最新消息  软件使用  功能建议  信息反馈  诺基亚手机 索尼爱立信手机 摩托罗拉手机 黑莓手机 其它手机  扩展资源 英语学习 购买咨询

  扩展资源  

你好2024-11-25 10:33
  
  刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序! 发表于 2009-08-24 16:55:50  1楼 
作者:林灿斌
积分:48
手机:诺基亚 5130XM
注册:2009-07-19
刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序!

是asp
优化了效率

一秒能转400条(我的电脑256MB内存)

同时过滤了一些垃圾
维基名言和维基新闻已经转好
维基百科太大了
没心情

我只会asp
不会java
只能这样了
  回复:刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序! 发表于 2009-08-24 21:34:09  2楼 
作者:记忆宝客户服务
积分:2337
手机:Android
注册:2008-01-01
感谢您为朋友们的付出!如果大家都来进行资源建设,那一定会更加方便和实用的!
  回复:刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序! 发表于 2009-08-26 20:48:59  3楼 
作者:olaony
积分:122
手机:天语B832
注册:2009-05-20
词典里的网页链接、和图片文件链接可以通过点击的方式打开吗?

如果不能,可以通过去除这些链接来给wiki瘦身:
“file”文件链接
“image”文件链接
“cite”外部网页链接
“[...]”内部网页链接
“==外部链接==”一栏
  回复:刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序! 发表于 2009-08-27 16:50:02  4楼 
作者:林灿斌
积分:48
手机:诺基亚 5130XM
注册:2009-07-19
<%@CodePage=65001 Language="VBScript"%>
<%Server.ScriptTimeOut=9999999
dim binFileData
i=0
Set XMLDOM=Server.CreateObject("Microsoft.XMLDOM")
XMLDOM.load Server.MapPath("wiki/zhwikiquote-20090820-pages-articles.xml")'要转换的文件的目录和文件名
Set XMLRoot=XMLDOM.documentElement
TotalCount=XMLRoot.childNodes.length-1

For NodeIndex=0 To TotalCount'循环所有page标签
On Error Resume Next
Set ParentNode=XMLRoot.childNodes(NodeIndex)
Title=HTMLEncode(ParentNode.childNodes(0).text)
ChildNode=HTMLEncode(ParentNode.childNodes(2).childNodes(4).text)
if instr(Title,":")=0 and Title<>"" and ChildNode<>"" then
binFileData=binFileData&Title&" "&ChildNode
if NodeIndexi=i+1
if i>100 then
SaveToFile binFileData,"zhwikiquote.txt"'转换后的文件的目录和文件名
i=0
binFileData=""
end if
end if
Title=""
ChildNode=""
Next
Set ParentNode=nothing

Set XMLRoot=nothing
Set XMLDOM=nothing


Sub SaveToFile(ByVal strBody,ByVal File)
Dim objStream
On Error Resume Next
Set objStream=Server.CreateObject("ADODB.Stream")
With objStream
.Type=2
.Open
.LoadFromFile Server.MapPath(File)
.Charset="Unicode"
.Position=objStream.Size
.WriteText=.ReadText&strBody
.SaveToFile Server.MapPath(File),2
.Close
End With
Set objStream=Nothing
End Sub

function HTMLEncode(fString)
fString=Replace(fString,"'''","")'“'''”
fString=Replace(fString,CHR(34),"")'“"”
fString=Replace(fString,CHR(39),"")'“'”
fString=Replace(fString,"-","-")'“-”
fString=Replace(fString,CHR(92),"\")'“”
fString=Replace(fString,CHR(10),"
")
fString=ReplaceText(fString,"{{.[^>]*}}","")
HTMLEncode=fString
end function

Function ReplaceText(fString,patrn,replStr)
Set regEx=New RegExp
regEx.Pattern=patrn
regEx.IgnoreCase=True
regEx.Global=True
ReplaceText=regEx.Replace(""&fString&"",""&replStr&"")
Set reg=nothing
End Function

%>



维基XML To TXT文件转换器


<%=TotalCount%>条数据转换完成,耗时<%=fix((timer()-startime)*1000)%>毫秒

文件格式:

词条名称+Tab制表符+词条内容


  回复:刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序! 发表于 2009-09-03 20:01:57  5楼 
作者:olaony
积分:122
手机:天语B832
注册:2009-05-20
支持!!!
大家很需要维基百科!
支持楼主的快来顶!!!
  维基百科 发表于 2009-09-29 09:59:14  6楼 
作者:nq19851120
积分:10
手机:5300
注册:2009-09-27
你现在转换好了吗,我到处找维基百科,唉
  回复:刚写了个把维基官方提供的XML文件转成记忆宝文本格式的程序! 发表于 2009-10-05 16:04:06  7楼 
作者:林灿斌
积分:48
手机:诺基亚 5130XM
注册:2009-07-19
电脑太烂了
转不了
  

版权所有(C)2006-2017 记忆宝网络 | 联系我们