200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 如何用WikiExtractor提取维基百科词汇

如何用WikiExtractor提取维基百科词汇

时间:2018-09-18 19:11:14

相关推荐

如何用WikiExtractor提取维基百科词汇

WikiExtractor下载地址:

/attardi/wikiextractor

clone到本地后,运行下面命令

其中1000M是每次读取语料的大小设置,extracted后改为自己的语料文件路径

python WikiExtractor.py -cb1000M -o extracted enwiki-0602-pages-articles1.xml-p000000010p000010000.bz2

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。