Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
中文分词 论坛首页 / 中文分词 /

我最近 把 sougou 的细胞词库下载下来生成词典大概1600万 生成词典时报内存

 
wentianle
会员
#1 | 发表时间: 2009 03 18 18:02
回复 
我最近 把 sougou 的细胞词库下载下来生成词典大概1600万 生成词典时报内存错误  请问大侠们有没有遇到过 词典文件 .txt 大概 320M
HonestQiao
会员
#2 | 发表时间: 2009 03 19 13:03
回复 
太大可能导致词典生成过程中内存占用溢出了。

如此大的词典是没有什么意义的,相反可能会降低速度。
xyliufeng
会员
#3 | 发表时间: 2010 05 13 13:20
回复 
生成词典多少万条一 般比较合适?
HonestQiao
会员
#4 | 发表时间: 2010 05 13 16:16
回复 
20~50w条
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .