Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
中文分词 论坛首页 / 中文分词 /

中文分词中的问题,感觉是个bug!

 
cheriecon
会员
#1 | 发表时间: 2010 08 12 17:17
回复 
txt:健康人生信息
seg result:健康/人生/信息

txt1:健康人生网
seg result1: 健/康/人生/网

第二个分词明显错误。

遇到奇数词的这样的问题就会出现这样的错误,请大家解决。注:健康 人生 信息 在词典中。
HonestQiao
会员
#2 | 发表时间: 2010 08 12 17:51
回复 
最新版本测试结果:
健康/x 人生/x 信息/x
健康/x 人生/x 网/x
cheriecon
会员
#3 | 发表时间: 2010 08 13 10:02
回复 
哦 没有看最新版本,呵呵。
cheriecon
会员
#4 | 发表时间: 2010 08 16 10:46
回复 
和词典好像有关系:
我在原来词典中加入“健康人”这个词条,不论是新版本,还是老版本,分词结果都是:
健/康/人生/网

请指正。
cheriecon
会员
#5 | 发表时间: 2010 08 16 14:50
回复 
呵呵,我是在旧版本上试的,新版本已经改正,谢谢。
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .