Core
seek
®
|
首页
|
注册
|
回复
|
搜索
|
统计资料
|
网站首页
|
产品服务
|
开放源码
|
安装使用
|
常见问题
|
中文手册
|
社区交流
|
联系我们
论坛首页
/
中文分词
/
中文分词中的问题,感觉是个bug!
cheriecon
会员
#1
|
发表时间: 2010 08 12 17:17
回复
txt:健康人生信息
seg result:健康/人生/信息
txt1:健康人生网
seg result1: 健/康/人生/网
第二个分词明显错误。
遇到奇数词的这样的问题就会出现这样的错误,请大家解决。注:健康 人生 信息 在词典中。
HonestQiao
会员
#2
|
发表时间: 2010 08 12 17:51
回复
最新版本测试结果:
健康/x 人生/x 信息/x
健康/x 人生/x 网/x
cheriecon
会员
#3
|
发表时间: 2010 08 13 10:02
回复
哦 没有看最新版本,呵呵。
cheriecon
会员
#4
|
发表时间: 2010 08 16 10:46
回复
和词典好像有关系:
我在原来词典中加入“健康人”这个词条,不论是新版本,还是老版本,分词结果都是:
健/康/人生/网
请指正。
cheriecon
会员
#5
|
发表时间: 2010 08 16 14:50
回复
呵呵,我是在旧版本上试的,新版本已经改正,谢谢。
回复
发帖注意:
网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
请仔细查看
中文手册和本站安装指南
,确认操作正确
请仔细查看
常见问题解答
,也许你的问题已经有解决方法
»
帐号
»
密码
发帖前请登陆, 或者
注册
.
中文分词
全文检索
站务公告
案例展示/经验分享
发展建议