Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
中文分词 论坛首页 / 中文分词 /

关于在libmmseg词自定义的长词,把在libmmseg中存在短词(包括在自定义的长词

 
xyliufeng
会员
#1 | 发表时间: 2010 05 14 15:46
回复 
关于在libmmseg词自定义的长词,把在libmmseg中存在短词(包括在自定义的长词中),覆盖了。这个问题的解决方法讨论(除定制词外).

比如:词库中存在“南京”,比如自定义,"南京西路",结果导致搜索关键字"南京",搜索不到。这类问题的解决方法.
wjackie
会员
#2 | 发表时间: 2010 05 14 16:21
回复 
这个问题俺也遇到过,管理员说csft目前支持同义词搜索能解决。
sphinx貌似还没办法
xyliufeng
会员
#3 | 发表时间: 2010 05 14 16:43
回复 
用csft怎么解决啊?我目前用的是coreseek3.2.12都没用
HonestQiao
会员
#4 | 发表时间: 2010 05 14 18:51
回复 
该功能需要进行定制版本。

另外,你都有南京了,加一个西路就可以了,为啥非要搞一个南京西路呢?
xyliufeng
会员
#5 | 发表时间: 2010 05 14 22:46
回复 
我只是看看有没有解决的方案,我觉得用 索引的最小前缀 可以实现,但是我试了没用。
HonestQiao
会员
#6 | 发表时间: 2010 05 17 16:26
回复 
最小前缀对英文适用
DreamDreams
会员
#7 | 发表时间: 2010 05 20 10:34
回复 
这其实是个大问题,这种情况太普遍了,期待解决方案。
HonestQiao
会员
#8 | 发表时间: 2010 05 21 00:35
回复 
特殊场合才使用。

如果要配合大众使用,最后基本就变为单个字的搜索了,那分词可以直接去掉,没有意义了。
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .