Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
全文检索 论坛首页 / 全文检索 /

coreseek中英文混合分词

 
nongzhuala
会员
#1 | 发表时间: 2016 04 21 16:01
回复 
我的数据中有很多是中英文混合
比如

“请问immunization totla是个动态过程,如果期间某一年发生新的利率变化,就需要重新整合对冲工具中各部分的百分比。这个深度是不是超过FRM part one了?”

我需根据这段文字去搜索相关的提问  
所以其中特定的中文词库(利率变化,对冲工具等)
以及特定的英语词组(FRM part one,immunization totla)
就显得尤为重要 不然会匹配uchu一堆关联度很小的内容

请问 我如何配置诸如上段文字中 FRM part one,immunization totla 这些英文词组
增加他们的权重??
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .