Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
中文分词 论坛首页 / 中文分词 /

使用utf-8 charset_table 无法搜索中文

 
volvorc
会员
#1 | 发表时间: 2010 06 29 10:37
回复 
本人使用的是默认的utf-8下的charset_table设置,无法搜索中文
charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
但#注释掉却可以搜索中文
HonestQiao
会员
#2 | 发表时间: 2010 06 29 10:56
回复 
请参考:www.coreseek.cn/news/6/52
volvorc
会员
#3 | 发表时间: 2010 06 29 11:17
回复 
但是我想加上U+2A(*),U+5F(_)的搜索啊 那该如何
volvorc
会员
#4 | 发表时间: 2010 06 29 11:37
回复 
我在英文搜索中 添加U+2A(*),U+5F(_)是可以搜的 因为中文搜索中将charset_table注释掉 我不知道如何配置才可以在中文搜索中也可以搜索*,_
谢谢,求助.
HonestQiao
会员
#5 | 发表时间: 2010 06 30 23:54
回复 
通用版本只能采用www.coreseek.cn/forum/2_910_0.html这个方法进行变换处理。

如果你要直接处理,可以考虑自己二次开发,破坏现有处理结构,实现自己的逻辑。

或者找我们定制,联系方式在:www.coreseek.cn/contact/
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .