Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
中文分词 论坛首页 / 中文分词 /

中文分词不起作用的问题

 
nftw
会员
#1 | 发表时间: 2010 08 23 14:35
回复 
用 coreseek-3.2.13/csft-3.2.13/api中提供的 test.php测试, 英文分词没有问题, 但中文分词没有结果.
我个人初步估计是词库没有设置好什么的,
因为我将 charset_dictpath = /usr/local/mmseg3/etc/这一项的设置随便设置一行什么,在运行/usr/local/coreseek/bin/indexer --rotate --config /usr/local/coreseek/etc/sphinx.conf products 建立索引时并没有报错!

请高手帮我解惑

sphinx.conf配置如下.
source mysql
{
        type =                  mysql
        sql_sock                = /var/lib/mysql/mysql.sock
        sql_host                = localhost
        sql_user                = my_name
        sql_pass                = my_pass
        sql_db                  = my_db
        sql_query_pre = SET NAMES utf8
        #sql_query_pre = SET SESSION query_cache_type=OFF
        sql_query               = SELECT id, title, description, \
                                  cat_id, price, UNIX_TIMESTAMP(added_date) AS added_ts \
                                  FROM products
        sql_attr_uint           = cat_id
        sql_attr_float          = price
        sql_attr_timestamp      = added_ts
}

index products
{
        source  = mysql
        path    = /usr/local/coreseek/var/data/products
        docinfo = extern

        charset_type     = utf-8
        charset_dictpath = /usr/local/mmseg3/etc/
}

searchd
{
        listen = 127.0.0.1:9312
        #port = 3312

        log = /usr/local/coreseek/var/log/searchd.log
        query_log = /usr/local/coreseek/var/log/query.log
        read_timeout = 5

        max_children = 30

        pid_file                        = /usr/local/coreseek/var/log/searchd.pid

        max_matches                     = 1000

        seamless_rotate         = 1

        preopen_indexes         = 0

        unlink_old                      = 1
}
nftw
会员
#2 | 发表时间: 2010 08 23 15:30
回复 
还有,我的系统是 centos 5.3
HonestQiao
会员
#3 | 发表时间: 2010 08 23 16:27
回复 
请参考:www.coreseek.cn/products/products-install 进行测试

中文分词参考:www.coreseek.cn/products-install/coreseek_mmseg/
nftw
会员
#4 | 发表时间: 2010 08 25 08:38
回复 
问题已经解决,谢谢您!
s_xingqing
会员
#5 | 发表时间: 2011 03 04 11:25
回复 
有一个搜索的问题
我搜索"笔记本"
后的 [words] => Array
        (
            [笔] => Array
                (
                    [docs] => 1395
                    [hits] => 5881
                )

            [记] => Array
                (
                    [docs] => 1631
                    [hits] => 3938
                )

            [本] => Array
                (
                    [docs] => 9674
                    [hits] => 47917
                )

        )
这是为什么,在哪里修改,我都至少完整地读了帮助pdf了
HonestQiao
会员
#6 | 发表时间: 2011 03 04 12:51
回复 
s_xingqing:
有一个搜索的问题
我搜索"笔记本"
后的 [words] => Array
        (
            [笔] => Array
                (
                    [docs] => 1395
                    [hits] => 5881
                )

            [记] => Array
                (
                    [docs] => 1631
                    [hits] => 3938
                )

            [本] => Array
                (
                    [docs] => 9674
                    [hits] => 47917
                )

        )
这是为什么,在哪里修改,我都至少完整地读了帮助pdf了

请参考这里的演示配置:
www.coreseek.cn/products-install/install_on_windows/#testpackdesc
matyhtf
会员
#7 | 发表时间: 2011 04 14 21:21
回复 
nftw:
问题已经解决,谢谢您!

请问 您是怎么解决的,哪里没有配置对呢?
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .