Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用联系我们 
中文分词 论坛首页 / 中文分词 /

大家报报自己的索引有多大。

 
wgbbiao
会员
#1 | 发表时间: 2010 02 22 17:39
回复 
mysql,有200多M的数据,生成的索引有5个多G。
HonestQiao
会员
#2 | 发表时间: 2010 02 28 21:59
回复 
你莫非没有启用中文分词,直接一个字一个字的,那就会非常大。
huochai
会员
#3 | 发表时间: 2010 03 01 15:45
回复 
怎么一个字一个字的切~~ngram=1??
wgbbiao
会员
#4 | 发表时间: 2010 03 03 14:41
回复 
不用中文分析就一个一个的切了。。

min_infix_len = 1

这个设置也是必须的。

哈哈。。。
mobilezht
会员
#5 | 发表时间: 2010 05 07 20:54
回复 
12G 总计
按年份分为 2006 /2007 /2008 /2009 /2010
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .