Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
中文分词 论坛首页 / 中文分词 /

大家报报自己的索引有多大。

 
wgbbiao
会员
#1 | 发表时间: 2010 02 22 17:39
回复 
mysql,有200多M的数据,生成的索引有5个多G。
HonestQiao
会员
#2 | 发表时间: 2010 02 28 21:59
回复 
你莫非没有启用中文分词,直接一个字一个字的,那就会非常大。
huochai
会员
#3 | 发表时间: 2010 03 01 15:45
回复 
怎么一个字一个字的切~~ngram=1??
wgbbiao
会员
#4 | 发表时间: 2010 03 03 14:41
回复 
不用中文分析就一个一个的切了。。

min_infix_len  = 1

这个设置也是必须的。

哈哈。。。
mobilezht
会员
#5 | 发表时间: 2010 05 07 20:54
回复 
12G     总计
按年份分为 2006 /2007 /2008 /2009 /2010
fsdi0254
会员
#6 | 发表时间: 2010 10 25 17:51
回复 
牛啊,200M的数据生成几个G的索引。。。,怎么弄的啊
atyu30
会员
#7 | 发表时间: 2010 11 01 00:48
回复 
622M 数据 126.4M 索引
ghostwwl
会员
#8 | 发表时间: 2010 11 02 16:59 | 修改: ghostwwl
回复 
www.shuoqian.net
使用的是coreseek 大约200W+的数据 数据库文件2.1G  索引445M 数据每天都在以几千条的量增加中
缓存使用的 ttserver 每天大约 30w左右pv

www.dashuhua.com
应该有好几百万加 懒得统计也是上百万   数据库文件大小 3.9G 索引 807M
同样是 coreseek  + ttserver

曾经测试过1200W 加的数据 mysql数据 速度还是很快的
索引的大小 与你要建立索引的字段大小 和字段数目 有关系的
而且 coreseek 有限制的 索引的时候最多只能索引多少个字段 这个数字我忘了
如果要索引大于这个数字的字段 好像在编译的时候 改个头文件的 宏定义 就OK
HonestQiao
会员
#9 | 发表时间: 2010 11 03 17:14
回复 
ghostwwl:
索引的大小 与你要建立索引的字段大小 和字段数目 有关系的
而且 coreseek 有限制的 索引的时候最多只能索引多少个字段 这个数字我忘了
如果要索引大于这个数字的字段 好像在编译的时候 改个头文件的 宏定义 就OK

这个绝大多数人都不会超出这个限制的
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
发帖前请登陆, 或者 注册 .