3.0版预计在8月底或9月出发布,计划的改进如下 中文处理部分: 1、mmseg的版本号跳到3.0,与搜索的版本号相匹配 2、支持必须出现的词表,用于保证查全率 3、切分速度可能有部分提升 搜索部分 1、对于高频字词,单独出现不高亮 2、废止目前基于pygtk的图形界面,改由b/s结构的界面进行配置 3、支持将配置文件存储在数据库中 平台支持部分 1、在Posix平台上,将优先支持Freebsd 6.2; Linux平台上不再进行单独测试
长期的计划 1、正向索引支持 2、基于tf/idf的关键词分析 3、基于关键词的相关主题计算 |