开放源码

选择软件 致力于推进开源软件运动在大中华地区的发展, 投入了大量的资源来改进开源软件。
目前,选择软件 参与并改进的项目包括:

  • CRF++:

  • 由日本人Taku Kudo 博士创立的采用条件随机场(CRF)方法对序列进行标注的软件包。我们对其进行了改进,显著的降低了CRF++的内存占用(降低幅度,取决于应用)。

  • Sphinx:

  • 由俄罗斯人Andrew Aksyonoff 开发的高性能全文搜索软件包。我们为Sphinx 贡献了:

    • 中文编码的数据源支持
    • 采用Chih-Hao Tsai MMSEG算法的中文分词器
    • 中文使用手册
    • 本地化的技术支持服务
  • LibMMSeg:

  • LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。

    LibMMSeg 采用C++开发,同时支持Linux平台和Windows平台,切分速度大约在300K/s(PM-1.2G)。


上一篇: 安装使用
下一篇: CRF++