产品优势

  1. 全文搜索与数据库搜索的区别
    • 专为全文搜索优化,效率更高

            由于典型的数据库系统要考虑用户的“增删改查”等多种复杂操作,因此其存取数据的方式需要考察综合考虑各种应用;而全文搜索的数据存取方式只考虑快速读取,相比数据库的查询,要快10倍或更多。(即使启用了数据库内置的全文搜索功能,这个结论仍成立)。

    • 支持复杂的查询表达式

            数据库系统的查询,往往只支持“AND” 或 "OR" 等有限的模式,而全文检索不但支持"AND"、“OR” 查询,还支持“NOT”、“近似”、“整句”等多种查询方式;同时相比数据库系统,进行在一定范围内查询时也更高效

    • 支持按相关度排序

            数据库查询出的结果,往往按照数据库内置的排序规则进行排序,往往只能按时间、按点击等有效的排序规则进行;全文搜索除了能够支持数据库的排序规则外,还支持按照结果的相关度排序,这往往会给访问者带来更大的便利。

    • 支持中文分词

            数据库提供的全文搜索功能往往不支持中文分词(或仅提供二元切分),导致某些短语检索不到或出现大量不相干的数据;中文全文检索系统支持中文分词,进一步过滤了不相干的数据。

  2. 自建全文搜索与使用Google等第三方网站提供的站内全文搜索的区别
    • 对网站设备有要求

            自建全文搜索往往需要站长有至少一台独立主机,而使用第三方提供的全文搜索对站点的要求低,虚拟主机即可;不过,出现全文搜索需求的站点通常已经有自己的独立主机了。

    • 索引更新更及时

            由于搜索服务在第三方托管,其往往只能按照一定的规则定期更新索引库(往往是几小时、甚至几天才更新一次索引),您网站上的新出现的内容往往不能及时被搜索到;
            使用自建全文搜索,可以保证您网站上新出现的内容可以”立即“被检索到。

    • 更适应您的网站

            由于中文需要进行分词的特性,导致没有一套通用的词库可以适用于全部网站,要得到优秀的检索结果需要定制一套适用于您网站的词库;
            采用第三方的搜索服务,您是无法修改第三方厂商的词库的,而使用自建全文搜索则无此问题。

    • 更有利于您网站的数据整合

            有些网站不止是论坛,往往还包括内容管理(CMS)、商城等多种应用,而使用数据库搜索往往需要用户在各个系统中都进行搜索才能找到内容;
            第三方的检索无法区别各个系统的不同。而自建的全文搜索可以有效的区分各个数据来源的不同数据,真正做到一次搜索应有尽有,从而改善您网站的访问体验,增加您网站的点击率。

    • 避免您的访问者遇到某些尴尬

            第三方的搜索结果页面不是您可以控制修改的,有推荐一些可能会使您网站访问者尴尬的搜索短语的可能。而使用自建全文搜索则完全无此问题。

  3. Coreseek 的全文搜索方案的更多的特性
    • 易于安装部署

             Windows用户仅需要4步在图形界面下的操作即可完成安装。

    • 更好的结果展现方式

             支持将检索按照特定的属性进行统计计数(Grouping),访问者可以通过这个特性了解他感兴趣的信息更多的出现在网站的那个模块(版面)。

    • 可控的CPU、内存和磁盘IO占用

             部分站长只能将全文搜索服务与网站应用安装在同一台服务器上,而某些全文搜索引擎在建立索引时往往会消耗掉全部可用的CPU、内存和磁盘IO资源,将导致在此期间访问网站非常慢或完全无法访问;Coreseek的方案可以限制全局搜索服务在建立索引期间的CPU、内存、磁盘IO的消耗,从而保证其他系统的正常运行。

    • 支持多种操作系统

            支持Linux、FreeBSD以及Windows等多种操作系统,推荐在Linux系统下运行。

    • 源代码开放

            在GPL协议下开放全部源代码。


上一篇: 产品服务
下一篇: 功能和特性