Coreseek®  
 | 首页 | 注册 | 回复 | 搜索 | 统计资料 |                 网站首页产品服务开放源码安装使用常见问题中文手册社区交流联系我们 
案例展示/经验分享 论坛首页 / 案例展示/经验分享 /

全文搜索+python数据源实例

 
dancebear
会员
#1 | 发表时间: 2010 07 12 17:19 | 修改: dancebear
回复 
数据量不多,大概4W文章。
www.517mr.com/word/%CB%AB%D1%DB%C6%A4/
还有个内部系统数据量多点,50W数据。
ylshjx
会员
#2 | 发表时间: 2010 07 26 16:16
回复 
非常不错
ylshjx
会员
#3 | 发表时间: 2010 07 26 16:23
回复 
不知道你这个排序是怎么做的,我做的都是最早的数据在前面
54chen
会员
#4 | 发表时间: 2010 09 07 09:29
回复 
没权限发是怎么一回事?
dancebear
会员
#5 | 发表时间: 2010 09 09 17:11 | 修改: dancebear
回复 
部分代码:

$g_ranker = SPH_RANK_PROXIMITY_BM25;
    //$g_matchmode = SPH_MATCH_EXTENDED;
    $g_matchmode = SPH_MATCH_EXTENDED2;
    $BuildExcerptsOpts=array("before_match"  => "<b>",
"after_match"  => "</b>",'limit'=>200,'exact_phrase'=>false,'single_passage'=>true,'chunk_separator'=>'……','around'=>3);
    $g_sortby='@weight DESC,@id DESC';
    $g_groupsort = "@group desc";
    $g_groupby = "";
    extract($searchConfig,EXTR_OVERWRITE);
    $cl = new SphinxClient ();
    $cl->SetServer ( $g_host, $g_port );
    $cl->SetWeights ( array ( 100, 1 ) );
    $cl->SetFieldWeights ( array ( 'subject'=>100, 'description'=>50,'content'=>100 ) );    
    $cl->SetMatchMode ( $g_matchmode );
    $tpp = 10;
    $page =isset($_REQUEST['pagenum'])? max(1, intval($_REQUEST['pagenum'])):1;
    $start_limit = ($page - 1) * $tpp;
    $cl->SetRankingMode ( $g_ranker );
    $cl->SetArrayResult ( true );
    $cl->SetLimits ( $start_limit , $tpp, ( $tpp>1000 ) ? $tpp : 1000 );

    $res = $cl->Query ( iconv('gbk','utf-8',$word), $g_index );
    $total_result = $res['total_found'];
    if ( $cl->GetLastWarning() )print "WARNING: " . $cl->GetLastWarning() . "\n\n";

没权限是因为你发URL的时候加了协议名。只发地址就可以了!
 
回复
Bold Style  Italic Style  Image 链接  URL 链接 
发帖注意:
  • 网址中请去掉http://开头,例如:您需要输入www.coreseek.cn,而不是http://www.coreseek.cn
  • 咨询问题,请贴出详细的操作系统版本、Coreseek版本(Linux环境请给出编译参数)
  • 请仔细查看中文手册和本站安装指南,确认操作正确
  • 请仔细查看常见问题解答,也许你的问题已经有解决方法

» 帐号  » 密码 
您只输入了昵称,没有输入密码,如果没有ID,请申请一个.