[groonga-dev,02808] Re: IN NATURAL LANGUAGE MODEにおける検索スコア

Back to archive index

Kouhei Sutou kou****@cozmi*****
2014年 9月 25日 (木) 21:50:29 JST


須藤です。

In <5423D****@fdiar*****>
  "[groonga-dev,02806] Re: IN NATURAL LANGUAGE MODEにおける検索スコア" on Thu, 25 Sep 2014 10:40:10 +0200,
  Kazuhiko <kazuh****@fdiar*****> wrote:

> On 24/09/2014 03:50, morit****@razil***** wrote:
>> 確かに、現状の方法はあまり良くないですね!
>> 検索精度と処理速度の兼ね合いという部分があってこのようにしたのですが、
>> 必ずしも現行方式を尊重しなくても良いと思います。
>> 
>> かずひこさんの提案も良いと思いますし、他にもご意見あればぜひお聞きしたいです。
> 
> groonga/lib/ii.c を見てみました。
> 
>   limit = optarg->similarity_threshold
>     ? (optarg->similarity_threshold > GRN_HASH_SIZE(h)
>        ? GRN_HASH_SIZE(h)
>        : optarg->similarity_threshold)
>     : (GRN_HASH_SIZE(h) >> 3) + 1;
> 
> どれくらいのlimitが検索精度と処理速度の兼ね合いで実用的か試してみたいの
> ですが、Mroonga側から、このoptarg->similarity_threshold を設定する方法は
> あるでしょうか?

ないです!

だとアレなので、masterでは設定できるようにしました。

AGAINST('*S1"a b c"' IN BOOLEAN MODE)というように使ってくだ
さい。「1」の部分がsimilarity_thresholdになります。


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ:
  http://www.clear-code.com/services/code-reader/




groonga-dev メーリングリストの案内
Back to archive index