[groonga-dev,03918] Re: あいまい検索のスコアについて

Back to archive index

Naoya Murakami visio****@gmail*****
2016年 2月 7日 (日) 15:33:07 JST


村上です。

ありがとうございます。

編集距離の差分値がトークンの重み付けに使われる
ようにpat_fuzzy_searchとiiを修正しました。

https://github.com/groonga/groonga/pull/470

よければ、よろしくお願いします。


2016年2月7日 13:15 <morit****@razil*****>:

> 遅くなってすみません。森です。
>
> 私も2が良いような気がしてきました。
> max_distance - 実際のedit_distance であれば計算コストも低くて良いと思います。
>
>
> 2016-02-06 14:46 GMT+09:00 Naoya Murakami <visio****@gmail*****>:
>
>> 村上です。
>>
>> 森さん、あいまい検索のスコア計算について相談です。
>>
>> 現状、インデックスを使ってあいまい検索をする場合、編集距離は
>> 無視して、通常の検索同様、max_distance以内のトークン同士で
>> クエリがマッチするかどうかだけで1のスコアが加算されるよう
>> になっています。
>>
>> 以下の1と2どちらのほうが望ましいですかね?
>>
>> 1.現状のままマッチするかだけで編集距離に応じた重み付けはしない
>>
>> 2.編集距離に応じてトークンの重み付けをする。
>>
>> 2.の場合、編集距離とスコアの重要度は逆になっているので、
>> やるとしたら、max_distance - 実際のedit_distanceでトークンの
>> 重み付けをするのがいいのかなと思っています。
>> (pat_fuzzy_searchを編集距離ではなく、maxからの差でスコアを
>> 書き込むように変える)
>>
>> 私は2の方がいいような気がしてきました。
>>
>>
>>
>> _______________________________________________
>> groonga-dev mailing list
>> groon****@lists*****
>> http://lists.osdn.me/mailman/listinfo/groonga-dev
>>
>>
>
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev
>
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download 



groonga-dev メーリングリストの案内
Back to archive index