[groonga-dev,03916] あいまい検索のスコアについて

Back to archive index

Naoya Murakami visio****@gmail*****
2016年 2月 6日 (土) 14:46:39 JST


村上です。

森さん、あいまい検索のスコア計算について相談です。

現状、インデックスを使ってあいまい検索をする場合、編集距離は
無視して、通常の検索同様、max_distance以内のトークン同士で
クエリがマッチするかどうかだけで1のスコアが加算されるよう
になっています。

以下の1と2どちらのほうが望ましいですかね?

1.現状のままマッチするかだけで編集距離に応じた重み付けはしない

2.編集距離に応じてトークンの重み付けをする。

2.の場合、編集距離とスコアの重要度は逆になっているので、
やるとしたら、max_distance - 実際のedit_distanceでトークンの
重み付けをするのがいいのかなと思っています。
(pat_fuzzy_searchを編集距離ではなく、maxからの差でスコアを
書き込むように変える)

私は2の方がいいような気がしてきました。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download 



groonga-dev メーリングリストの案内
Back to archive index