Naoya Murakami
visio****@gmail*****
2016年 2月 6日 (土) 14:46:39 JST
村上です。 森さん、あいまい検索のスコア計算について相談です。 現状、インデックスを使ってあいまい検索をする場合、編集距離は 無視して、通常の検索同様、max_distance以内のトークン同士で クエリがマッチするかどうかだけで1のスコアが加算されるよう になっています。 以下の1と2どちらのほうが望ましいですかね? 1.現状のままマッチするかだけで編集距離に応じた重み付けはしない 2.編集距離に応じてトークンの重み付けをする。 2.の場合、編集距離とスコアの重要度は逆になっているので、 やるとしたら、max_distance - 実際のedit_distanceでトークンの 重み付けをするのがいいのかなと思っています。 (pat_fuzzy_searchを編集距離ではなく、maxからの差でスコアを 書き込むように変える) 私は2の方がいいような気がしてきました。 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...Download