morit****@razil*****
morit****@razil*****
2016年 2月 7日 (日) 13:15:05 JST
遅くなってすみません。森です。 私も2が良いような気がしてきました。 max_distance - 実際のedit_distance であれば計算コストも低くて良いと思います。 2016-02-06 14:46 GMT+09:00 Naoya Murakami <visio****@gmail*****>: > 村上です。 > > 森さん、あいまい検索のスコア計算について相談です。 > > 現状、インデックスを使ってあいまい検索をする場合、編集距離は > 無視して、通常の検索同様、max_distance以内のトークン同士で > クエリがマッチするかどうかだけで1のスコアが加算されるよう > になっています。 > > 以下の1と2どちらのほうが望ましいですかね? > > 1.現状のままマッチするかだけで編集距離に応じた重み付けはしない > > 2.編集距離に応じてトークンの重み付けをする。 > > 2.の場合、編集距離とスコアの重要度は逆になっているので、 > やるとしたら、max_distance - 実際のedit_distanceでトークンの > 重み付けをするのがいいのかなと思っています。 > (pat_fuzzy_searchを編集距離ではなく、maxからの差でスコアを > 書き込むように変える) > > 私は2の方がいいような気がしてきました。 > > > > _______________________________________________ > groonga-dev mailing list > groon****@lists***** > http://lists.osdn.me/mailman/listinfo/groonga-dev > > -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...Download