[groonga-dev,04730] Re: PGroonga における検索スコア

Back to archive index
Kouhei Sutou kou****@clear*****
2019年 1月 21日 (月) 16:26:20 JST


須藤です。

In <003201d4af21$be5d8ad0$3b18a070$@mirror.ocn.ne.jp>
  "[groonga-dev,04729] Re: PGroonga における検索スコア" on Fri, 18 Jan 2019 20:34:13 +0900,
  <toshio_uchiy****@mirro*****> wrote:

>  いつもの通り、PGroonga の改善以外の目的に使用しない。
> という条件で、データをご提供させていただきます。よろしく
> お願いします。

ありがとうございます。

原因がわかりました。
text[]のインデックスだからでした。

配列の場合、スコアラーを1つしか指定しないと配列の先頭の要素
以外のところにある要素にマッチしてもヒットしなくなるのでした。
(2つめ以降はスコアラーが指定されていない扱いになって、検索
対象から外れる。)

これは不便なのでなんかいい感じにできないか考えてみます。スコ
アラーを1つだけ指定したらすべての要素で同じスコアラーを使う
ようにするとか。
(これはPGroongaレベルの話。)

あと、今は、各要素毎にスコアーを計算するので、配列の場合は
scorer_tf_at_most()が各要素に適用され、最大で
scorer_tf_at_most()に指定した最大値 * 配列長のスコアーになっ
てしまいます。これも不便な気がするので、なにかいい感じの方法
がないか考えてみます。
(これはGroongaレベルの話。)


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <https://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
データ処理ツールの開発:
  https://www.clear-code.com/blog/2018/7/11.html



groonga-dev メーリングリストの案内
Back to archive index