[groonga-dev,04802] Re: レコード内の検索語句の積算件数が取得できるか

Back to archive index
Naoya Murakami visio****@gmail*****
2020年 5月 18日 (月) 18:37:49 JST


村上と申します。

「朝日新聞」という検索語句をいれたとき、記事数ではなく、その記事に含まれる「朝日新聞」の総数を
> 知りたいのです。
>

その記事に含まれる「朝日新聞」ということでしたら、_scoreでよさそうですが、
ヒットした検索結果に含まれる「朝日新聞」の総数ということでしたら、
以下のような drilldownsにkeyを指定せずに、calc_typesにSUM、calc_targetに _scoreを
セットすれば、_allというキーに_scoreの総数を得られると思います。

table_create Articles TABLE_NO_KEY
[[0,0.0,0.0],true]
column_create Articles body COLUMN_SCALAR ShortText
[[0,0.0,0.0],true]
table_create Lexicon TABLE_PAT_KEY ShortText   --default_tokenizer
TokenBigram   --normalizer NormalizerAuto
[[0,0.0,0.0],true]
column_create Lexicon Documents_body COLUMN_INDEX|WITH_POSITION Articles
body
[[0,0.0,0.0],true]
load --table Articles
[
{"body": "朝日新聞 朝日新聞"},
{"body": "朝日新聞"},
{"body": "日経新聞"}
]
[[0,0.0,0.0],3]
select Articles   --filter 'body @ "朝日新聞"'   --output_columns _score,body
--drilldowns[total_n_quereis].calc_types SUM
--drilldowns[total_n_quereis].calc_target _score
--drilldowns[total_n_quereis].output_columns _key,_sum
[
  [
    0,
    0.0,
    0.0
  ],
  [
    [
      [
        2
      ],
      [
        [
          "_score",
          "Int32"
        ],
        [
          "body",
          "ShortText"
        ]
      ],
      [
        2,
        "朝日新聞 朝日新聞"
      ],
      [
        1,
        "朝日新聞"
      ]
    ],
    {
      "total_n_quereis": [
        [
          1
        ],
        [
          [
            "_key",
            "ShortText"
          ],
          [
            "_sum",
            "Float"
          ]
        ],
        [
          "_all",
          3.0
        ]
      ]
    }
  ]
]

以上、よろしくお願いします。

2020年5月18日(月) 18:22 yko kmt <kamat****@gmail*****>:

> Groongaを調べており、不明点があり、ここで質問させていただきます。
>
> 検索語句のヒット件数ですが、
> レコードのヒット件数ではなく、レコード内の検索語句の積算件数は取得できますでしょうか。
>
> 例えばWikiのような記事DBがあるとします。
> 「朝日新聞」という検索語句をいれたとき、記事数ではなく、その記事に含まれる「朝日新聞」の総数を
> 知りたいのです。
>
> Scoreを使うと、その記事内の語句の件数は取れるということはわかったのですが、その総数を取得できるのでしょうか。
>
> よろしくお願いいたします
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> https://lists.osdn.me/mailman/listinfo/groonga-dev
>
-------------- next part --------------
HTMLの添付ファイルを保管しました...
URL: <https://lists.osdn.me/mailman/archives/groonga-dev/attachments/20200518/153a84b2/attachment.html>


groonga-dev メーリングリストの案内
Back to archive index