[groonga-dev,01762] Re: phpからのgroongaデータベースへのアクセスについて

Back to archive index

Kouhei Sutou kou****@clear*****
2013年 9月 5日 (木) 18:12:44 JST


須藤です。

In <CANM+****@mail*****>
  "[groonga-dev,01761] Re: phpからのgroongaデータベースへのアクセスについて" on Thu, 5 Sep 2013 17:56:54 +0900,
  Naoya Murakami <visio****@gmail*****> wrote:

> 現在すでにデータベースに格納されている短めな文字列と、
> 全文情報から自分で抽出した出現頻度とキーワードのリスト
> みたいなものがあります。
> 
> 今は、それらを1文字単位で分解して学習させて補完する
> ことができないかなぁと考えています。
> 
> ユーザの入力クエリを学習させるつもりはいまのところはありません。
> 
> なので、学習だけgroongaのloadでやって、suggestのコマンド
> だけでもmroongaでいけないかなぁとか考えてました。

お、であればデータの登録もmroongaでいける気がします。

「item_${データセット名}」に対応するテーブルにレコードを追加
してください。このとき、_key(mroonga的にはprimary keyに設定
したカラムなはず)には補完させたいキーワードそのものを入れて、
kanaカラムにはカタカナ表記でのよみがなを入れてください。

たとえば、こんな感じです。

load --table item_DATASET1
[
{"_key":"東京", "kana":"トウキョウ"}
]

これで、「to」と入力したときに「東京」がでるようになります。

あ、テストに使っているサンプルデータがありました。こんな感じ
です。

  https://github.com/groonga/groonga/blob/master/test/command/fixture/suggest/rurema/items.grn

suggestコマンドの使い方はこんな感じです。これはデータセット
名が「rurema」ですね。

   https://github.com/groonga/groonga/blob/master/test/command/suite/suggest/complete/prefix-rk-search-hiragana-and-romaji.test

  suggest \
    --table item_rurema \
    --column kana \
    --types complete \
    --frequency_threshold 1 \
    --query 'さk'

-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/> (03-6231-7270)

groongaサポート:
  http://groonga.org/ja/support/
パッチ採用はじめました:
  http://www.clear-code.com/recruitment/
コミットへのコメントサービスはじめました:
  http://www.clear-code.com/services/commit-comment.html




groonga-dev メーリングリストの案内
Back to archive index