Kouhei Sutou
kou****@clear*****
2013年 9月 5日 (木) 18:12:44 JST
須藤です。 In <CANM+****@mail*****> "[groonga-dev,01761] Re: phpからのgroongaデータベースへのアクセスについて" on Thu, 5 Sep 2013 17:56:54 +0900, Naoya Murakami <visio****@gmail*****> wrote: > 現在すでにデータベースに格納されている短めな文字列と、 > 全文情報から自分で抽出した出現頻度とキーワードのリスト > みたいなものがあります。 > > 今は、それらを1文字単位で分解して学習させて補完する > ことができないかなぁと考えています。 > > ユーザの入力クエリを学習させるつもりはいまのところはありません。 > > なので、学習だけgroongaのloadでやって、suggestのコマンド > だけでもmroongaでいけないかなぁとか考えてました。 お、であればデータの登録もmroongaでいける気がします。 「item_${データセット名}」に対応するテーブルにレコードを追加 してください。このとき、_key(mroonga的にはprimary keyに設定 したカラムなはず)には補完させたいキーワードそのものを入れて、 kanaカラムにはカタカナ表記でのよみがなを入れてください。 たとえば、こんな感じです。 load --table item_DATASET1 [ {"_key":"東京", "kana":"トウキョウ"} ] これで、「to」と入力したときに「東京」がでるようになります。 あ、テストに使っているサンプルデータがありました。こんな感じ です。 https://github.com/groonga/groonga/blob/master/test/command/fixture/suggest/rurema/items.grn suggestコマンドの使い方はこんな感じです。これはデータセット 名が「rurema」ですね。 https://github.com/groonga/groonga/blob/master/test/command/suite/suggest/complete/prefix-rk-search-hiragana-and-romaji.test suggest \ --table item_rurema \ --column kana \ --types complete \ --frequency_threshold 1 \ --query 'さk' -- 須藤 功平 <kou****@clear*****> 株式会社クリアコード <http://www.clear-code.com/> (03-6231-7270) groongaサポート: http://groonga.org/ja/support/ パッチ採用はじめました: http://www.clear-code.com/recruitment/ コミットへのコメントサービスはじめました: http://www.clear-code.com/services/commit-comment.html