okk okk
mikke****@gmail*****
2012年 8月 24日 (金) 12:37:22 JST
こんにちは。 先程メーリングリストに入会致しました。temita と申します。 rroonga で保存された "Yes good" の文章からTokenMecabでトークナイズされた 単語 "Yes" と "good" を取得するところで悩んでいます。 文章は切り分けられ語彙表(lexicon)にちゃんと入っています。 「groongaにデータを登録してからインデックスが更新されるまでの流れ」 http://www.clear-code.com/blog/2011/10/5.html ”groongaのインデックスカラムでは、…” を参考にindex column が参照できれば、切り分けられた単語を取得できると考えたのですが、 インデックスカラムの参照方法がわかりませんでした。 インデックスカラムを参照する方法はありますでしょうか。 試行結果 irb(main):004:0> terms = Groonga["Terms"] => #<Groonga::PatriciaTrie id: <276>, name: <Terms>, path: </tmp/tmpdb/test3.db.0000114>, domain: <ShortText>, range: (nil), flags: <KEY_NORMALIZE|WITH_SECTION>, encoding: <:utf8>, size: <79417>> irb(main):005:0> terms.columns[0] => #<Groonga::IndexColumn id: <277>, name: <Terms.Comments_comment>, path: </tmp/tmpdb/test3.db.0000115>, domain: <Terms>, range: <Comments>, flags: <>> irb(main):011:0> terms.columns[0][1] => 111 転置インデックスのArrayが返ってくることを期待していましたが数値が返ってきました。 111 のID?の意味もよく理解していません。 理解が足りず見当違いのことを言っているかもしれませんが、 助言いただけると幸いです。 よろしくお願いしたします。 --- temita <mikke****@gmail*****>