Kouhei Sutou
kou****@clear*****
2010年 10月 8日 (金) 10:00:31 JST
須藤です。 In <20101****@trial*****> "[groonga-dev,00377] groonga ストレージエンジンでn-gramへの切替" on Thu, 07 Oct 2010 05:31:31 +0900, kameoyaji <kenji****@trial*****> wrote: > 全文検索時のインデックスの作成を > mecab,n-gram(2文字、3文字)に切り替える方法はどのようにすれば行えるの > でしょうか?(n-gramを使用したいもので) 今はBigram固定なのですが、次のバージョンではカスタマイズでき るようになると思います! http://redmine.groonga.org/issues/592 > 又、英記号(ドットや、-、?等)もインデックス対象の文字にする設定などが有 > りましたら合わせてお教えいただければと考えます) デフォルトでいくつかトークナイザー(MeCabやn-gram)が用意さ れているのですが、それの選び方で少し挙動が変わります。 groongaストレージエンジンがトークナイザーのカスタマイズをサ ポートしたらそのあたりがドキュメントとしてまとまるはずです! -- 須藤 功平 <kou****@clear*****> 株式会社クリアコード <http://www.clear-code.com/> (03-6231-7270) Mozilla Firefox/Thunderbirdサポート: http://www.clear-code.com/services/mozilla/menu.html 迷惑メール対策: http://www.clear-code.com/software/milter-manager.html テスティングフレームワーク: http://www.clear-code.com/software/cutter.html http://www.clear-code.com/software/uxu.html