[groonga-dev,00379] Re: groonga ストレージエンジンでn-gramへの切替

Back to archive index

Kouhei Sutou kou****@clear*****
2010年 10月 8日 (金) 10:00:31 JST


須藤です。

In <20101****@trial*****>
  "[groonga-dev,00377] groonga ストレージエンジンでn-gramへの切替" on Thu, 07 Oct 2010 05:31:31 +0900,
  kameoyaji <kenji****@trial*****> wrote:

> 全文検索時のインデックスの作成を
> mecab,n-gram(2文字、3文字)に切り替える方法はどのようにすれば行えるの
> でしょうか?(n-gramを使用したいもので)

今はBigram固定なのですが、次のバージョンではカスタマイズでき
るようになると思います!
  http://redmine.groonga.org/issues/592

> 又、英記号(ドットや、-、?等)もインデックス対象の文字にする設定などが有
> りましたら合わせてお教えいただければと考えます)

デフォルトでいくつかトークナイザー(MeCabやn-gram)が用意さ
れているのですが、それの選び方で少し挙動が変わります。
groongaストレージエンジンがトークナイザーのカスタマイズをサ
ポートしたらそのあたりがドキュメントとしてまとまるはずです!

-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/> (03-6231-7270)

Mozilla Firefox/Thunderbirdサポート:
  http://www.clear-code.com/services/mozilla/menu.html
迷惑メール対策:
  http://www.clear-code.com/software/milter-manager.html
テスティングフレームワーク:
  http://www.clear-code.com/software/cutter.html
  http://www.clear-code.com/software/uxu.html




groonga-dev メーリングリストの案内
Back to archive index