[groonga-dev,04300] Re: Mroongaの設定についての確認

Back to archive index

Kentaro Hayashi hayas****@clear*****
2017年 3月 24日 (金) 20:04:45 JST


林です。

On Tue, 21 Mar 2017 19:31:36 +0900
m-dob****@rozet***** wrote:

> いつもお世話になっています。ドブリンです。
>
> 下記の設定・テーブル定義について確認したいことがあります。
>
> ----------------------------
> 'mroonga_default_parser' = TokenBigram
>
>
> CREATE TABLE `TABLE_1` (
>   `id` int(11) NOT NULL,
>   `std_english` mediumtext,
>   `wa_japanese` mediumtext,
>   PRIMARY KEY (`id`),
>   FULLTEXT KEY `index_so` (`std_english`) COMMENT 'parser "TokenDelimit"
> ',
>   FULLTEXT KEY `index_wj` (`wa_japanese`) COMMENT 'parser\n"
> TokenDelimit"'
> ) ENGINE=mroonga DEFAULT CHARSET=utf8 COMMENT='engine "innodb"';
> ----------------------------
>
>
>
> 1.  「COMMENT 'parser "TokenDelimit"」と「COMMENT 'parser\n"
> TokenDelimit"'」を定義すると、ディフォルトの動作との違いがありますか?
> 違いがあるならば、具体的に何が変わるのでしょうか?
>

「COMMENT 'parser\n" TokenDelimit"'」としてしまうと「\n」のせいで定義が
無効となります。その結果wa_japaneseに対してデフォルト値であるTokenBigramが適用されます。
そのためタグテキストを格納してトークナイズしようとしている場合に意図した結果にならないと
思われます。(wa_japaneseにTokenDelimitではなくTokenBigramが適用されるため)

> 2.  テーブルのカラムにCOMMENTを追加する場合、mroonga_default_parserを
> 「TokenBigram」にする意味がありますか?
>

TokenBigramがデフォルト値になっているので、テーブルのカラムにCOMMENTを追加する
しないに関係なく、mroonga_default_parserにTokenBigramを指定する意味は
ありません。

参考までに、mroonga_default_parserは廃止されています。
  http://mroonga.org/ja/docs/reference/server_variables.html#mroonga-default-parser
かわりに、mroonga_default_tokenizerを使うようにしてください。
  http://mroonga.org/ja/docs/reference/server_variables.html#mroonga-default-tokenizer

>
> よろしくお願いします。
> ドブリン マイケル
>
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev


--
Kentaro Hayashi <hayas****@clear*****>
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: 無し
型:         application/pgp-signature
サイズ:     833 バイト
説明:       無し
Download 



groonga-dev メーリングリストの案内
Back to archive index