[groonga-dev,03215] 「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関して

Back to archive index

三井しょうた 01035****@gmail*****
2015年 5月 13日 (水) 15:09:47 JST


はじめまして。三井と申します。

parserとして、表題の
「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関してですが、

・空白を無視して処理する。
・「090 0123 4567」に「9001」でマッチする。

と言う例がよく紹介されています。

今回データの例として、
「ゴルフ△青森』 ※△は全角スペース
に対して、下記何れのキーワードでも検索結果が応答されるようにしたいと考えています。
1.「ゴルフ青森」※全角スペースなし
2.「ごるふ青森」※全角スペースなし
3.「ゴルフ」
4.「ごるふ」

かな、カナを無視したいので、
normalizerに、
「NormalizerMySQLUnicodeCIExceptKanaCIKanaWithVoicedSoundMark」
を設定したところ、3、4ではヒットしますが、1、2ではヒットしませんでした。
※空白が無視されない

参考までに「NormalizerAuto」を利用すると、1、3でヒットしますが、2、4ではヒットしませんでした。
※空白は無視されるが、かな、カナは同一視できない

どういった設定をすれば良いかわからず、設定について何とかご教授いただきたいと
考えております。

<環境>
CentOS 6.6
MySQL 5.6.24 (utf8)
mroonga 5.0.2

以上、よろしくお願いいたします。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download 



groonga-dev メーリングリストの案内
Back to archive index