[groonga-dev,03222] Re: 「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関して

Back to archive index

三井しょうた 01035****@gmail*****
2015年 5月 14日 (木) 09:35:36 JST


須藤様

お世話になります。三井です。

早々のご確認・ご対応ありがとうございます。

試してみたいと思ったのですが、下記のエラーとなってしまいました。

# rpm -Uvh
http://packages.groonga.org/tmp/groonga-normalizer-mysql-devel-1.1.0-1.el6.x86_64.rpm

Retrieving
http://packages.groonga.org/tmp/groonga-normalizer-mysql-devel-1.1.0-1.el6.x86_64.rpm
error: Failed dependencies:
        groonga-normalizer-mysql = 1.1.0-1.el6 is needed by
groonga-normalizer-mysql-devel-1.1.0-1.el6.x86_64

<環境>
# rpm -qa|grep groonga
groonga-normalizer-mysql-1.0.9-1.el6.x86_64
groonga-tokenizer-mecab-5.0.2-1.el6.x86_64
groonga-release-1.1.0-1.noarch
groonga-libs-5.0.2-1.el6.x86_64

申し訳ございませんが、対応についてご教授いただけないでしょうか。

以上、よろしくお願いいたします。



2015年5月13日 22:20 Kouhei Sutou <kou****@clear*****>:

> 須藤です。
>
> In <CAGOe04KJ-G03MvH+Jo+6kudXt+HO-GEAO_qcMf-__0414r****@mail*****>
>   "[groonga-dev,03215]
> 「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関して" on Wed, 13 May 2015
> 15:09:47 +0900,
>   三井しょうた <01035****@gmail*****> wrote:
>
> > parserとして、表題の
> > 「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関してですが、
> >
> > ・空白を無視して処理する。
> > ・「090 0123 4567」に「9001」でマッチする。
> >
> > と言う例がよく紹介されています。
> >
> > 今回データの例として、
> > 「ゴルフ△青森』 ※△は全角スペース
> > に対して、下記何れのキーワードでも検索結果が応答されるようにしたいと考
> > えています。
> > 1.「ゴルフ青森」※全角スペースなし
> > 2.「ごるふ青森」※全角スペースなし
> > 3.「ゴルフ」
> > 4.「ごるふ」
> >
> > かな、カナを無視したいので、
> > normalizerに、
> > 「NormalizerMySQLUnicodeCIExceptKanaCIKanaWithVoicedSoundMark」
> > を設定したところ、3、4ではヒットしますが、1、2ではヒットしませんで
> > した。
> > ※空白が無視されない
> >
> > 参考までに「NormalizerAuto」を利用すると、1、3でヒットしますが、2、
> > 4ではヒットしませんでした。
> > ※空白は無視されるが、かな、カナは同一視できない
> >
> > どういった設定をすれば良いかわからず、設定について何とかご教授いただき
> > たいと
> > 考えております。
>
> すみません、groonga-normalizer-mysql(NormalizerMySQLファミ
> リー)のバグでした。
>
> 正規化した後の文字が半角スペースかどうかをチェックするべきと
> ころを、正規化前の文字が半角スペースかどうかをチェックしてい
> ました。。。
>
> この変更で互換性がなくなってしまうのですが、これまでの挙動が
> バグだったので変更することにします。
>
> メモ:次回リリース時にはインデックスを作りなおさないといけな
> いことを明記すること。Mroonga側で自動検出してインデックスを
> 作り直せるならその仕組みを入れること。
>
> 要検討:NormalizerAutoとかは0x20以下のASCII文字(表示できな
> いやつら)も空白文字扱いにしているけど
> groonga-normalizer-mysqlもそうするべき?そうした方が便利な気
> がするけどMySQLとの互換じゃなくなる(MySQLだと'\t' = ' 'じゃ
> ないよね?)ので微妙な気はする。
>
>
> なので、回答は修正版のgroonga-normalizer-mysqlにアップグレー
> ドして「NormalizerMySQL...」と「TokenBigramIgnoreBlank...」
> を使ってください。ただし、アップグレード後に
>
>   ALTER TABLE テーブル名 DISABLE KEYS;
>   ALTER TABLE テーブル名 ENABLE KEYS;
>
> としてインデックスを作り直す必要があります。
>
>
> たぶん、次回リリースまで待てないと思うので、この問題の修正を
> 含んだRPMを作りました。次回リリースまではこれでしのいでくだ
> さい。
>
>   * 32bit版:
> http://packages.groonga.org/tmp/groonga-normalizer-mysql-devel-1.1.0-1.el6.i686.rpm
>   * 64bit版:
> http://packages.groonga.org/tmp/groonga-normalizer-mysql-devel-1.1.0-1.el6.x86_64.rpm
>
> rpmコマンドでインストールした後にMySQLを再起動すると
> groonga-normalizer-mysqlのアップグレードは完了です。その後に
> インデックスを作りなおしてください。
>
>
> --
> 須藤 功平 <kou****@clear*****>
> 株式会社クリアコード <http://www.clear-code.com/>
>
> Groongaベースの全文検索システムを総合サポート:
>   http://groonga.org/ja/support/
> パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
>   http://www.clear-code.com/recruitment/
> プログラミングが好きな学生のための勉強会:
>   http://www.seplus.jp/sezemi/
>
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download 



groonga-dev メーリングリストの案内
Back to archive index