[groonga-dev,02561] Re: groonga-normalizer-mysql 1.0.6のgrn_nfkc_char_typeでクラッシュ

Back to archive index

Kouhei Sutou kou****@clear*****
2014年 7月 31日 (木) 22:36:02 JST


須藤です。

In <CANM+HhdjDxA7RmN-WPzB_VPcnp****@mail*****>
  "[groonga-dev,02557] Re: groonga-normalizer-mysql 1.0.6のgrn_nfkc_char_typeでクラッシュ" on Thu, 31 Jul 2014 02:19:55 +0900,
  Naoya Murakami <visio****@gmail*****> wrote:

>> ちなみに、同じ文字列
> 
>> >   concat(0xd6, 0xbc, 0xde, 0xac, 0xc9, 0x93, 0x27)
>> > をMySQL標準のutf8_unicode_ciで正規化したときはどんな文字列に
>> > なるかわかりますか?groonga-normalizer-mysqlも同じ挙動にしよ
>> > うと思います。
>> >
>> > たぶん、元の文字がそのままでてくるか、文字が消えてしまうかの
>> > どちらかだと思うんですが。。。元の文字かなぁ。
>>
>> これ、だれか確認してもらえないでしょうか。。。
>>
>>
> 正規化後の文字列を確認する方法というのがわからなかったので、
> mysql-test/r/ctype_uca.resultを参考にして、weight_stringで正規化後の値の
> 変化を確認してみました。

ありがとうございます!

> 以下の結果を見ると、無効な文字コードを渡すとweight_stringでは何も
> 返ってこないようです。

あぁ、じゃあ消えるんですね。
助かりました!

ということで、消えるようにしておきました!



-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ:
  http://www.clear-code.com/services/code-reader/




groonga-dev メーリングリストの案内
Back to archive index