Kouhei Sutou
kou****@clear*****
2014年 7月 31日 (木) 22:36:02 JST
須藤です。 In <CANM+HhdjDxA7RmN-WPzB_VPcnp****@mail*****> "[groonga-dev,02557] Re: groonga-normalizer-mysql 1.0.6のgrn_nfkc_char_typeでクラッシュ" on Thu, 31 Jul 2014 02:19:55 +0900, Naoya Murakami <visio****@gmail*****> wrote: >> ちなみに、同じ文字列 > >> > concat(0xd6, 0xbc, 0xde, 0xac, 0xc9, 0x93, 0x27) >> > をMySQL標準のutf8_unicode_ciで正規化したときはどんな文字列に >> > なるかわかりますか?groonga-normalizer-mysqlも同じ挙動にしよ >> > うと思います。 >> > >> > たぶん、元の文字がそのままでてくるか、文字が消えてしまうかの >> > どちらかだと思うんですが。。。元の文字かなぁ。 >> >> これ、だれか確認してもらえないでしょうか。。。 >> >> > 正規化後の文字列を確認する方法というのがわからなかったので、 > mysql-test/r/ctype_uca.resultを参考にして、weight_stringで正規化後の値の > 変化を確認してみました。 ありがとうございます! > 以下の結果を見ると、無効な文字コードを渡すとweight_stringでは何も > 返ってこないようです。 あぁ、じゃあ消えるんですね。 助かりました! ということで、消えるようにしておきました! -- 須藤 功平 <kou****@clear*****> 株式会社クリアコード <http://www.clear-code.com/> Groongaベースの全文検索システムを総合サポート: http://groonga.org/ja/support/ パッチ採用 - プログラミングが楽しい人向けの採用プロセス: http://www.clear-code.com/recruitment/ コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ: http://www.clear-code.com/services/code-reader/