Forums: 公開討議 (Thread #30845)

v2.06以降では―をeucにしてutf8に戻すと化ける (2011-11-18 02:17 by sh #60621)

お世話になっております.自然言語処理でとても重宝させていただいております.



UTF8の上記文字をnkfでEUCにしてさらにUTF8に戻すと
* nkf2.05までだと化けませんが
* nkf2.07だと?に変わります.
これは仕様でしょうか?エンバグでしょうか.

自分としては2.05までの挙動のほうがありがたいです.
もしエンバグだとすれば,Fixされるとうれしいです.

Reply to #60621×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: v2.06以降では―をeucにしてutf8に戻すと化ける (2011-11-18 09:44 by naruse #60632)

2.0.5でUnicodeとの変換テーブルが整理された影響ですね。
標準ではJIS準拠の挙動を示すようになったので意図通りです。
具体的には U+2015 -> 0xA1BD -> U+2014 と変換されています。

以前のように0xA1BD->U+2014 と変換させたい場合は、
nkf -w --ic=cp51932 と指定してください。
Reply to #60621

Reply to #60632×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

RE: v2.06以降では―をeucにしてutf8に戻すと化ける (2011-11-18 22:44 by sh #60641)

成瀬様,さっそくのご連絡ありがとうございます.
教えていただいたオプションでうまく行きました.
とても助かりました.ありがとうございます.
Reply to #60621

Reply to #60641×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login