Ticket #30702

機種依存文字のUTF-8コードのbase64エンコード異常について

Open Date: 2013-02-08 12:30 Last Update: 2013-02-10 01:02

Reporter:
(Anonymous)
Owner:
(None)
Type:
Status:
Closed
Component:
(None)
MileStone:
(None)
Priority:
5 - Medium
Severity:
5 - Medium
Resolution:
None
File:
None

Details

 掲題について、

 例えば '㌶'(UTF-8:0xE38CB6) の -wMB オプションでの出力は "57m744Kr" となりますが、

 これを(nkfや他のツールで)デコードすると "繻カ" となります。

(他のツールでエンコードした "=?UTF-8?B?44y2?=" を nkfで -w オプションでデコードすると "㌶" と

 正常な出力が得られます)

 "繻"のShift-JISコードが 0xE38C であることが影響しているのか、

機種依存文字のUTF-8コードのbase64エンコードが異常になるようです。

Ticket History (2/2 Histories)

2013-02-08 12:30 Updated by: None
  • New Ticket "機種依存文字のUTF-8コードのbase64エンコード異常について" created
2013-02-10 01:02 Updated by: naruse
  • Status Update from Open to Closed
  • Ticket Close date is changed to 2013-02-10 01:02
Comment

入力のエンコーディングの自動判定に失敗しているからのようですね。 -wWMB と明示的に指定してあげてください。

Attachment File List

No attachments

Edit

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Login