機種依存文字のUTF-8コードのbase64エンコード異常について
掲題について、
例えば '㌶'(UTF-8:0xE38CB6) の -wMB オプションでの出力は "57m744Kr" となりますが、
これを(nkfや他のツールで)デコードすると "繻カ" となります。
(他のツールでエンコードした "=?UTF-8?B?44y2?=" を nkfで -w オプションでデコードすると "㌶" と
正常な出力が得られます)
"繻"のShift-JISコードが 0xE38C であることが影響しているのか、
機種依存文字のUTF-8コードのbase64エンコードが異常になるようです。
入力のエンコーディングの自動判定に失敗しているからのようですね。 -wWMB と明示的に指定してあげてください。
掲題について、
例えば '㌶'(UTF-8:0xE38CB6) の -wMB オプションでの出力は "57m744Kr" となりますが、
これを(nkfや他のツールで)デコードすると "繻カ" となります。
(他のツールでエンコードした "=?UTF-8?B?44y2?=" を nkfで -w オプションでデコードすると "㌶" と
正常な出力が得られます)
"繻"のShift-JISコードが 0xE38C であることが影響しているのか、
機種依存文字のUTF-8コードのbase64エンコードが異常になるようです。