UTF-8で4バイトになる文字の取り扱い
現状のTera TermのUTF-8対応では3バイトまでの文字しかデコードできない。 4バイトの文字は最初の3バイトでデコードしようとし、残った1バイトをゴミとして表示する。 Unicodeとしては不正であるが、5~6バイトの文字も同様。
4バイト以上の文字は現状のTera Termでは表示できないが、デコードだけでも正しく行うべき。
試験的な実装: https://osdn.net/users/doda/pf/Tera_Term_Testing/scm/commits/de91f85dedd79a353c409f61aefba4a7e36404f7
r7430 でとりあえず修正が入ったので一旦クローズ。
この実装 を使うかは別途検討。(と言ってきっと忘れる)
現状のTera TermのUTF-8対応では3バイトまでの文字しかデコードできない。 4バイトの文字は最初の3バイトでデコードしようとし、残った1バイトをゴミとして表示する。 Unicodeとしては不正であるが、5~6バイトの文字も同様。
4バイト以上の文字は現状のTera Termでは表示できないが、デコードだけでも正しく行うべき。