[Nkf-dev 4] eucJP-msのマッピング変更について

Back to archive index

NARUSE, Yui narus****@airem*****
2006年 1月 27日 (金) 22:12:22 JST


成瀬です。

さて、先日EUC-JPのマッピングで迷っていたわけですが、
ICUがglibcのeucJP-msマッピングをucm形式で公開しているのを見つけました。
http://dev.icu-project.org/cgi-bin/viewcvs.cgi/charset/data/ucm/

調べてみたところ、以下の点で現在のnkfとマッピングが異なるようです。

nkf.c rev 1.90, utftbl.c rev 1.16
<U00A5> \xA1\xEF |1
<U203E> \xA1\xB1 |1

glibc-EUC_JP_MS-2.3.3.ucm
<U00A5> \x5C |1
<U203E> \x7E |1

これについて、nkfのマッピングをglibcにあわせようと思っているのですが、
ご意見ありますでしょうか。


ASCII外の文字が文字コードの変換によってASCIIに飛び込んでくる件は、
CP932がどうしようもないことを考えると、
「仕様」とし、別途注意を喚起した方がいい気がしてきました。

#ちなみに、-eやeucJP-asciiにはそのような文字はありません


なおこの件については、
-e(eucJP-nkf)及びeucJP-asciiのマッピングに変更はありません。

-- 
NARUSE, Yui  <narus****@airem*****>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA



nkf-dev メーリングリストの案内
Back to archive index