Ticket #37548

CP932のFA40以降について、EUC-JISX0213間の変換にバグ

Open Date: 2017-10-03 16:24 Last Update: 2017-12-24 23:01

Reporter:
Owner:
(None)
Type:
Status:
Closed
Component:
(None)
MileStone:
(None)
Priority:
5 - Medium
Severity:
5 - Medium
Resolution:
Won't Fix
File:
None

Details

Unicode文字CP932EUC-JISX0213(正常)EUC-JISX0213(nkf出力)EUC-JP-MS
U2170FA40ACB58FF9A18FF3F3
U6D96FB40無し8FFDAB8FC7CB
U9E19FC4A8FFECF8FFDAB8FECD6
U9ED1FC4BFEF28FFDAC8FF4FE


CP932のFA40以降のコードについて、
CP932⇔EUC-JISX0213/EUC-JIS-2004間の変換がバグっているようです。
幾つかの文字を確認しただけですが、FA40以降のコードは
一律、8FF9A1を起点とした、異なったコードに変換されているように見えます。

CP932⇔EUC-JP-MS間の変換は正常なようです。

# printf '\xfa\x40' | nkf --ic=CP932 --oc=EUC-JISX0213 | od -tx1
0000000 8f f9 a1    ←本来はac b5
0000003

# printf '\xfa\x40' | nkf --ic=CP932 --oc=EUC-JIS-2004 | od -tx1
0000000 8f f9 a1    ←本来はac b5
0000003

# printf '\xac\xb5' | nkf --ic=EUC-JISX0213 --oc=CP932 | od -tx1
0000000 86 b3       ←本来はfa 40
0000002

# printf '\xfe\xf2' | nkf --ic=EUC-JISX0213 --oc=CP932 | od -tx1
0000000             ←本来はfc 4b

# nkf --version
Network Kanji Filter Version 2.1.4 (2015-12-12)

Ticket History (2/2 Histories)

2017-10-03 16:24 Updated by: a-nakajima
  • New Ticket "CP932のFA40以降について、EUC-JISX0213間の変換にバグ" created
2017-12-24 23:01 Updated by: naruse
  • Details Updated
  • Resolution Update from None to Won't Fix
  • Status Update from Open to Closed
Comment

IBM拡張文字の範囲はCP932とJIS X 0213の間ではJISベースでは変換出来ないので既知の制限ですね。 Unicodeを経由するようにするか、別にテーブルを用意すれば変換可能なはずではあるのですが。

Attachment File List

No attachments

Edit

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Login