Ticket #35590

統一英語点字対応モード

Open Date: 2015-10-05 10:39 Last Update: 2016-05-22 11:10

Reporter:
Owner:
Status:
Open [Owner assigned]
Component:
MileStone:
(None)
Priority:
5 - Medium
Severity:
5 - Medium
Resolution:
Accepted
File:
None

Details

統一英語点字(UEB)の日本での取り扱いについての動向を踏まえて、 日本語点訳エンジンの統一英語点字対応モードについてこのチケットで検討。

いずれにせよ日本点字の標準規則はスクリーンリーダーの仕様としては不十分であることから、 なんらかの「NVDA日本語版としての表記方法の開発」が必要である。

NVDA 日本語版の点訳エンジンは、現状で、以下のような規則の組み合わせで構成されている。

(1) 一般的な日本語の漢字仮名交じり文の読み付与、マスあけ、点訳。 日本点字表記法 2001年版に従っている。 英数字は数符や外字符を使った表記に変換。 半角英数字と全角英数字は区別していない。

(2) 日本点字表記法 2001年版が定めていない記号について、 NVDA 日本語版の独自の半角記号、全角記号の規則。 日本語に対応した点訳ソフトやスクリーンリーダーの既存の実装を踏まえて、 NVDA 日本語チームで独自に決めた部分がある。

NVDA 日本語版の説明 7. 点字ディスプレイ 7.1. 記号の出力

http://www.nvda.jp/nvda2015.3jp/ja/readmejp.html#toc43

(3) まとまった文字数の英数字が続く場合、 メールアドレスやURLなど特定のパターンでは、 日本の情報処理用点字の記号の規則を適用。 これは情報処理用点字の開始と終了の記号で囲まれる。

(4) まとまった文字数の英数字が続く場合で(3)以外は、 外国語引用符で囲んで、その中身には 日本で一般的に使われている英語点字の規則を適用。

(5) NVDA の点字設定でコンピューター点字(NABCC)をチェックした場合は、 1バイト文字のの英文字、数字、記号はすべて NABCC になり、 それ以外は日本語点訳の結果が使われる。

仕様についての論点:

  • 新仕様モードに完全移行するのか、従来モードと新仕様モードの2種類を作るのか?
  • 新仕様モードでは上記の(1)から(4)までのそれぞれについて、どのような変更をするのか?
  • 例えば(3)のメールアドレスやURLなどで情報処理点字を使う部分を UEB に移行する、といったことはあまり難しくなさそう。
  • また(4)の外国語引用符の内側だけ完全に UEB にする、という仕様もありえる。
  • 統一英語点字との整合性という話で、日本点字と併用される記号の規則の変更があるが、これは(1)(2)の部分をどうするかという話になる。
  • もっといえば、日本における英語点字の規格を尊重するのか、NVDA 本家版ですでに広く使われている UEB モードの使い勝手に近づけるのか、というアプローチの違いもある。
  • 新しい仕様をどういうユーザーに向けて作るのか、という位置づけも議論できていない。
  • ソフトウェア開発など技術者の多くは NABCC を好むと思われる。
  • 日本点字委員会は現在のところ「一般日本語文章にはUEBを原則として導入しない」としている。
  • 「英語の教科書・試験問題等」への導入スケジュールは明確になっているが NVDA 日本語版のユーザーから需要があるかどうかは不明。

実装についての論点:

  • 現状の Python ベースの点訳エンジンの実装を再検討したい。
  • テストケースを日本点字のコア規則と、記号に関する部分に分離する
  • 現在の実装の新仕様モードを追加するのか、エンジンを作り直すのか
  • UEB 関連はテーブルから作るのか、liblouis から取り込むか
  • 従来からの点訳エンジンの課題:開発にコミットしやすくする、クロスプラットフォーム、liblouis との統合、など

Ticket History (3/3 Histories)

2015-10-05 10:39 Updated by: nishimoto
  • New Ticket "統一英語点字対応モード" created
2015-10-05 10:41 Updated by: nishimoto
  • Details Updated
2016-05-22 11:10 Updated by: nishimoto
  • Resolution Update from None to Accepted
Comment

#36052 で本件に関連する変更を実施。 UEB モードを追加するのではなく、まずは外国語引用符の中身について、日本の英語点字の規則から UEB に移行していく。

2016.1jp までの仕様

(3) まとまった文字数の英数字が続く場合、 メールアドレスやURLなど特定のパターンでは、 日本の情報処理用点字の記号の規則を適用。 これは情報処理用点字の開始と終了の記号で囲まれる。 (4) まとまった文字数の英数字が続く場合で(3)以外は、 外国語引用符で囲んで、その中身には 日本で一般的に使われている英語点字の規則を適用。

2016.2jp の仕様

(3) まとまった文字数の英数字が続く場合、 メールアドレスやURLなど特定のパターンでは、 日本の情報処理用点字の記号の規則を適用。 これは情報処理用点字の開始と終了の記号で囲まれる。 (4) まとまった文字数の英数字が続く場合で(3)以外は、 外国語引用符で囲んで、その中身には 日本で一般的に使われている英語点字の規則を適用。ただし数符の効力に関しては UEB の規則、すなわち、数符の効力は数字及びコンマ・ピリオドが連続する間継続し、 それ以外の記号やマスあけで終わる。 小数点は、ピリオド(256)を用いる。

この(3)と(4)の使い分けについて、「日本の情報処理用点字」をやめて UEB に揃える、というモードの導入も考えられる。

Attachment File List

No attachments

Edit

Please login to add comment to this ticket » Login