JTalk の英単語の読み付与の改善
下記のあたりの一連の作業で、NVDA インストーラーの最初の GNU GPL v2 の英文を だいたいカタカナで読み下せるようになった:
https://github.com/nvdajp/nvdajpmiscdep/commit/ee0440994828f4a624b98e75ba96306c6724dcdc
中略
https://github.com/nvdajp/nvdajpmiscdep/commit/da03e39903708dc378bda3487eda6260f19e8eb7
基本的には s, ed, er などの派生語を規則で処理しつつ、規則で対応できない単語や未知語は地道に登録。
he, be, it などを「へー」「ベー」「アイティー」などと読んでいた問題にも対応。
未対応の作業は a 「ア」「エイ」や the 「ザ」「ジ」のような文脈依存の読み方。
この作業の影響かどうかわからないが、 m001 でアルファベット C が「チ」に聞こえる。 mei と lite はちゃんと「シー」に聞こえる。
JTalk の英単語の読み付与にいろいろおかしいところがありますが、 最近あまり改善に取り組む余裕がありませんでした。
例えば All rights reserved の rights を「リグ エイチティーエス」と読んでいます。
right は「ライト」と読んでいます。
まずは s や ed がつく派生語の辞書をもうすこし丁寧に整備するべきと思います。