Ticket #32516

ドキュメントーカが全角数字にはさまれた半角空白を無視する

Open Date: 2013-12-04 23:44 Last Update: 2014-02-09 13:56

Reporter:
Owner:
(None)
Status:
Open
Component:
(None)
MileStone:
(None)
Priority:
5 - Medium
Severity:
5 - Medium
Resolution:
None
File:
None

Details

SAPI5 対応音声エンジンであるドキュメントーカ(クリエートシステム開発)は、全角数字にはさまれた半角空白を無視する仕様のようです。

例えば「10 20」は「じゅう、にじゅう」ではなく「せんにじゅう」と読んでいます。

この仕様と、NVDAの記号読み上げ辞書の影響で、例えば NVDA 2013.2jp で下記のようなことが起こります。

  • NVDAの記号読み上げ辞書のリスト項目127番目あたりに「波線」として全角波線「~」があり、レベル「一部読み上げ」に指定されている。
  • NVDAを記号読み上げ「なし」にすると、「10~20」のような文字列は、全角波線をスペースに置き換えたテキスト「10 20」として音声エンジンに送られる。
  • 結果として「10~20」が「せんにじゅう」と読み上げられてしまう。これは記号読み上げ「なし」であれば「じゅう、にじゅう」と読まれるべきである。

Ticket History (3/4 Histories)

2013-12-04 23:44 Updated by: nishimoto
  • New Ticket "ドキュメントーカが全角数字にはさまれた半角空白を無視する" created
2013-12-05 16:16 Updated by: nishimoto
Comment

SAPI5 エンジンの出力のときに、全角数字に半角空白が挟まれていたら半角空白2個に置換する、という前処理をするアドオンを作れば解決しそうな気がします。

もうすこし考えてみます。

2013-12-09 09:18 Updated by: nishimoto
Comment

もしかすると本件の解決につながるかも知れないのでコメントしますが、本家のチケット 3698 関連の作業で、NVDA が音声エンジンに送る文字列の前処理の方法を変えるようです。

この作業は早ければ 2014.1 にマージされる可能性があります。

In languages which use a space as a digit group/thousands separator such as French and German, numbers from separate chunks of text are no longer pronounced as a single number. This was particularly problematic for table cells containing numbers.

speech.speak now uses CHUNK_SEPARATOR (double space) instead of a single space to separate text chunks in speech sequences.

2014-02-09 13:56 Updated by: nishimoto
Comment

日本語テスト版 jpbeta140207 で本件を確認しましたが、 やはり SAPI5 ドキュメントトーカでは 「10 20」を「せんにじゅう」と読んでいます。

ドキュメントトーカ専用に音声ドライバの処理を変更する必要がありますが、 アドオンで解決できるかも知れません。

Attachment File List

No attachments

Edit

Please login to add comment to this ticket » Login