チケット #32516

ドキュメントーカが全角数字にはさまれた半角空白を無視する

登録: 2013-12-04 23:44 最終更新: 2014-02-09 13:56

報告者:
担当者:
(未割り当て)
チケットの種類:
状況:
オープン
コンポーネント:
(未割り当て)
マイルストーン:
(未割り当て)
優先度:
5 - 中
重要度:
5 - 中
解決法:
なし
ファイル:
なし

詳細

SAPI5 対応音声エンジンであるドキュメントーカ(クリエートシステム開発)は、全角数字にはさまれた半角空白を無視する仕様のようです。

例えば「10 20」は「じゅう、にじゅう」ではなく「せんにじゅう」と読んでいます。

この仕様と、NVDAの記号読み上げ辞書の影響で、例えば NVDA 2013.2jp で下記のようなことが起こります。

  • NVDAの記号読み上げ辞書のリスト項目127番目あたりに「波線」として全角波線「~」があり、レベル「一部読み上げ」に指定されている。
  • NVDAを記号読み上げ「なし」にすると、「10~20」のような文字列は、全角波線をスペースに置き換えたテキスト「10 20」として音声エンジンに送られる。
  • 結果として「10~20」が「せんにじゅう」と読み上げられてしまう。これは記号読み上げ「なし」であれば「じゅう、にじゅう」と読まれるべきである。

チケットの履歴 (4 件中 3 件表示)

2013-12-04 23:44 更新者: nishimoto
  • 新しいチケット "ドキュメントーカが全角数字にはさまれた半角空白を無視する" が作成されました
2013-12-05 16:16 更新者: nishimoto
コメント

SAPI5 エンジンの出力のときに、全角数字に半角空白が挟まれていたら半角空白2個に置換する、という前処理をするアドオンを作れば解決しそうな気がします。

もうすこし考えてみます。

2013-12-09 09:18 更新者: nishimoto
コメント

もしかすると本件の解決につながるかも知れないのでコメントしますが、本家のチケット 3698 関連の作業で、NVDA が音声エンジンに送る文字列の前処理の方法を変えるようです。

この作業は早ければ 2014.1 にマージされる可能性があります。

In languages which use a space as a digit group/thousands separator such as French and German, numbers from separate chunks of text are no longer pronounced as a single number. This was particularly problematic for table cells containing numbers.

speech.speak now uses CHUNK_SEPARATOR (double space) instead of a single space to separate text chunks in speech sequences.

2014-02-09 13:56 更新者: nishimoto
コメント

日本語テスト版 jpbeta140207 で本件を確認しましたが、 やはり SAPI5 ドキュメントトーカでは 「10 20」を「せんにじゅう」と読んでいます。

ドキュメントトーカ専用に音声ドライバの処理を変更する必要がありますが、 アドオンで解決できるかも知れません。

添付ファイルリスト

添付ファイルはありません

編集

このチケットにコメントを追加するには、ログインが必要です » ログインする