チケット #35590

統一英語点字対応モード

登録: 2015-10-05 10:39 最終更新: 2016-05-22 11:10

報告者:
担当者:
チケットの種類:
状況:
オープン [担当者決定済み]
コンポーネント:
マイルストーン:
(未割り当て)
優先度:
5 - 中
重要度:
5 - 中
解決法:
受領
ファイル:
なし

詳細

統一英語点字(UEB)の日本での取り扱いについての動向を踏まえて、 日本語点訳エンジンの統一英語点字対応モードについてこのチケットで検討。

いずれにせよ日本点字の標準規則はスクリーンリーダーの仕様としては不十分であることから、 なんらかの「NVDA日本語版としての表記方法の開発」が必要である。

NVDA 日本語版の点訳エンジンは、現状で、以下のような規則の組み合わせで構成されている。

(1) 一般的な日本語の漢字仮名交じり文の読み付与、マスあけ、点訳。 日本点字表記法 2001年版に従っている。 英数字は数符や外字符を使った表記に変換。 半角英数字と全角英数字は区別していない。

(2) 日本点字表記法 2001年版が定めていない記号について、 NVDA 日本語版の独自の半角記号、全角記号の規則。 日本語に対応した点訳ソフトやスクリーンリーダーの既存の実装を踏まえて、 NVDA 日本語チームで独自に決めた部分がある。

NVDA 日本語版の説明 7. 点字ディスプレイ 7.1. 記号の出力

http://www.nvda.jp/nvda2015.3jp/ja/readmejp.html#toc43

(3) まとまった文字数の英数字が続く場合、 メールアドレスやURLなど特定のパターンでは、 日本の情報処理用点字の記号の規則を適用。 これは情報処理用点字の開始と終了の記号で囲まれる。

(4) まとまった文字数の英数字が続く場合で(3)以外は、 外国語引用符で囲んで、その中身には 日本で一般的に使われている英語点字の規則を適用。

(5) NVDA の点字設定でコンピューター点字(NABCC)をチェックした場合は、 1バイト文字のの英文字、数字、記号はすべて NABCC になり、 それ以外は日本語点訳の結果が使われる。

仕様についての論点:

  • 新仕様モードに完全移行するのか、従来モードと新仕様モードの2種類を作るのか?
  • 新仕様モードでは上記の(1)から(4)までのそれぞれについて、どのような変更をするのか?
  • 例えば(3)のメールアドレスやURLなどで情報処理点字を使う部分を UEB に移行する、といったことはあまり難しくなさそう。
  • また(4)の外国語引用符の内側だけ完全に UEB にする、という仕様もありえる。
  • 統一英語点字との整合性という話で、日本点字と併用される記号の規則の変更があるが、これは(1)(2)の部分をどうするかという話になる。
  • もっといえば、日本における英語点字の規格を尊重するのか、NVDA 本家版ですでに広く使われている UEB モードの使い勝手に近づけるのか、というアプローチの違いもある。
  • 新しい仕様をどういうユーザーに向けて作るのか、という位置づけも議論できていない。
  • ソフトウェア開発など技術者の多くは NABCC を好むと思われる。
  • 日本点字委員会は現在のところ「一般日本語文章にはUEBを原則として導入しない」としている。
  • 「英語の教科書・試験問題等」への導入スケジュールは明確になっているが NVDA 日本語版のユーザーから需要があるかどうかは不明。

実装についての論点:

  • 現状の Python ベースの点訳エンジンの実装を再検討したい。
  • テストケースを日本点字のコア規則と、記号に関する部分に分離する
  • 現在の実装の新仕様モードを追加するのか、エンジンを作り直すのか
  • UEB 関連はテーブルから作るのか、liblouis から取り込むか
  • 従来からの点訳エンジンの課題:開発にコミットしやすくする、クロスプラットフォーム、liblouis との統合、など

チケットの履歴 (3 件中 3 件表示)

2015-10-05 10:39 更新者: nishimoto
  • 新しいチケット "統一英語点字対応モード" が作成されました
2015-10-05 10:41 更新者: nishimoto
  • 詳細が更新されました
2016-05-22 11:10 更新者: nishimoto
  • 解決法なし から 受領 に更新されました
コメント

#36052 で本件に関連する変更を実施。 UEB モードを追加するのではなく、まずは外国語引用符の中身について、日本の英語点字の規則から UEB に移行していく。

2016.1jp までの仕様

(3) まとまった文字数の英数字が続く場合、 メールアドレスやURLなど特定のパターンでは、 日本の情報処理用点字の記号の規則を適用。 これは情報処理用点字の開始と終了の記号で囲まれる。 (4) まとまった文字数の英数字が続く場合で(3)以外は、 外国語引用符で囲んで、その中身には 日本で一般的に使われている英語点字の規則を適用。

2016.2jp の仕様

(3) まとまった文字数の英数字が続く場合、 メールアドレスやURLなど特定のパターンでは、 日本の情報処理用点字の記号の規則を適用。 これは情報処理用点字の開始と終了の記号で囲まれる。 (4) まとまった文字数の英数字が続く場合で(3)以外は、 外国語引用符で囲んで、その中身には 日本で一般的に使われている英語点字の規則を適用。ただし数符の効力に関しては UEB の規則、すなわち、数符の効力は数字及びコンマ・ピリオドが連続する間継続し、 それ以外の記号やマスあけで終わる。 小数点は、ピリオド(256)を用いる。

この(3)と(4)の使い分けについて、「日本の情報処理用点字」をやめて UEB に揃える、というモードの導入も考えられる。

添付ファイルリスト

添付ファイルはありません

編集

このチケットにコメントを追加するには、ログインが必要です » ログインする