Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.
これは,Julius による音声書き下し(ディクテーション)を
行ってみるための実行キットです.
ダウンロードしてバッチファイルを起動することで、
簡単にマイク音声の認識を行ってみることができます。
このキットは以下のものを含みます:
・Julius-3.4.2 実行バイナリ
・言語モデル(新聞記事から学習した20k語モデル)
・音響モデル(不特定話者PTMトライフォンモデル)
メインの動作環境はLinux です。
FreeBSD, Solaris その他多くの Unix マシンで動作します.
このキットのモデルの実験室環境での読み上げ認識性能は93%程度です
が、実際の性能は状況や対象によって性能は大きく変動します。
音声認識についての最新情報,さらに詳しい情報については
以下のWebページをご覧下さい.
http://julius.sourceforge.jp/
2001/01/08 Version 2.1 リリース
- 最初のリリース
- Julius-3.1p2 + 新聞記事言語モデル
2004/05/07 Version 2.2 リリース
- 実行バイナリを Julius-3.4.2 に更新