Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.
これは,Julius による音声書き下し(ディクテーション)を
行ってみるための実行キットです.
ダウンロードしてバッチファイルを起動することで、
簡単にマイク音声の認識を行ってみることができます。
このキットは以下のものを含みます:
・Julius-3.4.2 実行バイナリ
・言語モデル(Webから学習した60k語モデル)
・音響モデル(不特定話者PTMトライフォンモデル)
メインの動作環境はLinux および Windows です。
アーカイブ名に "win" がつくのが Windows 用です。
Linux 用はFreeBSD, Solaris その他多くの Unix マシンで動作します.
このキットのモデルの実験室環境での読み上げ認識性能は93%程度です
が、実際の性能は状況や対象によって性能は大きく変動します。
音声認識についての最新情報,さらに詳しい情報については
以下のWebページをご覧下さい.
http://julius.sourceforge.jp/
2004/08/11 v3.0 リリース
- 言語モデルを 60k の Web モデルに変更
- Windows 版を新規作成