ダウンロードリスト

プロジェクト概要

Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.

リリース時刻: 2013-06-30 00:00
julius 4.2.3

名前 サイズ ハッシュ 日付 ダウンロード数
julius-4.2.3-linuxbin.tar.gz 2.20 MB 2013-06-28 14:38 2366
julius-4.2.3-win32bin.zip 3.45 MB 2013-06-28 14:38 5282
julius-4.2.3.tar.gz 1.62 MB 2013-06-28 14:38 5795

リリースノート

Version 4.2.3 includes new features: dictionary reloading, audio input
scaling, long input rejection, minimum bayes risk decoding, and
character set conversion of binary N-gram. Several bugs has also been
fixed.

New options:
-lvscale
-rejectlong
-mbr, -nombr, -mbr_wwer, -mbr_weight

See the "Release.txt" file for the full list of updates.
Run with "-help" to see full list of options.

バージョン 4.2.3 で追加された新機能は、辞書の再読み込み、入力音声波形の
スケーリング、長時間入力の棄却、ベイズリスク最小化探索(南條浩輝氏,古
谷遼氏より提供)、およびバイナリN-gramの文字コード変換機能です。またい
くつかの不具合が修正されました。

新オプション:
-lvscale
-rejectlong
-mbr, -nombr, -mbr_wwer, -mbr_weight

変更点の詳細な一覧は Release-ja.txt をご覧ください.
また "-help" をつけて実行することでオプションの全リストが出力されます。

変更履歴

New features:
- Add function "j_reload_adddict()" to reload dictionaries.
- Add option "-lvscale factor" and func "j_adin_change_input_scaling_factor()"
to scale the amplitude of captured audio by the factor.
- Add option "-rejectlong msec" to reject too long input.
- Add minimum bayes risk decoding, contributed by H. Nanjo and R. Furutani
- Support binary N-gram symbol charset conversion by "mkbingram".

Fixes:
- Fix sending audio stream via network with incorrect byte order at
big-endian machines.
- Fix occasional failure of closing audio device at j_close_stream().
- Fix segfault when reading binary hmm created at 64bit env. with embedded parameters.
- Fix memory leak when failed to read an N-gram file.
- Fix memory leak when input length overflow is detected.
- Fix unable to load feature vector plugin.
- Update microphone input code for recent MacOSX.

○新機能
- 辞書のリロード: j_reload_adddict()
- 音声入力の振幅のスケーリング:"-lvscale factor" および
"j_adin_change_input_scaling_factor()"
- 長い入力の棄却:"-rejectlong msec"
- バイナリN-gramの文字コード変換をサポート: "mkbingram"
- ベイズリスク最小化(MBR)探索の実装(南條浩輝氏,古谷遼氏より提供)
MBR Extension contributed by Hiroaki Nanjo and Ryo Furutani.

○修正されたバグ
- ビッグエンディアンマシンでadinnetで音声をネットワーク送信するときに
エンディアンが異なっていた問題
- j_close_stream() で音声デバイスのクローズにたまに失敗する
- 64bit環境で変換されたパラメータ埋め込み付きバイナリHMMが読み込めない問題
- N-gram ファイル読み込み失敗時のメモリリーク
- 入力長オーバーフロー時のメモリリーク
- 特徴ベクトル呼び込みプラグインが動作しない
- 最新のMacOSXでコンパイルに失敗する