ダウンロードリスト

プロジェクト概要

Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.

リリース時刻: 2006-07-29 23:30
julius 3.5.2

名前 サイズ ハッシュ 日付 ダウンロード数
julius-3.5.2-linuxbin.tar.gz 1.07 MB 2006-07-29 23:31 1069
julius-3.5.2-win32bin.zip 2.08 MB 2006-07-29 23:31 6310
julius-3.5.2.tar.gz 1.20 MB 2006-07-29 23:30 4188

リリースノート

What's new in Julius-3.5.2 ?
=============================

Julius/Julian rev.3.5.2 is a minor update to improves performance on
Windows, enhancements and fixes for word graph outputs, and other bug
fixes. All users of previous version is encouraged to upgrade to 3.5.2.

Summary of changes in 3.5.2:

o Speed-up and improvement on Windows console.
- DirectSound
- Recent MinGW support
o More accurate word graph output.
- new optimization params: -graphcut, -graphboundloop, -graphsearchdelay
o Add capability to output word graph instead of trellis on 1st pass.
o Bug fixes.
o Imprementation improvements.

Details of the changes are listed in "Release.txt".

Please note that if you want to compile Julius with DirectSound
support, you need DirectX headers installed in your mingw / cygwin
environment. If not exist, configure will choose an old interface.
Please see install instruction on the Web.

Julius-3.5.2
=============

Julius-3.5.2 では,Windowsでの性能改善,問題の修正,単語グラフに
関する修正と拡張が行われました.以前のバージョンをお使いの方は
このバージョンの利用を推奨します.

変更点を以下にまとめます.

- Windows コンソールでの動作の大幅改善
- DirectSound サポート (cygwin / mingw)
- 入力のスレッド化 (portaudio API 使用)
- 最新の MinGW 環境(5.0.2) に対応
- 単語グラフの精度改善
- 調整用オプション: -graphcut, -graphboundloop, -graphsearchdelay
- 第1パスで単語トレリスのかわりに単語グラフを出力可能になった
- バグ修正
- 実装の改善

すべての変更点は Release-ja.txt にまとめられていますので,ご覧下さい.
なお,単語グラフの正確さと精度は改善されましたが,通常の認識精度と速度
は前バージョンと同じです.

Windows で DirectSound を使用した Julius をコンパイルするには,
DirectX のヘッダがインストールされている必要があります.
無い場合, configure スクリプトが自動的に古い(性能の低い)ドライバ
を使用します.インストールの詳細については Web のインストールマニュア
ルをご覧下さい.

変更履歴

3.5.2 (2006.07.31)
===================
o Speed-up and improvement on Windows console:
- Support DirectSound for better input handling
- Support input threading utilizing callback API on portaudio.
- Support newest MinGW (tested on 5.0.2)

o More accurate word graph output:
- Add option to cut the resulting graph by its depth
(option -graphcut, and enabled by default!)
- Set limit for post-processing loop to avoid infinite loop
(option -graphboundloop, and set by default)
- Refine graph generation algorithm concerning dynamic word merging
and search termination on the second pass.

o Add capability to output word graph instead of trellis on 1st pass:
- 1st pass generates word graph instead of word trellis as
intermediate result by specifying "--enable-word-graph".
In that case, the 2nd pass will be restricted on the graph, not
on the whole trellis.
- With "--enable-word-graph" and "--enable-wpair" option, the
first pass of Julius can perform 1-pass graph generation based
on 2-gram with basically the same algorithm as other popular
word graph based decoders.

o Bug fixes:
- configure script did not work on Solaris 8/9
- "-gprune none" did not work on tied-mixture AM
- Incorrect error message for AM with duration header other than "NULLD"
- Always warns abount zero frame stripping upon MFCC

o Imprementation improvements:
- bmalloc2-based AM memory management

3.5.2 (2006.07.31)
===================
- Windows コンソールでの動作の大幅改善
- DirectSound サポート (cygwin / mingw)
- 入力のスレッド化 (portaudio API 使用)
- 最新の MinGW 環境(5.0.2) に対応

- 単語グラフの精度改善
- 単語グラフの深さによるカット機能の追加 (-graphcut)
- 後処理の無限ループ回避用の上限設定 (-graphboundloop)
- グラフ単語仮説のマージと探索中断に関するアルゴリズムの改善

- 第1パスで単語トレリスのかわりに単語グラフを出力可能になった
- "--enable-word-graph" で単語グラフを出力,第2パスはグラフ上で探索
- "--enable-wpair" と同時に指定することで,広く用いられている
2-gram を使った1パスでのグラフ生成アルゴリズムとほぼ等価になる.

- バグ修正
- configure スクリプトが Solaris 8/9 で正しく動作しない
- tied-mixture モデルで -gprune none が動かない
- 音響モデルの duration ヘッダのエラーメッセージがおかしい
- MFCC の strip_zero がいつもワーニングを出す

- 実装の改善
- 音響モデルのメモリ管理を hmmdefs ごとに分けて管理するようにした