Download List

Project Description

Julius is an open-source, high-performance large vocabulary continuous speech recognition (LVCSR) engine for speech-related researchs and developments. With HMM acoustic model and language model, you can construct your own speech recognition system.

Moved to github: https://github.com/julius-speech/julius

System Requirements

System requirement is not defined

Released at 2006-07-29 23:30
julius 3.5.2 (3 files Hide)

Release Notes

What's new in Julius-3.5.2 ?
=============================

Julius/Julian rev.3.5.2 is a minor update to improves performance on
Windows, enhancements and fixes for word graph outputs, and other bug
fixes. All users of previous version is encouraged to upgrade to 3.5.2.

Summary of changes in 3.5.2:

o Speed-up and improvement on Windows console.
- DirectSound
- Recent MinGW support
o More accurate word graph output.
- new optimization params: -graphcut, -graphboundloop, -graphsearchdelay
o Add capability to output word graph instead of trellis on 1st pass.
o Bug fixes.
o Imprementation improvements.

Details of the changes are listed in "Release.txt".

Please note that if you want to compile Julius with DirectSound
support, you need DirectX headers installed in your mingw / cygwin
environment. If not exist, configure will choose an old interface.
Please see install instruction on the Web.

Julius-3.5.2
=============

Julius-3.5.2 では,Windowsでの性能改善,問題の修正,単語グラフに
関する修正と拡張が行われました.以前のバージョンをお使いの方は
このバージョンの利用を推奨します.

変更点を以下にまとめます.

- Windows コンソールでの動作の大幅改善
- DirectSound サポート (cygwin / mingw)
- 入力のスレッド化 (portaudio API 使用)
- 最新の MinGW 環境(5.0.2) に対応
- 単語グラフの精度改善
- 調整用オプション: -graphcut, -graphboundloop, -graphsearchdelay
- 第1パスで単語トレリスのかわりに単語グラフを出力可能になった
- バグ修正
- 実装の改善

すべての変更点は Release-ja.txt にまとめられていますので,ご覧下さい.
なお,単語グラフの正確さと精度は改善されましたが,通常の認識精度と速度
は前バージョンと同じです.

Windows で DirectSound を使用した Julius をコンパイルするには,
DirectX のヘッダがインストールされている必要があります.
無い場合, configure スクリプトが自動的に古い(性能の低い)ドライバ
を使用します.インストールの詳細については Web のインストールマニュア
ルをご覧下さい.

Changelog

3.5.2 (2006.07.31)
===================
o Speed-up and improvement on Windows console:
- Support DirectSound for better input handling
- Support input threading utilizing callback API on portaudio.
- Support newest MinGW (tested on 5.0.2)

o More accurate word graph output:
- Add option to cut the resulting graph by its depth
(option -graphcut, and enabled by default!)
- Set limit for post-processing loop to avoid infinite loop
(option -graphboundloop, and set by default)
- Refine graph generation algorithm concerning dynamic word merging
and search termination on the second pass.

o Add capability to output word graph instead of trellis on 1st pass:
- 1st pass generates word graph instead of word trellis as
intermediate result by specifying "--enable-word-graph".
In that case, the 2nd pass will be restricted on the graph, not
on the whole trellis.
- With "--enable-word-graph" and "--enable-wpair" option, the
first pass of Julius can perform 1-pass graph generation based
on 2-gram with basically the same algorithm as other popular
word graph based decoders.

o Bug fixes:
- configure script did not work on Solaris 8/9
- "-gprune none" did not work on tied-mixture AM
- Incorrect error message for AM with duration header other than "NULLD"
- Always warns abount zero frame stripping upon MFCC

o Imprementation improvements:
- bmalloc2-based AM memory management

3.5.2 (2006.07.31)
===================
- Windows コンソールでの動作の大幅改善
- DirectSound サポート (cygwin / mingw)
- 入力のスレッド化 (portaudio API 使用)
- 最新の MinGW 環境(5.0.2) に対応

- 単語グラフの精度改善
- 単語グラフの深さによるカット機能の追加 (-graphcut)
- 後処理の無限ループ回避用の上限設定 (-graphboundloop)
- グラフ単語仮説のマージと探索中断に関するアルゴリズムの改善

- 第1パスで単語トレリスのかわりに単語グラフを出力可能になった
- "--enable-word-graph" で単語グラフを出力,第2パスはグラフ上で探索
- "--enable-wpair" と同時に指定することで,広く用いられている
2-gram を使った1パスでのグラフ生成アルゴリズムとほぼ等価になる.

- バグ修正
- configure スクリプトが Solaris 8/9 で正しく動作しない
- tied-mixture モデルで -gprune none が動かない
- 音響モデルの duration ヘッダのエラーメッセージがおかしい
- MFCC の strip_zero がいつもワーニングを出す

- 実装の改善
- 音響モデルのメモリ管理を hmmdefs ごとに分けて管理するようにした