Julius is an open-source, high-performance large vocabulary continuous speech recognition (LVCSR) engine for speech-related researchs and developments. With HMM acoustic model and language model, you can construct your own speech recognition system.
Moved to github: https://github.com/julius-speech/julius
Version 4.3 includes several new features to support on-line DNN-HMM
decoding: decoding with state output probability vectors ("outprob
vectors") as input, network-based feature / outprob vector input,
improved cepstral variance normalization (CVN) for real-time
recognition, FBANK/MELSPEC feature support and so on. Also the tool
"adintool" is now capable of extracting and sending feature vectors in
real-time via network.
New options:
[-input vecnet] read feature / outprob vectors from network
[-input outprob] read outprob vectors from HTK parameter file
[-outprobout [file]] save computed outprob vectors to HTK file (for debug)
A short test of network-based feature transmission:
[server]
% julius -C file.jconf -input vecnet
[client with microphone]
% adintool -in mic -out vecnet -paramtype MFCC_E_D_N_Z -veclen 25 -C file.jconf
You should set appropriate feature vector's type and length to
adintool with "-paramtype TYPE", "-veclen length". You should also
set feature extraction parameters as the same as Julius. Since
adintool uses JuliusLib for the extraction, it accepts Jconf file and
setting options as same as Julis. So the easier way is to apply the
same Jconf file to adintool with "-C" option as shown above.
See the "Release.txt" file for the full list of updates.
Run with "-help" to see full list of options.
バージョン 4.3 では、DNN-HMM (Deep Neural-Network HMM) を用いたオンライ
ンデコーディングのための機能が追加されました。具体的には、状態出力確率
ベクトル"outprob vector" を入力としたデコーディング、ネットワーク経由の
特徴量ベクトル(および状態出力確率ベクトル)入力のサポート、リアルタイ
ムのための CVN (cepstral variance normalization), フィルタバンクベース
の特徴量(FBANK/MELSPEC)のサポートです。また、ツール adintool に特徴量
を抽出してネットワークへリアルタイム送信する機能が追加されました。
新オプション:
[-input vecnet] ネットワークから特徴量/出力確率ベクトルを読み込む
[-input outprob] HTKパラメータファイルを出力確率ベクトルとして読み込む
[-outprobout [file]] 計算された出力確率行列をHTK形式ファイルに保存(debug)
ネットワークの特徴量ベクトル送受信は、例えば以下のように試すことができます:
[サーバ]
% julius -C file.jconf -input vecnet
[クライアント(マイク付き)]
% adintool -in mic -out vecnet -paramtype MFCC_E_D_N_Z -veclen 25 -C file.jconf
adintool には、特徴量ベクトルのタイプ ("-paramtype TYPE") と総次元数
("-veclen length")を必ず指定する必要があります。また、特徴量抽出条件
は Julius使用時と同様にJuliusと同じオプションを用いて指定します。
adintool は Julius のライブラリを用いており Jconf ファイルを読み込めま
すので、Julius 単体で認識が動作するときの Jconf ファイルをそのまま
adintool に "-C" で与えるのがよいでしょう。(上記の例)
変更点の詳細な一覧は Release-ja.txt をご覧ください.
また "-help" をつけて実行することでオプションの全リストが出力されます。
New features:
- FBANK and MELSPEC support.
- Network-based feature vector and outprob vector input.
- Static mean/variance for cepstral mean/variance normalization.
- State output probability (i.e. outprob) vector input for DNN-HMM decoding.
- State ID "<SID>" extension of hmmdefs for DNN-HMM decoding.
- Real-time feature extraction and network transmittion by 'adintool'.
Modified:
- "mkbinhmm" now keeps the state order and id of the original hmmdefs.
- For portaudio, pause / resume operation synced between engine and audio I/O
- Load / save cepstral mean/variance of CMN/CVN in HTK text format.
New options:
[-input vecnet] read feature / outprob vectors from network
[-input outprob] read outprob vectors from HTK parameter file
[-outprobout [file]] save computed outprob vectors to HTK file (for debug)
○新機能
- フィルタバンク出力(FBANK および MELSPEC)のサポート
- ネットワーク経由の特徴量ベクトル入力および出力確率ベクトル入力
- DNN-HMMデコーディングのための状態出力確率ベクトル(outprob vector)入力
- DNN-HMMデコーディングのためのhmmdefsへの "<SID>" 拡張の導入
- adintool でリアルタイムの特徴量抽出とネットワーク送信が可能に
○変更点
- mkbinhmm が変換元hmmdefsの状態順あるいはID("<SID>")を保持
- Portaudio 使用時エンジンのpause/resumeで音声デバイスも停止・再開する
- CMN/CVN用のケプストラム平均・分散を HTK テキスト形式で保存するように
○新オプション
[-input vecnet] ネットワークから特徴量/出力確率ベクトルを読み込む
[-input outprob] HTKパラメータファイルを出力確率ベクトルとして読み込む
[-outprobout [file]] 計算された出力確率行列をHTK形式ファイルに保存(debug)