Julius is an open-source, high-performance large vocabulary continuous speech recognition (LVCSR) engine for speech-related researchs and developments. With HMM acoustic model and language model, you can construct your own speech recognition system.
Moved to github: https://github.com/julius-speech/julius
NEW FEATURES:
- class N-gram support
- confidence measuring support
- grammar based recognition integrated (aka Julian)
- become much stable
- LICENSE fixed to ensure free usage with no restriction
ABOUT JULIAN MODE:
The CSRC version (non-free) has become free from this
version, so all the functions in CSRC versoin including
grammar based recognition (Julian) are fully incorporated
to this single free package. Just take this for free!
Julius-3.4は、従来の性能を保ちながら、
以下のような新たな特徴を持ちます:
- クラスN-gramに対応
- 信頼度計算のサポート
- Julian(文法ベースの認識)の統合
- 長時間動作の安定化
- ライセンスの使用制限条項の撤廃
本バージョンより、CSRC版Juliusとフリー版Juliusは
統合され、単一のフリーソフトウェアとして配布されます。
すなわち、従来のCSRC版のみに含まれていた「ネットワーク文法
に基づく認識(Julian)」の機能もフリー版に組み込まれて
フリーとなりました。
3.4 (2003.10.01)
===================
- Confidence measure support
- New parameter "-cmalpha" as smoothing coef.
- New command "-outcode C" to output CM in module output
- Can be disabled by configure option "--disbale-cm"
- Can use an alternate CM algorithm by configure option "--enable-cm-nbest"
- Class N-gram support
- Can be disabled by configure option "--disable-class-ngram"
- Factoring basis changed from N-gram entry to dictionary word
- WAV format recording in "adinrec", "adintool" and "-record" option
- Modified output message
startup messages,
engine configuration message in --version and --help,
- Fixes:
some outputs in module mode,
bug in only several frame input (realtime-1stpass.c),
long silence at end of segmented speech
miscompilation with NetAudio,
word size check in binary N-gram,
bug in acoustic computation (gprune_none.c).
"-version" -> "-setting", "-hipass" -> "-hifreq", "-lopass" -> "-lofreq"
3.4 (2003.10.01)
===================
- 確信度計算のサポート
- "-cmalpha" オプションでスムージング係数を指定
- モジュールモードでの確信度出力は "-outcode" で 'C' を指定
- configure時 "--disable-cm"で無効化
- "--enable-cm-nbest"でN-bestを用いた計算方法に変更可能
- クラスN-gramのサポート
- configure時 "--disable-class-ngram"で無効化
- factoringノード決定をN-gram単語ベースから辞書単語ベースに変更
- adinrec, adintoolおよびオプション"-record"での音声記録形式を
RAW形式からWAV形式に変更
- 出力メッセージの変更:
System Info のメッセージ構成
エンジン設定のメッセージ
- 修正:
モジュールモードの出力のバグをいくつか修正
数フレーム入力されたときに落ちるバグを修正 (realtime-1stpass.c)
検出された音声区間の末尾の無音が長い不具合を修正
NetAudio使用時にコンパイルに失敗するバグを修正
バイナリN-gram作成時のワードサイズをチェックするよう修正
mixture欠け時の音響尤度計算の誤りを修正 (gprune_none.c)
"-version"->"-setting", "-hipass"->"-hifreq", "-lopass"->"-lofreq"