2012年10月21日 星期日

Raspberry PiにJuliusをインストールしてみた

Juliusをインストールしてみた、Juliusは?
Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです. 数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行できます. また,高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの音声認識の各モジュールを組み替えることで,様々な幅広い用途に応用できます. Julius はオープンソースソフトウェアで,ソースコードを含めてどなたでもフリーで入手することができます.
Raspberry PiのOSイメージはDebianに基づいてい発展したから、Debianでインストールできるなら、Raspberry Piにもインストールできると思ったので、チャレンジしてみた。


まずはjulius-4.2.2.tar.gzを公式サイトからダウンロード、解凍。
tar zxvf julius-4.2.2.tar.gz
cd julius-4.2.2
./configure
make
sudo make install
cd ..

問題がありません、順調にコンパイル完了、OSX上でJuliusのコンパイルと比べて楽です。次はディクテーションキット、サイトでLinux版 Juliusディクテーション実行キット v4.1 をダウンロード、解凍。

tar zxvf dictation-kit-v4.1.tar.gz
cd dictation-kit-v4.1

Raspberry Piでマイクを使うのは、ちょっとメンドウみたいので、.WAVファイル入力という方法を使う。まえ開発したアプリの音声ファイルを使ってみた。


fast.jconfをエディタで開いて

-input mic 

#-input mic

に変更
#-input rawfile 

-input rawfile

に変更してセーブ。前開発したアプリで使った音声ファイルを試してみた。.WAVファイルのフォーマットはRAW,16bit Rate,MONOです、そうしないとエラーが出てきた。
$ julius -C fast.jconf -charconv EUC-JP UTF-8
(略)
enter filename->voice004.wav
Stat: adin_file: input speechfile: voice004.wav
Warning: strip: sample 26199-26218 has zero value, stripped
STAT: 26208 samples (1.64 sec.)
STAT: ### speech analysis (waveform -> MFCC)
pass1_best:  後で の か も 三
sentence1:  あと で の ファン も 担当 。

(正解は「ほとけのかおもさんど」ですけど。)

でもファイルで転送という方法もちょっと不便と思います。ネットワーク・ソケット経由の入力の形はいいかもしれません。

今日はここで。