2012年10月20日 星期六

Raspberry Piにmecabをインストールしてみた


Raspberry PiにMeCabをインストールしてみた。

参考URL:
http://d.hatena.ne.jp/aircastle/20080925/1222269708 (DebianにMecabを入れてみる.)
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html (MeCab: Yet Another Part-of-Speech and Morphological Analyzer)



まずはファイルをwget:
wget http://mecab.googlecode.com/files/mecab-0.994.tar.gz
wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
wget http://mecab.googlecode.com/files/mecab-python-0.994.tar.gz
解凍:
tar xvfz mecab-0.994.tar.gz
tar xvfz mecab-ipadic-2.7.0-20070801.tar.gz
tar xvfz mecab-python-0.994.tar.gz

mecabをインストール、30分もかかった。
cd mecab-0.994
./configure --enable-utf8-only
make
sudo make install
cd..

次はmecab-ipadic:
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install
cd..

libmecab.so.2 not foundとかのエラーが出た場合:
sudo ldconfig
解けました。
最後にmecab-python
cd mecab-python-0.994
sudo python setup.py install
python.h not foundのエラーが出た場合:
sudo apt-get install python3.2-dev

できあがり。最後にテスト


#!/usr/bin/python
# -*- coding: utf-8 -*-
import MeCab
m = MeCab.Tagger()
print m.parse("おはよう、RaspberryPiがやっときました。")

結果

python test.py
おはよう 感動詞,*,*,*,*,*,おはよう,オハヨウ,オハヨー
記号,読点,*,*,*,*,、,、,、
RaspberryPi 名詞,固有名詞,組織,*,*,*,*
助詞,格助詞,一般,*,*,*,が,ガ,ガ
やっ 動詞,自立,*,*,五段・ラ行,連用タ接続,やる,ヤッ,ヤッ
とき 動詞,非自立,*,*,五段・カ行イ音便,連用形,とく,トキ,トキ
まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
記号,句点,*,*,*,*,。,。,。
EOS


お疲れ様でした。次はJuliusのインストール。