| ページ一覧 | ブログ | twitter |  書式 | 書式(表) |

MyMemoWiki

差分

ナビゲーションに移動 検索に移動
編集の要約なし
| [[Python]] | [[自然言語処理]] |
 
==Python MeCab(日本語形態素解析)==
[Python][自然言語処理]
{{amazon|4873114705}}
===インストール===
*http://d.hatena.ne.jp/atree/20090512/1242122536
====janome(辞書内包/Pure Python実装の形態素解析器[[Python]]実装の形態素解析器)====
*http://mocobeta-backup.tumblr.com/post/115843098157/pure-python-janome
*http://mocobeta.github.io/janome/
# make install
<&lt;blockquote>&gt;./configure で、Your compiler is not powerful enough to compile MeCab エラーとなったら、gcc-c++をインストール<&lt;/blockquote>&gt;
# yum install gcc-c++
====辞書のインストール====
# make install
====Pythonバインディングのインストール[[Python]]バインディングのインストール====
# wget http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
# tar -xvf mecab-python-0.996.tar.gz
# cd mecab-python-0.996
# python2.7 setup.py install
*python2.7 としているのは、[[CentOS6にPython2.7をインストール] [|Python2.7をインストールしている]]ため
====ImportError: libmecab.so.2====
=====以下のエラーがでる場合=====
# python2.7
>>> &gt;&gt;&gt; import MeCab
Traceback (most recent call last):
File "<&lt;stdin>&gt;", line 1, in <&lt;module>&gt; File "MeCab.py", line 26, in <&lt;module>&gt;
_MeCab = swig_import_helper()
File "MeCab.py", line 18, in swig_import_helper
=====ライブラリを読み込ませるように設定=====
# cd /etc/ld.so.conf.d
# [[vi ]] mecab.conf
*以下の内容をmecab.confに記述
/usr/local/lib
===実行してみる===
# python2.7
>>> &gt;&gt;&gt; import MeCab >>> &gt;&gt;&gt; mecab = MeCab.Tagger('-Ochasen') >>> &gt;&gt;&gt; print mecab.parse('泣き叫ぶ鬼の串刺し。何かに憑かれた餓鬼の群れ')
泣き叫ぶ ナキサケブ 泣き叫ぶ 動詞-自立 五段・バ行 基本形
鬼 オニ 鬼 名詞-一般

案内メニュー