| ページ一覧 | ブログ | twitter |  書式 | 書式(表) |

MyMemoWiki

「Python MeCab(日本語形態素解析)」の版間の差分

提供: MyMemoWiki
ナビゲーションに移動 検索に移動
 
(同じ利用者による、間の3版が非表示)
1行目: 1行目:
 +
| [[Python]] | [[自然言語処理]] |
 +
 
==Python MeCab(日本語形態素解析)==
 
==Python MeCab(日本語形態素解析)==
[[Python][自然言語処理]]
 
  
 
{{amazon|4873114705}}
 
{{amazon|4873114705}}
8行目: 9行目:
 
===インストール===
 
===インストール===
 
*http://d.hatena.ne.jp/atree/20090512/1242122536
 
*http://d.hatena.ne.jp/atree/20090512/1242122536
====janome(辞書内包/Pure Python実装の形態素解析器)====
+
====janome(辞書内包/Pure [[Python]]実装の形態素解析器)====
 
*http://mocobeta-backup.tumblr.com/post/115843098157/pure-python-janome
 
*http://mocobeta-backup.tumblr.com/post/115843098157/pure-python-janome
 
*http://mocobeta.github.io/janome/
 
*http://mocobeta.github.io/janome/
31行目: 32行目:
 
  # make install  
 
  # make install  
  
====Pythonバインディングのインストール====
+
====[[Python]]バインディングのインストール====
 
  # wget http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
 
  # wget http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
 
  # tar -xvf mecab-python-0.996.tar.gz
 
  # tar -xvf mecab-python-0.996.tar.gz
 
  # cd mecab-python-0.996
 
  # cd mecab-python-0.996
 
  # python2.7 setup.py install
 
  # python2.7 setup.py install
*python2.7 としているのは、[CentOS6にPython2.7をインストール] [Python2.7をインストールしている]ため
+
*python2.7 としているのは、[[CentOS6にPython2.7をインストール|Python2.7をインストールしている]]ため
  
 
====ImportError: libmecab.so.2====
 
====ImportError: libmecab.so.2====
51行目: 52行目:
 
=====ライブラリを読み込ませるように設定=====
 
=====ライブラリを読み込ませるように設定=====
 
  # cd /etc/ld.so.conf.d
 
  # cd /etc/ld.so.conf.d
  # vi mecab.conf
+
  # [[vi]] mecab.conf
 
*以下の内容をmecab.confに記述
 
*以下の内容をmecab.confに記述
 
  /usr/local/lib
 
  /usr/local/lib

2020年9月20日 (日) 13:31時点における最新版

| Python | 自然言語処理 |

Python MeCab(日本語形態素解析)

インストール

janome(辞書内包/Pure Python実装の形態素解析器)

MeCab

# wget http://mecab.googlecode.com/files/mecab-0.996.tar.gz
# tar -xvf http://mecab.googlecode.com/files/mecab-0.996.tar.gz
# cd mecab-0.996.
# ./configure --with-charset=utf8
# make
# make install

<blockquote>./configure で、Your compiler is not powerful enough to compile MeCab エラーとなったら、gcc-c++をインストール</blockquote>

# yum install gcc-c++

辞書のインストール

# wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
# tar -xvf http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
# cd mecab-ipadic-2.7.0-20070801
# ./configure --with-charset=utf8
# make
# make install 

Pythonバインディングのインストール

# wget http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
# tar -xvf mecab-python-0.996.tar.gz
# cd mecab-python-0.996
# python2.7 setup.py install

ImportError: libmecab.so.2

以下のエラーがでる場合
# python2.7
>>> import MeCab
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "MeCab.py", line 26, in <module>
    _MeCab = swig_import_helper()
  File "MeCab.py", line 18, in swig_import_helper
    import _MeCab
ImportError: libmecab.so.2: cannot open shared object file: No such file or  directory
ライブラリを読み込ませるように設定
# cd /etc/ld.so.conf.d
# vi mecab.conf
  • 以下の内容をmecab.confに記述
/usr/local/lib
  • 読み込み
# ldconfig

実行してみる

# python2.7
>>> import MeCab
>>> mecab = MeCab.Tagger('-Ochasen')
>>> print mecab.parse('泣き叫ぶ鬼の串刺し。何かに憑かれた餓鬼の群れ')
泣き叫ぶ	ナキサケブ	泣き叫ぶ	動詞-自立	五段・バ行	基本形
鬼	オニ	鬼	名詞-一般		
の	ノ	の	助詞-連体化		
串刺し	クシザシ	串刺し	名詞-一般		
。	。	。	記号-句点		
何	ナニ	何	名詞-代名詞-一般		
か	カ	か	助詞-副助詞/並立助詞/終助詞		
に	ニ	に	助詞-格助詞-一般		 
憑かれ	ツカレ	憑かれる	動詞-自立	一段	連用形
た	タ	た	助動詞	特殊・タ	基本形
餓鬼	ガキ	餓鬼	名詞-一般		
の	ノ	の	助詞-連体化		
群れ	ムレ	群れ	名詞-一般		
EOS