CentOS6.3(64bit)にMeCabとRMeCabをインストールする
http://atnd.org/events/45043R Advent Calendar 2013 : ATND
の
Force.com と R 言語でビッグデータ統計分析 – Salesforce.com のお客様の声をデータマイニング - - hiratake55の日記
Twitterと形態素解析 - 巨人の肩に乗ってニヤニヤするブログ
を見て形態素解析してみたくなったのでMeCabとRMeCabをインストールする。
1. MeCabインストール
CentOSにyumでmecabをインストールする | clicktx::Tech::Memo
を参考にyumでMeCabをインストールする。 mecab-develをインストールしておかないとRMeCabのインストールで失敗する。
$ wget http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm $ sudo rpm -ivh groonga-release-1.1.0-1.noarch.rpm $ sudo yum install mecab mecab-ipadic mecab-devel
早速試してみる
$ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS ^C
2. RMeCabインストール
に記載されている通りRを起動して以下のコマンドを実行する。
> install.packages("RMeCab", repos = "http://web.ias.tokushima-u.ac.jp/linguistik/R")
Rでも試してみる
> library(RMeCab) > RMeCabC('すもももももももものうち') [[1]] 名詞 "すもも" [[2]] 助詞 "も" [[3]] 名詞 "もも" [[4]] 助詞 "も" [[5]] 名詞 "もも" [[6]] 助詞 "の" [[7]] 名詞 "うち"