INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

CentOS6.3(64bit)にMeCabとRMeCabをインストールする

http://atnd.org/events/45043R Advent Calendar 2013 : ATND

Force.com と R 言語でビッグデータ統計分析 – Salesforce.com のお客様の声をデータマイニング - - hiratake55の日記

Twitterと形態素解析 - 巨人の肩に乗ってニヤニヤするブログ

を見て形態素解析してみたくなったのでMeCabとRMeCabをインストールする。


1. MeCabインストール

CentOSにyumでmecabをインストールする | clicktx::Tech::Memo

を参考にyumMeCabをインストールする。 mecab-develをインストールしておかないとRMeCabのインストールで失敗する。

$ wget http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
$ sudo rpm -ivh groonga-release-1.1.0-1.noarch.rpm 
$ sudo yum install mecab mecab-ipadic mecab-devel


早速試してみる

$ mecab
すもももももももものうち
すもも   名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
^C


2. RMeCabインストール

RMeCab - RとLinuxと...

に記載されている通りRを起動して以下のコマンドを実行する。

> install.packages("RMeCab", repos = "http://web.ias.tokushima-u.ac.jp/linguistik/R")


Rでも試してみる

> library(RMeCab)
> RMeCabC('すもももももももものうち')
[[1]]
    名詞 
"すもも" 

[[2]]
助詞 
"も" 

[[3]]
  名詞 
"もも" 

[[4]]
助詞 
"も" 

[[5]]
  名詞 
"もも" 

[[6]]
助詞 
"の" 

[[7]]
  名詞 
"うち" 



次はShinyで@SBCareへのTweet形態素解析してみる