MeCab 0.991

形態素解析とかよくわかんないけど、偉い人らが作ってるので使ってみたかったの。


WINWINな環境で頑張ってたけど、うまくいかないので投げた。
まずはおとなしくLinuxでやります。

本体

wget http://mecab.googlecode.com/files/mecab-0.991.tar.gz
tar xzvf mecab-0.991.tar.gz
cd mecab-0.991
./configure --prefix=/usr/local --with-charset=utf-8
make && make install

辞書

wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --prefix=/usr/local --with-charset=utf-8
make && make install

Text::MeCab

PerlMeCabを使うためのライブラリ。そこらへんよりも速くておいしいとのうわさ。

早速導入しようとするが、libmecab.so.2を参照しようとしてコケる。
ちゃんと/usr/local/libに入るのだけど、パスに入ってないっぽいので一時的に無理やり認識させる
常用するなら、シンボリックリンクをどっかに置くか、--prefix=/usrにしてしまうかしてちゃんとパスを通したほうがよいよい。

LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH cpan -fi Text::MeCab


文字コードだけ指定してあとはEnter連打でOKかも。

Encoding of your mecab dictionary? (shift_jis, euc-jp, utf-8) [euc-jp] utf-8 <= 応答

...テストでずっこけた。

...中略...

                                    • -

t/01-sanity.t (Wstat: 65280 Tests: 1 Failed: 0)
Non-zero exit status: 255
Parse errors: Bad plan. You planned 42 tests but ran 1.
Files=10, Tests=2336, 1 wallclock secs ( 0.26 usr 0.03 sys + 0.50 cusr 0.07 csys = 0.86 CPU)
Result: FAIL
Failed 1/10 test programs. 0/2336 subtests failed.
make: *** [test_dynamic] エラー 255
DMAKI/Text-MeCab-0.20013.tar.gz
/usr/bin/make test -- NOT OK
//hint// to see the cpan-testers results for installing this module, try:
reports DMAKI/Text-MeCab-0.20013.tar.gz
Warning (usually harmless): 'YAML' not installed, will not store persistent state
...中略...

テストには通ってないけど入ってるらしい。
ちょっと戯れる。

LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH perl -MText::MeCab
my $msg = '久々にワロタ こういうスレが沢山立ってたのが昔のVIPなんだよな 今の新参は昔のVIPを知らないから困る';
my $mecab = Text::MeCab->new;
for(my $n = $mecab->parse($msg); $n; $n = $n->next){
	printf("%s\t%s\t%d\n", $n->surface, $n->feature, $n->cost)
}
久々    名詞,一般,*,*,*,*,久々,ヒサビサ,ヒサビサ        5312
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ 5159
ワロタ     名詞,一般,*,*,*,*,*     14144
こういう        連体詞,*,*,*,*,*,こういう,コウイウ,コーユウ     19961
スレ      名詞,一般,*,*,*,*,*     28268
が      助詞,格助詞,一般,*,*,*,が,ガ,ガ 27413
沢山    副詞,一般,*,*,*,*,沢山,タクサン,タクサン        30859
立っ    動詞,自立,*,*,五段・タ行,連用タ接続,立つ,タッ,タッ      36771
て      動詞,非自立,*,*,一段,連用形,てる,テ,テ  44604
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ   42504
の      名詞,非自立,一般,*,*,*,の,ノ,ノ 46017
が      助詞,格助詞,一般,*,*,*,が,ガ,ガ 44708
昔      名詞,副詞可能,*,*,*,*,昔,ムカシ,ムカシ  47504
の      助詞,連体化,*,*,*,*,の,ノ,ノ    48575
VIP     名詞,一般,*,*,*,*,*     59668
な      助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ 63520
ん      名詞,非自立,一般,*,*,*,ん,ン,ン 66770
だ      助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ   67169
よ      助詞,終助詞,*,*,*,*,よ,ヨ,ヨ    66219
な      助詞,終助詞,*,*,*,*,な,ナ,ナ    70564
今      名詞,副詞可能,*,*,*,*,今,イマ,イマ      76585
の      助詞,連体化,*,*,*,*,の,ノ,ノ    77656
新参    名詞,一般,*,*,*,*,新参,シンザン,シンザン        81076
は      助詞,係助詞,*,*,*,*,は,ハ,ワ    81096
昔      名詞,副詞可能,*,*,*,*,昔,ムカシ,ムカシ  84883
の      助詞,連体化,*,*,*,*,の,ノ,ノ    85954
VIP     名詞,一般,*,*,*,*,*     97047
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 96237
知ら    動詞,自立,*,*,五段・ラ行,未然形,知る,シラ,シラ  101954
ない    助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ   100859
から    助詞,接続助詞,*,*,*,*,から,カラ,カラ    100787
困る    動詞,自立,*,*,五段・ラ行,基本形,困る,コマル,コマル      105552


hmm...