形態素解析とかよくわかんないけど、偉い人らが作ってるので使ってみたかったの。
WINWINな環境で頑張ってたけど、うまくいかないので投げた。
まずはおとなしくLinuxでやります。
本体
wget http://mecab.googlecode.com/files/mecab-0.991.tar.gz tar xzvf mecab-0.991.tar.gz cd mecab-0.991 ./configure --prefix=/usr/local --with-charset=utf-8 make && make install
辞書
wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz cd mecab-ipadic-2.7.0-20070801 ./configure --prefix=/usr/local --with-charset=utf-8 make && make install
Text::MeCab
PerlでMeCabを使うためのライブラリ。そこらへんよりも速くておいしいとのうわさ。
早速導入しようとするが、libmecab.so.2を参照しようとしてコケる。
ちゃんと/usr/local/libに入るのだけど、パスに入ってないっぽいので一時的に無理やり認識させる
常用するなら、シンボリックリンクをどっかに置くか、--prefix=/usrにしてしまうかしてちゃんとパスを通したほうがよいよい。
LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH cpan -fi Text::MeCab
文字コードだけ指定してあとはEnter連打でOKかも。
Encoding of your mecab dictionary? (shift_jis, euc-jp, utf-8) [euc-jp] utf-8 <= 応答
...テストでずっこけた。
...中略...
- -
t/01-sanity.t (Wstat: 65280 Tests: 1 Failed: 0)
Non-zero exit status: 255
Parse errors: Bad plan. You planned 42 tests but ran 1.
Files=10, Tests=2336, 1 wallclock secs ( 0.26 usr 0.03 sys + 0.50 cusr 0.07 csys = 0.86 CPU)
Result: FAIL
Failed 1/10 test programs. 0/2336 subtests failed.
make: *** [test_dynamic] エラー 255
DMAKI/Text-MeCab-0.20013.tar.gz
/usr/bin/make test -- NOT OK
//hint// to see the cpan-testers results for installing this module, try:
reports DMAKI/Text-MeCab-0.20013.tar.gz
Warning (usually harmless): 'YAML' not installed, will not store persistent state
...中略...
テストには通ってないけど入ってるらしい。
ちょっと戯れる。
LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH perl -MText::MeCab
my $msg = '久々にワロタ こういうスレが沢山立ってたのが昔のVIPなんだよな 今の新参は昔のVIPを知らないから困る'; my $mecab = Text::MeCab->new; for(my $n = $mecab->parse($msg); $n; $n = $n->next){ printf("%s\t%s\t%d\n", $n->surface, $n->feature, $n->cost) }
久々 名詞,一般,*,*,*,*,久々,ヒサビサ,ヒサビサ 5312 に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 5159 ワロタ 名詞,一般,*,*,*,*,* 14144 こういう 連体詞,*,*,*,*,*,こういう,コウイウ,コーユウ 19961 スレ 名詞,一般,*,*,*,*,* 28268 が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 27413 沢山 副詞,一般,*,*,*,*,沢山,タクサン,タクサン 30859 立っ 動詞,自立,*,*,五段・タ行,連用タ接続,立つ,タッ,タッ 36771 て 動詞,非自立,*,*,一段,連用形,てる,テ,テ 44604 た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 42504 の 名詞,非自立,一般,*,*,*,の,ノ,ノ 46017 が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 44708 昔 名詞,副詞可能,*,*,*,*,昔,ムカシ,ムカシ 47504 の 助詞,連体化,*,*,*,*,の,ノ,ノ 48575 VIP 名詞,一般,*,*,*,*,* 59668 な 助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ 63520 ん 名詞,非自立,一般,*,*,*,ん,ン,ン 66770 だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ 67169 よ 助詞,終助詞,*,*,*,*,よ,ヨ,ヨ 66219 な 助詞,終助詞,*,*,*,*,な,ナ,ナ 70564 今 名詞,副詞可能,*,*,*,*,今,イマ,イマ 76585 の 助詞,連体化,*,*,*,*,の,ノ,ノ 77656 新参 名詞,一般,*,*,*,*,新参,シンザン,シンザン 81076 は 助詞,係助詞,*,*,*,*,は,ハ,ワ 81096 昔 名詞,副詞可能,*,*,*,*,昔,ムカシ,ムカシ 84883 の 助詞,連体化,*,*,*,*,の,ノ,ノ 85954 VIP 名詞,一般,*,*,*,*,* 97047 を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 96237 知ら 動詞,自立,*,*,五段・ラ行,未然形,知る,シラ,シラ 101954 ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ 100859 から 助詞,接続助詞,*,*,*,*,から,カラ,カラ 100787 困る 動詞,自立,*,*,五段・ラ行,基本形,困る,コマル,コマル 105552
hmm...