Tue, May 10, 2005
{update:2006-06-15}
Senのインストール(Cygwin)
SenというJavaから使える形態素分析ツールがある。
これを使えば、
日本語をカタカナに変換できる。
インストール(展開するだけ)と辞書の構築
$ unzip sen-1.2.1.zip
$ cd ./sen-1.2.1/dic
$ ant
辞書の構築を {strong:cygwin} 上で行う場合は、明示的にPerlへのパスを指定した上で、antする。
$ ant -Dperl.bin=`cygpath -wp /usr/bin/perl`perlのパスは which perl にて確認のこと。