2007年6月12日火曜日

mecabの辞書をeuc-jpからutf-8に

ubuntuのリポジトリに入っているmecabパッケージに含まれる辞書はeuc-jp。だからmecabに引き渡すときはnkfとかで文字コード変えて渡していたんだけど、別にそれでも問題ないしいいか〜mecab自分でmakeめんどくさいし〜とか放置してたら、PoTさんの所で辞書変換の仕方が書いてあったので実行。
sudo /usr/lib/mecab/mecab-dict-index -d /usr/share/mecab/dic/ipadic -o /var/lib/mecab/dic/ipadic -f euc-jp -t utf-8 -p
あっさりと変換終了。拍子抜け^^;

0 件のコメント: