ミムの部屋

社内SEが,興味をもったことを書いていきます.

MalletをEclipse使うためのjarファイルの作成方法

今回は,機械学習ライブラリMalletをEclipseで使うために,Malletのjarファイルを作成する方法を書きます. 文章でダラダラ書いてもしょうがないので,プロセスを書きたいと思います.

1. Malletから「mallet-?.?.?.zip」をダウンロードする
2. 解凍したフォルダ「mallet-?.?.?」に移動
3.1. Apache antがインストールしてあるのであれば,「ant」とコマンドを打つ
3.2. Apache antがインストールしてないのであれば,antインストールを参照してください.
4. 「ant jar」とコマンドを打つ
5. フォルダ内にある「dist」に移動
6. 「mallet-deps.jar」と「mallet.jar」が作成されている

これら二つのファイルをeclipseで「外部jarファイルの追加」でパスを通すことによって,使用可能になる.
本家のサイトでのサンプルコードは,以下にリンクを貼っときます.

このソースコードは英語に対して行うもののようです.入力するファイルは単語を空白区切りにしたものであると考えられます.そのため,mecabなどの形態素解析などを行って,形態素を空白区切りしたファイルを入力するとうまくいきました.

ちなみに,それを行った結果がこれになります.一応,それらしくなっているかなって感じです.