Mahoutを導入してみる
Eclipse上で動かしたり、インストールしてレコメンドコマンドを叩いてみたり
k-meansしてみる
単純なデータでK-Meansを実行してみた
Canopy → k-meansしてみる
Canopyの結果を初期値としてK-Meansを実行してみた
seqdirectoryとseq2sparseを使って文書クラスタリング
コマンドを叩いて青空文庫の小説のいくつかをクラスタリングしてみる
Naive Bayesで文書を分類する
Naive Bayesを使ってWikipediaの記事をカテゴリ分けしてみる
seqdumperを使ってみる
シーケンスファイルの内容を表示するコマンド、seqdumperの使い方
IDMigratorを使ってみる
文字列とlongのIDの変換を行う緩い機能、IDMigratorについて
NGramsクラスを使ってみる
Mahout備え付けのNGramsクラスを使ってみたけど日本語向けじゃなかった
lucene.vectorを使ってみる
LuceneのインデックスからVectorを作るlucene.vectorを叩いてみる