Apache Nutch調査録

LinuxでNutchのソースを落としてantして、適当にコマンドを打ってみた記録
nutchの動きを設定するnutch-default.xmlを読んだ際の個人的まとめ
crawlした際に作成されるディレクトリをdumpしてどんな情報がいるか確認する
inject、generate、fetchなどの個別の実行コマンドを使ってcrawlを実行する