Apache Nutch調査録
- 導入と基本的な使い方(2010/12/11)
- LinuxでNutchのソースを落としてantして、適当にコマンドを打ってみた記録
- nutch-default.xmlの設定(2010/12/11)
- nutchの動きを設定するnutch-default.xmlを読んだ際の個人的まとめ
- crawlしてできるディレクトリの詳細(2010/12/12)
- crawlした際に作成されるディレクトリをdumpしてどんな情報がいるか確認する
- クロールを順を追って実行する(2010/12/12)
- inject、generate、fetchなどの個別の実行コマンドを使ってcrawlを実行する