CentOS 6.5+Nutch 1.7+Solr 4.7+IK 2012-VV的笔记本
# tree crawl/crawl/
├── crawldb
│ ├── current
│ │ └── part-00000
│ │ ├── data
│ │ └── index
│ └── old
│ └── part-00000
│ ├── data
│ └── index
├── linkdb
│ └── current
│ └── part-00000
│ ├── data
│ └── index
└── segments
├── 20150326234924
│ ├── content
│ │ └── part-00000
│ │ ├── data
│ │ └── index
│ ├── crawl_fetch
│ │ └── part-00000
│ │ ├── data
│ │ └── index
│ ├── crawl_generate
│ │ └── part-00000
│ ├── crawl_parse
│ │ └── part-00000
│ ├── parse_data
│ │ └── part-00000
│ │ ├── data
│ │ └── index
│ └── parse_text
│ └── part-00000
│ ├── data
│ └── index
└── 20150326234933
├── content
│ └── part-00000
│ ├── data
│ └── index
├── crawl_fetch
│ └── part-00000
│ ├── data
│ └── index
├── crawl_generate
│ └── part-00000
├── crawl_parse
│ └── part-00000
├── parse_data
│ └── part-00000
│ ├── data
│ └── index
└── parse_text
└── part-00000
├── data
└── index
页:
[1]