heshao2005 发表于 2018-6-21 10:09:00

CentOS 6.5+Nutch 1.7+Solr 4.7+IK 2012-VV的笔记本

# tree crawl/  
crawl/
  
├── crawldb
  
│   ├── current
  
│   │   └── part-00000
  
│   │       ├── data
  
│   │       └── index
  
│   └── old
  
│       └── part-00000
  
│         ├── data
  
│         └── index
  
├── linkdb
  
│   └── current
  
│       └── part-00000
  
│         ├── data
  
│         └── index
  
└── segments
  
    ├── 20150326234924
  
    │   ├── content
  
    │   │   └── part-00000
  
    │   │      ├── data
  
    │   │      └── index
  
    │   ├── crawl_fetch
  
    │   │   └── part-00000
  
    │   │      ├── data
  
    │   │      └── index
  
    │   ├── crawl_generate
  
    │   │   └── part-00000
  
    │   ├── crawl_parse
  
    │   │   └── part-00000
  
    │   ├── parse_data
  
    │   │   └── part-00000
  
    │   │      ├── data
  
    │   │      └── index
  
    │   └── parse_text
  
    │      └── part-00000
  
    │          ├── data
  
    │          └── index
  
    └── 20150326234933
  
      ├── content
  
      │   └── part-00000
  
      │      ├── data
  
      │      └── index
  
      ├── crawl_fetch
  
      │   └── part-00000
  
      │      ├── data
  
      │      └── index
  
      ├── crawl_generate
  
      │   └── part-00000
  
      ├── crawl_parse
  
      │   └── part-00000
  
      ├── parse_data
  
      │   └── part-00000
  
      │      ├── data
  
      │      └── index
  
      └── parse_text
  
            └── part-00000
  
                ├── data
  
                └── index
页: [1]
查看完整版本: CentOS 6.5+Nutch 1.7+Solr 4.7+IK 2012-VV的笔记本