小风儿 发表于 2018-10-29 07:20:31

HADOOP生态圈以及各组成部分的简介

http://img.blog.csdn.net/20170726171553543?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvTGVhcm5ib0M=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
  重点组件:
  HDFS:分布式文件系统
  MAPREDUCE:分布式运算程序开发框架
  Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具
  Hbase:基于Hadoop的分布式海量数据库
  ZOOKEEPER:分布式协调服务基础组件
  Mahout:基于mapreduce/Spark/flink等分布式运算框架的机器学习算法库
  Oozie:工作流调度框架
  Sqoop:数据导入导出工具
  Flume:日志数据采集框架

页: [1]
查看完整版本: HADOOP生态圈以及各组成部分的简介