一、Hadoop入门,了解什么是hadoop | 1、 Hadoop产生背景
2、 Hadoop在大数据、云计算中的位置和关系
3、 国内外Hadoop应用案例介绍
4、 国内Hadoop的就业情况分析及课程大纲介绍
5、 Hadoop生态圈以及各组成部分的简介
6、 Hadoop核心MapReduce例子说明 Hadoop核心MapReduce例子说明 |
二、分布式文件系统HDFS,是数据库管理员的基础课程 | 1、 分布式文件系统DFS简介
2、 HDFS的系统组成介绍
3、 HDFS的组成部分详解
4、 副本存放策略及路由规则
5、 命令行接口
6、 Java接口
7、 客户端与HDFS的数据流讲解
8、 HDFS的可用性(HA) |
三、初级MapReduce,成为Hadoop开发人员的基础课程 | 1、 如何理解map、reduce计算模型
2、 剖析伪分布式下MapReduce作业的执行过程
3、 序列化
4、 MapReduce的类型与格式
5、 MapReduce开发环境搭建
6、 MapReduce应用开发
7、 更多示例讲解,熟悉MapReduce算法原理 |
四、高级MapReduce,高级Hadoop开发人员的关键课程 | 1、 使用压缩分隔减少输入规模
2、 利用Combiner减少中间数据
3、 编写Partitioner优化负载均衡
4、 MapReduce优化
5、 编程实战 |
五、Hadoop集群与管理,是数据库管理员的高级课程 | 1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序 |
六、HBase基础知识,面向列的实时分布式数据库 | 1、 HBase定义
2、 HBase与RDBMS的对比
3、 数据模型
4、 系统架构
5、 HBase上的MapReduce
6、 表的设计 |
七、HBase集群及其管理 | 1、 集群的搭建过程讲解
2、 集群的监控
3、 集群的管理 |
八、HBase客户端 | 1、 HBase Shell以及演示
2、 Java客户端以及代码演示 |
九、Hive | 1、 数据仓库基础知识
2、 Hive定义
3、 Hive体系结构简介
4、 Hive集群
5、 客户端简介 |
十、HiveQL | 1、 HiveQL定义
2、 HiveQL与SQL的比较
3、 数据类型
4、 表与表分区概念
5、 表的操作与CLI客户端演示
6、 数据导入与CLI客户端演示
7、 查询数据与CLI客户端演示
8、 数据的连接与CLI客户端演示
9、 用户自定义函数(UDF)的开发与演示 |
来源 :