Hadoop 相关节点说明 - Hadoop - 运维网 - Powered by Discuz! Archiver

论坛 › Hadoop › Hadoop 相关节点说明

颇为阿娇978 发表于 2016-12-6 10:21:28

Hadoop 相关节点说明

　　Hadoop框架中最核心的设计就是：MapReduce和HDFS。
　　MapReduce的思想是由Google的一篇论文所提及而被广为流传的，简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。
　　HDFS是Hadoop分布式文件系统（Hadoop Distributed File System）的缩写，为分布式计算存储提供了底层支持。
　　NameNode:负责记录文件是如何分割数据块，以及这些分别被存储的。
　　DataNode:负责把HDFS数据块读写到本地文件系统中。
　　SecondaryNode:次要的nameNode,它与nameNode通信，保存最新的nameNode快照。
　　当nameNode宕机能及时当作备用nameNode使用。
　　Jobtracker:主要负责任务的接受，初始化，调度以及对TaskTracker的监控。
　　TaskTracker:具体的任务内容。
　　HDFS －写文件:
　　client - nameNode(写请求),nameNode根据文件大小分割数据块.
　　nameNode - client(响应请求),响应nameNode的数据块信息.
　　client - dataNode(存取数据块,并且进行备份).
　　HDFS - 读文件:
　　client - nameNode(读请求).
　　nameNode - client(响应请求),返回nameNode数据块的信息.
　　client - dataNode(读数据块)
　　HDFS设计特点:
　　1.块存放:默认分三块保存。
　　2.心跳监控dataNode状态,如发现问题及时备份，保证数据安全.
　　3.数据复制dataNode失败，需要平衡节点的利用率。采用threshold配置.
　　4.数据交验采用crc32.
　　5.nameNode单点失败任务处理信息保存在本地系统文件.

页: [1]

查看完整版本: Hadoop 相关节点说明