zhouyi 发表于 2018-10-28 12:40:54

hadoop学习笔记1---Hadoop体系介绍

  1、Namenode
  HDFS的守护进程
  记录文件时如何分割成数据块的,以及这些数据块被存储到哪些节点上
  对内存和I/O进行集中管理
  是个单点,发生故障将使集群崩溃
  2、Secondary Namenode
  监控HDFS状态的辅助后台程序
  每个集群都有一个
  与NameNode进行通讯定期保存HDFS元数据快照
  当NameNode故障可以作为备用NameNode使用
  3、DataNode
  每台从服务器都运行一个
  负责把HDFS数据块读写到本地文件系统
  4、JobTracker
  用于处理作业(用户提交代码)的后台程序
  决定有哪些文件参与处理,然后切割task并分配节点
  监控task,重启失败的task(于不同的几点)
  每个集群只有唯一一个JobTracker,位于Master节点
  5、TaskTracker
  位于slave节点上,与datanode结合(代码与数据一起的原则)
  管理各自节点上的task(由jobtracker分配)
  每个节点只有一个tasktracker,但一个tasktracker可以启动多个JVM,用于并行执行map或reduce任务
  与jobtracker交互
  1.6、Master和Slave
  Master:Namenode、Secondary Namenode、jobtracker。浏览器(用于观看管理界面),其它Hadoop工具
  Slave:Tasktracker、Datenode
  Master不是唯一的

页: [1]
查看完整版本: hadoop学习笔记1---Hadoop体系介绍