qqruser 发表于 2016-12-6 08:00:15

Hadoop中几个重要的进程

  通过jps可以查看相应的进程列表,主要进程如下:

org.apache.hadoop.hdfs.server.namenode.NameNode;
org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode;
org.apache.hadoop.hdfs.server.datanode.DataNode;
org.apache.hadoop.mapred.JobTracker;
org.apache.hadoop.mapred.TaskTracker;
  NameNode:
  Hadoop中神经中枢,Hadoop是单节点的(虽然有SecondaryNameNode),NameNode里存储的是元数据,那些数据文件在那些DataNode里存储。DataNode发生变化的时候会向他汇报自己的数据状态信息
  SecondaryNameNode:
  只跟NameNode进行通信,随时待命(需要手动才能将他变为NameNode),也就是NameNode的一个备份。
  DataNode:
  具体的数据节点。
  JobTracker:
  Job的调度,任务的分配。
  TaskTracker:
  执行具体的Job,与JobTracker进行通信,当JobTracker感觉不到他的存在的时候就会重启一个任务到其他的节点中去,
页: [1]
查看完整版本: Hadoop中几个重要的进程