agangliu0400 发表于 2018-10-30 12:27:45

Hadoop源码解读之(一)>>>>>>>>>>NameNode

  Hadoop源码解读之(一)>>>>>>>>>>NameNode
  正如大多数源码解读,第一篇为NameNode的解析。
  首先将NameNode注释翻译一下,大概意思如下:
  1.NameNode 服务器有两个作用:
  a.目录名称空间的管理者
  b.维护 hadoop 分布式系统的“inode table”
  2.NameNode维护着两个关键的对应关系
  a.文件名和block 块
  b.block 块和其对应的存储机器
  其中:第一个对应关系存储在磁盘中,第二个对应关系在每次NameNode启动的时候被加载到内存中。
  3.NameNode主要的工作是向外界暴露IPC接口、HTTP服务和一些参数管理
  4.NameNode实现了3个接口:
  a.ClientProtocol:允许Client请求服务,但是ClientProtocol不是被用来让最终用户使用的,最终用户使用FileSystem来对HDFS进行操作。
  b.DatanodeProtocol:DataNode使用该接口来存储block块,这些方法被DataNode调用。
  c.NamenodeProtocol:该接口被secondary namenode或者balance进程调用去获取局部的NameNode信息,如局部的blockMap等。
  ----解释完注释,来看一下代码内容----
  首先找见NameNode的构造函数
    public NameNode(Configuration conf) throws IOException {  
    this(conf, NamenodeRole.NAMENODE);
  
}
  
    protected NameNode(Configuration conf, NamenodeRole role)
  
      throws IOException
  可以看出最终NameNode实例化走的都是后者。
  下面进入main方法:
  找见最重要的一句话
NameNode namenode = createNameNode(argv, null);  

  
    点进去,然后是switch代码块,这里就是我们在命令行里面敲hdfs dfs -X的解析部分。


页: [1]
查看完整版本: Hadoop源码解读之(一)>>>>>>>>>>NameNode