civilvar 发表于 2016-12-8 08:10:59

hadoop namenode format做了什么?

  一看到format就和磁盘格式化联想到一起,然后这个format是对hdfs来说的,所以有些人害怕真的是格式化自己的文件系统了,其实大可不必担心。
  具体的实现format的功能是在  org.apache.hadoop.hdfs.server.namenode.FSImage  这个类的format(StorageDirectory sd)方法中,我们首先大概看下方法说明:

/** Create new dfs name directory.Caution: this destroys all files
* in this filesystem. */
  这个方法说明是建立新的dfs name dir,但是会删除所有这个目录下的文件,这个看方法实现中的第一行就可以知道

sd.clearDirectory(); // create currrent dir
针对clearDirectory的说明如下:
* Clear and re-create storage directory.
* <p>
* Removes contents of the current directory and creates an empty directory.
*
* This does not fully format storage directory.
  好下面看具体的做了什么

1:saveFSImage(getImageFile(sd, NameNodeFile.IMAGE));
2:editLog.createEditLogFile(getImageFile(sd, NameNodeFile.EDITS));
  其实就是建立新的image文件以及editlog文件,只是这些文件建立的时候会写入一些初始值。
  首先来看image文件的建立过程:

1:saveINode2Image//save the root
2:saveImage // save the rest of the nodes
3:fsNamesys.saveFilesUnderConstruction //Serializes leases
  其实这三部 在第一次format时只有第一步会真正写数据,其他两步在这个时候还未有作用。
  第一步写了一些权限组相关的信息,具体可以看  fsimage 文件。
  

  再来看editlog的建立过程:
  用RandomAccessFile 建立了一个rw文件用于记录editlog。
  总的来说:namenode format只是初始化一些目录和文件而已。
页: [1]
查看完整版本: hadoop namenode format做了什么?