zzbb 发表于 2018-10-29 09:59:21

Hadoop学习--通过配置文件修改文件副本数块大小--day04

  import java.io.ByteArrayOutputStream;
  import java.io.FileInputStream;
  import java.io.FileOutputStream;
  import java.io.InputStream;
  import java.net.URL;
  import org.apache.hadoop.conf.Configuration;
  import org.apache.hadoop.fs.FSDataInputStream;
  import org.apache.hadoop.fs.FSDataOutputStream;
  import org.apache.hadoop.fs.FileSystem;
  import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;
  import org.apache.hadoop.fs.Path;
  import org.apache.hadoop.io.IOUtils;
  import org.junit.Test;

  public>  /**
  * 通过API实现自定义文件的副本数
  * 最后测试的时候修改集群hdfs.site.xml中dfs.namenode.fs-limits.min-block-size的值为10K
  * 注意修改集群的配置文件后手动的刷新nodes的命令并不能让文件生效,需要重新启动集群
  * 最后通过webui hadoop01:50070来查看
  */
  @Test
  public void customReplicationNum() throws Exception {
  //创建configuration对象,有个默认的加载顺序,先从core-default.xml,再到src目录中的文件,这里
  //我们给定了
  Configuration conf = new Configuration();
  //修改当前文件的副本数量
  conf.set("dfs.replication", "4");
  //修改当前文件的块大小
  conf.set("dfs.blocksize", "20480");
  //修改namenode的blcoksize的下限,需要修改集群的配置,这里设置是有问题的
  //      conf.set("dfs.namenode.fs-limits.min-block-size", "1024*10");
  //通过conf的configuration对象创建了该分布式文件系统fs,默认如果不指定文件的话为本地文件系统
  FileSystem fs = FileSystem.get(conf);
  //定义一个URL的字符串
  String file = "hdfs://hadoop01:9000/user/hadoop/data2/kala-copy.jpg";
  //通过一个URL的字符串构建一个path对象
  Path path = new Path(file);
  FSDataOutputStream out = fs.create(path);
  IOUtils.copyBytes(new FileInputStream("E:/zhaopian.jpg"), out, 1024);
  out.close();
  }
  }

页: [1]
查看完整版本: Hadoop学习--通过配置文件修改文件副本数块大小--day04