opiuytr1 发表于 2017-1-4 10:03:01

Hadoop学习--通过配置文件修改文件副本数块大小--day04

                      import java.io.ByteArrayOutputStream;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.junit.Test;

public class replication {

        /**
       * 通过API实现自定义文件的副本数
       * 最后测试的时候修改集群hdfs.site.xml中dfs.namenode.fs-limits.min-block-size的值为10K
       * 注意修改集群的配置文件后手动的刷新nodes的命令并不能让文件生效,需要重新启动集群
       * 最后通过webui hadoop01:50070来查看
       */
        @Test
        public void customReplicationNum() throws Exception {
//创建configuration对象,有个默认的加载顺序,先从core-default.xml,再到src目录中的文件,这里
//我们给定了
      Configuration conf = new Configuration();
      //修改当前文件的副本数量
      conf.set("dfs.replication", "4");
      //修改当前文件的块大小
      conf.set("dfs.blocksize", "20480");
      //修改namenode的blcoksize的下限,需要修改集群的配置,这里设置是有问题的
//      conf.set("dfs.namenode.fs-limits.min-block-size", "1024*10");
//通过conf的configuration对象创建了该分布式文件系统fs,默认如果不指定文件的话为本地文件系统
      FileSystem fs = FileSystem.get(conf);
      //定义一个URL的字符串
      String file = "hdfs://hadoop01:9000/user/hadoop/data2/kala-copy.jpg";
      //通过一个URL的字符串构建一个path对象
      Path path = new Path(file);
      FSDataOutputStream out = fs.create(path);
      IOUtils.copyBytes(new FileInputStream("E:/zhaopian.jpg"), out, 1024);
      out.close();
   }
}

                   

页: [1]
查看完整版本: Hadoop学习--通过配置文件修改文件副本数块大小--day04