lsdwyl 发表于 2018-10-29 10:23:19

Hadoop学习--伪分布式部署--day01

  1.伪分布式安装准备工作
  上传hadoop-2.7.3.tar.gz/soft
  虚拟机Java安装完毕
  卸载原有的openjdk的版本
  # java -version如果看到有openjdk的字样就是说明是系统带的openjdk版本
  # rpm -qa|grep jdk
  用类似如下的方法删除上面的rpm包
  #rpm -e --nodeps   java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
  检查是否还有jdk1.5的版本,有就删除
  #rpm -e --nodeps java-1.5.0-gcj-1.5.0.0-29.1.el6.x86_64
  #解压新下载的jdk的安装包
  配置环境变量
  2.解压hadoop
  $tar -xzvf hadoop-2.7.3.tar.gz
  3.配置环境变量
  编辑/etc/profile,添加如下内容
  export JAVA_HOME=/soft/jdk1.8.0_111
  export HADOOP_HOME=/soft/hadoop-2.7.3
  export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
  并且把以上的内容写到/home/hadoop/.bashrc中
  4.配置SSH免密码登陆
  $ssh-keygen -t rsa (四个回车)
  执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)
  将公钥拷贝到要免登陆的机器上
  $cd /home/hadoop/.ssh

  $cat>  $chmod 600 authorized_keys
  mkdir ./ssh
  chmod 700 ~/.ssh cd ~/.ssh
  ssh-keygen -t rsa
  cd ~/.ssh
  cat /root/.ssh/id_rsa.pub > authorized_keys
  chmod 600 ~/.ssh/authorized_keys
  scp authorized_keys userB:/root/.ssh/
  注:A 为管理主机,B为被管理主机。
  5.修改core-site.xml
  添加如下信息
  
  
  
  fs.defaultFS
  hdfs://localhost/
  
  
  6.修改hdfs-site.xml
  
  
  dfs.replication
  1
  
  7.修改mapred-site.xml
  
  
  mapreduce.framework.name
  yarn
  
  8.修改yarn-site.xml
  
  
  yarn.resourcemanager.hostname
  localhost
  
  
  
  yarn.nodemanager.aux-services
  mapreduce_shuffle
  
  9.格式化namenode(是对namenode进行初始化
  $hdfs namenode -format (hadoop namenode -format)
  10.启动hadoop
  先启动HDFS
  $start-dfs.sh
  $start-yarn.sh
  关闭的顺序最好相反
  11.目录操作
  $hadoop fs -mkdir -p /user/hadoop
  $hadoop fs -ls /
  $hadoop fs -ls -R /
  $hadoop fs -lsr /
  上传
  $hadoop fs -put   
  $hadoop fs -put local.txt /user/hadoop/xx.txt   //将本地文件put到hdfs文件系统
  查看文件内容
  $hadoop fs -cat
  下载文件
  $hadoop fs -get
  12.查看帮助
  $hadoop fs//直接回车
  $hadoop fs -help put //查看put的具体信息
  13.查看namenode和datanode在本地
  $cd /tmp/hadoop-hadoop/dfs/name/...   //第一个hadoop是hadoop用户登陆启动创建的
  $cd /tmp/hadoop-hadoop/dfs/data/...
  14.查看log文件
  $ $HADOOP_HOME/logs
  15.通过webui查看日志或者集群情况
  http://localhost:500070/    //namenode web server port
  http://localhost:8088/      //resourceManager,只有在本机访问才可以。hadoop集群信息
  http://localhost:19888/   //historyServer
  16.通过netstat查看网络端口占用情况
  $netstat-lnpt//l:listeneru:udpp:programname

页: [1]
查看完整版本: Hadoop学习--伪分布式部署--day01