设为首页 收藏本站
查看: 730|回复: 0

[经验分享] 如何搭建Hadoop集群环境

[复制链接]

尚未签到

发表于 2016-12-4 09:47:25 | 显示全部楼层 |阅读模式
  第一步:安装
  (1) 下载hadoop包 http://hadoop.apache.org/
  (2) 登录需要配置hadoop的服务器(HadoopSrv01) su -gird(官方建议用grid账户搭建)
  (3) 解压 tar -xvf hadoop-2.1.0-bin.tar.gz 到一个目录比如/home/gird
  (4) 进入/home/gird 创建临时目录 tmp
  (5) 配置 hadoop-env.sh, core-site.xml, hdfs-site.xml,mapred-site.xml ,masters,slaves文件
  (6) 修改hadoop-env.sh 文件,只需要设置 export JAVA_HOME=/usr/java/jdk1.7.0 即可,其他不需要修改。
  (7) 修改core-site.xml 文件,增加以下内容
  <property>
  <name>default.name</name>
  <value>http://HadoopSrv01:9000</value>
  </property>
  <property>
  <name>hadoop.tmp.dir</name>
  <value>/home/gird/hadoop-2.1.0/tmp</value>
  </property>
  (8) 修改hdfs-site.xml,根据你自己的datanode节点数,设置复制因子。
  <property>
  <name>dfs.replication</name>
  <value>2</value>
  </property>
  (9) 修改mapred-site.xml文件
  <property>
  <name>mapred.job.tracker</name>
  <value>HadoopSrv01:9001</value>
  </property>
  (10) 修改masters,slaves 增加namenode,datanode节点配置。
  masters:
  HadoopSrv01
  slaves:
  HadoopSrv02
  HadoopSrv03
  (11) 格式化Hadoop集群 bin/hadoop namenode -format
  (12) 启动集群 bin/start-all.sh
  (13)检查后台进程是否OK /usr/java/jdk1.7.0/bin/jps
  NameNode,JobTracker,DataNode,TaskTracker
  如果以上都能看到,就说明Hadoop分布式环境搭建好了
  第二步:测试
  (1) 进入cd /home/gird mkdir input
  (2) cd input
  (3)通过输出重定向的方式,新增两个txt文件
  echo "Hi everyone">Text1.txt  
  echo "Hi,Hadoop">Text2.txt
  (4) 查看Hadoop HDFS里是否有东西 
  cd /home/gird/hadoop-2.1.0/bin/hadoop  fs -ls
  返回:ls: Cannot  access .: No such file or directory
  (5)把input目录下的文件拷贝到hadoop in目录下
  bin/hadoop fs -put ../put  ./in
  提示错误:
  put: org.apache.hadoop.hdfs.server .namenode.SafeModeException: Cannot create directory /user/gird/in. Name node is in safe mode.
  执行:/home/gird/hadoop-2.1.0/bin/hadoop dfsadmin -safemode leave
  (6) 执行example jar 进行统计分析。
  /home/gird/hadoop-2.1.0/bin/hadoop jar hadoop-examples-2.1.0.jar wordcount in out
  (7) 查看执行输出文件。 
  bin/hadoop fs -cat ./out/part-r-00000
  返回:
  Hadoop 1
  Hi 2
  everyone 1
  第三步:配置SSH验证
  (1) 依次登录登录到 HadoopSrv01,HadoopSrv02,HadoopSrv03,先进行(1),(2),(3)操作,然后进行第(4)步骤操作:
  (1):su - grid
  (2): ssh-keygen -t rsa  全部默认,直接回车,不需要输入任何东西。
  (3): cd .ssh 进入.ssh目录
  (4):  
  HadoopSrv01上:
  scp id_rsa.pub 
  scp id_rsa.pub 
  HadoopSrv02上:
  scp id_rsa.pub 
  scp id_rsa.pub 
  HadoopSrv03上:
  scp id_rsa.pub 
  scp id_rsa.pub 
  (2) 测试
  ssh hostname 如果不需要输入密码就证明设置成功了。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.iyunv.com/thread-309399-1-1.html 上篇帖子: hadoop 2.2.0安装 下篇帖子: Hadoop 本地集成环境搭建
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表