Hadoop初学指南(1)--Hadoop1伪分布模式的安装

jydg 发表于 2018-10-31 08:08:04

　　本文主要介绍了hadoop1的伪分布模式的安装。只需要根据步骤一步一步的操作就可以按照好hadoop的伪分布安装。所用到的安装包为jdk-6u45-linux-x64.bin和hadoop-1.1.2.tar.gz。操作环境为VMware下CentOS-6.5的64位虚拟机。如果是32位系统，只需下载相应的jdk即可。
　　一。伪分布模式安装大致步骤：
　　(1)关闭防火墙
　　(2)修改hostname
　　(3)设置ssh自动登录
　　(4)安装jdk
　　(5)安装hadoop
　　二。伪分布模式的安装：
　　Hadoop1只能工作在Linux的操作系统上，因此需要准备一台Linux下主机，可以用VMWare建立一台虚拟机。
　　(1)关闭防火墙
　　使用service iptables stop关闭防火墙

　　完成后可以使用service iptables status来进行验证：

　　(2)关闭防火墙自动运行
　　使用命令chkconfig iptables off来关闭防火墙的自动运行

　　完成后可以使用chkconfig --list | grep iptables进行验证：

　　(3)设置主机名
　　①使用hostname HOSTNAME命令对当前窗口主机名进行更改，完成后使用hostname进行查看

　　②编辑/etc/sysconfig/network把主机名改为自己刚设置的主机名

　　③重启主机后就可以看见主机名已经改为myhadoop

　　(4)设置ssh自动登录
　　①使用命令ssh-keygen -t rsa生成密钥

　　②复制/root/.ssh/id_rsa.pub文件为authorized_keys

　　这样即可实现ssh免密码登录
　　(5)绑定ip与hostname
　　①使用ifconfig查看当前主机IP

　　②修改/etc/hosts文件

　　设置成功后可以使用ping myhadoop来进行验证，如果ping通说明设置成功：

　　(6)安装jdk
　　①下载jdk和hadoop的安装包到/usr/local下

　　②切换到/usr/local目录下，使用./jdk-6u45-linux-x64.bin来进行jdk安装

　　安装完成后截图：

　　③修改安装后的目录名为jdk

　　④在/etc/profile下追加JAVA_HOME和PATH

　　⑤使用source /etc/profile来刷新环境变量

　　最后可以使用java -version进行验证

　　(7)安装hadoop
　　①使用tar对hadoop进行解压

　　②把安装后的hadoop-1.1.2目录重命名为hadoop

　　③修改/etc/profile文件

　　④刷新配置

　　⑤修改/usr/local/hadoop/conf下相应的配置文件
　　1.hadoop-env.sh
　　修改内容：
　　export JAVA_HOME=/usr/local/jdk

　　2.core-site.xml
　　修改内容：
　　
　　fs.default.name
　　hdfs://myhadoop:9000
　　
　　
　　hadoop.tmp.dir
　　/usr/local/hadoop/tmp
　　
　　

　　3.hdfs-site.xml
　　修改内容：
　　
　　dfs.replication
　　1
　　
　　
　　dfs.permissions
　　false
　　
　　

　　4.mapred-site.xml
　　修改内容：
　　
　　mapred.job.tracker
　　myhadoop:9001
　　
　　

　　(8)启动hadoop
　　①初始化namenode，执行命令为hadoop namenode -format

　　②启动hadoop，执行命令为start-all.sh

　　最后可以使用jps进行验证，如果看到5个新的java进程，分别是NameNode、SecondaryNameNode、DataNode、JobTracker、TaskTracker。那么表示hadoop启动成功：

　　③利用网页查看hadoop：
　　在虚拟机中打开火狐浏览器，分别打开http://myhadoop:50070http://myhadoop:50030
　　出现如下画面说明成功：

　　(9)可能出现的错误：
　　1.启动时没有NameNode的可能原因：
　　(1)没有格式化
　　(2)环境变量设置错误
　　(3)ip与hostname绑定失败
　　2.启动时没有DataNode的可能原因：
　　执行了多次格式化，导致日志文件中的namenode序列号与datanode序列号不一致，只需要把日志中的序列号修改一致即可

页: [1]

运维网's Archiver

Hadoop初学指南(1)--Hadoop1伪分布模式的安装