使用Ambari来部署hadoop集群（搭建内网HDP源）

876543e 发表于 2017-1-10 11:28:20

规划
OS：centos6.5

Ambari-yumrepo 10.10.10.20公网 Ambari-server10.10.10.10内网hadoop-master1 10.10.10.1 内网 hadoop-master2 10.10.10.2 内网 hadoop-slave110.10.10.3 内网hadoop-slave210.10.10.4 内网 hadoop-slave310.10.10.5 内网

准备工作
（1）修改主机名

[*]Ambari-server、master1、master2、slave1、slave2、slave3

1
2
3
4
5
6
7
8
9
10
$ hostname XXX && echo XXX >/etc/hostname
$ cat >> /etc/hosts << EOF
10.10.10.1 master1
10.10.10.2 master2
10.10.10.3 slave1
10.10.10.4 slave2
10.10.10.5 slave3
10.10.10.10 ambari-server
10.10.10.20 ambari-yumrepo
EOF

（2）关闭selinux和防火墙

[*]Ambari-server、master1、master2、slave1、slave2、slave3

1
2
3
$ setenforce 0
$ service iptables stop
$ chkconfig iptables off

（3）主从节点ssh互信

[*]slave1、slave2、slave3

1
$ echo sshd:10.64.8.1 10.64.8.2 >>/etc/hosts.allow

[*]master1、master2

1
2
3
4
$ ssh-keygen -t rsa
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave1
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave2
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave3

（4）安装jdk

[*]Ambari-server、master1、master2、slave1、slave2、slave3

1
2
$ wget http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm
$ rpm -ivh jdk-8u111-linux-x64.rpm

（5）格式化硬盘

[*]Ambari-server、master1、master2、slave1、slave2、slave3

1
2
3
4
$ yes|mkfs.ext4 /dev/sdb
$ mkdir /data
$ mount /dev/sdb /data
$ echo "mount /dev/sdb /data" >>/etc/rc.local

（6）系统参数调优

[*]Ambari-server、master1、master2、slave1、slave2、slave3

1
2
3
4
5
6
7
8
9
10
$ cat >>/etc/sysctl.conf <<EOF
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_keepalive_time = 1200
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.ip_local_port_range = 1024 65000
net.ipv4.tcp_max_syn_baklog = 8192
net.ipv4.tcp_max_tw_bukets = 5000
EOF

文件打开数

1
2
3
$ cat >> /etc/security/limits.conf <<EOF
* soft nofile 65535* hard nofile 65535
EOF

重启

二：搭建内网yum源
注意：因为考虑到hadoop集群的机器可能是内网机器，没有公网访问权限，那么选择搭建一个内网的yum源，这个yum源的机器需要有公网权限。如果你的机器都可以出公网，也可以跳过这一步。

（1）添加yum源

[*]Ambari-yumrepo

1
2
3
$ cd /opt
$ wget http://public-repo-1.hortonworks.com/ambari/centos6/1.x/updates/1.4.1.25/ambari.repo
$ cp ambari.repo /etc/yum.repos.d/

（2）同步yum源的包

[*]Ambari-yumrepo

1
2
3
$ reposync-r HDP-UTILS-1.1.0.16
$ reposync-r Updates-ambari-1.4.1.25
$ reposync-r ambari-1.x

会在当前目录生成三个目录。

（3）发布yum源

[*]Ambari-yumrepo

需要一个web服务器来发布，已经安装了nginx,将上面下载包的三个目录移动到nginx发布目录下。

1
2
3
4
5
$ yum install nginx
$ mkdir /usr/share/nginx/html/ambari
$ cp -R ambari-1.x /usr/share/nginx/html/ambari/
$ cp -R HDP-UTILS-1.1.0.16 /usr/share/nginx/html/ambari/
$ cp -R Updates-ambari-1.4.1.25/usr/share/nginx/html/ambari/

（4）创建repo

[*]Ambari-yumrepo

安装createrepo命令

1
2
3
$ yum install createrepo
$ cd/usr/share/nginx/html/ambari/
$ createrepo ./

（5）添加HDP源

[*]Ambari-yumrepo

1
2
3
4
5
6
$ vim /etc/yum.repos.d/HDP.repo

name=HDP
baseurl=http://public-repo-1.hortonworks.com/HDP/centos6/2.x/updates/2.0.6.0
enabled=1
gpgcheck=0

1
2
3
4
5
$ mkdir /usr/share/nginx/html/hdp
$ cd /usr/share/nginx/html/hdp
同步网络源的包，1G左右。
$ reposync -r HDP-2.0.6
$ createrepo ./

这样就本地yum源就OK了！

（6）配置yum.repo配置文件，放在web目录下。

[*]Ambari-yumrepo

注意：这个ambari.repo配置是给其他机器来使用的，不是本机的配置。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$ mkdir /usr/share/nginx/html/hadoop
$ cd /usr/share/nginx/html/hadoop
$ vim ambari.repo

name=Ambari 1.x
baseurl=http://10.10.10.20/ambari/
gpgcheck=0
enabled=1

name=Hortonworks Data Platform Utils Version - HDP-UTILS-1.1.0.16
baseurl=http://10.10.10.20/ambari/
gpgcheck=0
enabled=1

name=ambari-1.4.1.25 - Updates
baseurl=http://10.64.10.20/ambari/
gpgcheck=
enabled=1

1
2
3
4
5
6
7
$ vim hdp.repo

name=HDP
baseurl=http://10.10.10.20/hdp
path=/
enabled=1
gpgcheck=0

三：安装Ambari
（1）添加yum源

[*]Ambari-server、master1、master2、slave1、slave2、slave3

1
2
3
$ cd /etc/yum.repos.d/
$ wget http://10.10.10.20/hadoop/ambari.repo #上面搭建的内网yum源
$ wget http://10.10.10.20/hadoop/hdp.repo #上面搭建的内网yum源

（2）ambari主机ssh信任hadoop各机器

[*]master1、master2、slave1、slave2、slave3

1
$ echo sshd:10.10.10.10>>/etc/hosts.allow

[*]Ambari-server

1
2
3
4
5
6
$ ssh-keygen -t rsa
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@master1
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@master2
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave1
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave2
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave3

（3）安装ambari

[*]Ambari-server

1
$ yum -y install ambari-server

（4）初始化ambari

[*]Ambari-server

下载需要的jdk文件（必须用这个文件）

1
2
3
4
$ wget http://public-repo-1.hortonworks.com/ARTIFACTS/jdk-6u31-linux-x64.bin
$ mv jdk-6u31-linux-x64.bin /var/lib/ambari-server/resources/

$ ambari-server setup#初始化配置

（5）启动ambari

[*]Ambari-server

1
$ ambari-server start

（6）给ambari配置本地的hadoop源

[*]Ambari-server

1
2
3
4
5
6
$ cd /var/lib/ambari-server/resources/stacks/HDPLocal/2.0.6/repos/
$ vim repoinfo.xml
将centos6的
<baseurl>http://public-repo-1.hortonworks.com/HDP/centos6/2.x/updates/2.0.6.0</baseurl>
替换成
<baseurl>http://10.10.10.20/hdp/centos6/2.x/updates/2.0.6.0</baseurl>

（7）进入ambari

[*]访问：http://10.10.10.10:8080进入ambari，user:admin，passwd:admin

[*]输入集群名

[*]选择 stack 版本

[*]Target Hosts输入hadoop机器的列表，需要添加ambari-server这台机器的/root/.ssh/id_rsa文件。

[*]会自动安装ambari-agent

[*]选择那个服务安装在哪个机器上。

[*]配置客户端和slaves

[*]配置各个系统

[*]开始安装

通过Ambari部署hadoop集群成功！

部署过程中遇到的问题：
1：执行os_type_check.sh脚本执行失败导致的Local OS is not compatible with cluster primary OS报错，这是一个BUG，可以直接修改该os_type_check.sh，输出正确的结果。

2：ambari没有复制过去正确的hdp源，所以手动将hdp源配置到hadoop的集群

1
2
3
4
5
6
7
$ vim hdp.repo

name=HDP
baseurl=http://10.10.10.20/hdp
path=/
enabled=1
gpgcheck=0

3：nagios输入正确密码和用户名无法登陆，密码文件httpd用户没有权限，设置777后可以正常访问。
-rw-r----- 1 nagios nagios 26 Jun9 11:54 /etc/nagios/htpasswd.users

4:jourenode无法启动报错

直接执行yum会报错
$ yum-d 0 -e 0 -y install net-snmp-utils
rpmdb: Thread/process 12500/139757427676928 failed: Thread died in Berkeley DB library
error: db3 error(-30974) from dbenv->failchk: DB_RUNRECOVERY: Fatal error, run database recovery
error: cannot open Packages index using db3 -(-30974)
error: cannot open Packages database in /var/lib/rpm
CRITICAL:yum.main:
解决办法：
$ rm -rf /var/lib/rpm/__db.*

bsdlra@126.com 发表于 2017-6-30 17:00:49

还文章继续学习

页: [1]

运维网's Archiver

使用Ambari来部署hadoop集群（搭建内网HDP源）