876543e 发表于 2017-1-10 11:28:20

使用Ambari来部署hadoop集群(搭建内网HDP源)

规划
OS:centos6.5

Ambari-yumrepo 10.10.10.20公网 Ambari-server10.10.10.10内网hadoop-master1 10.10.10.1   内网   hadoop-master2 10.10.10.2   内网   hadoop-slave110.10.10.3   内网hadoop-slave210.10.10.4   内网   hadoop-slave310.10.10.5   内网

准备工作
(1)修改主机名

[*]Ambari-server、master1、master2、slave1、slave2、slave3


1
2
3
4
5
6
7
8
9
10
$ hostname XXX && echo XXX >/etc/hostname
$ cat >> /etc/hosts << EOF
10.10.10.1 master1
10.10.10.2 master2
10.10.10.3 slave1
10.10.10.4 slave2
10.10.10.5 slave3
10.10.10.10 ambari-server
10.10.10.20 ambari-yumrepo
EOF




(2)关闭selinux和防火墙

[*]Ambari-server、master1、master2、slave1、slave2、slave3


1
2
3
$ setenforce 0
$ service iptables stop
$ chkconfig iptables off




(3)主从节点ssh互信

[*]slave1、slave2、slave3


1
$ echo sshd:10.64.8.1 10.64.8.2 >>/etc/hosts.allow





[*]master1、master2


1
2
3
4
$ ssh-keygen -t rsa
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave1
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave2
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave3




(4)安装jdk

[*]Ambari-server、master1、master2、slave1、slave2、slave3


1
2
$ wget http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm
$ rpm -ivh jdk-8u111-linux-x64.rpm





(5)格式化硬盘

[*]Ambari-server、master1、master2、slave1、slave2、slave3


1
2
3
4
$ yes|mkfs.ext4 /dev/sdb
$ mkdir /data
$ mount /dev/sdb /data
$ echo "mount /dev/sdb /data" >>/etc/rc.local





(6)系统参数调优

[*]Ambari-server、master1、master2、slave1、slave2、slave3


1
2
3
4
5
6
7
8
9
10
$ cat >>/etc/sysctl.conf <<EOF
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_keepalive_time = 1200
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.ip_local_port_range = 1024 65000
net.ipv4.tcp_max_syn_baklog = 8192
net.ipv4.tcp_max_tw_bukets = 5000
EOF




文件打开数

1
2
3
$ cat >> /etc/security/limits.conf <<EOF
*             soft    nofile          65535*             hard    nofile          65535
EOF




重启

二:搭建内网yum源
注意:因为考虑到hadoop集群的机器可能是内网机器,没有公网访问权限,那么选择搭建一个内网的yum源,这个yum源的机器需要有公网权限。如果你的机器都可以出公网,也可以跳过这一步。

(1)添加yum源

[*]Ambari-yumrepo


1
2
3
$ cd /opt
$ wget http://public-repo-1.hortonworks.com/ambari/centos6/1.x/updates/1.4.1.25/ambari.repo
$ cp ambari.repo /etc/yum.repos.d/







(2)同步yum源的包

[*]Ambari-yumrepo


1
2
3
$ reposync-r HDP-UTILS-1.1.0.16
$ reposync-r Updates-ambari-1.4.1.25
$ reposync-r ambari-1.x




会在当前目录生成三个目录。

(3)发布yum源

[*]Ambari-yumrepo

需要一个web服务器来发布,已经安装了nginx,将上面下载包的三个目录移动到nginx发布目录下。

1
2
3
4
5
$ yum install nginx
$ mkdir /usr/share/nginx/html/ambari
$ cp -R ambari-1.x    /usr/share/nginx/html/ambari/
$ cp -R HDP-UTILS-1.1.0.16   /usr/share/nginx/html/ambari/
$ cp -R Updates-ambari-1.4.1.25/usr/share/nginx/html/ambari/






(4)创建repo

[*]Ambari-yumrepo

安装createrepo命令

1
2
3
$ yum install createrepo
$ cd/usr/share/nginx/html/ambari/
$ createrepo ./






(5)添加HDP源

[*]Ambari-yumrepo


1
2
3
4
5
6
$ vim /etc/yum.repos.d/HDP.repo

name=HDP
baseurl=http://public-repo-1.hortonworks.com/HDP/centos6/2.x/updates/2.0.6.0
enabled=1
gpgcheck=0






1
2
3
4
5
$ mkdir /usr/share/nginx/html/hdp
$ cd /usr/share/nginx/html/hdp
同步网络源的包,1G左右。
$ reposync -r HDP-2.0.6
$ createrepo ./





这样就本地yum源就OK了!

(6)配置yum.repo配置文件,放在web目录下。

[*]Ambari-yumrepo

注意:这个ambari.repo配置是给其他机器来使用的,不是本机的配置。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$ mkdir /usr/share/nginx/html/hadoop
$ cd /usr/share/nginx/html/hadoop
$ vim ambari.repo

name=Ambari 1.x
baseurl=http://10.10.10.20/ambari/
gpgcheck=0
enabled=1

name=Hortonworks Data Platform Utils Version - HDP-UTILS-1.1.0.16
baseurl=http://10.10.10.20/ambari/
gpgcheck=0
enabled=1

name=ambari-1.4.1.25 - Updates
baseurl=http://10.64.10.20/ambari/
gpgcheck=
enabled=1





1
2
3
4
5
6
7
$ vim hdp.repo

name=HDP
baseurl=http://10.10.10.20/hdp
path=/
enabled=1
gpgcheck=0





三:安装Ambari
(1)添加yum源

[*]Ambari-server、master1、master2、slave1、slave2、slave3


1
2
3
$ cd /etc/yum.repos.d/
$ wget http://10.10.10.20/hadoop/ambari.repo   #上面搭建的内网yum源
$ wget http://10.10.10.20/hadoop/hdp.repo      #上面搭建的内网yum源





(2)ambari主机ssh信任hadoop各机器

[*]master1、master2、slave1、slave2、slave3


1
$ echo sshd:10.10.10.10>>/etc/hosts.allow





[*]Ambari-server


1
2
3
4
5
6
$ ssh-keygen -t rsa
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@master1
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@master2
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave1
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave2
$ ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave3





(3)安装ambari

[*]Ambari-server


1
$ yum -y install ambari-server






(4)初始化ambari

[*]Ambari-server

下载需要的jdk文件(必须用这个文件)

1
2
3
4
$ wget http://public-repo-1.hortonworks.com/ARTIFACTS/jdk-6u31-linux-x64.bin
$ mv jdk-6u31-linux-x64.bin /var/lib/ambari-server/resources/

$ ambari-server setup#初始化配置






(5)启动ambari


[*]Ambari-server


1
$ ambari-server start






(6)给ambari配置本地的hadoop源

[*]Ambari-server


1
2
3
4
5
6
$ cd /var/lib/ambari-server/resources/stacks/HDPLocal/2.0.6/repos/
$ vim repoinfo.xml
将centos6的
<baseurl>http://public-repo-1.hortonworks.com/HDP/centos6/2.x/updates/2.0.6.0</baseurl>
替换成
<baseurl>http://10.10.10.20/hdp/centos6/2.x/updates/2.0.6.0</baseurl>





(7)进入ambari

[*]访问:http://10.10.10.10:8080进入ambari,user:admin,passwd:admin



[*]输入集群名



[*]选择 stack 版本



[*]Target Hosts输入hadoop机器的列表,需要添加ambari-server这台机器的/root/.ssh/id_rsa文件。



[*]会自动安装ambari-agent



[*]选择那个服务安装在哪个机器上。



[*]配置客户端和slaves



[*]配置各个系统



[*]开始安装



通过Ambari部署hadoop集群成功!



部署过程中遇到的问题:
1:执行os_type_check.sh脚本执行失败导致的Local OS is not compatible with cluster primary OS报错,这是一个BUG,可以直接修改该os_type_check.sh,输出正确的结果。

2:ambari没有复制过去正确的hdp源,所以手动将hdp源配置到hadoop的集群

1
2
3
4
5
6
7
$ vim hdp.repo

name=HDP
baseurl=http://10.10.10.20/hdp
path=/
enabled=1
gpgcheck=0




3:nagios输入正确密码和用户名无法登陆,密码文件httpd用户没有权限,设置777后可以正常访问。
-rw-r----- 1 nagios nagios 26 Jun9 11:54 /etc/nagios/htpasswd.users

4:jourenode无法启动报错


直接执行yum会报错
$ yum-d 0 -e 0 -y install net-snmp-utils
rpmdb: Thread/process 12500/139757427676928 failed: Thread died in Berkeley DB library
error: db3 error(-30974) from dbenv->failchk: DB_RUNRECOVERY: Fatal error, run database recovery
error: cannot open Packages index using db3 -(-30974)
error: cannot open Packages database in /var/lib/rpm
CRITICAL:yum.main:
解决办法:
$ rm -rf /var/lib/rpm/__db.*


bsdlra@126.com 发表于 2017-6-30 17:00:49

还文章继续学习
页: [1]
查看完整版本: 使用Ambari来部署hadoop集群(搭建内网HDP源)