lchl0388 发表于 2019-1-6 14:16:46

编译安装 Heartbeat 搭建高可用集群

环境

OS:Redhat5.4

VirtualBox:3.2.8

HeartBeat:2.1.4

Node 数量:2

源代码安装 Heartbeat 依赖于 libnet 这个软件包,这个软件包没有收录在系统中,需要手工编译安装

下载地址:http://linux.softpedia.com/get/Programming/Libraries/Libnet-10275.shtml

这是编译安装需要安装的软件包

glib2-devel

python-devel

pam-devel

e2fsprogs-devel

uuid library

bzip2

libxml-devel

guntls-devel



#创建heartbeat用户和组



# 编译安装 Heartbeat

tar xvjf Heartbeat-STABLE-2-1-STABLE-2.1.4.tar.bz2 -C /usr/local/src/

cd /usr/local/src/Heartbeat-STABLE-2-1-STABLE-2.1.4/

./ConfigureMe configure

make && make install

heartbeat1.X与2.X配置文件的区别

/etc/ha.d/authkeys 该文件在两个版本作用是完全相同的,都必须设置,并且保证每个节点(node)内容一样;
/etc/ha.d/ha.cf 这个是主要配置文件,由其决定v1或v2 style格式
/etc/ha.d/haresources 这是v1的资源配置文件
/var/lib/heartbeat/crm/cib.xml 这是v2的资源配置文件,两者根据ha.cf的设定只能选其一



/etc/ha.d/ha.cf 这个文件是heartbeat的主要配置文件

这是没有注释的行,也就是需要配置的

debugfile /var/log/ha-debug



logfile /var/log/ha-log



logfacility   local0

设置系统日志的信息范围为 local0

keepalive 2

设置心跳的检测时间,默认单位为秒

deadtime 30

宣布节点死亡的时间,单位为秒

warntime 10                  

通过这个来调整判断节点的死亡时间

initdead 120

Heartbeat 启动资源的等待时间,单位为秒

udpport 694

设定用于bcast和ucast通信的端口,默认为 UDP 694

ucast eth1 10.10.10.2

心跳网卡和对方的ip地址

auto_failback on

这个设定会使节点具备优先级。当服务运行于备机上时,如果主节点已恢复,会自动取回运行在备机上的服务。

node    heartbeat-1.site heartbeat-2.site

节点信息

ping192.168.1.1

指定ping节点,检测网络状态,通常是网关

respawn hacluster /usr/lib/heartbeat/ipfail



设定 Heartbeat 监控的服务,该服务会随着 Heartbeat 服务启动时启动,停止时则一起停止。当出现意外导致该服务停止时,Heartbeat 将自动重启该服务

respawn hacluster    /usr/lib/heartbeat/pingd -m 100 -d 5s



HeartbeatVersion1.X.X 中用ipfail ,而2.X.X 中用pingd

apiauth ipfail gid=haclient uid=hacluster



客户端API访问控制。这里指定运行 ipfail 的用户和用户组

apiauth ping gid=haclient uid=hacluster



apiauth pingd gid=haclient uid=hacluster



crmrespawn

支持crm管理



群集资源文件

haresource或者cib.xml

haresource格式比较简单,可以直接编辑,但是cib.xml格式比较复杂,最好通过GUI界面或者用工具转换V1文件

这是V1.X的 httpd资源的一个例子,这个ip是资源的ip,假如资源在node1上,那么网卡会虚拟出一个网卡,而IP 就是这个IP

heartbeat-1 IPaddr::192.168.228.235 httpd mysql

heartbeat是资源的主控节点

如果集群需要实现Active-Active(互备)状态,则可以再写一行,但托管的应用不能冲突。

cib.xml 文件的编辑方式

1人工编写XML文件;
2使用admintools工具,其已经包含在heartbeat包中;
3使用GUI图形工具配置,也包含在heartbeat-gui包里面;
4使用python脚本转换1.x style的格式配置文件



authkeys配置文件

该文件是集群中各节点相互认证的配置文件,允许使用crc(明文)、md5、sha1等不同的验证方式,可以使用heartbeat自带的示例来修改

!!!文件的权限必须是600,

auth 2
1 crc
2 sha1 HI!
3 md5 Hello!

每种验证方式耗费的系统资源也是不一样的,性能安全平衡一下吧

最后还要把heartbeat添加为系统服务

chkconfig –add heartbeat

chkconfig--level 2354 heartbeat on

在我启动heartbeat的服务的时候,遇到了这样一个错误




[*]# /etc/init.d/heartbeat start
[*]logd is already running
[*]Starting High-Availability services:
[*]2010/10/16_01:43:54 INFO:Resource is stopped
[*]                                                         
[*]heartbeat: 2010/10/16_01:43:54 WARN: heartbeat: udp port 1694 reserved for service "rrimwm".
[*]heartbeat: udpport setting must precede media statementsheartbeat: 2010/10/16_01:43:54 info: Version 2 support: resppawn
[*]heartbeat: 2010/10/16_01:43:54 ERROR: Heartbeat not started: configuration error.
[*]heartbeat: 2010/10/16_01:43:54 ERROR: Configuration error, heartbeat not started.

1694是我自己修改的,这个不是大问题,主要是 updport setting must precede media statements heartbeat

服务总是启动失败,最后查明原因是authkeys文件的问题,2个节点的这个文件不相同,建议这个文件用scp拷贝,手工修改可能会有问题,我就是手工修改的,折腾了半天,囧







关于HeartBeat的原理介绍,请参考http://www.linuxfly.org/






页: [1]
查看完整版本: 编译安装 Heartbeat 搭建高可用集群