yum安装配置nagios-wqh
原始出处:http://dongxin.blog.运维网.com/3486403/17717801. Nagios安装 - 服务端
安装扩展YUM源(2个都可以,但是epel-release只有6.7版本才可以,6.7以前版本不支持)
# yum install -y epel-release
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4UjagYMsGAAA-u5gqi-U115.png
# wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo
http://s1.运维网.com/wyfs02/M01/80/1C/wKioL1c4UyqgugWTAACBuwBeGN8050.png
安装nagios服务以及相关支持服务:
# yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
http://s2.运维网.com/wyfs02/M02/80/1C/wKioL1c4UzmRNES8AABSnWL662U470.png
创建用户和密码
# htpasswd -c /etc/nagios/passwd nagiosadmin
http://s5.运维网.com/wyfs02/M02/80/1C/wKioL1c4U0fjy360AAAr5PaMczM729.png
检测配置文件
# nagios -v /etc/nagios/nagios.cfg
http://s4.运维网.com/wyfs02/M00/80/1F/wKiom1c4UnDzHd2cAACpW8lSeug742.png
http://s1.运维网.com/wyfs02/M01/80/1C/wKioL1c4U56xRkFBAABVdbLw0uE147.png
上图表示 配置正确 没有问题
启动服务:
http://s3.运维网.com/wyfs02/M02/80/1F/wKiom1c4UsXTsmVBAAApg5OOzYA692.png
检测一下:
http://s2.运维网.com/wyfs02/M02/80/1C/wKioL1c4U7SBjmTKAAA1QP__idQ531.png
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4UtujNYGOAABNPbb7uw8991.png
浏览器访问: http://ip/nagios
http://s1.运维网.com/wyfs02/M00/80/1C/wKioL1c4U8yQLqeBAACGmP6rDmo712.png
如果没有得到上面的结果,请检查selinux和iptables,输入上面建立的用户名和密码
http://s5.运维网.com/wyfs02/M01/80/1C/wKioL1c4VAbw-GRhAAKdb1l5I1Y671.png
可以看到我安装的版本是3.5.1。
2. Nagios安装 - 客户端
安装扩展YUM源(2个都可以,但是epel-release只有6.7版本才可以,6.7以前版本不支持)
# yum install -y epel-release
http://s3.运维网.com/wyfs02/M02/80/1F/wKiom1c4UyyBcSS6AAA-u5gqi-U633.png
# wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo
http://s3.运维网.com/wyfs02/M02/80/1F/wKiom1c4UzfDLZq2AACBuwBeGN8160.png
安装nagios客户端服务
# yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
http://s3.运维网.com/wyfs02/M02/80/1C/wKioL1c4VC2BfisqAABqv8UMH_A416.png
编辑配置文件
# vim /etc/nagios/nrpe.cfg
找到“allowed_hosts=127.0.0.1” 改为 “allowed_hosts=192.168.1.201”
allowed_hosts=192.168.1.201定义服务器主机
找到” dont_blame_nrpe=0” 改为“dont_blame_nrpe=1”
dont_blame_nrpe=1
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4U1nz60x6AABOOhq4fck511.png
启动服务
# /etc/init.d/nrpe start
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4U5miOFUYAAAbt-roAc0752.png
3. 监控中心(192.168.1.201)添加被监控主机(192.168.1.202)
编辑被监控主机配置文件
# cd /etc/nagios/conf.d/
# vim 192.168.1.202.cfg
define host{
use linux-server
host_name 192.168.1.202
alias 1.202
address 192.168.1.202
}
define service{
use generic-service
host_name 192.168.1.202
service_description check_ping
check_command check_ping!100.0,20%!200.0,50%
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name 192.168.1.202
service_description check_ssh
check_command check_ssh
max_check_attempts 5
normal_check_interval 1
notification_interval 60
define service{
use generic-service
host_name 192.168.1.202
service_description check_http
check_command check_http
max_check_attempts 5
normal_check_interval 1
}
max_check_attempts 5 ;当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警
normal_check_interval 1 ;重新检测的时间间隔,单位是分钟,默认是3分钟
notification_interval 60;在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。
http://s2.运维网.com/wyfs02/M01/80/1C/wKioL1c4VIqDYEJAAADCC19tEv4188.png
检测配置文件:
# nagios -v /etc/nagios/nagios.cfg
http://s1.运维网.com/wyfs02/M02/80/1F/wKiom1c4U6_RCEO1AAC0WxmG9eE169.png
http://s3.运维网.com/wyfs02/M02/80/1C/wKioL1c4VKGAOEgXAABSFJ4kXzI394.png
重启服务:
http://s1.运维网.com/wyfs02/M00/80/1F/wKiom1c4U8ezLZ5TAAAhtBpJq20809.png
去web查看一下监控情况
http://s1.运维网.com/wyfs02/M02/80/1F/wKiom1c4U9LBIS_KAAE0uV_6biM467.png
http://s5.运维网.com/wyfs02/M02/80/1C/wKioL1c4VPuRUi40AAHah2fZSuo493.png
4--监控客户端硬盘,内存情况
#由于需要nagios调用的监控命令都需要在command.cfg模块中定义 而前面的check_nrpe在默认的command.cfg中时没有的
这里需要在command.cfg中将其加入进去 现在去服务器端编辑/objects/commands.cfg
# vim /etc/nagios/objects/commands.cfg
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
定义check_nrpe编辑文件添加下面内容:
http://s2.运维网.com/wyfs02/M00/80/1C/wKioL1c4VQmBP-PxAAAQfXHYRkg371.png
http://s2.运维网.com/wyfs02/M00/80/1F/wKiom1c4VC3SN8MRAAAkZRrD7IA037.png
在服务器端配置被监控端的配置文件:
# cd /etc/nagios/conf.d/
# vim 192.168.1.202.cfg
define service{
use generic-service
host_name 192.168.1.88
service_description check_load
check_command check_nrpe!check_load
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name 192.168.1.88
service_description check_disk_hda1
check_command check_nrpe!check_hda1
max_check_attempts 5
normal_check_interval 1
}
http://s3.运维网.com/wyfs02/M00/80/1C/wKioL1c4VR-zZmR7AACgp_Gdka4924.png
客户端查看check_load,check_hda1服务
# df -h
http://s2.运维网.com/wyfs02/M01/80/1F/wKiom1c4VEfR3Uu0AAA1lKOsWIA051.png
# vi /etc/nagios/nrpe.cfg
http://s5.运维网.com/wyfs02/M01/80/1C/wKioL1c4VTnTQTx_AABcgiZ-o1Y918.png
查看一下已经监控到了 ok
http://s5.运维网.com/wyfs02/M02/80/1F/wKiom1c4VF6xQbZ5AACfjDCeMzw666.png
页:
[1]