发表于 2019-1-13 06:41:30

yum安装配置nagios-wqh

  原始出处:http://dongxin.blog.运维网.com/3486403/1771780
  1. Nagios安装 - 服务端
  安装扩展YUM源(2个都可以,但是epel-release只有6.7版本才可以,6.7以前版本不支持)
  # yum install -y epel-release
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4UjagYMsGAAA-u5gqi-U115.png
  # wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo
http://s1.运维网.com/wyfs02/M01/80/1C/wKioL1c4UyqgugWTAACBuwBeGN8050.png
  安装nagios服务以及相关支持服务:
  # yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
http://s2.运维网.com/wyfs02/M02/80/1C/wKioL1c4UzmRNES8AABSnWL662U470.png
  创建用户和密码
  # htpasswd -c /etc/nagios/passwd nagiosadmin
http://s5.运维网.com/wyfs02/M02/80/1C/wKioL1c4U0fjy360AAAr5PaMczM729.png
  检测配置文件
  # nagios -v /etc/nagios/nagios.cfg
http://s4.运维网.com/wyfs02/M00/80/1F/wKiom1c4UnDzHd2cAACpW8lSeug742.png
http://s1.运维网.com/wyfs02/M01/80/1C/wKioL1c4U56xRkFBAABVdbLw0uE147.png
  上图表示 配置正确 没有问题
  启动服务:
http://s3.运维网.com/wyfs02/M02/80/1F/wKiom1c4UsXTsmVBAAApg5OOzYA692.png
  检测一下:
http://s2.运维网.com/wyfs02/M02/80/1C/wKioL1c4U7SBjmTKAAA1QP__idQ531.png
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4UtujNYGOAABNPbb7uw8991.png
  浏览器访问: http://ip/nagios
http://s1.运维网.com/wyfs02/M00/80/1C/wKioL1c4U8yQLqeBAACGmP6rDmo712.png
  如果没有得到上面的结果,请检查selinux和iptables,输入上面建立的用户名和密码
http://s5.运维网.com/wyfs02/M01/80/1C/wKioL1c4VAbw-GRhAAKdb1l5I1Y671.png
  可以看到我安装的版本是3.5.1。
  2. Nagios安装 - 客户端
  安装扩展YUM源(2个都可以,但是epel-release只有6.7版本才可以,6.7以前版本不支持)
  # yum install -y epel-release
http://s3.运维网.com/wyfs02/M02/80/1F/wKiom1c4UyyBcSS6AAA-u5gqi-U633.png
  # wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo
http://s3.运维网.com/wyfs02/M02/80/1F/wKiom1c4UzfDLZq2AACBuwBeGN8160.png
  安装nagios客户端服务
  # yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
http://s3.运维网.com/wyfs02/M02/80/1C/wKioL1c4VC2BfisqAABqv8UMH_A416.png
  编辑配置文件
  # vim /etc/nagios/nrpe.cfg
  找到“allowed_hosts=127.0.0.1” 改为 “allowed_hosts=192.168.1.201”
  allowed_hosts=192.168.1.201定义服务器主机
  找到” dont_blame_nrpe=0” 改为“dont_blame_nrpe=1”
  dont_blame_nrpe=1
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4U1nz60x6AABOOhq4fck511.png
  启动服务
  # /etc/init.d/nrpe start
http://s4.运维网.com/wyfs02/M01/80/1F/wKiom1c4U5miOFUYAAAbt-roAc0752.png
  3. 监控中心(192.168.1.201)添加被监控主机(192.168.1.202)
  编辑被监控主机配置文件
  # cd /etc/nagios/conf.d/
  # vim 192.168.1.202.cfg
  define host{
  use                     linux-server
  host_name         192.168.1.202
  alias                     1.202
  address               192.168.1.202
  }
  define service{
  use                     generic-service
  host_name               192.168.1.202
  service_description   check_ping
  check_command         check_ping!100.0,20%!200.0,50%
  max_check_attempts 5
  normal_check_interval 1
  }
  define service{
  use                     generic-service
  host_name               192.168.1.202
  service_description   check_ssh
  check_command         check_ssh
  max_check_attempts      5
  normal_check_interval    1
  notification_interval         60
  define service{
  use                     generic-service
  host_name               192.168.1.202
  service_description   check_http
  check_command         check_http
  max_check_attempts      5
  normal_check_interval    1
  }
  max_check_attempts      5    ;当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警
  normal_check_interval    1   ;重新检测的时间间隔,单位是分钟,默认是3分钟
  notification_interval      60;在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。
http://s2.运维网.com/wyfs02/M01/80/1C/wKioL1c4VIqDYEJAAADCC19tEv4188.png
  检测配置文件:
  # nagios -v /etc/nagios/nagios.cfg
http://s1.运维网.com/wyfs02/M02/80/1F/wKiom1c4U6_RCEO1AAC0WxmG9eE169.png
http://s3.运维网.com/wyfs02/M02/80/1C/wKioL1c4VKGAOEgXAABSFJ4kXzI394.png
  重启服务:
http://s1.运维网.com/wyfs02/M00/80/1F/wKiom1c4U8ezLZ5TAAAhtBpJq20809.png
  去web查看一下监控情况
http://s1.运维网.com/wyfs02/M02/80/1F/wKiom1c4U9LBIS_KAAE0uV_6biM467.png
http://s5.运维网.com/wyfs02/M02/80/1C/wKioL1c4VPuRUi40AAHah2fZSuo493.png
  4--监控客户端硬盘,内存情况
  #由于需要nagios调用的监控命令都需要在command.cfg模块中定义 而前面的check_nrpe在默认的command.cfg中时没有的
  这里需要在command.cfg中将其加入进去 现在去服务器端编辑/objects/commands.cfg
  # vim /etc/nagios/objects/commands.cfg
  define command{
  command_name    check_nrpe
  command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
  }
  定义check_nrpe编辑文件添加下面内容:
http://s2.运维网.com/wyfs02/M00/80/1C/wKioL1c4VQmBP-PxAAAQfXHYRkg371.png
http://s2.运维网.com/wyfs02/M00/80/1F/wKiom1c4VC3SN8MRAAAkZRrD7IA037.png
  在服务器端配置被监控端的配置文件:
  # cd /etc/nagios/conf.d/
  # vim 192.168.1.202.cfg
  define service{
  use   generic-service
  host_name       192.168.1.88
  service_description   check_load
  check_command         check_nrpe!check_load
  max_check_attempts 5
  normal_check_interval 1
  }
  define service{
  use   generic-service
  host_name       192.168.1.88
  service_description   check_disk_hda1
  check_command         check_nrpe!check_hda1
  max_check_attempts 5
  normal_check_interval 1
  }
http://s3.运维网.com/wyfs02/M00/80/1C/wKioL1c4VR-zZmR7AACgp_Gdka4924.png
  客户端查看check_load,check_hda1服务
  # df -h
http://s2.运维网.com/wyfs02/M01/80/1F/wKiom1c4VEfR3Uu0AAA1lKOsWIA051.png
  # vi /etc/nagios/nrpe.cfg
http://s5.运维网.com/wyfs02/M01/80/1C/wKioL1c4VTnTQTx_AABcgiZ-o1Y918.png
  查看一下已经监控到了 ok
http://s5.运维网.com/wyfs02/M02/80/1F/wKiom1c4VF6xQbZ5AACfjDCeMzw666.png

页: [1]
查看完整版本: yum安装配置nagios-wqh