hgjgh 发表于 2019-1-14 06:29:31

Nagios 工作涉及到日常的操作

  由于工作中会有日常的操作,闲暇时间写出来可能对大家有帮助,如果没有帮助,请略过1.Nagios添加、删除监控节点
  2.Nagios服务的添加删除
  3定义报警通知联系人,以及发送报警方式
  4.定义报警邮件的接受方式、
  1.1.Nagios添加、删除监控节点,首先要确定group(WEB页面查询,客户邮件要求),之后,连接机器,进入后sudo su - 切换到管理员,打开指定目录group文件,vi d打开/usr/local/nagios/etc/cfgs/dc/infra.cfg,infra.cfg文件下面你会看到很多define host{} 这是nagios定义监控点和服务的格式,{}之间的内容是根据用户的需求可以调整的,一般情况下按照有的内容定义新的监控点就可以了,我截取了一个host 具体说明下:
  define host{
  use dc-linux-host                  nagios已经定义好的内 容,直接引用

  host_name nagios02.pek.dc          主机名

  alias nagios02.pek.dc            别 名

  address 10.219.*.*                  主机的IP地址

  check_command check-host-alive      nagios定义好的命令,命令的意思是对被监控主机发送ICMP包来监测被监控主机是否存活。

  contact_groups RS_NOC,dc_server   接收报警通知组

  }
  保存退出,check
  Checking for circular paths between hosts...
  Checking for circular host and service dependencies...
  Checking global event handlers...
  Checking obsessive compulsive processor commands...
  Checking misc settings...
  Total Warnings: 0
  Total Errors: 0
  Things look okay - No serious problems were detected during the pre-flight check
  显示errors:0 就OK啦,之后 /etc/init.d/nagios reload 完成添加,可以到web页面下找到你刚才添加的监控主机。
  2.如何添加监控服务
  比如添加DNS tcp53 端口监测、CPU、disk 等等 很多
  与刚才一样 vi 编辑 infra.cfg下 (VI 下复制多行 NYY+P   N=行数 YY=复制p=粘贴)
  define service{
  use                            dc-generlic-srvice,srv-pnp         nagios定义好,直接引用
  host name               nagios01.pek.dc                              主机名
  service_descrption    CPU—per—p1          nagios显示的服务名称
  check_command   check_nrpe+!check_cpu_per_dc!90!95   监测CPU使用率 报警伐值设置为90warning 和95告知联系组 ,伐值是客户需求,可以根据要求更改。
  contact_groups            RS_NOC,dc_server      报警通知组
  }



页: [1]
查看完整版本: Nagios 工作涉及到日常的操作