qazxsw1 发表于 2019-1-13 15:22:48

nagios监控 报警异常状况 二

  遇到一个奇葩问题,nagios监控windows下面的cpu服务项出现如下警告信息:(但是其他服务项状态Ok,且此警告信息过一会 自动会恢复Ok状态 再过一段时间 又会变成如下图中的警告信息状态warning)
http://s3.运维网.com/wyfs02/M00/47/1E/wKioL1P26aaBsBkPAAFxRhd8r2w723.jpghttp://s3.运维网.com/wyfs02/M01/47/1E/wKioL1P26cbhlaPYAACBHT2zHWI873.jpg
  解决思路:
  第一 : 排查造成此情况的原因:

[*]  Nsclient++版本原因( 经排查同样版本的服务器CPU监控项没出现此问题故排除)
[*]  Nsclient++服务重启( 经观察 不是此处故障)
[*]  更换CPU监控方式: ( 由 check_nt命令检测改为snmp检测。最终解决此问题)
  第一步: 编写snmp方式监控CPU的脚本并放在如下目录:
http://s3.运维网.com/wyfs02/M00/47/1E/wKioL1P266jD3C8_AARMNLo5luk988.jpg第二步 :在command.conf文件中进行定义:
http://s3.运维网.com/wyfs02/M01/47/1E/wKioL1P268rQhpJaAADFUED1URA804.jpg

  第三步: 定义服务监控项:
http://s3.运维网.com/wyfs02/M00/47/1E/wKioL1P26_GRQfHEAAH-D6p8Lbo846.jpg
[*]  配置好以上步骤,重启nagios服务器即可。
  遇到nagios报警如下图所示现象:

  http://s3.运维网.com/wyfs02/M01/47/1E/wKioL1P27GOiobzUAAFAJMO2U3s182.jpg
  分析: 可能是/var/empty/sshd目录权限问题

  如果可以ssh登录服务器,那么在服务器上执行如下命令查看/var/empty/sshd目录权限是否为744
  如果不是的话更改为744即可。
  http://s3.运维网.com/wyfs02/M02/47/1E/wKioL1P27S_ihy2qAABUUTkNH-0994.jpg



页: [1]
查看完整版本: nagios监控 报警异常状况 二