zhouandtao 发表于 2018-12-8 14:54:05

check_mk自定义监控插件监控IIS站点的性能计数器

  场景:Web站点部分是IIS下的站点,IIS不像apache,nginx提供了status模块,可以直接通过web或nagios监控到站点的当前连接数等情况。
  监控服务器是CentOS 6.3+Cacti+Nagios+check_mk 。以下简称监控服务器

  所有的Windows服务器用check_mk-agent监控。以下简称监控客户端

  任务:打算利用check_mk-agent的插件来监控IIS的性能数据
  

  Windows 客户端监控插件:
  由于check_mk_agent支持bat.vbs,exe的客户端插件,

  最初打算用wmic实现。
  C:\Program Files\check_mk\plugins\下创建w3svc_perf.bat 内容为:
@echo off
echo ^
wmic path Win32_PerfRawData_W3SVC_WebService get Name,currentanonymoususers,currentconnections,currentISAPIExtensionrequests /format:csv  这里只取当前连接数,当前匿名用户数,当前ISAPI请求数。
  保存后重启check_mk_agent服务。
  在监控服务器上执行cmk -d 监控客户端IP
  得到如下内容
...........
...........
...........
[`System`]
[`Windows PowerShell`]

_Total,16,605,16
xxx.xxx.com,0,10,0
xxx.xxx.com,4,88,4
xxx.xxx.com,12,507,12
awstats,0,0,0



1388575521  但是执行多次发现 有的时候 下有一个空行,有的时候没有。不知道问题在哪里
  不晓得哪个给解释一下。逐放弃wmic bat插件 改用wmi
  C:\Program Files\check_mk\plugins\下创建w3svc_perf.vbs内容如下:
  
' w3svc_perf.vbs
On Error Resume Next
Dim objWMIService, objItem, colItems, strComputer
Dim WshNetwork : Set WshNetwork = CreateObject("WScript.Network")
Dim Hostname : HostName = WshNetwork.ComputerName
strComputer = "."
Wscript.Echo ""
Set objWMIService = GetObject("winmgmts:\\" & strComputer & "\root\CIMV2")
Set colItems = objWMIService.ExecQuery("select name,CurrentAnonymousUsers,CurrentConnections,CurrentISAPIExtensionRequests from Win32_PerfRawData_W3SVC_WebService",,48)
For Each objItem in colItems
Wscript.Echo objItem.Name & "," & objItem.CurrentAnonymousUsers & "," & objItem.CurrentConnections & "," & objItem.CurrentISAPIExtensionRequests
Next
WSCript.Quit  

  
  
  在监控服务器上执行cmk -d 监控客户端IP
  得到正常结果,反复执行后下无空行
  在监控服务器/usr/share/check_mk/checks下创建w3svc_perf,内容为:
  
#!/usr/bin/python
# -*- encoding: utf-8; py-indent-offset: 4 -*-
#创建库存函数
def inventory_w3svc_perf(checkname,info):
inventory = []
print info:
return inventory
#创建监控check函数
def check_w3svc_perf(item, params, info):
return (0,"test ok")
#创建check类型(在check_info字典中添加新的check库存,check函数以及是否出性能图)
check_info['w3svc_perf'] = (check_w3svc_perf, "w3svc%s", 1, inventory_w3svc_perf)  

  cmk -L |grep w3svc_perf
  
w3svc_perf            tcp      yes    yes    w3svc%s  可以看到已经添加新的check类型了。
  根据print info断代码的返回,可以看出,客户端插件返回的

_Total,16,605,16
xxx.xxx.com,0,10,0
xxx.xxx.com,4,88,4
xxx.xxx.com,12,507,12
awstats,0,0,0  部分内容 被作为参数info传递到服务端的监控插件的库存以及check函数中。且为一个列表返回。用cmk --checks=w3svc_perf -I 监控客户端 可以看到上述的print info的返回值
[['_Total,12,667,12'],
['xxx.xxx.com,1,21,1'],
['xxx.xxx.com,0,112,0'],
['xxx.xxx.com,11,534,11'],
['awstats,0,0,0']]  有了这个print的调试结果,既可对返回值进行解析处理了,修改后的监控/usr/share/check_mk/checks/w3svc_perf,内容为:
#!/usr/bin/python
# -*- encoding: utf-8; py-indent-offset: 4 -*-
w3svc_perf_default_values=(2048,1024,2048,2014,1024,512)
def inventory_w3svc_perf(checkname,info):
inventory = []
#测试输出
#   for line in info:
#      temperfdata = " ".join(line).split(",")
#      webname= tempperfdata
#      curuser = int(tempperfdata)
#      curconn = int(tempperfdata)
#      curisapi = int(tempperfdata)
#      print "webname ,%s,curuser,%d,curconn,%d,curisapi,%d"%(webname,curuser,curconn,curisapi)
inventory.append('sessions',w3svc_perf_default_values)
return inventory
def check_w3svc_perf(item, params, info):
curusercri,curuserwrn,curconncri,curconnwrn,curisapicri,curisapiwrn = params
for line in info:
tempperfdata = " ".join(line).split(",")
webname= tempperfdata
curuser = tempperfdata
curconn = tempperfdata
curisapi = tempperfdata
if   int(curuser) > int(curusercri):
infos="Critical -%s:curuser=%d,(Crit) > %d."\
%(webname,int(curuser),int(curusercri))
state=1
elif int(curuser) > int(curuserwrn):
state=2
infos="Warning -%s:curuser=%d,(Warn > %d)."%\
(webname,int(curuser),int(curuserwrn))
elif int(curconn) > int(curconncri):
state=1
infos="Critical -%s:curconn=%d,(Crit > %d)."%\
(webname,int(curconn),int(curconncri))
elif int(curconn) > int(curconnwrn):
state=2
infos="Warning -%s:curconn=%d,(Warn > %d)."%\
(webname,int(curconn),int(curconnwrn))
elif int(curisapi) > int(curisapicri):
state=1
infos="Critical -%s:curisapi=%d,(Crit > %d)."%\
(webname,int(curisapi),int(curisapicri))
elif int(curisapi) > int(curisapiwrn):
state=2
infos="Warning -%s:curisapi=%d,(Warn > %d)."%\
(webname,int(curisapi),int(curisapiwrn))
else:
state=0
infos="OK,webname:%s,curuser:%d,curconn:%d,curisapi:%d"%\
(webname,int(curuser),int(curconn),int(curisapi))
infotext="".join(infos)
return (state,infotext)
check_info['w3svc_perf'] = (check_w3svc_perf, "w3svc%s", 1, inventory_w3svc_perf)  最后执行cmk-I && cmk -U && cmk -O

  在http://serverip/check_mk/中看到
http://blog.运维网.com/e/u/themes/default/images/spacer.gifhttp://s3.运维网.com/wyfs01/M02/4F/67/wKioJlLEAhCjEwYAAAEItTSyM4w871.jpg
  竟然看到的状态是unkow 返回值也不是预想的那种循环遍历所有站点的性能值返回,而是把info列表的第一个值取出返回了。继续调试。。。。。
  烦请写过check_mk插件的兄弟伙给指条明路
  

  checks 做了修改
  

  —————————————20140108————————————————————————-
#!/usr/bin/python
# -*- encoding: utf-8; py-indent-offset: 4 -*-
# the agent info
#
#_Total,8,586,8
#xxxx.xxx.com,0,11,0
#yyyy.xxx.com,0,48,0
#zzzz.xxx.com,8,527,8
#this line not agent return
#webname,curuser,curconn,curisapi
w3svc_perf_default_values=(2048,1024) #警告,严重阙值的默认值,可在main.mk中
#用w3svc_perf_default_values = (1500, 1600)
#修改
def inventory_w3svc_perf(info):
inventory = []
for line in info:
tempperfdata = " ".join(line).split(",")
webname= tempperfdata
curuser = int(tempperfdata)
curconn = int(tempperfdata)
curisapi = int(tempperfdata)
inventory.append(('w3svc:'+webname,w3svc_perf_default_values))   \
#检查入库,用元组入库,直接'w3svc:'+webname,w3svc_perf_default_values\
#入库不得遍历
return inventory #返回库
def check_w3svc_perf(item,params,info):
cri,wrn = params #定义警告和严重的阙值
for line in info:
tempperfdata = " ".join(line).split(",")
webname = tempperfdata
curuser = tempperfdata
curconn = tempperfdata
curisapi = tempperfdata
infos=[] #定义输出内容的空数组
state=0
if int(curuser) > int(wrn) :
if   int(curuser) > int(cri):
state=2
infos.append("Crit!,%s_Curuser=%d >cri[%d]"\
%(webname,int(curuser),cri))
else :
state=1
infos.append("Warn!,%s_Curuser=%d >wrn[%d]"\
%(webname,int(curuser),wrn))
elif int(curconn) > int(wrn) :
if   int(curconn) > int(cri):
state=2
infos.append("Crit!,%s_Curconn=%d >cri[%d]"\
%(webname,int(curconn),cri))
else :
state=1
infos.append("Warn!,%s_Curconn=%d >wrn[%d]"\
%(webname,int(curconn),wrn))
elif int(curisapi) > int(wrn):
if   int(curisapi) > int(cri):
state=2
infos.append("Crit!,%s_Curisapi=%d >cri[%d]"\
%(webname,int(curisapi),cri))
else :
state=1
infos.append("Warn!,%s_Curisapi=%d >wrn[%d]"\
%(webname,int(curisapi),wrn))
else:
state=0
infos.append("OK!!webname=%s,curuser=%d,curconn=%d,curisapi=%d"\
%(webname,int(curuser),int(curconn),int(curisapi)))
infotext="".join(infos)
if infotext.find(item.split(':')) > -1:#判断item是否在输出内容,并切分\
#后输出。
return (state, infotext)
check_info['w3svc_perf'] = (check_w3svc_perf, "%s", 1, inventory_w3svc_perf)  

  效果图
http://s3.运维网.com/wyfs02/M01/11/67/wKiom1LOWOKQ77h2AAF-HcG1Nso655.jpg
  cmk -P create w3svc_perf
  cmk -P pack w3svc_perf
  打包为mkp文件可直接cmk -P install 安装
  



附件:http://down.运维网.com/data/2363964

页: [1]
查看完整版本: check_mk自定义监控插件监控IIS站点的性能计数器