noel0217 发表于 2015-9-9 09:46:11

Zabbix的集中式监控

  相对于传统的ZABBIX硬件系统级监控(CPU,内存,硬盘,网卡),应用级的监控就显得有些复杂了。
  如果对不同的应该来不同的应用,配置会很多的。
  如果我们能在一个指定的AGENT上监控所有的APACHE,NGINX,MYSQL,PHP-FPM,TOMCAT之类的话,
  那后期维护就是比较简单的事了。
  且对于MYSQL,WEB这种,可以直接手动建一个AGENT,利用自动发现功能,LOW DISCOVERY,弄好图表和触发器,然后维护相关的配置文件即可。(在ZABBIX SERVER进行类似监控,在压力不大的情况下,也是一个好主意~)
  相关模板和脚本附后。
  http://files.cnblogs.com/files/aguncn/TemplateAppNginx.xml
  http://files.cnblogs.com/files/aguncn/nginx_monitor.sh
  我们的自定义用户参数,可以这样来:



UnsafeUserParameters=1
#mysql
UserParameter=MySQL.BBS,/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.3 -P 3306 -e "show processlist" | wc -l` \- 1
UserParameter=MySQL.WWW,/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.2 -P 3306 -e "show processlist" | wc -l` \- 1
UserParameter=MySQL.WEND,/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.1 -P 3306 -e "show processlist" | wc -l` \- 1
UserParameter=MySQL.JIJ/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.4 -P 3306 -e "show processlist" | wc -l` \- 1
#http
UserParameter=web.site.discovery,/etc/zabbix/alertscripts/web_site_code_status web_site_discovery
UserParameter=web.site.code
[*],/etc/zabbix/alertscripts/web_site_code_status web_site_code $1
#nginx
UserParameter=nginxSiteDiscovery,/etc/zabbix/alertscripts/nginx_monitor.sh nginxSiteDiscovery
UserParameter=getNginxStatus
[*],/etc/zabbix/alertscripts/nginx_monitor.sh getNginxStatus "$1" "$2"
#php-fpm
UserParameter=php.site.discovery,/etc/zabbix/alertscripts/php-fpm-status php_site_discovery
UserParameter=php.site.code
[*],/etc/zabbix/alertscripts/php-fpm-status php_site_code "$1" "$2"
UserParameter=PhpSiteDiscovery,/etc/zabbix/alertscripts/php_monitor.sh PhpSiteDiscovery
UserParameter=getPhpStatus
[*],/etc/zabbix/alertscripts/php_monitor.sh getPhpStatus "$1" "$2"
  
  ======================
  转一篇可以用这种方式扩展的东东。感谢这个聪明的朋友:)
  http://qicheng0211.blog.iyunv.com/3958621/1557695
  
  
  ==========================
  
  “nginx统一监控”意思是在一台Linux服务器上集中监控所有nginx站点的status状态。我们把这个服务器叫做“nginx监控服务器”,可以是装有zabbix agent的zabbix server,或是其他装agent的被监控客户端。
  思路:把所有nginx站点的URL写入到“nginx监控服务器”上的一个配置文件中。增加或删除nginx监控站点只需要修改这个配置文件,利用zabbix的low-level discovery动态监控这些站点。“nginx监控服务器”的zabbix-agent调用nginx监控脚本,获取nginx_status后,利用zabbix-sender把监控数据发送到zabbix服务器端。
  配置步骤如下:
  一、在被监控nginx站点上配置stub_status模块
  开启stub_status模块监控,在server块中加入location就行了。
  假设“nginx监控服务器”的IP地址为192.168.0.1,配置如下:










1

2

3

4

5

6

7

8





    location /nginx_status{

      stub_status on;

      access_log off;

      allow 127.0.0.1;

      # 要允许“nginx监控服务器”访问nginx status

      allow 192.168.0.1;

      deny all;

    }



  重启nginx,然后请求http://domain/nginx_status 就行了,下面是结果:










1

2

3

4





Active connections: 1

server accepts handled requests

16672 16672 16769

Reading: 0 Writing: 1 Waiting: 0



  二、在nginx监控服务器上配置监控脚本
  首先,在nginx监控服务器上安装好zabbix-agent和zabbix-sender,推荐yum安装。
  注意:设置zabbix_agentd.conf里Timeout=30。减少因脚本执行超时,agent获取不到数据的情况。
  然后,建立脚本文件的目录/etc/zabbix/monitor_scripts。










1





shell# mkdir -p /etc/zabbix/monitor_scripts



  把监控脚本nginx_monitor.sh放到/etc/zabbix/monitor_scripts目录下。
  nginx_monitor.sh脚本内容如下,需要修改AGENT_CONF变量的值:










1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89





#!/bin/bash

#

# Filename:    nginx_monitor.sh

# Revision:    1.0

# Date:      2014/09/24

# Author:      Qicheng

# Email:

# Website:   http://qicheng0211.blog.iyunv.com

# Description: nginx统一监控脚本

# Notes:      

#



# 修改AGENT_CONF的值为本地zabbix agent的配置文件路径

AGENT_CONF="/etc/zabbix/zabbix_agentd.conf "

# nginx站点的配置文件路径

NGINX_SITE_CONF="/etc/zabbix/monitor_scripts/nginx_site.conf"

# zabbix_sender的路径

ZBX_SENDER="/usr/bin/zabbix_sender"



FUNCTION=$1

HOST_NAME=$2

NGINX_SITE=$3

CURL="/usr/bin/curl"

TIMEOUT=30



# nginx site low-level discovery

function nginxSiteDiscovery()

{

    nginx_site=($(grep '^[^#]' ${NGINX_SITE_CONF}))

    max_index=$[${#nginx_site[@]}-1]

    printf '{\n'

    printf '\t"data":['

    for key in `seq -s' ' 0 $max_index`

    do

      printf '\n\t\t{'

      printf "\"{#NGINX_SITE}\":\"${nginx_site[${key}]}\"}"

      if [ $key -ne $max_index ];then

            printf ","

      fi

    done

    printf '\n\t]\n'

    printf '}\n'

}



# 获取nginx status,把数据发送到zabbix server

function getNginxStatus()

{

    nginx_status_url="${NGINX_SITE}/nginx_status"

    # 获取nginx_status后,保存到下面的文件里

    nginx_status_file="/tmp/nginx_status_$(echo ${NGINX_SITE} | sed 's#^http.*://##; s#/#_#g').log"

    :>"$nginx_status_file"



    # curl获取nginx_status

    ${CURL} -s --connect-timeout ${TIMEOUT} "$nginx_status_url" 2>&1 | tee "$nginx_status_file"

    line_num=$(cat "$nginx_status_file" | wc -l)

    # 判断是否正确获取nginx_status

    [ $line_num -ne 4 ] && { echo "ERROR: $nginx_status_file is not correct."; exit 1;}



    active=$(cat "$nginx_status_file" | grep 'Active' | awk '{print $NF}')

    reading=$(cat "$nginx_status_file" | grep 'Reading' | awk '{print $2}')

    writing=$(cat "$nginx_status_file" | grep 'Writing' | awk '{print $4}')

    waiting=$(cat "$nginx_status_file" | grep 'Waiting' | awk '{print $6}')

    accepts=$(cat "$nginx_status_file" | awk NR==3 | awk '{print $1}')

    handled=$(cat "$nginx_status_file" | awk NR==3 | awk '{print $2}')

    requests=$(cat "$nginx_status_file" | awk NR==3 | awk '{print $3}')

    echo "Sending the data to zabbix server..."

    # 将特定格式的数据发送到zabbix server,每行的格式为:<hostname> <key> <value>

    cat << EOF | ${ZBX_SENDER} -c ${AGENT_CONF} -i -

"${HOST_NAME}" "nginx_status[$NGINX_SITE,active]" "${active}"

"${HOST_NAME}" "nginx_status[$NGINX_SITE,reading]" "${reading}"

"${HOST_NAME}" "nginx_status[$NGINX_SITE,writing]" "${writing}"

"${HOST_NAME}" "nginx_status[$NGINX_SITE,waiting]" "${waiting}"

"${HOST_NAME}" "nginx_status[$NGINX_SITE,accepts]" "${accepts}"

"${HOST_NAME}" "nginx_status[$NGINX_SITE,handled]" "${handled}"

"${HOST_NAME}" "nginx_status[$NGINX_SITE,requests]" "${requests}"

EOF

}



[ $# -eq 0 ] && { echo "ERROR: The script needs at least one parameter."; exit 1;}



case $FUNCTION in

    nginxSiteDiscovery|getNginxStatus)

      $FUNCTION

      ;;

    *)

      echo "ERROR: Bad parameters."

      exit 1

      ;;

esac



  创建nginx站点配置文件nginx_site.conf:










1

2





shell# touch /etc/zabbix/monitor_scripts/nginx_site.conf

shell# chown -R zabbix:zabbix /etc/zabbix/monitor_scripts



  把所有被监控nginx站点的URL写入到nginx_site.conf文件中,每一行一个URL,如下图:

  在zabbix_agentd.conf最后面添加自定义参数:










1

2





UserParameter=nginxSiteDiscovery,bash /etc/zabbix/monitor_scripts/nginx_monitor.sh nginxSiteDiscovery

UserParameter=getNginxStatus
[*],bash /etc/zabbix/monitor_scripts/nginx_monitor.sh getNginxStatus "$1" "$2"



  最后重启zabbix agent。
  在zabbix server端执行zabbix_get命令测试:

  如上图所示,说明环境部署好了。
  三、zabbix WEB端
  1、导入模板
  导入"Template App Nginx.xml"模板,附件有下载。

  模板的Item prototypes如下:
  “get nginx status of {#NGINX_SITE}”监控项是Zabbix agent类型,用于调用脚本获取nginx_status。其他item是Zabbix trapper类型,用于接收zabbix-sender发来的nginx_status。
  模板配置了触发器,如果获取不到nginx_status则发出告警。
      2、创建nginx监控主机并链接模板
  “nginx监控主机”的配置中要填写Agent interfaces,并链接模板Template App Nginx。
  
      3、数据展示

  

  本文出自 “启程的Linux博客” 博客,请务必保留此出处http://qicheng0211.blog.iyunv.com/3958621/1557695
  
  
页: [1]
查看完整版本: Zabbix的集中式监控