爱若晨风 发表于 2019-1-14 07:39:56

【7】nagios从零学习使用

  使用nrpe插件来监控主机,被监控主机安装nagios-plugins、nrpe (需要gcc、openssl-devel、xinetd):
Useradd nagios
Passwd nagios
安装插件 nagios-plugins-1.x
./configure --prefix=/usr/local/nagios
make && make install
更改/usr/local/nagios文件夹的用户所有者
chown -R nagios:nagios /usr/local/nagios  

  一、不带参数的nrpe安装及监控设置
  安装nrpe插件(不带参数的安装方法,不需要设置nrpe.cfg)
./configure
make all
make install-plugin
make install-daemon
make install-daemon-config
make install-xinetd
修改/etc/xinetd.d/nrpe文件
# description: NRPE (Nagios Remote Plugin Executor)
service nrpe
{
flags         = REUSE
socket_type   = stream
port            = 5666
wait            = no
user            = nagios
group         = nagios
server          = /usr/local/nagios/bin/nrpe
server_args   = -c /usr/local/nagios/etc/nrpe.cfg --inetd
log_on_failure+= USERID
disable         = no
only_from       = 127.0.0.1 192.168.198.254
}
在only_from 后增加监控主机的IP地址。
编辑/etc/services 文件,在最后面增加NRPE服务
nrpe            5666/tcp                # nrpe  

  

  

  

  在centreon中添加不带参数check_nrpe检测命令
$USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$http://s3.运维网.com/wyfs02/M02/23/AA/wKiom1M-DRXAJseBAAKp7Neni_Q295.jpg
  

  被监控机/usr/local/nagios/etc/nrpe.cfg文件中已定义好可以用check_nrpe调用的命令:
command=/usr/local/nagios/libexec/check_users -w 5 -c 10
command=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1
command=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command=/usr/local/nagios/libexec/check_procs -w 100 -c 120  

  

  比如要查看被监控主机的进程总数,那么在监控主机上面输入下面命令就可以看到:
# /usr/local/nagios/libexec/check_nrpe -H 192.168.198.144 -c check_total_procs
PROCS OK: 103 processes | procs=103;150;200;0;  

  

  centreon中添加监控主机的进程数,设置如下:
  1、添加主机
  2、添加服务并关联到主机
http://s3.运维网.com/wyfs02/M02/23/AA/wKiom1M-DnzTH5oRAAMqkTLOISY134.jpg
  

http://s3.运维网.com/wyfs02/M01/23/AB/wKioL1M-DlTx0XBnAAJcSD6eqvI997.jpg
  

  显示结果如下:
http://s3.运维网.com/wyfs02/M00/23/AA/wKiom1M-Dn2hWDEPAAOw0af8POw710.jpg
  

  

  

  二、带参数的nrpe安装及监控设置
  nagios-plugin插件安装和上面一样,nrpe编译时加个参数外,别的和上面安装方法一样。
./configure --enable-command-args  

  修改/usr/local/nagios/etc/nrpe.cfg 把dont_blame_nrpe=0改成1
dont_blame_nrpe=1  

  注释非参数的命令
#command=/usr/local/nagios/libexec/check_users -w 5 -c 10
#command=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
#command=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1
#command=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
#command=/usr/local/nagios/libexec/check_procs -w 150 -c 200  

  打开参数命令
command=/usr/local/nagios/libexec/check_users -w $ARG1$ -c $ARG2$
command=/usr/local/nagios/libexec/check_load -w $ARG1$ -c $ARG2$
command=/usr/local/nagios/libexec/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
command=/usr/local/nagios/libexec/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$  

  在监控主机测试效果:
# /usr/local/nagios/libexec/check_nrpe -H 192.168.198.144 -c check_procs -a 100110 S
PROCS OK: 64 processes with STATE = S | procs=64;100;110;0;
# /usr/local/nagios/libexec/check_nrpe -H 192.168.198.144 -c check_load-a 1 2
OK - load average: 0.00, 0.05, 0.12|load1=0.000;1.000;2.000;0; load5=0.050;1.000;2.000;0; load15=0.120;1.000;2.000;0;  

  各个插件的用法都是可以使用./check_xx --help查看帮助
  

  centreon设置带参数的check_nrpe命令,这里添加二个命令,插件有2或3个参数时使用。
  check_nrpe_arg_2
$USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$ $ARG3$  check_nrpe_arg_3
$USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$ $ARG3$ $ARG4$  

http://s3.运维网.com/wyfs02/M02/23/AB/wKiom1M-HZuhuTMRAAJQWKAel2s224.jpg
  

http://s3.运维网.com/wyfs02/M01/23/AC/wKioL1M-HXODozvlAAJjKcQcAdo347.jpg
  

  

  添加服务关联到主机
http://s3.运维网.com/wyfs02/M00/23/AB/wKiom1M-HZyC6K10AALRKBqEXuQ718.jpg
  

  

http://s3.运维网.com/wyfs02/M02/23/AC/wKioL1M-HXShyCbbAAKDZg5UhEE282.jpg
  

  结果如下:
http://s3.运维网.com/wyfs02/M01/23/AB/wKiom1M-HZ2Q07c0AAPPAKtBhws225.jpg
  

  

  

  

  总结:带参数的nrpe非常方便,只需要nagios调整数据即可,不需要在被监控机调整数值。
  

  

  

  

  

  

  

  

  

  

  




页: [1]
查看完整版本: 【7】nagios从零学习使用