13916729435 发表于 2019-1-14 08:20:57

用Nagios监控Dell服务器硬件状况

  ell有一套监控硬件的软件,Linux/windows都可以监控。
  官方网址:http://linux.dell.com/repo/hardware/
  安装方法(centos linux 5.7 x64):
  被监控服务器:
  1) 增加dell的yum库
  wget -q -O - http://linux.dell.com/repo/hardware/OMSA_6.5.2/bootstrap.cgi | bash
  2) 安装srvadmin
  Installing OpenManage Server Administrator
  yum install srvadmin-all
  3)安装firmware-tools,这个也可以不装,升级bios这类的用的。
  Installing firmware-tools to manage BIOS and firmware updates
  yum install dell_ft_install
  4) 启动srvadmin:
  /opt/dell/srvadmin/sbin/srvadmin-services.sh start
  可以把上面的命令加入/etc/rc.local内开机启动。
  5) 重启snmpd(假定您已经配置好了snmpd):
  service snmpd restart
  监控端:
  1)安装perl的库:
  yum install perl-Net-SNMP perl-Config-Tiny perl-Crypt-Rijndael
  2) 安装nagios插件openmanage(需先配置好nagios server):
  wget http://folk.uio.no/trondham/software/files/nagios-plugins-openmanage-3.7.3-1.el5.x86_64.rpm
  3) 修改配置文件:
  vim /etc/nagios/objects/commands.cfg
  define command {
  command_name    check_openmanage
  command_line    /usr/lib64/nagios/plugins/check_openmanage -H $HOSTADDRESS$
  }
  vim /etc/nagios/objects/hosts.cfg
  define service{
  use                           generic-service         ; Name of service template to use
  hostgroup_name                  all_servers
  service_description             Dell OMSA
  check_command                   check_openmanage
  normal_check_interval         10
  }
  4) 重启nagios

  service nagios>  完成。
  也可以手工用脚本调试:
  # /usr/lib64/nagios/plugins/check_openmanage -H 192.168.2.4
  OK - System: 'PowerEdge R510 II', SN: 'XXXXXXX', 48 GB ram (6 dimms), 2 logical drives, 8 physical drives
  如果报错:
  SNMP CRITICAL: No response from remote host '10.1.2.3'
  或:
  ERROR: (SNMP) OpenManage is not installed or is not working correctly
  首先确认/etc/snmpd.conf内是否有以下这行:
  # Allow Systems Management Data Engine SNMP to connect to snmpd using SMUX
  smuxpeer .1.3.6.1.4.1.674.10892.1
  一般安装srvadmin的时候会自动加上的,如果没找到手工加上。
  再检查被监控端的服务器上是否有启动snmpd和srvadmin,没有的话启动起来:
  service snmpd restart
  /opt/dell/srvadmin/sbin/srvadmin-services.sh restart
  参考:http://folk.uio.no/trondham/software/check_openmanage.html

页: [1]
查看完整版本: 用Nagios监控Dell服务器硬件状况