gaoke 发表于 2018-11-10 09:21:17

如何利用nginx_upstream_check_module-master对nginx的后端机器进行健康状态检查

  用nginx做前端反向代理,如果后端服务器宕掉的话,nginx是不会把这台realserver踢出upstream的,还会把请求转发到后端的这台realserver上面。所以当某台机器出现问题时,我们会看到nginx的日志会有一段转发失败然后转发正常的日志。这次借助与淘宝技术团队开发的nginx模快nginx_upstream_check_module来检测后方realserver的健康状态,如果后端服务器不可用,则会将其踢出upstream,所有的请求不转发到这台服务器。当期恢复正常时,将其加入upstream。
  相关软件下载
  http://nginx.org/download/nginx-1.7.4.tar.gz
  https://codeload.github.com/yaoweibin/nginx_upstream_check_module/zip/master
  http://www.pcre.org/
  也可以从http://pan.baidu.com/s/1gdxlTQV下载
  所有软件都放在/home/soft
  编译安装
  unzip nginx_upstream_check_module-master.zip
  tar -zvxf nginx-1.7.4.tar.gz
  unzip pcre-8.32.zip
  要先给nginx打nginx_upstream_check_module-master的补丁
  cd /home/soft/nginx-1.7.2
  patch -p1 < /home/soft/nginx_upstream_check_module-master/check_1.7.2+.patch
  ./configure --prefix=/home/www/nginx --user=nobody --group=nobody --with-http_stub_status_module --with-http_ssl_module --with-pcre=/home/soft/pcre-8.32 --with-http_realip_module --add-module=/home/soft/nginx_upstream_check_module-master
  make
  make install
  配置
  upstream mobile-portal{
  server 127.0.0.1:18080;
  server 192.168.2.10:18080;
  check interval=3000 rise=2 fall=5 timeout=1000 type=tcp;
  }
  type可以是http
  interval检测间隔时间,单位为毫秒,rsie请求2次正常的话,标记此realserver的状态为up,fall表示请求5次都失败的情况下,标记此realserver的状态为down,timeout为超时时间,单位为毫秒。
  这里列出 nginx_upstream_check_module 模块所支持的指令意思:
  Syntax: check interval=milliseconds
  Default: 如果没有配置参数,默认值是:interval=30000 fall=5 rise=2 timeout=1000 default_down=true type=tcp
  Context: upstream
  该指令可以打开后端服务器的健康检查功能。
  指令后面的参数意义是:
  - interval:向后端发送的健康检查包的间隔。
  - fall(fall_count): 如果连续失败次数达到fall_count,服务器就被认为是down。
  - rise(rise_count): 如果连续成功次数达到rise_count,服务器就被认为是up。
  - timeout: 后端健康请求的超时时间。
  - default_down: 设定初始时服务器的状态,如果是true,就说明默认是down的,如果是false,就是up的。默认值是true,也就是一开始服务器认为是不可用,要等健康检查包达到一定成功次数以后才会被认为是健康的。
  - type:健康检查包的类型,现在支持以下多种类型
  - tcp:简单的tcp连接,如果连接成功,就说明后端正常。
  - ssl_hello:发送一个初始的SSL hello包并接受服务器的SSL hello包。
  - http:发送HTTP请求,通过后端的回复包的状态来判断后端是否存活。
  - mysql: 向mysql服务器连接,通过接收服务器的greeting包来判断后端是否存活。
  - ajp:向后端发送AJP协议的Cping包,通过接收Cpong包来判断后端是否存活。
  - port: 指定后端服务器的检查端口。你可以指定不同于真实服务的后端服务器的端口,比如后端提供的是443端口的应用,你可以去检查80端口的状态来判断后端健康状况。默认是0,表示跟后端server提供真实服务的端口一样。该选项出现于Tengine-1.4.0。
  在server添加
  {
  location /nstatus {
  check_status;
  access_log off;
  allow 192.168.2.11;
  #deny all;
  }
  }
  以上配置用于该模块的转态查看,整个nginx的配置如下

  转态查看页面
  http://192.168.2.9/nstatus


页: [1]
查看完整版本: 如何利用nginx_upstream_check_module-master对nginx的后端机器进行健康状态检查