jxp2002 发表于 2017-12-22 21:12:54

Nginx平滑升级源码分析

  一、平滑升级步骤
  1、重命名之前的sbin/nginx文件,将新的nginx文件放到sbin/目录下
  #mv ./sbin/nginx ./sbin/nginx.old
  #cp ~/nginx ./sbin/
  2、向正在运行的nginx发送USR2信号启动新的nginx,这个时候新老nginx都会接收请求,看那一个进程能抢到锁,抢到锁的worker进程可以accpet新请求
  #kill -USR2`cat nginx.pid`
  3、观察新的nginx运行无误后,向旧nginx发信号 停止旧nginx的运行
  #kill -QUIT `cat nginx.pid.oldbin`
  二、源码分析
  1,nginx启动时 设置信号监听函数,监听信号
  src/core/nginx.c

  368行 ngx_init_signals函数 设置要监听的信号,和信号的处理函数
  src/core/nginx.c

  291-293行 信号为sig->signo,对应的处理函数为sig->handler
  sig的定义如下
  
  QUIT和USR2的信号处理函数都为 ngx_signal_handler
  对应的流程图为

  2、master进程通过sigsuspend挂起在信号监听处

  3,向master进程id发送USR2信号
  ngx_signal_handler处理USR2信号
  src/os/unix/ngx_process.c

  372行设置了ngx_change_binary=1
  master进程接收到信号,从挂起状态恢复,继续执行
  src/os/unix/ngx_process.c

  277行 ngx_exec_new_binary通过fork启动新的nginx bin文件
  src/core/nginx.c

  589行 ngx_set_evviroment 设置新nginx bin的环境变量
  640行 ngx_rename_file 通过rename函数将nginx.pid文件重命名为nginx.pid.oldbin
  651行 ngx_execute 启动新的bin文件
  由于nginx老master进程fork出的新nginxmaster进程,他们可以监听同一个端口,所以新nginx和老nginx可以同时监听端口,具体谁执行看哪一个worker子进程抢到了锁,可以accpet新连接
  src/os/unix/ngx_process.c

  src/os/unix/ngx_process.c

  src/os/unix/ngx_process.c
  对应的流程图如下

  4、向老的nginx进程发送QUIT信号,从容关闭
  master进程收到QUIT信号后,将ngx_quit置为1

  master进程接收到信号,从挂起状态恢复,继续执行

  209行 ngx_signal_worket_processes 向worker进程发送 NGX_SHUTDOWN_SIGNAL(QUIT)信号
  215行 ngx_close_socket 主进程关闭监听的socket
  src/os/unix/ngx_process_cycle.c

  504行 通过kill函数向所有worker进程发送信号
  5、worker进程收到NGX_SHUTDOWN_SIGNAL(QUIT)信号
  src/os/unix/ngx_process.c

  360行 worker进程将ngx_quit置为1

  worker进程收到信号后从epoll_wait中唤醒从ngx_process_events_and_timers函数中恢复,
  710-714行 发现ngx_quit=1后将ngx_quit恢复为0,ngx_exiting置为1,
  713行 通过ngx_close_listening_sockets关闭处理的socket
  609行 下一次循环发现ngx_exiting=1后,处理队列中的已有事件和超时事件,发现没有要处理的事件了,就通过ngx_worker_process_exit退出worker进程
  src/os/unix/ngx_process_cycle.c

  1024行 调用各个模块的exit_process方法
  1067行 销毁内存池
  对应的流程图如下

  6、子进程退出后,作为父进程的master进程会收到SIGCHLD信号
  src/os/unix/ngx_process.c

  387行 父进程收到SIGCHLD后将ngx_reap置为1,
  437行 发现信号是SIGCHLD后执行ngx_process_get_status函数判断worker子进程是正常退出,还是异常退出
  src/os/unix/ngx_process.c

  494-499行 如果发现worker子进程如果是正常退出的,会将exited置为1
  master进程接收到信号,从挂起状态恢复,继续执行

  176行 发现ngx_reap=1后,ngx_reap_children函数判断是否需要重启worker进程
  如果worker是因为收到了quit信号正常退出的,所有worker进程退出时,live=0
  183行 live=0 并且收到了ngx_quit信号通过ngx_master_process_exit关闭master进程
  src/os/unix/ngx_process_cycle.c

  619 如果worker至今才是因为意外退出的,并且可以重启,则调用ngx_spawn_process重新启动一个worker子进程
  642 如果有worker进程还在运行则live=1 如果全部的worker子进程都已经退出则live=0
  src/os/unix/ngx_process_cycle.c

  656行 ngx_delete_pidfile 删除pid文件
  666行 ngx_close_listening_sockets 关闭监听端口
  685行 销毁内存池
  686行 退出
  对应的流程图如下
页: [1]
查看完整版本: Nginx平滑升级源码分析