hongblue 发表于 2018-11-10 13:55:12

记一次nginx 的recv() failed 错误

  L同学又一次把socket连接往错误的端口上连了。
  搬完办公室,D同学说端口有点乱,一台开发机上3个游戏,端口范围不规范,于是就定了下各个游戏的端口区间,负载其中一款游戏的L同学就开始修改端口了。修改完端口后游戏进不去了。
  表现为:

[*]前端一连接就报错
[*]后端接受到了请求并处理了请求
[*]我在输出处打了下log,输出的数据是对的
[*]nginx的error log如下:
[*]recv() failed (104: Connection reset by peer) while reading response header from upstream
[*]当时没有去看php-fpm的log,其实应该先去检查下php-fpm的错误log,后来想起后去看了下,发现php worker进程频繁地挂掉。
  解决办法:

[*]修改php-fpm配置,只起一个worker进程
[*]kill -USR2 php-fpm_master_pid 重启php-fpm
[*]strace -p only_php_worker_pid
  然后发现php worker进程在connect某个端口后就挂掉了,一问L同学这个端口是干嘛的,然后他恍然大悟。原因是没有对redis的pconnect的返回值做判断,然后直接lpush,导致php worker进程直接core掉。
  想起墨菲定律:Anything that cango wrong will go wrong.作为一名技术人员,应该时刻谨记这条定律,不要有侥幸心理。

页: [1]
查看完整版本: 记一次nginx 的recv() failed 错误