wslhs 发表于 2016-12-24 11:39:05

nginx优化 突破十万并发

nginx的安装与基本配置文档网上已经有很多了,但具体讲优化的文章还比较少,偶尔发现有这么一篇《nginx优化 突破十万并发》仔细拜读后,转至此做以收藏,感谢原作的辛苦编写。
一般来说nginx配置文件中对优化比较有作用的为以下几项:
1worker_processes 8;


nginx进程数,建议按照cpu数目来指定,一般为它的倍数。
1worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;



为每个进程分配cpu,上例中将8个进程分配到8个cpu,当然可以写多个,或者将一个进程分配到多个cpu。
1worker_rlimit_nofile 102400;


这个指令是指当一个nginx进程打开的最多文件描述符数目,理论值应该是最多打开文件数(ulimit -n)与nginx进程数相除,但是nginx分配请求并不是那么均匀,所以最好与ulimit -n的值保持一致。
1use epoll;


使用epoll的I/O模型,这个不用说了吧。
1worker_connections 102400;


每个进程允许的最多连接数,理论上每台nginx服务器的最大连接数为worker_processes*worker_connections。
1keepalive_timeout 60;


keepalive超时时间。
1client_header_buffer_size 4k;


客户端请求头部的缓冲区大小,这个可以根据你的系统分页大小来设置,一般一个请求的头部大小不会超过1k,不过由于一般系统分页都要大于1k,所以这里设置为分页大小。分页大小可以用命令getconf PAGESIZE取得。
1open_file_cache max=102400 inactive=20s;


这个将为打开文件指定缓存,默认是没有启用的,max指定缓存数量,建议和打开文件数一致,inactive是指经过多长时间文件没被请求后删除缓存。
1open_file_cache_valid 30s;


这个是指多长时间检查一次缓存的有效信息。
1open_file_cache_min_uses 1;


open_file_cache指令中的inactive参数时间内文件的最少使用次数,如果超过这个数字,文件描述符一直是在缓存中打开的,如上例,如果有一个文件在inactive时间内一次没被使用,它将被移除。
关于内核参数的优化:
 
1net.ipv4.tcp_max_tw_buckets = 6000


timewait的数量,默认是180000。
1net.ipv4.ip_local_port_range = 1024    65000


允许系统打开的端口范围。
1net.ipv4.tcp_tw_recycle = 1


启用timewait快速回收。
1net.ipv4.tcp_tw_reuse = 1


开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接。
1net.ipv4.tcp_syncookies = 1


开启SYN Cookies,当出现SYN等待队列溢出时,启用cookies来处理。
1net.core.somaxconn = 262144


web应用中listen函数的backlog默认会给我们内核参数的net.core.somaxconn限制到128,而nginx定义的NGX_LISTEN_BACKLOG默认为511,所以有必要调整这个值。
1net.core.netdev_max_backlog = 262144


每个网络接口接收数据包的速率比内核处理这些包的速率快时,允许送到队列的数据包的最大数目。
1net.ipv4.tcp_max_orphans = 262144


系统中最多有多少个TCP套接字不被关联到任何一个用户文件句柄上。如果超过这个数字,孤儿连接将即刻被复位并打印出警告信息。这个限制仅仅是为了防止简单的DoS攻击,不能过分依靠它或者人为地减小这个值,更应该增加这个值(如果增加了内存之后)。
1net.ipv4.tcp_max_syn_backlog = 262144


记录的那些尚未收到客户端确认信息的连接请求的最大值。对于有128M内存的系统而言,缺省值是1024,小内存的系统则是128。
1net.ipv4.tcp_timestamps = 0


时间戳可以避免序列号的卷绕。一个1Gbps的链路肯定会遇到以前用过的序列号。时间戳能够让内核接受这种“异常”的数据包。这里需要将其关掉。
1net.ipv4.tcp_synack_retries = 1


为了打开对端的连接,内核需要发送一个SYN并附带一个回应前面一个SYN的ACK。也就是所谓三次握手中的第二次握手。这个设置决定了内核放弃连接之前发送SYN+ACK包的数量。
1net.ipv4.tcp_syn_retries = 1


在内核放弃建立连接之前发送SYN包的数量。
1net.ipv4.tcp_fin_timeout = 1


如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间。对端可以出错并永远不关闭连接,甚至意外当机。缺省值是60秒。 2.2 内核的通常值是180秒,你可以按这个设置,但要记住的是,即使你的机器是一个轻载的WEB服务器,也有因为大量的死套接字而内存溢出的风险,FIN- WAIT-2的危险性比FIN-WAIT-1要小,因为它最多只能吃掉1.5K内存,但是它们的生存期长些。
1net.ipv4.tcp_keepalive_time = 30


当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时。
下面贴一个完整的内核优化设置:
01net.ipv4.ip_forward = 0
02net.ipv4.conf.default.rp_filter = 1
03net.ipv4.conf.default.accept_source_route = 0
04kernel.sysrq = 0
05kernel.core_uses_pid = 1
06net.ipv4.tcp_syncookies = 1
07kernel.msgmnb = 65536
08kernel.msgmax = 65536
09kernel.shmmax = 68719476736
10kernel.shmall = 4294967296
11net.ipv4.tcp_max_tw_buckets = 6000
12net.ipv4.tcp_sack = 1
13net.ipv4.tcp_window_scaling = 1
14net.ipv4.tcp_rmem = 4096        87380   4194304
15net.ipv4.tcp_wmem = 4096        16384   4194304
16net.core.wmem_default = 8388608
17net.core.rmem_default = 8388608
18net.core.rmem_max = 16777216
19net.core.wmem_max = 16777216
20net.core.netdev_max_backlog = 262144
21net.core.somaxconn = 262144
22net.ipv4.tcp_max_orphans = 3276800
23net.ipv4.tcp_max_syn_backlog = 262144
24net.ipv4.tcp_timestamps = 0
25net.ipv4.tcp_synack_retries = 1
26net.ipv4.tcp_syn_retries = 1
27net.ipv4.tcp_tw_recycle = 1
28net.ipv4.tcp_tw_reuse = 1
29net.ipv4.tcp_mem = 94500000 915000000 927000000
30net.ipv4.tcp_fin_timeout = 1
31net.ipv4.tcp_keepalive_time = 30
32net.ipv4.ip_local_port_range = 1024    65000




下面是一个简单的nginx配置文件:
01user  www www;
02worker_processes 8;
03worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000;
04error_log  /www/log/nginx_error.log  crit;
05pid        /usr/local/nginx/nginx.pid;
06worker_rlimit_nofile 204800;
07 
08events
09{
10  use epoll;
11  worker_connections 204800;
12}
13 
14http
15{
16  include       mime.types;
17  default_type  application/octet-stream;
18 
19  charset  utf-8;
20 
21  server_names_hash_bucket_size 128;
22  client_header_buffer_size 2k;
23  large_client_header_buffers 4 4k;
24  client_max_body_size 8m;
25 
26  sendfile on;
27  tcp_nopush     on;
28 
29  keepalive_timeout 60;
30 
31  fastcgi_cache_path /usr/local/nginx/fastcgi_cache levels=1:2
32                keys_zone=TEST:10m
33                inactive=5m;
34  fastcgi_connect_timeout 300;
35  fastcgi_send_timeout 300;
36  fastcgi_read_timeout 300;
37  fastcgi_buffer_size 16k;
38  fastcgi_buffers 16 16k;
39  fastcgi_busy_buffers_size 16k;
40  fastcgi_temp_file_write_size 16k;
41  fastcgi_cache TEST;
42  fastcgi_cache_valid 200 302 1h;
43  fastcgi_cache_valid 301 1d;
44  fastcgi_cache_valid any 1m;
45  fastcgi_cache_min_uses 1;
46  fastcgi_cache_use_stale error timeout invalid_header http_500;
47  
48  open_file_cache max=204800 inactive=20s;
49  open_file_cache_min_uses 1;
50  open_file_cache_valid 30s;
51  
52 
53 
54  tcp_nodelay on;
55  
56  gzip on;
57  gzip_min_length  1k;
58  gzip_buffers     4 16k;
59  gzip_http_version 1.0;
60  gzip_comp_level 2;
61  gzip_types       text/plain application/x-javascript text/css application/xml;
62  gzip_vary on;
63 
64 
65  server
66  {
67    listen       8080;
68    server_name  backup.aiju.com;
69    index index.php index.htm;
70    root  /www/html/;
71 
72    location /status
73    {
74        stub_status on;
75    }
76 
77    location ~ .*\.(php|php5)?$
78    {
79        fastcgi_pass 127.0.0.1:9000;
80        fastcgi_index index.php;
81        include fcgi.conf;
82    }
83 
84    location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|js|css)$
85    {
86      expires      30d;
87    }
88 
89    log_format  access  '$remote_addr - $remote_user [$time_local] "$request" '
90              '$status $body_bytes_sent "$http_referer" '
91              '"$http_user_agent" $http_x_forwarded_for';
92    access_log  /www/log/access.log  access;
93      }
94}


关于FastCGI的几个指令:
1fastcgi_cache_path /usr/local/nginx/fastcgi_cache levels=1:2 keys_zone=TEST:10m inactive=5m;


这个指令为FastCGI缓存指定一个路径,目录结构等级,关键字区域存储时间和非活动删除时间。
1fastcgi_connect_timeout 300;


指定连接到后端FastCGI的超时时间。
1fastcgi_send_timeout 300;


向FastCGI传送请求的超时时间,这个值是指已经完成两次握手后向FastCGI传送请求的超时时间。
1fastcgi_read_timeout 300;


接收FastCGI应答的超时时间,这个值是指已经完成两次握手后接收FastCGI应答的超时时间。
1fastcgi_buffer_size 16k;


指定读取FastCGI应答第一部分需要用多大的缓冲区,这里可以设置为fastcgi_buffers指令指定的缓冲区大小,上面的指令指定它将使用1 个16k的缓冲区去读取应答的第一部分,即应答头,其实这个应答头一般情况下都很小(不会超过1k),但是你如果在fastcgi_buffers指令中 指定了缓冲区的大小,那么它也会分配一个fastcgi_buffers指定的缓冲区大小去缓存。
1fastcgi_buffers 16 16k;


指定本地需要用多少和多大的缓冲区来缓冲FastCGI的应答,如上所示,如果一个php脚本所产生的页面大小为256k,则会为其分配16个16k的缓 冲区来缓存,如果大于256k,增大于256k的部分会缓存到fastcgi_temp指定的路径中,当然这对服务器负载来说是不明智的方案,因为内存中 处理数据速度要快于硬盘,通常这个值的设置应该选择一个你的站点中的php脚本所产生的页面大小的中间值,比如你的站点大部分脚本所产生的页面大小为 256k就可以把这个值设置为16 16k,或者4 64k 或者64 4k,但很显然,后两种并不是好的设置方法,因为如果产生的页面只有32k,如果用4 64k它会分配1个64k的缓冲区去缓存,而如果使用64 4k它会分配8个4k的缓冲区去缓存,而如果使用16 16k则它会分配2个16k去缓存页面,这样看起来似乎更加合理。
1fastcgi_busy_buffers_size 32k;


这个指令我也不知道是做什么用,只知道默认值是fastcgi_buffers的两倍。
1fastcgi_temp_file_write_size 32k;


在写入fastcgi_temp_path时将用多大的数据块,默认值是fastcgi_buffers的两倍。
1fastcgi_cache TEST


开启FastCGI缓存并且为其制定一个名称。个人感觉开启缓存非常有用,可以有效降低CPU负载,并且防止502错误。但是这个缓存会引起很多问题,因为它缓存的是动态页面。具体使用还需根据自己的需求。
1fastcgi_cache_valid 200 302 1h;
2fastcgi_cache_valid 301 1d;
3fastcgi_cache_valid any 1m;


为指定的应答代码指定缓存时间,如上例中将200,302应答缓存一小时,301应答缓存1天,其他为1分钟。
1fastcgi_cache_min_uses 1;


缓存在fastcgi_cache_path指令inactive参数值时间内的最少使用次数,如上例,如果在5分钟内某文件1次也没有被使用,那么这个文件将被移除。
1fastcgi_cache_use_stale error timeout invalid_header http_500;


不知道这个参数的作用,猜想应该是让nginx知道哪些类型的缓存是没用的。
以上为nginx中FastCGI相关参数,另外,FastCGI自身也有一些配置需要进行优化,如果你使用php-fpm来管理FastCGI,可以修改配置文件中的以下值:
1<value name="max_children">60</value>


同时处理的并发请求数,即它将开启最多60个子线程来处理并发连接。
1<value name="rlimit_files">102400</value>


最多打开文件数。
1<value name="max_requests">204800</value>


每个进程在重置之前能够执行的最多请求数。
下面贴几张测试结果图。
静态页面为我在squid配置4W并发那篇文章中提到的测试文件,下图为同时在6台机器运行webbench -c 30000 -t 600 http://www.yanghengfei.com/ 命令后的测试结果:
 


 

使用netstat过滤后的连接数:

php页面在status中的结果(php页面为调用phpinfo):
 


 

php页面在netstat过滤后的连接数:

  
未使用FastCGI缓存之前的服务器负载:
  

  

  

  

  
此时打开php页面已经有些困难,需要进行多次刷新才能打开。上图中cpu0负载偏低是因为测试时将网卡中断请求全部分配到cpu0上,并且在nginx中开启7个进程分别制定到cpu1-7。
使用FastCGI缓存之后:

  

  

  

  

此时可以很轻松的打开php页面。
这个测试并没有连接到任何数据库,所以并没有什么参考价值,不过不知道上述测试是否已经到达极限,根据内存和cpu的使用情况来看似乎没有,但是已经没有 多余的机子来让我运行webbench了。囧,但至少可以说明加载FastCGI缓存之后,还有是些效果的。以图为证嘛。
  
页: [1]
查看完整版本: nginx优化 突破十万并发