2017年7月5日 星期三

Nginx+PHP-FPM+socket 配置優化

1.nginx + php-fpm,連線數一多會發生,502 Bad Gateway 或 504 Gateway Time-out 等問題。
502 Bad Gateway:nginx 連不到 php-fpm。可以增加 php-fpm 連線數量。
或將 nginx 連 php-fpm 等待連接的時間設長一點(fastcgi_connect_timeout)。
504 Gateway Time-out:php-fpm 執行時間,超過 nginx 允許的接收時間。
可以將 nginx 接收時間設長一點(fastcgi_read_timeout)。
影響連線數限制的設定有三個:linux 系統的限制、nginx 的限制、php-fpm 的限制。
修改時,須視執行情況調整,若設的太大,系統負擔太大,會執行的很慢,甚至崩潰。

主要是4個文件設定


修改 Linux 作業系統設定


$ /etc/sysctl.conf

net.ipv4.tcp_syncookies = 1
開啟 SYN Cookies,當出現 SYN 等待隊列溢出時,啟用 cookies 來處理。
net.ipv4.tcp_max_tw_buckets = 6000
timewait 的數量,默認是 180000。
net.core.netdev_max_backlog = 819200
每個網絡接口接收數據包的速率比內核處理這些包的速率快時,允許送到隊列的數據包的最大數目。 不能低于
$  /etc/nginx/sites-available/default
isten 80 default_server backlog=1024;
$ /etc/php/7.0/fpm/pool.d/www.conf
listen.backlog = 2048
net.core.somaxconn = 65535
web 應用中 listen 函數的 backlog 默認會給我們內核參數的 net.core.somaxconn 限製到 128,而 nginx 定義的 NGX_LISTEN_BACKLOG 默認為 511,所以有必要調整這個值。
net.ipv4.tcp_max_orphans = 3276800
系統中最多有多少個 TCP 套接字不被關聯到任何一個用戶文件句柄上。如果超過這個數字,孤兒連接將即刻被復位並打 印出警告信息。這個限制僅僅是為了防止簡單的 DoS 攻擊,不能過分依靠它或者人為地減小這個值,更應該增加這個值 (如果增加了內存之後)。
net.ipv4.tcp_max_syn_backlog = 819200
記錄的那些尚未收到客戶端確認信息的連接請求的最大值。對於有 128M 內存的系統而言,缺省值是 1024,小內存的系 統則是 128。 #不能低于
$  /etc/nginx/sites-available/default
isten 80 default_server backlog=1024;
$ /etc/php/7.0/fpm/pool.d/www.conf
listen.backlog = 2048
net.ipv4.tcp_timestamps = 0
時間戳可以避免序列號的捲繞。一個 1Gbps 的鏈路肯定會遇到以前用過的序列號。時間戳能夠讓內核接受這種“異常”的 數據包。這裡需要將其關掉。
net.ipv4.tcp_synack_retries = 1
為了打開對端的連接,內核需要發送一個 SYN 並附帶一個回應前面一個 SYN 的 ACK。也就是所謂三次握手中的第二次 握手。這個設置決定了內核放棄連接之前發送 SYN+ACK 包的數量。
net.ipv4.tcp_syn_retries = 1
在內核放棄建立連接之前發送 SYN 包的數量。
net.ipv4.tcp_tw_recycle = 1
啟用 timewait 快速回收。
net.ipv4.tcp_tw_reuse = 1
開啟重用。允許將 TIME-WAIT sockets 重新用於新的 TCP 連接。
net.ipv4.tcp_fin_timeout = 1
如果套接字由本端要求關閉,這個參數決定了它保持在 FIN-WAIT-2 狀態的時間。對端可以出錯並永遠不關閉連接,甚 至意外當機。缺省值是 60 秒。2.2 內核的通常值是 180 秒,你可以按這個設置,但要記住的是,即使你的機器是一個輕 載的 WEB 服務器,也有因為大量的死套接字而內存溢出的風險,FIN- WAIT-2 的危險性比 FIN-WAIT-1 要小,因為它最 多只能吃掉 1.5K 內存,但是它們的生存期長些。
net.ipv4.tcp_keepalive_time = 30
當 keepalive 起用的時候,TCP 發送 keepalive 消息的頻度。缺省是 2 小時。
net.ipv4.ip_local_port_range = 1024 65000
允許系統打開的端口範圍。

#不重開機,立即套用設定
$ sysctl -p

完整的優化設置範例:
net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.shmmax = 68719476736
kernel.shmall = 4294967296
net.ipv4.tcp_max_tw_buckets = 6000
net.ipv4.tcp_sack = 1
net.ipv4.tcp_window_scaling = 1
net.ipv4.tcp_rmem = 4096 87380 4194304
net.ipv4.tcp_wmem = 4096 16384 4194304
net.core.wmem_default = 8388608
net.core.rmem_default = 8388608
net.core.rmem_max = 16777216
net.core.wmem_max = 16777216
net.core.netdev_max_backlog = 819200
net.core.somaxconn = 65535
net.ipv4.tcp_max_orphans = 3276800
net.ipv4.tcp_max_syn_backlog = 819200
net.ipv4.tcp_timestamps = 0
net.ipv4.tcp_synack_retries = 1
net.ipv4.tcp_syn_retries = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_mem = 94500000 915000000 927000000
net.ipv4.tcp_fin_timeout = 1
net.ipv4.tcp_keepalive_time = 30
net.ipv4.ip_local_port_range = 1024 65000
fs.file-max = 8192

nginx 優化

$ /etc/nginx/nginx.conf

worker_processes 8;
nginx 進程數,建議按照 cpu 數目來指定,一般為它的倍數。
worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;
為每個進程分配 cpu,上例中將 8 個進程分配到 8 個 cpu,當然可以寫多個,或者將一個進程分配到多個 cpu。
worker_rlimit_nofile 204800;
這個指令是指當一個 nginx 進程打開的最多文件描述符數目,理論值應該是最多打開文件數(ulimit -n)與 nginx 進程數 相除,但是 nginx 分配請求並不是那麼均勻,所以最好與 ulimit -n 的值保持一致。
use epoll;
使用 epoll 的 I/O 模型,這個不用說了吧。
worker_connections 204800;
每個進程允許的最多連接數,理論上每台 nginx 服務器的最大連接數為 worker_processes*worker_connections。
keepalive_timeout 60;
keepalive 超時時間。
client_header_buffer_size 4k;
客戶端請求頭部的緩衝區大小,這個可以根據你的系統分頁大小來設置,一般一個請求的頭部大小不會超過 1k,不過由
於一般系統分頁都要大於 1k,所以這裡設置為分頁大小。分頁大小可以用命令 getconf PAGESIZE 取得。
open_file_cache max=102400 inactive=20s;
這個將為打開文件指定緩存,默認是沒有啟用的,max 指定緩存數量,建議和打開文件數一致,inactive 是指經過多長時
間文件沒被請求後刪除緩存。
open_file_cache_valid 30s;
這個是指多長時間檢查一次緩存的有效信息。
open_file_cache_min_uses 1;
open_file_cache 指令中的 inactive 參數時間內文件的最少使用次數,如果超過這個數字,文件描述符一直是在緩存中打開的,如上例,如果有一個文件在 inactive 時間內一次沒被使用,它將被移除。
fastcgi_connect_timeout 300;
指定連接到後端 FastCGI 的超時時間。#太短可能發生 502 Bad Gateway
fastcgi_send_timeout 300;
向 FastCGI 傳送請求的超時時間,這個值是指已經完成兩次握手後向 FastCGI 傳送請求的超時時間。
fastcgi_read_timeout 300;
接收 FastCGI 應答的超時時間,這個值是指已經完成兩次握手後接收 FastCGI 應答的超時時間。#太短可能發生 504 Gateway Time-out
fastcgi_buffer_size 16k;
指定讀取 FastCGI 應答第一部分需要用多大的緩衝區,這裡可以設置為 fastcgi_buffers 指令指定的緩衝區大小,上面的
指令指定它將使用 1 個 16k 的緩衝區去讀取應答的第一部分,即應答頭,其實這個應答頭一般情況下都很小(不會超過
1k),但是你如果在 fastcgi_buffers 指令中指定了緩衝區的大小,那麼它也會分配一個 fastcgi_buffers 指定的緩衝區大
小去緩存。
fastcgi_buffers 16 16k;
指定本地需要用多少和多大的緩衝區來緩衝 FastCGI 的應答,如上所示,如果一個 php 腳本所產生的頁面大小為 256k,
則會為其分配 16 個 16k 的緩衝區來緩存,如果大於 256k ,增大於 256k 的部分會緩存到 fastcgi_temp 指定的路徑中,
當然這對服務器負載來說是不明智的方案,因為內存中處理數據速度要快於硬盤,通常這個值的設置應該選擇一個你的
站點中的 php 腳本所產生的頁面大小的中間值,比如你的站點大部分腳本所產生的頁面大小為 256k 就可以把這個值設
置為 16 16k,或者 4 64k 或者 64 4k,但很顯然,後兩種並不是好的設置方法,因為如果產生的頁面只有 32k,如果用 4
64k 它會分配 1 個 64k 的緩衝區去緩存,而如果使用 64 4k 它會分配 8 個 4k 的緩衝區去緩存,而如果使用 16 16k 則它
會分配 2 個 16k 去緩存頁面,這樣看起來似乎更加合理。
fastcgi_busy_buffers_size 32k;
這個指令我也不知道是做什麼用,只知道默認值是 fastcgi_buffers 的兩倍。
fastcgi_temp_file_write_size 32k;
在寫入 fastcgi_temp_path 時將用多大的數據塊,默認值是 fastcgi_buffers 的兩倍。
fastcgi_cache TEST
開啟 FastCGI 緩存並且為其製定一個名稱。個人感覺開啟緩存非常有用,可以有效降低 CPU 負載,並且防止 502 錯誤。
但是這個緩存會引起很多問題,因為它緩存的是動態頁面。具體使用還需根據自己的需求。
fastcgi_cache_valid 200 302 1h;
fastcgi_cache_valid 301 1d;
fastcgi_cache_valid any 1m;
為指定的應答代碼指定緩存時間,如上例中將 200,302 應答緩存一小時,301 應答緩存 1 天,其他為 1 分鐘。
fastcgi_cache_min_uses 1;
緩存在 fastcgi_cache_path 指令 inactive 參數值時間內的最少使用次數,如上例,如果在 5 分鐘內某文件 1 次也沒有被
使用,那麼這個文件將被移除。
fastcgi_cache_use_stale error timeout invalid_header http_500;
不知道這個參數的作用,猜想應該是讓 nginx 知道哪些類型的緩存是沒用的。
以上為 nginx 中 FastCGI 相關參數,另外,FastCGI 自身也有一些配置需要進行優化,如果你使用 php-fpm 來管理

#套用設定
service nginx stop
service nginx start

完整的優化設置範例:
user www-data;
worker_processes 8;
worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;
pid /run/nginx.pid;
worker_rlimit_nofile 204800;

events {
use epoll;
worker_connections 204800;
}

http {

sendfile on;
tcp_nopush on;
tcp_nodelay on;
client_header_buffer_size 32k;
large_client_header_buffers 4 32k;
client_max_body_size 8m;
keepalive_timeout 65;
types_hash_max_size 2048;
server_tokens off;
client_body_buffer_size 512k;
server_names_hash_bucket_size 128;

include /etc/nginx/mime.types;
default_type application/octet-stream;

ssl_protocols TLSv1 TLSv1.1 TLSv1.2;
ssl_prefer_server_ciphers on;

access_log /var/log/nginx/access.log;
error_log /var/log/nginx/error.log;

fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
fastcgi_buffer_size 64k;
fastcgi_buffers 4 64k;
fastcgi_busy_buffers_size 128k;
fastcgi_temp_file_write_size 128k;
open_file_cache max=204800 inactive=20s;
open_file_cache_min_uses 1;
open_file_cache_valid 30s;

gzip off;
gzip_disable "msie6";
gzip_min_length 1k;
gzip_comp_level 2;
gzip_buffers 32 4k;
gzip_http_version 1.1;

include /etc/nginx/conf.d/*.conf;
#include /etc/nginx/sites-enabled/*; include /etc/nginx/sites-available/default;
}


[Nginx virtual host 設定] 

重啟後,查看 backlog 設定是否生效。
這邊要注意的是,backlog 這個值不是越大越好,
若程式很耗費資源,當 backlog 太大時,可能耗盡 Server 資源,造成網站卡住所有連線反應都很慢,
這個設定值會受 linux 系統 net.core.somaxconn 設定的限制。

$ /etc/nginx/sites-available/default

server {
    #修改 backlog,多個 virtual host,backlog 只須在其中一個設定
    listen 80 default_server backlog=1024;
    ....
}

$ ss -nlt

State   Recv-Q Send-Q   Local Address:Port    Peer Address:Port

LISTEN    0     1024                *:80                 *:*


php-fpm 優化

/etc/php/7.0/fpm/pool.d/www.conf

常駐的 process 數越多,系統越不用開開關關 process,會較節省 CPU。
但 process 數越多,使用的記憶體也會越大,所以,須視CPU與記憶體使用狀況,取一個平衡。
若設的太小,在 php-fpm.log 會記錄相關的訊息。

listen.backlog = 65535
pm.max_children = 800
pm.start_servers = 200
pm.min_spare_servers = 100
pm.max_spare_servers = 800
pm.max_requests = 4000
rlimit_files = 51200


參考文件
Linux、nginx、php-fpm 連線數優化
nginx 優化突破十萬並行連線數
nginx+php-fpm性能参数优化原则
nginx提示:500 Internal Server Error错误的解决方法