nginx服務器異常502 bad gateway原因排查

服務器進行公眾號粉絲數據同步以及批量推送報錯502

根據錯誤信息可以判定是後端的問題,502錯誤的原因有很多種,但總的來說就是服務器處理不過來瞭

1.首先查看服務器日志
1)先查nginx日志,不熟悉的可以從nginx.conf中獲取error_log的路徑,找到錯誤如下:

在這裡插入圖片描述

發現nginx進程處理的連接數不夠用,單個進程處理的連接數超過瞭nginx.conf配置的worker_connections值

在這裡插入圖片描述

通常worker_connections的值可以參考單個進程打開的最大連接數,命令為:ulimit -n
ulimit -a 查看所有限制參數
當前最大打開文件數:65535,可以設置worker_connections為51200

重啟nginx nginx -s reload

查看當前tcp連接狀況 
netstat -an|awk '/^tcp/{++S[$NF]}END{for (a in S)print a,S[a]}'

2)查看php-fpm日志,同樣不熟悉日志位置可以從php-fpm.conf中查看,註意php7以上的配置文件是放在php-fpm.d目錄下的www.conf

查看php-fpm.log

在這裡插入圖片描述

發現pm.max_children不夠用瞭,說明php-fpm最大進程數太小瞭,查看php配置文件ww.conf,修改改參數pm.max_children=100

php-fpm主要調整幾個參數
pm = dynamic 如何控制子進程,選項有static和dynamic

pm.max_children:靜態方式下開啟的php-fpm進程數量

pm.max_requests:php-fpm子進程能處理的最大請求數

pm.start_servers:動態方式下的起始php-fpm進程數量
pm.min_spare_servers:動態方式下的最小php-fpm進程數
pm.max_spare_servers:動態方式下的最大php-fpm進程數量

一、pm.max_children,pm.max_spare_servers 多大合適?

這個值原則上是越大越好,php-cgi的進程多瞭就會處理的很快,排隊的請求就會很少。
設置”max_children” 也需要根據服務器的性能進行設定。

數量也可以根據 內存/30M 得到,比如8GB內存可以設置為100,那麼php-fpm耗費的內存就能控制在 2G-3G的樣子。

對於小內存的服務器來說,比如256M內存的VPS,即使按照一個20M的內存量來算,10個php-cgi進程就將耗掉200M內存,那系統的崩潰就應該很正常瞭。

因此應該盡量地控制php-fpm進程的數量,大體明確其他應用占用的內存後,
給它指定一個靜態的小數量,會讓系統更加平穩一些。或者使用動態方式,
因為動態方式會結束掉多餘的進程,可以回收釋放一些內存,所以推薦在內存較少的服務器或VPS上使用。具體最大數量根據 內存/30M 得到。

pm.start_servers缺省值計算公式: min_spare_servers + (max_spare_servers – min_spare_servers) / 2。

比如說512M的VPS,加入分配給php-fpm最大250M,建議pm.max_spare_servers設置為250/30 ,約為8。至於pm.min_spare_servers,則建議根據服務器的負載情況來設置,比如服務器上隻是部署php環境的話,比較合適的值在2~5之間。

這裡面還有一個問題,php-fpm因為一些第三方庫可能會引起內存泄漏,時間長瞭,占用的內存會比較多,像我們的服務器現在就是50m左右,還好,有pm.max_requests這個參數,這個參數指定瞭一個php-fpm子進程執行多少次之後重啟該進程。這個可能就要根據你的實際情況調整瞭。

計算方式如下:

一般來說一臺服務器正常情況下每一個php-cgi所耗費的內存在20M~30M左右,因此我的”max_children”我設置成40個,20M*40=800M也就是說在峰值的時候所有PHP-CGI所耗內存在800M以內,低於我的有效內存2Gb。

而如果我 的”max_children”設置的較小,比如5-10個,那麼php-cgi就會“很累“,處理速度也很慢,等待的時間也較長,占用的CPU也很高。

如果長時間沒有得到處理的請求就會出現 504 Gateway Time-out 這個錯誤,而正在處理的很累的那幾個php-cgi如果遇到瞭問題就會出現 502 Bad gateway 這個錯誤。

max_children較好的設置方式根據req/s
(吞吐率,單位時間裡服務器處理的最大請求數,單位req/s)來設置,
若程序是 100 req/s 的處理能力,那麼就設置 100比較好,這是動態來調整的。

二、request_terminate_timeout 多大合適?

計算方式如下:

如果你的服務器性能足夠好,且寬帶資源足夠充足,PHP腳本沒有循環或BUG的話你可以直接將”request_terminate_timeout”設 置成0s。0s的含義是讓PHP-CGI一直執行下去而沒有時間限制。

而如果你做不到這一點,也就是說你的PHP-CGI可能出現某個BUG,或者你的寬帶不夠充足或者其他的原因導致你的PHP-CGI能夠假死那麼就建議你給”request_terminate_timeout”賦一個值,這個值可以根 據你服務器的性能進行設定。

一般來說性能越好你可以設置越高,20分鐘-30分鐘都可以。由於我的服務器PHP腳本需要長時間運行,有的可能會超過10分鐘因此我設置瞭900秒,這樣不會導致PHP-CGI死掉而出現502 Bad gateway這個錯誤。

優化後的參數

編輯/usr/local/php/etc/php-fpm.d/www.conf:
服務器配置:2核8G
pm = dynamic
pm.start_servers = 5
pm.min_spare_servers = 2
pm.max_spare_servers = 100

request_terminate_timeout=1200

查出服務的進程id
ps aux |grep php-fpm
kill -9 進程id 常用來殺死僵屍進程

總結nginx出現502錯誤原因

二、代理緩沖區設置過小
如果你使用的是nginx反向代理,如果header過大,超出瞭默認的1k,就會引發上述的upstream sent too big header (說白瞭就是nginx把外部請求給後端處理,後端返回的header太大,nginx處理不過來就會導致502。

server {

listen       80;
server_name  *.lxy.me;

location / {

添加這3行
fastcgi_buffer_size 64k;
fastcgi_buffers 32 32k;
fastcgi_busy_buffers_size 128k;
添加這3行
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
…………
}

三、默認php-cgi的進程數設置過少
在安裝好使用過程中出現502問題,一般是因為默認php-cgi進程是5個,可能因為phpcgi進程不夠用而造成502,需要修改/usr/local/php/etc/php-fpm.conf 將其中的max_children值適當增加。也有可能是max_requests值不夠用。需要說明的是這連個配置項占用內存很大,請根據服務器配置進行設置。否則可能起到反效果。

四、php執行超時
php執行超時,修改/usr/local/php/etc/php.ini 將max_execution_time 改為300

五、nginx等待時間超時
部分PHP程序的執行時間超過瞭Nginx的等待時間,可以適當增加nginx.conf配置文件中FastCGI的timeout時間

http {
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
……
}

六、如果做公眾號這一塊,註意有可能是微信服務器請求自己服務器過多導致的
如果發現php-fpm進程數已經達到最大的進程數,查看php-fpm配置文件,可以看到錯誤信息

到此這篇關於nginx服務器異常502 bad gateway原因排查的文章就介紹到這瞭,更多相關nginx服務器異常502 bad gateway內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: