nginx假死導致的問題回顧

2021-09-08 12:29:20 字數 1262 閱讀 3301

背景:

網路大致拓撲型

定位到一台nginx節點於凌晨timewait異常,等到6k。

程序異常,ngx_http_realtime_request模組錯誤

錯誤日誌:

解決過程:

nginx每天凌晨定時切割日誌reload後,程序異常,但埠存活,致使f5仍舊分發請求,以及監控無法異常告警。

1. 從github上查詢專案

發現最近更新是4年前,專案不活躍。

2.網上有報過這個問題:

>>>>2014-06-30 12:17 gmt+08:00 趙海軍 :

>>>>>那這個問題應該是ngx_http_realtime_request導致的,請問有什麼解決辦法嗎?

>>>>>>>這個看起來像是模組實現時的問題。需要這個模組的開發者來幫助排查,可以嘗試再他的github上提個issue。

>>btw,我粗略看了下他的模組,這個問題可能和ngx_http_realtime_request_init_zone()實現有關係。

>>*這裡*ngx_http_realtime_request_init_zone()實現上是不太完善的

>>

3. 關閉ngx_http_realtime_request模組,重新reload

4.增加timewait 監控

5. 用elk監控nginx的流量,替換ngx_http_realtime_request功能

nginx導致的session丟失的解決方法

nginx把同一使用者的請求分發到了不同的伺服器,如果不做處理,就會導致session丟失。1 粘性ip 在nginx配置檔案中,增加配置,對ip進行hash後,雜湊到伺服器。2 伺服器session複製 1 在 tomcat的web.xml中配置為集群模式,2 在tomcat的server.xml...

acpi導致的問題

今天過來發現泰國人說伺服器出問題了,結果上去一看dmesg裡輸出了一串資訊如下 info task kacpi notify 155 blocked for more than 120 seconds.echo 0 proc sys kernel hung task timeout secs dis...

導致加班的問題

類的成員對外公布最好通過介面,因為直接使用成員的外放介面呼叫會導致出了錯誤而無從入手找起。例如 a public static hashmap b static 如果直接在外部呼叫b的clear方法,會導致我們在其他地方呼叫時發現 奇怪我是在 clear的呢?為什麼b沒有元素了。而如果我們自己定義了...