背景:
網路大致拓撲型
定位到一台nginx節點於凌晨timewait異常,等到6k。
程序異常,ngx_http_realtime_request模組錯誤
錯誤日誌:
解決過程:
nginx每天凌晨定時切割日誌reload後,程序異常,但埠存活,致使f5仍舊分發請求,以及監控無法異常告警。
1. 從github上查詢專案
發現最近更新是4年前,專案不活躍。
2.網上有報過這個問題:
>>>>2014-06-30 12:17 gmt+08:00 趙海軍 :3. 關閉ngx_http_realtime_request模組,重新reload>>>>>那這個問題應該是ngx_http_realtime_request導致的,請問有什麼解決辦法嗎?
>>>>>>>這個看起來像是模組實現時的問題。需要這個模組的開發者來幫助排查,可以嘗試再他的github上提個issue。
>>btw,我粗略看了下他的模組,這個問題可能和ngx_http_realtime_request_init_zone()實現有關係。
>>*這裡*ngx_http_realtime_request_init_zone()實現上是不太完善的
>>
4.增加timewait 監控
5. 用elk監控nginx的流量,替換ngx_http_realtime_request功能
nginx導致的session丟失的解決方法
nginx把同一使用者的請求分發到了不同的伺服器,如果不做處理,就會導致session丟失。1 粘性ip 在nginx配置檔案中,增加配置,對ip進行hash後,雜湊到伺服器。2 伺服器session複製 1 在 tomcat的web.xml中配置為集群模式,2 在tomcat的server.xml...
acpi導致的問題
今天過來發現泰國人說伺服器出問題了,結果上去一看dmesg裡輸出了一串資訊如下 info task kacpi notify 155 blocked for more than 120 seconds.echo 0 proc sys kernel hung task timeout secs dis...
導致加班的問題
類的成員對外公布最好通過介面,因為直接使用成員的外放介面呼叫會導致出了錯誤而無從入手找起。例如 a public static hashmap b static 如果直接在外部呼叫b的clear方法,會導致我們在其他地方呼叫時發現 奇怪我是在 clear的呢?為什麼b沒有元素了。而如果我們自己定義了...