問題出現前的提要:
1、專案需求:將大量資料通過kafka訊息佇列**到另外的專案中
2、專案打完版本後,3點開始cpu開始飆公升
報錯資訊
解決問題方式
1、重啟伺服器 關閉大量資料的**,暫時解決問題。
2、開始分析問題
(1)檢查**:檢視有沒有死鎖或者有沒有占用大量cpu的**,檢查結果沒有發現**問題,排除問題
(2)通過zabbix 觀察cpu和記憶體的異常過程,通過觀察發現cpu在3點鐘的時候開始大量飆公升。再通過kibana查詢當時日誌情況。
(3)通過以上的檢查沒有發現什麼特殊異常,只是知道我們3點鐘打完版本cpu開始飆公升,所以我們這邊決定在測試環境進行壓測,但是壓測結果是沒有問題,
(5)將war部署到新的節點上,開始觀察專案cpu、記憶體資訊、kafka消費資訊,發現cpu和記憶體資訊都沒有問題,只是啟動專案的時候有點小上公升,並且發現kafka資訊開始堆積, 所以這邊先將topic分割槽 分成8個區 因為機器是4臺 要為倍數關係最好。分析cpu異常是不是跟時間有關,我觀察最近幾天zabbix發現半夜3點的時候cpu 都會上公升,所以分析應該是3點的時候有定時任務啟動導致cpu上公升,正好當時我們這邊重啟專案cpu 也會上公升 所以導致專案cpu暴漲導致機器奔潰,
分析結果
導致原因:猜測定時任務導致cpu公升高 再加上kafka訊息大量堆積和專案重啟導致的cpu公升高 。
centos伺服器漏洞問題解決
sh xx.sh cd etc進入資料夾 再export path usr bin usr sbin bin sbin加入初始path命令 再vim profile進入修改錯誤 新開乙個終端 執行killall wget cd etc yum.repos.d vim epel.repo 將eable...
昨天伺服器出現問題,解決過程如下所述
對伺服器的管理不是很在行。昨天下午伺服器突然不能訪問,電告資料中心要求重啟,資料中心技術人員報告說重啟以後不能進入系統,找不到系統盤。於是懷疑硬碟出問題,很擔心資料能否挽回,開始準備出發去資料中心。令人氣憤的是想刻一張新的win2003sp1帶去重灌,用achol120,換了兩台機,竟然刻飛了3張,...
httpd伺服器啟動不了問題解決
停止 httpd 失敗 正在啟動 httpd 確定 httpd 已死,但是 subsys 被鎖 root使用者無法刪除tmp目錄下檔案 root discuz tmp rm rf rm 無法刪除 gates.lod 許可權不夠 rm 無法刪除 gpg hrborj 許可權不夠 rm 無法刪除 mon...