storm supervisor.out日誌中有報錯:
supervisor [info] shutting down and clearing state for id ae1ad586-ce5c-459a-8f32-30410683b4d6. current supervisor time: 1408166828. state: :timed-out, heartbeat:
對於乙個worker的重啟,一般來說基本為三種情況:
1、**異常,一般列印出的日誌會有較為明確的體現;
2、jvm記憶體溢位,由於程序重啟,沒有保留當時程序的堆記憶體使用率情況;
3、worker本身無異常,supervisor主動重啟worker。
對於第三種情況,從日誌中可以看到, 是因為timeout超時導致。
推測:1、worker重啟且連續出現在同乙個節點上,因此認為該節點本身問題的可能性大一點。
2、supervisor和worker本身都在同一節點,當supervisor檢測不到worker的心跳,會將其shutdown,而由於心跳檔案是在本地,因此是與網路無關的。
3、更大的可能性是本機當時的負載比較高,該節點上有30+個worker程序,在12:48分前後節點負載從小於1陡然增大到6.44(當然這個值不算很高),負載突然變大可能導致worker無法及時更新心跳檔案,導致supervisor判定其timeout,重啟了worker。
方案:1、白天看了cpu和記憶體的監控日誌,因為是每隔5分鐘列印出的瞬時值,不能很好反應資源的波動情況,得出了資源較為空閒的結論,明天看一下確定當時資源波動到底如何。
2、加大supervisor和worker之間的心跳時間,在storm.yaml中設定supervisor.worker.timeout.secs,這個明天看一下是否需要進行調整。
異常重啟 關機充電,手機不斷重啟問題分析
程式設計師android 力薦 android 開發者需要的必備技能 一 lk 階段重啟 二 在kernel關機充電階段重啟 三 關閉異常掉電機制 在低電量時,插著充電器關機充電,手機會不斷重啟。低電量關機充電不斷重啟問題在lk 階段重啟的log如下 unplugged usb charger in...
kernel 異常重啟的log輸出
異常處理函式,在底層 彙編 做一些處理後,最後呼叫c 介面函式。即使是c 函式,核心異常的處理函式還是cpu 架構相關的,就是函式在arch 下的不同目錄下實現。當發生指令異常時,彙編 的處理是 以64位armv8 架構為例 對應的彙編 在檔案kernel arch arm64 kernel ent...
讓程式異常退出後自動重啟
程式 freeeim.exe 遇到問題異常退出,是否重啟?類似的情況我們似乎碰見過,很多程式都有這個功能 這是怎麼實現的呢?經 過一番努力,在msdn找到了setunhandledexceptionfilter函式,利用它,可以實現這個功能。其實這個過程叫做seh structured except...