一次硬體故障處理後的總結

2021-10-04 14:24:45 字數 536 閱讀 3504

背景:

主庫切換到備庫機房後,資料讀寫和業務處理都比主庫機房慢很多,結合之前幾個月備庫機房的這6臺主機經常出現重啟現象,因此懷疑是硬體問題

過程:忽略,總之是測試過很多次,測試過光交,換過模組,修改過多路徑配置等等,最後是替換了乙個光交,問題解決

總結:

1.一定是要做好分析,列出所有可能存在的故障點,再決定怎麼去測試,不能閉著眼就去測試去了

2.測試時一定要做好記錄,測試的是什麼場景,預期會出現什麼結果,實際會出現什麼結果,不記下來只靠腦子記,兩天之後就記不清了

3.如果是長時間的現場操作最好是兩人一起,一人操作一人review,之前有次就是信心滿滿,結果到最後稀里糊塗的就插錯了一次線

4.測試還是要充分考慮概率因素對結果的影響,有條件的話最好是多次測試確認,不能是測試一次結果是自己想要的,就「失去理性」了

5.相信科學,反對迷信

一次svn的故障處理

辦公室乙個妹紙在用svn的時候,刪掉了乙個目錄,然後上傳的時候出現錯誤,根據報錯,度娘解釋要用cleanup,但是cleanup不能用,妹紙從網上查到要用sqlite3連線wc.db,然後delete一下任務堆積,但是妹紙執行後沒反應,於是妹紙就沒招了 把我叫了過去,於是排障開始了。根據報錯 回到工...

記一次硬體故障,並普及點硬體知識

既當故事,也做見識 事情是這樣的,星期四的時候需要用工作站的gpu進行ai模型訓練,所以把gpu和主機板驅動公升級了一下,然後就執行了1天,晚上的時候暫停任務,心想著讓工作站休息一晚,明天繼續吧 那gpu運轉和產熱真是誇張啊,現在知道為什麼gpu都有兩個風扇了 第二天把工作站重新開機,發現遠端連線不...

記公升級mysql後的一次故障

一 問題背景 接上級要求,某生產資料庫需要實施備份 剛好漏洞掃瞄報告出來,mysql 版本需要公升級到5.7.20,於是就未雨綢繆,先寫指令碼。指令碼在mysql舊版本下完全可用 未公升級前,mysql 為5.7.18 公升級完後,本著技術人員的一種嚴謹態度,絕對要sh x 看看指令碼在新環境下有沒...