俗話說,運維工程師三件寶,重啟,重灌,換電腦。這三件百試不爽的法寶有時候也手背不靈光的時候,那個時候呀真是欲哭無淚。以下分別談一談我或我身份同事發生的事。這三件事有的並不是直接發生在我身份的,但確實我親眼所見或同事親述,但是為了保護同事的隱私,以下全部用第一人稱講述,有人不甘不擠兌胖胖不爽的人會說,胖胖,別瞎扯,不就是你自己親身經歷的事嘛,還嫁禍到別人頭上,那好吧,就算是我親身經歷的好了。
一、囧事之重啟篇
某生產系統進行硬體擴容,要將32gb的物理記憶體擴充套件到64gb,因為是生產環境,linux系統所以停機時間不能太長。雖然記憶體支援熱插拔,但是經過和同事一致討論,領導的拍板,熱插拔不靠譜,停機安裝。擴容過程本來是無比簡單的。首先去機房找到該台伺服器,然後確認,對方遠端關閉計算機(實際控制使用這台計算機的許可權在其它部分同事手中)然後將計算機下架,開啟機箱蓋,由廠商負責插入新記憶體,開機啟動 ,觀察bios資訊記憶體情況,ok完成。簡單的吧,與其說是關機,就不如算乙個略長時間的重啟。結果人手背的時候,沒法說呀。因為是遠端關閉計算機,到達現場後我立刻找到了該台計算機,並確認(其實擴容是二台)然後**遠端關閉計算機。然後將計算機下架,擴充套件記憶體,開機檢查bios資訊,第一台正常,ok。關機上架。然後如法炮製第二台,檢查記憶體資訊,ok,本以為打完收工。然後上架,開機,結果悲催的事情就發生了。因為這台機器是linux系統,已經n年沒重啟了,所以這次關機後開機,竟然無法正常引導作業系統了,乙個勁的報錯,提示檔案系統損壞。當時汗馬上就下來了。馬上進入單引導模式,開始嘗試手動修復檔案系統。結果就是人背喝涼水都塞牙。檔案系統修復失敗。糟糕的是,因為是個很簡單的操作,遠端的同事不知道情況,乙個勁的催完成沒有,所以就是越催越急,一時也沒有了頭緒。離預計時間已經超過20分鐘了,還沒有個頭緒,當時臉都綠了。還有公司的乙個更有經驗的同事**聯絡問情況,沒辦法實話實說吧。因為無法引導系統,只能手機拍照,然後存到自己隨身攜帶的筆記本上,然後把圖發給同事分析判斷,指導操作。好在老天不餓死瞎家雀,最後在超過預計2小時10分的時候,終於將系統成功引導了。當年挨批是免不了的了。事後經過大家的事故分析,問題出在因為這台機器常年沒有關機,系統在關機的時候比較慢,資料由記憶體寫入硬碟的時間超過了自己的預期。因為第一台成功完成後得意忘形,沒有連線本地顯示器檢視關機情況,系統並沒有造成正常的關機,在資料從記憶體寫入硬碟的時候非法關機了,最後造成檔案系統掛掉了。這個事件告訴我們,很多時候溝通是關鍵,做事的要做到事無鉅細。
二、囧事之重灌篇
(未完,待續)
運維囧事 之重啟 重灌 換電腦
俗話說,運維工程師三件寶,重啟,重灌,換電腦。這三件百試不爽的法寶有時候也手背不靈光的時候,那個時候呀真是欲哭無淚。以下分別談一談我或我身份同事發生的事。這三件事有的並不是直接發生在我身份的,但確實我親眼所見或同事親述,但是為了保護同事的隱私,以下全部用第一人稱講述,有人不甘不擠兌胖胖不爽的人會說,...
運維囧事 運維的苦樂之旅
人生就是一段充滿苦與樂的旅程,在人生當中有痛苦也有歡樂,痛苦不一定是負面的,有的時候還會使你進步,增強應變能力。對一般人而言,人生一定要是快樂的才是有意義的,可是你仔細想想,有誰不是因為挫折而更加的堅強呢?走過運維的風風雨雨,與大家一起回憶其中的苦樂甘甜,那何嘗不是一段段激情燃燒的歲月呢,記載著你我...
運維子系統之運維節點
運維子系統是通用平台重要的基礎構件,運維節點則是運維子系統最重要,最基礎的構成部分。運維節點被部署在每台伺服器上,維護該台伺服器上所有的運維任務。運維節點功能上篇已經描述,本篇簡介運維節點實現上相關要點。1.守護功能 守護功能作為乙個7x24小時執行系統而言是必不可少的,再穩定服務也有發生異常的時候...