俗話說,運維工程師三件寶,重啟,重灌,換電腦。這三件百試不爽的法寶有時候也手背不靈光的時候,那個時候呀真是欲哭無淚。以下分別談一談我或我身份同事發生的事。這三件事有的並不是直接發生在我身份的,但確實我親眼所見或同事親述,但是為了保護同事的隱私,以下全部用第一人稱講述,有人不甘不擠兌胖胖不爽的人會說,胖胖,別瞎扯,不就是你自己親身經歷的事嘛,還嫁禍到別人頭上,那好吧,就算是我親身經歷的好了。
一、囧事之重啟篇
某生產系統進行硬體擴容,要將32gb的物理記憶體擴充套件到64gb,因為是生產環境,linux系統所以停機時間不能太長。雖然記憶體支援熱插拔,但是經過和同事一致討論,領導的拍板,熱插拔不靠譜,停機安裝。擴容過程本來是無比簡單的。首先去機房找到該台伺服器,然後確認,對方遠端關閉計算機(實際控制使用這台計算機的許可權在其它部分同事手中)然後將計算機下架,開啟機箱蓋,由廠商負責插入新記憶體,開機啟動 ,觀察bios資訊記憶體情況,ok完成。簡單的吧,與其說是關機,就不如算乙個略長時間的重啟。結果人手背的時候,沒法說呀。因為是遠端關閉計算機,到達現場後我立刻找到了該台計算機,並確認(其實擴容是二台)然後**遠端關閉計算機。然後將計算機下架,擴充套件記憶體,開機檢查bios資訊,第一台正常,ok。關機上架。然後如法炮製第二台,檢查記憶體資訊,ok,本以為打完收工。然後上架,開機,結果悲催的事情就發生了。因為這台機器是linux系統,已經n年沒重啟了,所以這次關機後開機,竟然無法正常引導作業系統了,乙個勁的報錯,提示檔案系統損壞。當時汗馬上就下來了。馬上進入單引導模式,開始嘗試手動修復檔案系統。結果就是人背喝涼水都塞牙。檔案系統修復失敗。糟糕的是,因為是個很簡單的操作,遠端的同事不知道情況,乙個勁的催完成沒有,所以就是越催越急,一時也沒有了頭緒。離預計時間已經超過20分鐘了,還沒有個頭緒,當時臉都綠了。還有公司的乙個更有經驗的同事**聯絡問情況,沒辦法實話實說吧。因為無法引導系統,只能手機拍照,然後存到自己隨身攜帶的筆記本上,然後把圖發給同事分析判斷,指導操作。好在老天不餓死瞎家雀,最後在超過預計2小時10分的時候,終於將系統成功引導了。當年挨批是免不了的了。事後經過大家的事故分析,問題出在因為這台機器常年沒有關機,系統在關機的時候比較慢,資料由記憶體寫入硬碟的時間超過了自己的預期。因為第一台成功完成後得意忘形,沒有連線本地顯示器檢視關機情況,系統並沒有造成正常的關機,在資料從記憶體寫入硬碟的時候非法關機了,最後造成檔案系統掛掉了。
這個事件告訴我們,很多時候溝通是關鍵,另外做事的要做到事無鉅細,關鍵是頭腦要清醒,有條理,不要做蠢事。
二、囧事之重灌篇
說完了重啟的囧事後,我現在來講講重灌的故事。重灌系統可能是很多運維人員經常要面臨的工作。有人認為這項工作沒有意義,很簡單。話說丁胖胖工作這些年也不知道重做了多少系統。輕鬆的時候多,麻煩的時候也有。當然我就拿出一篇比較囧的事來說。話說某台pc server系統掛掉了。所以我們的工作就是給這台機器重灌系統。那好像是2023年的第一場雪,比以往的時候來的稍晚了一些。那天是週末,所以週末加班是件很不爽的事。不知道我那次腦袋被門擠了還是進了一些水。我沒有使用強大的u盤安裝,而是選擇了使用光碟安裝。安裝的頭天快下班的時候,乙個同事提醒我,最好多帶幾張系統盤,免的光碟機挑盤或者剛巧光碟讀不出來。所以我自作聰明的帶了4張光碟。結果悲催就悲催在這4張光碟上。插入第一張光碟,光碟沒有被引導。奶奶的,巧了。換第二張,光碟還是沒有被引導,真巧。換第三張光碟,光碟仍然沒有被引導,太巧了。換第四張光碟,光碟習慣性的沒有被引導,真是化腐朽為神奇了。和我同去的同事都被驚呆了。怎麼了?回公司再拿一張,那麼上午這半天就過去了。問idc機房的同行要一張,真巧週末沒人,就乙個值班的,人家手頭也恰巧沒有同版本的系統光碟。當然在我們走投無路的時候,我的同事大神從包裡翻出一張混雜著他汗水、汗水還是汗水估計放了有半年以上得系統光碟,放入光碟機。神了,顯示器終於出現了友好的安裝嚮導介面。
事後細想了一下,可能是當時四張光碟使用了同乙個移動燒錄光碟機,估計是燒錄光碟機有問題造成的。這件事也教育了我,平時檢查一下,哪怕是乙個很不起眼的細節,也是很重要的。
三、囧事之換機篇
話說某日,和我們有合作專案的甲方要來我公司觀察某專案系統的演示。公司的乙個同事負責具體工作。在此之前,我已經安裝要求將一台顯示的筆記本安裝了linux系統。因為演示程式需要在該系統中演示。但是臨甲方來臨的前20分鐘,這個同事找到我,要求在另一台台式電腦上安裝linux。理由是那台筆記本效能太差,怕出現意外。因為那個台式電腦原裝有windows系統,他給我的時間是5分鐘。我去。就是利用零干預全自動化安裝或者ghost系統安裝,也不可能在5分鐘之內完成。況且更換系統重灌還是重新分割槽,格式化系統。在我強烈表示無法完成的情況下,對方給我增加了13分鐘。並告之我,只要單機可以執行即可,不需要安裝網絡卡驅動。終於,我在12分47秒完成任務的時候,對方急匆匆的跑來告訴我。需要安裝網絡卡,聯網操作。於是,借來悲催的一幕終於發生了。原來這個台式電腦是雜牌網絡卡,linux自帶網絡卡驅動不能安裝上去。於是我立刻度娘,谷哥,一頓折騰下來,發現了更悲催的結果,該網絡卡沒有基於linux的網絡卡驅動。我的同事急的是團團轉,我更是急的轉團團。無奈之下,我的同事硬著頭皮拿起那台破本,上了戰場。。。還好完整的歸來。
時候這件事教育了我,一定對無法完成的任務說no。自作聰明的答應無把握之仗必定慘兮兮。另外,凡事要多想幾步,別走一步,看一步,會很被動的。
【部落格話題】 人在囧途之「運維囧」
!詳情檢視:
運維囧事 之重啟 重灌 換電腦
俗話說,運維工程師三件寶,重啟,重灌,換電腦。這三件百試不爽的法寶有時候也手背不靈光的時候,那個時候呀真是欲哭無淚。以下分別談一談我或我身份同事發生的事。這三件事有的並不是直接發生在我身份的,但確實我親眼所見或同事親述,但是為了保護同事的隱私,以下全部用第一人稱講述,有人不甘不擠兌胖胖不爽的人會說,...
運維囧事 運維的苦樂之旅
人生就是一段充滿苦與樂的旅程,在人生當中有痛苦也有歡樂,痛苦不一定是負面的,有的時候還會使你進步,增強應變能力。對一般人而言,人生一定要是快樂的才是有意義的,可是你仔細想想,有誰不是因為挫折而更加的堅強呢?走過運維的風風雨雨,與大家一起回憶其中的苦樂甘甜,那何嘗不是一段段激情燃燒的歲月呢,記載著你我...
運維子系統之運維節點
運維子系統是通用平台重要的基礎構件,運維節點則是運維子系統最重要,最基礎的構成部分。運維節點被部署在每台伺服器上,維護該台伺服器上所有的運維任務。運維節點功能上篇已經描述,本篇簡介運維節點實現上相關要點。1.守護功能 守護功能作為乙個7x24小時執行系統而言是必不可少的,再穩定服務也有發生異常的時候...