一、伺服器常見故障和現象
1、有關伺服器無法啟動的主要原因 :
①市電或電源線故障(斷電或接觸不良)
②電源或電源模組故障
③記憶體故障(一般伴有報警聲)
④cpu故障(一般也會有報警聲)
⑤主機板故障
⑥其它插卡造成中斷衝突
二、伺服器無法啟動
1、檢查電源線和各種i/o接線是否連線正常。
2、檢查連線電源線後主機板是否加電。
3、將伺服器設為最小配置(只接單顆cpu,最少的記憶體,只連線顯示器和鍵盤)直接短接主機板開關跳線,看看是否能夠啟動。
4、檢查電源,將所有的電源介面拔下,將電源的主機板供電口的綠線和黑線短接,看看電源是否啟動。
5、如果判斷電源正常,則需要用替換法來排除故障,替換法是在最小化配置下先由最容易替換的配件開始替換(記憶體、cpu、主機板)
三、系統頻繁重啟 ?
1、造成系統頻繁重啟的原因:
①電源故障(替換法判斷解決)
②記憶體故障(可從bios錯誤報告中查出)
③網路埠資料流量過大(工作壓力過大)
④軟體故障(更新或重灌作業系統解決)
四、伺服器宕機故障判斷處理:
伺服器宕機故障比較難以判斷,一般分為軟體和硬體兩個方面。
1、第一方面-軟體故障
①首先檢查作業系統的系統日誌,可以通過系統日誌來判斷部分造成宕機的原因。
②電腦病毒的原因。
④軟體使用不當或系統工作壓力過大,可以請客戶適當降低伺服器的工作壓力來看看是否能夠解決
2、第二方面-硬體故障
①硬體衝突
②電源故障或電源供電不足,可以通過對比計算伺服器電源所有的負載功率的值來作出判斷。
③硬碟故障(通過掃瞄硬碟表面來檢查是否有壞道)
④記憶體故障(可以通過主機板bios中的錯誤報告和作業系統的報錯資訊來判斷)
⑤主機板故障(使用替換法來判斷)
⑥cpu故障(使用替換法)
⑦板卡故障(一般是scsi/raid卡或其他pci裝置也有可能造成系統宕機,可用替換法判斷處理)
注意:系統宕機故障需要在處理完後需要在一段時間內進行一定壓力的拷機測試來盡一步檢查故障是否徹底解決。
五、安裝作業系統時提示找不到硬碟?
1、故障原因:
無物理硬碟裝置
硬碟線纜連線問題
沒有安裝硬碟控制器驅動或驅動不相符
六、如何獲得驅動程式?
1、使用隨機光碟製作相應驅動
七、為什麼用正確的驅動仍然無法載入硬碟控制器驅動?
1、檢視是否啟用了hostraid功能。
八、新購買的一塊硬碟,安裝到機器上之後,機器自檢無法通過?
1、將新的硬碟取下,機器是否可以自檢通過;
2、檢查新增加的硬碟的id號是否與原來的硬碟的id號相同,如果硬碟的id號相同的話,自檢將無法通過。
九、如何格式化scsi硬碟?
1、有作業系統的情況:使用磁碟管理工具格式化;
2、無作業系統的情況:在scsi管理控制介面格式化;
3、以adaptec raid卡為例:開機-出現ctrl+a 資訊時,按ctrl+a進 入 ①選中通道a
②選中scsi utility-將檢測到硬碟-選中要檢測的硬碟
③選中format可對硬碟進行全面格式化
④選中verify可對硬碟進行檢測,檢查是否有壞道
注意:在格式化硬碟時不能中斷或停電,不然會損壞磁碟
十、在aisino 系列中有raid卡機器,當其中乙個硬碟不能正常工作raid報警,但系統能正常執行,怎麼辦?
1、用乙個新硬碟,確保容量大於或等於不能正常工作的硬碟,最好用相同型號的硬碟替換即可。
2、raid卡相關常見故障
第一類: raid卡本身有問題
①經常表現為raid資訊丟失,硬碟經常掉線,不能做rebuild,開機自檢時檢測不到硬碟或時間長。
典型故障a:作完raid1,安裝作業系統,一切正常,但第二次重啟系統時,發出報警聲,經檢查發現一塊硬碟掉線,rebuild後,又恢復正常,但重啟後又掉線。懷疑為硬碟故障,校驗硬碟後均無問題。最後更換raid卡,故障解決。
第二類: 硬碟本身問題
①表現為硬碟掉線,在raid陣列中的狀態為dead,或者在作rebuild時,作到某一進度就不能繼續
第三類: 硬碟盒或模組的接觸問題
①此類問題經常表現為raid卡根本檢測不到硬碟,此類問題比較簡單,但在處理硬碟盒相關機器時,需要注意一些問題。
典型故障:riad卡中檢測不到硬碟,把scsi電纜接到主機板的ultra160介面上,故障依舊,拔出硬碟盒(不包括硬碟盒後面的托架)更換,故障依舊,更換硬碟,還是不行。最後卸下硬碟盒後面的托架(非熱插拔部分),發現後托架上80pin介面上的一根針彎曲,校直彎針,恢復正常。
十
一、在伺服器上使用的scsi硬碟,為什麼硬碟的id號不能設定為7?
1、scsi控制器中,預設將id=7設定為硬碟控制器佔,所以硬碟的id號不能設定為7
十
二、為什麼開機自檢無法通過?
1、解決方法:
①機器切斷電源,將機箱開啟,用「coms clear」跳線的跳線帽將「coms clear」跳線的另外兩個針短接(跳線參看主機板說明書)
②機器加電,自檢,等機器自檢完閉,報cmos已被清除,然後將機器電源關掉,把跳線復原即可
③機器重新開機
十
三、物理記憶體插槽報錯
1、解決方法:
①開機-按f2進入「setup」-「advanced」–「memory configuration」 回車-「clear dimm errors」 直接回車
IBMMQ運維常見問題
目錄 1.錯誤日誌 2.日誌檔案 3.常用排障方法 4.常見問題 websphere mq 使用許多錯誤日誌來捕捉websphere mq自身的操作 任何佇列管理器的啟動和正在使用的通道的錯誤資訊。錯誤日誌的位置取決於佇列管理器名,以及錯誤是否與客戶機相關。在 websphere mq window...
linux運維常見命令學習
檢視作業系統摘要資訊 uname ar 檢視記憶體 cat proc meminfo 檢視cpu cat proc cpuinfo 檢視每個物理cpu中core的個數 即核數 cat proc cpuinfo grep cpu cores uniq 檢視磁碟資訊 fdisk l 檢視linux作業系...
運維筆記 linux常見命令
建立和刪除 touch 建立乙個普通檔案 mkdir 建立乙個目錄檔案 ln 建立乙個鏈結檔案 rm 刪除乙個檔案或目錄 檢視和搜尋 echo 將命令後面的內容,輸出到當前螢幕 cat 檢視檔案內容 find 搜尋檔案內容 grep 過濾關鍵字內容 man 檢視命令幫助資訊 zcat 檢視壓縮包檔案...