伺服器硬體故障排查

2021-09-21 05:10:58 字數 1209 閱讀 3802

電源故障現象

1、接電源線、電源燈不亮

2、電源指示燈報警

3、電源燈正常、按開機鍵無反應

排查方式:

1、檢測電源線的接觸是否有鬆散

2、替換電源測試

3、供電環境檢測(是否存在電壓不穩定)

4、檢視事件日誌

主機板故障現象:

1、按開機鍵無效,黑屏

2、裝置啟動正常,接顯示器黑屏

3、裝置某些介面或者插槽接配件,導致無法開機

cpu故障現象

1、按開機鍵無效,黑屏

2、裝置自動重啟

3、裝置無辜宕機

排查方式:

1、檢測cpu安裝問題

2、替換cpu

3、檢測環境(風扇和溫度)

4、檢視事件日誌

記憶體故障現象

1、按開機鍵無效,黑屏

2、開機卡自檢

3、系統識別記憶體變小

4、裝置無故宕機,重啟

排查方式;

1、重新插拔記憶體,清理記憶體金手指部位

2、替換記憶體檢測

3、記憶體插法檢測

4、檢視事件日誌

硬碟故障現象

1、開機進bios

2、系統不識別硬碟

3、不進系統游標閃爍

4、裝置無故宕機,重啟

排查方式:

1、啟動順序檢測

2、替換硬碟或檢測更換硬碟介面檢測

3、raid卡設定檢測

裝置不開機(電源、主機板、cpu)

卡硬體自檢(記憶體、擴充套件卡)

開機進bios(硬碟、啟動項)

集中管理

網路喚醒

一、電腦顯示器不提示,鍵盤滑鼠顯示燈不亮,風扇轉動,開啟主機箱擦擦記憶體條再試試,時間長了,可能進了些灰層,若不行返廠自檢bios

二、伺服器啟不來進入不了介面,到dhcp就啟動不了,可以斷電重啟試試

三、通過現象反映記憶體問題

拔記憶體重新插不能解決。錯誤就是:無法訪問所有安裝的記憶體。系統關閉。我還沒裝系統。新機器。 

記憶體錯誤,錯誤記憶體定位在 3號記憶體板 第三根記憶體。建議先記憶體最小化 兩個記憶體板各裝兩根記憶體,機器無報錯後,再用替換法檢測記憶體

解決方式:

1、拔掉儲存器板1(一組記憶體板)

2、更換記憶體

華為伺服器硬體排查

預設使用者 root 預設密碼為 huawei12 預設使用者 admin 預設密碼為 huawei12 預設使用者 operator 預設密碼為 huawei12 預設使用者 taobao 預設密碼為 huawei12 引數舉例如下 serial line to connect to com1 s...

linux 伺服器丟包故障排查

專案開了個p2p伺服器,但是執行一段時間就會出現丟包問題,具體表現為 1 udp丟包嚴重 一分鐘收發分別1.5w 2 ssh 用於運維指令 連線不上該伺服器 超時 3 伺服器執行好像沒什麼異常,udp假連線數比tcp連線數少 正常應該相近 首先開始懷疑是不是客戶端有bug,查log發現某段時間有個別...

Linux伺服器SSH遠端連線故障排查

ping 10.0.0.7 排查客戶端到伺服器端的線路問題,ping是常用的網路連通性檢查工具 tracert d 10.0.0.7 tracert路由追蹤命令,也可以檢查路是否暢通,d是不進行反向解析 telnet 10.0.0.7 22 判斷ssh伺服器預設的22埠是否開啟 客戶端執行 一看埠是...