處理linux系統故障的思路:
1.重視錯誤提示資訊。
2.查閱日誌檔案 。message (系統日誌) 服務的日誌 error(應用日誌)
3.分析,定位問題。
4.解決問題。
忘記root密碼?
重置:centos5或者6 啟動載入grub引導選單時 按esc 找到當前系統引導選項。
按方向鍵找到需要的系統引導核心,按 「e「 進入編輯狀態。
然後通過方向鍵選中帶有kernel指令的行 繼續按"e" 在行尾**空格新增『single』 修改完成後
按回車鍵進入上一級選單。然後按"b".進入單使用者模式, passwd 輸入2次相同的密碼。
然後重新啟動系統 (reboot 或是 init 3)
重置centos7 下的密碼:
同樣進入 kernel行尾新增 init=/bin/sh
ctrl +x 啟動shell引導,進入單使用者模式。
掛載根分割槽:
mount -o remount,rw /
如果系統開啟了 selinux 需要在根分割槽建立 autorelabel檔案 (touch /.autorelabel)
passwd 輸入2次一樣的密碼
重新啟動: exec /sbin/init
linux 啟動不了?
援救模式啟動系統。
模擬故障: 修改 /etc/fstab # \mv /etc/fstab /etc/fstab.bak
啟動系統:出現錯誤;
starting system logger: can『t open or create /var/run/syslogd.pid. can『t write pid .
解決方法: 在光碟機中放入系統盤。用系統盤重新引導啟動。
進入修復模式:rescue installed system
啟動到shell最終進入 bash-4.1# 命令提示符下:
可以檢視系統分割槽情況: # fdisk -l
檢視根分割槽的具體位置: tune2fs -l /dev/sda2 | more
(/dev/sda2這個引數根據具體分割槽情況 查詢到/ 目錄 因為fstab在根目錄下)
找到根分割槽後掛載根分割槽。然後重構 fstab檔案
重新啟動系統。看是否讀取fstab成功。
檔案系統受損(一般在頻繁讀寫的時候出現斷電。容易造成檔案系統錯誤)
如何檢視檔案體統型別:
1. file -s /dev/sda2
2. mount
3. df -t /dev/sda2
4. more /etc/fstab
如果系統不能修復就需要手動修復了:
1.解除安裝 分割槽 umount
2. 修復 fsck.ext4 -y /dev/sda5
linxu網路問題?
1.網路硬體異常。(網線,網絡卡,路由器,交換機)
2.檢查網絡卡是否正常工作(網絡卡配置檔案是否正確)
3.檢查dns設定 /etc/resolv.conf /etc/hosts(網域名稱解析服務衝突)
4.服務是否正常開啟。可以通過telnet或者netstat命令檢視服務是否正常。
5.訪問許可權是否開啟,從本機iptalbes 防火牆,linux核心強制訪問控制策略selinux。
6.區域網主機之間聯接是否正常,可以通過ping自身ip。ping區域網其它主機ip,ping閘道器
位址確定區域網連線正常。
檢視網路路由資訊。動態監測 :
mtr 網域名稱或ip
traceroute 網域名稱或ip
檢查服務是否正常:例如sshd 服務:
# telnet 192.168.1.123 22
(成功進入telnet後 。如何退出? ctrl + ] 進入telnet> quit 退出
檢查區域網主機之間聯機是否正常:
ping ip | telnet ip port
錯誤解析: 一般操作檔案系統時。例如 執行 mkdir 時 出現:「read-only file system「
可能是檔案系統資料塊出現不一致導致的,也有可能是磁碟故障造成的。
對於簡單的錯誤,檔案系統一般可自行修復,當遇到致命錯誤無法修復時,檔案系統為了保證資料一致性和安全,會暫時遮蔽檔案系統的寫操作,將檔案系統變為唯讀,進而出現了上面的「read-only file system」現象。
解決: fsck命令修復
解除安裝 分割槽。umount
可以檢視 檔案所占用的pid : fuser /
執行 fsck (fsck會自動識別檔案系統型別)
檔案許可權問題:
# su - swa
su: warning: cannot change directory to /home/swa: permission denied
su: /bin/bash: permission denied
檢視 /home/下的許可權:
# ls -al
drwxr-xr-x. 3 root root 4096 jan 29 04:03 .
drw-rw-rw-. 24 root root 4096 jan 29 01:41 …
drwx------ 2 swa swa 4096 jan 29 04:03 swa
這裡發現 。。 目錄沒有x (執行許可權)
# chmod 755 … (修改許可權)
成功切換登入。
還可以通過 stat 檢視 許可權
stat …
file: `…『
size: 4096 blocks: 8 io block: 4096 directory
device: 802h/2050d inode: 1046530 links: 3
access: (0755/drwxr-xr-x) uid: ( 0/ root) gid: ( 0/ root)
access: 2017-01-29 04:03:28.585978590 +0800
modify: 2017-01-29 04:03:08.505176624 +0800
change: 2017-01-29 04:03:08.505176624 +0800
linux運維系統故障排查思路
一 linux系統故障的一般處理思路 報錯資訊 查閱日誌檔案 分析定位問題 解決問題。二 linux系統無法啟動原因及解決 系統無法啟動的原因很多,常見的有下面幾種情況 1 檔案系統被破壞,常常因斷電和非法關機引起檔案系統結構不一致。修復方法是用fsck命名強制修復,進入單使用者模式或者互動介面,按...
Linux 系統故障排查思路簡析
處理linux系統故障的思路 1.重視錯誤提示資訊。2.查閱日誌檔案 message 系統日誌 服務的日誌 error 應用日誌 3.分析,定位問題。4.解決問題。忘記root密碼?重置 centos5或者6 啟動載入grub引導選單時 按esc 找到當前系統引導選項。按方向鍵找到需要的系統引導核心...
linux系統基本排查
1.檢視記憶體使用情況 free g當觀察到free欄已為0的時候,表示記憶體基本被吃完了,那就釋放記憶體吧。釋放記憶體 sync echo 3 proc sys vm drop cachessync表示將記憶體快取區內容立即同步到磁碟,為了保證安全可以多執行幾次。2.檢視磁碟使用情況 df h當發...