需要先搞明白對這台伺服器有多少已知的情況,還有故障的具體情況。不然你很可能就是在無的放矢。
必須搞清楚的問題有:
故障的表現是什麼?無響應?報錯?
故障是什麼時候發現的?
故障是否可重現?
$ w$ last
$ history
檢視一下之前伺服器上執行過的命令。看一下總是沒錯的,加上前面看的誰登入過的資訊,應該有點用。另外作為admin要注意,不要利用自己的許可權去侵犯別人的隱私哦。
$ pstree -a
$ ps aux
這都是檢視現有程序的。
$ netstat -ntlp
$ netstat -nulp
找到所有正在執行的服務,檢查它們是否應該執行。檢視各個監聽埠。在netstat顯示的服務列表中的pid 和 ps aux 程序列表中的是一樣的。
$ free -m
$ uptime
還有空餘的記憶體嗎? 伺服器是否正在記憶體和硬碟之間進行swap?
$ lspci
找到raid 卡 (是否帶bbu備用電池?)、 cpu、空餘的記憶體插槽。
伺服器運維
運維 網際網路運維,通常屬於技術部門,與研發 測試 系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。產品的整個生命週期裡運維的職責重要而廣泛,但運維工程師們的職責不僅限於這部分工作,還需要總結工作中遇到的問題,抽取出相關的技術方向 研發相關的工具和平...
python運維伺服器
好久沒有寫東西了.一直做伺服器開發需要寫一些指令碼來控 務器的啟動.本來windows自帶了任務計畫,但不是特別方便,還是用python寫了一下.需求 在固定的時間啟動伺服器 先看源 def start process date cwd os.getcwd global list threads g...
伺服器運維簡介
一 認識伺服器 良知知彼才氣百戰不殆,假如對本身維護的伺服器都不相識,何故能正確辦理伺服器宕機 補丁安裝,裂痕修復等問題。1.伺服器操縱系統範例,版本,補丁版本 2.伺服器硬碟利用率 3.伺服器執行業務的環境 4.伺服器網路設定環境等。二 按期查抄 1.伺服器電源狀態查抄 2.伺服器電扇狀態查抄 3...