一般來說伺服器的可持續工作能力通常用mtbf(平均無故障時間)來衡量的。伺服器每年的宕機時間都非常短暫,當伺服器可靠性為99%時,每年停機大約在87.6 小時;但當可靠性高達5個9的時候即99.999%,它年停機時間僅為5分鐘了。那麼為什麼伺服器能長時間持續地工作呢?
執行環境
首先是執行環境,一般機房要求無塵,室內環境良好,溫度控制在零上4到40度,否者對電子零件有影響。通常電子資訊裝置的工作環境溫度應在18℃~30℃之間,溫度過高或過低將使計算機受到損害並加速其老化,從而影響伺服器的使用壽命。因此,伺服器一般都放在空氣流動的地方,有24小時的空調為其服務。
執行狀態
伺服器的執行狀態影響著其使用壽命,一般伺服器cpu的負荷總在80%以上會對風扇和cpu的壽命都有影響,所以伺服器一般不會超頻工作。另外工作人員也會定期檢查伺服器的硬體工作狀態,有小問題及時解決。應該能用五年以上。
可靠的電源
伺服器的工作離不開電源,同時電源也是計算機產生故障的主要因素。首先,必須確保伺服器使用的是適當功率的電源。伺服器電源的電壓一般為220v/50hz,並朝著低壓化、大功率化、高密度、高效率、分布式化等方向發展。ups保證了伺服器在突然斷電等狀況下還可以繼續工作。其次,伺服器所使用的電源與照明電源分開,使用單獨的插座。
強大的硬體條件
伺服器也是電腦,但一般來說,伺服器是比較特殊的機器,因為「工作崗位」的關係,有些地方設計得更「特別」一點。針對伺服器穩定壓倒一切的特點,伺服器cpu內建多種容錯糾錯機制;記憶體使用帶ecc校驗晶元的記憶體,資料干擾出錯風險比非ecc記憶體降低很多;伺服器用的都是純銅散熱器、純銅散熱片,而且機箱風扇也都裝到位了。內建的整合顯示卡大多數時間不需要工作。主機板都是6層以上pcb,硬碟設計壽命是普通硬碟的2倍等等,這些硬體的設計為伺服器的穩定提供了進一步的支撐。
專用的作業系統
專為伺服器設計的windows server以及unix和linux類作業系統可以在不需要外接顯示器的情況下,關掉圖形化介面的服務程式,甚至伺服器的作業系統預設連聲卡都沒開啟的。專用的作業系統提供了高安全性、高可靠性、高可用性和高可擴充套件性,為伺服器的穩定性做出了巨大貢獻。
冗餘設計
冗餘,指重複配置系統的一些部件,當系統發生故障時,冗餘配置的部件介入並承擔故障部件的工作,由此減少系統的故障時間。高階伺服器產品中普遍採用雙電源系統,這兩個電源是負載均衡的,即在系統工作時它們都為系統提供電力,當乙個電源出現故障時,另乙個電源就承擔所有的負載。有些伺服器系統實現了dc的冗餘,另一些伺服器產品,如micron公司的netframe 9000實現了ac、dc的全冗餘。
優秀的集群架構
如果伺服器集群中有一台出現了硬體故障怎麼辦呢,例如cpu或者記憶體的故障,十分這樣伺服器就會掛掉導致宕機呢?其實,我們優秀的軟體工程師設計出集群架構可以讓多台伺服器執行同乙個業務,一台或者多台伺服器離線並不會對整體業務造成嚴重影響。
專業的維護
世界沒有從來不壞的伺服器,這是可以肯定的。業務對可靠性的近似苛刻要求也有其不得已的苦衷。根據統計,金融企業每次宕機損失平均為1000萬美元,所造成的無形資產損失更是無法估量。所以專業的維護對於伺服器機房來說也是必不可少。伺服器在設計的時候做了大量的備份冗餘,在使用的時候運維在不停排除故障。專業的維護人員設計了hadoop、hdfs、lvs等等一系列的維護系統和災後修復策略。超多的維護費用、電費、監控費、安保費等為伺服器的穩定執行做出了後勤保障。
為什麼伺服器需要備份?
在雲計算系統中,許多常見的故障可能性,將導致嚴重的資料丟失 軟體故障 應用系統出現錯誤 檔案系統崩潰。今年年中,廣州一區主備兩條運營商網路鏈路同時中斷,導致國內部分使用者出現資源訪問失敗 控制台登入異常,甚至資料完全丟失,便是軟體故障造成的事故。偶然故障 人為失誤 非授權操作等,典型案例如近日國內一...
為什麼伺服器會被攻擊
為什麼伺服器會被攻擊?網際網路中的伺服器都難免會出現被攻擊的情況,被掛馬更是常見,伺服器主要被攻擊的原因一般有以下幾種。惡性競爭 由於無處不在的競爭關係,導致了網際網路環境越來越惡劣,一些攻擊手段層出不窮,遭受到惡意攻擊的頻率也更高。來自同行業其他競爭對手的攻擊,讓你的伺服器宕機,爭奪使用者去他們那...
mysql伺服器為什麼老死?
歡迎使用 phpmyadmin 錯誤mysql 返回 文件 無法連線 無效的設定。mysqli real connect hy000 2002 connection refused 使用配置檔案中定義的控制使用者連線失敗。mysqli real connect hy000 2002 connecti...