本文介紹3個資料中心常見的問題,管理員通過it監控操作,能夠提前做好準備處理這些問題。
操作問題
如果修復bug的周期長達12個月甚至更長,這清楚的表明了現有系統(例如cobol)以及造成如此長週期的操作流程應該被替換掉了。資料中心管理員應該考慮將這些已有系統替換,可以替換為乙個saas服務,也可以是用sql和c重寫。如果替換系統時,公司並沒有意願更改商業流程,那你將付出巨大開銷,並且很大比例的軟體將會執行得很低效。特定部門迅速增長的系統更改請求,即是乙個警告,表明一些員工抗拒改變商業流程。
在操作層面上,管理員最重要的工作,就是收集趨勢資料,了解資料中心正在發生什麼。如果一項工作需要原先兩倍的時間才能執行完,則必須弄清楚為什麼會這樣。管理員需要隨時監控儲存、網路和伺服器的執行狀態,通過這些監控結果分析出系統瓶頸和錯誤。乙個好的it監控系統將需要花費大量金錢和操作人員時間,但乙個壞的靠暴力收集資料的系統會收集過多的資料,造成資訊過載,而非找到問題的根源。
更新儲存
企業級儲存將變得更為複雜。它已經從簡單的主/從硬碟驅動器(hhd)變為一堆ssd和大容量sata hdd的組成。未來2年將出現非易失性記憶體規格(nvdimm)的儲存器,3d xpoint非易失性儲存器標準(nvme)的ssd,高容量sata ssd和越來越多的網路和集群選擇,例如虛擬儲存區域網路(san),超融合系統和遠端直接記憶體訪問鏈結。當這些技術形成主流後,自動化的it監控將是唯一的優化運維的方式。
更先進的網路
網路也會造成資料中心一系列的問題。採用模版和策略來控制虛擬區域網建立和關閉將變得更為普遍,並將會被用到業務部門使用者的雲服務配置中去。
然而這些使用者並沒有義務做優化網路的工作,當乙個新的雲服務部署完後,他們仍然可能會繼續使用傳統的較鬆散的終端。使用自動化工具找出網路瓶頸對改善使用者使用體驗將非常有用。 監控一條鏈路潛在的和承載吞吐量的趨勢也是非常重要的。這可以揭示出哪些工作流量需要被重新分配,並且驗證這些改變是否有效。
隨著雲和集群編配技術的進步,智慧型負載平衡方法將變得更為重要,它能夠將需要消耗大量資源的應用例項分布到只有較輕網路負載的環境中。 伺服器還有一些額外的模組需要被監控,包括動態記憶體(dram)和cpu占有率。很快將出現一些雲配屬工具,能夠指出系統熱點,並自動化的進行負載平衡。
目前這還是乙個正在發展的方向,公司還需要根據歷史資料,以每個應用為單位進行平衡決策。 任何乙個好的it監控軟體都具備當某些值超過門限後報警的功能。找到並使用這些軟體,能夠幫助快速定位問題。一些工具能夠將終端上的乙個慢速工作的報警轉變為乙個秒級更新的應用程序列表中的標記,無需人工從實際系統程序樹中去深入分析,例如eg innovations enterprice 6.1和printerlogic公司的printer installer.
總的來說,用好it監控軟體和趨勢分析工具,能夠使it管理員能更好的響應資料中心問題,並快速處理現實危機。
應對資料中心常見問題的IT監控策略
作為乙個資料中心管理員,如果缺乏更大的視野,很容易陷入到千篇一律的解決問題的工作中。然而,資料中心的問題會從執行的方方面面產生,從操作故障到巨集觀經濟問題。與其等待不可避免的問題出現,管理員應該積極的收集資料 分析趨勢 做好應對準備。本文介紹3個資料中心常見的問題,管理員通過it監控操作,能夠提前做...
應對資料中心的能源效率挑戰
鑑於剛剛過去的十月份被資料中心業界宣傳推廣為節能宣傳月 energy awareness month 同時世界能源日 world energy day 也於10月22日正式舉行,能源效率問題再一次成為了許多資料中心管理人員所備受關注的話題。雖然對於跨諸多行業的專業人士來說,能源效率都是乙個相當重要的...
應對資料中心的能源效率挑戰
鑑於剛剛過去的十月份被資料中心業界宣傳推廣為節能宣傳月 energy awareness month 同時世界能源日 world energy day 也於10月22日正式舉行,能源效率問題再一次成為了許多資料中心管理人員所備受關注的話題。雖然對於跨諸多行業的專業人士來說,能源效率都是乙個相當重要的...