國華電力早在許久之前就曾經使用北塔網路監控產品,但由於當前國華電力資訊中心的網路管理系統呈分散狀態,其範圍也非常有限,致使無法全面了解國華電力客戶資訊網中計算機及網路系統的實時執行狀況,對網路資源配置及網路流量分布也無法進行有效監控,關鍵在於無法實現運維流程與事故報警的聯動。國華電力客戶的各項業務系統對計算機網路和it基礎平台的依賴性越來越高,對系統與網路的可用性、可靠性和穩定性也提出了更高的要求。因此,對全域性的計算機及網路系統進行高效、統
一、集中的監控和管理是保證國華電力客戶及各項業務系統正常執行的重要條件。
之前國華電力客戶的it管理主要面臨以下問題:
網路管理的覆蓋範圍不足
缺乏統一的運維管理平台
作為網路管理員,必須有效地了解網路中資料傳輸是否正常、伺服器以及網路裝置是否過載執行、區域網內部以及區域網與網際網路的連線是否正常、區域網是否受到非法者的***、使用者之間的資料傳輸是否正常等等,同時,在遇到網路時斷時續、網路內部使用者不能正常上網等網路故障時,必須能快速定位故障點並將其排除。由於網路之間的資料傳輸的不透明性,沒有統一的網路管理平台,管理手段落後,網路管理人員很難及時準確完成上述要求。
網路效能得不到充分發揮。
由於沒有網路效能方面的管理工具,網管人員不能對網路進行有效的調整和優化。
對於國華電力這個集生產業務網路和電子政務外網混合組網的網路系統來講,如果沒有乙個有效而集中的工具進行管理和分析網路的執行趨勢,找到隱藏的效能瓶頸,為網路系統管理的長期規劃提供數字依據。將難以保證網路及各項業務應用的順利執行。
從業務視角管理it
國華電力的業務系統通常由以下幾個元件組成:
網路主機
應用使用者
當某個元件出現問題,問題就會反映在業務服務儀錶盤上,使用者(包括業務部門)只關心提供給他們所使用的業務服務的狀態與效能,而不關心技術細節。
通過服務儀錶盤,國華電力資訊管理部門可以隨時了解到:
業務服務執行狀態
kpi指標(平均無故障時間mtbf、平均恢復時間mttr)
各服務元件之間的依賴關係
故障對於服務的影響
以使用者的身份感受it服務
國華電力資訊化建設為遍布全國的二十多個電廠業務支撐體系提供了大量的業務系統,從使用者體驗的角度出發,嚴格審查業務系統的可用成都,通過模擬使用者行為,對業務支撐系統的業務流程進行監測,從應用的層面監控業務支撐系統的可用性。
三步走式的故障分析策略
國華電力目前針對全國二十個電廠提供的業務支撐系統複雜度相對較高,在出現異常情況時往往在初步的故障分析中就浪費了大量的時間,為此,國華電力資訊管理中心提出了「三步走」式的監控機制,當出現故障時通過圖形化的展示介面即可快速定位到故障點。
第一步:排除周邊影響因素。即當故障時首先通過自動監控機制判斷該業務系統主機的網路連線情況、業務系統首頁開啟情況、web訪問的埠情況等,將網路、主機、業務表現三個因素綜合進行初步故障分析。
第二步:查清平台級影響因素。即在周邊條件均正常時,通過自動監控機制提供各個應用平台級底層指標的效能負載及資源消耗情況,主要體現在對一些中介軟體、資料庫、j2ee應用平台等it資源中,實現業務應用平台級的故障分析。
第三步:由於在國華電力業務支撐體系中存在大量自行開發的應用程式,對這些程式的執行效率監控就形成了故障分析的法寶,通過自動化的日誌監控機制將程式執行過程中的異常丟擲按照關鍵字以及日誌級別等方式進行過濾,使運維人員不在因錯失日誌而無法解決問題。
運維(1)什麼是運維
運維,這裡指網際網路運維,通常屬於技術部門,與研發 測試 系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。乙個網際網路產品的生成一般經歷的過程是 產品經理 需求分析 研發部門開發 測試部門測試 運維部門部署發布以及長期的執行維護。對於初創公司,運維部...
初級運維個人運維筆記
實時抓取並顯示當前系統中tcp 80埠的網路資料資訊,請寫出完整操作命令 tcpdump nn tcp port 80 如何重置mysql root密碼?一 在已知mysql資料庫的root使用者密碼的情況下,修改密碼的方法 1 在shell環境下,使用mysqladmin命令設定 mysqladm...
運維 運維知識體系(運維體系化成長)
運維標準化 工具化服務化 api 智慧型化自動化縮容 縮容服務降級 故障自癒 基於itil的運維管理體系 監控概述 快取應用運維 專案上線 服務部署 業務部署 版本管理 灰度發布 應用監控 安全運維 安全寶 整體安全方案 規範 漏洞監測 安全防護 監控運維 7x24 故障處理 系統運維 阿里雲 分布...