運維標準化
工具化服務化(api)
智慧型化自動化縮容
縮容服務降級
故障自癒
基於itil的運維管理體系
監控概述
快取應用運維
專案上線、服務部署、業務部署、版本管理、灰度發布、應用監控
安全運維(安全寶)
整體安全方案、規範、漏洞監測、安全防護
監控運維
7x24 故障處理
系統運維 (阿里雲)
分布式快取、分布式檔案系統、日誌收集、環境規劃(測試、開發、生產)、架構設計、效能優化
基礎服務運維
dns、負載均衡、系統監控、運維平台、系統監控
1. 物理裝置方面
伺服器標籤化、裝置負責人、裝置採購詳情、裝置擺放
網路劃分、遠端控制卡、網絡卡埠
伺服器機型、硬碟、記憶體統
一、根據業務分類
資產命名規範、編號、型別
監控標準
2. 作業系統層面
作業系統版本
系統初始化(dns、ntp、核心引數調優、rsyslog、主機名規範)
基礎agent配置(zabbix agent 、logstash agent 、saltstack minion)
系統監控標準(cpu、記憶體、硬碟、網路、程序)
3. 應用服務層面
web伺服器選型(apache、nginx)
程序啟動使用者、埠監聽規範、日誌收集規範( 訪問日誌、錯誤日誌、執行日誌)
配置管理(配置檔案規範、指令碼規範)
架構規範(nginx+keepalived、lvs+keepalived)
部署規範(位置、包命名)
1. shell指令碼
功能性、檢查性、報表性
2. 開源工具
web化好處
服務化(api)
新增集群節點流程
呼叫cobbler-api安裝作業系統
呼叫saltstack-api進行系統初始化
呼叫dns-api解析主機名
呼叫zabbix-api給上線機器加上監控
再次呼叫saltstack-api部署軟體(安裝nginx+php)
呼叫deploy-api 將當前版本的**部署到伺服器
呼叫test-api 測試當前伺服器執行是否正常
呼叫slb-api 將該節點加入集群
智慧型化自動化擴容(虛擬機器)
觸發機制->決策系統(決策樹)
訪問量超過最大支撐量
cpu使用率
記憶體使用率
持續5分鐘
不是攻擊
資源池有可用資源
1.頻寬
2.錢當前後端服務支撐量是否超過閾值
資料庫是否可以支撐當前併發
當前自動化擴充套件佇列,是否有正在擴容的節點
其他業務相關
工具zabbix觸發action
判斷buffer裡是否有最近已經建立的虛擬機器,並查詢軟體版本是否和當前一致
openstack 建立虛擬機器
saltstack配置環境 ----監控
部署系統,部署當前**
測試服務是否可用(注意間隔和次數) 例如 curl,不返回200 sleep 5秒再訪問 sleep 20 再訪問
加入集群
通知(簡訊、郵件通知)
工具2部署openstack
建立虛擬機器
部署mesos + docker + marathon
自動化建立docker容器進行自動化擴容
自動化縮容
觸發條件和決策
從集群中移除節點 --關閉監控–移除
通知移除節點放在buffer裡,以待未來擴容
buffer裡超過一天的虛擬機器,自動關閉,存放於xx區
xx區的虛擬機器,每7天清理刪除 縮容
服務降級
故障自癒
基於itil的運維管理體系
服務是向客戶提供價值的一種手段,使客戶不用承擔特定的成本和風險就可以獲得所期望的結果
服務管理
特定的組織能力
itsm(it service manage)
itil(it 基礎架構庫)是itsm的最佳實踐,是一種標準
管什麼
pdca四階段
服務台(呼叫中心)
監控概述
監控物件的指標
監控範圍(監控哪些物件)
硬體監控
安裝 使用方式
網路配置
機房巡檢
路由器和交換機的監控
系統監控
執行佇列
使用率
核心態
確定服務型別
確定效能基準線
記憶體監控
硬碟(iotop)
iftop(網路io)
ibm nmon(提供系統狀態報表)
應用程式監控
zabbix
模式 體系
組成
自定義監控項
緩衝 buffer 寫緩衝
存放介質
特性 redis集群
redis cluster
proxy
日常運維工作的知識體系
一 基礎服務類。1 安裝windows linux作業系統,系統ip配置,系統初始化 包括引數優化 各個平台基礎軟體的安裝,包括各個軟體的配置優化,搭建集群環境。2 日常系統伺服器的維護 服務狀態的監控。3 負載均衡系統的維護,如lvs nginx f5 haproxy等。4 web伺服器維護。5 ...
svc 運維知識體系及職業
100個命令 三劍客 正則 linux啟動 目錄結構 常見配置路徑 檔案屬性 鏈結知識 許可權 使用者管理 磁碟管理 網路基礎 配置ip路由等 搭建中小規模 集群10 20臺規模 ssh批量管理,rsync資料同步,crond定時任務,批量分發檔案 ansible inotify,sersync同步...
svc 運維知識體系及職業
100個命令 三劍客 正則 linux啟動 目錄結構 常見配置路徑 檔案屬性 鏈結知識 許可權 使用者管理 磁碟管理 網路基礎 配置ip路由等 搭建中小規模 集群10 20臺規模 ssh批量管理,rsync資料同步,crond定時任務,批量分發檔案 ansible inotify,sersync同步...