在 kubernetes 開源生態中,資源監控有metrics-server
、prometheus
等,但這些監控並不能實時推送 kubernetes 事件,監控準確性也不足。當 kubernetes 集群中發生 pod因為 oom 、拉取不到映象、健康檢查不通過等錯誤導致重啟,集群管理員其實是不知道的,因為 kubernetes 有自我修復機制,pod宕掉,可以重新啟動乙個。這樣讓集群管理員很難立即發現服務問題。
kubernetes中,事件分為兩種:
例子:
$ kubectl get events
last seen type reason object message
58m normal scalingreplicaset deployment/demo scaled down replica set demo-8b85c64cb to 0
5m7s warning unhealthy pod/demo-79844f78b8-nd5jz readiness probe failed: get dial tcp 192.168.1.68:8080: connect: connection refused
阿里雲開源 kubernetes 事件離線工具kube-eventer
,能很好的解決這個問題。
下面是以釘釘
做為接收器,通過釘釘機械人通知到相關人員或者相關群
dingtalk阿里 sls 服務elasticsearchhoneycombinfluxdbkafkamysql
K8s部署prometheus監控K8s細節
prometheus 一些配置檔案可以再github上找到。部署 root kube prometheus manifests 目錄下所有檔案 部署 root kube prometheus manifests setup 目錄下所有檔案 要注意的是自己要建立乙個工作空間 如果報錯執行下面語句 部署...
k8s集群部署 docker部署k8s安裝篇
1 安裝docker 緊接著配置乙個穩定 stable 的倉庫 倉庫配置會儲存到 etc yum.repos.d docker ce.repo檔案中 yum config manager add repo 更新yum安裝的相關docke軟體包 安裝docker ce yum update y yum...
K8s集群環境搭建 K8s安裝(2)
k8s集群環境搭建 基礎環境配置 1 k8s集群環境搭建 k8s安裝 2 k8s集群環境搭建 安裝keepalived和haproxy 3 k8s集群環境搭建 k8s集群初始化 4 k8s集群環境搭建 安裝metrics和dashboard 5 一 安裝docker 所有節點 檢視docker版本有...