我們知道大資料平台有很多服務datanode,namenode,nodemananger,resourcemanager等等,這些服務可能會在跑任務的過程中直接退出,那麼我們如何監控這些服務並重啟服務呢?接下來總結一些這方面的監控指令碼以備不時之需。
1、datanode監控(hadoop_datanode_monitor.sh)
#!/bin/bash
source $home/.bashrc
function logger()
#monitor base function
function proc_monitor()
#minitoring datanode
proc_monitor "datanode"
2、namenode監控(hadoop_namenode_monitor.sh)
#!/bin/bash
source $home/.bashrc
function logger()
#monitor base function
function proc_monitor()
#minitoring namenode
proc_monitor "namenode"
3、nodemanager監控(hadoop_nodemanager_monitor.sh)
#!/bin/bash
source $home/.bashrc
function logger()
#monitor base function
function proc_monitor()
#minitoring nodemanager
proc_monitor "nodemanager"
4、resourcemanager監控(hadoop_resourcemanager_monitor.sh)
#!/bin/bash
source $home/.bashrc
function logger()
#monitor base function
function proc_monitor()
#minitoring resourcemanager
proc_monitor "resourcemanager"
5、hmaster監控(hbase_master_monitor.sh)
#!/bin/bash
source $home/.bashrc
function logger()
#monitor base function
function proc_monitor()
#minitoring master
proc_monitor "master"
6、hregionserver監控(hbase_regionserver_monitor.sh)
#!/bin/bash
source $home/.bashrc
function logger()
#monitor base function
function proc_monitor()
#minitoring regionserver
proc_monitor "regionserver"
大資料平台監控服務及自動重啟指令碼
我們知道大資料平台有很多服務datanode,namenode,nodemananger,resourcemanager等等,這些服務可能會在跑任務的過程中直接退出,那麼我們如何監控這些服務並重啟服務呢?接下來總結一些這方面的監控指令碼以備不時之需。1 datanode監控 hadoop datan...
windows服務監控及重啟指令碼
1 本篇目的 監控指定windows服務,停止後重啟。1 echo off 2rem 定義迴圈間隔時間和監測的服務 3set secs 600 4set srvname dot3svc 5 6echo.7 echo 8 echo 查詢計算機服務的執行狀態 9 echo 每間隔 secs 秒鐘進行一次...
大資料監控平台實踐之路
二 架構設計 influxdb grafana 大資料監控平台實踐之路 監控粒度 監控指標完整性 監控實時性是評價監控系統的三要素。從分層體系可以把監控系統分為三個層次 業務系統本質目的是為了達成業務目標,因此監控業務系統是否正常最有效的方式是從資料上監控業務目標是否達成。對業務運營資料進行監控,可...