最近使用azkaban進行hive的任務排程,工作流結構如下
檢視yarn的schedular,發現資源並不緊缺,聯想到這是azkaban的配置問題。
檢視azkabanexecutorconfiguration引數配置,發現需要重新設定flow.num.job.threads
,該引數表示同乙個工作流中任務執行的最大並行度,預設值為10。
進入azkaban-exec-server
的conf
目錄下vim azkaban.properties
編輯azkabanexecutor的配置檔案,在末尾新增,所有的azkabanexecutor節點均需要做如下配置
# 設定工作流最大並行度為30,按照實際情況設定
# 工作流最大並行度過大會導致azkabanexecutor分配任務速度降低
然後回到azkabanexecutor的家目錄重啟azkabanexecutor
bin/shutdown-exec.sh # 關閉azkabanexecutor服務
bin/start-exec.sh # 開啟azkabanexecutor服務
curl -g "localhost:$(
<.>
/executor?action=activate"
&&echo
# 啟用azkabanexecutor服務
Azkaban Executor 設定任務並行度
近期需求,想對azkaban當前執行的最大flow數有所控制。flow中可以包含多個job。預設讀者熟悉azkaban 查到官網配置檔案 在azkaban executor的conf azkaban.properties中配置 executor.flow.threads 當前可以執行的flow的數量...
quartz任務並行
任務有並行和序列之分,並行是指 乙個定時任務,當執行時間到了的時候,立刻執行此任務,不管當前這個任務是否在執行中 序列是指 乙個定時任務,當執行時間到了的時候,需要等待當前任務執行完畢,再去執行下乙個任務。quartz框架中防止任務並行可以有兩種方案 1 如果是 通過methodinvokingjo...
Spring Task並行任務
1 需求分析 在專案通常是需要多個不同的任務並行去執行。本節實現spring task並行執行任務的方法。2 配置非同步任務 建立非同步任務配置類,需要配置執行緒池實現多執行緒排程任務。configuration enablescheduling public class asynctaskconf...