Cloudera Hadoop集群新增

2021-07-12 00:48:52 字數 1153 閱讀 2421

本文將詳細概述使用cloudera manager進行hadoop集群動態新增和刪除節點

注意我們這裡採用的cloudera 的c方案進行安裝集群的,所以在新增節點之前務必在新增節點新增agent服務和jdk

#安裝agent服務

rpm -ivh cloudera-manager-daemons-5.5.3-1.cm553.p0.1.el6.x86_64.rpm

rpm -ivh cloudera-manager-agent-5.5.3-1.cm553.p0.1.el6.x86_64.rpm

#安裝jdk

rpm -ivh jdk-6u31-linux-amd64.rpm

rpm -ivh oracle-j2sdk1.7-1.7.0***1.x86_64.rpm

修改agent指向的server_host

這裡可以建立乙份模板,(只包含datanode和nodemanager)

擁有模板的好處就是對於相同配置的伺服器,你可以採用相同的配置進行統一批量的配置,從而達到快速便於維護的部署

這裡有兩種方式:

通過cm啟動服務

通過cm上面的重啟按鈕進行重啟集群並選擇重新部署客戶端

至此完成

下一節將介紹如何進行刪除節點

訓練集 驗證集 測試集

訓練集loss 驗證集loss 測試集loss 乙個好的網路,二者的差距應該是很低的。但一般情況下因為網路不可避免地存在一定程度上的過擬合,所以肯定是train loss低於test lost,但如果低太多,就得考慮是過擬合的問題還是因為樣本的特徵空間不統一的問題。驗證集基本是在每個epoch完成後...

訓練集,驗證集,測試集

普通引數就是可以被梯度下降所更新的,也就是訓練集所更新的引數。超引數是指訓練開始之前設定的引數,不在梯度下降的更新範圍內,比如網路層數 網路節點數 迭代次數 學習率等等 1.訓練集 確定模型後,用於訓練普通引數 2.驗證集 交叉驗證集cv 驗證集在每個epoch訓練完成後,用來測試一下當前模型的準確...

訓練集 測試集 驗證集

訓練集 用來訓練和擬合模型。驗證集 當通過訓練集訓練出多個模型後,使用驗證集資料糾偏或比較 測試集 模型泛化能力的考量。泛化 對未知資料的 能力 from sklearn.model selection import train test split import numpy as np from ...