實際工作中搭建cdh集群的話,理論上來說,機子越多越好,如果資源有限的話,建議前期最好4臺機子,4臺機子的話,針對hadoop集群而言 可以設定為1主3從,
如果考慮到ha的話,就需要最少5臺機子,本案例採用的伺服器配置如下
ip主機名
cpu記憶體
硬碟角色
172.20.9.1
hadoop1
8h64g
50gcm-server、namenode、secondarynamenode、yarn resourcemanager
172.20.9.2
hadoop2
8h32g
50gdatanode、nodemanager
172.20.9.3
hadoop3
8h32g
50gdatanode、nodemanager
這裡部署就用3臺機子來演示
所有節點都需要配置
# 這裡我設定的是hadoop1、hadoop2、hadoop3
hostnamectl set-hostname
大資料平台CDH和HDP
cdh cloudera s distribution,including apache hadoop 是hadoop眾多分支中的一種,由cloudera維護,基於穩定版本的apache hadoop構建,並整合了很多補丁,可直接用於生產環境。cloudera manager則是為了便於在集群中進行...
大資料平台CDH集群資料遷移的常見問題與解決方案
一般而言,資料遷移常用於集群之間,但集群之間往往會出現cdh版本不同,那麼如何查詢集群的cdh版本呢?可以使用命令hadoop version檢視 不同版本的cdh的資料遷移方式也不一樣,下面來介紹下相同版本和不同版本cdh 的資料遷移方式 注意 ip1 源集群,ip2 目標集群 一 相同版本 使用...
《Hadoop與大資料探勘》 1 2 大資料平台
大資料平台有哪些呢?一般認為大資料平台分為兩個方面,硬體平台和軟體平台。硬體平台一般如open stack amazon雲平台 阿里雲計算等,類似這樣的平台其實做的是虛擬化,即把多台機器或一台機器虛擬化成乙個資源池,然後給成千上萬人用,各自租用相應的資源服務等。而軟體平台則是大家經常聽到的,如had...