cdh 簡介 CDH 1 CDH簡介

2021-10-13 09:20:44 字數 956 閱讀 1491

1、apache hadoop 不足之處

• 版本管理混亂

• 部署過程繁瑣、公升級過程複雜

• 相容性差

• 安全性低

2、hadoop 發行版

• apache hadoop

• cloudera』s distribution including apache hadoop(cdh)

• hortonworks data platform (hdp)

• mapr

• emr

3、cdh能解決哪些問題

• 1000臺伺服器的集群,最少要花費多長時間來搭建好hadoop集群,包括hive、hbase、flume、kafka、spark等等

• 只給你一天時間,完成以上工作?

• 對於以上集群進行hadoop版本公升級,你會選擇什麼公升級方案,最少要花費多長時間?

• 新版本的hadoop,與hive、hbase、flume、kafka、spark等等相容?

4、cdh簡介

• cloudera's distribution, including apache hadoop

• 是hadoop眾多分支中的一種,由cloudera維護,基於穩定版本的apache hadoop構建

• 提供了hadoop的核心

– 可擴充套件儲存

– 分布式計算

• 基於web的使用者介面

5、cdh的優點

• 版本劃分清晰

• 版本更新速度快

• 支援kerberos安全認證

• 文件清晰

• 支援多種安裝方式(cloudera manager方式)

6、cdh安裝方式

• cloudera manager

• yum

• rpm

• tarball

• cdh5.4

•cloudera manager5.4.3:

cdh 簡介 CDH 1 CDH簡介

1 apache hadoop 不足之處 版本管理混亂 部署過程繁瑣 公升級過程複雜 相容性差 安全性低 2 hadoop 發行版 apache hadoop cloudera s distribution including apache hadoop cdh hortonworks data p...

cdh使用者許可權 cdh設定hdfs許可權

通常會把 root 或者需要的使用者新增到 supergroup組,但linux下預設是沒有supergroup組。linux下預設是沒有supergroup組的 hadoop x 994 hdfs,mapred,yarn cat etc group 檢視hdfs使用者的組是hadoop hdfs ...

CDH效能優化

cdh5支援的大多數linux系統都支援乙個叫做transparent hugepage compaction特性。該特性會導致hadoop的工作負載和效能會嚴重降低 症狀 top或其他系統監控工具顯示了system cpu這個類別的cpu處理耗用很大。如果system cpu使用 30 則你的系統...