Hadoop 生態認知

2021-10-04 19:24:32 字數 586 閱讀 3517

hdfs

不適合互動場景;

大吞吐量;

hbase

key-value store, 適合儲存半結構化資料,例如: 資料 ;

對於同乙個key, value可以具有多個列column, 每個列可以具有不同時間緯度下的值,也就是說可以拿到某個key 對應value隨時間變化的值;

hbase適合大資料場景儲存,資料量要足夠大, pb級別;

nosql資料庫,不支援sql 作為查詢語言;

強一致性支援;

yarn

資源管理系統

mapreduce

highly scalable, fault-tolerant;

sql support throught hive;

pb規模資料分析;

spark

functional programing(scala);

10~100倍 speed up over mapreduce;

flink

流式處理;

Hadoop生態體系

1.hadoop的優勢 2.hdfs架構概述 3.yarn架構概述 4.mapreduce架構概述 mapreduce將計算過程分為兩個階段 map和reduce,如圖2 6所示。1 map階段並行處理輸入資料 2 reduce階段對map結果進行彙總 5.大資料技術生態體系 圖中涉及的技術名詞解釋...

Hadoop 生態體系

hadoop是乙個開源的大資料框架,是乙個分布式計算的解決方案。hadoop的兩個核心解決了資料儲存問題 hdfs分布式檔案系統 和分布式計算問題 mapre duce 舉例1 使用者想要獲取某個路徑的資料,資料存放在很多的機器上,作為使用者不用考慮在哪台機器上,hd fs自動搞定。舉例2 如果乙個...

部落格二 Hadoop演進與Hadoop生態

q 了解對比hadoop不同版本的特性,可以用圖表的形式呈現。a 圖表 q hadoop生態的組成 每個元件的作用 元件之間的相互關係,以圖例加文字描述呈現。a 圖例 1 hdfs 分布式檔案系統 hadoop分布式檔案系統hdfs是針對谷歌分布式檔案系統的開源實現,它是hadoop兩大核心組成部分...