hdfs
不適合互動場景;
大吞吐量;
hbase
key-value store, 適合儲存半結構化資料,例如: 資料 ;
對於同乙個key, value可以具有多個列column, 每個列可以具有不同時間緯度下的值,也就是說可以拿到某個key 對應value隨時間變化的值;
hbase適合大資料場景儲存,資料量要足夠大, pb級別;
nosql資料庫,不支援sql 作為查詢語言;
強一致性支援;
yarn
資源管理系統
mapreduce
highly scalable, fault-tolerant;
sql support throught hive;
pb規模資料分析;
spark
functional programing(scala);
10~100倍 speed up over mapreduce;
flink
流式處理;
Hadoop生態體系
1.hadoop的優勢 2.hdfs架構概述 3.yarn架構概述 4.mapreduce架構概述 mapreduce將計算過程分為兩個階段 map和reduce,如圖2 6所示。1 map階段並行處理輸入資料 2 reduce階段對map結果進行彙總 5.大資料技術生態體系 圖中涉及的技術名詞解釋...
Hadoop 生態體系
hadoop是乙個開源的大資料框架,是乙個分布式計算的解決方案。hadoop的兩個核心解決了資料儲存問題 hdfs分布式檔案系統 和分布式計算問題 mapre duce 舉例1 使用者想要獲取某個路徑的資料,資料存放在很多的機器上,作為使用者不用考慮在哪台機器上,hd fs自動搞定。舉例2 如果乙個...
部落格二 Hadoop演進與Hadoop生態
q 了解對比hadoop不同版本的特性,可以用圖表的形式呈現。a 圖表 q hadoop生態的組成 每個元件的作用 元件之間的相互關係,以圖例加文字描述呈現。a 圖例 1 hdfs 分布式檔案系統 hadoop分布式檔案系統hdfs是針對谷歌分布式檔案系統的開源實現,它是hadoop兩大核心組成部分...