hive和hbase都是hadoop集群下的工具,hive是對mapreduce的優化,而hbase則是hdfs資料儲存的大管家。
1.hive中的表為純邏輯表,僅僅對錶的元資料進行定義。hive沒有物理儲存的功能,它完全依賴hdfs和mapreduce。它可以將結構化的資料檔案對映為為一張資料庫表,並提供完整的sql查詢功能,並將sql語句最終轉換為mapreduce任務進行執行。hbase表則是物理表,適合存放非結構化的資料。
2.hive是在mapreduce的基礎上對資料進行處理,而mapreduce的資料處理依照行模式;而hbase為列模式,這樣使得對海量資料的隨機訪問變得可行。
3.hbase的儲存表儲存密度小,因而使用者可以對行定義成不同的列;而hive是邏輯表,屬於稠密型,即定義列數,每一行對列數都有固定的資料。
4.hive使用hadoop來分析處理資料,而hadoop系統是批處理系統,所以資料處理存在延時的問題;而hbase是準實時系統,可以實現資料的實時查詢。
6.hive全面支援sql,一般可以用來進行基於歷史資料的挖掘、分析。而hbase不適用於有join,多級索引,表關係複雜的應用場景。
Hive和HBase的區別
hive是為了簡化編寫mapreduce程式而生的,使用mapreduce做過資料分析的人都知道,很多分析程式除業務邏輯不同外,程式流程基本一樣。在這種情況下,就需要hive這樣的使用者程式設計介面。hive本身不儲存和計算資料,它完全依賴於hdfs和mapreduce,hive中的表純邏輯,就是些...
hbase和hive的區別
hive 不想用程式語言開發mapreduce的朋友比如db們,熟悉sql的朋友可以使用hive開脫機的進行資料處理與分析工作。起源於facebook,hive在hadoop中扮演資料倉儲的角色。建立在hadoop集群的最頂層,對儲存在hadoop群上的資料提供類sql的介面進行操作。你可以用 hi...
Hive和HBase的區別
以下 由網上內容 整理 hive是為了簡化編寫mapreduce程式而生的,使用mapreduce做過資料分析的人都知道,很多分析程式除業務邏輯不同外,程式流程基本一樣。在這種情況下,就需要hive這樣的使用者程式設計介面。hive本身不儲存和計算資料,它完全依賴於hdfs和mapreduce,hi...