一、hbase與hive的對比
hive和hbase有各自不同的特徵:hive是高延遲、結構化和面向分析的,hbase是低延遲、非結構化和面向程式設計的。hive資料倉儲在hadoop上是高延遲的。
其中hbase位於結構化儲存層,hadoop hdfs為hbase提供了高可靠性的底層儲存支援,hadoop mapreduce為hbase提供了高效能的計算能力,zookeeper為hbase提供了穩定服務和failover機制。
通過hive的儲存介面,hive和hbase可以整合使用。
1) hive
(1) 資料倉儲
hive的本質其實就相當於將hdfs中已經儲存的檔案在mysql中做了乙個雙射關係,以方便使用hql去管理查詢。(2) 用於資料分析、清洗
hive適用於離線的資料分析和清洗,延遲較高。(3) 基於hdfs、mapreduce
hive儲存的資料依舊在datanode上,編寫的hql語句終將是轉換為mapreduce**執行。2) hbase
(1) 資料庫
是一種面向列儲存的非關係型資料庫。(2) 用於儲存結構化和非結構話的資料
適用於單錶非關係型資料的儲存,不適合做關聯查詢,類似join等操作。(3) 基於hdfs
資料持久化儲存的體現形式是hfile,存放於datanode中,被resionserver以region的形式進行管理。
面對大量的企業資料,hbase可以直線單錶大量資料的儲存,同時提供了高效的資料訪問速度。
Hive與Hbase的區別
以下 由網上內容 整理 hive是為了簡化編寫mapreduce程式而生的,使用mapreduce做過資料分析的人都知道,很多分析程式除業務邏輯不同外,程式流程基本一樣。在這種情況下,就需要hive這樣的使用者程式設計介面。hive本身不儲存和計算資料,它完全依賴於hdfs和mapreduce,hi...
hive與hbase的區別
hive與hbase的區別 hive 核心將sql轉換為mapreduce 將儲存在hdfs上的結構化的資料對映成一張表,並提供類sql語句進行查詢 hive的特點 高延遲儲存的是結構化的資料 hive是面向分析,使用的hql語言 hive不能接入業務使用 hive是面向行儲存的資料倉儲工具,是一種...
Hbase與hive的區別
hive是乙個構建在hadoop 基礎之上的資料倉儲。通過hive可以使用hql語言查詢存放在hdfs 上的資料。hql是一種類sql語言,這種語言最終被轉化為map reduce.雖然hive提供了sql查詢功能,但是hive 不能夠進行互動查詢,因為它只能夠在haoop上批量的執行hadoop。...