hive
1、可以理解為一種sql執行引擎,對sql的支援最終轉換為map/reduce任務
2、不支援更新、刪除操作,但可以插入
3、任務不是實時執行,用時一般為數分鐘到數小時
4、本身可以不儲存資料,只儲存關於資料的元資料,偏重於邏輯結構,是一種資料倉儲
5、適合於靜態大資料量的查詢、分析、彙總,不適合聯機實時資料處理
6、操作一般以全表資料為基礎,但也有分割槽等概念
hbase
1、不支援sql
2、支援增刪改查操作
3、任務實時執行
4、本身儲存資料,有複雜的物理儲存結構,是一種真正的資料庫
5、適合聯機實時資料處理
6、操作以列為基礎
總結:hive和hbase都是以hadoop為基礎構建;
hive是建立在hadoop之上為了減少mapreduce jobs編寫工作的批處理系統,是用sql替**mr的程式設計框架,而hbase是為了支援彌補hadoop對實時操作的缺陷的專案。
hive是一種能執行mapreduce作業的類sql程式設計介面,而hbase是一種非關係型的資料庫結構。
和hbase對映 hbase整合hive
hive提供了與hbase的整合,是的能夠在hbase表上使用hive sql語句進行查詢 插入操作以及進行join和union等複雜查詢 同時也可以將hive表中的資料對映到hbase中。當我們在使用hive時候,在資料量多的時候就會發現非常的慢,乙個簡單的sql都要半天,其實我們追尋他的原因很簡...
Hive和HBase的區別
hive是為了簡化編寫mapreduce程式而生的,使用mapreduce做過資料分析的人都知道,很多分析程式除業務邏輯不同外,程式流程基本一樣。在這種情況下,就需要hive這樣的使用者程式設計介面。hive本身不儲存和計算資料,它完全依賴於hdfs和mapreduce,hive中的表純邏輯,就是些...
hbase和hive的區別
hive 不想用程式語言開發mapreduce的朋友比如db們,熟悉sql的朋友可以使用hive開脫機的進行資料處理與分析工作。起源於facebook,hive在hadoop中扮演資料倉儲的角色。建立在hadoop集群的最頂層,對儲存在hadoop群上的資料提供類sql的介面進行操作。你可以用 hi...