由google發表的關於bigtable的**啟發,使得hbase成為了基於hdfs開發的、面向列的、可伸縮的、開源的分布式資料庫,並且它提供了隨機實時讀寫功能。hbase作為hadoop生態系統中的結構化儲存工具,hdfs為它提供了高可靠性的底層儲存支援,hadoop mapreduce為它提供了高效能的海量資料處理能力(如可以實現上億條記錄的毫秒級別的查詢),zookeeper作為協調工具為它提供了穩定服務和失敗恢復機制。
hbase具有以下特點。它彌補了hadoop不能實時資料處理的缺陷,是一種非關係型資料庫(nosql,不能保證關係型資料庫的原子性、一致性、隔離性和永續性);它採用了稀疏矩陣的儲存方式,對於空值(null)資料的儲存並不占用儲存空間。hbase表中的列可根據需求來動態增加,並且每個cell(由行和列來確定)的資料可以存在多個版本;它可以通過增加節點的方式進行線性擴充套件,以使得在廉價計算機構建的集群上管理超大規模的稀疏表。
與傳統資料庫相比,hbase有諸多不同。例如,hbase的資料儲存型別單一(僅有簡單的字串型別),而關係型資料庫具有更加豐富的型別選擇和儲存方式;hbase僅具有簡單的操作(插入、刪除、清空等),並不具有像傳統關係型資料庫那樣豐富的函式及表連線操作;hbase的更新操作實際上是插入了新的資料且仍保留舊的資料,與傳統關聯式資料庫的替換修改不同;hbase的查詢只能通過行鍵來查詢,表的設計難度較大。
hive和hbase都是以hadoop為基礎構建的
HBase簡介及應用
一 關鍵字 分布式儲存系統 開源 基於列模式 適合非結構化 二 特性 海量儲存,資料可達pb級別 列式儲存,一種nosql資料庫 極易擴充套件,分布式資料庫 高併發,多個pc同時處理 稀疏,指hbase列的靈活性,可以指定任意多的列 三 什麼適合用hbase?hbase不適合解決所有的問題 資料庫量...
HBase簡介及HBase Shell操作
二 hbase shell操作 hbase的安裝可以參照 hbase偽分布式搭建 hbase是乙個高可靠性 高效能 面向列 可伸縮的nosql分布式資料儲存系統,利用hbase可實現對大型資料的實時 隨機的讀寫訪問。hbase 依賴於 hdfs 做底層的資料儲存 依賴於 mapreduce做資料計算...
HBASE簡介及部分操作例項
一 hbase簡介 hbase是乙個分布式的 面向列的開源資料庫,其名字 於hadoop資料庫 hadoop database hbase不同於一般的關聯式資料庫,它是乙個適合於非結構化資料儲存的資料庫,隸屬於apache的hadoop專案。二 hbase相關概念 表 table hbbase同樣是...