Hbase 入門簡介

hbase是apache hadoop中的乙個子專案，hbase依託於hadoop的hdfs作為最基本儲存基礎單元，通過使用hadoop的dfs工具就可以看到這些這些資料儲存資料夾的結構,還可以通過map/reduce的框架(演算法)對hbase進行操作，如下圖所示：

hbase在產品中還包含了jetty，在hbase啟動時採用嵌入式的方式來啟動jetty，因此可以通過web介面對hbase進行管理和檢視當前執行的一些狀態，非常輕巧方便。

hbase是apache hadoop中的乙個子專案，現已成為apache的頂級專案。

hbase是google bigtable(基於google file system)的開源山寨版本。

hbase作為面向列的資料庫執行在hdfs之上，hdfs缺乏隨即讀寫操作，hbase正是為此而出現。hbase以google bigtable為藍本，以鍵值對的形式儲存。專案的目標就是快速在主機內數十億行資料中定位所需的資料並訪問它。

hbase是乙個資料庫，乙個nosql的資料庫，像其他資料庫一樣提供隨即讀寫功能，hadoop不能滿足實時需要，hbase正可以滿足。如果你需要實時訪問一些資料，就把它存入hbase，你可以用hadoop作為靜態資料倉儲，hbase作為資料儲存，放那些進行一些操作會改變的資料。

hbase是介於map entry(key & value)和db row之間的一種資料儲存方式。就點有點類似於現在流行的memcache，但不僅僅是簡單的乙個key對應乙個 value，你很可能需要儲存多個屬性的資料結構，但沒有傳統資料庫表中那麼多的關聯關係，這就是所謂的鬆散資料。

簡單來說，你在hbase中的表建立的可以看做是一張很大的表，而這個表的屬性可以根據需求去動態增加，在hbase中沒有表與表之間關聯查詢。你只需要告訴你的資料儲存到hbase的那個column families 就可以了，不需要指定它的具體型別：char,varchar,int,tinyint,text等等。但是你需要注意hbase中不包含事務此類的功能。

apache hbase 和google bigtable 有非常相似的地方，乙個資料行擁有乙個可選擇的鍵和任意數量的列。表是疏鬆的儲存的，因此使用者可以給行定義各種不同的列，對於這樣的功能在大專案中非常實用，可以簡化設計和公升級的成本。

hbase 是基於列的資料庫，讓我們看一下關係型資料庫和hbase資料庫儲存的對比。

行式儲存和列式儲存對比：

行式儲存

列式儲存

資料按列儲存——每一列單獨存放

資料即是索引

只訪問查涉及的列——大量降低系統io

每一列由乙個線索來處理——查詢的併發處理

資料型別一致，資料特徵相似——高效壓縮

hbase 是基於

下面的**中hbase和rdbms的對比關係

hbase

rdbms

資料型別

只有字串

豐富的資料型別

資料操作

簡單的增刪改查

各種各樣的函式，表連線

儲存模式

基於列儲存

基於**結構和行儲存

資料保護

更新後舊版本仍然會保留

替換可伸縮性

輕易的進行增加節點，相容性高

需要中間層，犧牲功能

Hbase 入門簡介

HBase 命令簡介

HBase學習筆記（一）《HBase簡介》

HBase 筆記 1 簡介

Hbase 入門簡介

HBase 命令簡介

HBase學習筆記（一） 《HBase簡介》

HBase 筆記 1 簡介

相關推薦

HBase學習筆記（一）《HBase簡介》