hbase查詢解析

客戶端查詢乙個資料，先根據zookeeper獲取meta表所在的region資訊，meta表裡存著region的各種資訊，但是他也是在region裡的，會被乙個regionserver管理，資訊存放在節點meta-region-server中。

region表中存放著所有region的資訊，key是由表名，起始行，時間，雜湊值組成的，column有server,serverstartcode,regioninfo。server中存放的是regionserver的ip和port。regioninfo中有表名，startkey，endkey。根據這些資訊可以知道你查的資料的regionserver。

hbase支援三種查詢，rowkey,rowkey範圍，全表掃瞄。根據startkey和endkey。保證了rowkey和rowkey範圍的需求，剩下的就是全表掃瞄了。

每個regionserver的資料是兩部分組成的，一部分在記憶體中，稱為memstore，查詢memstore的過程叫做memstorescan。一部分存在檔案中，稱為storefile，查詢storefile的過程教程storefilescan。

hbase的檔案儲存格式如下

trailer記錄fileinfo,dataindex,metaindex的偏移量。根據trailer可以找到dataindex。dataindex存放的是data資料的偏移量。

data塊的儲存如下

這裡的儲存是按照key的字典順序存的。

hbase的查詢是乙個多級查詢索引的過程，根據zk找meta，根據meta找regionserver。猶豫hbase lsm的資料結構，資料分散成兩塊，一部分在記憶體，一部分在檔案。此時就分成了兩部分查詢任務，在檔案查詢的過程中，先讀取trailer找到dataindex，根據dataindex再找到data模組的索引，然後根據data裡rowkey排序的儲存模式來定位資料。

hbase查詢解析

HBase架構解析

hbase條件查詢

hbase分頁查詢

hbase查詢解析

HBase架構解析

hbase條件查詢

hbase分頁查詢

相關推薦