全域性索引是phoenix的重要特性,合理的使用二級索引能降低查詢延時,讓集群資源得以充分利用。 本文將講述如何高效的設計和使用索引。
全域性索引的根本是通過單獨的hbase表來儲存資料表的索引資料。我們通過如下示例看索引資料和主表資料的關係。
-- 建立資料表
create table data_table(
a varchar primary key,
b varchar,
c integer,
d integer);
-- 建立索引
create index b_idx on data_table(b)include(c);
-- 插入資料
upsert into data_table values('a','b',1,2);
當寫入資料到主表時,索引資料也會被同步到索引表中。索引表中的主鍵將會是索引列和資料表主鍵的組合值,include的列被儲存在索引表的普通列中,目的是讓查詢更加高效,只需要查詢一次索引表就能夠拿到資料,而不用去回查主表。其過程如下圖:
phoenix表就是hbase表,而hbase rowkey都是通過二進位制資料的字典序排列儲存,也就意味著row key字首匹配度越高就越容易排在一起。
我們繼續使用data_table作為示例表,建立如下組合索引。之前我們已經提到索引表中的row key是字典序儲存的,什麼樣的查詢適合這樣的索引結構呢?
create index b_c_d_idx on data_table(b,c,d);
所有字段條件以=操作符為例:
注:上表查詢中and條件不一定要和索引組合字段順序一致,可以任意組合。
在實際使用中我們也只推薦使用1~4,遵循字首匹配原則,避免觸發掃全表。5~7條件就要掃瞄全表資料才能過濾出來符合這些條件的資料,所以是極力不推薦的。
Phoenix 十 全域性索引設計實踐
全域性索引是phoenix的重要特性,合理的使用二級索引能降低查詢延時,讓集群資源得以充分利用。本文將講述如何高效的設計和使用索引。全域性索引的根本是通過單獨的hbase表來儲存資料表的索引資料。我們通過如下示例看索引資料和主表資料的關係。建立資料表 create table data table ...
全域性索引設計實踐
概述 全域性索引是phoenix的重要特性,合理的使用二級索引能降低查詢延時,讓集群資源得以充分利用。本文將講述如何高效的設計和使用索引。全域性索引說明 全域性索引的根本是通過單獨的hbase表來儲存資料表的索引資料。我們通過如下示例看索引資料和主表資料的關係。建立資料表 create table ...
Phoenix 索引生命週期
本文主要介紹phoenix索引狀態的生命週期,幫助大家解惑 為什麼我的phoenix索引不能正常使用了?索引總共有以下幾個狀態,其狀態資訊儲存在system.catalog表中。可以通過以下sql來檢視所有索引表資訊 sql中欄位 local 2 usable e unusable d active...