hive索引
建立索引
create index tablename_index
on table (col1)
as 'org.apache.hadoop.hive.ql.index.compact.compactindexhandler'
with deferred rebuild
idxproperties('creator' = 'me', 'created_at' = 'some_time')
in table tablename_index_table//要求索引處理器在一張新錶中保留索引資料
partitioned by (col1, col2)
comment '...';
bitmap索引
應用於排重後值較少的列
create index tablename_index
on table (col1)
as 'bitmap'
with deferred rebuild
idxproperties('creator' = 'me', 'created_at' = 'some_time')
in table tablename_index_table
partitioned by (col1, col2)
comment '...';
重建索引
alter index tablename_index
on table
partition (col1 = '')
rebuild;
顯示索引
show formatted index on ;
//formatted,可以使輸出中包含有列名稱;indexs可以列舉出多個索引資訊
刪除索引
drop index if exists tablename_index on table ;
//如果有索引表,刪除乙個索引將會刪除這個索引表
//如果被索引的表被刪除,其對應的索引和索引表也會被刪除;原始表的某個分割槽被刪除,其對應的分割槽索引也會被刪除
《Hive程式設計指南》之Hive環境安裝
hive 1 解壓 2 配置 hadoop home hive home等環境變數 3 修改配置檔案hive conf cp hive default.xml.template hive site.xml 修改hive.metastore.schema.verification的值為false 建立...
Hive程式設計指南 學習筆記01
第四章 hql的資料定義 1 建立資料庫 create database financials create database if not exists financials 2 檢視資料庫 show databases 模糊查詢資料庫 show databases like h.3 建立資料庫修...
Hive程式設計指南 要點總結(1)
1.當對3個或更多的表進行join連線時,若是on子句都是使用相同的連線鍵的話,那麼只會產生乙個mapreduce任務。2.使用者在進行多表查詢時,需要保證連續查詢的表的大小從左至右是依次增大的。因為hive假定查詢中最後乙個表是最大的表,在對每行記錄進行連線操作時,它會嘗試將其他表快取起來,然後掃...