block
if the job outputs are to compressed as sequencefiles,
how should they be compressed? should be one of none, record or block.
d. 使用sequence file作為最終檔案格式(reduce輸出資料的檔案格式,可以對每個block進行壓縮)
hive> set mapred.output.compression.type=block;
hive> set hive.exec.compress.output=true;
hive> set mapred.output.compression.codec=org.apache.hadoop.io.compress.gzipcodec;
hive> create table final_comp_on_gz_seq
> row format delimited fields terminated by '\t'
> stored as sequencefile
> as select * from a;
對sequence file而言,可以使用gzip進行壓縮,原理是sequence file支援按照塊進行壓縮(每個塊都是完整的資料)
Hive相關概念
hive 基於hadoop之上的乙個離線資料倉儲,使用hdfs作為底層儲存,可以將結構化的資料檔案對映為一張資料庫表,並提供簡單的sql查詢功能,可以將sql語句轉換為mapreduce任務進行執行。hive主要分為以下幾個部分 1.使用者介面 使用者介面主要有三個 cli,client 和 web...
hive相關知識
hivesql的相關知識 1.union 和 union all的區別 兩個都能進行全連線,但是表字段名稱需要相同。不同的是union連線後的結果去重,union all的結果不去重 2.rank over 和row number over 的區別 rank over 的結果對存在的並列現象會全部顯...
js相關筆記(十五)
1.offset取值返回時乙個number型別的數值,但是它不會返回帶小數的整數,內部做了四捨五入的處理,如style.left 9.4px,offsetleft獲取到的值是9,然而style.left 9.5px,offsetleft獲取到的值是10。2.勻速動畫的原理 this.style.le...