textfile
: 純文字檔案儲存格式,不壓縮,也是hive
的預設儲存格式,磁碟開銷大,資料解析開銷大
第二類:二進位制檔案儲存
>
>
hive.default.fileformatname
>
>
textfilevalue
>
>
expects one of [textfile, sequencefile, rcfile, orc].
default file format for create table statement. users can explicitly override it by create table ... stored as [format]
description
>
property
>
hiev預設用的是textfile
,就是說不壓縮
hive> set hive.
default
.fileformat;
hive.
default
.fileformat=textfile
儲存為rcfile
測試
create
table emptest
( empno int
, ename string,
job string,
mgr int
, hiredate date
, sal double
, comm double
, deptno int
)row format delimited
fields
terminated
by','
stored as rcfile;
插入資料
insert into emptest
select * from emp;
create
table emptest1
( empno int
, ename string,
job string,
mgr int
, hiredate date
, sal double
, comm double
, deptno int
)row format delimited
fields
terminated
by','
stored as textfile;
insert
into emptest1 select
*from emp;
hive儲存格式
textfile 預設格式,行儲存,匯入資料時直接把資料檔案拷貝到hdfs的hive表目錄 hive location 資料檔案可先經過gzip等壓縮,再導hive表 系統自動檢查,執行查詢時自動解壓 但使用這種方式,hive不會對資料進行切分,從而無法對資料進行並行操作.優點 資料載入快 load...
Hive儲存格式
hive的四種儲存格式 textfile sequencefile rcfile parquet 列式儲存和行式儲存的比較 優點缺點 行式儲存 一行資料是一條記錄,放在同乙個block塊中 只查詢幾個列時,也會讀取整行的資料,當資料量大時,影響效能 方便進行insert update操作 不同型別的...
hive 儲存格式
hive有textfile,sequencefile,rcfile三種檔案格式。textfile為預設格式,建表時不指定預設為這個格式,匯入資料時會直接把資料檔案拷貝到hdfs上不進行處理。sequencefile,rcfile格式的表不能直接從本地檔案匯入資料,資料要先匯入到textfile格式的...