1、csv serde
create table if not exists csv(
id int,
name string
)row format serde 'org.apache.hadoop.hive.serde2.opencsvserde'
load data local inpath "localpath/mycsv.csv" into table csv;
2、json serde:解析複雜的jsoncreate table if not exists csv(
id int,
name string
)row format serde 'org.apache.hadoop.hive.serde2.opencsvserde'
with serdeproperties(
)store as textfile;
hive>add jar /localpath/json-serde-1.3-jar-with-dependencies.jar;
create table if not exists json(
provice string,
city array,
person map>
)row format serde 'org.openx.data.jsonserde.jsonserde'
load data local inpath "localpath/file" into table json;
regex serde:正則匹配##查詢城市多與三個的並且青年婦女人數大於80萬的資料
select * from json3 where size(city) >=3 and person["woman"][0] > 80; [10/jan/2018:00:02:00 + 0800] [10/jan/2018:00:02:00 + 0800]
220.19c.111.12 [10/jan/2018:00:02:00 + 0800]
220.ax1.111.12 [10/jan/2018:00:02:00 + 0800] [10/jan/2018:00:02:00 + 0800]
create table if not exists regex(
host string,
data string
)row format serde'org.apache.hadoop.hive.serde2.regexserde'
with serderproperties(
"input.regex" = "^([0-9].[0-9].[0-9].[0-9](.*)$)"
)stroed as textfile
load data local inpath"localpath/file"into table regex;
select * from regex;
hive檔案儲存格式 1.textfile textfile為預設格式 儲存方式 行儲存 磁碟開銷大 資料解析開銷大 壓縮的text檔案 hive無法進行合併和拆分 2.sequencefile 二進位制檔案,以的形式序列化到檔案中 儲存方式 行儲存 可分割 壓縮 一般選擇block壓縮 優勢是檔案...
