分割槽表
create external table track_info(
ip string,
country string,
province string,
city string,
url string,
time string,
page string
) partitioned by (day string)
row format delimited fields terminated by '\t'
location '/project/trackinfo/';
crontab表示式進行排程
之後將清洗過後的資料載入進去分割槽表
統計省份
select province,count(*) from track_info where day='2013-07-21' group by province;
省份統計表
統計的資料已經在hive表track_info_province_stat而且這個表是乙個分割槽表,後續統計報表的資料可以直接從這個表中查詢,也可以將hive表中的資料匯出到關係型資料庫中去(sqoop)
第一步:etl
第二步:把elt中輸出中的資料載入到track_info分割槽表中去
第三步:各個維度統計結果的資料輸出到各自維度的表裡(track_info_province_stat)
第四步:將資料匯出(optional)
hive 分割槽表 Hive的DDL分割槽表建立
1.單分割槽表 建立表t user,指定分割槽hive xiaoliu create table t user id int,name string partitioned by country string row format delimited fields terminated by xia...
hive 建立分割槽表
必須在表定義時建立partition a 單分割槽建表語句 create table day table id int,content string partitioned by dt string 單分割槽表,按天分割槽,在表結構中存在id,content,dt三列。以dt為資料夾區分 b 雙分割...
hive建立分割槽表
靜態分割槽去掉源資料分割槽列後執行 記得指定ymd 2019 10 10 1.建立分割槽表 create tabletemp pilesmallint,mp smallint,carownerint,hmsint partitioned by ymd int row format delimited...