0、基礎知識
(1)pv:page view(頁面訪問量)
(2)uv:user view(訪問人數)
(3)uv表的資料如下
(4)統計每個月的使用者瀏覽量,"distinct"關鍵字是去除重複的值
select month, count(distinct id) from uv group by month;
1、union all:表聯合操作
eg:統計每天和每月的使用者訪問量
select month, count(distinct id) from uv group by month union all select day, count(distinct id) from uv group by day;
2、grouping sets:只統計指定字段
eg:統計每天和每月的使用者訪問量,grouping__id是分組的組號(兩個下劃線)
select month, day, count(distinct id), grouping__id from uv group by month, day grouping sets(month, day);
3、with cube:統計指定欄位的所有組合(包括null)
eg:統計每天和每月的使用者訪問量,grouping__id是分組的組號(兩個下劃線)
select month, day, count(distinct id), grouping__id from uv group by month, day with cube order by grouping__id;
4、with rollup:逐層統計指定字段
eg:統計每天和每月的使用者訪問量,grouping__id是分組的組號(兩個下劃線),組號扔按所有組合排序,但只顯示逐層統計的記錄
select month, day, count(distinct id), grouping__id from uv group by month, day with rollup order by grouping__id;
Hive高階聚合函式
基礎知識 1 pv page view 頁面訪問量 2 uv user view 訪問人數 3 uv表的資料如下 4 統計每個月的使用者瀏覽量,distinct 關鍵字是去除重複的值 select month,count distinct id from uv group by month 1 un...
Hive高階聚合函式 group by擴充套件
目錄 指定多種聚合的維度 層次,對多個group by union all進行替換 簡化 可實現從右到左遞減多級的統計,顯示統計某一層次結構的聚合 可以實現多個任意維度的查詢,會統計所選列中值的所有組合的聚合 按照一定規則給統計的各維度組合打標,並返回標識值。1.group by擴充套件 group...
Hive 聚合函式
用途 計算總體標準差 格式 t stddev t,t,t,用途 計算樣本標準差 格式 t stddev samp t,t,t,用途 返回組內某個數字列的方差 介面格式 double variance column name 用途 返回組內某個數字列的方差 介面格式 double var pop co...