列名
列型別說明
idstring
訂單id
date1
string
訂單日期
channelid
string
訂單渠道(商場、京東、天貓)
productid
string
產品id
regionid
string
區域名稱
amount
int商品下單數量
price
double
商品金額 列名
列型別說明
channelid
string
渠道id
channelname
string
渠道名稱
列名 列型別 說明
productid string 產品id
productname string 產品名稱 列名
類型別說明
regionid
string
區域id
regionname
string
區域名稱
操作步驟
1、使用 beeline 連線hive
!connect jdbc:hive2:
//node1:
10000
create database hanjiaxiaozhi_kylin_dw;
use hanjiaxiaozhi_kylin_dw;
-- 檢視表是否建立成功
show tables;
mkdir ~
/dat_file
匯入資料到表中
select * from dw_sales;
操作步驟:
use hanjiaxiaozhi_dw
select date1,
sum(price) as total_money,
sum(amount) as total_amount from dw_sales group by date1;
3、建立模型(model
)
4、建立立方體(cube
)
5、執行構建、等待構建完成
6、再執行sql
查詢,獲取結果
操作步驟
指定維度字段
select
t1.date1,
t2.regionid,
t2.regionname,
t3.productid,
t3.productname,
sum(t1.price)
as total_money,
sum(t1.amount)
as total_amount
from
dw_sales t1
inner
join dim_region t2
on t1.regionid = t2.regionid
inner
join dim_product t3
on t1.productid = t3.productid
group
by t1.date1,
t2.regionid,
t2.regionname,
t3.productid,
t3.productname
order
by t1.date1,
t2.regionname,
t3.productname
kylin入門到實戰 入門
kylin是一款開源的分布式資料分析工具,基於hadoop之上的sql查詢介面,能支援超大規模的資料分析。響應時間在亞秒級別,其核心是預計算,計算結果存放在hbase中。3.1fact table 事實表 事實表是指包含了大量不冗餘資料的表,其列一般有兩種,分別為包含事實資料的列,包含維表forei...
kylin入門到實戰 入門
排版亂?請移步原文獲得更好的閱讀體驗 1.概述 kylin是一款開源的分布式資料分析工具,基於hadoop之上的sql查詢介面,能支援超大規模的資料分析。響應時間在亞秒級別,其核心是預計算,計算結果存放在hbase中。2.特性 3.相關概念 3.1fact table 事實表 事實表是指包含了大量不...
Hibernate入門 入門案例
4.1 資料庫建立表 create table cst customer cust id bigint 32 not null auto increment comment 客戶編號 主鍵 cust name varchar 32 not null comment 客戶名稱 公司名稱 cust so...