排版亂?請移步原文獲得更好的閱讀體驗
1.概述
kylin是一款開源的分布式資料分析工具,基於hadoop之上的sql查詢介面,能支援超大規模的資料分析。響應時間在亞秒級別,其核心是預計算,計算結果存放在hbase中。
2.特性
3.相關概念
3.1fact table(事實表):
事實表是指包含了大量不冗餘資料的表,其列一般有兩種,分別為包含事實資料的列,包含維表foreign key的列。
3.2lookup table:包含了對事實表的某些列擴充說明的字段。
3.3dimenssion table(維表):
由fact table和lookup table 抽象出來的表,包含了多個相關的列,提供對資料不同維度的觀察,其中每列的值的數目稱為cardinatily。
3.4model:用來定義使用者需要使用的hive表名,及所包含的維度列、度量列、partition列和date格式。
3.5cube:用來定義某具體查詢時會涉及到的維度列及相互之間的關係(如層級關係)、度量列的具體型別(如max,min,sum)等,乙個model下可存在多個cube。
kylin入門到實戰 入門
kylin是一款開源的分布式資料分析工具,基於hadoop之上的sql查詢介面,能支援超大規模的資料分析。響應時間在亞秒級別,其核心是預計算,計算結果存放在hbase中。3.1fact table 事實表 事實表是指包含了大量不冗餘資料的表,其列一般有兩種,分別為包含事實資料的列,包含維表forei...
Kylin 入門案例
列名 列型別說明 idstring 訂單id date1 string 訂單日期 channelid string 訂單渠道 商場 京東 天貓 productid string 產品id regionid string 區域名稱 amount int商品下單數量 price double 商品金額 ...
Nginx從入門到實戰
什麼是nginx?nginx engine x 是一款輕量級的web 伺服器 反向 伺服器及電子郵件 imap pop3 伺服器。什麼是反向 反向 reverse proxy 方式是指以 伺服器來接受internet上的連線請求,然後將請求 給內部網路上的伺服器,並將從伺服器上得到的結果返回給int...