維度表示你要對資料進行分析時所用的乙個量, 比如你要分析產品銷售情況, 你可以選擇按類別來進行分析,或按區域來分析. 這樣的按..分析就構成乙個維度。前面的示例就可以有兩個維度:型別和區域。另外每個維度還可以有子維度(稱為屬性),例如類別可以有子型別,產品名等屬性。下面是兩個常見的維度表結構:
產品維度表:prod_id, product_name, category, color, size, price
時間維度表:timekey, season, year, month, date
而事實表是資料聚合後依據某個維度生成的結果表。它的結構示例如下:
銷售事實表:prod_id(引用產品維度表), timekey(引用時間維度表), salesamount(銷售總量,以貨幣計), unit(銷售量)
上面的這些表就是存在於資料倉儲中的。從這裡可以看出它有幾個特點:
1. 維度表的冗餘很大,主要是因為維度一般不大(相對於事實表來說的),而維度表的冗餘可以使事實表節省很多空間。
2. 事實表一般都很大,如果以普通方式查詢的話,得到結果一般發的時間都不是我們可以接受的。所以它一般要進行一些特殊處理。如sql server 2005就會對事實表進行如預生成處理等。
3. 維度表的主鍵一般都取整型值的標誌列型別,這樣也是為了節省事實表的儲存空間。
事實表和維度表
維度表示你要對資料進行分析時所用的乙個量,比如你要分析產品銷售情況,你可以選擇按類別來進行分析,或按區域來分析.這樣的按.分析就構成乙個維度。前面的示例就可以有兩個維度 型別和區域。另外每個維度還可以有子維度 稱為屬性 例如類別可以有子型別,產品名等屬性。下面是兩個常見的維度表結構 產品維度表 pr...
維度表和事實表
維度表 一般是對事實的描述資訊。每一張維表對應現實世界中的乙個物件或者概念。例如 使用者 商品 日期 地區等。維表的特徵 事實表中的每行資料代表乙個業務事件 下單 支付 退款 評價等 事實 這個術語表示的是業務事件的度量值 可統計次數 個數 金額等 例如,訂單事件中的下單金額。每乙個事實表的行包括 ...
維度建模 事實表型別
維度建模數倉領域中的事實表大致分以下三種 事務事實表,週期快照事實表,累計事實表 什麼是稀疏表,什麼是稠密表?稀疏表 當天只有發生了操作才會有記錄 稠密表 當天沒有操作也會有記錄,便於下游使用 事務事實表記錄的事務層面的事實,儲存的是最原子的資料,也稱 原子事實表 事務事實表中的資料在事務事件發生後...