在資料倉儲領域有乙個概念叫transaction fact table,中文一般翻譯為「事務事實表」。事務事實表是維度建模的資料倉儲中三種基本型別事實表中的一種,另外兩種分別是週期快照事實表和累積快照事實表。
事務事實表與週期快照事實表、累積快照事實表使用相同的一致性維度,但是它們在描述業務事實方面是有著非常大的差異的。
事務事實表記錄的事務層面的事實,儲存的是最原子的資料,也稱「原子事實表」。事務事實表中的資料在事務事件發生後產生,資料的粒度通常是每個事務一條記錄。一旦事務被提交,事實表資料被插入,資料就不再進行更改,其更新方式為增量更新。
事務事實表的日期維度記錄的是事務發生的日期,它記錄的事實是事務活動的內容。使用者可以通過事務事實表對事務行為進行特別詳細的分析。
通過事務事實表,還可以建立聚集事實表,為使用者提供高效能的分析。
2) 在資料倉儲領域有乙個概念叫periodic snapshot fact table,中文一般翻譯為「週期快照事實表」。
週期快照事實表以具有規律性的、可預見的時間間隔來記錄事實,時間間隔如每天、每月、每年等等。典型的例子如銷售日快照表、庫存日快照表等。
週期快照事實表的粒度是每個時間段一條記錄,通常比事務事實表的粒度要粗,是在事務事實表之上建立的聚集表。週期快照事實表的維度個數比事務事實表要少,但是記錄的事實要比事務事實表多。
週期快照事實表的日期維度通常是記錄時間段的終止日,記錄的事實是這個時間段內一些聚集事實值。事實表的資料一旦插入即不能更改,其更新方式為增量更新。
3)在資料倉儲領域有乙個概念叫accumulating snapshot fact table,中文一般翻譯為「累積快照事實表」。
累積快照事實表和週期快照事實表有些相似之處,它們儲存的都是事務資料的快照資訊。但是它們之間也有著很大的不同,週期快照事實表記錄的確定的週期的資料,而累積快照事實表記錄的不確定的週期的資料。
累積快照事實表代表的是完全覆蓋乙個事務或產品的生命週期的時間跨度,它通常具有多個日期字段,用來記錄整個生命週期中的關鍵時間點。另外,它還會有乙個用於指示最後更新日期的附加日期字段。由於事實表中許多日期在首次載入時是不知道的,所以必須使用**關鍵字來處理未定義的日期,而且這類事實表在資料載入完後,是可以對它進行更新的,來補充隨後知道的日期資訊。
舉例來說:
訂貨日期 預定交貨日期 實際發貨日期 實際交貨日期 數量 金額 運費
特點交易事實
週期快照事實
累積快照事實
時間時期
時間跨度較短的多個時點
粒度每行代表乙個交易事件
每行代表乙個時間週期
每行代表乙個業務週期
事實表載入
新增新增
新增和修改
事實表更新
不更新不更新
新事件產生時更新
時間維業務日期
時期末多個業務過程的完成日期
事實交易活動
時間週期內的績效
限定多個業務階段內的績效
交易事實表 週期快照事實表和累積快照事實表
在資料倉儲領域有乙個概念叫transaction fact table,中文一般翻譯為 事務事實表 事務事實表是維度建模的資料倉儲中三種基本型別事實表中的一種,另外兩種分別是週期快照事實表和累積快照事實表。事務事實表與週期快照事實表 累積快照事實表使用相同的一致性維度,但是它們在描述業務事實方面是有...
週期快照事實表和累計快照事實表
累計快照事實表的這種最簡單的實現方法中沒有給出保留中間點的歷史資訊的方法,如訂單本身的變化。至少有三種方法可以用來捕獲這種中間的狀態的變化 1 在諸如月末等的固定時間間隔對累計快照再進行快照處理,即聯合使用週期快照和累計快照技術。這種累計快照的週期快照事實表應該被建立為單獨的事實表,可以降低應用的複...
累積型快照事實表 訂單表
concat函式在連線字串的時候,只要其中乙個是null,那麼將返回null hive select concat a b abhive select concat a b null nullconcat ws函式在連線字串的時候,只要有乙個字串不是null,就不會返回null。concat ws函...