(1)可加性事實
是指可以按照與事實表關聯的任意維度進行彙總。
示例:交易訂單記錄表中的【使用者id】可以進行count|distinct count
彙總
(2)半可加性事實
只能按照特定維度彙總,不能對所有維度彙總。
示例:庫存可以按照地點和商品進行彙總,而按時間維度把一年中每個月的庫存累加則毫無意義。
交易訂單記錄表中的【時間維度、地區維度】按照這類「自然屬性」的維度進行統計,在主題層沒有實際意義,而偏統計報表類計算更多在dm層進行彙總,或者在dws層往往是以某個主題資料做核心,與其產生關係的其他主題資料作為度量值來進行統計彙總的。
(3)完全不可加性
。
示例:轉化率、比率型等事實。
事務事實表
事務事實表用來描述業務過程,跟蹤空間或時間上某點的度量事件,儲存的是最原子的資料,也稱為原子事實表。
示例: 交易訂單記錄表、廣告投放資料表,這類資料本身是乙個業務過程。
週期快照事實表週期快照事實表中的每行彙總了發生在某一標準週期, 如一天、 一周或一月的多個度量。 其粒度是週期性的時間段, 而不是單個事務。週期快照事實表通常包含許多資料的總計, 因為任何與事實表時間範圍一致的記錄都會被包含在內。
示例: 乙個月|一周的銷售訂單週期快照, 用於按產品統計每個月總的銷售訂單金額和產品銷售數量
另外週期快照在庫存管理和人力資源系統中有比較廣泛的應用
1 零售商希望通過產品和商店分析每天保有商品的庫存水平,分析的業務過程是零售商店庫存的每日週期快照。
2 在人力資源管理系統中, 分析包括員工數量、支付的工資、假期天數、新增員工數量、離職員工數量,晉公升人員數量等。 這時需要建立乙個每月員工統計週期快照。
累積快照事實表累積快照事實表用來表述過程開始和結束之間的關鍵步驟事件,覆蓋過程的整個生命週期,通常具有多個日期欄位來記錄關鍵時間點。當累積快照事實表隨著生命週期不斷變化時,記錄也會隨著過程的變化而被修改。
具體實現方式:拉鍊表形式表達事實資料的變化過程或稱歷史軌跡
大資料之資料倉儲分層
資料分層是一套行之有效的資料組織和管理方法,使得資料體系更有序。1 清晰資料結構 每乙個資料分層都有它的作用域和職責,在使用表的時候能更方便的定位和理解。2 減少重複開發 規範資料分層,開發一些通用的中間層資料,能夠減少極大的重複計算。3 統一資料口徑 通過資料分層,提供統一的資料出口,統一對外輸出...
資料倉儲之數倉分層
1 為什麼要分層 1.1 把複雜問題簡單化,將複雜的任務分解成多層來完成,每一層只處理簡單的任務,方便定位問題。1.2 減少重複開發 規範資料分層,通過中間層資料,能夠減少極大的重複計算,增加一次計算結果的復用性。1.3 隔離原始資料 不論是資料的異常還是資料的敏感性,使真實資料與統計資料解耦開 2...
臨床文件資料結構之 結構分層
臨床文件資料結構之 結構分層 臨床文件結構分為四層 1.臨床文件 位於電子病歷資料結構的最頂層,是由特定醫療服務活動 衛生事件 產生和記錄的患者 或保健物件 臨床診療和指導干預資訊的資料集合。如 門 急 診病歷 住院病案首頁 會診記錄等。分為兩部分 1 文件頭 主要為臨床文件中的各類標識資訊,如文件...