幵始維度建模工作前,專案組需要理解業務需求,以及作為基礎的源資料的實際情況。 通過與、 ik務代表交流來發現需求,用於理解他們的基於關鍵效能指標、競爭性商業問題、 決策制定過程、支援分析需求的目標。同時,資料實際情況可以通過與源系統專家交流, 構建高層次資料分析訪問資料可行性來揭示。
維度模型設計期間主要涉及 4 個主要的決策: (1) 選擇業務過程 (2) 宣告粒度 (3) 確認維度 (4) 確認事實 要回答上述問題,需要考慮業務需求以及協作建模階段涉及的底層資料來源。按照業務 過程、粒度、維度、事實宣告的流程,設計組確定表名和列名、示例領域值以及業務規則。 而業務資料管理代表必須參與詳細的設計活動,以確保涵蓋正確的業務。
業務過程是組織完成的操作型活動,例如,獲得訂單、處理保險索賠、學生課程註冊 或每個月每個賬單的快照等。業務過程事件建立或獲取效能度量,並轉換為事實表中的事 實。多數事實表關注某一業務過程的結果。過程的選擇是非常重要的,因為過程定義了特 定的設計目標以及對粒度、維度、事實的定義。每個業務過程對應企業資料倉儲匯流排矩陣 的一行。
宣告粒度是維度設計的重要步驟。粒度用於確定某一事實表中的行表示什麼。粒度聲 明是設計必須履行的合同。在選擇維度或事實前必須宣告粒度,因為每個候選維度或事實 必須與定義的粒度保持一致。在所有維度設計中強制實行一致性是保證 bi 應用效能和易用 性的關鍵。在從給定的業務過程獲取資料時,原子粒度是最低級別的粒度。我們強烈建議 從關注原子級別粒度資料幵始設計,因為原子粒度資料能夠承受無法預期的使用者查詢。上 卷彙總粒度對效能調整來說非常重要,但這樣的粒度往往要猜測業務公共問題。針對不同 的事實表粒度,要建立不同的物理表,在同一事實表中不要混用多種不同的粒度。
維度提供圍繞某一業務過程事件所涉及的「誰、什麼、何處、何時、為什麼、如何」 等背景。維度表包含 bi 應用所需要的用於過濾及分類事實的描述性屬性。牢牢掌握事實表 的粒度,就能夠將所有可能存在的維度區分幵。當與給定事實錶行關聯時,任何情況下都 應使維度保持單一值。 維度表有時被稱為資料倉儲的「靈魂」,因為維度表包含確保 dw/bi 系統能夠被用作 業務分析的入口和描述性標識。主要的工作都放在資料管理與維度表的幵發方面,因為它 們是使用者 bi 經驗的驅動者。
事實涉及來自業務過程事件的度量,基本上都是以數量值表示。乙個事實錶行與按照 事實表粒度描述的度量事件之間存在一對一關係,因此事實表對應乙個物理可觀察的事件。 在事實表內,所有事實只允許與宣告的粒度保持一致。例如,在零售事務中,銷售產品的 數量與其總額是良好的事實,然而商店經理的工資不允許存在於零售事務中。
維度建模步驟
資料模型是指用實體 屬性 實體之間的關係對業務概念和邏輯規則進行統一的定義,命名和編碼,主要描述企業的資訊需求和業務規則,是業務人員和開發人員溝通的語言,是資料倉儲架構設計工作開始的第一步。正確的資料模型是使用者需求的集中體現,是商業智慧型專案成功與否最重要的因素之一。資料模型可以分為概念模型 邏輯...
維度建模示例
以庫存模組和零售模組這兩個模組來談一談維度建模的相關事項 梳理庫存業務中的表的構造與設計思想 梳理一下緩慢變化維的處理方法與優缺 這篇部落格計畫用週末來完成,只能簡單的討論一下建模概況,從維度建模這本書中摘錄出一些重要的知識點,對於維度建模這本書的報告計畫在5.1之前完成,希望結合具體的業務來分享一...
維度建模步驟
原 2015年05月15日 10 50 00 資料模型是指用實體 屬性 實體之間的關係對業務概念和邏輯規則進行統一的定義,命名和編碼,主要描述企業的資訊需求和業務規則,是業務人員和開發人員溝通的語言,是資料倉儲架構設計工作開始的第一步。正確的資料模型是使用者需求的集中體現,是商業智慧型專案成功與否最...