關注業務流程,而不是業務部門
行業裡乙個最常見的做法是將資料集市按照業務部門進行定義。我們可以看到無數的資料倉儲架構圖中包含乙個個「市場資料集市」,「銷售資料集市」,「財務資料集市」。在你回顧這些部門的業務需求後,你一定會不可避免的發現這三個部門需要相同的核心資訊,比如訂單資料。不要構建包含訂單的市場資料集市和包含訂單的銷售資料集市,而應該構建單一詳細的訂單資料集市,允許多個部門訪問。
專注於業務流程,而不是業務部門可以更加經濟地在多組織間傳遞一致性資訊。如果你建立的是跟部門繫結的集市,那麼會導致重複資料。不考慮源是來自於作業系統或者是**資料倉儲,進入集市的多重資料流將導致資料的不一致。最好的辦法是確保只發布一次資料。單一的發布將減少etl的開發成本,持續的資料管理負擔以及磁碟儲存需求。
當然了,在考慮到常見的基於部門構建,以流程為中心的資料集市有點錯綜複雜。不過你可以通過審查在維護同樣的很大的事實表而產生的不必要的成本來推廣該理念。儘管部門間存在阻隔,但是管理層對減少成本還是有興趣的。
那麼在公司機構裡如何識別出業務流程呢?第一步是傾聽你的業務使用者。在你蒐集需求的時候,你應該調查關鍵的操作型**系統。事實上,最容易的方法是根據源系統來定義資料集市。根據單獨業務流程和源系統識別出資料集市後,就可以重點關注跨流程的資料集市,比如**鏈,或者所有來自於客戶滿意情況的輸入等。我們建議你將解決這些更複雜的多流程的集市作為第二階段。
當然了,跨資料集市你必須使用一致的維度。我們強烈建議畫乙個資料倉儲匯流排矩陣圖來確立和溝通你的整個資料集市策略。你要做的是不要讓你的矩陣行上出現「市場」,「銷售」,「財務」。
ps:上面提到了data warehouse bus matrix。
資料集市設計
業務銷售資料集市設計步驟 一 維度和型別列表 維度類別 層次 客戶表時間表 條目表品牌表 地區表客戶編號 時間編號 條目名稱 品牌編號 地區編號 客戶名稱 年品牌編號 品牌名稱 街道街道 季條目編號 品牌型別 城市城市月型別 省份省份周國家 國家日 號碼 度量 金額和單價 二 轉換為星形圖為 三 元...
12 資料集市DataMart
資料集市 datamart 一 含義這是乙個面向應用的 具有多級彙總特性的多維分析層,他主要面向業務部門 資料時經過聚集和整合的,可以使用bi的資訊立方體及多種虛擬物件來建立。這一層次的資料是根據應用的要求進行不同級別的彙總的。處於應用的需要,還需要在各種彙總級別上搭建跨主題的聯合查詢。二 作用通過...
資料倉儲到搭建資料集市
資料倉儲是一種關聯式資料庫模式,其中儲存了來自乙個或者多個源資料庫的歷史資料和元資料。資料倉儲的目的是便於將資料的報告和分析彙總到多個層次。或者更簡單點 是作為乙個存放企業各個領域的資料的單獨且有組織的庫。典型的資料倉儲有以下的一些特點 涉及多個主題域 有十分詳細的資訊 集合來自不同資料來源的資料 ...