本次討論的主題是: 資料倉儲中的主題域是如何劃分的?
問題:你在工作中和交流中,有主題域劃分的例子可以分享嗎?
分析:關於主題:本話題是乙個發散性的話題,並沒有限制太多的內容,主要是想跟大家討論一下在工作和交流中大家都是怎麼劃分主題域的。
資料倉儲中的資料是面向主題組織的,主題是在較高層次上將企業資訊系統中的資料進行綜合、歸類和分析利用的乙個抽象概念,每乙個主題基本對應乙個巨集觀的分析領域。如財務分析就是乙個分析領域,因此這個資料倉儲應用的主題就為「財務分析」。
關於主題域:
主題域通常是聯絡較為緊密的資料主題的集合。可以根據業務的關注點,將這些資料主題劃分到不同的主題域(也說是對某個主題進行分析後確定的主題的邊界。)
關於主題域的劃分:
2、根據需求方劃分:比如需求方為財務部,就可以設定對應的財務主題域,而財務主題域裡面可能就會有員工工資分析,投資回報比分析等主題;
4、按照部門劃分:比如可能會有運營域、技術域等,運營域中可能會有工資支出分析、活動宣傳效果分析等主題;
總而言之,切入的出發點邏輯不一樣,就可以存在不同的劃分邏輯。在建設過程中可採用迭代方式,不糾結於一次完成所有主題的抽象,可先從明確定義的主題開始,後續逐步歸納總結成自身行業的標準模型。
資料倉儲(六) 資料倉儲的概念設計
在資料集市設計中可以使用3種基本的系統方法 資料驅動的方法 需求驅動的方法和混合方法。它們的區別在於源資料庫分析和終端使用者需求分析階段所佔的比重。方法的選擇將極大地影響概念設計的方式。資料驅動方法包括 基於實體 關係模式的設計 基於關係模式的設計 基於xml模式的設計。概念型實體 關係模式比關係型...
access對比資料 資料倉儲系列之資料質量管理
資料質量一直是資料倉儲領域乙個比較令人頭疼的問題,因為資料倉儲上層對接很多業務系統,業務系統的髒資料,業務系統變更,都會直接影響資料倉儲的資料質量。因此資料倉儲的資料質量建設是一些公司的重點工作。資料質量的高低代表了該資料滿足資料消費者期望的程度,這種程度基於他們對資料的使用預期。資料質量必須是可測...
資料倉儲系列之ETL過程和ETL工具
上週因為在處理很多資料來源整合的事情一直沒有更新系列文章,在這週後開始規律更新。在維度建模中我們已經了解資料倉儲中的維度建模方法以及基本要素,在這篇文章中我們將學習了解資料倉儲的etl過程以及實用的etl工具。一 什麼是etl?構建資料倉儲的核心是建模,在資料倉儲的構建中,etl貫穿於專案始終,它是...