資料倉儲專題(22) 匯流排架構和維度建模優勢 雜項

2021-09-21 19:17:11 字數 997 閱讀 5422

一、匯流排架構

維度建模的資料倉儲中,有乙個概念叫bus architecture,中文一般翻譯為「匯流排架構」。匯流排架構是kimball的多維體系結構(md)中的三個關鍵性概念之一,另兩個是一致性維度(conformed dimension)和一致性事實(conformed fact)。

在多維體系結構(md) 的資料倉儲架構中,主導思想是分步建立資料倉儲,由資料集市組合成企業的資料倉儲。但是,在建立第乙個資料集市前,架構師首先要做的就是設計出在整個企業 內具有統一解釋的標準化的維度和事實,即一致性維度和一致性事實。而開發團隊必須嚴格的按照這個體系結構來進行資料集市的迭代開發。

一致性維度就好比企業範圍內的一組匯流排,不同資料集市的事實的就好比插在這組匯流排上的元件。這也是稱之為匯流排架構的原因。

實際設計過程中,我們通常把匯流排架構列表成矩陣的形式,其中列為一致性維度,行為不同的業務處理過程,即事實,在交叉點上打上標記表示該業務處理過程與該維度相關。這個矩陣也稱為匯流排矩陣(bus matrix)。

匯流排架構和一致性維度、一致性事實共同組成了kimball的多維體系結構的基礎,也建立了一套可以逐步建立資料倉儲的方**。由於匯流排架構是多維體系結構的核心,所以我們有時就把多維體系結構直接稱為匯流排架構。

二、匯流排矩陣

通常,匯流排矩陣的一行會產生幾個相關的事實表,由此可以從不同角度跟蹤業務過程。訂單業務過程可能會有行項級別的訂單事務事實表和訂單級別的訂單快照事實表。這兩種基於訂單的維度模型同屬於訂單業務過程,這種分組稱為業務過程維度模型。

三、維度建模的優勢

資料倉儲採用使用維度建模的好處:易理解、查詢的高效能、修改的靈活性和可擴充性。

維度建模是乙個可不斷擴充新增的過程

(1)在現有的事實表中增加維度。

(2)在事實表中增加事實。

(3)在維度表中增加屬性。

在比較了解業務情況下,可先以底層細粒度構建開始,反之,以業務需求的粗粒度開始,至頂向下;

出處:

資料倉儲維度建模

雪花模型 星型模型 星座 多個事實表 問題 1 資料倉儲,不針對某乙個分析主題,而是有多個分析主題,即多個事實表,維度表怎麼設計?2 即使是同乙個分析主題,也可能存在多個事實表,維度表如何設計?多個時間維度?無論星型模型 雪花模型還是星座模型,都是針對維度上的區別而來,星座模型實質上還是星型模型,只...

資料倉儲 維度表

維度建模將業務抽象成事實和維度兩個概念。維度建模的核心是對齊維度。所以維度表的一致性是很重要的!維度表是如何進行處理的呢?穩定的維度表。比如 時間維度表 這種維度表的屬性是穩定的,不需要做天的全量快照資料,直接匯入一次即可 緩慢漸變維 維度會隨著時間發生緩慢的變化。比如 使用者維度表 資料量很大,但...

資料倉儲維度建模概述

面向主題的。操作型資料庫的資料組織面向事物處理任務,各個業務系統之間各自分離,而資料倉儲中的資料是按照一定的主題域進行組織的。例如 當事人 協議 機構 財務 事件 產品等主題。整合的。資料倉儲中的資料是從多個不同的資料來源傳送來的。多個應用之間在編碼,命名習慣,物理屬性 不同的資料庫 欄位的資料型別...