資料倉儲的多維資料模型介紹

2021-08-18 04:42:39 字數 2014 閱讀 5329

多維資料模型的定義和作用:

為了滿足使用者從多角度多層次進行資料查詢和分析的需要而建立起來的基於事實和維的資料庫模型。

其基本的應用是為了實現olap(online analytical processing)。

通過多維資料模型的資料展示、查詢和獲取就是其作用的展現,但其真的作用的實現在於,通過資料倉儲可以根據不同的資料需求建立起各類多維模型,並組成資料集市開放給不同的使用者群體使用,也就是根據需求定製的各類資料商品擺放在資料集市中供不同的資料消費者進行採購。

olap介紹:

聯機分析處理( on-line analytical processing):是使分析職員、治理職員或執行職員能夠從多種角度對從原始資料中轉化出來的、能夠真正為使用者所理解的、並真實反映企業維度特性的。

聯機分析處理(olap)系統是

資料倉儲

系統最主要的應用,專門設計用於支援複雜的分析操作,側重對決策人員和高層管理人員的決策支援,可以根據分析人員的要求快速、靈活地進行大資料量的複雜查詢處理,並且以一種直觀而易懂的形式將查詢結果提供給決策人員,以便他們準確掌握企業(公司)的經營狀況,了解物件的需求,制定正確的方案。

多維資料模型例項:

在看例項之前需要知道兩個概念:事物表和維表。

事物表:是用來記錄具體事件的,包含了每個事件的具體要素,以及具體發生的事情。

維表:對事實表中事件的要素的描述資訊。

例如乙個事件,它有人物,時間,地點,幹了什麼。事物表就是記錄了這個事件,只是對人物,時間,地點,幹了什麼記錄了一些關鍵標記。而維表則是分別記錄了人物,時間,地點,幹了什麼的具體資訊。如果你想知道這個時間的人物,你就需要進入到人物相對應的維表了。基於事實表和維表就可以構建出多種多維模型,包括星形模型、雪花模型和星座模型。

可以參考下面例項:

以上是乙個簡單的星形模型.

事實表裡面主要包含兩方面的資訊:維和度量,維的具體描述資訊記錄在維表,事實表中的維屬性只是乙個關聯到維表的鍵,並不記錄具體資訊;度量一般都會記錄事件的相應數值,比如這裡的產品的銷售數量、銷售額等。維表中的資訊一般是可以分層的,比如時間維的年月日、地域維的省市縣等,這類分層的資訊就是為了滿足事實表中的度量可以在不同的粒度上完成聚合,比如2023年商品的銷售額,來自上海市的銷售額等。

還有一點需要注意的是,維表的資訊更新頻率不高或者保持相對的穩定,例如乙個已經建立的十年的時間維在短期是不需要更新的,地域維也是;但是事實表中的資料會不斷地更新或增加,因為事件一直在不斷地發生,使用者在不斷地購買商品、接受服務。

多維資料模型的優缺點

優點:多維資料模型最大的優點就是其基於分析優化的資料組織和儲存模式。舉個簡單的例子,電子商務**的運算元據庫中記錄的可能是某個時間點,某個使用者購買了某個商品,並寄送到某個具體的位址的這種記錄的集合,於是我們無法馬上獲取2023年的7月份到底有多少使用者購買了商品,或者2023年的7月份有多少的s省使用者購買了商品?但是在基於多維模型的基礎上,此類查詢就變得簡單了,只要在時間維上將資料聚合到2023年的7月份,同時在地域維上將資料聚合到s省的粒度就可以實現,這個就是olap的概念。

缺點:多維模型的缺點就是與關係模型相比其靈活性不夠,一旦模型構建就很難進行更改。比如乙個訂單的事實,其中使用者可能購買了多種商品,包括了時間、使用者維和商品數量、總價等度量,對於關係模型而言如果我們進而需要區分訂單中包含了哪些商品,我們只需要另外再建一張表記錄訂單號和商品的對應關係即可,但在多維模型裡面一旦事實表構建起來後,我們無法將事實表中的一條訂單記錄再進行拆分,於是無法建立以乙個新的維度——產品維,只能另外再建個以產品為主題的事實表。

這篇文章是我初次接觸資料倉儲的多維資料模型,所以我也是借鑑別人的文章和查資料了解到多維資料模型。你們有深的見解可以和我分享。

資料倉儲 資料模型

資料模型是抽象描述現實世界的一種工具和方法,是通過抽象的實體及實體之間聯絡的形式,來表示現實世界中事務的相互關係的一種對映。在這裡,資料模型表現的抽象的是實體和實體之間的關係,通過對實體和實體之間關係的定義和描述,來表達實際的業務中具體的業務關係。資料倉儲模型是資料模型中針對特定的資料倉儲應用系統的...

資料倉儲 邏輯資料模型

在資料倉儲領域有乙個概念叫logical data model,中文一般翻譯為 邏輯資料模型 邏輯資料模型設計與概念資料模型設計 物理資料模型設計是資料庫及資料倉儲模型設計的三個主要步驟。邏輯資料模型反映的是系統分析設計人員對資料儲存的觀點,是對概念資料模型進一步的分解和細化。邏輯資料模型是根據業務...

資料倉儲之資料模型

關於資料倉儲的概念,這裡不再累贅。先看下面的圖 資料倉儲建設的7個主要環節 本文,主要針對第三塊資料倉儲模型設計來討論交流,尤其是網際網路行業。一 關於資料倉儲資料模型 1.資料倉儲資料模型是指使用實體 屬性及其關係對企業運營和邏輯規則進行統一的定義 編碼和命名 是業務人員和開發人員之間溝通的一套語...