三個例子,讓你看懂資料倉儲多維資料模型的設計

2021-09-22 00:15:02 字數 1045 閱讀 7534

一、概述

多維資料模型是最流行的資料倉儲的資料模型,多維資料模型最典型的資料模式包括星型模式、雪花模式和事實星座模式,本文以例項方式展示三者的模式和區別。

二、星型模式(star schema)

星型模式的核心是乙個大的中心表(事實表),一組小的附屬表(維表)。星型模式示例如下所示:

三、雪花模式(snowflake schema)

雪花模式是星型模式的擴充套件,其中某些維表被規範化,進一步分解到附加表(維表)中。雪花模式示例如下圖所示:

從圖中我們可以看到位址表被進一步細分出了城市(city)維。supplier_type表被進一步細分出來supplier維。

四、事實星座模式(fact constellation)或星系模式(galaxy schema)

資料倉儲由多個主題構成,包含多個事實表,而維表是公共的,可以共享,這種模式可以看做星型模式的匯集,因而稱作星系模式或者事實星座模式。本模式示例如下圖所示:

如上圖所示,事實星座模式包含兩個事實表:sales和shipping,二者共享維表。

五、總結

事實星座模式是資料倉儲最長使用的資料模式,尤其是企業級資料倉儲(edw)。這也是資料倉儲區別於資料集市的乙個典型的特徵,從根本上而言,資料倉儲資料模型的模式更多是為了避免冗餘和資料復用,套用現成的模式,是設計資料倉儲最合理的選擇。當然大資料技術體系下,資料倉儲資料模型的設計,還是乙個盲點,探索中。

出處:

三個例子,讓你看懂資料倉儲多維資料模型的設計

一 概述 多維資料模型是最流行的資料倉儲的資料模型,多維資料模型最典型的資料模式包括星型模式 雪花模式和事實星座模式,本文以例項方式展示三者的模式和區別。二 星型模式 star schema 星型模式的核心是乙個大的中心表 事實表 一組小的附屬表 維表 星型模式示例如下所示 三 雪花模式 snowf...

python sorted三個例子

例1.按照元素出現的次數來排序 seq 2,4,3,1,2,2,3 按次數排序 seq2 sorted seq,key lambda x seq.count x print seq2 4,1,3,3,2,2,2 改進 第一優先按次數,第二優先按值 seq3 sorted seq,key lambda...

儲存過程三個例子

例項1 統計每年入職的員工個數。可能sql select to char hiredate,yyyy from emp set serveroutput on declare cursor cemp is select to char hiredate,yyyy from emp phiredate...