資料倉儲的星形和雪花模型

2021-07-11 02:36:45 字數 681 閱讀 6201

什麼時候使用雪花模型?

ralph kimball,資料倉儲大師,講述了三個例子。對於下面三個例子,使用雪花模型可能是更好的選擇。

1,乙個使用者維度表且資料量較大。其中,80%的事實度量表是匿名訪問者,僅包含少數詳細資訊。20%的是可靠的註冊使用者,且這些註冊使用者有較為詳細的資訊,與多個維度表中的資料相連。

2,例如乙個金融產品維度表,且這些金融產品有銀行類的,保險類等等區別。

因此不同種類的產品有自己一系列的特殊屬性,且這些屬性並非是所有產品共享的。

3,多個企業共用的日曆維度表。但每個企業的財政週期不同,節假日不同等等。

分析這三個案例,共同的特點是:乙個維度表中的資料差異比較大,有的資料具備的一些屬性(字段),其它資料沒有或不需要 -- 這就導致大量資料的很多屬性為空值,其結果就是增加儲存空間,降低效率。此時使用雪花模型將不同的屬性分散到其他的維度表中,可能是更好的選擇。

另外如果有資料量巨大且快速變化的維度表,可以考慮使用雪花模型以減少資料冗餘。

ralph kimball 推薦在絕大多數的其他案例中,星形模型是更好的解決方案。雖然在雪花模型中,資料冗餘被降低了,但是另一方面卻需要更多的join。kimball還建議像終端使用者暴露物理的雪花模型不是乙個好主意,因為在對模型的理解和執行效率上都會大打折扣。因此在雪花模型中,使用view等工具向終端使用者暴露整合過的資料是更好的選擇。

資料倉儲的星型模型和雪花模型

在多維分析的商業智慧型解決方案中,根據事實表和維度表的關係,又可將常見的模型分為星型模型和雪花型模型。在設計邏輯型資料的模型的時候,就應考慮資料是按照星型模型還是雪花型模型進行組織。當所有維表都直接連線到 事實表 上時,整個 就像星星一樣,故將該模型稱為星型模型,如圖 1 星型架構是一種非正規化的結...

星形模型 雪花模型的對比

當所有維表都直接連線到 事實表 上時,整個 就像星星一樣,故將該模型稱為星型模型。如下圖 銷售資料倉儲星型模型圖 當有乙個或多個維表沒有直接連線到事實表上,而是通過其他維表連線到事實表上時,其 就像多個雪花連線在一起,故稱雪花模型。雪花模型是對星型模型的擴充套件。它對星型模型的維表進一步層次化,原有...

星形和雪花模型 星型模型和雪花型模型比較

每個資料倉儲都包含乙個或者多個事實資料表。事實資料表可能包含業務銷售資料,如現金登記事務所產生的資料,事實資料表通常包含大量的行。事實資料表的主要特點是包含數字資料 事實 並且這些數字資訊可以彙總,以提供有關單位作為歷史的資料,每個事實資料表包含乙個由多個部分組成的索引,該索引包含作為外來鍵的相關性...