資料倉儲星型模型VS雪花模型

2021-10-07 20:15:23 字數 1068 閱讀 9036

在多維分析的商業智慧型解決方案中,根據事實表和維度表的關係,可將常見的模型分為星型模型雪花模型。在設計邏輯型資料的模型的時候,就應考慮資料是按照星型模型還是雪花模型進行組織。

當所有維表都直接連線到事實表上時,整個**就像星星一樣,故將該模型稱為星型模型。

星型架構是一種非正規化的結構,多維資料集的每乙個維度都直接與事實表相連線,不存在漸變維度,是反正規化的,所以資料有一定的冗餘。其模型示例如下圖所示

當有乙個或多個維表沒有直接連線到事實表上,而是通過其他維表連線到事實表上時,其**就像多個雪花連線在一起,故稱雪花模型。

雪花模型是對星型模型的擴充套件。它對星型模型的維表進一步層次化,原有的各維表可能被擴充套件為小的事實表,形成一些區域性的「層次 」 區域,這些被分解的表都連線到主維度表而不是事實表。它的優點是 :通過最大限度地減少資料儲存量以及聯合較小的維表來改善查詢效能。雪花型結構去除了資料冗餘。 其模型示例如下圖所示

雪花模型使用的是規範化資料,也就是說資料在資料庫內部是組織好的,以便消除冗餘,因此它能夠有效地減少資料量。通過引用完整性,其業務層級和維度都將儲存在資料模型之中。

相比較而言,星形模型實用的是反規範化資料。在星形模型中,維度直接指的是事實表,業務層級不會通過維度之間的參照完整性來部署。

在雪花模型中,資料模型的業務層級是由乙個不同維度表主鍵-外來鍵的關係來代表的。而在星形模型中,所有必要的維度表在事實表中都只擁有外來鍵。

雪花模型在維度表、事實表之間的連線很多,因此效能方面會比較低。而星形模型的連線就少的多,雖然增加了資料冗餘,但減少了join連線的次數,效能反而會好一些。

雪花模型載入資料集市,因此etl操作在設計上更加複雜,而且由於附屬模型的限制,不能並行化。

星形模型載入維度表,不需要再維度之間新增附屬模型,因此etl就相對簡單,而且可以實現高度的並行化。

資料倉儲的星型模型和雪花模型

在多維分析的商業智慧型解決方案中,根據事實表和維度表的關係,又可將常見的模型分為星型模型和雪花型模型。在設計邏輯型資料的模型的時候,就應考慮資料是按照星型模型還是雪花型模型進行組織。當所有維表都直接連線到 事實表 上時,整個 就像星星一樣,故將該模型稱為星型模型,如圖 1 星型架構是一種非正規化的結...

星型模型 vs 雪花型模型

總結在多維分析的商業智慧型解決方案中,根據事實表和維度表的關係,又可將常見的模型分為星型模型和雪花型模型。在設計邏輯型資料的模型的時候,就應考慮資料是按照星型模型還是雪花型模型進行組織。當所有維表都直接連線到 事實表 上時,整個 就像星星一樣,故將該模型稱為星型模型,如圖 1 星型架構是一種非正規化...

資料倉儲學習(四) 星型模型與雪花模型

一 概述 在多維分析的商業智慧型解決方案中,根據事實表和維度表的關係,又可將常見的模型分為星型模型和雪花型模型。在設計邏輯型資料的模型的時候,就應考慮資料是按照星型模型還是雪花型模型進行組織。當所有維表都直接連線到 事實表 上時,整個 就像星星一樣,故將該模型稱為星型模型,如圖1 星型架構是一種非正...