多維資料模型

2021-05-21 12:55:32 字數 1344 閱讀 1959

在做biee的資料探勘之前必須了解一下的這些概念,前車之鑑,望各位志同道合之兄共勉之!(所有的本人遇到的感覺重要的名詞解釋都使用使用紅色標記了。)

1.基本概念

資料倉儲和資料倉儲技術是基於多維資料模型的。這個模型把資料看做是資料立方體形式。多維資料模型圍繞中心主題組織。該主題用事實表表示,事實是數值度量的。

資料立方體允許以多維資料建模和觀察。它由維和事實來定義。

維是關於乙個組織想要記錄的視角或觀點。每個維都有乙個表與之相關聯,稱為維表。維表是對維的屬性的描述。

事實是乙個資料度量,對所要考察的資料的乙個數值度量,事實表包括事實的名稱或度量以及每個相關維表的關鍵字。 乙個

n維的資料的立方體叫做基本方體。給定乙個維的集合,我們可以構造乙個方體的格。每個格都在不同的彙總級或不同的資料子集顯示資料,方體的格稱為資料立方體。

0維方體存放最高層彙總,稱作頂點方體,而存放最底層彙總的方體則稱為基本方體。

2.多維資料模型的存在形式:

a.星型模式

(star schema):

事實表在中心,周圍圍繞地連線著維表(每維乙個),事實表含有大量資料,沒有冗餘。

b.雪花模式(

snowflake schema

):是星型模式的變種,其中某些維表是規範化的(將引起冗餘的字段用乙個新表來表示),因而把資料進一步的分解到附加表中,結果模式圖形成類似於雪花的形狀。

c.事實星座

(fact constellations):

多個事實表共享維表,這種模式可以看做星型模式集,因此稱為星系模式

(galaxy schema)

,或者事實星座。

3.多維資料模型上的

olap操作

a.上捲

(roll-up):

彙總資料

通過乙個維的概念分層向上攀公升或者通過維規約來實現 b.

下鑽(drill-down):

上捲的逆操作

由不太詳細的資料得到更加詳細的資料,可以通過沿維的概念分層向下或引入新的維來實現。 c.

切片和切塊

(slice and dice)

:投影和選擇操作

(projection and selection)

d.轉軸

(pivot):

立方體的重定位,視覺化,或將乙個三維立方體轉化為乙個二維平面序列。變換座標軸。 e.

鑽過(drill_across):

執行涉及多個事實表的查詢 f.

鑽透(drill_through):

使用關係

sql機制,鑽到資料立方體的底層,到後端關係表。

多維資料模型與OLAP實現

一 多維資料模型及相關概念 資料模型一般有兩個層次 概念層 邏輯層 和物理層。邏輯資料模型是從概念角度抽象出現實世界的內在規律,如業務流程 資料架構等 物理資料模型則側重於特定環境下的具體實現,如效率 安全性等.多維資料模型是乙個邏輯概念,該模型主要解決如何對大量資料進行快速查詢和多角度展示,以便得...

資料倉儲的多維資料模型介紹

多維資料模型的定義和作用 為了滿足使用者從多角度多層次進行資料查詢和分析的需要而建立起來的基於事實和維的資料庫模型。其基本的應用是為了實現olap online analytical processing 通過多維資料模型的資料展示 查詢和獲取就是其作用的展現,但其真的作用的實現在於,通過資料倉儲可...

概念資料模型 邏輯資料模型 物理資料模型

概念資料模型設計與邏輯資料模型設計 物理資料模型設計是資料庫及資料倉儲模型設計的三個主要步驟。在資料倉儲領域有乙個概念叫conceptual data model,中文一般翻譯為 概念資料模型 概念資料模型是終端使用者對資料儲存的看法,反映了終端使用者綜合性的資訊需求,它以資料類的方式描述企業級的資...