資料立方體的基本計算

2021-07-24 01:27:58 字數 813 閱讀 3733

資料立方體計算是資料倉儲實現的一項基本任務。這裡介紹幾種計算方法

1.多路陣列聚集計算法(multiway)(計算完全方體)

(1)把陣列劃分成塊,塊是乙個子立方體,它足夠小可以放入立方體計算時所需的記憶體即可。

(2)通過訪問立方體單元(即獲取立方體單元的值)來計算聚集。

例:乙個空間立方體(我上篇所用的那個),我們要計算它,將它劃分成很小的基於記憶體的塊。我們將其化為64塊(a0b0c0(1),a1b0c0(2)...a3b3c3(64))這樣我們首先計算基本方體(包含abc的所有方體,然後計算2-d方體,1-d方體,0-d(頂點)方體)

2.buc從頂點方體向下計算冰上立方體(計算稀疏冰山立方體)

1.首先掃面整個輸入,計算整個度量

2.針對方體的每一維進行劃分

3.針對每乙個劃分,對他進行聚集,為該劃分建立乙個元組並得到該元組的計數。判斷其分組基數是否滿足最小支援度。

4.滿足輸出該劃分的聚集元組並在該劃分下對下一維進行遞迴呼叫。否則剪枝。

3.動態星型結構計算冰山立方體(star-cubing)

它是一種整合自頂向下和自底向上的立方體計算方法

如圖以abd為根的子樹中的所有方體都包含維ab,我們把子樹中所有方體都包含的維成為共享維。

接下來我們構建方體樹,樹的每一層代表乙個維,每個節點代表乙個屬性值。構建方體樹和共享維是為了方便剪枝

如果單個維a的屬性值p上的聚集不滿足最小支援度,則將該節點用×替換,從而進一步壓縮方體樹。我們稱屬性a中的節點p為星界定啊,使用星節點壓縮的方體樹稱為星樹。

資料立方體

總體介紹 首先模擬乙個資料分析場景,某企業積累了如下 所示的銷售資料 中每一行表示某個時間段內某種商品在某個地區的銷售情況。很明顯,這些資料涉及到了時間 地區 產品三個業務角度。在對這樣的資料進行分析時,不同的角色都會基於自己所感興趣的業務角度提出問題 銷售經理關心各個地區的銷售情況,希望找出銷售增...

資料立方體基本概念

1.基本單元 基本方體的單元 上圖所示為基本方體 2.聚集單元 非基本方體的單元 3.聚集度量 對所有可能聚集進行計算 例 以資料庫資料屬性 元資料 tuple mouth,city,measures 度量 a 1,20 b 1,harbin,50 a為聚集單元稱1 d單元。b為基本單元稱2 d單元...

資料立方體 解密

資料立方體和傳統資料庫的差別在於資料立方體即cube把很多原來要用資料庫的group by操作來達到的效果通過其獨有的儲存形式予以加速,使用者可以方便地下鑽,切面 看到各種聚合的資料的結果。試想一下,如果乙個cube擁有3個維度,為了計算在各個維度上的聚合,就要進行2 3次計算,如果有10個維度就要...