資料立方體基本概念

2021-07-23 23:56:02 字數 381 閱讀 9142

1.基本單元:基本方體的單元(上圖所示為基本方體)

2.聚集單元:非基本方體的單元

3.聚集度量:對所有可能聚集進行計算

例:以資料庫資料屬性(元資料):tuple =(mouth,city,measures(度量))a=(1,*,20)b=(1,harbin,50)。a為聚集單元稱1-d單元。b為基本單元稱2-d單元。其中,a為b的祖先,b為a的子女(後代)。

完全立方體:給定資料立方體的所有方體的所有單元。n維資料資料立方體包含2的n次方個方體(不考慮每個維的概念分層)

稀疏方體:方體維的基數成績很大時。稱該方體為稀疏方體

冰山立方體:物化代表最小支援度以上的方體成為冰山方體(可以想象乙個資料立方體只物化其中大於某個值的一小部分,相當於冰山露出一角。)

資料立方體

總體介紹 首先模擬乙個資料分析場景,某企業積累了如下 所示的銷售資料 中每一行表示某個時間段內某種商品在某個地區的銷售情況。很明顯,這些資料涉及到了時間 地區 產品三個業務角度。在對這樣的資料進行分析時,不同的角色都會基於自己所感興趣的業務角度提出問題 銷售經理關心各個地區的銷售情況,希望找出銷售增...

資料立方體的基本計算

資料立方體計算是資料倉儲實現的一項基本任務。這裡介紹幾種計算方法 1.多路陣列聚集計算法 multiway 計算完全方體 1 把陣列劃分成塊,塊是乙個子立方體,它足夠小可以放入立方體計算時所需的記憶體即可。2 通過訪問立方體單元 即獲取立方體單元的值 來計算聚集。例 乙個空間立方體 我上篇所用的那個...

資料立方體 解密

資料立方體和傳統資料庫的差別在於資料立方體即cube把很多原來要用資料庫的group by操作來達到的效果通過其獨有的儲存形式予以加速,使用者可以方便地下鑽,切面 看到各種聚合的資料的結果。試想一下,如果乙個cube擁有3個維度,為了計算在各個維度上的聚合,就要進行2 3次計算,如果有10個維度就要...