資料粒度(資料倉儲)

2021-04-03 02:50:00 字數 848 閱讀 6400

資料倉儲中的粒度是指資料的詳細程度,同樣為了描述乙個情況,我可以用很多的資料,但同樣我也可以只用必需的資料。而這起決於儲存器。如果有很大的硬碟,那就沒有我們不能存的事情。所以,估計一年內裡表中的最大行數和最小行數,是設計者的最大問題。這裡牽扯到了乙個概念:上下限推測的方法。(別問我,我也不懂)

然後通過簡單的計算可以知道資料庫大概的情況,然後可以調整我們的策略。說的仔細一點,我們可以採用雙重粒度或者單一粒度的辦法。

雙重粒度是降低資料量的最佳方法。而且,大多數公司都採用這種方法。下面來乙個分析:

雙重粒度包括:低細節級和高細節級。要知道:在很低的細節級上建立輕度彙總資料是沒有意義的。反過來,在太高的細節級建立彙總資料也是沒有用的。所以,一定要進行資料粒度的評估,然後才能得出最佳的彙總方案。而可笑的是,這根本都是猜測出來的,沒有正確性的保證,嘿嘿,沒辦法,誰讓我們本來就是在做一件不知道條件,指知道結果的方程式呢,但你可以把你的結果給終端使用者看,讓她來評價這個好壞,別指望

%100

的通過,

%50就很不錯了:)

這裡有一些反饋技巧和乙個例子,在

90頁,你可以參考一下。

如果說,資料粒度教你建資料倉儲的話,下乙個話題就是教你管理啦!

而且,由於資料倉儲的使用物件不盡相同,資料倉儲的設計需要考慮其資料單元的細節程度,即粒度。細節程度越高,粒度級就越低,反之亦然。例如:乙個簡單的交易處於低粒度級,而每個月所有交易的彙總則處於乙個高粒度級。通常,資料分析人員使用的資料粒度較低,而高層管理人員所使用的資料粒度較高。粒度同時決定了資料倉儲所占用的物理空間的大小,儘管一條交易記錄可能只占用200個位元組,但是乙個月所累積的10萬條交易記錄就占用了20m個位元組。如果按月對每月的所有交易記錄進行綜合,所得到的記錄可能只占用500個位元組。

資料倉儲中資料粒度

粒度問題是設計資料倉儲的乙個最重要方面。粒度是指資料倉儲的資料單位中儲存資料的細化或綜合程度的級別。細化程度越高,粒度級就越小 相反,細化程度越低,粒度級就越大。確定粒度是資料倉儲開發者需要面對的乙個重要的設計問題。如果資料倉儲的粒度確定合理,設計和實現中的其餘方面就可以非常順暢地進行 反之,如果粒...

資料倉儲之資料粒度

粒度的定義 確定資料倉儲中資料的恰當粒度是資料倉儲開發者需要面對的乙個最重要的設計問題。資料粒度主要針對指標資料的計算範圍,如人口這個資料項在統計部門是以街區範圍還是乙個社群為範圍統計的。人口資料細化程度越高,粒度級就越小 相反,細化程度越低,粒度級就越大。粒度是資料倉儲主要設計問題,因為它極大地影...

資料倉儲中資料粒度

粒度問題是設計資料倉儲的乙個最重要方面。粒度是指資料倉儲的資料單位中儲存資料的細化或綜合程度的級別。細化程度越高,粒度級就越小 相反,細化程度越低,粒度級就越大。確定粒度是資料倉儲開發者需要面對的乙個重要的設計問題。如果資料倉儲的粒度確定合理,設計和實現中的其餘方面就可以非常順暢地進行 反之,如果粒...