本部落格主要內容為對書中第三章事實表特性的知識的總結。
事實表特性主要包括粒度、可加性、稀疏性和退化維。
事實分為可加事實,半可加事實和非可加事實。
每個事實表通過獲取描述業務過程的度量來表達業務過程。然而,一些事實不能被聚集。這些不可求和的事實通常可以分解到其他可求和的事實表中。
事實表記錄資訊的細節程度被稱為粒度。
盡可能將事實表的粒度設定為最詳細的資料粒度級別。
將事實相加以獲得對單個事實彙總的能力被稱為可加性。
事實表是度量業務過程的引擎。事實表儲存用來描述過程的詳細粒度。事實採用外來鍵為每個度量提供維度環境。在某些情況下,事實表可以包含維度。作為過程度量的核心,事實表應包含與其描述的過程有關的所有事實,當然也可以包含從其他方面獲得的一些事實。事實以特定的細節層次儲存,但可以通過上捲產生各種級別的維度。由於事實具有可加性,因此這樣的聚集是可能的。某些度量不具備可加性,但通常可以分解成具有可加性的元件。
常見的錯誤是在事實表中儲存數量單位而不是儲存延伸量。數量單位通常用作維度。它也可以用於計算延伸量,延伸量通常作為事實存在。只有事實才具備可加性,提供靈活的分析能力。如果沒有合適的維度表用於儲存數量單位,可以將它們放置於退化維中。
存在非可加事實,如利潤率。彙總行中的利潤率需要根據分類彙總的利潤額度和訂單額度的比值得到,而非通過將各個銷售人員的利潤率相加獲得。非可加事實以可加事實的比率方式計算。由於非可加事實並未儲存在事實表中,需要注意不要丟失這些事實,應該被文件化。
出現在事實表中的組合數量遠遠小於可能存在的組合數量,該項特性被稱為稀疏性。
有時,不可能將所有與業務相關的維度分類到乙個緊湊的表集合中。類似這樣的情況,將乙個或多個維度儲存到事實表中是合適的選擇。若採用了這種方法,儲存到事實表中的維度列被稱為退化維度,簡稱退化維。
雖然被儲存在事實表中,但該列仍應被視為維度。與其他表中的維度列一樣,其值仍然可以用於過濾查詢、控制聚合層次、排序資料、定義主從關係等。應該謹慎使用退化維度,因為事實表累計記錄的速度很快,包含退化維度可能會造成儲存空間的過度消耗。多數情況下,適合選作退化維度的維度最好放置到雜項維度中,事務標識除外。事務標識通常作為退化維度儲存。它也可以作為事實表中行的唯一標識,並用於定義事實表的粒度。雖然事務標識通常作為退化維度儲存,但這並不是必須遵循的規則。
Star Schema完全參考手冊讀書筆記五
本部落格就第三章緩慢變化維和多維資料集的有關知識進行總結。採用維度設計方案時,確定資料來源的變化情況在維度表中如何表示非常重要。這一現象稱為緩慢變化的維度,簡稱緩慢變化維。該術語的名稱反映了維度積累變化的實際情況,至少與積累資料行較為快速的事實表比較,緩慢變化相對緩慢。星型模式與多維資料集共存方式擁...
HTML標記參考手
總類 所有html檔案都有的 檔案型別 放在檔案的開頭與結尾 檔案主題 必須放在 文頭 區塊內 文頭 描述性資料,像是 主題 文體 檔案本體 結構性定義 由瀏覽器控制的顯示風格 標題 從1到6,有六層選擇 3.0 標題的對齊 3.0 區分 3.0 區分的對齊 引文區塊 通常會內縮 強調 通常會以斜體...
返回 ADO Connection 物件參考手冊
返回 ado connection 物件參考手冊 這三個方法與 connection 物件使用,來儲存或取消對資料來源所做的更改。注釋 並非所有提供者都支援事務。注釋 begintrans committrans 和 rollbacktrans 方法在客戶端 connection 物件上無效。beg...