資料倉儲(data warehouse)是乙個面向主題的(subject oriented)、整合的(integrate)、相對穩定的(non-volatile)、反映歷史變化(time variant)的資料集合,用於支援管理決策。
(1) 面向主題:指資料倉儲中的資料是按照一定的主題域進行組織。
(2)整合:指對原有分散的資料庫資料經過系統加工, 整理得到的消除源資料中的不一致性。
(3)相對穩定:指一旦某個資料進入資料倉儲以後只需要定期的載入、重新整理。
(4)反映歷史變化:指通過這些資訊,對企業的發展歷程和未來趨勢做出定量分析**。
主要區別在於:
(1)資料庫是面向事務的設計,資料倉儲是面向主題設計的。
(3)資料庫設計是盡量避免冗餘,資料倉儲在設計是有意引入冗餘。
(4)資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計。
etl(資料倉儲技術)
etl,是英文 extract-transform-load 的縮寫,用來描述將資料從**端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。
資料庫與資料倉儲
簡而言之,資料庫是面向事務的設計,資料倉儲是面向主題設計的。資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表...
資料庫與資料倉儲
簡而言之,資料庫是面向事務的設計,資料倉儲是面向主題設計的。資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表...
資料庫與資料倉儲
資料倉儲用於為決策者提供資訊。為此,資料倉儲必須將來自單位中許多源的資料聚集和合併為一致的資料集,以準確地反映單位的業務運作情況和歷史記錄。單位通常有多個聯機事務處理 oltp 系統來捕獲日常的業務運作情況。這些 oltp 系統很少與資料倉儲同時設計。它們甚至可能是由不同單位設計的,尤其當單位是通過...