一、資料倉儲的概念
資料倉儲之父比爾·恩門(bill inmon)在2023年出版的「building the data warehouse」(《建立資料倉儲》)一書中所提出的定義被廣泛接受——資料倉儲(data warehouse)是乙個面向主題的(subject oriented)、整合的(integrated)、相對穩定的(non-volatile)、反映歷史變化(time variant)的資料集合,用於支援管理決策(decision ****** support)。
1、資料倉儲是面向主題的;操作型資料庫的資料組織面向事務處理任務,而資料倉儲中的資料是按照一定的主題域進行組織。主題是指使用者使用資料倉儲進行決策時所關心的重點方面,乙個主題通常與多個操作型資訊系統相關。
2、資料倉儲是整合的,資料倉儲的資料有來自於分散的操作型資料,將所需資料從原來的資料中抽取出來,進行加工與整合,統一與綜合之後才能進入資料倉儲;
3、資料倉儲是不可更新的,資料倉儲主要是為決策分析提供資料,所涉及的操作主要是資料的查詢;操作型資料庫主要服務於日常的業務操作,使得資料庫需要不斷地對資料實 時更新,以便迅速獲得當前最新資料,不至於影響正常的業務運作。在資料倉儲 中只要儲存過去的業務資料,不需要每一筆業務都實時更新資料倉儲,而是根據 商業需要每隔一段時間把一批較新的資料匯入資料倉儲。
4、資料倉儲是隨時間而變化的,傳統的關係資料庫系統比較適合處理格式化的資料,能夠較好的滿足商業商務處理的需求。穩定的資料以唯讀格式儲存,且不隨時間改變
二、資料庫和資料倉儲的區別
一般地,在進行資料庫設計時,應遵循三大原則,也就是我們通常說的三大正規化,即:
第一正規化要求確保表中每列的原子性,也就是不可拆分;
第二正規化要求確保表中每列與主鍵相關,而不能只與主鍵的某部分相關(主要針對聯合主鍵),主鍵列與非主鍵列遵循完全函式依賴關係,也就是完全依賴;
第三正規化確保主鍵列之間沒有傳遞函式依賴關係,也就是消除傳遞依賴。
資料庫和資料倉儲的區別
資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...
資料庫和資料倉儲的區別
資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...
資料倉儲和資料庫的區別
一 資料倉儲 1.什麼是資料倉儲?資料倉儲 data warehouse 可簡寫為dw或dwh,資料倉儲,是為了企業所有級別的決策制定計畫過程,提供所有型別資料型別的戰略集合。它出於分析性報告和決策支援的目的而建立。為需要業務智慧型的企業 為需要指導業務流程改進 監視時間,成本,質量以及控制等 2....