要了解 資料庫和資料倉儲的區別,首先我們要了解資料倉儲的概念。資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它決不是所謂的「大型資料庫」。那麼,資料倉儲與傳統資料庫比較,究竟有哪些不同呢?讓我們先看看w.h.inmon關於資料倉儲的定義:面向主題的、整合的、與時間相關且不可修改的資料集合。
「面向主題的」:傳統資料庫主要是為應用程式進行資料處理,未必按照同一主題儲存資料;資料倉儲側重於資料分析工作,是按照主題儲存的。這一點,類似於傳統農貿市場與超市的區別—市場裡面,白菜、蘿蔔、香菜會在乙個攤位上,如果它們是乙個小販賣的;而超市裡,白菜、蘿蔔、香菜則各自一塊。也就是說,市場裡的菜(資料)是按照小販(應用程式)歸堆(儲存)的,超市裡面則是按照菜的型別(同主題)歸堆的。
「與時間相關」:資料庫儲存資訊的時候,並不強調一定有時間資訊。資料倉儲則不同,出於決策的需要,資料倉儲中的資料都要標明時間屬性。決策中,時間屬性很重要。同樣都是累計購買過九車產品的顧客,一位是最近三個月購買九車,一位是最近一年從未買過,這對於決策者意義是不同的。
「不可修改」:資料倉儲中的資料並不是最新的,而是**於其它資料來源。資料倉儲反映的是歷史資訊,並不是很多資料庫處理的那種日常事務資料(有的資料庫例如電信計費資料庫甚至處理實時資訊)。因此,資料倉儲中的資料是極少或根本不修改的;當然,向資料倉儲新增資料是允許的。
以一言以概之,資料庫 database (oracle, mysql, postgresql)主要用於事務處理,資料倉儲 datawarehouse (amazon redshift, hive)主要用於資料分析。
資料庫和資料倉儲的區別
資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...
資料庫和資料倉儲的區別
一 資料倉儲的概念 資料倉儲之父比爾 恩門 bill inmon 在1991年出版的 building the data warehouse 建立資料倉儲 一書中所提出的定義被廣泛接受 資料倉儲 data warehouse 是乙個面向主題的 subject oriented 整合的 integra...
資料庫和資料倉儲的區別
資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...