資料倉儲之簡單介紹

2021-09-24 05:14:27 字數 760 閱讀 8476

什麼是資料倉儲?

乙個面向主題的、整合的、隨時間變化的、非易失的資料集合,用於支援管理者的決策過程。

面向主題:如去年買了100w貨以上的使用者有哪些?這個場景就是乙個銷售的資料主題。

整合:假設公司有多個產品線分別在不同的資料庫,要統計總銷量,就可以把各個資料整合在資料倉儲

隨時間變化:資料隨著時間變化的情況,能反映在歷史時間點的資料快照。

非易失:一旦進入到資料倉儲中,資料就不應該再有改變。新的資料進入產生新的記錄,保留資料變化的歷史軌跡。也就是說資料倉儲中的資料基本是靜態的。

為什麼要建立資料倉儲?

業務系統中的資料形式多種多樣(oracle、mysql、sqlserver等,文字、csv、word、excel、xml)。

資料倉儲可以提供即時查詢、分析系統、資料集市、報表系統、資料探勘。

「直接訪問」業務系統的資料方式很難良好的工作,主要原因如下:

是否真正需要乙個資料倉儲?

建立資料倉儲需要投入大量的人、財,而且在較短時間內也不顯現出來價值。

:在沒有專家介入而僅憑組織自身力量建立資料倉儲時,是要冒著很大的失敗風險。

:雖然當下的雲伺服器越來越便宜,但是數倉的基礎伺服器也是其它(如web)伺服器幾倍之多

投入資料倉儲之前先問自己幾個問題:

總結一下資料倉儲的好處:

資料倉儲介紹

什麼是數倉 資料倉儲簡稱dw,就是乙個用以更好地支援企業或組織的決策分析處理的 面向主題的 整合的 不可更新的 隨時間不斷變化的資料集合。為什麼要有數倉 主要因為面向應用型的應用的資料庫設計一般是操作型的,而資料分析或者資料探勘都是面向分析型的應用。這兩種應用各有特點和適用的場景,對資料的處理應當分...

資料倉儲介紹

備註 根據網路資源整理 數倉分層部分待進一步研究 一.定義 理解 資料倉儲是資料庫一種概念上的公升級,為滿足業務需求而設計,提供了各種型別的資料支援,容納更多的資料。為企業所有級別的決策制定過程,提供所有型別資料支撐的戰略集合,主要是用於資料探勘和資料分析,以建立資料沙盤為基礎,為消滅訊息孤島和支援...

技術分享 資料倉儲介紹

1991年bill inmon出版的 building the data warehouse 一書中正式提出了資料倉儲的概念,inmon也被人成為資料倉儲之父。從本質上說,資料倉儲是一種從操作型系統到決策支援環境的資料流架構模型。這定義看上去有些抽象,解釋起來還要從資料庫說起。資料庫是在資訊化初期,...