在實際專案開發中,需要和資料倉儲以及資料湖那邊的開發同事進行對接,頭一次聽到這兩個名詞,自己也是一頭霧水。
下面我就以我自己的理解,簡單的向大家介紹一下。
資料庫:就是儲存當前的業務資料,集中儲存的是公司經常使用到的資料(儲存的是公司近50年的資料);
資料倉儲:也是儲存的公司的各種業務資料,主要集中儲存的是結構化的資料。當然也儲存少量非結構化的資料(儲存的是近100年的業務資料);
資料湖:也是儲存公司的各種各樣的資料,主要集中儲存結構化和非結構化的資料。(儲存的是公司好幾百年之前的資料)。
資料倉儲和資料湖,我生成的檔案,是可以直接分別給他們進行傳遞的。兩者之間,沒有必然的聯絡。
資料湖和資料倉儲的區別是什麼?
我們都知道,進行資料分析工作的時候會用到很多的工具,比如說資料湖和資料倉儲,不過這兩者之間的差異和區別,可能會讓人困惑。那麼大家知道不知道資料湖和資料倉儲的區別是什麼呢?下面我們就給大家介紹一下資料湖和資料庫的相關知識。那麼什麼是資料湖呢?其實資料湖就是乙個集中儲存資料庫,用於儲存所有結構化和非結構...
資料倉儲 資料集市和資料湖三者的區別
資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。資料倉儲算是優化的資料庫,用於分析來自事務系統和業務線應用程式的關係資料,事先定義資料結構和約束來優化sql查詢速度,其中結果通常用於操作報告和分析,資料經過etl,可以充...
資料倉儲和資料倉儲分層
資料倉儲 data warehouse 可簡寫為dw或dwh。資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。為需要業務智慧型的企業,提供指導業務流程改進 監視時間 成本 質量以及控制。1 問題簡單化,將乙個複雜的問題分...