資料倉儲是商業和資料科學中最熱門的話題之一。
但是,如果你是該領域的新手,你可能想知道什麼是資料倉儲?為什麼我們需要它,它是怎麼執行的?
別擔心,因為在接下來的4分鐘,你將知曉這所有問題的答案。
cda資料分析師 出品
編譯:mika
資料倉儲是商業和資料科學中最熱門的話題之一。
但是,如果你是該領域的新手,你可能想知道什麼是資料倉儲?為什麼我們需要它,它是怎麼執行的?
別擔心,因為在接下來的4分鐘,你將知曉這所有問題的答案。
好的,首先讓我們看到定義。
唯一資料來源——這個詞是什麼意思?
在資訊系統理論中,唯一資料來源是在乙個地方構造全部最佳質量資料的實踐。
讓我們看到乙個簡單的例子:
你肯定遇到過這種情況,當你在處理檔案,並且建立不同的版本,這時你怎麼給檔案命名?
當你完成後,你通常會在結尾加上「最終版」。
這導致產生一堆帶有副檔名的檔案:
最終版,最終的最終版,最終的最終的最終版…
或者是我的最愛,真正最終版…的最終版。
如果你是這樣,恭喜你,你不是乙個人。
有時候,即使是公司,也都不知道最新或最合適的檔案在**。
但是如果你知道有個地方會始終存放著唯一的資料來源,那就太棒了,不是麼?
資料倉儲就可以滿足這種需求,那到底什麼是資料倉儲呢?
其實就是公司儲存其寶貴資料資產的地方。包括客戶資料、銷售資料、員工資料等。
簡而言之,資料倉儲是公司事實上的唯一資料來源。
通常建立它是為了將其主要用於資料報告和分析目的。
資料倉儲有幾個定義特徵:
物件導向性
整合性時變性
永久性歸納性
讓我們快速地分別看看。
01 物件導向性
這意味著資料倉儲中的資訊會圍繞某些方面。
因此,它永遠不會包含所有公司資料,不過只會包含相關的主題。
例如,競爭對手的資料不需要出現在資料倉儲中。但是,自己的銷售資料肯定會在。
02 整合性
這就是為什麼要開發通用標準,以確保資料倉儲在任何方面都能選擇最佳質量的資料。這與主資料治理有關,但這是另乙個話題了。
03 時變性
資料倉儲也包含歷史資料。如前所述,我們主要使用資料倉儲進行分析和報告。這意味著我們需要知道五到十年前發生的事情。
04 永久性
意味著資料僅按原樣錄入資料倉儲,一旦存入,就無法更改或刪除。
05 歸納性
再次觸及將資料用於資料分析這一事實。通常,它會以某種方式進行彙總或細分,為了便於分析和報告。
好的,這就是資料倉儲,是對於公司而言結構優良,永久性事實上的單一資料來源。
10分鐘帶你看懂氣泡排序Yu選擇排序
你可以這樣理解 從小到大排序 存在10個不同大小的氣泡,由底至上地把較少的氣泡逐步地向上公升,這樣經過遍歷一次後,最小的氣泡就會被上公升到頂 下標為0 然後再從底至上地這樣公升,迴圈直至十個氣泡大小有序。在氣泡排序中,最重要的思想是兩兩比較,將兩者較少的公升上去 問題 設有一陣列,其大小為10個元素...
三分鐘帶你看懂prototype原型 ES6高階
1.prototype 定義 在js中的類的實現是基於prototype的,基於原型的繼承比基於類的繼承在概念上更為簡單 乙個新物件可以繼承乙個舊物件的屬性 2.new 建構函式 很短很簡單,要看完嗷 function star uname,age var ldh newstar 劉德華 18 va...
帶你一分鐘看懂企業直播特性
直播直至今日依然火爆如初,直播 讓很多行業趨之若鶩,當然現在已經有不少行業嵌入了直播服務和技術,那麼對於企業來說,直播是一種全新的營銷工具,利用它的特性就能夠有很好的營銷效果,那麼企業是怎麼結合直播特性來營銷的呢?1 實時性 說到實時,我們都能夠想到當前的熱點突發事件,如前不久的美國 選舉。隨著5g...