數倉知識08 數倉設計步驟和使用

2021-09-26 07:33:22 字數 956 閱讀 5600

提供相關資訊進行分析和效能估計,提高行業競爭優勢

提高企業生產力。可以快速收集準確描述組織機構的資訊

有利於客戶聯絡管理,因為他跨越所有商務、所有部門和市場

可以降低成本。通過可靠的方式進行長期趨勢跟蹤,發現異常。

建立數倉前需要分析商務需求,搭建商務分析框架。

b.資料來源檢視:被操作的資料庫庫細通收集、儲存和管理資訊,如er圖或者case建模工具

c.資料倉儲檢視:事實表和維表,提供數倉資訊包括與計算的總和和計數,以及提供歷史背景的關於源、日期和時間等資訊

d.商務檢視:從使用者的角度透視數倉的資料

資料倉儲可以使用自頂向下方法、自底向上方法或者二者結合的混合方法設計。

自定向下方法:由總體規劃和規劃開始

自底向上方法:以實驗和原型開始。在商務建模和技術開發的早期階段,這種方法是有用的。

設計步驟:

a.選取待建模的商務處理:

整個組織的-->數倉模型

處理部門的-->資料集市

b.選取商務處理的粒度

c.選取用於每個事實表記錄的維:e.g時間、商品、顧客、**商、倉庫、事務型別等

d.選取將安放在每個事實表記錄中的度量;e.g數值量

4.數倉後期管理:
資料重新整理

資料來源同步

規劃災難恢復

管理訪問控制和安全

管理資料增長

管理資料庫效能

數倉的增強和擴充

5.資料倉儲的進化路徑

資料倉儲廣泛用在銀行、金融服務、生活消費品和零售批發部門

最初:用於產生報告和回答預先定義的查詢

漸漸:分析彙總和詳細資料,(報表和圖表形式)

然後:用於決策。進行多維分析和複雜切片、切塊操作

最後:資料探勘工具,用於知識發現戰略決策制定

數倉分層設計

介紹資料分層的作用 提出一種通用的資料分層設計,以及分層設計的原則 舉出具體的例子說明 提出可落地的實踐意見 0x01 資料分層?為什麼要設計資料分層?這應該是資料倉儲同學在設計資料分層時首先要被挑戰的問題,類似的問題可能會有很多,比如說 為什麼要做資料倉儲?為什麼要做元資料管理?為什麼要做資料質量...

數倉相關知識集合

數倉建模 說到數倉建模,就得提下經典的2套理論 數倉的建模或者分層,其實都是為了更好的去組織 管理 維護資料,實際開發時會整合2種方式去使用,當然,還有些其他的,像data vault模型 anchor模型,暫時還沒有應用過,就不說了。維度建模,一般都會提到星型模型 雪花模型,星型模型做olap分析...

數倉理論知識

為什麼分層 1 清洗資料結構 每乙個資料分層都哦於他的作用域和職責,在使用表的時候能更方便定位和理解 2 統一開發 減少重複開發 規範資料分層,開發一些通用的中間層資料,能夠減少極大的重複計算 3 統一資料口徑 通過資料分層,提供統一的資料出口,統一對外輸出的資料口徑 4 複雜問題簡單化 將乙個複雜...