資料倉儲搭建 Inmon與Kimball

2021-09-08 13:08:03 字數 817 閱讀 3723

搞資料倉儲這麼久,實踐中發現首先搭建資料集市,還是清洗資料之後,直接進入資料立方體(形成維度表和實施表)形成核心資料倉儲層,是個選擇題...

隨後發現這其實涉及到了資料倉儲的歷史問題,是採用inmon建模還是採用kimball建模?甚至有人稱之為資料倉儲界的宗教之爭。下面我說一下自己的理解:

資料獲取到之後,先進行整理,並且要求整理的資料是滿足第三正規化標準的。

我理解,kimball與inmon的主要區別就是kimball更強調一致性事實和維度,也就是一致性維度企業匯流排的總要作用,這樣在資料倉儲迭代開發過程中更接近需求,也會提公升敏捷性。通常,kimball都是以最終任務為導向。

首先,在得到資料後需要先做資料的探索,深入理解業務邏輯與資料表的關係。

然後,在明確資料依賴後,按照目標需求,直接生成事實表+維度表。

最後,(資料集市層)拆分出部分的事實表和維度表

結果,資料集市一方面可以直接向bi環節輸出資料,另一方面也可以向資料倉儲層輸出資料,方便後續的多維分析。如下圖:

他們之間的區別用這個圖表體現非常合適:

特性kimball

inmon

時間快速交付

路漫漫其修遠兮

開發難度小大

維護難度大小

技能要求

入門級專家級

資料要求

特定業務

企業級

資料倉儲中的Inmon與Kimball架構之爭

對於資料倉儲體系結構的最佳問題,始終存在許多不同的看法,甚至有人把inmon和kimball之爭稱之為資料倉儲界的 宗教戰爭 那麼本文就通過對兩位提倡的資料倉儲體系和市場流行的另一種體系做簡單描述和比較,不是為了下定義那個好,那個不好,而是讓初學者更明白兩位資料倉儲鼻祖對資料倉儲體系的見解而已。首先...

資料倉儲搭建

1.資料倉儲需求分析 1.1主題分析 確定主題 使用者從哪些角度來分析資料 主題 比如銷售主體 指標 維度 粒度 1.2資料分析 了解資料情況,是否可以支撐主題 資料來源分析 資料來源的資料表的關係,資料表的內容 資料量分析 記錄和字段的量進行乙個統計分析 資料質量分析 正確性分析 一致性分析 規範...

資料倉儲怎麼搭建?

資料倉儲怎麼搭建?在網上一搜,有太多的大廠中廠數倉完整實踐的文章,已經能把數倉由哪些組成,各部分如何建設,重點難點和解決方法都講的很清楚。我接觸到的大多數數倉開發者對於資料倉儲都有乙個較為完整的了解,各個部分也都能說得頭頭是道。可另一方面,從我了解到的片面的行業資訊來說,除了在網上發文章的那些公司,...