資料倉儲專案之 指標字典制定

2021-10-01 10:08:04 字數 1076 閱讀 9562

1、指標字典是什麼?

答:指標字典是業務資料標準化的基礎,目的是對指標進行統一管理,方便共享達成對業務指標的共識,並統一修改和維護。指標字典可以更新在excel。如果有足夠多的的資源,那麼開發指標管理模組可以放在資料管理系統再配合血緣關係,就方便追蹤資料流轉了。

2、設計指標字典的目的?

答:(1).規範維度和量度命名,命名規則要明確,通用,易懂。

(2).對維度或量度統一計算口徑,避免歧義。

(3).涵蓋盡可能多的關注的核心維度和量度,以此為基礎推動資料建設,確保指標字典裡覆蓋的維度都可區分、指標都可統計。

(4).基於指標字典,將核心維度和量度注入元資料中心,接入指標提取工具,後續實現不需要寫sql語句即可完成自助查詢及分析需求。

3、制定指標字典主要包含哪些方面?

答:(1)主題或者場景:根據模組或主題分類

(2)指標型別:說明指標的作用

(2)給指標制定編號:方便統計,也避免後續有相同的指標可以跳過

(4)指標名稱:列出所有的指標名稱

(5)計算公式:統一確定指標的計算公式

(6)維度:確定分析的維度,以及資料分析的粒度大小

(7)指標說明:說明制定指標的意義

(8)分析的動作

例如:

4、遇到的問題

確認完指標之後,就要設定計算指標了,主要有兩大類問題

(1)指標的統一問題

對於同乙個指標,不同的公司或者部門的理解可能不同。因此,需要討論解決公式的統一問題,在設個過程中也會帶出第二類問題。

(2) 資料來源問題

會發現有些指標的制定了,但是不能取到資料來源,或者是源資料不規範,導致指標的分析結果失去了意義。在維度的分析和粒度也需要強大的基礎資料。

5、解決方法

與不同的部門討論解決相應資料來源問題,當然也需要erp的支援,優化資料來源的收集。這是保證資料倉儲建立是否成功的前提和保障。因此,需要足夠重視。

資料倉儲之資料粒度

粒度的定義 確定資料倉儲中資料的恰當粒度是資料倉儲開發者需要面對的乙個最重要的設計問題。資料粒度主要針對指標資料的計算範圍,如人口這個資料項在統計部門是以街區範圍還是乙個社群為範圍統計的。人口資料細化程度越高,粒度級就越小 相反,細化程度越低,粒度級就越大。粒度是資料倉儲主要設計問題,因為它極大地影...

資料倉儲專案的步驟

一 技術方案和概念驗證。根據客戶的需求,畫demo看是否與需求吻合。初步設計階段是多選方案階段,技術設計階段主要還是功能性的實現。二 需求階段 需求訪談,需求報告輸出 第一次評審,需求最後一次評審,產物是需求文件 主題,指標,維度,展現格式等功能性需求和非功能性需求 三 源系統資料分析和源系統分析,...

資料倉儲之ETL導讀

etl是資料抽取 extract 轉換 transform 載入 load 的簡寫,它是將oltp系統中的資料經過抽取,並將不同資料來源的資料進行轉換 整合,得出一致性的資料,然後載入到資料倉儲中。簡而言之etl是完成從 oltp系統到olap系統的過程。看過這樣一本書,將etl比作餐館的後廚,後廚...