資料倉儲技術的簡單闡述

2021-08-04 03:09:48 字數 915 閱讀 8658

資料倉儲技術的簡單闡述

資料倉儲定義:

資料倉儲是在企業管理和就決策中

1.面向主題的

2.整合的

3.與時間相關的

4.不可修改的資料集合

資料倉儲模型三層次

1.概念模型:

概念模型是對真實世界中問題域內的事物的描述

表示概念模型最常用的是:「實體-關係」圖

e-r圖主要是由實體、屬性和關係三個要素構成的。

2.邏輯模型:

邏輯資料模型,反映的是系統分析設計人員對資料儲存的觀點,是對概念資料模型進一步的分解和優化。

資料倉儲的邏輯模型(資料的邏輯結構)包含有:多維模型、關係模型、層次模型等。資料倉儲的邏輯模型描述資料倉儲的主要的邏輯實現,每個主題對應的模式定義。

3.物理模型

邏輯模型的具體體現,如物理訪問方式、資料儲存結構、資料存放位置以及儲存分配等。在設計資料倉儲的物理模型,需要考慮一些提高效能的技術,如表分割槽,建立索引等。(資料在資料庫中的訪問方式)

資料倉儲邏輯模型-多維模型

對資料倉儲邏輯模型的討論大多集中在邏輯模型,其中最常用的是多維模型。

維:關注資料的特定角度(例如企業關注不同銷售資料隨時間的變化情況,時間就是乙個維)

維的層次:人們觀察資料的某個特定角度還可以存在細節程度不同的多個描述,這就是維的層次。(如:時間維:年份、季度、月份、周、天)

維成員:維的乙個取值成為該維的乙個成員。如果乙個維是多層次的,那麼該維的成員就是在不同層次取值的組合。(例:某年某月某日)

度量:描述要分析的數值。(例:用電量、話費、使用者數量)

粒度:粒度是資料倉儲的資料單位中儲存的資料的細化或綜合程度的級別。粒度大小影響資料量的大小,同時影響資料 倉庫所能回答的查詢型別。粒度越小,資料量越大,同時資料所能回答查詢的能力會隨之提高。

ETL(資料倉儲技術)

etl,是英文 extract transform load 的縮寫,用來描述將資料從 端經過抽取 extract 轉換 transform 載入 load 至目的端的過程。etl一詞較常用在 資料倉儲,但其物件並不限於資料倉儲。etl是構建資料倉儲的重要一環,使用者從 資料來源抽取出所需的資料,經...

資料倉儲 資料倉儲部署

1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...

資料倉儲(十) OLAP技術

olap伺服器通常採用多維模型 inmon認為多維模型應當用在資料集市上,而資料倉儲應採用關係模型 kimball認為可以直接採用多維模型建立維度資料倉儲。二人均認可多維模型,只是應用場景不同 其具體實現可分為 rolap 關係型聯機分析處理 rolap基本資料和聚合資料均存放在rdbms之中。mo...