資料倉儲技術的簡單闡述
資料倉儲定義:
資料倉儲是在企業管理和就決策中
1.面向主題的
2.整合的
3.與時間相關的
4.不可修改的資料集合
資料倉儲模型三層次
1.概念模型:
概念模型是對真實世界中問題域內的事物的描述
表示概念模型最常用的是:「實體-關係」圖
e-r圖主要是由實體、屬性和關係三個要素構成的。
2.邏輯模型:
邏輯資料模型,反映的是系統分析設計人員對資料儲存的觀點,是對概念資料模型進一步的分解和優化。
資料倉儲的邏輯模型(資料的邏輯結構)包含有:多維模型、關係模型、層次模型等。資料倉儲的邏輯模型描述資料倉儲的主要的邏輯實現,每個主題對應的模式定義。
3.物理模型
邏輯模型的具體體現,如物理訪問方式、資料儲存結構、資料存放位置以及儲存分配等。在設計資料倉儲的物理模型,需要考慮一些提高效能的技術,如表分割槽,建立索引等。(資料在資料庫中的訪問方式)
資料倉儲邏輯模型-多維模型
對資料倉儲邏輯模型的討論大多集中在邏輯模型,其中最常用的是多維模型。
維:關注資料的特定角度(例如企業關注不同銷售資料隨時間的變化情況,時間就是乙個維)
維的層次:人們觀察資料的某個特定角度還可以存在細節程度不同的多個描述,這就是維的層次。(如:時間維:年份、季度、月份、周、天)
維成員:維的乙個取值成為該維的乙個成員。如果乙個維是多層次的,那麼該維的成員就是在不同層次取值的組合。(例:某年某月某日)
度量:描述要分析的數值。(例:用電量、話費、使用者數量)
粒度:粒度是資料倉儲的資料單位中儲存的資料的細化或綜合程度的級別。粒度大小影響資料量的大小,同時影響資料 倉庫所能回答的查詢型別。粒度越小,資料量越大,同時資料所能回答查詢的能力會隨之提高。
ETL(資料倉儲技術)
etl,是英文 extract transform load 的縮寫,用來描述將資料從 端經過抽取 extract 轉換 transform 載入 load 至目的端的過程。etl一詞較常用在 資料倉儲,但其物件並不限於資料倉儲。etl是構建資料倉儲的重要一環,使用者從 資料來源抽取出所需的資料,經...
資料倉儲 資料倉儲部署
1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...
資料倉儲(十) OLAP技術
olap伺服器通常採用多維模型 inmon認為多維模型應當用在資料集市上,而資料倉儲應採用關係模型 kimball認為可以直接採用多維模型建立維度資料倉儲。二人均認可多維模型,只是應用場景不同 其具體實現可分為 rolap 關係型聯機分析處理 rolap基本資料和聚合資料均存放在rdbms之中。mo...