資料倉儲的特點:
面向主題的:從面向操作型的系統提取出分析主題,例如:保險公司操作環境是汽車、人壽,而對於資料倉儲構建要從顧客、保險單。。這些主題去構建。要提取出各個作業系統中公共的屬性,要將資料倉儲構建成最細粒度,對各個操作環境都可用。
整合性:保證資料的一致性,就是把各個系統中的資料採集到一起,相同的東西可能在不同的作業系統中命名不同,在資料倉儲中要將這些進行統一命名,通過etl把他們採集到資料倉儲的同一張表中。
非易失:採用批量載入的方式採集資料,以靜態快照的形式載入,一般不會進行更新
隨時間變化的:書上說時變性是資料倉儲中的每個資料單元都只是在某乙個時間是準確。(這一點不太理解,需要慢慢體會)
資料倉儲的結構:
早起細節級、當前細節級、輕度綜合資料級、高度綜合資料級
流程是:由當前細節進入早起細節級,經過一段時間進入輕度綜合資料級,然後進入高度綜合資料級。
資料倉儲粒度:
粒度是資料倉儲中資料單元的細節程度或綜合程度的級別,細度越高,粒度越低。粒度的設計主要影響資料量的大小,以及資料倉儲所能回答的查詢型別。問題就是乙個很低粒度可以回答任何問題,但是占用儲存,且查詢效率低,但是高階粒度限制了處理問題的數量,但是節省空間,效率高。
資料倉儲設計必須滿足實體需要的最低粒度。
解決辦法就是:採用雙重粒度級的形式。就是一邊用專門的儲存裝置儲存真實的細節資料,例如:顧客每個打出**的細節,一方面採用輕度綜合資料,例如顧客每天打出多少**,總共的時長。。
這樣的好處是:dss分析員90%會忽略細節資料,直接分析輕度綜合的資料,當必要的情況才會去查細節資料。只用採用雙粒度這兩種問題才能解決。
資料倉儲應用(一) 資料倉儲模型設計
關聯文章 資料倉儲應用 二 資料抽取 轉換 載入 etl 資料倉儲應用 三 sql server 2005的資料倉儲應用 聯機分析olap 一 問題背景 某電子商務 主要銷售電子類產品,產品又分為幾個大類別,包括 電腦類 手機類 鍵盤類等,每個類別內又細分為幾個小類別,各類別下又有諸多的商品,每乙個...
資料倉儲學習筆記一
資料倉儲是乙個面向主題的 整合的 非易失的且隨時間變化的資料集合,用來支援管 理人員的決策。1 主題 圖1傳統的操作型系統是圍繞公司的應用進行組織的。對乙個保險公司來說,應用問題可能 是汽車保險 健康保險 人壽保險與意外 保險。公司的主要主題範圍可能是顧客 保險 單 保險費與索賠。2 整合 圖2 資...
資料倉儲學習筆記(一)
決策支援系統的發展 決策支援系統 decision support system 簡稱dss 可以為決策者提供分析問題 建立模型 模擬決策過程和方案的環境,呼叫各種資訊資源和分析工具,幫助決策者提高決策水平和質量,它是管理資訊系統 mis 向更高一級發展而產生的先進資訊管理系統。資料倉儲技術就是為更...