該系列博文為《資料倉儲 building the data warehouse》一書的讀書筆記,筆者將書中重點內容進行概括總結。大致保留書中結構,一部分根據自己的理解進行調整。如發現問題,歡迎批評指正。
章節博文
1《資料倉儲》讀書筆記:第1章 決策支援系統的發展
2《資料倉儲》讀書筆記:第2章 資料倉儲環境
3《資料倉儲》讀書筆記:第3章 設計資料倉儲
4《資料倉儲》讀書筆記:第4章 資料倉儲中的粒度
5《資料倉儲》讀書筆記:第5章 資料倉儲和技術
6《資料倉儲》讀書筆記:第6章 分布式資料倉儲
7《資料倉儲》讀書筆記:第7章 主管資訊系統和資料倉儲
8《資料倉儲》讀書筆記:第8章 外部資料與資料倉儲
9《資料倉儲》讀書筆記:第9章 遷移到體系結構化環境
10《資料倉儲》讀書筆記:第10章 資料倉儲和web
11《資料倉儲》讀書筆記:第11章 非結構化資料和資料倉儲
12待續……
3. 體系結構化環境
參考書籍
當用抽取程式將資料從操作型事物處理環境內移出後,資料的控制方式就發生了轉變
。終端使用者一旦開始控制資料,他們最終「擁有」了這些資料。
抽取演變為抽取之上的抽取,接著在此基礎上再次抽取。這種失控的抽取處理模式即「自然演化式體系結構」。
自然演化式體系結構的問題體系結構化環境的核心,主要有兩種資料:
原始資料
和匯出資料
。這兩種資料之間的一些主要區別如下:
原始資料/操作型資料
匯出資料/dss(決策支援系統)資料
面向應用;詳細的;在訪問瞬間是準確的
面向主題;概要的/精化的;代表過去的資料,快照
為日常工作服務;可更新;重複執行
為管理者服務;不更新;啟發式執行
處理需求預先可知
處理需求預先不知道
生命週期符合sdlc;事務處理驅動
完全不同的生命週期;分析處理驅動
對效能要求高;一次訪問乙個單元
對效能要求寬鬆;一次訪問乙個集合
就操作型資料更新責任來說更新控制是乙個主要關心的問題
無更新控制問題
高可用性;非冗餘性
以子集管理;總是存在冗餘
靜態結構,可變的內容;一次處理資料量小
結構靈活;一次處理資料量大
支援日常操作;訪問頻繁
支援管理需求;訪問很少或不多
由於原始資料和匯出資料的差異而引發資料分離.
體系化環境中有四個層次的資料:
操作型環境與資料倉儲的差異
從生產環境轉變到體系化的資料倉儲環境的轉變:
資料倉儲的特性是不停地增長
。
olap中當響應時間太長,業務情況很快開始變糟,在dss資料倉儲環境中,響應時間總是寬鬆的。
[1] 《資料倉儲》william h.inmon著,王志濤等譯,機械工業出版社。
《資料倉儲》讀書筆記 2
讀了資料倉儲第2章,這一章講解的是資料倉儲環境。梳理出來的知識點 1 資料倉儲是面向主題的。資料倉儲的資料只對於特定的領域或客戶是有意義的。2 資料倉儲整合。這是資料倉儲所有特性中最重要的特性。資料倉儲中的資料是從多個資料來源來的。整合的功能之一就是消除不同資料來源對於同一資料的表示差異。3 資料倉...
《資料倉儲》讀書筆記 3
這兩天讀了 資料倉儲 第三章,這一章講解的是設計資料倉儲。將主要的內容梳理如下 1 建造資料倉儲主要包括兩個部分的工作 與操作型系統介面的設計和資料倉儲本身的設計。資料倉儲是在啟發方式下建造的,在這個過程中乙個階段的開發完全依賴於上乙個階段的結構。2 將資料從操作型環境移入資料倉儲環境不是簡單的抽取...
《資料倉儲》讀書筆記 4
今天開始讀資料倉儲的第四章,這一章講解的是資料倉儲中的粒度。下面是本章的小結 為體系結構化環境選擇乙個適當的粒度級別是成功的關鍵。選擇粒度級別的一般方法是利用常識。首先建立資料倉儲的一小部分,並讓使用者訪問這些資料。然後仔細聆聽使用者的意見,根據他們的反饋意見對粒度級別做適當的調整。最壞的想法是想要...