《資料倉儲》讀書筆記 第1章 決策支援系統的發展

2021-10-02 03:31:46 字數 1655 閱讀 5131

該系列博文為《資料倉儲 building the data warehouse》一書的讀書筆記,筆者將書中重點內容進行概括總結。大致保留書中結構,一部分根據自己的理解進行調整。如發現問題,歡迎批評指正。

章節博文

1《資料倉儲》讀書筆記:第1章 決策支援系統的發展

2《資料倉儲》讀書筆記:第2章 資料倉儲環境

3《資料倉儲》讀書筆記:第3章 設計資料倉儲

4《資料倉儲》讀書筆記:第4章 資料倉儲中的粒度

5《資料倉儲》讀書筆記:第5章 資料倉儲和技術

6《資料倉儲》讀書筆記:第6章 分布式資料倉儲

7《資料倉儲》讀書筆記:第7章 主管資訊系統和資料倉儲

8《資料倉儲》讀書筆記:第8章 外部資料與資料倉儲

9《資料倉儲》讀書筆記:第9章 遷移到體系結構化環境

10《資料倉儲》讀書筆記:第10章 資料倉儲和web

11《資料倉儲》讀書筆記:第11章 非結構化資料和資料倉儲

12待續……

3. 體系結構化環境

參考書籍

當用抽取程式將資料從操作型事物處理環境內移出後,資料的控制方式就發生了轉變。終端使用者一旦開始控制資料,他們最終「擁有」了這些資料。

抽取演變為抽取之上的抽取,接著在此基礎上再次抽取。這種失控的抽取處理模式即「自然演化式體系結構」。

自然演化式體系結構的問題

體系結構化環境的核心,主要有兩種資料:原始資料匯出資料。這兩種資料之間的一些主要區別如下:

原始資料/操作型資料

匯出資料/dss(決策支援系統)資料

面向應用;詳細的;在訪問瞬間是準確的

面向主題;概要的/精化的;代表過去的資料,快照

為日常工作服務;可更新;重複執行

為管理者服務;不更新;啟發式執行

處理需求預先可知

處理需求預先不知道

生命週期符合sdlc;事務處理驅動

完全不同的生命週期;分析處理驅動

對效能要求高;一次訪問乙個單元

對效能要求寬鬆;一次訪問乙個集合

就操作型資料更新責任來說更新控制是乙個主要關心的問題

無更新控制問題

高可用性;非冗餘性

以子集管理;總是存在冗餘

靜態結構,可變的內容;一次處理資料量小

結構靈活;一次處理資料量大

支援日常操作;訪問頻繁

支援管理需求;訪問很少或不多

由於原始資料和匯出資料的差異而引發資料分離.

體系化環境中有四個層次的資料

操作型環境與資料倉儲的差異

從生產環境轉變到體系化的資料倉儲環境的轉變:

資料倉儲的特性是不停地增長

olap中當響應時間太長,業務情況很快開始變糟,在dss資料倉儲環境中,響應時間總是寬鬆的。

[1] 《資料倉儲》william h.inmon著,王志濤等譯,機械工業出版社。

《資料倉儲》讀書筆記 2

讀了資料倉儲第2章,這一章講解的是資料倉儲環境。梳理出來的知識點 1 資料倉儲是面向主題的。資料倉儲的資料只對於特定的領域或客戶是有意義的。2 資料倉儲整合。這是資料倉儲所有特性中最重要的特性。資料倉儲中的資料是從多個資料來源來的。整合的功能之一就是消除不同資料來源對於同一資料的表示差異。3 資料倉...

《資料倉儲》讀書筆記 3

這兩天讀了 資料倉儲 第三章,這一章講解的是設計資料倉儲。將主要的內容梳理如下 1 建造資料倉儲主要包括兩個部分的工作 與操作型系統介面的設計和資料倉儲本身的設計。資料倉儲是在啟發方式下建造的,在這個過程中乙個階段的開發完全依賴於上乙個階段的結構。2 將資料從操作型環境移入資料倉儲環境不是簡單的抽取...

《資料倉儲》讀書筆記 4

今天開始讀資料倉儲的第四章,這一章講解的是資料倉儲中的粒度。下面是本章的小結 為體系結構化環境選擇乙個適當的粒度級別是成功的關鍵。選擇粒度級別的一般方法是利用常識。首先建立資料倉儲的一小部分,並讓使用者訪問這些資料。然後仔細聆聽使用者的意見,根據他們的反饋意見對粒度級別做適當的調整。最壞的想法是想要...