《資料倉儲》讀書筆記 4

2021-08-30 07:00:39 字數 660 閱讀 9297

今天開始讀資料倉儲的第四章,這一章講解的是資料倉儲中的粒度。

下面是本章的小結:

為體系結構化環境選擇乙個適當的粒度級別是成功的關鍵。選擇粒度級別的一般方法是利用常識。首先建立資料倉儲的一小部分,並讓使用者訪問這些資料。然後仔細聆聽使用者的意見,根據他們的反饋意見對粒度級別做適當的調整。

最壞的想法是想要實現設計好所有的粒度級別,再進行資料倉儲的建造。即使是在最好的情況下,有50%的設計是正確的,這個設計就已經成功了。資料倉儲環境的特點就是只有當dss分析員看到了報表之後,才能想象出哪些是他們需要的。

粒度設計的過程始於對資料倉儲在一年時間和五年時間內所能達到的大小的乙個粗略估測。一旦這個估測完成後,設計者就可以得知粒度應該細到什麼程度。此外,利用這個估測還可以得出是否需要考慮使用溢位儲存器。

資料倉儲環境中有乙個非常重要的反饋迴圈。建造資料倉儲的第一次迴圈設計完成後,資料體系結構設計人員認真聆聽終端使用者反饋的意見,並根據這些意見作出調整。

要考慮的另乙個重要問題是需要從資料倉儲中獲取資料的不同體系結構實體說需的粒度級別。當資料轉移到溢位儲存器,當存在大量的資料時,設計人員對粒度級別的選擇會受到約束。

要使溢位儲存器正常工作,有兩種軟體是必須的:管理硬碟環境與海量備用儲存環境之間資料流動的跨介質儲存管理器和資料活動監控器。資料活動監控器用來確定哪些資料應當放到溢位儲存器中和哪些應當留在硬碟上。

《資料倉儲》讀書筆記 2

讀了資料倉儲第2章,這一章講解的是資料倉儲環境。梳理出來的知識點 1 資料倉儲是面向主題的。資料倉儲的資料只對於特定的領域或客戶是有意義的。2 資料倉儲整合。這是資料倉儲所有特性中最重要的特性。資料倉儲中的資料是從多個資料來源來的。整合的功能之一就是消除不同資料來源對於同一資料的表示差異。3 資料倉...

《資料倉儲》讀書筆記 3

這兩天讀了 資料倉儲 第三章,這一章講解的是設計資料倉儲。將主要的內容梳理如下 1 建造資料倉儲主要包括兩個部分的工作 與操作型系統介面的設計和資料倉儲本身的設計。資料倉儲是在啟發方式下建造的,在這個過程中乙個階段的開發完全依賴於上乙個階段的結構。2 將資料從操作型環境移入資料倉儲環境不是簡單的抽取...

資料倉儲 DW BI架構對比 讀書筆記二

kimball 分工明確,資源占用更加合理,呼叫鏈路少,整個dw bi系統更加穩定 高效 有保障。etl系統高度關注資料質量 完整性 一致性。輸入資料在進入時要檢查其質量。一致的獲取增值度量和屬性的業務規則由etl系統中的有技能的專業人員開發,這樣會給客戶發布更好的 保持一致性的產品。展現區根據客戶...