粒度概述
粒度問題時設計資料倉儲的乙個最重要方面。粒度時指資料倉儲的資料單位中儲存資料的細化或綜合成都的級別。細化程度越高,粒度就越小;相反,細化程度越低,粒度級就越大。資料的粒度一直時乙個設計問題。資料倉儲環境中粒度之所以時主要的設計問題,是因為它深深地影響存放在資料倉儲中的資料量的大小。同時影響資料倉儲所能回答的查詢型別。粒度的大小需要資料倉儲在設計時在資料量大小與查詢的訊息成都之間做出權衡。
選擇維度和事實前必須宣告粒度
建議從原始粒度資料開始設計
不同的事實可以有不同的粒度
維度表儲存了某一維度的所有相關資料
維度是對事實資料屬性的描述
乙個維度被規範化成多個關聯的表
資料倉儲建模
一 資料倉儲建模的意義 如果把資料看作圖書館裡的書,我們希望看到它們在書架上分門別類地放置 如果把資料看作城市的建築,我們希望城市規劃布局合理 如果把資料看作電腦檔案和資料夾,我們希望按照自己的習慣有很好的資料夾組織方式,而不是糟糕混亂的桌面,經常為找乙個檔案而不知所措。資料模型就是資料組織和儲存方...
資料倉儲建模
是原始資料,儲存總hdfs上 lzo壓縮 解壓速度非常快 允許在壓縮部分以損失壓縮速度為代價提高壓縮率,解壓速度不會降低。演算法無損,執行緒安全 需構建維度模型,一般採用星型模型,呈現的狀態一般為星座模型 維度建模的過程 選擇業務 一條業務線對應一張事實表 宣告粒度 精確定義事實表中的一行資料表示什...
資料倉儲建模參考
資料倉儲建模案例 資料倉儲建模規範1.0 資料倉儲優化資料分析 資料倉儲的建模方法 資料倉儲維度集定義 寬表的思考 寬表從字面意義上講就是字段比較多的資料庫表。通常是指業務主題相關的指標 維度 屬性關聯在一起的一張資料庫表。由於把不同的內容都放在同一張表儲存,寬表已經不符合三正規化的模型設計規範,隨...