看阿里大資料之路一書,說到為什麼要資料建模?記錄如下
1、效能:良好的資料模型能幫助我們快速查詢所需要的資料,減少資料的i/o吞吐;
2、成本:良好的資料模型能極大地減少不必要的資料冗餘,也能實現計算結果符用,極大地降低大資料系統中的儲存和計算成本
3、效率:良好的資料模型能極大地改善使用者使用資料的體驗,提高資料使用效率
4、質量:良好的資料模型能改善資料統計口徑的不一致性,減少資料計算錯誤的可能性
因此,毋庸置疑,大資料系統需要資料模型方法來幫助更好地組織和儲存資料,一邊在效能,成本,效率和質量之間取得最佳平衡
數倉建模綜述
隨著大型關聯式資料庫商業軟體的興起,現代企業資訊系統幾乎都在使用關聯式資料庫來儲存 加工和處理資料。資料倉儲系統也不例外,大量的資料倉儲系統依託強大的關聯式資料庫能力儲存和處理資料,其採用的資料模型方法也是基於關聯式資料庫理論的。儘管 nosql也有 一定的發展,但是企業仍在大規模使用sql進行資料...
數倉 正規化建模 維度建模
third normal form,3nf 是資料模型常用的乙個方法,主要解決關係型資料庫的資料儲存。目前關係型資料庫的建模方法,大部分採用三正規化建模,即通過實體關係 entity relationship,er 模型描述企業業務。是資料倉儲之父inmon提出的集線器的自上而下 edw dm 的資...
數倉建模的edw 數倉結構幾層,作用
資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。為需要業務智慧型的企業,提供指導業務流程改進 監視時間 成本 質量以及控制。資料倉儲,並不是資料的最...