使結構更合理,改善資料的一致性
消除儲存異常
使資料冗餘盡量小
便於插入、刪除和更新
函式依賴
關係模式
決定因素
候選碼,主碼,外碼
正規化第一正規化:資料庫表中的字段都是單一屬性,不可再分
第二正規化:表中的非主屬性,不存在部分依賴。即所有非主屬性都完全依賴於任意乙個候選關鍵字
第三正規化:資料表中不存在非關鍵字段對任意候選鍵字段的傳遞函式依賴
一對一和多對多單獨做表
一對多聯合做表
維:是用於從不同角度描述事物特徵的,用於選擇和分組
度量: 資料的實際意義,常為乙個資料值的統計指標
粒度:資料的細分層度,考慮到量度的聚合程度不同,一般採用「最小粒度原則」
資料立方體(cubes):
切片、切塊、旋轉和鑽取(先切之後聚合)
事實表:是用來記錄分析的內容的全量資訊的,包含了每個事件的具體要素,以及具體發生的事情。事實表中儲存數字型id以及度量資訊。要求符合「瘦高原則」,即要求事實表資料條數盡量多(粒度最小),而描述性資訊盡量少
維表:則是對事實表中事件的要素的描述資訊,就是你觀察該事務的角度,是從哪個角度去觀察這個內容的。
拉鍊表:資料倉儲設計中表儲存資料的方式而定義的,即記錄歷史。記錄乙個事物從開始,一直到當前狀態的所有變化的資訊。
資料表columns越多,查詢越慢
星型模型: 事實表下有多個維表
雪花模型:在星型基礎拆分,可並行和這垂直關係,可幫助鑽取不同維度下的資料
區別:每個維度都有主鍵;星型模型維表沒有父表,雪花模式可有乙個到多個;星型模型下,維層次都放在一張維表中,雪花模型,會拆分成若干張表。
參考:
正規化理論簡介
正規化理論簡介 為了建立冗餘較小,結構合理的資料庫,構造資料庫時必須 遵循一定的規則,在關聯式資料庫中這種規則就是正規化。正規化 是符合某一種級別的關係模式的集合。關聯式資料庫的關係必須滿足一定的要求,即滿足不同的正規化。目前關係 資料庫有六種正規化,即第一正規化 第二正規化 第三正規化 bcnf ...
正規化篇之一正規化理論
關係模型原理的核心是 規範化 概念,規範化是把資料庫組織成在儲存儲存資料完整性的同時,最小化冗餘資料的結構的過程 規範化的資料庫是符合關係模型規則的資料庫,通常把這些規則稱為正規化 正規化是符合某一種級別的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求即滿足不同的正規化,目前關係型資料庫有六...
正規化篇之一正規化理論
關係模型原理的核心是 規範化 概念,規範化是把資料庫組織成在儲存儲存資料完整性的同時,最小化冗餘資料的結構的過程 規範化的資料庫是符合關係模型規則的資料庫,通常把這些規則稱為正規化 正規化是符合某一種級別的關係模式的集合,關聯式資料庫中的關係必須滿足一定的要求即滿足不同的正規化,目前關係型資料庫有六...