資料庫正規化

2022-05-15 14:23:23 字數 2829 閱讀 2656

資料庫正規化

設計關聯式資料庫時,遵從不同的規範要求,設計出合理的關係型資料庫,這些不同的規範要求被稱為不同的正規化,各種正規化呈遞次規範,越高的正規化資料庫冗餘越小。

正規化來自英文normal form,簡稱nf。要想設計—個好的關係,必須使關係滿足一定的約束條件,此約束已經形成了規範,分成幾個等級,一級比一級要求得嚴格。滿足這些規範的資料庫是簡潔的、結構明晰的,同時,不會發生插入(insert)、刪除(delete)和更新(update)操作異常。反之則是亂七八糟,不僅給資料庫的程式設計人員製造麻煩,而且面目可憎,可能儲存了大量不需要的冗餘資訊。

目前關聯式資料庫有六種正規化:第一正規化(1nf)、第二正規化(2nf)、第三正規化(3nf)、巴斯-科德正規化(bcnf)、第四正規化(4nf)和第五正規化(5nf,又稱完美正規化)。滿足最低要求的正規化是第一正規化(1nf)。在第一正規化的基礎上進一步滿足更多規範要求的稱為第二正規化(2nf),其餘正規化以次類推。一般來說,資料庫只需滿足第三正規化(3nf)就行了。

1、第一正規化(1nf):

所謂第一正規化(1nf)是指在關係模型中,對於新增的乙個規範要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子資料項,而不能是集合,陣列,記錄等非原子資料項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一正規化(1nf)表中的每個域值只能是實體的乙個屬性或乙個屬性的一部分。簡而言之,第一正規化就是無重複的域。

說明:在任何乙個關聯式資料庫中,第一正規化(1nf)是對關係模式的設計基本要求,一般設計中都必須滿足第一正規化(1nf)。不過有些關係模型中突破了1nf的限制,這種稱為非1nf的關係模型。換句話說,是否必須滿足1nf的最低要求,主要依賴於所使用的關係模型。

2、第二正規化(2nf)

在1nf的基礎上,非碼屬性必須完全依賴於候選碼(在1nf基礎上消除非主屬性對主碼的部分函式依賴)

第二正規化(2nf)是在第一正規化(1nf)的基礎上建立起來的,即滿足第二正規化(2nf)必須先滿足第一正規化(1nf)。第二正規化(2nf)要求資料庫表中的每個例項或記錄必須可以被唯一的區分。選取乙個能區分每個實體的屬性或屬性組,作為實體的唯一標識。例如在員工表中的身份證號碼即可實現每個一員工的區分,該身份證號碼即為候選鍵,任何乙個候選鍵都可以被選作主鍵。在找不到候選鍵時,可額外增加屬性以實現區分,如果在員工關係中,沒有對其身份證號進行儲存,而姓名可能會在資料庫執行的某個時間重複,無法區分出實體時,設計闢如id等不重複的編號以實現區分,被新增的編號或id選作主鍵。(該主鍵的新增是在er設計時新增,不是建庫時隨意新增)

第二正規化(2nf)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成乙個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上乙個列,以儲存各個例項的唯一標識。簡而言之,第二正規化就是在第一正規化的基礎上屬性完全依賴於主鍵

3、第三正規化(3nf)

在2nf基礎上,任何非主屬性不依賴於其它非主屬性(在2nf基礎上消除傳遞依賴)

第三正規化(3nf)是第二正規化(2nf)的乙個子集,即滿足第三正規化(3nf)必須滿足第二正規化(2nf)。簡而言之,第三正規化(3nf)要求乙個關係中不包含已在其它關係已包含的非主關鍵字資訊(只用包含其他關係的主鍵即可,也就是使用外來鍵)。例如,存在乙個部門資訊表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等資訊。那麼在員工資訊表中列出部門編號後就不能再將部門名稱、部門簡介等與部門有關的資訊再加入員工資訊表中。如果不存在部門資訊表,則根據第三正規化(3nf)也應該構建它,否則就會有大量的資料冗餘。簡而言之,第三正規化就是屬性不依賴於其它非主屬性,也就是在滿足2nf的基礎上,任何非主屬性不得傳遞依賴於主屬性。

4、巴斯-科德正規化(bcnf)

boyce-codd normal form(巴斯-科德正規化)

在3nf基礎上,任何非主屬性不能對主鍵子集依賴(在3nf基礎上消除對主碼子集的依賴)

巴斯-科德正規化(bcnf)是第三正規化(3nf)的乙個子集,即滿足巴斯-科德正規化(bcnf)必須滿足第三正規化(3nf)。通常情況下,巴斯-科德正規化被認為沒有新的設計規範加入,只是對第二正規化與第三正規化中設計規範要求更強,因而被認為是修正第三正規化,也就是說,它事實上是對第三正規化的修正,使資料庫冗餘度更小。這也是bcnf不被稱為第四正規化的原因。某些書上,根據正規化要求的遞增性將其稱之為第四正規化是不規範,也是更讓人不容易理解的地方。而真正的第四正規化,則是在設計規範中新增了對多值及依賴的要求。

規範化目的是使結構更合理,消除儲存異常,使資料冗餘盡量小。便於插入、刪除和更新。

遵從概念單一化「一事一地」原則,即乙個關係模式描述乙個實體或實體間的一種聯絡。規範的實質就是概念的單一化。

乙個關係模式接著分解可以得到不同關係模式集合,也就是說分解方法不是唯一的。最小冗餘的要求必須以分解後的資料庫能夠表達原來資料庫所有資訊為前提來實現。其根本目標是節省儲存空問,避免資料不一致性,提高對關係的操作效率,同時滿足應用需求。實際上,並不一定要求全部模式都達到bcnf不可。有時故意保留部分冗餘可能更方便資料查詢。尤其對於那些更新頻度不高,查詢頻度極高的資料庫系統更是如此。

規範化的優點是明顯的,它避免了大量的資料冗餘,節省了儲存空間,保持了資料的一致性。當乙個庫里的資料經常發生變化時,達到3nf的庫可以使使用者不必在超過兩個以上的地方更改同乙個值。那麼是不是只要把所有的表都規範為3nf後,資料庫的設計就是最優的呢?這可不一定。正規化越高意味著表的劃分更細,乙個資料庫中需要的表也就越多,使用者不得不將原本相關聯的資料分攤到多個表中。當使用者同時需要這些資料時只能採用連線表的形式將資料重新合併在一起。同時把多個表聯接在一起的花費是巨大的,尤其是當需要連線的兩張或者多張表資料非常龐大的時候,表連線操作幾乎是乙個噩夢,這嚴重地降低了系統執行效能。

資料庫 資料庫正規化

關聯式資料庫的設計規範。不同的規範要求被稱為不同的正規化,越高的正規化資料庫冗餘越小。減少資料庫中資料冗餘的過程 1 第一正規化 1nf 在關係模式r中,當且僅當所有屬性只包含原子值,即每個分量都是不可再分的資料項,則稱r滿足1nf。例如表所示的教師職稱情況關係就不滿足1nf。原因在於,該關係模式中...

資料庫正規化 三正規化

所謂第一正規化 1nf 是指在關係模型中,對域新增的乙個規範要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子資料項,而不能是集合,陣列,記錄等非原子資料項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一正規化 1nf 表中的每個域值只能是實體的乙個屬性或乙個屬性的...

資料庫正規化

注 表在定義中被稱為關係,記作r 欄位在定義中被稱作屬性 模式 資料庫中有三種模式,外模式,內模式,模式 粗體是關鍵字的意思 斜體為外來鍵 以前寫下來的,但是用了多年的帳號已經忘了,唯有把文章轉到這裡來了 真暈哦 http blog.csdn.net fantasylu archive 2004 0...