正規化是符合某一種級別的關係模式的集合。關聯式資料庫中的關係必須滿足一定的要求。滿足最低要求的叫第一正規化,簡稱1nf,在第一正規化基礎上進一步滿足一些要求的為第二正規化,簡稱2nf。其餘依此類推,目前有六種正規化:1nf,2nf,3nf,bcnf,4nf,5nf。
1 第一正規化(1nf)
在任何乙個關聯式資料庫中,第一正規化(1nf)是對關係模式的基本要求,不滿足第一正規化(1nf)的資料庫就不是關聯式資料庫。
所謂第一正規化(1nf)是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如 果出現重複的屬性,就可能需要定義乙個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關係。在第一正規化(1nf)中表的每一行只包含一 個例項的資訊。例如,對於圖3-2 中的員工資訊表,不能將員工資訊都放在一列中顯示,也不能將其中的兩列或多列在一列中顯示;員工資訊表的每一行只表示乙個員工的資訊,乙個員工的資訊在表 中只出現一次。簡而言之,第一正規化就是無重複的列。
2 第二正規化(2nf)
第二正規化(2nf)是在第一正規化(1nf)的基礎上建立起來的,即滿足第二正規化(2nf)必須先滿足第一正規化(1nf)。第二正規化(2nf)要求資料庫表 中的每個例項或行必須可以被惟一地區分。為實現區分通常需要為表加上乙個列,以儲存各個例項的惟一標識。如圖3-2 員工資訊表中加上了員工編號(emp_id)列,因為每個員工的員工編號是惟一的,因此每個員工可以被惟一區分。這個惟一屬性列被稱為主關鍵字或主鍵、主 碼。
第二正規化(2nf)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部 分應該分離出來形成乙個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上乙個列,以儲存各個例項的惟一標識。簡而言之,第二正規化 就是非主屬性非部分依賴於主關鍵字。
3 第三正規化(3nf)
滿足第三正規化(3nf)必須先滿足第二正規化(2nf)。簡而言之,第三正規化(3nf)要求乙個資料庫表中不包含已在其它表中已包含的非主關鍵字資訊。例 如,存在乙個部門資訊表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等資訊。那麼在圖3-2的員工資訊表中列出部門編號後就不能再將 部門名稱、部門簡介等與部門有關的資訊再加入員工資訊表中。如果不存在部門資訊表,則根據第三正規化(3nf)也應該構建它,否則就會有大量的資料冗餘。簡 而言之,第三正規化就是屬性不依賴於其它非主屬性。
bc正規化(bcnf)
例如:在關係模式stj(s,t,j)中s表示學生,t表示教師,j表示課程。假設每一教師只教一門課程,一門課程由多個教師任課,某一學生選定某門課程,就確定了乙個固定的教師。於是,有如下函式依賴
(s,j)→t,(s,t)→j,t→j
顯然,(s,j)和(s,t)都可以作為候選碼。該關係模式沒有任何非主屬性對碼傳遞依賴或部分依賴,所以stj∈3nf。但另一方面,t→j,即t是決定屬性集,可是t只是主屬性,它既不是候選鍵,也不包含候選鍵
如果關係模式是r∈bcnf,由定義可知,r中不存在任何屬性傳遞依賴於或部分依賴於任何候選鍵,所以必有r∈3nf。但是,如果r∈3nf,r未必屬於bcnf。
3nf和bcnf是以函式依賴為基礎的關係模式規範化程度的測度。
如果乙個關聯式資料庫中的所有關係模式都屬於3nf,則已在很大程度上消除了插入異常和刪除異常,但由於可能存在主屬性對候選碼的部分依賴和傳遞依賴,因此關係模式的分離不夠徹底。
如果乙個關聯式資料庫中的所有關係模式都屬於bcnf,那麼在函式依賴範疇內,它已實現了模式的徹底分解,達到了最高的規範化程度,消除了插入異常和刪除異常。
多值依賴與第四正規化(4nf)
前面完全是在函式依賴範疇內討論關係模式的正規化問題。如果僅考慮函式依賴這一種資料依賴,屬於bcnf的關係模式已經很完美了,但如果考慮其他資料依賴,例如多值依賴,屬於bcnf的關係模式仍然存在問題。
此例子將幫助你更好的理解
設有關係模式r(運動員編號,比賽專案,成績,比賽類別,比賽主管),如果規定:每個運動員每參加乙個比賽專案,只有乙個成績;每個比賽專案只屬於乙個比賽類別;每個比賽類別只有乙個比賽主管。
請回答下列問題:
(1)根據上述規定,寫出模式r的基本fd和關鍵碼
(2)說明r不是2nf的理由,並把r分解成2nf模式集
(3)進而分解成3nf模式集
解:(1)基本的fd有3個:
(運動員編號,比賽專案)→成績;比賽專案→比賽類別;比賽類別→比賽主管
該關係r的關鍵碼(即候選碼)為:(運動員編號,比賽專案)
(2)r中兩個這樣的fd:
(運動員編號,比賽專案)→(比賽類別,比賽主管)
比賽專案→(比賽類別,比賽主管)
存在非主屬性對主屬性的部分函式依賴,所以r不是2nf。
r應分解為:r1(比賽專案,比賽類別,比賽主管)
r2(運動員編號,比賽專案,成績)
此時,r1和r2是2nf
(3)r2已經是3nf,但是r1中存在兩個fd:
比賽專案→比賽類別;
比賽類別→比賽主管
存在非主屬性對主屬性的傳遞函式依賴,所以r不是3nf。
r1分解為r11(比賽專案,比賽類別)
r12(比賽類別,比賽主管)
關係模式規範化的步驟:
(1) 對1nf關係進行投影,消除原關係中非主屬性對碼的部分函式依賴,將1nf關係轉換為若干個2nf
(2) 對2nf關係進行投影,消除原關係中非主屬性對碼的傳遞函式依賴,從而產生一組3nf
(3) 對3nf關係進行投影,消除原關係中主屬性對碼的部分函式依賴和傳遞函式依賴,得到一組bcnf關係。
(4) 對bcnf關係進行投影,消除原關係中非平凡函式依賴的多值依賴,從而產生一組4nf
規範化 資料庫設計原則
關聯式資料庫設計的核心問題是關係模型的設計。本文將結合具體的例項,介紹資料庫設計規範化的流程。摘要 關係型資料庫是當前廣泛應用的資料庫型別,關聯式資料庫設計是對資料進行組織化和結構化的過程,核心問題是關係模型的設計。對於資料庫規模較小的情況,我們可以比較輕鬆的處理資料庫中的表結構。然而,隨著專案規模...
資料庫規範化
規範化 normalization 是資料庫系統設計中非常重要的乙個技術。資料庫規範化能夠讓資料庫設計者更好地了解組織內部當前的資料結構,最終得到一系列的資料實體。資料庫規範化通過對資料庫表的設計,可以有效降低資料庫冗餘程度。在進行資料庫規範化的時候,我們有一系列的步驟需要遵循。我們把這些步驟稱作正...
資料庫設計系列6 規範化
在前面的部分,我們學習了er建模方法,一種泛化的自上而下的資料庫設計方法,在這一節,我們學習另外的一種泛化的資料庫設計的方法,叫做規範化。在資料庫設計中,規範化可以有兩種使用方法,第一種是把規範化用作自下而上的資料庫設計方法,第二種是把規範化方法與er建模結合起來使用,把規範化作為自下而上的方法包括...