正規化是符合某一種級別的關係模式的集合。關聯式資料庫中的關係必須 滿足一定的要求。滿足最低要求的叫第一正規化,簡稱1nf,在第一正規化基礎上進一步滿足一些要求的為第二正規化,簡稱2nf。其餘依此類推,目前有六種範 式:1nf,2nf,3nf,bcnf,4nf,5nf。
1 第一正規化(1nf)
在任何乙個關聯式資料庫中,第一正規化(1nf)是對關係模式的基本要求,不滿足第一正規化(1nf)的資料庫就不是關聯式資料庫。
所謂第一正規化(1nf)是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如 果出現重複的屬性,就可能需要定義乙個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關係。在第一正規化(1nf)中表的每一行只包含一 個例項的資訊。例如,對於圖3-2 中的員工資訊表,不能將員工資訊都放在一列中顯示,也不能將其中的兩列或多列在一列中顯示;員工資訊表的每一行只表示乙個員工的資訊,乙個員工的資訊在表 中只出現一次。簡而言之,第一正規化就是無重複的列。
2 第二正規化(2nf)
第二正規化(2nf)是在第一正規化(1nf)的基礎上建立起來的,即滿足第二正規化(2nf)必須先滿足第一正規化(1nf)。第二正規化(2nf)要求資料庫表 中的每個例項或行必須可以被惟一地區分。為實現區分通常需要為表加上乙個列,以儲存各個例項的惟一標識。如圖3-2 員工資訊表中加上了員工編號(emp_id)列,因為每個員工的員工編號是惟一的,因此每個員工可以被惟一區分。這個惟一屬性列被稱為主關鍵字或主鍵、主 碼。
第二正規化(2nf)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部 分應該分離出來形成乙個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上乙個列,以儲存各個例項的惟一標識。簡而言之,第二正規化 就是非主屬性非部分依賴於主關鍵字。
3 第三正規化(3nf)
滿足第三正規化(3nf)必須先滿足第二正規化(2nf)。簡而言之,第三正規化(3nf)要求乙個資料庫表中不包含已在其它表中已包含的非主關鍵字資訊。例 如,存在乙個部門資訊表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等資訊。那麼在圖3-2的員工資訊表中列出部門編號後就不能再將 部門名稱、部門簡介等與部門有關的資訊再加入員工資訊表中。如果不存在部門資訊表,則根據第三正規化(3nf)也應該構建它,否則就會有大量的資料冗餘。簡 而言之,第三正規化就是屬性不依賴於其它非主屬性。
bc正規化(bcnf)
例如:在關係模式stj(s,t,j)中s表示學生,t表示教師,j表示課程。假設每一教師只教一門課程,一門課程由多個教師任課,某一學生選定某門課 程,就確定了乙個固定的教師。於是,有如下函式依賴
(s,j)→t,(s,t)→j,t→j
顯然,(s,j)和(s,t)都可以作為候選 碼。該關係模式沒有任何非主屬性對碼傳遞依賴或部分依賴,所以stj∈3nf。但另一方面,t→j,即t是決定屬性集,可是t只是主屬性,它既不是候選 鍵,也不包含候選鍵
如果關係模式是r∈bcnf,由定義可知,r中不存在任何 屬性傳遞依賴於或部分依賴於任何候選鍵,所以必有r∈3nf。但是,如果r∈3nf,r未必屬於bcnf。
3nf和bcnf是以函式依賴為基礎的 關係模式規範化程度的測度。
如果乙個關聯式資料庫中的所有關係模式都屬於3nf,則已在很大程度上消除了插入異常和刪除異常,但由於可能存在主屬性 對候選碼的部分依賴和傳遞依賴,因此關係模式的分離不夠徹底。
如果乙個關聯式資料庫中的所有關係模式都屬於bcnf,那麼在函式依賴範疇內,它已實 現了模式的徹底分解,達到了最高的規範化程度,消除了插入異常和刪除異常。
多值依賴與第四正規化(4nf)
前面完全是在函式依賴範疇內討論關係模式的正規化問題。如果僅考慮函式依賴這一種資料依賴,屬於bcnf的關係模式已經很完美了,但如果考慮其他資料依賴, 例如多值依賴,屬於bcnf的關係模式仍然存在問題。
此例子將幫助你更好的理解
設有關係模式r
(運動員編號,比賽專案,成績,比賽類別,比賽主管),如果規定:每個運動員每參加乙個比賽項 目,只有乙個成績;每個比賽專案只屬於乙個比賽類別;每個比賽類別只有乙個比賽主管。
請回答下列問題:
(1 )根據上述規定,寫出模式r
的基本fd
和關鍵碼
(2 )說明r
不是2nf
的 理由,並把r
分解成2nf
模式集(3 )進而分解成3nf
模式集解:(1
)基本的fd
有3 個:
(運動員編號,比賽項 目)→成績;比賽專案→比賽類別;比賽類別→比賽主管
該關係r
的關鍵碼(即候選碼)為:(運動員編號,比賽專案)
(2 )r
中 兩個這樣的fd
:(運動員編號,比賽專案)→(比賽類別,比 賽主管)
比賽專案→(比賽類別,比賽主管)
存在非主屬性對主屬性的部分函式依賴,所以r
不是2nf 。r
應分解為:r1
(比賽專案 ,比賽類別,比賽主管)
r2 (運 動員編號,比賽專案 ,成績)
此時,r1
和r2是2nf (3
)r2已 經是3nf
,但是r1
中存在兩個fd
:比賽專案→比賽類別;
比賽類別→比賽主管
存在非主屬性對主屬性的傳遞函式依賴,所以r
不是3nf
。r1分解為r11
(比賽專案,比賽類別)
r12 (比賽類別,比賽主管)
關係模式規範化的步驟:
(1) 對1nf關係進行投影,消除原關係中非主屬性對碼的部分函式依賴,將1nf關係轉換為若干個2nf
(2) 對2nf關係進行投影,消除原關係中非主屬性對碼的傳遞函式依賴,從而產生一組3nf
(3) 對3nf關係進行投影,消除原關係中主屬性對碼的部分函式依賴和傳遞函式依賴,得到一組bcnf關係。
(4) 對bcnf關係進行投影,消除原關係中非平凡函式依賴的多值依賴,從而產生一組4nf
資料庫三種設計正規化
1 正規化定義 規範的的資料庫是需要滿足一些規範的來優化資料資料儲存方式。在關係型資料庫中這些規範就可以稱為正規化。2 第一正規化 域原子性 1nf 當關係模式r的所有屬性都不能在分解為更基本的資料單位時,稱r是滿足第一正規化的,簡記為1nf。滿足第一正規化是關係模式規範化的最低要求。3 第二正規化...
資料庫的三種正規化
第一正規化 在任何乙個關聯式資料庫中,第一正規化 1nf 是對關係模式的基本要求,不滿足第一正規化 1nf 的資料庫就不是關聯式資料庫。所謂第一正規化 1nf 是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性,...
資料庫正規化 三正規化
所謂第一正規化 1nf 是指在關係模型中,對域新增的乙個規範要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子資料項,而不能是集合,陣列,記錄等非原子資料項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一正規化 1nf 表中的每個域值只能是實體的乙個屬性或乙個屬性的...