資料庫正規化

1、一正規化

表必須有主鍵

欄位不可以再分（列不可再分）

2、二正規化（多對多關係表設計）

不能存在部分依賴（主鍵有多個，非主鍵的字段不能依賴於部分主鍵，

必須同時依賴於所有主鍵）

3、三正規化

不能存在傳遞依賴（部分字段不是完全依賴於主鍵，比如學生依賴於學號，

班級依賴於班級號，屬於傳遞依賴於學號，也就是說非主鍵字段之間不能

存在依賴關係）

1 第一正規化（1nf）無重複的列

所謂第一正規化（1nf）是指資料庫表的每一列都是不可分割的基本資料項，同一列中不能有多個值，即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性，就可能需要定義乙個新的實體，新的實體由重複的屬性構成，新實體與原實體之間為一對多關係。在第一正規化（1nf）中表的每一行只包含乙個例項的資訊。簡而言之，第一正規化就是無重複的列。

說明：在任何乙個關聯式資料庫中，第一正規化（1nf）是對關係模式的基本要求，不滿足第一正規化（1nf）的資料庫就不是關聯式資料庫。

1.2 第二正規化（2nf）屬性完全依賴於主鍵[消除部分子函式依賴]

第二正規化（2nf）是在第一正規化（1nf）的基礎上建立起來的，即滿足第二正規化（2nf）必須先滿足第一正規化（1nf）。第二正規化（2nf）要求資料庫表中的每個例項或行必須可以被唯一地區分。為實現區分通常需要為表加上乙個列，以儲存各個例項的唯一標識。例如員工資訊表中加上了員工編號（emp_id）列，因為每個員工的員工編號是唯一的，因此每個員工可以被唯一區分。這個唯一屬性列被稱為主關鍵字或主鍵、主碼。

第二正規化（2nf）要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性，如果存在，那麼這個屬性和主關鍵字的這一部分應該分離出來形成乙個新的實體，新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上乙個列，以儲存各個例項的唯一標識。簡而言之，第二正規化就是屬性完全依賴於主鍵。

1.3 第三正規化（3nf）屬性不依賴於其它非主屬性[消除傳遞依賴]

滿足第三正規化（3nf）必須先滿足第二正規化（2nf）。簡而言之，第三正規化（3nf）要求乙個資料庫表中不包含已在其它表中已包含的非主關鍵字資訊。例如，存在乙個部門資訊表，其中每個部門有部門編號（dept_id）、部門名稱、部門簡介等資訊。那麼在的員工資訊表中列出部門編號後就不能再將部門名稱、部門簡介等與部門有關的資訊再加入員工資訊表中。如果不存在部門資訊表，則根據第三正規化（3nf）也應該構建它，否則就會有大量的資料冗餘。簡而言之，第三正規化就是屬性不依賴於其它非主屬性。

ii、正規化應用例項剖析

下面以乙個學校的學生系統為例分析說明，這幾個正規化的應用。首先第一正規化（1nf）：資料庫表中的字段都是單一屬性的，不可再分。這個單一屬性由基本型別構成，包括整型、實數、字元型、邏輯型、日期型等。在當前的任何關聯式資料庫管理系統（dbms）中，傻瓜也不可能做出不符合第一正規化的資料庫，因為這些dbms不允許你把資料庫表的一列再分成二列或多列。因此，你想在現有的dbms中設計出不符合第一正規化的資料庫都是不可能的。

首先我們確定一下要設計的內容包括那些。學號、學生姓名、年齡、性別、課程、課程學分、系別、學科成績，系辦位址、系辦**等資訊。為了簡單我們暫時只考慮這些字段資訊。我們對於這些資訊，說關心的問題有如下幾個方面。

學生有那些基本資訊

學生選了那些課，成績是什麼

每個課的學分是多少

學生屬於那個系，系的基本資訊是什麼。

2.1 第二正規化（2nf）例項分析

首先我們考慮，把所有這些資訊放到乙個表中(學號，學生姓名、年齡、性別、課程、課程學分、系別、學科成績，系辦位址、系辦**)下面存在如下的依賴關係。

（學號）→ (姓名, 年齡，性別，系別，系辦位址、系辦**)

(課程名稱) → (學分)

（學號，課程）→ (學科成績)

2.1.1 問題分析

因此不滿足第二正規化的要求，會產生如下問題

資料冗餘：同一門課程由n個學生選修，"學分"就重複n-1次；同乙個學生選修了m門課程，姓名和年齡就重複了m-1次。

更新異常：

1)若調整了某門課程的學分，資料表中所有行的"學分"值都要更新，否則會出現同一門課程學分不同的情況。

2)假設要開設一門新的課程，暫時還沒有人選修。這樣，由於還沒有"學號"關鍵字，課程名稱和學分也無法記錄入資料庫。

刪除異常：假設一批學生已經完成課程的選修，這些選修記錄就應該從資料庫表中刪除。但是，與此同時，課程名稱和學分資訊也被刪除了。很顯然，這也會導致插入異常。

2.1.2 解決方案

把選課關係表selectcourse改為如下三個表：

學生：student(學號，姓名, 年齡，性別，系別，系辦位址、系辦**)；

課程：course(課程名稱, 學分)；

選課關係：selectcourse(學號, 課程名稱, 成績)。

2.2 第三正規化（3nf）例項分析

接著看上面的學生表student(學號，姓名, 年齡，性別，系別，系辦位址、系辦**)，關鍵字為單一關鍵字"學號"，因為存在如下決定關係：

（學號）→ (姓名, 年齡，性別，系別，系辦位址、系辦**)

但是還存在下面的決定關係

(學號) → (所在學院)→(學院地點, 學院**)

即存在非關鍵字段"學院地點"、"學院**"對關鍵字段"學號"的傳遞函式依賴。

它也會存在資料冗餘、更新異常、插入異常和刪除異常的情況。 (資料的更新，刪除異常這裡就不分析了，可以參照2.1.1進行分析)

根據第三正規化把學生關係表分為如下兩個表就可以滿足第三正規化了：

學生：(學號, 姓名, 年齡, 性別，系別)；

系別：(系別, 系辦位址、系辦**)。

總結上面的資料庫表就是符合i,ii,iii正規化的，消除了資料冗餘、更新異常、插入異常和刪除異常

一、函式依賴概念

函式依賴是從數學角度來定義的，在關係中用來刻畫關係各屬性之間相互制約而又相互依賴的情況。函式依賴普遍存在於現實生活中，比如，描述乙個學生的關係，可以有學號、姓名、所在系等多個屬性，由於乙個學號對應乙個且僅乙個學生，乙個學生就讀於乙個確定的系，因而當「學號」屬性的值確定之後，「姓名」及「所在系」的值也就唯一地確定了，此時，就可以稱「姓名」和「所在系」函式依賴於「學號」，或者說「學號」函式決定「姓名」和「所在系」，記作：學號→姓名、學號→所在系。下面對函式依賴給出確切的定義。

定義：設u是屬性集合，r（u）是u上的乙個關係，x、y是u的子集。若對於r（u）下的任何乙個可能的關係，均有x的乙個值對應於y的唯一具體值，稱y函式依賴於x，記作x→y。其中x稱為決定因素。進而若再有y→x，則稱x與y相互依賴，記作x←→y。例如表1．2所示「系」關係中：如果系名值是唯一的，即各系名均不相同，那麼有函式依賴集：

系**→系名，系**→系位址，系**→系**，系**→系專業設定。

系名→系**，系名→系位址，系名→系**，系名→系專業設定。

可見，系名與系**相互依賴，記作系名←→系**。

函式依賴中還可細分為多種函式依賴，分別介紹如下：

二、部分函式依賴

設r（u）是屬性集u上的關係，x、y是u的子集，x』是x的真子集，若x→y且x』→y，則稱y部分依賴x，記作x→py。顯然，當且僅當x為復合屬性組時，才有可能出現部分函式依賴。

例如表1.6中，顯然有課程號→課程名，課程號→開課教研室**。從另一角度看，只要課程號一定，同時課程名確定，開課教研室也就唯一確定，因此課程號+課程名→開課教研室**。但它與前述課程號→開課教研室**是不同的，因為｛課程號，課程名｝存在真子集：「課程號」，課程號→開課教研室**，我們把課程號十課程名→開課教研室**稱為「開課教研室**」部分函式依賴於課程號+課程名。

三、完全函式依賴

設r（u）是屬性集u上的關係，x、y是u的子集，x』是x的真子集。若對於r（u）的任何乙個可能的關係，有x→y但x』→y，則稱y完全函式依賴於x，記作x→fy。

所謂完全依賴是說明在依賴關係的決定項（即依賴關係的左項）中沒有多餘屬性，有多餘屬性就是部分依賴。

例如設關係模式r，r＝r（學號，姓名，班號，課程號，成績），易知：

「（學號，班號，課程號）→成績」是r的乙個部分依賴關係。因此有決定項的真子集（學號，課程號），使得「（學號，課程號）→成績」成立，且「學號→成績」或「課程號→成績」成立，「（學號，課程號）→ 成績」是r的乙個完全依賴關係。

四、傳遞函式依賴

設r（u）是屬性集u上的關係，x、y、z是u的子集，在r（u）中，若x→y，但y→x，若y→z，則x→z，稱z傳遞函式依賴於x，記作x→tz。

例如在乙個學校中，每門課均是某一位老師教，但有些老師可教多門課，則有關係「教學」如表3．1所示。

由以上關係不難分析，課程名→職工號、職工號→課程名，但職工號和其他屬性的函式關係中都是決定因素，即職工號→老師名、職工號→職稱，在這種情況下，老師名、職稱傳遞函式依賴於課程名。

表3．1 教學表

課程名

職工號

老師名

性別

出生日期

職稱

英語

張平

男

55．6．3

教授

數學

王文

女

62．10．5

副教授

c語言

李迎

女

62．10．5

副教授

資料庫

王文

女

62．10．5

副教授

資料庫正規化

資料庫資料庫正規化

資料庫正規化三正規化

資料庫正規化

資料庫正規化

資料庫 資料庫正規化

資料庫正規化 三正規化

資料庫正規化

相關推薦

資料庫資料庫正規化

資料庫正規化三正規化