所謂第一正規化(1nf)是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能同時有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性,就可能需要定義乙個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關係。在第一正規化(1nf)中表的每一行只包含乙個例項的資訊。簡而言之,第一正規化就是無重複的列。
在任何乙個關聯式資料庫中,第一正規化(1nf)是對關係模式的基本要求,不滿足第一正規化(1nf)的資料庫就不是關聯式資料庫。在當前的任何關聯式資料庫管理系統(dbms)中,不可能做出不符合第一正規化的資料庫,因為這些dbms不允許你把資料庫表的一列再分成二列或多列。因此,你想在現有的dbms中設計出不符合第一正規化的資料庫都是不可能的。
舉例1:
一張學生表student(stuno,stuname,age,age,***)是不符合第一正規化的,因為有重複列age屬性。去除重複列age以後的student(stuno,stuname,age,***)是符合第一正規化的。
第二正規化(2nf)是在第一正規化(1nf)的基礎上建立起來的,即滿足第二正規化(2nf)必須先滿足第一正規化(1nf)。第二正規化(2nf)要求資料庫表中的每個例項或行必須可以被唯一地區分。為實現區分通常需要為表加上乙個列,以儲存各個例項的唯一標識。例如員工資訊表中加上了員工編號(emp_id)列,因為每個員工的員工編號是唯一的,因此每個員工可以被唯一區分。這個唯一屬性列被稱為主關鍵字或主鍵、主碼。
第二正規化(2nf)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成乙個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上乙個列,以儲存各個例項的唯一標識。簡而言之,第二正規化就是屬性完全依賴於主鍵。
這裡說的主關鍵字可能不只有乙個,有些情況下是存在聯合主鍵的,就是主鍵有多個屬性。
舉例2:
以學生選課為例,每個學生都可以選課,並且有這一門課程的成績,那麼如果將這些資訊都放在一張表stugrade(stuno,stuname,age,***,courseno,coursename,credit,score)。
如果不仔細看,我們會以為這張表的主鍵是stuno,但是當我們看到最後乙個score屬性以後,在想想如果沒有課程資訊,那麼**有學生成績資訊呢。所以這張表的主鍵是乙個聯合主鍵(stuno,corseno),這個聯合屬性能夠唯一確定score屬性。那麼再看其他資訊,比如stuname只需要stuno就能夠唯一確定,coursename只需要courseno就能夠唯一確定,因此這樣就存在了部分依賴,不符合第二正規化。如果要讓學生課程成績資訊滿足第二正規化,那麼久需要將這張表拆分成多張表,一張學生表studnet(stuno,stuname,age,***),一張課程表course(courseno,coursename,credit),還有最後一張學生課程成績表stugrade(stuno,courseno,score)。
這樣就符合第二正規化了。
滿足第三正規化(3nf)必須先滿足第二正規化(2nf)。簡而言之,第三正規化(3nf)要求乙個資料庫表中不包含已在其它表中已包含的非主關鍵字資訊。
舉例3:
每乙個員工都有乙個所屬部門,假如有乙個員工資訊表employee(emp_id,emp_name,emp_age,dept_id,dept_name,dept_info)。
這張員工資訊表的主鍵是emp_id,因為這個屬性能夠唯一確定其他所有屬性,比如知道員工編號emp_id以後,肯定能夠知道員工姓名,所屬部門編號,部門名稱和部門介紹。所以這裡dept_id不是主屬性,而是非主屬性。但是,我們又可以發現dept_name,dept_info這兩個屬性也可以由dept_id這個非主屬性決定,即dept_name依賴dept_id,而dept_id依賴emp_id,這樣就存在了傳遞依賴。而且我們可以看出傳遞依賴的乙個明顯缺點就是資料冗餘非常嚴重。
那麼如何解決傳遞依賴問題,其實非常簡單,我們只需要將dept_name,dept_info這連個屬性刪除就可以了,即employee(emp_id,emp_name,emp_age,dept_id),然後再建立乙個部門表dept(dept_id,dept_name,dept_info)。
這樣如果要搜尋某乙個員工的部門資訊dept_info,可以通過資料庫連線來實現,查詢語句如下:
select e.emp_id,e.emp_name,d.dept_name from employee e,dept d where e.dept_id=d.dept_id注意點:資料庫連線會帶來一部分的效能損失
並不是資料庫正規化越高越高
有時會在資料冗餘與正規化之間做出權衡,在實際的資料庫開發過程中,往往會允許一部分的資料冗餘來減少資料庫連線。
資料庫三正規化詳解
所謂第一正規化 1nf 是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能同時有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性 如果出現重複的屬性,就可能需要定義乙個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關係。在第一正規化 1nf 中表的每一行只包含乙個例...
資料庫三正規化詳解
所謂第一正規化 1nf 是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能同時有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性 如果出現重複的屬性,就可能需要定義乙個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關係。在第一正規化 1nf 中表的每一行只包含乙個例...
資料庫三正規化詳解
2015 05 19 1 三正規化非正式描述 2 三正規化解釋 3 三正規化示例 返回返回 返回表1 不符合第一正規化的例子 關聯式資料庫中create不出這樣的表 欄位1欄位2 欄位2.1,欄位2.2 欄位3.存在的問題 因為設計不出這樣的表,所以沒有問題 表2 不符合第二正規化的例子 學號姓名 ...