通常情況下,可以從兩個方面來判斷資料庫是否設計的比較規範。一是看看是否擁有大量的窄表,二是寬表的數量是否足夠的少。若符合這兩個條件,則可以說明這個資料庫的規範化水平還是比較高的。當然這是兩個泛泛而談的指標。為了達到資料庫設計規範化的要求,一般來說,需要符合以下五個要求。
要求一:表中應該避免可為空的列。
雖然表中允許空列,但是,空字段是一種比較特殊的資料型別。資料庫在處理的時候,需要進行特殊的處理。如此的話,就會增加資料庫處理記錄的複雜性。當表中有比較多的空字段時,在同等條件下,資料庫處理的效能會降低許多。
所以,雖然在資料庫表設計的時候,允許表中具有空欄位,但是,我們應該盡量避免。若確實需要的話,我們可以通過一些折中的方式,來處理這些空欄位,讓其對資料庫效能的影響降低到最少。
一是通過設定預設值的形式,來避免空字段的產生。如在乙個人事管理系統中,有時候身份證號碼字段可能允許為空。因為不是每個人都可以記住自己的身份證號碼。而在員工報到的時候,可能身份證沒有帶在身邊。所以,身份證號碼字段往往不能及時提供。為此,身份證號碼字段可以允許為空,以滿足這些特殊情況的需要。但是,在資料庫設計的時候,則可以做一些處理。如當使用者沒有輸入內容的時候,則把這個欄位的預設值設定為0或者為n/a。以避免空字段的產生。
二是若一張表中,允許為空的列比較多,接近表全部列數的三分之一。而且,這些列在大部分情況下,都是可有可無的。若資料庫管理員遇到這種情況,筆者建議另外建立一張副表,以儲存這些列。然後通過關鍵字把主表跟這張副表關聯起來。將資料儲存在兩個獨立的表中使得主表的設計更為簡單,同時也能夠滿足儲存空值資訊的需要。
要求二:表不應該有重複的值或者列。
如現在有乙個進銷存管理系統,這個系統中有一張產品基本資訊表中。這個產品開發有時候可以是乙個人完成,而有時候又需要多個人合作才能夠完成。所以,在產品基本資訊表產品開發者這個欄位中,有時候可能需要填入多個開發者的名字。
如進銷存管理中,還需要對客戶的聯絡人進行管理。有時候,企業可能只知道客戶乙個採購員的姓名。但是在必要的情況下,企業需要對客戶的採購代表、倉庫人員、財務人員共同進行管理。因為在訂單上,可能需要填入採購代表的名字,可是在出貨單上,則需要填入倉庫管理人員的名字等等。
為了解決這個問題,有多種實現方式。但是,若設計不合理的話,則會導致重複的值或者列。如我們也可以這麼設計,把客戶資訊、聯絡人都放入同一張表中。為了解決多個聯絡人的問題,可以設定第一聯絡人、第一聯絡人**、第二聯絡人、第二聯絡人**等等。若還有第三聯絡人、第四聯絡人等等,則往往還需要加入更多的字段。
可是這麼設計的話,會產生一系列的問題。如客戶的採購員流動性比較大,在一年內換了六個採購員。此時,在系統中該如何管理呢?難道就建立六個聯絡人字段?這不但會導致空字段的增加,還需要頻繁的更改資料庫表結構。明顯,這麼做是不合理的。也有人說,可以直接修改採購員的名字呀。可是這麼處理的話,會把原先採購訂單上採購員的名字也改變了。因為採購單上客戶採購員資訊在資料庫中儲存的不是採購員的名字,而只是採購員對應的乙個編號。在編號不改而名字改變了的情況下,採購訂單上顯示的就是更改後的名字。這不利於時候的追蹤。
所以,在資料庫設計的時候要盡量避免這種重複的值或者列的產生。筆者建議,若資料庫管理員遇到這種情況,可以改變一下策略。如把客戶聯絡人另外設定一張表。然後通過客戶id把**商資訊表跟客戶聯絡人資訊表連線起來。也就是說,盡量將重複的值放置到一張獨立的表中進行管理。然後通過檢視或者其他手段把這些獨立的表聯絡起來。
要求三:表中記錄應該有乙個唯一的識別符號。
在資料庫表設計的時候,資料庫管理員應該養成乙個好習慣,用乙個id號來唯一的標識行記錄,而不要通過名字、編號等字段來對紀錄進行區分。每個表都應該有乙個id列,任何兩個記錄都不可以共享同乙個id值。另外,這個id值最好有資料庫來進行自動管理,而不要把這個任務給前台應用程式。否則的話,很容易產生id值不統一的情況。
另外,在資料庫設計的時候,最好還能夠加入行號。如在銷售訂單管理中,id號是使用者不能夠維護的。但是,行號使用者就可以維護。如在銷售訂單的行中,使用者可以通過調整行號的大小來對訂單行進行排序。通常情況下,id列是以1為單位遞進的。但是,行號就要以10為單位累進。如此,正常情況下,行號就以10、20、30依次擴充套件下去。若此時使用者需要把行號為30的紀錄調到第一行顯示。此時,使用者在不能夠更改id列的情況下,可以更改行號來實現。如可以把行號改為1,在排序時就可以按行號來進行排序。如此的話,原來行號為30的紀錄現在行號變為了1,就可以在第一行中顯示。這是在實際應用程式設計中對id列的乙個有效補充。這個內容在教科書上是沒有的。需要在實際應用程式設計中,才會掌握到這個技巧。
要求四:資料庫物件要有統一的字首名。
乙個比較複雜的應用系統,其對應的資料庫表往往以千計。若讓資料庫管理員看到物件名就了解這個資料庫物件所起的作用,恐怕會比較困難。而且在資料庫物件引用的時候,資料庫管理員也會為不能迅速找到所需要的資料庫物件而頭疼。
其次,表、檢視、函式等最好也有統一的字首。如檢視可以用v為字首,而函式則可以利用f為字首。如此資料庫管理員無論是在日常管理還是物件引用的時候,都能夠在最短的時間內找到自己所需要的物件。
要求五:盡量只儲存單一實體型別的資料。
這裡講的實體型別跟資料型別不是一回事,要注意區分。這裡講的實體型別是指所需要描述物件的本身。筆者舉乙個例子,估計大家就可以明白其中的內容了。如現在有乙個圖書館裡系統,有圖書基本資訊、作者資訊兩個實體物件。若使用者要把這兩個實體物件資訊放在同一張表中也是可以的。如可以把錶設計成圖書名字、圖書作者等等。可是如此設計的話,會給後續的維護帶來不少的麻煩。
如當後續有圖書出版時,則需要為每次出版的圖書增加作者資訊,這無疑會增加額外的儲存空間,也會增加記錄的長度。而且若作者的情況有所改變,如住址改變了以後,則還需要去更改每本書的記錄。同時,若這個作者的圖書從資料庫中全部刪除之後,這個作者的資訊也就蕩然無存了。很明顯,這不符合資料庫設計規範化的需求。
遇到這種情況時,筆者建議可以把上面這張表分解成三種獨立的表,分別為圖書基本資訊表、作者基本資訊表、圖書與作者對應表等等。如此設計以後,以上遇到的所有問題就都引刃而解了。
以上五條是在資料庫設計時達到規範化水平的基本要求。除了這些另外還有很多細節方面的要求,如資料型別、儲存過程等等。而且,資料庫規範往往沒有技術方面的嚴格限制,主要依靠資料庫管理員日常工作經驗的累積。
from:
資料庫設計規範化的 5 個要求
原文出處 hawkks 通常情況下,可以從兩個方面來判斷資料庫是否設計的比較規範。一是看看是否擁有大量的窄表,二是寬表的數量是否足夠的少。若符合這兩個條件,則可以說明這個資料庫的規範化水平還是比較高的。當然這是兩個泛泛而談的指標。為了達到資料庫設計規範化的要求,一般來說,需要符合以下五個要求。雖然表...
規範化 資料庫設計原則
關聯式資料庫設計的核心問題是關係模型的設計。本文將結合具體的例項,介紹資料庫設計規範化的流程。摘要 關係型資料庫是當前廣泛應用的資料庫型別,關聯式資料庫設計是對資料進行組織化和結構化的過程,核心問題是關係模型的設計。對於資料庫規模較小的情況,我們可以比較輕鬆的處理資料庫中的表結構。然而,隨著專案規模...
資料庫規範化
規範化 normalization 是資料庫系統設計中非常重要的乙個技術。資料庫規範化能夠讓資料庫設計者更好地了解組織內部當前的資料結構,最終得到一系列的資料實體。資料庫規範化通過對資料庫表的設計,可以有效降低資料庫冗餘程度。在進行資料庫規範化的時候,我們有一系列的步驟需要遵循。我們把這些步驟稱作正...