如果你正在負責乙個基於sql server的專案,或者你剛剛接觸sql server,你都有可能要面臨一些資料庫效能的問題,這篇文章會為你提供一些有用的指導(其中大多數也可以用於其它的dbms)。
在這裡,我不打算介紹使用sql server的竅門,也不能提供乙個包治百病的方案,我所做的是總結一些經驗----關於如何形成乙個好的設計。這些經驗來自我過去幾年中經受的教訓,一直來,我看到許多同樣的設計錯誤被一次又一次的重複。
一、了解你用的工具
不要輕視這一點,這是我在這篇文章中講述的最關鍵的一條。也許你也看到有很多的sql server程式設計師沒有掌握全部的t-sql命令和sql server提供的那些有用的工具。 「什麼?我要浪費乙個月的時間來學習那些我永遠也不會用到的sql命令???」,你也許會這樣說。對的,你不需要這樣做。但是你應該用乙個週末瀏覽所有的t-sql命令。在這裡,你的任務是了解,將來,當你設計乙個查詢時,你會記起來:「對了,這裡有乙個命令可以完全實現我需要的功能」,於是,到 msdn檢視這個命令的確切語法。
二、不要使用游標
讓我再重複一遍:不要使用游標。如果你想破壞整個系統的效能的話,它們倒是你最有效的首選辦法。大多數的初學者都使用游標,而沒有意識到它們對效能造成的影響。它們占用記憶體,還用它們那些不可思議的方式鎖定表,另外,它們簡直就像蝸牛。而最糟糕的是,它們可以使你的dba所能做的一切效能優化等於沒做。不知你是否知道每執行一次fetch就等於執行一次select命令?這意味著如果你的游標有10000條記錄,它將執行10000次select!如果你使用一組 select、update或者delete來完成相應的工作,那將有效率的多。
初學者一般認為使用游標是一種比較熟悉和舒適的程式設計方式,可很不幸,這會導致糟糕的效能。顯然,sql的總體目的是你要實現什麼,而不是怎樣實現。
我曾經用t-sql重寫了乙個基於游標的儲存過程,那個表只有100,000條記錄,原來的儲存過程用了40分鐘才執行完畢,而新的儲存過程只用了10秒鐘。在這裡,我想你應該可以看到乙個不稱職的程式設計師究竟在幹了什麼!!!
我們可以寫乙個小程式來取得和處理資料並且更新資料庫,這樣做有時會更有效。記住:對於迴圈,t-sql無能為力。
我再重新提醒一下:使用游標沒有好處。除了dba的工作外,我從來沒有看到過使用游標可以有效的完成任何工作。
三、規範化你的資料表
為什麼不規範化資料庫?大概有兩個藉口:出於效能的考慮和純粹因為懶惰。至於第二點,你遲早得為此付出代價。而關於效能的問題,你不需要優化根本就不慢的東西。我經常看到一些程式設計師「反規範化」資料庫,他們的理由是「原來的設計太慢了」,可結果卻常常是他們讓系統更慢了。dbms被設計用來處理規範資料庫的,因此,記住:按照規範化的要求設計資料庫。
四、不要使用select *
這點不太容易做到,我太了解了,因為我自己就經常這樣幹。可是,如果在select中指定你所需要的列,那將會帶來以下的好處:
1 減少記憶體耗費和網路的頻寬
2 你可以得到更安全的設計
3 給查詢優化器機會從索引讀取所有需要的列
五、了解你將要對資料進行的操作
為你的資料庫建立乙個健壯的索引,那可是功德一件。可要做到這一點簡直就是一門藝術。每當你為乙個表新增乙個索引,select會更快了,可 insert和delete卻大大的變慢了,因為建立了維護索引需要許多額外的工作。顯然,這裡問題的關鍵是:你要對這張表進行什麼樣的操作。這個問題不太好把握,特別是涉及delete和update時,因為這些語句經常在where部分包含select命令。
六、不要給「性別」列建立索引
首先,我們必須了解索引是如何加速對錶的訪問的。你可以將索引理解為基於一定的標準上對錶進行劃分的一種方式。如果你給類似於「性別」這樣的列建立了乙個索引,你僅僅是將表劃分為兩部分:男和女。你在處理乙個有1,000,000條記錄的表,這樣的劃分有什麼意義?記住:維護索引是比較費時的。當你設計索引時,請遵循這樣的規則:根據列可能包含不同內容的數目從多到少排列,比如:姓名+省份+性別。
七、使用事務
請使用事務,特別是當查詢比較耗時。如果系統出現問題,這樣做會救你一命的。一般有些經驗的程式設計師都有體會-----你經常會碰到一些不可預料的情況會導致儲存過程崩潰。
八、小心死鎖
按照一定的次序來訪問你的表。如果你先鎖住表a,再鎖住表b,那麼在所有的儲存過程中都要按照這個順序來鎖定它們。如果你(不經意的)某個儲存過程中先鎖定表b,再鎖定表a,這可能就會導致乙個死鎖。如果鎖定順序沒有被預先詳細的設計好,死鎖是不太容易被發現的。
九、不要開啟大的資料集
乙個經常被提出的問題是:我怎樣才能迅速的將100000條記錄新增到combobox中?這是不對的,你不能也不需要這樣做。很簡單,你的使用者要瀏覽 100000條記錄才能找到需要的記錄,他一定會詛咒你的。在這裡,你需要的是乙個更好的ui,你需要為你的使用者顯示不超過100或200條記錄。
十、不要使用伺服器端游標
與伺服器端游標比起來,客戶端游標可以減少伺服器和網路的系統開銷,並且還減少鎖定時間。
十一、使用引數查詢
有時,我在csdn技術論壇看到類似這樣的問題:「select * from a where a.id=ab,因為單引號查詢發生異常,我該怎麼辦?」,而普遍的回答是:用兩個單引號代替單引號。這是錯誤的。這樣治標不治本,因為你還會在其他一些字元上遇到這樣的問題,更何況這樣會導致嚴重的bug,除此以外,這樣做還會使sql server的緩衝系統無法發揮應有的作用。使用引數查詢,釜底抽薪,這些問題統統不存在了。
十二、在程式編碼時使用大資料量的資料庫
程式設計師在開發中使用的測試資料庫一般資料量都不大,可經常的是終端使用者的資料量都很大。我們通常的做法是不對的,原因很簡單:現在硬碟不是很貴,可為什麼效能問題卻要等到已經無可挽回的時候才被注意呢?
十三、不要使用insert匯入大批的資料
請不要這樣做,除非那是必須的。使用uts或者bcp,這樣你可以一舉而兼得靈活性和速度。
十四、注意超時問題
查詢資料庫時,一般資料庫的預設都比較小,比如15秒或者30秒。而有些查詢執行時間要比這長,特別是當資料庫的資料量不斷變大時。
十五、不要忽略同時修改同一記錄的問題
有時候,兩個使用者會同時修改同一記錄,這樣,後乙個修改者修改了前乙個修改者的操作,某些更新就會丟失。處理這種情況不是很難:建立乙個timestamp欄位,在寫入前檢查它,如果允許,就合併修改,如果存在衝突,提示使用者。
十六、在細節表中插入紀錄時,不要在主表執行select max(id)
這是乙個普遍的錯誤,當兩個使用者在同一時間插入資料時,這會導致錯誤。你可以使用scope_identity,ident_current和 @@identity。如果可能,不要使用@@identity,因為在有觸發器的情況下,它會引起一些問題。
十七、避免將列設為nullable
如果可能的話,你應該避免將列設為nullable。系統會為nullable列的每一行分配乙個額外的位元組,查詢時會帶來更多的系統開銷。另外,將列設為nullable使編碼變得複雜,因為每一次訪問這些列時都必須先進行檢查。
我並不是說nulls是麻煩的根源,儘管有些人這樣認為。我認為如果你的業務規則中允許「空資料」,那麼,將列設為nullable有時會發揮很好的作用,但是,如果在類似下面的情況中使用nullable,那簡直就是自討苦吃。
十八、盡量不要使用text資料型別
除非你使用text處理乙個很大的資料,否則不要使用它。因為它不易於查詢,速度慢,用的不好還會浪費大量的空間。一般的,varchar可以更好的處理你的資料。
十九、盡量不要使用臨時表
盡量不要使用臨時表,除非你必須這樣做。一般使用子查詢可以代替臨時表。使用臨時表會帶來系統開銷,如果你是用com+進行程式設計,它還會給你帶來很大的麻煩,因為com+使用資料庫連線池而臨時表卻自始至終都存在。sql server提供了一些替代方案,比如table資料型別。
二十、學會分析查詢
sql server查詢分析器是你的好夥伴,通過它你可以了解查詢和索引是如何影響效能的。
二十一、使用參照完整性
定義主健、唯一性約束和外來鍵,這樣做可以節約大量的時間。
資料庫 資料庫的物理設計
資料庫在物理裝置上的儲存結構與訪問方法稱為資料庫的物理結構,它依賴於給定的計算機系統。為乙個給定的邏輯資料模型選取乙個最合適應用要求的物理結構的過程,稱為資料庫的物理設計。物理設計的目的是有效地實現邏輯模式,確定所採取的儲存策略。此階段是以邏輯設計的結構作為輸入,並結合具體dbms的特點與儲存裝置特...
資料庫的設計
什麼是資料庫設計?資料庫設計就是規劃和結構化資料庫中的資料物件以及這些資料物件之間關係的工程。在需求分析階段 收集資訊 標識物件 實體 標識每個物件需要儲存的詳細資訊 屬性 標識物件 實體 之間的關係。在概要設計階段 繪製e r 實體 關係 圖 在詳細設計階段 規範化e r圖 把e r圖轉換為多張表...
資料庫的設計
資料庫的設計 1.學習e r圖的繪製 實體entity用矩形,關係relationship用菱形表示,屬性attribute用橢圓表示 理解資料庫正規化,掌握如何規範的設計資料庫。確定業務需求 標識關鍵實體 標識每個實體的屬性 確定實體之間的關係 和物件導向的程式設計一樣,在建立資料庫之前也是設計過...