一、聚簇索引(clustered indexes)的使用
聚簇索引是一種對磁碟上實際資料重新組織以按指定的乙個或多個列的值排序。由於聚簇索引的索引頁面指標指向資料頁面,所以使用聚簇索引查詢資料幾乎總是比使用非聚簇索引快。每張表只能建乙個聚簇索引,並且建聚簇索引需要至少相當該錶120%的附加空間,以存放該錶的副本和索引中間頁。建立聚簇索引的思想是:
1、大多數表都應該有聚簇索引或使用分割槽來降低對錶尾頁的競爭,在乙個高事務的環境中,對最後一頁的封鎖嚴重影響系統的吞吐量。
2、在聚簇索引下,資料在物理上按順序排在資料頁上,重複值也排在一起,因而在那些包含範圍檢查(between、<、<=、>、>=)或使用group by或order by的查詢時,一旦找到具有範圍中第乙個鍵值的行,具有後續索引值的行保證物理上毗連在一起而不必進一步搜尋,避免了大範圍掃瞄,可以大大提高查詢速度。
3、在乙個頻繁發生插入操作的表上建立聚簇索引時,不要建在具有單調上公升值的列(如identity)上,否則會經常引起封鎖衝突。
4、在聚簇索引中不要包含經常修改的列,因為碼值修改後,資料行必須移動到新的位置。
5、選擇聚簇索引應基於where子句和連線操作的型別。
聚簇索引的侯選列是:
1、主鍵列,該列在where子句中使用並且插入是隨機的。
2、按範圍訪問的列,如pri_order > 100 and pri_order < 200。
3、在group by或order by中使用的列。
4、不經常修改的列。
5、在連線操作中使用的列。
二、非聚簇索引(nonclustered indexes)的使用
sqlserver預設情況下建立的索引是非聚簇索引,由於非聚簇索引不重新組織表中的資料,而是對每一行儲存索引列值並用乙個指標指向資料所在的頁面。換句話說非聚簇索引具有在索引結構和資料本身之間的乙個額外級。乙個表如果沒有聚簇索引時,可有250個非聚簇索引。每個非聚簇索引提供訪問資料的不同排序順序。在建立非聚簇索引時,要權衡索引對查詢速度的加快與降低修改速度之間的利弊。另外,還要考慮這些問題:
1、索引需要使用多少空間。
2、合適的列是否穩定。
3、索引鍵是如何選擇的,掃瞄效果是否更佳。
4、是否有許多重複值。
對更新頻繁的表來說,表上的非聚簇索引比聚簇索引和根本沒有索引需要更多的額外開銷。對移到新頁的每一行而言,指向該資料的每個非聚簇索引的頁級行也必須更新,有時可能還需要索引頁的分理。從乙個頁面刪除資料的程序也會有類似的開銷,另外,刪除程序還必須把資料移到頁面上部,以保證資料的連續性。所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情況:
1、某列常用於集合函式(如sum,....)。
2、某列常用於join,order by,group by。
3、查尋出的資料不超過表中資料量的20%。
三、覆蓋索引(covering indexes)的使用
覆蓋索引是指那些索引項中包含查尋所需要的全部資訊的非聚簇索引,這種索引之所以比較快也正是因為索引頁中包含了查尋所必須的資料,不需去訪問資料頁。如果非聚簇索引中包含結果資料,那麼它的查詢速度將快於聚簇索引。
但是由於覆蓋索引的索引項比較多,要占用比較大的空間。而且update操作會引起索引值改變。所以如果潛在的覆蓋查詢並不常用或不太關鍵,則覆蓋索引的增加反而會降低效能。
四、索引的選擇技術
一般來說建立索引的思路是:
(1)、主鍵時常作為where子句的條件,應在表的主鍵列上建立聚簇索引,尤其當經常用它作為連線的時候。
(2)、有大量重複值且經常有範圍查詢和排序、分組發生的列,或者非常頻繁地被訪問的列,可考慮建立聚簇索引。
(3)、經常同時訪問多列,且每列都含有重複值可考慮建立復合索引來覆蓋乙個或一組查詢,並把查詢引用最頻繁的列作為前導列,如果可能盡量使關鍵查詢形成覆蓋查詢。
(4)、如果知道索引鍵的所有值都是唯一的,那麼確保把索引定義成唯一索引。
(5)、在乙個經常做插入操作的表上建索引時,使用fillfactor(填充因子)來減少頁**,同時提高併發度降低死鎖的發生。如果在唯讀表上建索引,則可以把fillfactor置為100。
(6)、在選擇索引鍵時,設法選擇那些採用小資料型別的列作為鍵以使每個索引頁能夠容納盡可能多的索引鍵和指標,通過這種方式,可使乙個查詢必須遍歷的索引頁面降到最小。此外,盡可能地使用整數為鍵值,因為它能夠提供比任何資料型別都快的訪問速度。
五、索引的維護
上面講到,某些不合適的索引影響到sqlserver的效能,隨著應用系統的執行,資料不斷地發生變化,當資料變化達到某乙個程度時將會影響到索引的使用。這時需要使用者自己來維護索引。索引的維護包括:
1、重建索引
隨著資料行的插入、刪除和資料頁的**,有些索引頁可能只包含幾頁資料,另外應用在執行大塊i/o的時候,重建非聚簇索引可以降低分片,維護大塊i/o的效率。重建索引實際上是重新組織b-樹空間。在下面情況下需要重建索引:
(1)、資料和使用模式大幅度變化。
(2)、排序的順序發生改變。
(3)、要進行大量插入操作或已經完成。
(4)、使用大塊i/o的查詢的磁碟讀次數比預料的要多。
(5)、由於大量資料修改,使得資料頁和索引頁沒有充分使用而導致空間的使用超出估算。
(6)、dbcc檢查出索引有問題。
當重建聚簇索引時,這張表的所有非聚簇索引將被重建。
2、索引統計資訊的更新
當在乙個包含資料的表上建立索引的時候,sqlserver會建立分布資料頁來存放有關索引的兩種統計資訊:分布表和密度表。優化器利用這個頁來判斷該索引對某個特定查詢是否有用。但這個統計資訊並不動態地重新計算。這意味著,當表的資料改變之後,統計資訊有可能是過時的,從而影響優化器追求最有工作的目標。因此,在下面情況下應該執行update statistics命令:
(1)、資料行的插入和刪除修改了資料的分布。
(2)、對用truncate table刪除資料的表上增加資料行。
(3)、修改索引列的值。
六、結束語
1、在查詢中很少或從不引用的列不會受益於索引,因為索引很少或從來不必搜尋基於這些列的行。
2、只有兩個或三個值的列,如男性和女性(是或否),從不會從索引中得到好處。
另外,鑑於索引加快了查詢速度,但減慢了資料更新速度的特點。可通過在乙個段上建表,而在另乙個段上建其非聚簇索引,而這兩段分別在單獨的物理裝置上來改善操作效能。
聚簇索引和非聚簇索引
一 聚簇索引 clustered indexes 的使用 聚簇索引是一種對磁碟上實際資料重新組織以按指定的乙個或多個列的值排序。由於聚簇索引的索引頁面指標指向資料頁面,所以使用聚簇索引查詢資料幾 乎總是比使用非聚簇索引快。每張表只能建乙個聚簇索引,並且建聚簇索引需要至少相當該錶120 的附加空間,以...
聚簇索引和非聚簇索引
一 聚簇索引 clustered indexes 的使用 聚簇索引是一種對磁碟上實際資料重新組織以按指定的乙個或多個列的值排序。由於聚簇索引的索引頁面指標指向資料頁面,所以使用聚簇索引查詢資料幾 乎總是比使用非聚簇索引快。每張表只能建乙個聚簇索引,並且建聚簇索引需要至少相當該錶120 的附加空間,以...
聚簇索引和非聚簇索引
聚簇索引並不是一種單獨的索引型別,而是一種資料儲存方式。當表有聚簇索引時,它的資料行實際上存放在索引的葉子節點中。通常預設都是主鍵,設定了主鍵,系統預設就為你加上了聚簇索引,當然有人說我不想拿主鍵作為聚簇索引,我需要用其他字段作為索引,當然這也是可以的,這就需要你在設定主鍵之前自己手動的先新增上唯一...