關於資料庫表索引的作用以及意義

什麼是索引？

索引用來快速地尋找那些具有特定值的記錄，所有mysql索引都以b-樹的形式儲存。如果沒有索引，執行查詢時mysql必須從第乙個記錄開始掃瞄整個表的所有記錄，直至找到符合要求的記錄。表裡面的記錄數量越多，這個操作的代價就越高。如果作為搜尋條件的列上已經建立了索引，mysql無需掃瞄任何記錄即可迅速得到目標記錄所在的位置。如果表有1000個記錄，通過索引查詢記錄至少要比順序掃瞄記錄快100倍。

索引是對資料庫表中乙個或多個列（例如，employee表的姓氏(lname)列）的值進行排序的結構。如果想按特定職員的姓來查詢他或她，則與在表中搜尋所有的行相比，索引有助於更快地獲取資訊。

索引提供指標以指向儲存在表中指定列的資料值，然後根據指定的排序次序排列這些指標。資料庫使用索引的方式與使用書的目錄很相似：通過搜尋索引找到特定的值，然後跟隨指標到達包含該值的行。

在資料庫關係圖中，可以為選定的表建立、編輯或刪除索引/鍵屬性頁中的每個索引型別。當儲存附加在此索引上的表或包含此表的資料庫關係圖時，索引同時被儲存。有關詳細資訊，請參見建立索引。

通常情況下，只有當經常查詢索引列中的資料時，才需要在表上建立索引。索引將占用磁碟空間，並且降低新增、刪除和更新行的速度。不過在多數情況下，索引所帶來的資料檢索速度的優勢大大超過它的不足之處。然而，如果應用程式非常頻繁地更新資料，或磁碟空間有限，那麼最好限制索引的數量。

索引型別

根據資料庫的功能，可在資料庫設計器中建立三種型別的索引——唯一索引、主鍵索引和聚集索引。

唯一索引：唯一索引不允許兩行具有相同的索引值。

主鍵索引：資料庫表通常有一列或列組合，其值用來唯一標識表中的每一行。該列稱為表的主鍵。

在資料庫關係圖中為表定義乙個主鍵將自動建立主鍵索引，主鍵索引是唯一索引的特殊型別。主鍵索引要求主鍵中的每個值是唯一的。

聚集索引：聚集索引中，表中各行的物理順序與鍵值的邏輯（索引）順序相同。表只能包含乙個聚集索引。

如果不是聚集索引，表中各行的物理順序與鍵值的邏輯順序不匹配。聚集索引比非聚集索引有更快的資料訪問速度

在microsoft?sqlserver?資料庫中可以建立聚集索引。在聚集索引中，表中各行的物理順序與索引鍵值的邏輯（索引）順序相同。表只能包含乙個聚集索引。聚集索引通常可加快update和delete操作的速度，因為這兩個操作需要讀取大量的資料。建立或修改聚集索引可能要花很長時間，因為執行這兩個操作時要在磁碟上對錶的行進行重組。

可考慮將聚集索引用於：

1：包含數量有限的唯一值的列，如state列只包含50個唯一的州**。

2：使用下列運算子返回乙個範圍值的查詢：between、>、>=、《和<=。

3：返回大結果集的查詢。（摘自microsoft?sqlserver?幫助）

聚集索引對於那些經常要搜尋範圍值的列特別有效。使用聚集索引找到包含第乙個值的行後，便可以確保包含後續索引值的行在物理相鄰。例如，如果應用程序執行的乙個查詢經常檢索某一日期範圍內的記錄，則使用聚集索引可以迅速找到包含開始日期的行，然後檢索表中所有相鄰的行，直到到達結束日期。這樣有助於提高此類查詢的效能。同樣，如果對從表中檢索的資料進行排序時經常要用到某一列，則可以將該錶在該列上聚集（物理排序），避免每次查詢該列時都進行排序，從而節省成本。

當索引值唯一時，使用聚集索引查詢特定的行也很有效率。例如，使用唯一雇員id列emp_id查詢特定雇員的最快速的方法，是在emp_id列上建立聚集索引或primarykey約束。

在建立聚集索引之前，應先了解您的資料是如何被訪問的。可考慮將聚集索引用於：

1包含大量非重複值的列。

2使用下列運算子返回乙個範圍值的查詢：between、>、>=、《和<=。

3被連續訪問的列。

4返回大型結果集的查詢。

5經常被使用聯接或groupby子句的查詢訪問的列；一般來說，這些是外來鍵列。對orderby或groupby子句中指定的列進行索引，可以使sqlserver不必對資料進行排序，因為這些行已經排序。這樣可以提高查詢效能。

6oltp型別的應用程式，這些程式要求進行非常快速的單行查詢（一般通過主鍵）。應在主鍵上建立聚集索引。

聚集索引不適用於：

1頻繁更改的列這將導致整行移動（因為sqlserver必須按物理順序保留行中的資料值）。這一點要特別注意，因為在大資料量事務處理系統中資料是易失的。

2寬鍵來自聚集索引的鍵值由所有非聚集索引作為查詢鍵使用，因此儲存在每個非聚集索引的葉條目內。

說明：如果該錶上尚未建立聚集索引，且在建立primarykey約束時未指定非聚集索引，primarykey約束會自動建立聚集索引。

注意事項：定義聚集索引鍵時使用的列越少越好，這一點很重要。如果定義了乙個大型的聚集索引鍵，則同乙個表上定義的任何非聚集索引都將增大許多，因為非聚集索引條目包含聚集鍵。當把sql指令碼儲存到可用空間不足的磁碟上時，索引優化嚮導不返回錯誤。

索引的缺點

到目前為止，我們討論的都是索引的優點。事實上，索引也是有缺點的。

第二，對於需要寫入資料的操作，比如delete、update以及insert操作，索引會降低它們的速度。這是因為mysql不僅要把改動資料寫入資料檔案，而且它還要把這些改動寫入索引檔案。

什麼是資料庫索引，索引有什麼作用

資料庫索引是為了增加查詢速度而對表字段附加的一種標識。見過很多人機械的理解索引的概念，認為增加索引只有好處沒有壞處。這裡想把之前的索引學習筆記總結一下：

首先明白為什麼索引會增加速度，db在執行一條sql語句的時候，預設的方式是根據搜尋條件進行全表掃瞄，遇到匹配條件的就加入搜尋結果集合。如果我們對某一欄位增加索引，查詢時就會先去索引列表中一次定位到特定值的行數，大大減少遍歷匹配的行數，所以能明顯增加查詢的速度。那麼在任何時候都應該加索引麼？這裡有幾個反例：1、如果每次都需要取到所有表記錄，無論如何都必須進行全表掃瞄了，那麼是否加索引也沒有意義了。2、對非唯一的字段，例如「性別」這種大量重複值的字段，增加索引也沒有什麼意義。3、對於記錄比較少的表，增加索引不會帶來速度的優化反而浪費了儲存空間，因為索引是需要儲存空間的，而且有個致命缺點是對於update/insert/delete的每次執行，欄位的索引都必須重新計算更新。

那麼在什麼時候適合加上索引呢？我們看乙個mysql手冊中舉的例子，這裡有一條sql語句：

select c.companyid, c.companyname from companies c, user u where c.companyid = u.fk_companyid and c.numemployees >= 0 and c.companyname like '%i%' and u.groupid in (select g.groupid from groups g where g.grouplabel = 'executive')

這條語句涉及3個表的聯接，並且包括了許多搜尋條件比如大小比較，like匹配等。在沒有索引的情況下mysql需要執行的掃瞄行數是77721876行。而我們通過在companyid和grouplabel兩個欄位上加上索引之後，掃瞄的行數隻需要134行。在mysql中可以通過explain select來檢視掃瞄次數。可以看出來在這種聯表和複雜搜尋條件的情況下，索引帶來的效能提公升遠比它所佔據的磁碟空間要重要得多。

那麼索引是如何實現的呢？大多數db廠商實現索引都是基於一種資料結構——b樹。因為b樹的特點就是適合在磁碟等直接儲存裝置上組織動態查詢表。b樹的定義是這樣的：一棵m(m>=3)階的b樹是滿足下列條件的m叉樹：

1、每個結點包括如下作用域(j, p0, k1, p1, k2, p2, ... ki, pi) 其中j是關鍵字個數，p是孩子指標

2、所有葉子結點在同一層上，層數等於樹高h

3、每個非根結點包含的關鍵字個數滿足[m/2-1]<=j<=m-1

4、若樹非空，則根至少有1個關鍵字，若根非葉子，則至少有2棵子樹，至多有m棵子樹

看乙個b樹的例子，針對26個英文本母的b樹可以這樣構造：

關於資料庫表索引的作用以及意義

資料庫索引的作用以及優缺點分析

關於索引的作用以及建立方法

建立資料庫表以及索引

關於資料庫表索引的作用以及意義

資料庫索引的作用以及優缺點分析

關於索引的作用以及建立方法

建立資料庫 表以及索引

相關推薦

建立資料庫表以及索引