資料庫索引（Oracle和MySql）

索引概念

索引是關聯式資料庫中用於存放每一條記錄的一種物件，主要目的是加快資料的讀取速度和完整性檢查。建立索引是一項技術性要求高的工作。一般在資料庫設計階

段得與資料庫結構一起考慮。應用系統的效能直接與索引的合理直接有關。

一.oracle索引

1.索引型別

1）非唯一索引（最常用）uonunique。

2）唯一索引unique。

3）位圖索引bitmap

4）分割槽索引partitioned

5）非分割槽索引nonpartitioned

6）正常型b樹normal

7）基於函式的索引function-based

2.索引結構

1）b-tree：

適合與大量的增、刪、改（oltp）；

不能用包含or操作符的查詢；

適合高基數的列（唯一值多）

2）典型的樹狀結構；

每個結點都是資料塊；

大多都是物理上一層、兩層或三層不定，邏輯上三層；

葉子塊資料是排序的，從左向右遞增；

在分支塊和根塊中放的是索引的範圍；

3）bitmap:

適合與決策支援系統；

做update代價非常高；

非常適合or操作符的查詢；

基數比較少的時候才能建位圖索引；

4）樹型結構：

<1>索引頭

開始rowid，結束rowid（先列出索引的最大範圍）

<2>bitmap

每乙個bit對應著乙個rowid，它的值是1還是0，如果是1，表示著bit對應的rowid有值

5）b-tree索引

oracle資料庫中最常見的索引型別是b-tree索引，也就是b-樹索引，以其同名的計算科學結構命名。create index語句時，預設就是在建立b-tree索引。沒有特別規定可用於任何情況。

6）位圖索引(bitmap index)

位圖索引特定於該列只有幾個列舉值的情況，比如性別字段，標示字段比如只有0和1的情況。

7）基於函式的索引

比如經常對某個欄位做查詢的時候是帶函式操作的，那麼此時建乙個函式索引就有價值了。

8）分割槽索引和全域性索引

這2個是用於分割槽表的時候。前者是分區內索引，後者是全表索引

9）反向索引（reverse）

這個索引不常見，但是特定情況特別有效，比如乙個varchar(5)位欄位(員工編號)含值（10001,10002,10033,10005,10016..）

這種情況預設索引分布過於密集，不能利用好伺服器的並行

但是反向之後10001,20001,33001,50001,61001就有了乙個很好的分布，能高效的利用好並行運算。

10）hash索引

hash索引可能是訪問資料庫中資料的最快方法，但它也有自身的缺點。集群鍵上不同值的數目必須在建立hash集群之前就要知道。需要在建立hash集群的時候指定這個值。使用hash索引必須要使用hash集群。

3.索引原理

若沒有索引，搜尋某個記錄時（例如查詢name='wish'）需要搜尋所有的記錄，因為不能保證只有乙個wish，必須全部搜尋一遍

若在name上建立索引，oracle會對全表進行一次搜尋，將每條記錄的name值哪找公升序排列，然後構建索引條目（name和rowid），儲存到索引段中，查詢

name為wish時即可直接查詢對應地方

建立了索引並不一定就會使用，oracle自動統計表的資訊後，決定是否使用索引，表中資料很少時使用全表掃瞄速度已經很快，沒有必要使用索引

4.建立索引的原則

1）如果有兩個或者以上的索引，其中有乙個唯一性索引，而其他是非唯一，這種情況下oracle將使用唯一性索引而完全忽略非唯一性索引

2）至少要包含組合索引的第一列（即如果索引建立在多個列上，只有它的第乙個列被where子句引用時，優化器才會使用該索引）

3）小表不要簡歷索引

4）對於基數大的列適合建立b樹索引，對於基數小的列適合簡歷位圖索引

5）列中有很多空值，但經常查詢該列上非空記錄時應該建立索引

6）經常進行連線查詢的列應該建立索引

7）使用create index時要將最常查詢的列放在最前面

8）long（可變長字串資料，最長2g）和long raw（可變長二進位制資料，最長2g）列不能建立索引

9）限制表中索引的數量（建立索引耗費時間，並且隨資料量的增大而增大；索引會占用物理空間；當對表中的資料進行增加、刪除和修改的時候，索引也要動態

的維護，降低了資料的維護速度）

5.索引使用原則

1）經常檢索排序大表中40%或非排序表7%的行，建議建索引；

2）為了改善多表關聯，索引列用於聯結；

3）列中的值相對比較唯一；

4）取值範圍（大：b*樹索引，小：位圖索引）；

5）date型列一般適合基於函式的索引；

6）列中有許多空值，不適合建立索引

二.mysql索引

1.索引型別

1）單列索引(普通索引，唯一索引，主鍵索引)、組合索引、全文索引、空間索引

2）單列索引：乙個索引只包含單個列，但乙個表中可以有多個單列索引。

3）普通索引：mysql中基本索引型別，沒有什麼限制，允許在定義索引的列中插入重複值和空值，純粹為了查詢資料更快一點。

4）唯一索引：索引列中的值必須是唯一的，但是允許為空值。

5）主鍵索引：是一種特殊的唯一索引，不允許有空值。

6）組合索引：在表中的多個字段組合上建立的索引，只有在查詢條件中使用了這些欄位的左邊欄位時，索引才會被使用，使用組合索引時遵循最左字首集合。這個如果還不明白，等後面舉例講解時在細說　

8）空間索引：空間索引是對空間資料型別的字段建立的索引，mysql中的空間資料型別有四種，geometry、point、linestring、polygon。在建立空間索引時，使用spatial關鍵字。要求，引擎為myisam，建立空間索引的列，必須將其宣告為not null。

2.索引原理

在mysql中，儲存引擎用類似的方法使用索引，其先在索引中查詢對應的值，然後根據匹配的索引記錄找到對應的資料行，最後將資料結果集返回給客戶端。

3.索引使用原則

最左字首匹配原則

mysql會一直向右匹配直到遇到範圍查詢（>、<、between、like）就停止匹配。比如a = 1 and b = 2 and c > 3 and d = 4，如果建立（a,b,c,d）順序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引則都可以用到，a,b,d的順序可以任意調整。

=和in可以亂序

比如a = 1 and b = 2 and c = 3 建立（a,b,c）索引可以任意順序，mysql的查詢優化器會幫你優化成索引可以識別的形式。

盡量選擇區分度高的列作為索引

區分度的公式是count(distinct col)/count(*)，表示欄位不重複的比例，比例越大我們掃瞄的記錄數越少，唯一鍵的區分度是1，而一些狀態、性別字段可能在大資料面前區分度就是0，那可能有人會問，這個比例有什麼經驗值嗎？使用場景不同，這個值也很難確定，一般需要join的字段我們都要求是0.1以上，即平均1條掃瞄10條記錄。

索引列不能參與計算，保持列「乾淨」

比如from_unixtime(create_time) = 』2014-05-29』就不能使用到索引，原因很簡單，b+樹中存的都是資料表中的字段值，但進行檢索時，需要把所有元素都應用函式才能比較，顯然成本太大。所以語句應該寫成create_time = unix_timestamp(』2014-05-29』);

盡量的擴充套件索引，不要新建索引

比如表中已經有a的索引，現在要加(a,b)的索引，那麼只需要修改原來的索引即可。

4.高效能索引列

獨立的列

字首索引和索引的選擇性

多列索引

選擇合適的索引列順序

聚簇索引

覆蓋索引

使用索引掃瞄來做排序

冗餘和重複索引

未使用的索引

資料庫索引（Oracle和MySql）

Oracle資料庫索引

Oracle資料庫索引

Oracle資料庫索引

資料庫索引（Oracle和MySql）

Oracle資料庫索引

Oracle資料庫 索引

Oracle資料庫 索引

相關推薦

Oracle資料庫索引

Oracle資料庫索引