索引概念
索引是關聯式資料庫中用於存放每一條記錄的一種物件,主要目的是加快資料的讀取速度和完整性檢查。建立索引是一項技術性要求高的工作。一般在資料庫設計階
段得與資料庫結構一起考慮。應用系統的效能直接與索引的合理直接有關。
一.oracle索引
1.索引型別
1)非唯一索引(最常用)uonunique。
2)唯一索引unique。
3)位圖索引bitmap
4)分割槽索引partitioned
5)非分割槽索引nonpartitioned
6)正常型b樹normal
7)基於函式的索引function-based
2.索引結構
1)b-tree:
適合與大量的增、刪、改(oltp);
不能用包含or操作符的查詢;
適合高基數的列(唯一值多)
2)典型的樹狀結構;
每個結點都是資料塊;
大多都是物理上一層、兩層或三層不定,邏輯上三層;
葉子塊資料是排序的,從左向右遞增;
在分支塊和根塊中放的是索引的範圍;
3)bitmap:
適合與決策支援系統;
做update代價非常高;
非常適合or操作符的查詢;
基數比較少的時候才能建位圖索引;
4)樹型結構:
<1>索引頭
開始rowid,結束rowid(先列出索引的最大範圍)
<2>bitmap
每乙個bit對應著乙個rowid,它的值是1還是0,如果是1,表示著bit對應的rowid有值
5)b-tree索引
oracle資料庫中最常見的索引型別是b-tree索引,也就是b-樹索引,以其同名的計算科學結構命名。create index語句時,預設就是在建立b-tree索引。沒有特別規定可用於任何情況。
6)位圖索引(bitmap index)
位圖索引特定於該列只有幾個列舉值的情況,比如性別字段,標示字段比如只有0和1的情況。
7)基於函式的索引
比如經常對某個欄位做查詢的時候是帶函式操作的,那麼此時建乙個函式索引就有價值了。
8)分割槽索引和全域性索引
這2個是用於分割槽表的時候。前者是分區內索引,後者是全表索引
9)反向索引(reverse)
這個索引不常見,但是特定情況特別有效,比如乙個varchar(5)位欄位(員工編號)含值(10001,10002,10033,10005,10016..)
這種情況預設索引分布過於密集,不能利用好伺服器的並行
但是反向之後10001,20001,33001,50001,61001就有了乙個很好的分布,能高效的利用好並行運算。
10)hash索引
hash索引可能是訪問資料庫中資料的最快方法,但它也有自身的缺點。集群鍵上不同值的數目必須在建立hash集群之前就要知道。需要在建立hash集群的時候指定這個值。使用hash索引必須要使用hash集群。
3.索引原理
若沒有索引,搜尋某個記錄時(例如查詢name='wish')需要搜尋所有的記錄,因為不能保證只有乙個wish,必須全部搜尋一遍
若在name上建立索引,oracle會對全表進行一次搜尋,將每條記錄的name值哪找公升序排列,然後構建索引條目(name和rowid),儲存到索引段中,查詢
name為wish時即可直接查詢對應地方
建立了索引並不一定就會使用,oracle自動統計表的資訊後,決定是否使用索引,表中資料很少時使用全表掃瞄速度已經很快,沒有必要使用索引
4.建立索引的原則
1)如果有兩個或者以上的索引,其中有乙個唯一性索引,而其他是非唯一,這種情況下oracle將使用唯一性索引而完全忽略非唯一性索引
2)至少要包含組合索引的第一列(即如果索引建立在多個列上,只有它的第乙個列被where子句引用時,優化器才會使用該索引)
3)小表不要簡歷索引
4)對於基數大的列適合建立b樹索引,對於基數小的列適合簡歷位圖索引
5)列中有很多空值,但經常查詢該列上非空記錄時應該建立索引
6)經常進行連線查詢的列應該建立索引
7)使用create index時要將最常查詢的列放在最前面
8)long(可變長字串資料,最長2g)和long raw(可變長二進位制資料,最長2g)列不能建立索引
9)限制表中索引的數量(建立索引耗費時間,並且隨資料量的增大而增大;索引會占用物理空間;當對表中的資料進行增加、刪除和修改的時候,索引也要動態
的維護,降低了資料的維護速度)
5.索引使用原則
1)經常檢索排序大表中40%或非排序表7%的行,建議建索引;
2)為了改善多表關聯,索引列用於聯結;
3)列中的值相對比較唯一;
4)取值範圍(大:b*樹索引,小:位圖索引);
5)date型列一般適合基於函式的索引;
6)列中有許多空值,不適合建立索引
二.mysql索引
1.索引型別
1)單列索引(普通索引,唯一索引,主鍵索引)、組合索引、全文索引、空間索引
2)單列索引:乙個索引只包含單個列,但乙個表中可以有多個單列索引。
3)普通索引:mysql中基本索引型別,沒有什麼限制,允許在定義索引的列中插入重複值和空值,純粹為了查詢資料更快一點。
4)唯一索引:索引列中的值必須是唯一的,但是允許為空值。
5)主鍵索引:是一種特殊的唯一索引,不允許有空值。
6)組合索引:在表中的多個字段組合上建立的索引,只有在查詢條件中使用了這些欄位的左邊欄位時,索引才會被使用,使用組合索引時遵循最左字首集合。這個如果還不明白,等後面舉例講解時在細說
8)空間索引:空間索引是對空間資料型別的字段建立的索引,mysql中的空間資料型別有四種,geometry、point、linestring、polygon。在建立空間索引時,使用spatial關鍵字。要求,引擎為myisam,建立空間索引的列,必須將其宣告為not null。
2.索引原理
在mysql中,儲存引擎用類似的方法使用索引,其先在索引中查詢對應的值,然後根據匹配的索引記錄找到對應的資料行,最後將資料結果集返回給客戶端。
3.索引使用原則
最左字首匹配原則
mysql會一直向右匹配直到遇到範圍查詢(>、<、between、like)就停止匹配。比如a = 1 and b = 2 and c > 3 and d = 4,如果建立(a,b,c,d)順序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調整。
=和in可以亂序
比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序,mysql的查詢優化器會幫你優化成索引可以識別的形式。
盡量選擇區分度高的列作為索引
區分度的公式是count(distinct col)/count(*),表示欄位不重複的比例,比例越大我們掃瞄的記錄數越少,唯一鍵的區分度是1,而一些狀態、性別字段可能在大資料面前區分度就是0,那可能有人會問,這個比例有什麼經驗值嗎?使用場景不同,這個值也很難確定,一般需要join的字段我們都要求是0.1以上,即平均1條掃瞄10條記錄。
索引列不能參與計算,保持列「乾淨」
比如from_unixtime(create_time) = 』2014-05-29』就不能使用到索引,原因很簡單,b+樹中存的都是資料表中的字段值,但進行檢索時,需要把所有元素都應用函式才能比較,顯然成本太大。所以語句應該寫成create_time = unix_timestamp(』2014-05-29』);
盡量的擴充套件索引,不要新建索引
比如表中已經有a的索引,現在要加(a,b)的索引,那麼只需要修改原來的索引即可。
4.高效能索引列
獨立的列
字首索引和索引的選擇性
多列索引
選擇合適的索引列順序
聚簇索引
覆蓋索引
使用索引掃瞄來做排序
冗餘和重複索引
未使用的索引
Oracle資料庫索引
標籤 資料庫 oracle 索引index 2013 06 14 16 54 4148人閱讀收藏 舉報 database 6 目錄 索引基本概念 索引的作用 索引的架構 oracle索引的型別 1 基於函式的索引 2 位圖索引 oracle索引的實現 索引是用於加速資料訪問的資料物件,合理的使用索引...
Oracle資料庫 索引
索引通過指標的形式提高資料查詢的速度。如果乙個資料量比較大的資料庫經常被查詢而插入刪除的次數較少,則應該建立索引,相反,小表或經常被插入或修改,則不建議建立索引。1.建立索引 create index emp phone number ix on employees phone number 2.建...
Oracle資料庫 索引
索引是定義在儲存表基礎之上,有助於無需檢查所有記錄而快速定位所需記錄的一種輔助儲存結構,由一系列儲存在磁碟上的索引項 index entries 組成,每個索引項又由兩部分構成 索引字段 由table中某些列 通常是一列 中的值串接而成,索引中通常儲存了索引欄位的每乙個值 也有例外 索引字段類似於詞...