it技術之家 2019-04-03 16:32:16
概述一、什麼是索引
資料庫索引,是資料庫管理系統中乙個排序的資料結構,以協助快速查詢、更新資料庫表中資料。就像我們以前用的新華字典的目錄一樣,能幫助我們快速查詢到某乙個字。
二、索引的分類
分類角度索引名稱 資料結構b+樹,hash索引,r-tree等 儲存層面聚簇索引,非聚簇索引 邏輯層面主鍵索引,普通索引,復合索引,唯一索引,空間索引等 三、索引例項分析(以innodb為例)
3.1 innodb下索引的結構
innodb下,表都是根據主鍵順序以索引的形式存放的,這種資料儲存方式也被稱為聚簇索引,「聚簇」就是表示資料行和相鄰的鍵值緊湊的儲存在一起,也就是資料行實際上是儲存在索引的葉子頁中。我們建立一張表來實際說明下innodb下的索引結構,建表語句如下:
create table person(
id int primary key,
age int not null
index (age)engine=innodb;
然後我們插入五條資料分別為(1,15),(2,17),(6,20),(10,18),(19,21),索引的樹結構如下:
上圖中展示了兩部分內容,第乙個圖為聚簇索引(主鍵索引)的內容,可以看到,資料按照id的大小排序,對應的索引會包含該索引的整行資料。
第二個圖展示了用age做索引的索引結構圖,也就是非聚簇索引(非主鍵索引),可以看到索引以年齡排序,但是和主鍵索引不同的是,年齡索引對應的卻是id,所以我們可以知道非主鍵索引記錄的內容就是主鍵索引的值。
這裡可能有同學會有疑問,如果我建表的時候沒有指定主鍵的話,索引結構又是如何的呢?其實在innodb中,如果沒有定義主鍵,那麼他會選擇乙個唯一的非空索引代替。如果沒有這樣的索引,那麼他會隱式的定義乙個主鍵來作為聚簇索引。所以無論你是否設定主鍵,innodb還是會幫你滿足以上圖的形式來索引資料。接下來我們分析下索引查詢的流程。
3.2 索引查詢分析
假設我們執行一條查詢語句 select * from person where id = 6,因為直接使用的是主鍵id查詢,所以就會用主鍵索引,由於主鍵索引直接關聯了整行所有資料,所以,引擎只要執行一次就能查詢出結果。
如果執行的sql語句是非主鍵索引
select * from person where age = 18
上述語句會走age的普通索引,索引先根據age搜尋等於18的索引記錄,找到id=10的記錄,然後再到主鍵索引搜尋一次,然後拿出需要查詢的資料。
從普通索引查出主鍵索引,然後查詢出資料的過程叫做回表。由於回表需要多執行一次查詢,這也是為什麼主鍵索引要比普通索引要快的原因,所以,我們要盡量使用主鍵查詢。
3.3 覆蓋索引
我們通常建立索引的依據都是根據查詢的where條件,但是這只是我們通常的做法,我們根據上面的分析可以知道,如果要想查詢效率高,第一,使用主鍵索引,第二,避免回表,也就是盡可能的在索引中就能獲取想要的資料。如果乙個索引包含了需要查詢的字段,那麼我們就叫做「覆蓋索引」。
那麼如何建立乙個覆蓋索引呢?答案是通過聯合索引來實現,通過聯合索引的字段來覆蓋要查詢的字段,從而達到索引覆蓋的效果。
我們把上面的建表語句改造下,來分析下如何實現覆蓋索引。
create table `person` (
`id` int(11) not null,
`age` int(11) default null,
`name` varchar(20) default null,
`***` varchar(1) default null,
primary key (`id`),
key `name_age` (`name`,`age`)
) engine=innodb default charset=latin1;
上面我建立了乙個name和age的聯合索引,索引結構圖表示如下:
我們根據圖可以知道,聯合索引是和建立索引字段順序有關的,上面這個例子就是先以name排序,然後name相同再以age為標準排序。那麼我們建表後該如何達到覆蓋索引的效果呢?相信有些同學已經知道了怎麼寫sql可以達到覆蓋索引效果,sql如下:
select name,age from person where name = "barry"
因為我們需要查詢的字段name和age,都在索引中可以直接查詢到了,所以不需要查詢到主鍵id,然後再回表了。
看到這裡,肯定有同學會說,既然這樣的話,我把所有需要查詢的字段組合都建上聯合索引不就行了嗎?答案是:不行。因為索引也是需要消耗空間的,而且維護索引也是需要成本的,這一點我會在後面的優缺點中提到。那麼有沒有別的方式可以盡可能的實現不回表的效果呢?這裡我們就要引入mysql的最左字首原則了。
什麼叫最左字首原則呢?就是在索引的匹配中,可以以索引的最左n個字段,也可以是字串索引的最左n個字元。比如在上圖中,要查詢以a開頭的名字,查詢語句就是
select name from person where name like 'a%'
這個時候就可以滿足最左字首規則來使用索引查詢了,這裡就會依賴索引查詢到第乙個首字母是a的名字,然後向後遍歷,直到不滿足條件為止。
那麼最左n個字段是什麼意思呢?意思就是索引(name,age),可以直接利用 name來當做單獨索引使用,可以只使用聯合索引的部分字段,但是必須是順序一致,比如索引(a,b,c),如果要想使用最左字首規則,可以使用索引a,ab。
我們也可以利用該規則來少維護乙個或多個索引,比如我們需要 a,ab,abc的查詢,那就只需要(a,b,c)聯合索引就滿足要求了。
3.4 索引下推
在mysql 5.6版本中引入了乙個新特性,叫做「索引條件推送(index condition pushdown)」,這也稱為索引下推。那麼索引下推是這個什麼東東呢?其實從「索引條件推送」這個名字就可以表明,這個特性是可以在索引中的字段進行條件判斷,然後過濾不滿足條件的記錄,減少回表的次數。
比如以上圖中的資料為準,sql如下:
select * from person where name like 'a%' and age =19;
那麼如果沒有索引下推的情況下,首先會根據索引查詢出名字以a開頭的所有記錄,然後查詢出id,然後回表去查詢對應的id記錄,最後再判斷age=19,返回滿足條件的語句。因為滿足a開頭的記錄有2條,所以這種情況下,會回表2次。
在索引下推情況下,innodb會在索引內部直接判斷age=19是否滿足條件,過濾掉不滿足條件的記錄,所以只返回了一條,也就是只需要回表一次。從而提高了效能。
3.5 索引的優點與缺點
說了這麼多關於索引的內容,我們來談談索引的優缺點。
優點:
缺點
五、總結
這篇博文我主要說了,索引的定義,索引的分類,索引按照不同的角度可以分為常見的哪幾種。然後我重點說了在innodb下索引的資料結構。 主鍵索引和非主鍵索引的區別就是查詢主鍵索引可以直接返回資料,非主鍵索引需要先查詢出主鍵id,然後再查詢出資料,這個過程就叫做回表。我們可以通過覆蓋索引減少回表的次數,從而達到提高效能的效果。在mysql5.6以後,innodb可以支援索引下推,在使用聯合索引的時候,如果可以在索引判斷條件,那麼就在索引中過濾不滿足條件的行,從而減少回表次數。
六、參考
mysql索引做什麼 MySQL索引那些事
概述一 什麼是索引 資料庫索引,是資料庫管理系統中乙個排序的資料結構,以協助快速查詢 更新資料庫表中資料。就像我們以前用的新華字典的目錄一樣,能幫助我們快速查詢到某乙個字。二 索引的分類 分類角度 索引名稱 資料結構 b 樹,hash索引,r tree等 儲存層面 聚簇索引,非聚簇索引 邏輯層面 主...
索引那些事
最近面試問了很多關於索引的事,本來自認為可以對答如流,什麼btree b tree啊,什麼like abc 和like abc 的區別啊,又是聯合索引a and b and c 的判斷啊,很簡單吶,但沒想到啊,這裡面門門道道都可以玩出花來了,現在面試官問問題都是挖著陷阱讓你往裡跳,不講究。你真的懂聯...
索引 mysql MySql索引那些事
概述一 什麼是索引 資料庫索引,是資料庫管理系統中乙個排序的資料結構,以協助快速查詢 更新資料庫表中資料。就像我們以前用的新華字典的目錄一樣,能幫助我們快速查詢到某乙個字。二 索引的分類 分類角度索引名稱 資料結構b 樹,hash索引,r tree等 儲存層面聚簇索引,非聚簇索引 邏輯層面主鍵索引,...