回想四年前,我在學習mysql的索引這塊的時候,老師在講索引的時候,是像下面這麼說的
索引就像一本書的目錄。而當使用者通過索引查詢資料時,就好比使用者通過目錄查詢某章節的某個知識點。這樣就幫助使用者有效地提高了查詢速度。所以,使用索引可以有效地提高資料庫系統的整體效能。嗯,這麼說其實也對。但是呢,大家看完這種說法,其實可能還是覺得太抽象了!因此呢,我還想再深入的細說一下,所以就有了此文!
需要說明的是,我說的內容只在mysql的innodb引擎中是成立的。在sql server、oracle、mysql的mysiam引擎中的正確性,不一定成立!
ok,廢話不多說,開始囉嗦!
先引進聚簇索引和非聚簇索引的概念!
我們平時在使用的mysql中,使用下述語句
create [unique|fulltext|spatial] index index_name
[using index_type]
on tbl_name (index_col_name,...)
index_col_name:
col_name [(length)] [asc | desc]
建立的索引,如復合索引、字首索引、唯一索引,都是屬於非聚簇索引,在有的書籍中,又將其稱為輔助索引(secondary index)。在後文中,我們稱其為非聚簇索引,其資料結構為b+樹。
那麼,這個聚簇索引,在mysql中是沒有語句來另外生成的。在innodb中,mysql中的資料是按照主鍵的順序來存放的。那麼聚簇索引就是按照每張表的主鍵來構造一顆b+樹,葉子節點存放的就是整張表的行資料。由於表裡的資料只能按照一顆b+樹排序,因此一張表只能有乙個聚簇索引。
在innodb中,聚簇索引預設就是主鍵索引。
這個時候,機智的讀者,應該要問我
如果我的表沒建主鍵呢?回答是,如果沒有主鍵,則按照下列規則來建聚簇索引
ps
:大家還記得,自增主鍵和uuid作為主鍵的區別麼?由於主鍵使用了聚簇索引,如果主鍵是自增id,,那麼對應的資料一定也是相鄰地存放在磁碟上的,寫入效能比較高。如果是uuid的形式,頻繁的插入會使innodb頻繁地移動磁碟塊,寫入效能就比較低了。
先來一張帶主鍵的表,如下所示,pid是主鍵
pidname
birthday
5zhangsan
2016-10-02
8lisi
2015-10-04
11wangwu
2016-09-02
13zhaoliu
2015-10-07
畫出該錶的結構圖如下
如上圖所示,分為上下兩個部分,上半部分是由主鍵形成的b+樹,下半部分就是磁碟上真實的資料!那麼,當我們, 執行下面的語句
select * from
table
where pid='11'
那麼,執行過程如下
如上圖所示,從根開始,經過3次查詢,就可以找到真實資料。如果不使用索引,那就要在磁碟上,進行逐行掃瞄,直到找到資料位置。顯然,使用索引速度會快。但是在寫入資料的時候,需要維護這顆b+樹的結構,因此寫入效能會下降!
ok,接下來引入非聚簇索引!我們執行下面的語句
create
index index_name on
table(name);
此時結構圖如下所示
大家注意看,會根據你的索引字段生成一顆新的b+樹。因此, 我們每加乙個索引,就會增加表的體積, 占用磁碟儲存空間。然而,注意看葉子節點,非聚簇索引的葉子節點並不是真實資料,它的葉子節點依然是索引節點,存放的是該索引欄位的值以及對應的主鍵索引(聚簇索引)。
如果我們執行下列語句
select * from
table
where
name='lisi'
此時結構圖如下所示
通過上圖紅線可以看出,先從非聚簇索引樹開始查詢,然後找到聚簇索引後。根據聚簇索引,在聚簇索引的b+樹上,找到完整的資料!
那
什麼情況不去聚簇索引樹上查詢呢?還記得我們的非聚簇索引樹上存著該索引欄位的值麼。如果,此時我們執行下面的語句
select
name
from
table
where
name='lisi'
此時結構圖如下
如上圖紅線所示,如果在非聚簇索引樹上找到了想要的值,就不會去聚簇索引樹上查詢。還記得,博主在《select的正確姿勢》提到的索引問題麼:
當執行select col from table where col = ?,col上有索引的時候,效率比執行select * from table where col = ? 速度快好幾倍!看完上面的圖,你應該對這句話有更深層的理解了。
那麼這個時候,我們執行了下述語句,又會發生什麼呢?
create
index index_birthday on
table(birthday);
此時結構圖如下
看到了麼,多加乙個索引,就會多生成一顆非聚簇索引樹。因此,很多文章才說,索引不能亂加。因為,有幾個索引,就有幾顆非聚簇索引樹!你在做插入操作的時候,需要同時維護這幾顆樹的變化!因此,如果索引太多,插入效能就會下降!
關於 Mysql innodb的索引
關於innodb的索引,可以分為聚簇索引,輔助索引,都是以b tree 為底層資料結構。聚簇索引 只是資料的儲存方法。以主鍵為key,如果表中沒有主鍵,則會選擇乙個有唯一索引的列作為key,如果都沒有,innodb會為我們建立乙個唯一列作為key。所有的資料都存在葉子節點上,並且是按順序儲存的。如果...
MySQL Innodb 索引的原理
回想四年前,我在學習mysql的索引這塊的時候,老師在講索引的時候,是像下面這麼說的 索引就像一本書的目錄。而當使用者通過索引查詢資料時,就好比使用者通過目錄查詢某章節的某個知識點。這樣就幫助使用者有效地提高了查詢速度。所以,使用索引可以有效地提高資料庫系統的整體效能。嗯,這麼說其實也對。但是呢,大...
MySQL InnoDB索引相關
一般資料庫的資料 資料本身和結構維護資料 最終都是要落地到磁碟上,進行讀取的時候不可能一次性將所有資料全部載入到記憶體,所以記憶體中需要不停的置換磁碟上的內容,索引也是一樣,乙個資料庫的索引佔據的空間也是不小的資料,都是分頁載入的,所以需要合適的資料結構來儲存才能保持較好的效能,b樹就是用來儲存索引...