sql中的索引分為兩種,一種為聚集索引和非聚集索引,下面介紹兩者的異同。
1、聚集索引:
聚集索引的意思可以理解為順序排列,比如乙個主鍵自增的錶即為聚集索引,即id為1的存在於第一條,id為2的存在於第二條...假使資料庫中是使用陣列來存放的這張表中的資料,那麼如果我需要查詢第100條,那麼直接第一條資料的位址加上100即為第一百條的位址,一次就能查詢出來。
因為資料庫中的資料只能按照乙個順序進行排列,所以聚集索引乙個資料庫只能有乙個。在mysql中,不能自己建立聚集索引,主鍵即為聚集索引,如果沒有建立主鍵,那麼預設非空的列為聚集索引,如果沒有非空的列那麼會自動生成乙個隱藏列為聚集索引。
所以一般在mysql中,我們建立的主鍵即為聚集索引,資料是按照我們的主鍵順序進行排列。所以在根據主鍵進行查詢時會非常快。
2、非聚集索引:
非聚集索引可以簡單理解為有序目錄,是一種以空間換取時間的方法。舉個例子,在乙個user表中,有乙個id_num,即身份號,此不為主鍵id,那麼這些資料在儲存的時候都是無序的,比如
id為1的id_num為100,id為2的id_num為97,id為3的id_num為98,id為4的id_num為99,id為5的id_num為96。。。id為67的id_num為56。。。
那麼如果我要查詢id_num為56的人,那麼只能一條一條的遍歷,n條就需要查詢n次,時間複雜度為o(n),這是非常耗費效能的。
所以,現在就需要為id_num增加非聚集索引,新增了非聚集索引後,會給id_num進行排序(內部使用結構為b+樹),並且排序後,我只需要查詢此目錄(即查詢b+樹),很快就知道為id為56的在資料庫中的第67條,而不需要在去遍歷表中的所有資料。
所以,在非聚集索引中,不重複的資料越多,那麼索引的效率越高。
我們平常在資料庫中使用的索引一般非聚集索引,下面介紹其使用方法:
1、建立索引:
1.1、建立普通索引:
模式:create index 索引名 on 表名(列名1,列名2,...);
或者修改表: alter table 表名add index 索引名 (列名1,列名2,...);
或者建立表時指定索引:create table 表名 ( [...], index 索引名 (列名1,列名 2,...) );
eg:create index name_index on index_test(name);
此為在index_test表上的name列上建立乙個索引name_index。
測試的表為:
create table index_test (
id int not null,
name varchar(50),
idnum int,
primary key (id)
);1.2、建立唯一索引:
表示唯一的,不允許重複的索引,如果該欄位資訊保證不會重複例如身份證號用作索引時,可設定為unique
下面三種模式都可以建立唯一索引:
1、建立索引:create unique index 索引名 on 表名(列的列表);
2、在表上增加索引:alter table 表名add unique 索引名 (列的列表);
3、建立表時指定索引:create table 表名( [...], unique 索引名 (列的列表) );
eg:create unique index id_num_index on index_test(idnum);
也可以寫成下面的形式:
alter table index_test add unique id_num_index(idnum);
此為在index_test表的idnum列上建立乙個唯一索引id_num_index
在建立了唯一索引之後,列中即不能重複,比如,現在我給表中插入一條重複的值,會報:
error code: 1062. duplicate entry '3' for key 'id_num_index'
即在id_num_index唯一索引上出現了重複。
2、刪除索引:
以下兩種模式都可以刪除索引:
drop index index_name on talbe_name
alter table table_name drop index index_name
eg:drop index name_index on index_test;
此為刪除在index_test表上的name_index索引
3、檢視索引:
show index from index_test;
即返回index_test表中的所有索引。
在返回的字段中,
table:表的名稱
non_unique:是否不唯一,0為唯一,1不為唯一
key_name:索引的名稱
seq_in_index:索引中的列序列號,從1開始
column_name:列名稱
collation:列以什麼方式儲存在索引中。在mysql中,有值『a』(公升序)或null(無分類)。
cardinality:索引中唯一值的數目的估計值。通過執行analyze table或myisamchk -a可以更新。基數根據被儲存為整數的統計資料來計數,所以即使對於小型表,該值也沒有必要是精確的。基數越大,當進行聯合時,mysql使用該索引的機會就越大。
sub_part:如果列只是被部分地編入索引,則為被編入索引的字元的數目。如果整列被編入索引,則為null。
packed:指示關鍵字如何被壓縮。如果沒有被壓縮,則為null。
null:如果列含有null,則含有yes。如果沒有,則該列含有no。
index_type:用過的索引方法(btree, fulltext, hash, rtree)。
comment:更多評注。
非聚集索引在資料庫建立、增加、刪除、修改的時候都需要作出相應的修改,所以,使用索引也是有一定的原則,即:
1、較頻繁的作為查詢條件的字段應該建立索引
2、重複太多的字段不適合單獨建立索引,即使頻繁作為查詢條件
3、不會出現在where子句中的字段不應該建立索引
以下兩種情況不建議使用索引:
1、表的記錄比較少,比如只有幾百,一千條記錄,那麼沒必要建立索引,直接全表查詢即可。
2、不重複的字段越多,那麼索引的價值越高,檢視不重複的字段佔總體的比例可以使用下面的sql語句:
select count(distinct(name))/count(*) as selectivity from index_test;
比如上面這個sql就是判斷index_test表中name欄位中不重複的值佔整體的比例,這個比例應該在(0,1]之間,這個數值越大,越應該使用索引。
SQL 索引 建立索引
create index 語句用於在表中建立索引。在不讀取整個表的情況下,索引使資料庫應用程式可以更快地查詢資料。您可以在表中建立索引,以便更加快速高效地查詢資料。使用者無法看到索引,它們只能被用來加速搜尋 查詢。注釋 更新乙個包含索引的表需要比更新乙個沒有索引的表更多的時間,這是由於索引本身也需要...
SQL優化(SQL 索引)
檢視表定義 show create table users 檢視表的索引 show index from users 你要獲取第乙個表的所有資訊,你說全表掃瞄快呢還是索引掃瞄快呢?所以當你查詢庫 包括left join中的臨時庫 的所有資訊時,資料庫會選擇最優方法 全表掃瞄!s表dept id na...
MySQL聚集索引詳解 mysql 索引詳解
直接起飛 1.什麼是索引?索引是幫助mysql高效獲取資料的排好序的資料結構。2.索引的資料結構?為什麼選這種結構?假設我們現在這裡有一張表 以下情況都是innodb儲存引擎 idnumber 如果mysql沒有索引這種結構,那麼我們如果查詢number為51的這行記錄,那麼mysql就要從上往下掃...