mysql exists和in效率問題

2021-08-03 21:34:35 字數 3126 閱讀 5823

**

exists對外表用loop逐條查詢,每次查詢都會檢視exists的條件語句,當 exists裡的條件語句能夠返回記錄行時(無論記錄行是的多少,只要能返回),條件就為真,返回當前loop到的這條記錄,反之如果exists裡的條 件語句不能返回記錄行,則當前loop到的這條記錄被丟棄,exists的條件就像乙個bool條件,當能返回結果集則為true,不能返回結果集則為 false

如下:select * from user where exists (select 1);

對user表的記錄逐條取出,由於子條件中的select 1永遠能返回記錄行,那麼user表的所有記錄都將被加入結果集,所以與 select * from user;是一樣的

又如下select * from user where exists (select * from user where userid = 0);

可以知道對user表進行loop時,檢查條件語句(select * from user where userid = 0),由於userid永遠不為0,所以條件語句永遠返回空集,條件永遠為false,那麼user表的所有記錄都將被丟棄

not exists與exists相反,也就是當exists條件有結果集返回時,loop到的記錄將被丟棄,否則將loop到的記錄加入結果集

總的來說,如果a表有n條記錄,那麼exists查詢就是將這n條記錄逐條取出,然後判斷n遍exists條件 

in查詢相當於多個or條件的疊加,這個比較好理解,比如下面的查詢

select * from user where userid in (1, 2, 3);

等效於select * from user where userid = 1 or userid = 2 or userid = 3;

not in與in相反,如下

select * from user where userid not in (1, 2, 3);

等效於select * from user where userid != 1 and userid != 2 and userid != 3;

總的來說,in查詢就是先將子查詢條件的記錄全都查出來,假設結果集為b,共有m條記錄,然後在將子查詢條件的結果集分解成m個,再進行m次查詢

值得一提的是,in查詢的子條件返回結果必須只有乙個字段,例如

select * from user where userid in (select id from b);

而不能是

select * from user where userid in (select id, age from b);

而exists就沒有這個限制

下面來考慮exists和in的效能

考慮如下sql語句

1: select * from a where exists (select * from b where b.id = a.id);

2: select * from a where a.id in (select id from b);

查詢1.可以轉化以下偽**,便於理解

for ($i = 0; $i < count(a); $i++)

return $result;

大概就是這麼個意思,其實可以看到,查詢1主要是用到了b表的索引,a表如何對查詢的效率影響應該不大

假設b表的所有id為1,2,3,查詢2可以轉換為

select * from a where a.id = 1 or a.id = 2 or a.id = 3;

這個好理解了,這裡主要是用到了a的索引,b表如何對查詢影響不大

下面再看not exists 和 not in

1. select * from a where not exists (select * from b where b.id = a.id);

2. select * from a where a.id not in (select id from b);

看查詢1,還是和上面一樣,用了b的索引

而對於查詢2,可以轉化成如下語句

select * from a where a.id != 1 and a.id != 2 and a.id != 3;

可以知道not in是個範圍查詢,這種!=的範圍查詢無法使用任何索引,等於說a表的每條記錄,都要在b表裡遍歷一次,檢視b表裡是否存在這條記錄

故not exists比not in效率高

mysql中的in語句是把外表和內錶作hash 連線,而exists語句是對外表作loop迴圈,每次loop迴圈再對內表進行查詢。一直大家都認為exists比in語句的效率要高,這種說法其實是不準確的。這個是要區分環境的。

如果查詢的兩個表大小相當,那麼用in和exists差別不大。 

如果兩個表中乙個較小,乙個是大表,則子查詢表大的用exists,子查詢錶小的用in: 

例如:表a(小表),表b(大表) 1:

select * from a where cc in (select cc from b)

效率低,用到了a表上cc列的索引;

select * from a where exists(select cc from b where cc=a.cc) 

效率高,用到了b表上cc列的索引。 

相反的 2:

select * from b where cc in (select cc from a) 

效率高,用到了b表上cc列的索引;

select * from b where exists(select cc from a where cc=b.cc) 

效率低,用到了a表上cc列的索引。

not in 和not exists如果查詢語句使用了not in 那麼內外表都進行全表掃瞄,沒有用到索引;而not extsts 的子查詢依然能用到表上的索引。所以無論那個表大,用not exists都比not in要快。 

in 與 =的區別 

select name from student where name in ('zhang','wang','li','zhao');  與 

select name from student where name='zhang' or name='li' or name='wang' or name='zhao' 

的結果是相同的。

MySql exists和in的效率

如果查詢的兩個表大小相當,那麼用in和exists差別不大。如果兩個表中乙個較小,乙個是大表,則子查詢表大的用exists,子查詢小的用in 例如 表a 小表 表b 大表 1 select from a where cc in select cc from b 效率低,用到了a表上cc列的索引 se...

mysql exists 和 in的效率比較

這條語句適用於a錶比b表大的情況 select from ecs goods a where cat id in select cat id from ecs category 這條語句適用於b錶比a表大的情況 select from ecs goods a where exists select ...

mysql exists 和 in的效率比較

select from a where id in select id from b 以上查詢使用了in語句,in 只執行一次,它查出b表中的所有id欄位並快取起來.之後,檢查a表的id是否與b表中的id相等,如果相等則將a表的記錄加入結果集中,直到遍歷完a表的所有記錄.它的查詢過程類似於以下過程 ...