這張圖與 sql 查詢的語義有關,讓你知道乙個查詢會返回什麼,並回答了以下這些問題:
但資料庫引擎並不一定嚴格按照這個順序執行 sql 查詢,因為為了更快地執行查詢,它們會做出一些優化,這些問題會在以後的文章中解釋。
所以:有很多 sql 實現允許你使用這樣的語法:
select concat(first_name, '從這個語句來看,好像 group by 是在 select 之後執行的,因為它引用了 select 中的乙個別名。但實際上不一定要這樣,資料庫引擎可以把查詢重寫成這樣:', last_name) as full_name, count(1
)from
table
group
by full_name
select concat(first_name, '這樣 group by 仍然先執行。', last_name) as full_name, count(1
)from
table
group
by concat(first_name, '
', last_name)
資料庫引擎還會做一系列檢查,確保 select 和 group by 中的東西是有效的,所以會在生成執行計畫之前對查詢做一次整體檢查。
在實際當中,資料庫不一定會按照 join、where、group by 的順序來執行查詢,因為它們會進行一系列優化,把執行順序打亂,從而讓查詢執行得更快,只要不改變查詢結果。
這個查詢說明了為什麼需要以不同的順序執行查詢:
select如果只需要找出名字叫「mr darcy」的貓,那就沒必要對兩張表的所有資料執行左連線,在連線之前先進行過濾,這樣查詢會快得多,而且對於這個查詢來說,先執行過濾並不會改變查詢結果。*from
owners
left
join cats on owners.id =
cats.owner
where cats.name =
'mr darcy
'
資料庫引擎還會做出其他很多優化,按照不同的順序執行查詢,不過我並不是這方面的專家,所以這裡就不多說了。
linq(c#和 vb.net 中的查詢語法)是按照 from…where…select 的順序來的。這裡有乙個 linq 查詢例子:
var teenagerstudent =pandas 中的查詢也基本上是這樣的,不過你不一定要按照這個順序。我通常會像下面這樣寫 pandas **:from s in
studentlist
where s.age >
12&& s.age <
20select s;
df = thing1.join(thing2) #這樣寫並不是因為 pandas 規定了這些規則,而是按照 join/where/group by/h**ing 這樣的順序來寫**會更有意義些。不過我經常會先寫 where 來改進效能,而且我想大多數資料庫引擎也會這麼做。join
df = df[df.created_at > 1000] #
where
df = df.groupby('
something
', num_yes = ('
yes', '
sum')) #
group by
df = df[df.num_yes > 2] #
h**ing, 對 group by 結果進行過濾
df = df[['
num_yes
', '
something1
', '
something
']] #
select, 選擇要顯示的列
df.sort_values('
sometthing
', ascending=true)[:30] #
order by 和 limit
df[:30]
SQL執行順序
在專案開發的時候 特別是遇到資料庫表中資料比較多的時候 sql語句的執行效率優先順序是非常高的,最近本人寫了一條sql 800萬條資料中執行了10秒,最後定位出來是在使用 where lower t.commit lower 的時候執行效率特別慢 再次 後面會去專門分析 oracle中 自帶函式的使...
sql查詢條件位置和執行順序
經常有這樣的場景 在頁面的 處顯示指標的資料,如果指標的資料不存在,那麼指標的名稱也不會顯示。而實際上,有時候是需要顯示名稱的,因為這樣可以知道頁面區域的內容,沒有資料是另外一回事,因此,我們需要對sql的執行原理有一定認識,才不會走太多的彎路。如下sql select from class c l...
SQL 的where 執行順序
乙個原則,排除越多的條件放到第乙個例子 抄的。select where p.languages id 1 and m.languages id 1 and c.languages id 1 and t.languages id 1 and p.products id in 472,474 這樣查詢需...