SQL語句優化技術分析

sql語句優化技術分析

操作符優化

in 操作符

用in寫出來的sql的優點是比較容易寫及清晰易懂，這比較適合現代軟體開發的風格。

但是用in的sql效能總是比較低的，從oracle執行的步驟來分析用in的sql與不用in的sql有以下區別：

oracle試圖將其轉換成多個表的連線，如果轉換不成功則先執行in裡面的子查詢，再查詢外層的表記錄，如果轉換成功則直接採用多個表的連線方式查詢。由此可見用in的sql至少多了乙個轉換的過程。一般的sql都可以轉換成功，但對於含有分組統計等方面的sql就不能轉換了。

推薦方案：在業務密集的sql當中盡量不採用in操作符。

not in操作符

此操作是強列推薦不使用的，因為它不能應用表的索引。

推薦方案：用not exists 或（外連線+判斷為空）方案代替

<> 操作符（不等於）

不等於操作符是永遠不會用到索引的，因此對它的處理只會產生全表掃瞄。

推薦方案：用其它相同功能的操作運算代替，如

a<>0 改為 a>0 or a<0

a<>』』改為 a>』』

is null 或is not null操作（判斷字段是否為空）

判斷字段是否為空一般是不會應用索引的，因為b樹索引是不索引空值的。

推薦方案：

用其它相同功能的操作運算代替，如

a is not null 改為 a>0 或a>』』等。

不允許欄位為空，而用乙個預設值代替空值，如業擴申請中狀態字段不允許為空，預設為申請。

建立位圖索引（有分割槽的表不能建，位圖索引比較難控制，如字段值太多索引會使效能下降，多人更新操作會增加資料塊鎖的現象）

> 及 < 操作符（大於或小於操作符）

大於或小於操作符一般情況下是不用調整的，因為它有索引就會採用索引查詢，但有的情況下可以對它進行優化，如乙個表有100萬記錄，乙個數值型字段a，30萬記錄的a=0，30萬記錄的a=1，39萬記錄的a=2，1萬記錄的a=3。那麼執行a>2與a>=3的效果就有很大的區別了，因為a>2時oracle會先找出為2的記錄索引再進行比較，而a>=3時oracle則直接找到=3的記錄索引。

like操作符

like操作符可以應用萬用字元查詢，裡面的萬用字元組合可能達到幾乎是任意的查詢，但是如果用得不好則會產生效能上的問題，如like 『%5400%』這種查詢不會引用索引，而like 『x5400%』則會引用範圍索引。乙個實際例子：用yw_yhjbqk表中營業編號後面的戶標識號可來查詢營業編號 yy_bh like 『%5400%』這個條件會產生全表掃瞄，如果改成yy_bh like 』x5400%』 or yy_bh like 』b5400%』則會利用yy_bh的索引進行兩個範圍的查詢，效能肯定大大提高。

union操作符

union在進行表鏈結後會篩選掉重複的記錄，所以在表鏈結後會對所產生的結果集進行排序運算，刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄，最常見的是過程表與歷史表union。如：

select * from gc_dfys

union

select * from ls_jg_dfys

這個sql在執行時先取出兩個表的結果，再用排序空間進行排序刪除重複的記錄，最後返回結果集，如果表資料量大的話可能會導致用磁碟進行排序。

推薦方案：採用union all操作符替代union，因為union all操作只是簡單的將兩個結果合併後就返回。

select * from gc_dfys

union all

select * from ls_jg_dfys

sql書寫的影響

同一功能同一效能不同寫法sql的影響

如乙個sql在a程式設計師寫的為

select * from zl_yhjbqk

b程式設計師寫的為

select * from dlyx.zl_yhjbqk（帶表所有者的字首）

c程式設計師寫的為

select * from dlyx.zlyhjbqk（大寫表名）

d程式設計師寫的為

select *　from dlyx.zlyhjbqk（中間多了空格）

以上四個sql在oracle分析整理之後產生的結果及執行的時間是一樣的，但是從oracle共享記憶體sga的原理，可以得出oracle對每個sql 都會對其進行一次分析，並且占用共享記憶體，如果將sql的字串及格式寫得完全相同則oracle只會分析一次，共享記憶體也只會留下一次的分析結果，這不僅可以減少分析sql的時間，而且可以減少共享記憶體重複的資訊，oracle也可以準確統計sql的執行頻率。

where後面的條件順序影響

where子句後面的條件順序對大資料量表的查詢會產生直接的影響，如

select * from zl_yhjbqk where dy_dj = '1kv以下' and xh_bz=1

select * from zl_yhjbqk where xh_bz=1　and dy_dj = '1kv以下'

以上兩個sql中dy_dj（電壓等級）及xh_bz（銷戶標誌）兩個欄位都沒進行索引，所以執行的時候都是全表掃瞄，第一條sql的dy_dj = '1kv以下'條件在記錄集內比率為99%，而xh_bz=1的比率只為0.5%，在進行第一條sql的時候99%條記錄都進行dy_dj及xh_bz的比較，而在進行第二條sql的時候0.5%條記錄都進行dy_dj及xh_bz的比較，以此可以得出第二條sql的cpu佔用率明顯比第一條低。

查詢表順序的影響

在from後面的表中的列表順序會對sql執行效能影響，在沒有索引及oracle沒有對錶進行統計分析的情況下oracle會按表出現的順序進行鏈結，由此因為表的順序不對會產生十分耗伺服器資源的資料交叉。（注：如果對錶進行了統計分析，oracle會自動先進小表的鏈結，再進行大表的鏈結）

SQL語句優化技術分析

SQL語句優化技術分析

SQL語句優化技術分析

SQL語句優化技術分析

相關推薦