sql語句優化技術分析
操作符優化
in 操作符
用in寫出來的sql的優點是比較容易寫及清晰易懂,這比較適合現代軟體開發的風格。
但是用in的sql效能總是比較低的,從oracle執行的步驟來分析用in的sql與不用in的sql有以下區別:
oracle試圖將其轉換成多個表的連線,如果轉換不成功則先執行in裡面的子查詢,再查詢外層的表記錄,如果轉換成功則直接採用多個表的連線方式查詢。由此可見用in的sql至少多了乙個轉換的過程。一般的sql都可以轉換成功,但對於含有分組統計等方面的sql就不能轉換了。
推薦方案:在業務密集的sql當中盡量不採用in操作符。
not in操作符
此操作是強列推薦不使用的,因為它不能應用表的索引。
推薦方案:用not exists 或(外連線+判斷為空)方案代替
<> 操作符(不等於)
不等於操作符是永遠不會用到索引的,因此對它的處理只會產生全表掃瞄。
推薦方案:用其它相同功能的操作運算代替,如
a<>0 改為 a>0 or a<0
a<>』』 改為 a>』』
is null 或is not null操作(判斷字段是否為空)
判斷字段是否為空一般是不會應用索引的,因為b樹索引是不索引空值的。
推薦方案:
用其它相同功能的操作運算代替,如
a is not null 改為 a>0 或a>』』等。
不允許欄位為空,而用乙個預設值代替空值,如業擴申請中狀態字段不允許為空,預設為申請。
建立位圖索引(有分割槽的表不能建,位圖索引比較難控制,如字段值太多索引會使效能下降,多人更新操作會增加資料塊鎖的現象)
> 及 < 操作符(大於或小於操作符)
大於或小於操作符一般情況下是不用調整的,因為它有索引就會採用索引查詢,但有的情況下可以對它進行優化,如乙個表有100萬記錄,乙個數值型字段a,30萬記錄的a=0,30萬記錄的a=1,39萬記錄的a=2,1萬記錄的a=3。那麼執行a>2與a>=3的效果就有很大的區別了,因為a>2時oracle會先找出為2的記錄索引再進行比較,而a>=3時oracle則直接找到=3的記錄索引。
like操作符
like操作符可以應用萬用字元查詢,裡面的萬用字元組合可能達到幾乎是任意的查詢,但是如果用得不好則會產生效能上的問題,如like 『%5400%』 這種查詢不會引用索引,而like 『x5400%』則會引用範圍索引。乙個實際例子:用yw_yhjbqk表中營業編號後面的戶標識號可來查詢營業編號 yy_bh like 『%5400%』 這個條件會產生全表掃瞄,如果改成yy_bh like 』x5400%』 or yy_bh like 』b5400%』 則會利用yy_bh的索引進行兩個範圍的查詢,效能肯定大大提高。
union操作符
union在進行表鏈結後會篩選掉重複的記錄,所以在表鏈結後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表union。如:
select * from gc_dfys
union
select * from ls_jg_dfys
這個sql在執行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表資料量大的話可能會導致用磁碟進行排序。
推薦方案:採用union all操作符替代union,因為union all操作只是簡單的將兩個結果合併後就返回。
select * from gc_dfys
union all
select * from ls_jg_dfys
sql書寫的影響
同一功能同一效能不同寫法sql的影響
如乙個sql在a程式設計師寫的為
select * from zl_yhjbqk
b程式設計師寫的為
select * from dlyx.zl_yhjbqk(帶表所有者的字首)
c程式設計師寫的為
select * from dlyx.zlyhjbqk(大寫表名)
d程式設計師寫的為
select * from dlyx.zlyhjbqk(中間多了空格)
以上四個sql在oracle分析整理之後產生的結果及執行的時間是一樣的,但是從oracle共享記憶體sga的原理,可以得出oracle對每個sql 都會對其進行一次分析,並且占用共享記憶體,如果將sql的字串及格式寫得完全相同則oracle只會分析一次,共享記憶體也只會留下一次的分析結果,這不僅可以減少分析sql的時間,而且可以減少共享記憶體重複的資訊,oracle也可以準確統計sql的執行頻率。
where後面的條件順序影響
where子句後面的條件順序對大資料量表的查詢會產生直接的影響,如
select * from zl_yhjbqk where dy_dj = '1kv以下' and xh_bz=1
select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1kv以下'
以上兩個sql中dy_dj(電壓等級)及xh_bz(銷戶標誌)兩個欄位都沒進行索引,所以執行的時候都是全表掃瞄,第一條sql的dy_dj = '1kv以下'條件在記錄集內比率為99%,而xh_bz=1的比率只為0.5%,在進行第一條sql的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條sql的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條sql的cpu佔用率明顯比第一條低。
查詢表順序的影響
在from後面的表中的列表順序會對sql執行效能影響,在沒有索引及oracle沒有對錶進行統計分析的情況下oracle會按表出現的順序進行鏈結,由此因為表的順序不對會產生十分耗伺服器資源的資料交叉。(注:如果對錶進行了統計分析,oracle會自動先進小表的鏈結,再進行大表的鏈結)
SQL語句優化技術分析
一 操作符優化 1 in 操作符 2 not in操作符 3 is null 或is not null操作 4 及 操作符 大於或小於操作符 乙個數值型字段a,30萬記錄的a 0,30萬記錄的a 1,39萬記錄的a 2,1萬記錄的a 3。那麼執行a 2與a 3的效果就有很大的區別了,因為a 2時or...
SQL語句優化技術分析
操作符優化 in 操作符 用in寫出來的sql的優點是比較容易寫及清晰易懂,這比較適合現代軟體開發的風格。但是用in的sql效能總是比較低的,從oracle執行的步驟來分析用in的sql與不用in的sql有以下區別 oracle試圖將其轉換成多個表的連線,如果轉換不成功則先執行in裡面的子查詢,再查...
SQL語句優化技術分析
操作符優化 in 操作符 用in寫出來的sql的優點是比較容易寫及清晰易懂,這比較適合現代軟體開發的風格。但是用in的sql效能總是比較低的,從oracle執行的步驟來分析用in的sql與不用in的sql有以下區別 oracle試圖將其轉換成多個表的連線,如果轉換不成功則先執行in裡面的子查詢,再查...