1、nested loop(巢狀迴圈)
對於被連線的資料子集較小的情況,nested loop連線就是較好的選擇。nested loop就是掃瞄乙個表,每讀到一條記錄,就根據索引去另外乙個表裡面查詢,沒有索引一般就不會是nested loops。
一般在nested loop中,驅動表滿足條件結果集不大,被驅動表的連線欄位要有索引,這樣就走nested loop。
如果驅動表返回記錄太多,就不適合nested loop。如果連線字段沒有索引,則適合走hash join,因為不需要索引。
要點如下:
1)對於被連線的資料子集較小的情況,巢狀迴圈連線是個較好的選擇
2)使用use_nl(table_name1 table_name2)可是強制cbo 執行巢狀迴圈連線
3)nested loop一般用在連線的表中有索引,並且索引選擇性較好的時候
4)on、in的順序很重要,驅動表的記錄集一定要小,返回結果集的響應時間是最快的。
5)nested loops 工作方式是從一張表中讀取資料,訪問另一張表(通常是索引)來做匹配,nested loops適用的場合是當乙個關聯表比較小的時候,效率會更高。
select ename,dname from emp,dept where emp.deptno=dname.deptno;
2個資料來源鍵值一一比較,返回相互匹配的記錄集
for example: nested loop
join
for x in
(select
*from emp )
loop
for y in
(select
*from dept)
loop
if( x.deptno =
= y.deptno )
output_record(x.ename,y.dname)
endif
endloop
endloop
2、hash join(雜湊連線)
優化器掃瞄小表(資料來源),利用連線鍵(也就是根據連線字段計算hash值)在記憶體中建立hash表,然後掃瞄大表,每讀到一條記錄就探測hash表一次,找出與hash表匹配的行。
當小表可以全部放入記憶體中,其成本接近全表掃瞄兩個表的成本之和。如果表很大不能完全放入記憶體,這時優化器會將它分割成若干個不同的分割槽,不能放入記憶體的部分就將該分割槽寫入磁碟的臨時段,此時要有較大的臨時段從而盡量提高i/o的效能。臨時段中的分割槽都需要換進記憶體做hash join。這時候成本接近於全表掃瞄小表+分割槽數*全表掃瞄大表的代價和。
至於兩個表進行分割槽,其好處是可以使用parrallel query,就是多個程序同時對不同的分割槽進行join,然後再合併,但是複雜。
使用hash join時,hash_area_size初始化引數必須足夠大。
以下條件使用hash join可能有優勢:
1)兩個大表之間的連線;
2)乙個大表和乙個小表之間的連線;
要點如下:
1)雜湊連線是cbo做大資料集連線時的常用方式;
2)也可以用use_hash(table_name1 table_name2)提示來強制使用雜湊連線
3)hash join在兩個表的資料量差別很大的時候
4)hash join的工作方式是將乙個表(通常是乙個小一點的表)hash運算並儲存到hash列表中,從另乙個表中抽取記錄,做hash運算,到hash列表中找到相應的值,做匹配。
可用ordere提示來改變cbo預設的驅動表,可用use_hash(table_name1 table_name2)提示來強制使用hash join。
3、sort merge join
1)對連線的每個表做table access full;
2)對table access full的結果進行排序;
3)進行merge join 對排序結果進行合併;
sort merge join 效能開銷幾乎都在前兩步。一般在沒有索引的情況下,因為排序成本高1,大多為hash join替代。
通常情況下hash join的效果都比sort merge join要好,但是,如果行源已經被排過序,在執行sort merge join時不需要再排序,這時sort merge join的效能會優於hash join。
當全表掃瞄比』索引範圍掃瞄後再通過rowid進行表訪問』更可取的情況下,sort merge join 會比nested loop 效能更佳。
要點如下:
1)使用use_merge(table_name1 table_name2)來強制使用排序合併連線
2)sort merge join用在沒有索引,並且資料已經排序的情況
3)連線步驟:將兩個表排序,然後將兩個表合併
4)通常情況下,只有在以下情況發生時,才會使用這種join方式
rbo;不等價關聯(>,<,>=,<=,<>);bhash_join_enabled=false;資料來源已排序;merge join 是先將關聯表的關聯列各自做排序,然後從各自的排序表中抽取資料,到另乙個排序表中做匹配,因為merge join需要做更多的排序,所以消耗的資源更多; like ,not like
通常來講,能夠使用merge join的地方,hash join都可以發揮更好的效能
oracle三種表連線方式
nested loop 對於被連線的資料子集較小的情況,nested loop連線是個較好的選擇。nested loop就是掃瞄乙個表,每讀到一條記錄,就根據索引去另乙個表裡面查詢,沒有索引一般就不會是 nested loops。一般在nested loop中,驅動表滿足條件結果集不大,被驅動表的連...
oracle 三種表連線方式
oracle 小知識 1.oracle 檢視表大小 select sum t.bytes 1024 1024 1024 from dba segments t where t.segment name tt tsfr fuzzy abnormal 2.強制走全表掃瞄和索引 full tt conve...
Oracle 三種表連線演算法總結
oracle有三種表連線技術,分別是巢狀連線 合併連線和雜湊連線。巢狀連線把要處理的資料集分為外迴圈 驅動資料來源 和內迴圈 被驅動資料來源 外迴圈只執行一次 先執行 內迴圈執行的次數等於外迴圈執行的資料集個數。這種連線的好處是記憶體使用非常少。如果驅動資料來源有限,且被驅動表在連線列上有相應的索引...