資料結構(8)之堆

2021-08-01 02:31:44 字數 2771 閱讀 3927

1.堆排序定義

n個關鍵字序列kl,k2,…,kn稱為堆,當且僅當該序列滿足如下性質(簡稱為堆性質):

(1)ki≤k2i且ki≤k2i+1或(2)ki≥k2i且ki≥k2i+1(1≤i≤ )

若將此序列所儲存的向量r[1..n]看做是一棵完全二叉樹的儲存結構,則堆實質上是滿足如下性質的完全二叉樹:樹中任一非葉結點的關鍵字均不大於(或不小於)其左右孩子(若存在)結點的關鍵字。

2、大根堆和小根堆

根結點(亦稱為堆頂)的關鍵字是堆裡所有結點關鍵字中最小者的堆稱為小根堆。

根結點(亦稱為堆頂)的關鍵字是堆裡所有結點關鍵字中最大者,稱為大根堆。

注意:①堆中任一子樹亦是堆。

②以上討論的堆實際上是二叉堆(binaryheap),類似地可定義k叉堆。

3、堆排序特點

堆排序(heapsort)是一樹形選擇排序。

堆排序的特點是:在排序過程中,將r[l..n]看成是一棵完全二叉樹的順序儲存結構,利用完全二叉樹中雙親結點和孩子結點之間的內在關係【參見二叉樹的順序儲存結構】,在當前無序區中選擇關鍵字最大(或最小)的記錄。

4、堆排序與直接插入排序的區別

直接選擇排序中,為了從r[1..n]中選出關鍵字最小的記錄,必須進行n-1次比較,然後在r[2..n]中選出關鍵字最小的記錄,又需要做n-2次比較。事實上,後面的n-2次比較中,有許多比較可能在前面的n-1次比較中已經做過,但由於前一趟排序時未保留這些比較結果,所以後一趟排序時又重複執行了這些比較操作。

堆排序可通過樹形結構儲存部分比較結果,可減少比較次數。

5、堆排序

堆排序利用了大根堆(或小根堆)堆頂記錄的關鍵字最大(或最小)這一特徵,使得在當前無序區中選取最大(或最小)關鍵字的記錄變得簡單。(1

)用大根堆排序的基本思想

① 先將初始檔案r[1..n]建成乙個大根堆,此堆為初始的無序區

② 再將關鍵字最大的記錄r[1](即堆頂)和無序區的最後乙個記錄r[n]交換,由此得到新的無序區r[1..n-1]和有序區r[n],且滿足r[1..n-1].keys≤r[n].key

③ 由於交換後新的根r[1]可能違反堆性質,故應將當前無序區r[1..n-1]調整為堆。然後再次將r[1..n-1]中關鍵字最大的記錄r[1]和該區間的最後乙個記錄r[n-1]交換,由此得到新的無序區r[1..n-2]和有序區r[n-1..n],且仍滿足關係r[1..n-2].keys≤r[n-1..n].keys,同樣要將r[1..n-2]調整為堆。

……直到無序區只有乙個元素為止。(2

)大根堆排序演算法的基本操作:

① 初始化操作:將r[1..n]構造為初始堆;

② 每一趟排序的基本操作:將當前無序區的堆頂記錄r[1]和該區間的最後乙個記錄交換,然後將新的無序區調整為堆(亦稱重建堆)。

注意:①只需做n-1趟排序,選出較大的n-1個關鍵字即可以使得檔案遞增有序。

②用小根堆排序與利用大根堆類似,只不過其排序結果是遞減有序的。堆排序和直接選擇排序相反:在任何時刻,堆排序中無序區總是在有序區之前,且有序區是在原向量的尾部由後往前逐步擴大至整個向量為止。(3

)堆排序的演算法:

void heapsort(seqiast r)

//endfor

} //heapsort(4

)buildheap

和heapify

函式的實現

因為構造初始堆必須使用到調整堆的操作,先討論heapify的實現。

① heapify函式思想方法

每趟排序開始前r[l..i]是以r[1]為根的堆,在r[1]與r[i]交換後,新的無序區r[1..i-1]中只有r[1]的值發生了變化,故除r[1]可能違反堆性質外,其餘任何結點為根的子樹均是堆。因此,當被調整區間是r[low..high]時,只須調整以r[low]為根的樹即可。

"篩選法"調整堆

r[low]的左、右子樹(若存在)均已是堆,這兩棵子樹的根r[2low]和r[2low+1]分別是各自子樹中關鍵字最大的結點。若r[low].key不小於這兩個孩子結點的關鍵字,則r[low]未違反堆性質,以r[low]為根的樹已是堆,無須調整;否則必須將r[low]和它的兩個孩子結點中關鍵字較大者進行交換,即r[low]與r[large](r[large].key=max(r[2low].key,r[2low+1].key))交換。交換後又可能使結點r[large]違反堆性質,同樣由於該結點的兩棵子樹(若存在)仍然是堆,故可重複上述的調整過程,對以r[large]為根的樹進行調整。此過程直至當前被調整的結點已滿足堆性質,或者該結點已是葉子為止。上述過程就象過篩子一樣,把較小的關鍵字逐層篩下去,而將較大的關鍵字逐層選上來。因此,有人將此方法稱為"篩選法"。

要將初始檔案r[l..n]調整為乙個大根堆,就必須將它所對應的完全二叉樹中以每一結點為根的子樹都調整為堆。

顯然只有乙個結點的樹是堆,而在完全二叉樹中,所有序號  的結點都是葉子,因此以這些結點為根的子樹均已是堆。這樣,我們只需依次將以序號為  , -1,…,1的結點作為根的子樹都調整為堆即可。

具體演算法【參見教材】。

5、 演算法分析

堆排序的時間,主要由建立初始堆和反覆重建堆這兩部分的時間開銷構成,它們均是通過呼叫heapify實現的。

堆排序的最壞時間複雜度為o(nlgn)。堆排序的平均效能較接近於最壞效能。

由於建初始堆所需的比較次數較多,所以堆排序不適宜於記錄數較少的檔案。

堆排序是就地排序,輔助空間為o(1),

它是不穩定的排序方法。

資料結構之堆

原帖 對於堆的資料結構的介紹,在網上搜了下,具體講的不是很多。發現比較好的一篇介紹堆的部落格是在此感謝他。通過對上面那篇部落格的學習,然後自己也去翻了下 演算法導論 裡面關於堆排序 heapsort 的介紹。這樣就對堆有了更加深刻的認識,在此,我結合自己的一點點理解,主要還是基於上面那篇部落格的內容...

資料結構之堆

堆 我們這裡指二叉堆 是一棵完全二叉樹,並且祖先節點的所有子孫節點都不小於 或不大於 祖先節點的值。通常我們把根節點作為第一層的話,那麼深度為h的堆就有2 h 1 2 h 1個節點,顯然擁有n個節點的堆,其高度為lgn。也就是說對堆進行插入語刪除操作我們都需要lgn的時間。由於堆的完全樹的性質,因此...

資料結構之堆

1.概述 堆 也叫優先佇列 是一棵完全二叉樹,它的特點是父節點的值大於 小於 兩個子節點的值 分別稱為大頂堆和小頂堆 它常用於管理演算法執行過程中的資訊,應用場景包括堆排序,優先佇列等。2.堆的基本操作 堆是一棵完全二叉樹,高度為o lg n 其基本操作至多與樹的高度成正比。在介紹堆的基本操作之前,...