哈夫曼樹的介紹
huffman tree,中文名是哈夫曼樹或霍夫曼樹,它是最優二叉樹。
定義:給定n個權值作為n個葉子結點,構造一棵二叉樹,若樹的帶權路徑長度達到最小,則這棵樹被稱為哈夫曼樹。 這個定義裡面涉及到了幾個陌生的概念,下面就是一顆哈夫曼樹,我們來看**答。
(01) 路徑和路徑長度
定義:在一棵樹中,從乙個結點往下可以達到的孩子或孫子結點之間的通路,稱為路徑。通路中分支的數目稱為路徑長度。若規定根結點的層數為1,則從根結點到第l層結點的路徑長度為l-1。(02) 結點的權及帶權路徑長度例子:100和80的路徑長度是1,50和30的路徑長度是2,20和10的路徑長度是3。
定義:若將樹中結點賦給乙個有著某種含義的數值,則這個數值稱為該結點的權。結點的帶權路徑長度為:從根結點到該結點之間的路徑長度與該結點的權的乘積。(03) 樹的帶權路徑長度例子:節點20的路徑長度是3,它的帶權路徑長度= 路徑長度 * 權 = 3 * 20 = 60。
定義:樹的帶權路徑長度規定為所有葉子結點的帶權路徑長度之和,記為wpl。比較下面兩棵樹例子:示例中,樹的wpl= 1*100 + 2*80 + 3*20 + 3*10 = 100 + 160 + 60 + 30 = 350。
上面的兩棵樹都是以為葉子節點的樹。
左邊的樹wpl=2*10 + 2*20 + 2*50 + 2*100 = 360左邊的樹wpl > 右邊的樹的wpl。你也可以計算除上面兩種示例之外的情況,但實際上右邊的樹就是對應的哈夫曼樹。至此,應該堆哈夫曼樹的概念有了一定的了解了,下面看看如何去構造一棵哈夫曼樹。右邊的樹wpl=350
哈夫曼樹的**解析
假設有n個權值,則構造出的哈夫曼樹有n個葉子結點。 n個權值分別設為 w1、w2、…、wn,哈夫曼樹的構造規則為:
1. 將w1、w2、…,wn看成是有n 棵樹的森林(每棵樹僅有乙個結點);以為例,來構造一棵哈夫曼樹。2. 在森林中選出根結點的權值最小的兩棵樹進行合併,作為一棵新樹的左、右子樹,且新樹的根結點權值為其左、右子樹根結點權值之和;
3. 從森林中刪除選取的兩棵樹,並將新樹加入森林;
4. 重複(02)、(03)步,直到森林中只剩一棵樹為止,該樹即為所求得的哈夫曼樹。
第1步:建立森林,森林包括5棵樹,這5棵樹的權值分別是5,6,7,8,15。
第2步:在森林中,選擇根節點權值最小的兩棵樹(5和6)來進行合併,將它們作為一顆新樹的左右孩子(誰左誰右無關緊要,這裡,我們選擇較小的作為左孩子),並且新樹的權值是左右孩子的權值之和。即,新樹的權值是11。 然後,將"樹5"和"樹6"從森林中刪除,並將新的樹(樹11)新增到森林中。
第3步:在森林中,選擇根節點權值最小的兩棵樹(7和8)來進行合併。得到的新樹的權值是15。 然後,將"樹7"和"樹8"從森林中刪除,並將新的樹(樹15)新增到森林中。
第4步:在森林中,選擇根節點權值最小的兩棵樹(11和15)來進行合併。得到的新樹的權值是26。 然後,將"樹11"和"樹15"從森林中刪除,並將新的樹(樹26)新增到森林中。
第5步:在森林中,選擇根節點權值最小的兩棵樹(15和26)來進行合併。得到的新樹的權值是41。 然後,將"樹15"和"樹26"從森林中刪除,並將新的樹(樹41)新增到森林中。
此時,森林中只有一棵樹(樹41)。這棵樹就是我們需要的哈夫曼樹!
哈夫曼樹的基本操作
哈夫曼樹的重點是如何構造哈夫曼樹。本文構造哈夫曼時,用到了以前介紹過的"(二叉堆)最小堆"。下面對哈夫曼樹進行講解。
1. 基本定義
giftemplate class huffmannode huffmannode(t value, huffmannode *l, huffmannode *r, huffmannode *p): key(value),left(l),right(r),parent(p) {}};
huffmannode是哈夫曼樹的節點類。
template class huffman ;
huffman是哈夫曼樹對應的類,它包含了哈夫曼樹的根節點和哈夫曼樹的相關操作。
2. 構造哈夫曼樹
/* * 建立huffman樹 * * 引數說明: * a 權值陣列 * size 陣列大小 * * 返回值: * huffman樹的根節點 */template void huffman::create(t a, int size) } mroot = parent; // 銷毀最小堆 heap->destroy(); delete heap;}
首先通過heap->create(a, size)來建立最小堆。最小堆構造完成之後,進入for迴圈。
每次迴圈時:
(01) 首先,將最小堆中的最小節點拷貝乙份並賦值給left,然後重塑最小堆(將最小節點和後面的節點交換位置,接著將"交換位置後的最小節點"之前的全部元素重新構造成最小堆);在二叉堆中已經介紹過堆,這裡就不再對堆的**進行說明了。(02) 接著,再將最小堆中的最小節點拷貝乙份並將其賦值right,然後再次重塑最小堆;
(03) 然後,新建節點parent,並將它作為left和right的父節點;
(04) 接著,將parent的資料複製給最小堆中的指定節點。
哈夫曼樹與哈夫曼編碼(C 實現)
1 對給定的n個權值構成n棵二叉樹的初始集合f 其中每棵二叉樹ti中只有乙個權值為wi的根結點,它的左右子樹均為空。2 在f中選取兩棵根結點權值最小的樹作為新構造的二叉樹的左右子樹,新二叉樹的根結點的權值為其左右子樹的根結點的權值之和。3 從f中刪除這兩棵樹,並把這棵新的二叉樹同樣以公升序排列加入到...
哈夫曼樹詳解
一 什麼是哈夫曼樹呢?自己的描述 在樹的路徑長度的基礎上引入了帶權路徑長度 weighted path length,wpl 一棵葉子結點帶權值 分支節點不帶權值 的二叉樹叫做擴充二叉樹。帶權值的結點均為葉子結點,不帶權值的均為分支節點 包括根結點 一棵擴充二叉樹 帶權二叉樹 的wpl最小,這麼一棵...
哈夫曼樹詳解
一 哈夫曼樹的定義 1 簡單路徑長度 所謂樹的簡單路徑長度,是指從樹的跟節點到每個節點的路徑長度之和。完全二叉樹是簡單路徑長度更小的二叉樹。2 加權路徑長度 所謂樹的加權路徑長度,是指樹中所以帶權 非0 葉節點的加權路徑長度之和。如下圖所示,不同的樹結構,加權路徑長度也不一樣。3 哈夫曼樹的定義 哈...