什麼是哈夫曼樹?
先來看哈夫曼樹的定義:
哈夫曼樹(huffman tree)是在葉子結點和權重確定的情況下,帶權路徑長度最小的二叉樹,也被稱為最優二叉樹。
看到這個定義我是一臉懵逼的,什麼葉子節點和權重還好,那麼路徑是指什麼呢,乙個節點到另乙個節點之間的途徑?而且帶權路徑長度又是指什麼呢?
什麼是路徑?
在一棵樹中,從乙個結點到另乙個結點所經過的所有結點,被我們稱為兩個結點之間的路徑。
上面的二叉樹當中,從根結點a到葉子結點h的路徑,就是a,b,d,h。
所以路徑長度就是3,也就是a=>b=>d=>h。
什麼是結點的帶權路徑長度?
結點的帶權路徑長度是指:該結點權重的乘積 * 樹的根結點到該結點的路徑長度。
也就是 1x3=3。
那麼樹的帶權路徑長度就是:所有葉子結點的帶權路徑長度之和
也就是 1x3+2x3+3x2+4x2+5x2=33
哈夫曼樹的構造
假設有5個葉子結點,權重依次是1,2,3,4,5,如何構建一顆哈夫曼樹,也就是帶權路徑長度最小的樹呢?
偽**實現:
看到上面所說的每次把權值最小的兩個節點合併,是不是瞬間就想到了最小堆呢,我們把權值存放在最小堆裡,每次取根節點就可以了。這裡直接放截圖
哈夫曼編碼其實就是哈夫曼樹的一種應用
他是一種無字首編碼。解碼時不會混淆。其主要應用在資料壓縮,加密解密等場合
哈夫曼編碼 哈夫曼樹
1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....
哈夫曼樹 哈夫曼編碼
定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...
哈夫曼編碼 哈夫曼樹
哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...