哈夫曼樹又稱最優二叉樹,是一種帶權路徑長度最短的二叉樹。
結點的權值:
將樹中結點賦給乙個含有某種含義的數值。記為:wi(i=1,2,...n)
路徑長度:
等於路徑上的結點數減1。
結點的帶權路徑長度:
從根結點到該結點的路徑長度與該結點的權值的乘積。記為:li(i=1,2,...n)。
樹的帶權路徑長度:
樹中所有葉子結點的帶權路徑長度之和
記為wpl
= (w1l1+w2l2+w3l3+...+wnln),
如果讓這n個結點,構成一棵有n個葉結點的二叉樹,可以證明哈夫曼樹的wpl是最小的。
哈夫曼樹也是效率最高的判別樹。( 判斷樹:用於描述分類的判斷樹)
注意:
滿二叉樹不一定是哈夫曼樹;
哈夫曼樹中權值越大的葉子離根越近
具有相同帶權結點的哈夫曼樹不惟一
構造哈夫曼口訣:
構造森林全是根,
先用兩小造新樹,
刪除兩小添新人,
重複2,3剩單根
具體來說就是:
根據給定的n個權值構成二叉樹集合f=,其中每棵二叉樹ti中只有乙個帶權為wi的根結點,其左右子樹為空.
在f中選取兩棵根結點權值最小的樹作為左右子樹構造一棵新的二叉樹,且置新的二叉樹的根結點的權值為左右子樹根結點的權值之和.
在f中刪除這兩棵樹,同時將新的二叉樹加入森林中.
重複2、3,直到f只含有一棵樹為止.(得到哈夫曼樹)
偽**:
將n個結點放入集合s
while (s中的結點數 > 1)
return 集合s剩下的結點 // 剩下的結點就是根結點
借助優先佇列實現**:
#include using namespace std;
struct huffman
;struct cmp
};int main()
huffman *p;
while (q.size() > 1)
pre(f);
return 0;
}
編碼規則:從根節點到每乙個葉子節點的路徑上,左分支記為0,右分支記為1,將這些0與1連起來即為葉子節點的哈夫曼編碼。如下圖:
哈夫曼編碼是最優字首碼
字首編碼:
要求任一字元的編碼都不能是另一字元編碼的字首。
為什麼哈夫曼編碼是最優字首碼?
code 變數的初始值是空字串,採用二叉樹後續遍歷,如果是非葉子結點,
存在左子樹就將code加"0",存在右子樹就將code加"1",繼續遞迴呼叫;
如果是葉子結點,就記錄到鍵值對(map)裡。
*/void huffman_code(huffman* h, string code, map& map_huff)
}7-3 修理牧場 (25 分)
哈夫曼編碼 哈夫曼樹
1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....
哈夫曼樹 哈夫曼編碼
定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...
哈夫曼編碼 哈夫曼樹
哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...