不等長編碼需要解決的兩個問題:
1. 編碼盡可能短
2. 不能有二義性(字首碼特性)
哈夫曼編碼的主要思想是以字元的使用頻率作為權值構建一顆哈夫曼樹,然後利用哈夫曼樹對字元進行編碼。
哈夫曼演算法採取的貪心策略是每次從樹的集合中取出沒有雙親且權值最小的兩顆樹作為左右子樹,構造一棵新樹,新樹的根節點的權值為其左右子樹權值之和,將新樹插入到樹的集合中
public class huffman
}public static void main(string args) ;
double frequency = ;
buildhuffmantree(chars, frequency);
}private static void buildhuffmantree(char chars, double frequency)
});for (int i = 0; i < chars.length; i++)
while (trees.size() >= 2)
show(trees.poll(),new stringbuilder());
}private static void show(treenode node,stringbuilder code)
show(node.left,code);
code.deletecharat(code.length()-1);
show(node.right,code);
code.deletecharat(code.length()-1);
}}c : 0.18 code:00
f : 0.13 code:010
a : 0.05 code:0110
d : 0.07 code:0111
e : 0.25 code:10
b : 0.32 code:11
哈夫曼編碼 哈夫曼樹
1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....
哈夫曼樹 哈夫曼編碼
定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...
哈夫曼編碼 哈夫曼樹
哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...