根據哈夫曼樹可以解決報文編碼問題。假設需要對乙個字串如「abcdabcaba」進行編碼,將它轉化為唯一的二進位製碼,但要求轉換出來的二進位製碼長度最小。
假設每個字元在字串中出現的頻率為w ,其編碼長度為l ,編碼字元有n 個,則編碼後二進位製碼額總長度為w1l1 + w1l2 + w3l3 + …… + wnln,這正好符合哈夫曼樹的處理原則,因此可以採用哈夫曼樹的原理構造二進位製碼,並使電文總長最短。
對於「abcdabcaba」字串,總共只有a,b,c,d四個字元,他們出現的次數分別為4,3,2,1次——這相當於他們的權值。於是,將a、b、c、d四個字元出現次數為權值構造哈夫曼樹,得到如下圖11.19所示。
從哈夫曼樹的根節點開始,對左子樹分配**「0」,對右子樹分配**「1」,一直到達葉子節點。然後,將從樹根每條路徑到達葉子節點的**排列起來,,邊得到了每個葉子節點的哈夫曼碼。圖11.20顯示了對a、b、c、d四個字元編碼得到的哈夫曼編碼。
* ( ) ( )
* ││ 0 ││ 1
* (a)───┘└───( ) (a)───┘└───( )
* ││ 0 0 ││ 1
* (b)───┘└───( ) (b)───┘└───( )
* ││ 10 0 ││ 1
* (c)───┘└───(d) (c)───┘└───(d)
* 110 111
* 圖11.19 哈夫曼樹 圖11.20 哈夫曼編碼
從上面的介紹可以看出,a 的哈弗曼編碼為0,b 的哈夫曼編碼為 10,c 的哈夫曼編碼為 110,d 的哈夫曼編碼為111。然後將」abcdabcaba」這個字串轉換為對應的二進位制編碼0101101110101100100,長度僅為19.這就是該字串的最短二進位制編碼,也被稱為哈夫曼編碼。
根據上面介紹的規律不難發現,哈夫曼編碼有乙個規律:假設有n個葉子節點需要編碼,最終得到的哈夫曼樹一定有n層,哈夫曼編碼得到的二進位製碼的最大長度為n - 1。
哈夫曼編碼 哈夫曼樹
1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....
哈夫曼樹 哈夫曼編碼
定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...
哈夫曼編碼 哈夫曼樹
哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...