在一棵二叉樹中,
由根節點到某個節點所經過的分支序列叫做由根節點到這個節點的路徑。
由根節點到某個節點所經過的分支數稱為由根節點到該節點的路徑長度。
由根節點到所有葉子節點的路徑長度之和稱為該二叉樹的路徑長度。
如果二叉樹中每乙個葉節點都帶有某一確定值,可以將二叉樹的路徑長度的概念推廣。
設一棵具有n個帶權值葉節點的二叉樹,那麼從根節點到各個葉節點的路徑長度與對應葉節點權值的乘積之和叫做二叉樹的帶權路徑長度。把其中具有最小帶權路徑長度的二叉樹稱為最優二叉樹,也稱為哈夫曼樹。
根據定義,要使一棵二叉樹的帶權路徑長度最小,必須使權值越大的葉子節點越靠近根節點,權值越小的節點越遠離根節點。
由給定的n個權值構造n棵只有乙個根節點(亦為葉節點)的二叉樹,從而得到乙個森林f=。
從f中選取兩棵根節點的權值最小的二叉樹ti,tj,以ti和tj作為左,右子樹構造一棵新的二叉樹tk(左子樹的權值比右子樹小)。置新的二叉樹tk的根節點的權值為其左右子樹上根節點的權值之和。
在f中刪去ti,tj,並把新的二叉樹tk加入f。
重複2和3的步驟,直到f中僅剩下一棵樹為止。
可以利用哈夫曼樹構造出使電文**總長最短的方案。具體做法如下:
設需要編碼的字符集合為,它們在電文**現的次數或頻率集合為。以c1,c2,…,cn作為葉子節點,w1,w2,…,wn作為它們的權值,構造一棵哈夫曼樹,規定哈夫曼樹中的左分支代表0,右分支代表1,則從根節點到每個葉子節點所經過的路徑分支組成的0或1序列作為該葉子節點對應字元的編碼,稱為哈夫曼編碼。哈夫曼是一種字首編碼,解碼時不會混淆。字首碼要求任一字元的編碼均非其他字元編碼的字首。如果不是字首編碼,無法獲得唯一的解碼。
哈夫曼編碼 哈夫曼樹
1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....
哈夫曼樹 哈夫曼編碼
定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...
哈夫曼編碼 哈夫曼樹
哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...