資料結構實訓哈夫曼樹

2021-10-25 01:32:47 字數 2103 閱讀 7333

哈夫曼編碼和解碼

基本要求:

 輸入為:一段英文或中文的文章(原文)

 對輸入的文章構造哈夫曼樹生成對應的編碼

 輸出為:原文所對應的編碼(譯文)

 根據已經生成的編碼表,輸入任意的譯文可以得到對應的原文

哈夫曼樹的定義:給定n個權值作為n個葉子結點,構造一棵二叉樹,若該樹的帶權路徑長度達到最小,稱這樣的二叉樹為最優二叉樹,也稱為哈夫曼樹(huffman tree)。哈夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近。

首先先構造一棵哈夫曼樹,在構造哈夫曼樹的演算法中,需要選擇根權值最小和次小的樹進行合併

//建立哈夫曼樹編碼表

void huffmantree::

creathuffmantree

(int a,

char b,

int n)

for(i=n; i)//查詢兩個權值最小的樹

void huffmantree::

select

(int

&r1,

int&r2,

int n)

else

if(r2==-1

||nodes[i]

.weight.weight)

//找權值第二小的結點

r2=i;

}```cpp

在這裡插入**片

建立編碼表,根據每一根分支是左還是右,確定相應位編碼是0還是1(此**為左0右1),從葉子節點出發逆向到根結點,將編碼倒轉使之成為正確的編碼

//建立編碼表

void huffmantree::

creathuffmantree

(int a,

char b,

int n)

codes[i]

.code[k]

='\0'

;recall

(codes[i]

.code,k)

;//字串整合,倒轉

cout<.data<<

"的編碼是:"

<.code

void huffmantree::

recall

(char c,

int l)

for(

int i=

0;i<=l/

2;i++

)//交換位置

}

有了哈夫曼樹的編碼,即可進行編碼和解碼

//編碼

void huffmantree::

encode

(char

*c,char

*s,int n)

} c++;}

cout<<

"編碼結果為:"

<}//解碼

void huffmantree::

decode

(char

*s,char

*d,int n)

*d=codes[z]

.data;

//解碼後的結果賦值給指標*d

d++;}

cout<"解碼結果為:"

<}

主要函式就是以上,下面將程式變得完整一點,使其成為可執行的程式

主函式如下:

void

main()

}}

哈夫曼樹是帶權路徑長度最小的樹,所以將一段英文裡出現字元的頻率作為權值來計算

//計算字元出現的頻率

int huffmantree::

sumweight

(char

*pl)}if

(j>i)

sweight++;}

cout<"統計次數:"

int j=

0;j<=i;j++

) cout<<

"字元"

<<<

"的頻率為"

<

}

至此,程式基本已經完善,剩下的函式成員以及結構體可在除錯時自行加上。

資料結構 哈夫曼樹 哈夫曼編碼

哈夫曼樹又稱最優樹 二叉樹 是一類帶權路徑最短的樹。構造這種樹的演算法最早是由哈夫曼 huffman 1952年提出,這種樹在資訊檢索中很有用。結點之間的路徑長度 從乙個結點到另乙個結點之間的分支數目。樹的路徑長度 從樹的根到樹中每乙個結點的路徑長度之和。結點的帶權路徑長度 從該結點到樹根之間的路徑...

哈夫曼編碼 哈夫曼樹 (資料結構)

哈夫曼編碼,又稱霍夫曼編碼,是一種編碼方式,哈夫曼編碼是可變字長編碼 vlc 的一種。huffman於1952年提出一種編碼方法,該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字,有時稱之為最佳編碼,一般就叫做huffman編碼 有時也稱為霍夫曼編碼 include include inc...

資料結構 哈夫曼樹

哈夫曼樹是二叉樹的一種。被稱為最優二叉樹。實際應用中最重要的是帶權路徑長度。樹的路徑長度 樹中每個結點的路徑長度之和。權 附加在樹節點上,表示出現的概率。樹的帶權路徑長度 所有葉子結點帶權長度之和。看例項 的結點路徑長度 從d到 a的路徑,共走了兩條邊,所以為2。樹中的葉子結點有 d,e和 f。結點...