哈夫曼編碼和解碼
基本要求:
輸入為:一段英文或中文的文章(原文)
對輸入的文章構造哈夫曼樹生成對應的編碼
輸出為:原文所對應的編碼(譯文)
根據已經生成的編碼表,輸入任意的譯文可以得到對應的原文
哈夫曼樹的定義:給定n個權值作為n個葉子結點,構造一棵二叉樹,若該樹的帶權路徑長度達到最小,稱這樣的二叉樹為最優二叉樹,也稱為哈夫曼樹(huffman tree)。哈夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近。
首先先構造一棵哈夫曼樹,在構造哈夫曼樹的演算法中,需要選擇根權值最小和次小的樹進行合併
//建立哈夫曼樹編碼表
void huffmantree::
creathuffmantree
(int a,
char b,
int n)
for(i=n; i)//查詢兩個權值最小的樹
void huffmantree::
select
(int
&r1,
int&r2,
int n)
else
if(r2==-1
||nodes[i]
.weight.weight)
//找權值第二小的結點
r2=i;
}```cpp
在這裡插入**片
建立編碼表,根據每一根分支是左還是右,確定相應位編碼是0還是1(此**為左0右1),從葉子節點出發逆向到根結點,將編碼倒轉使之成為正確的編碼
//建立編碼表
void huffmantree::
creathuffmantree
(int a,
char b,
int n)
codes[i]
.code[k]
='\0'
;recall
(codes[i]
.code,k)
;//字串整合,倒轉
cout<.data<<
"的編碼是:"
<.code/倒轉字串
void huffmantree::
recall
(char c,
int l)
for(
int i=
0;i<=l/
2;i++
)//交換位置
}
有了哈夫曼樹的編碼,即可進行編碼和解碼
//編碼
void huffmantree::
encode
(char
*c,char
*s,int n)
} c++;}
cout<<
"編碼結果為:"
<}//解碼
void huffmantree::
decode
(char
*s,char
*d,int n)
*d=codes[z]
.data;
//解碼後的結果賦值給指標*d
d++;}
cout<"解碼結果為:"
<}
主要函式就是以上,下面將程式變得完整一點,使其成為可執行的程式
主函式如下:
void
main()
}}
哈夫曼樹是帶權路徑長度最小的樹,所以將一段英文裡出現字元的頻率作為權值來計算
//計算字元出現的頻率
int huffmantree::
sumweight
(char
*pl)}if
(j>i)
sweight++;}
cout<"統計次數:"
int j=
0;j<=i;j++
) cout<<
"字元"
<<<
"的頻率為"
<
}
至此,程式基本已經完善,剩下的函式成員以及結構體可在除錯時自行加上。 資料結構 哈夫曼樹 哈夫曼編碼
哈夫曼樹又稱最優樹 二叉樹 是一類帶權路徑最短的樹。構造這種樹的演算法最早是由哈夫曼 huffman 1952年提出,這種樹在資訊檢索中很有用。結點之間的路徑長度 從乙個結點到另乙個結點之間的分支數目。樹的路徑長度 從樹的根到樹中每乙個結點的路徑長度之和。結點的帶權路徑長度 從該結點到樹根之間的路徑...
哈夫曼編碼 哈夫曼樹 (資料結構)
哈夫曼編碼,又稱霍夫曼編碼,是一種編碼方式,哈夫曼編碼是可變字長編碼 vlc 的一種。huffman於1952年提出一種編碼方法,該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字,有時稱之為最佳編碼,一般就叫做huffman編碼 有時也稱為霍夫曼編碼 include include inc...
資料結構 哈夫曼樹
哈夫曼樹是二叉樹的一種。被稱為最優二叉樹。實際應用中最重要的是帶權路徑長度。樹的路徑長度 樹中每個結點的路徑長度之和。權 附加在樹節點上,表示出現的概率。樹的帶權路徑長度 所有葉子結點帶權長度之和。看例項 的結點路徑長度 從d到 a的路徑,共走了兩條邊,所以為2。樹中的葉子結點有 d,e和 f。結點...