problem description
字元的編碼方式有多種,除了大家熟悉的ascii
編碼,哈夫曼編碼
(huffman coding)
也是一種編碼方式,它是可變字長編碼。該方法完全依據字元出現概率來構造出平均長度最短的編碼,稱之為最優編碼。哈夫曼編碼常被用於資料檔案壓縮中,其壓縮率通常在
20%~
90%之間。你的任務是對從鍵盤輸入的乙個字串求出它的
ascii
編碼長度和哈夫曼編碼長度的比值。
input
輸入資料有多組,每組資料一行,表示要編碼的字串。
output
對應字元的
ascii
編碼長度la,
huffman
編碼長度lh和
la/lh的值(
保留一位小數
),資料之間以空格間隔。
example input
aaaaabcdthe_cat_in_the_hat
example output
64 13 4.9144 51 2.8
hint
#include #include #include #include using namespace std;
int main()
; priority_queue < int,vector,greater> q;//現在對這個優先佇列還不是很了解
for(int i=0;imax)//判斷出現的最大值為多少,為下面的進佇列做工作
max=ch[i];
}for(int j=0;j<=max;++j)//還有這一塊,這種操作這兒有點浪費時間
if(ans[j])//不為0的時候
q.push(ans[j]);
int sum=0;
while(!q.empty())
}printf("%d %d %.1f\n",strlen(ch)*8,sum,strlen(ch)*8.0/sum);
}}
哈夫曼編碼 哈夫曼樹
1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....
哈夫曼樹 哈夫曼編碼
定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...
哈夫曼編碼 哈夫曼樹
哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...