time limit: 10 sec memory limit: 512 mb
追逐影子的人,自己就是影子。 ——荷馬
allison 最近迷上了文學。她喜歡在乙個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的《荷馬史詩》。但是由《奧德賽》和《伊利亞特》組成的鴻篇巨制《荷馬史詩》實在是太長了,allison 想通過一種編碼方式使得它變得短一些。
一部《荷馬史詩》中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。allison 想要用 k 進製串 si 來替換第 i 種單詞,使得其滿足如下要求:
對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首。
現在 allison 想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。在確保總長度最小的情況下,allison 還想知道最長的 si 的最短長度是多少?
乙個字串被稱為 k 進製字串,當且僅當它的每個字元是 0 到 k−1 之間(包括 0 和 k−1)的整數。
字串 str1 被稱為字串 str2 的字首,當且僅當:存在 1≤t≤m,使得 str1=str2[1..t]。其中,m 是字串 str2 的長度,str2[1..t] 表示 str2 的前 t 個字元組成的字串。
輸入檔案的第 1 行包含 2 個正整數 n,k,中間用單個空格隔開,表示共有 n 種單詞,需要使用 k 進製字串進行替換。
接下來 n 行,第 i+1 行包含 1 個非負整數 wi,表示第 i 種單詞的出現次數。
輸出檔案包括 2 行。
第 1 行輸出 1 個整數,為《荷馬史詩》經過重新編碼以後的最短長度。
第 2 行輸出 1 個整數,為保證最短總長度的情況下,最長字串 si 的最短長度。
4 2112
2122用 x(k) 表示 x 是以 k 進製表示的字串。
一種最優方案:令 00(2) 替換第 1 種單詞,01(2) 替換第 2 種單詞,10(2) 替換第 3 種單詞,11(2) 替換第 4 種單詞。在這種方案下,編碼以後的最短長度為:
1×2+1×2+2×2+2×2=12
最長字串 si 的長度為 2。
一種非最優方案:令 000(2) 替換第 1 種單詞,001(2) 替換第 2 種單詞,01(2) 替換第 3 種單詞,1(2) 替換第 4 種單詞。在這種方案下,編碼以後的最短長度為:
1×3+1×3+2×2+2×1=12
最長字串 si 的長度為 3。與最優方案相比,文章的長度相同,但是最長字串的長度更長一些。
對於所有資料,保證 2≤n≤100000,2≤k≤9。
選手請注意使用 64 位整數進行輸入輸出、儲存和計算。
題解:似乎這道題是純粹的要求掌握知識點。。。
如果學過哈夫曼樹的話,這就接近一道板子題了。
我們先來科普下哈夫曼樹:
如果我們設點到根節點的邊數×點權為點的帶權路徑長度,一顆樹中每個節點的帶權路徑長度和為樹的帶權路徑長度,
給定n個權值作為n個葉子結點,構造一棵二叉樹,若樹的帶權路徑長度達到最小,稱這樣的二叉樹為最優二叉樹,也稱為哈夫曼樹。
也就是說,哈夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近。
在構造哈夫曼樹時,我們只需要取出權值最小的兩個點,把他們合併起來,權值和作為新的節點的權值,
在最後只剩下乙個節點時我們就得到了這些節點對應的哈夫曼樹。
哈夫曼樹最重要的功能就是字首編碼了!
我們給每個單詞(或者字母)編碼的時候,為了使總長度短一些,可以考慮給每個單詞/字母不等長編碼。
也就是說,單詞中使用頻率高的用短碼,使用頻率低的用長碼,從而優化總長度。
當然,這些編碼也不能引起誤會,也就是說,不能出現某個串是其他某個串的字首。
那麼這時候,我們可將每個單詞的出現頻數作為單詞結點的權值賦予該結點上,
顯然單詞使用次數越小權值越小,權值越小葉子就越靠下,於是頻率小,到根節點距離就長,編碼也就長,同理次數大編碼短,
這樣就保證了此樹的最小帶權路徑長度效果上就是文章的最短長度。
我們再看這道題:
allison 想要用 k 進製串 si 來替換第 i 種單詞,使得其滿足如下要求:顯然,這裡我們就要用哈夫曼樹做乙個編碼即可,但是本題是用k進製編碼:對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首。
現在 allison 想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。
那麼我們只需要把哈夫曼樹由二叉樹變成k叉樹----但是可能節點個數不夠。
我們考慮,一顆滿的k叉哈夫曼樹,節點數可以表示為n*k*(k-1)+1----也就是說,如果n%((k-1)*k)!=1
,我們可以補上幾個權值為0的節點,補到n*k*(k-1)+1個,這樣他們並不會對我們的建樹以及計算產生任何影響(權值為0,計數時也不會計入長度)
最後我們只要輸出整棵樹的帶權路徑長度,以及這棵樹中最深的節點深度-1就行了!
**見下:
1 #include 2 #include 3 #include 4 #include 5using
namespace
std;
6 typedef long
long
ll;7
const
int n=100010;8
int n,k,maxdeep[n<<7
];9 ll sum[n<<7],w[n<<7
];10
struct
point
1114 inline bool
operator
< (const point &b)const
15
16 inline bool
operator > (const point &b)const
17
18};
19 priority_queue, greater>q;
20int
main()
2135 printf("
%lld\n%d
",sum[q.top().id],maxdeep[q.top().id]-1
);36 }
bzoj4198 哈夫曼樹 荷馬史詩
description 追逐影子的人,自己就是影子。荷馬 allison 最近迷上了文學。她喜歡在乙個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的 荷馬史詩 但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,allison 想通過一種編碼方式使得它變得短一些。一部 ...
BZOJ4198荷馬史詩
time limit 10 sec memory limit 512 mb submit 240 solved 134 submit status discuss 追逐影子的人,自己就是影子。荷馬 allison 最近迷上了文學。她喜歡在乙個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的...
k叉哈夫曼樹 bzoj 4198荷馬史詩
k叉哈夫曼樹在acm中的最常用的應用就是求合併n個數最小的代價。哈夫曼樹也可以是k叉的,只是在構造k叉哈夫曼樹時需要先進行一些調整。構造哈夫曼樹的思想是每次選k個權重最小的元素來合成乙個新的元素,該元素權重為k個元素權重之和。但是當k大於2時,按照這個步驟做下去可能到最後剩下的元素少於k個。解決這個...