但是由《奧德賽》和《伊利亞特》組成的鴻篇巨制《荷馬史詩》實在是太長了,達達想通過一種編碼方式使得它變得短一些。
一部《荷馬史詩》中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。
達達想要用k 進製串 si 來替換第 i 種單詞,使得其滿足如下要求:
對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首。
現在達達想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。
在確保總長度最小的情況下,達達還想知道最長的 si 的最短長度是多少?
乙個字串被稱為 k 進製字串,當且僅當它的每個字元是 0 到 k−1 之間(包括 0 和 k−1)的整數。
字串 str1 被稱為字串 str2 的字首,當且僅當:存在 1≤t≤m,使得 str1=str2[1…t]。
其中,m 是字串 str2 的長度,str2[1…t] 表示 str2 的前 t 個字元組成的字串。
輸入檔案的第 1 行包含 2 個正整數 n,k,中間用單個空格隔開,表示共有 n 種單詞,需要使用 k 進製字串進行替換。
第2~n+1 行:第 i+1 行包含 1 個非負整數 wi,表示第 i 種單詞的出現次數。
輸出檔案包括 2 行。
第 1 行輸出 1 個整數,為《荷馬史詩》經過重新編碼以後的最短長度。
第 2 行輸出 1 個整數,為保證最短總長度的情況下,最長字串 si 的最短長度。
2≤n≤100000
2≤k≤9
題目巨長,總結一下就是我們要將《荷馬史詩》中的單詞重新編碼,已知單詞種類數和出現的次數(因為要重新編碼所以不在意原長度),將每乙個單詞重新編碼成乙個k進製數,然後求編碼後最短長度,這就類似huffman編碼。
因為是k進製數,所以每一位上最多編碼k個單詞(例如3進製可以用0、1、2表示),這樣就是個k叉huffman樹(即一次合併k個值),又因為存在n%k!=0的情況,這種會導致最下層合併的節點多,上層合併的節點少而導致和增大,所以我們可以進行補零操作。
然後考慮最長字串的最短長度,因為用了huffman樹,所以我們的最長字串一般是最小的,但由於存在權值相同的點深度不同的情況,所以在這種情況下優先合併深度低的點。
#include
#include
#include
#include
#include
#include
#define ll long long
using
namespace std;
pairint>t;
priority_queueint>
,vectorint>
>
,greaterint>
>
>q;
ll ans=
0,x;
intmain()
);}while
((n-1)
%(k-1)
) q.
push()
,n++
;while
(q.size()
>1)
ans+
=sum;
//printf("%lld\n",ans);
q.push()
;}printf
("%lld\n%d\n"
,ans,q.
top(
).second)
;return0;
}
ACWING149 荷馬史詩(多叉哈夫曼樹)
追逐影子的人,自己就是影子。荷馬 達達最近迷上了文學。但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,達達想通過一種編碼方式使得它變得短一些。一部 荷馬史詩 中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。達達想要用 k 進製串 si ...
Acwing 149 荷馬史詩 K叉堆
追逐影子的人,自己就是影子。荷馬 達達最近迷上了文學。但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,達達想通過一種編碼方式使得它變得短一些。一部 荷馬史詩 中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。達達想要用 k 進製串 si ...
荷馬史詩 k叉哈夫曼樹
題目描述 追逐影子的人,自己就是影子。荷馬 達達最近迷上了文學。但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,達達想通過一種編碼方式使得它變得短一些。一部 荷馬史詩 中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wiwi。達達想要用 k ...