首先看這個範圍又看到這種題目,就知道是狀壓 dp 跑不了了。
乙個直接的思路是設 \(f_\) 表示當前到第 \(i\) 輪,寶物拿取狀態為 \(s\) 時的得分,但是我們發現這玩意直接推的話會出現一些奇奇怪怪的狀態,主要是這個系統有時扔出來的寶物不能讓你到達 \(s\) 或者是你推著推著 \(s\) 裡面 1 的個數就大於 \(i\) 了。
所以我們需要換個方法,採用逆推的思路。
逆推的話狀態需要改一下:\(f_\) 表示 1 到 \(i - 1\) 輪寶物拿取狀態為 \(s\),第 \(i\) 輪到第 \(k\) 輪的平均得分。
這樣的話由於 \(i+1\) 到 \(k\) 的所有狀態都是合法的,自然 \(i\) 的狀態也是合法的。
於是我們就可以得到如下的轉移方程:
\[f_= \max\,f_+p_j \mid j \in s_1\}
\]其中上式的 \(s_1\) 表示在當前狀態 \(s\) 下,能夠拿取的寶物集合。
於是這道題做完了,答案是 \(f_\)。
code:github codebase-of-plozia p2473 [scoi2008] 獎勵關
洛谷P2473 獎勵關 期望dp
csdn的介面真的是越來越醜了qwq qwq希望可以保留原來的樣式吧,真的不是很喜歡現在的介面了。搞不好到時候又要去註冊或者自己搭建部落格了。有nn 個物品,每乙個時刻隨機生成乙個物品,選擇該物品能獲得aia i 的價值,但是選擇一些物品可能需要先選擇其他物品。求最優策略下期望價值。哇這個人的期望d...
SCOI2008 獎勵關 狀壓 期望dp
傳送門 題意 有n種卡 n 15 k輪遊戲,每輪遊戲可以抽一張卡 每一輪抽出每種卡的概率都是1 n 卡的價值為ai ai可以為負數 並且某些卡需要另一些卡作為引導即只有在得到某些卡的時候才能獲得這些卡,每輪遊戲抽到的卡可以選擇獲得 前提是前驅卡已經獲得 或者不獲得,求選擇最優策略的情況下的總價值的期...
SCOI2008 獎勵關 題解(狀壓DP 期望)
題目鏈結 題目大意 給定 n 個寶物,每次隨機丟擲乙個寶物,獎勵分數為 p i 但如果選這個寶物必須選過它的前置寶物集合。共進行 k 輪問最優策略下的期望。n leq 15,10 6 leq p i leq 10 6 看到資料範圍,狀壓很容易想到。設 f i j 表示到了第 i 輪,寶物取捨狀態為 ...