演算法博弈論筆記 3 梅爾森的引理

2021-10-09 18:51:32 字數 2366 閱讀 5873

因為感覺看英文教材比較不好理解,所以打算把重點記下來。

維氏拍賣作為乙個好的拍賣(awesome auctions),具有3個保證

[強動機保證]dsic (dominant strategy incentive compatible). 即真實的競價是優勢策略,並且永遠不會導致負的效益。

追求dsic的理由有兩個:

投標人只需要很輕易地投出對於他們來說最具有優勢的**;

如果所有投標人都按照優勢策略的**進行投標,那麼我們能夠很自信地**拍賣的結果。

[強效能保證]社會福利最大化。

[計算效能]拍賣能夠在多項式(線性)時間內被計算。

機制設計步驟

首先設想投標人真實地(truthfully)投標,即假設disc成立的情況下,設定乙個能夠保證社會福利最大化計算效能分配原則

由第1步設計出的分配原則,設計乙個滿足dsic支付原則

單一引數環境

在單一引數的環境下陳述梅爾森的引理,假設在這種環境中有n個投標人。每乙個投標人 i

ii都有乙個自己的估價v

iv_i

vi​,x

ix_i

xi​ 表示投標人i

ii 獲得物品的數量。那麼可以得到乙個可行集合x

xx,其中的每乙個元素都是1個n向量(x

1x_1

x1​,x

2x_2

x2​,…,x

nx_n

xn​)。

舉例說明:

分配原則和支付原則

密封式拍賣需要正式定義分配原則支付原則。也就是說,密封式拍賣需要3步完成:

(1)收集bids: b=(

b1,…

,bn)

\bold b=(b_1,\dots,b_n)

b=(b1​

,…,b

n​)

(2)設計分配原則:選擇可行的分配函式x(b

)∈x⊂

rn\bold x(\bold b)\in x \subset r^n

x(b)∈x

⊂rn(3)設計支付原則:選擇可行的支付函式p(b

)∈rn

\bold p(\bold b) \in r^n

p(b)∈r

n有了分配原則和支付原則厚,我們繼續使用乙個擬線性效用模型,在競價的向量b

\bold b

b中得到bidder i

ii的效用函式

u i(

b)=v

i⋅xi

(b)−

pi(b

)u_i(b)=v_i\cdot x_i(\bold b)-p_i(\bold b)

ui​(b)

=vi​

⋅xi​

(b)−

pi​(

b)我們將會將集中關注於滿足pi∈

[0,b

i⋅xi

(b)]

p_i \in [0,b_i\cdot x_i(\bold b)]

pi​∈[0

,bi​

⋅xi​

(b)]

的支付原則。pi(

b)>=0

p_i(\bold b)>=0

pi​(b)

>=0

代表拍賣房不會支付金額給投標人。

p i(

b)<=b

i⋅xi

(b)p_i(\bold b)<=b_i\cdot x_i(\bold b)

pi​(b)

<=b

i​⋅x

i​(b

)確保了支付原則是disc的,也就是說每一位投標人都會真實地進行投標,並且不會有負效益。

梅爾森引理的陳述

梅爾森引理的定義(單一引數)

當且僅當分配原則是單調的時候,分配原則x

xx是可以實現的。

如果分配原則是可以實現的,那麼在密封式拍賣機制(x,

p)(\bold x,\bold p)

(x,p

)中存在乙個唯一的支付原則p

pp是disc的。

滿足2的支付原則負責以下的形式。

博弈論演算法

複習 兩個頂尖聰明的人在玩遊戲,有一堆n個石子,每次每個人能取 1,m 個石子,不能拿的人輸,請問先手與後手誰必敗?結論 通過上面的分析可以得出結論 當n能整除m 1時先手必敗,否則先手必勝。兩個頂尖聰明的人在玩遊戲,有nn堆石子,第ii堆有aiai個,每人每次能從一堆石子中取任意多個石子但不能不取...

博弈論 演算法

博弈論主要研究公式化了的激勵結構間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法。博弈論考慮遊戲中的個體的 行為和實際行為,並研究它們的優化策略。如囚徒困境 鏈結 在演算法競賽 現的博弈論題目通常是icg 公平組合遊戲 的,有如下特徵 1.有兩名選手。2.兩名選手交替操作,每次一步,每步都...

博弈論筆記

不懂得止損 沉沒成本的存在 有乙個明顯的誘餌 通往誘餌之路是單向的,可進不可出 越想掙脫就陷越深 有沉沒成本的地方就會有萬元陷阱。投資已經過半後,如果要改變投資方向或暫停投資都是頗為困難的事情。經濟 理性 動機 挽回損失 非經濟 感性 動機 挽回面子 既然事情已經發生,請坦然接受 目前的一小部分損失...