**
個人實在太懶 所以直接抄啦~~
點球案例
在一次足球比賽罰點球時,罰球隊員可以選擇l,m,r三種不同射門路徑;門將可以選擇撲向左路或者右路(原則上講他也可以守在右路)。lr
l4,-4
9,-9
m6,-6
6,-6
r9,-9
4,-4
該錶表示各自的收益,其中,lr對應的9表示當射手射向左路而門將撲向右路時,射手有90%的概率進球,-9表示門將有90%的概率丟球(10%概率射偏)。其他收益以此類推。我們假設門將撲向右路的概率是pr,那麼門將撲向左路的概率是pl=1-pr。
那麼,射手
選擇左路的預期收益為 eu1(l,pr) = pl*u1(l,l) + pr*u1(l,l) = (1-pr)*4 + pr*9 = 4 + 5*pr;
選擇中路的預期收益為 eu1(m,pr) = pl*u1(l,l) + pr*u1(l,l) = (1-pr)*6 + pr*6 = 6;
選擇右路的預期收益為 eu1(r,pr) = pl*u1(l,l) + pr*u1(l,l) = (1-pr)*9 + pr*4 = 9 - 5*pr;
結論:定義:參與者i的對策si是對手的策略s-i的最佳對策,當且僅當對於參與者i的所有其他策略si',u1(si,s-i)>=u1(si',s-i)從中路射門都不是乙個最佳策略;不要選擇在任何信念下都不是最佳策略的策略。
商業合作案例
兩個參與者都是公司的股東,他們都持有公司的股份並且平分利潤。
si表示第i**東為公司付出的精力。i=1,2。
總收益為4*(s1 + s2 + b*s1*s2)
所以對於每個參與者,他們能夠獲得的收益是1/2*4*(s1 + s2 + b*s1*s2) = 2*(s1 + s2 + b*s1*s2)
我們現在來考慮參與者1,他的付出是s1^2,s所以他的淨收益為:2*(s1 + s2 + b*s1*s2) - s1^2
為了讓收益最大,對s1求導得出收益導數為0的方程:s1 = 1 + b*s2
同理,對於s2,s2 = 1 + b*s1
我們這裡設b=1/4。s=[1,4]。
這裡看一看到,因為s1的範圍只在1和2之間,所以[0,1]和[3,4]是s1的劣勢策略;這意味著博弈雙方彼此都不想偏離納什均衡點。在納什均衡點處,雙方都採取彼此的最佳對策。同理,[0,1]和[3,4]是s2的劣勢策略。
所以剔除之後剩下了s1∈[1,2],s2∈[1,2]這個區間,我們將其放大四倍,發現了和原來一樣的圖。
然後我們就可以接待進行剔除了。
最後得到的點就是方程組:
s1 = 1 + b*s2
s2 = 1 + b*s1
的解。得出:
s1 = s2 = 1/(b-1)
(1/(b-1), 1/(b-1))這個點稱為納什均衡 nash equilibrium
博弈論學習筆記
eg hdu2149,2156 描述 只有一堆n個石子,每次能取1到m個物品,a先手,問誰能先取完石子 思路 這種問題的關鍵就在於能否取到關鍵點,比如,這裡只能能取到倒數m 2個石子,留下m 1個石子,則後者就必敗。結論 如果初始石子是 m 1 的倍數,則先手必敗,否則先手必勝。eg hdu2177...
學習筆記 博弈論
博弈論的題比較重思路,都比較好寫,所以我打算腦內做題不寫 梳理一下遇到的博弈論題目的思路。題意是給乙個由數字0 9和問號構成的字串,長度為n,n為偶數 需要注意可能沒有問號 b和m兩人輪流用數字替換問號,m先手,若所有問號都被替換後前一半的數字之和等於後一半的數字之和,b勝,否則m 勝。考慮三種情況...
博弈論學習筆記
好久以前不記得在那本初賽資料上看到第一章就是博弈論,看了一頁紙,那時候還不知道有多難,就只是感性地用數學去理解 感覺不難,就沒搞了。考了好幾次博弈論的題,發現毛都不會,又老聽旁邊 mital 和 skounputer 講什麼 sg 函式,心態 於是還是決定自己學一下。蒟蒻決定先把幾個經典的例子學會了...