接著上節課講到的納什均衡,這節課一直圍繞這一點展開,其實這也是整個課程的重點。
首先,乙個很簡單的雙人博弈的例子,各自的收益如下:
p1\p2lc
ru0,44,0
5,3m
4,00,4
5,3d
3,53,5
6,6從表中我們可以看到當p2選擇l 時,p1最好的對策是br1(l) = m (收益為4),同理,br1(c) = u,br1(r) = d(標紅部分);br2(u) = l,br2(m) = c,br2(d) = r(標藍部分)。
如果1知道2選擇l,則他會選擇m,而若2知道1選擇m,則他會選擇c,若1知道2選擇c,則他又會選擇u,若2知道1選擇u,則他又會選擇l,如此一來這種競爭就成了死迴圈,而在點(d, r)處則不一樣,一旦1選擇d,則2最好的對策就是r,而當2選擇r時,1最好的對策還是d,因此他們兩人會在此點達到納什均衡,即他們都會滿足於該點(self-fulfilling belief or no regrets)。
然後,老師又舉了乙個類似的例子,只是稍微換了換上表中兩個參與者的收益,我們會發現有時候當1採取某種策略時,2最佳的應對策略不止乙個,即可能存在兩個或者多個策略都是最佳策略。至此納什均衡都不存在什麼問題,可是他又列舉了乙個非常簡單的例子,發現其中有兩個納什均衡點,下圖中的(u, l)和(d, r),雖然兩個都是納什均衡點,但是很顯然選擇(u, l)的話,兩個人的收益都可以達到最大,大家可能都會毫不猶豫地選擇該點。
1\2lru
1,10,0
d0,0
0,0
下面就是乙個比較有意思的投資小遊戲(investment game)了,題目大意是現在大家有乙個投資物件,你有兩個策略:1、不投資(既沒有收益也沒有損失);2、投資10美元(當參與遊戲的所有人中投資的同學超過90%,則選擇投資的同學可以獲得5美元的收益,否則,損失10美元)。
第一次全班對是否投資進行投票,結果大約為1:1,即有一半的人將損失掉10美元。
如果再進行一次該遊戲,選擇投資的人會更少,約10%,繼續下去的話,第三次遊戲只有乙個搗蛋的同學依然選擇投資。
為什麼會出現這種情況呢?老師開始和大家討論,對大家的選擇原因進行訪談。後來提到了該遊戲其實也有兩個納什均衡(至於該怎麼找納什均衡點,對於這個例子估計只能用guess and check了),如果大家都投資的話,那麼大家將都獲得5美元的收益,這是乙個均衡點;而若大家都不投資的話,所有人都既沒有收益也沒有損失,這是另外乙個均衡點。很明顯前乙個均衡點更好,可是為什麼經過三次遊戲之後大家都趨向後者呢?
這裡老師又和同學們一起列舉了很多類似的社會問題,最後得到的結論是經過博弈後大家的選擇會自然地趨向於乙個均衡點,但是對於這種存在兩個均衡點的情況,往往會趨向於劣勢均衡而非優勢。不同的初始結果可能會得到不同的的均衡點,例如這個小遊戲,如果一開始就有超過90%的人選擇投資,再一次遊戲的時候那剩餘的10%肯定會也選擇投資。
很多類似的問題都說明往往博弈結果會自然地趨向劣勢均衡,是不是有點悲觀呢!?好在老師又舉了《美麗人生》中銀行擠兌的例子,幸運的是電影中銀行最終並沒有倒閉,因為jimmy stewart站出來做了個演講,引導大家都朝著優勢均衡發展。經過此番講解,老師也請了一位班上的同學說服大家選擇投資,結果在第四次進行該遊戲的時候,幾乎所有人都選擇了投資!
這節課的基本內容就是這樣了,期間其實還提到了兩點,在這裡稍微列舉一下:
1. 納什均衡與劣勢策略有什麼關係?劣勢策略一定不能成為納什均衡嗎?因為納什均衡是兩條最優應對策略的交點,即納什均衡是所有參與者的最優應對策略,該點不可能是嚴格劣勢策略或者非最優應對策略。
2. 如果像投資遊戲中最後的引導那樣去處理,囚徒困境最終的結果會改變嗎?不會,跟上一點一樣,囚徒困境中選擇不認罪的策略是嚴格劣勢的。
Yale開放課程博弈論7
這節課介紹伯川德競爭 bertrandcompetition 與上節課古諾競爭的例子類似,這裡依然是兩家公司生產同一產品,相互競爭市場使得自身利益最大化,但是不同的是每家公司的策略不是生產產品的產量,而是產品的定價p1和p2。市場對公司1產品的需求q1與兩家公司的 有關 若p12,則q1 1 p1 ...
Yale開放課程博弈論13
貫序博弈,道德風險 獎勵和飢餓的獅子 與之前的博弈遊戲都不同的是,這節課要講的借方與貸方的博弈是 貫序博弈 sequential move game 不同於之前的是,這裡是行為有順序的博弈,關鍵是在博弈中參與者2在做決定之前可以看到參與者1的決定,而且參與者1知道這種情況。我們對這種博弈的分析方式也...
博弈論 Nim博弈
1.nim博弈的起源很早,至於歷史我們就不再說了,直接說它的使用場景。1 依舊是兩個人博弈,但是物品時n堆,每一堆有ai個。2 每個人可以挑選一堆取走若干個,但是不能不取。3 最先取完所有物品的人獲勝。4 結論 所以堆的物品的數量異或起來是0,先手必敗。2.乙個nim博弈的例項 nim博弈。乍一看這...