首先,演化博弈論與傳統的博弈理論相比,有乙個更加貼近現實的應用背景:認為現實生活中人不可能達到完全理性,也不要求完全資訊的條件。
一般的演化博弈理論具有如下特徵:它的研究物件是隨著時間變化的某一群體,理論探索的目的是為了理解群體演化的動態過程,並解釋說明為何群體將達到目前的這一狀態以及如何達到。影響群體變化的因素既具有一定的隨機性和擾動現象(突變),又有通過演化過程中的選擇機制而呈現出來的規律性。大部分演化博弈理論的**或解釋能力在於群體的選擇過程,通常群體的選擇過程具有一定的慣性,同時這個過程也潛伏著突變的動力,從而不斷地產生新變種或新特徵。
演化博弈模型有如下幾個特徵:第一,以參與人群體為研究物件,分析動態的演化過程,解釋群體為何達到以及如何達到目前的這一狀態;第二,群體的演化既有選擇過程也有突變過程;第三,經群體選擇下來的行為具有一定的慣性。
選擇是指能夠獲得較高支付的策略在以後將被更多的參與者採用;突變是指部分個體以隨機的方式選擇不同於群體的策略(可能是能夠獲得高支付的策略,也可能是獲得較低支付的策略)。突變其實也是一種選擇,但只有好的策略才能生存下來。突變是一種不斷試錯的過程,也是一種學習與模仿的過程,這個過程是適應性且是不斷改進的。
演化博弈論假設在博弈群體中所有參與主體採取同一種行為策略的 狀態之時,某一主體的行為策略發生了突變,與其他參與主體的策略都不相同。 如果該主體的行為策略帶來的收益相較於其他主體更高,那麼其他參與主體也會 效仿此發生突變的行為主體,採取相類似的行為策略,從而在整個博弈群體中採 取該新策略的個體比例會越來越大,最後博弈中的全部博弈主體都採用了這個新 策略,那麼這個新策略即為該博弈的演化穩定策略(ess)。反之,如果產生突 變的博弈群體其採取新的行為策略並不能帶來更高的收益,那麼突變群體本身就 不會引發博弈群體行為策略的改變,他本身也會恢復到原來的行為策略,此時原 策略就是演化穩定策略。
標準的演化博弈有三種基本假設:①隨著博弈的進行和時間的流逝,收益較 高的行為策略會漸漸取代收益較低的行為策略;②在博弈的過程中存在一些慣性 使得演化博弈過程不可能一蹴而就;③局中人未來的演化策略選擇不受其他局中 人的影響。
演化博弈常常用複製動態方程來描述博弈的過程。複製動態(rd) 是指博弈的局中人能夠在借鑑和學習其他局中人的行為策略基礎之上,改變自身原本的策略,選擇比以前更為有利的策略的過程。它能夠使群體中選擇較優策略的個體數目增多。複製動態是演化博弈能夠進行的前提條件,是演化博弈過程的內生動力。複製動態微分方程一般長這樣:
具體可參考這篇**基於演化博弈論的裝配式建築創新激勵政策研究
基於演化博弈論的裝配式建築創新激勵政策研究
基於演化博弈的智慧型城市資訊保安監管研究
博弈論筆記
不懂得止損 沉沒成本的存在 有乙個明顯的誘餌 通往誘餌之路是單向的,可進不可出 越想掙脫就陷越深 有沉沒成本的地方就會有萬元陷阱。投資已經過半後,如果要改變投資方向或暫停投資都是頗為困難的事情。經濟 理性 動機 挽回損失 非經濟 感性 動機 挽回面子 既然事情已經發生,請坦然接受 目前的一小部分損失...
博弈論學習筆記
eg hdu2149,2156 描述 只有一堆n個石子,每次能取1到m個物品,a先手,問誰能先取完石子 思路 這種問題的關鍵就在於能否取到關鍵點,比如,這裡只能能取到倒數m 2個石子,留下m 1個石子,則後者就必敗。結論 如果初始石子是 m 1 的倍數,則先手必敗,否則先手必勝。eg hdu2177...
博弈論學習筆記
個人實在太懶 所以直接抄啦 點球案例 在一次足球比賽罰點球時,罰球隊員可以選擇l,m,r三種不同射門路徑 門將可以選擇撲向左路或者右路 原則上講他也可以守在右路 lr l4,4 9,9 m6,6 6,6 r9,9 4,4 該錶表示各自的收益,其中,lr對應的9表示當射手射向左路而門將撲向右路時,射手...