博弈論學習筆記(一)

2021-08-04 07:28:04 字數 1027 閱讀 1503

開始起步,希望專家朋友們給予指點,共同進步。

博弈論三要素

1參與者:

指的是博弈中做出相關決策的個體,由於存在相互依賴,博 弈中至少有兩個參與者。

2每個參與者的策略集。

策略:指乙個完整的計畫或決策準則,它定義了參與者在不同狀態下所要選擇的行動。並非羅列參與者可選的行動,而 是描述參與者的行動如何依賴他所觀察到的其他參與者已經採取的行動。

3效用函式:

衡量參與者在每一組策略組合下所獲得的收益,參與者總是願 意選擇高收益而不是低收益。

博弈包括兩種型別:合作博弈和非合作博弈。在合作博弈中,參與者會達 成乙個具有約束力的協議,而在非合作博弈中則不能達成這種協議。

合作博弈

合作博弈:在合作博弈中,所有的參與者都關心的是整體的利益,而不是 個人的利益。合作博弈強調的是集體理性,研究的核心問題是參與者如何進行 合作以及如何分配達成合作後所獲得的收益。合作博弈一般需要考慮所有參與 者的資訊。

非合作博弈

每個參與者都只追求自身效益最大 化,而不在乎其他參與者的效能,因此該個體的決定具有競爭性和自私性。非 合作博弈的核心是納什均衡問題,在納什均衡狀態,每個參與者都不能通過單 獨改變其策略而獲得更好的收益。

動態非合作博弈:參與人的行動不僅有先後 次序,而且後行動者能夠獲知先行動者的行為選擇資訊,那麼該博弈稱為動態博弈。

靜態非合作博弈:參與人同時作出了行動選擇,或者雖然參與人是 在不同的時間點作出的策略選擇,但每個參與人都不知道其他人具體採取了什 麼行動,那麼該博弈就可視為靜態博弈。

完全資訊博弈:如果每個參與人對其他參與人的特徵、策略和 效用函式等資訊都完全了解,該博弈就是完全資訊博弈

不完全資訊博弈:參與人並不完全清楚有關博弈的一些資訊

純策略是最基本的策略,指參與者在乙個給定的資訊條件下只能有 一種行動選擇。

如果參與者在給定資訊的條件下以某種概率分布隨機地選擇行動集合 中的行動, 則稱之為混合策略

si 表示某個人i的策略空間 si表示某個人具體的某個策略。 si屬於si。

博弈論學習筆記

eg hdu2149,2156 描述 只有一堆n個石子,每次能取1到m個物品,a先手,問誰能先取完石子 思路 這種問題的關鍵就在於能否取到關鍵點,比如,這裡只能能取到倒數m 2個石子,留下m 1個石子,則後者就必敗。結論 如果初始石子是 m 1 的倍數,則先手必敗,否則先手必勝。eg hdu2177...

博弈論學習筆記

個人實在太懶 所以直接抄啦 點球案例 在一次足球比賽罰點球時,罰球隊員可以選擇l,m,r三種不同射門路徑 門將可以選擇撲向左路或者右路 原則上講他也可以守在右路 lr l4,4 9,9 m6,6 6,6 r9,9 4,4 該錶表示各自的收益,其中,lr對應的9表示當射手射向左路而門將撲向右路時,射手...

學習筆記 博弈論

博弈論的題比較重思路,都比較好寫,所以我打算腦內做題不寫 梳理一下遇到的博弈論題目的思路。題意是給乙個由數字0 9和問號構成的字串,長度為n,n為偶數 需要注意可能沒有問號 b和m兩人輪流用數字替換問號,m先手,若所有問號都被替換後前一半的數字之和等於後一半的數字之和,b勝,否則m 勝。考慮三種情況...