微軟面試題 關於納什均衡

2021-07-23 14:25:34 字數 1932 閱讀 1764

5個海盜搶到了100顆寶石,每一顆都一樣的大小和價值連城。

他們決定這麼分:

1。抽籤決定自己的號碼(1,2,3,4,5)。

2。首先,由1號提出分配方案,然後大家5人進行表決,當且僅當等於或超過半數的人同意時,按照他的提案進行分配;否則將被扔入大海喂鯊魚。 

3。如果1號死後,再由2號提出分配方案,然後大家4人進行表決,當且僅當等於或超過半數的人同意時,按照他的提案進行分配,否則將被扔入大海喂鯊魚。

4。以次類推。

(注意這個條件:每個海盜都是很聰明的人,都能很理智的判斷得失,從而做出選擇。)

問題:

第乙個海盜提出怎樣的分配方案才能夠使自己的收益最大化?

推理過程是這樣的:

從後向前推,如果1至3號強盜都喂了鯊魚,只剩4號和5號的話,5號一定投反對票讓4號喂鯊魚,以獨吞全部金幣。所以,4號惟有支援3號才能保命。

3號知道這一點,就會提出「100,0,0」的分配方案,對4號、5號一-_-!!不拔而將全部金幣歸為已有,因為他知道4號一無所獲但還是會投贊成票,再加上自己一票,他的方案即可通過。

不過,2號推知3號的方案,就會提出「98,0,1,1」的方案,即放棄3號,而給予4號和5號各一枚金幣。由於該方案對於4號和5號來說比在3號分配時更為有利,他們將支援他而不希望他出局而由3號來分配。這樣,2號將拿走98枚金幣。

同樣,2號的方案也會被1號所洞悉,1號並將提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放棄2號,而給3號一枚金幣,同時給4號(或5號)2枚金幣。由於1號的這一方案對於3號和4號(或5號)來說,相比2號分配時更優,他們將投1號的贊成票,再加上1號自己的票,1號的方案可獲通過,97枚金幣可輕鬆落入囊中。這無疑是1號能夠獲取最大收益的方案了!答案是:1號強盜分給3號1枚金幣,分給4號或5號強盜2枚,自己獨得97枚。分配方案可寫成(97,0,1,2,0)或(97,0,1,0,2)。

「海盜分金」其實是乙個高度簡化和抽象的模型,體現了博弈的思想。在「海盜分金」模型中,任何「分配者」想讓自己的方案獲得通過的關鍵是事先考慮清楚「挑戰者」的分配方案是什麼,並用最小的代價獲取最大收益,拉攏「挑戰者」分配方案中最不得意的人們。企業中的一把手,在搞內部人控制時,經常是拋開二號人物,而與會計和出納們打得火熱,就是因為公司裡的小人物好收買。

1號看起來最有可能喂鯊魚,但他牢牢地把握住先發優勢,結果不但消除了死亡威脅,還收益最大。這不正是全球化過程中先進國家的先發優勢嗎?而5號,看起來最安全,沒有死亡的威脅,甚至還能坐收漁人之利,卻因不得不看別人臉色行事而只能分得一小杯羹。

不過,模型任意改變乙個假設條件,最終結果都不一樣。而現實世界遠比模型複雜。

首先,現實中肯定不會是人人都「絕對理性」。回到「海盜分金」的模型中,只要3號、4號或5號中有乙個人偏離了絕對聰明的假設,海盜1號無論怎麼分都可能會被扔到海浬去了。所以,1號首先要考慮的就是他的海盜兄弟們的聰明和理性究竟靠得住靠不住,否則先分者倒霉。

如果某人偏好看同夥被扔進海浬喂鯊魚。果真如此,1號自以為得意的方案豈不成了自掘墳墓!

再就是俗話所說的「人心隔肚皮」。由於資訊不對稱,謊言和虛假承諾就大有用武之地,而陰謀也會像雜-_-!!般瘋長,並藉機獲益。如果2號對3、4、5號大放煙幕彈,宣稱對於1號所提出任何分配方案,他一定會再多加上乙個金幣給他們。這樣,結果又當如何?

通常,現實中人人都有自認的公平標準,因而時常會嘟嚷:「誰動了我的乳酪?」可以料想,一旦1號所提方案和其所想的不符,就會有人大鬧……當大家都鬧起來的時候,1號能拿著97枚金幣毫髮無損、鎮定自若地走出去嗎?最大的可能就是,海盜們會要求修改規則,然後重新分配。想一想二戰前的希特拉德國吧!

而假如由一次博弈變成重複博弈呢?比如,大家講清楚下次再得100枚金幣時,先由2號海盜來分……然後是3號……這頗有點像美國**選舉,輪流主政。說白了,其實是民主形式下的分贓制。

最可怕的是其他四人形成乙個反1號的大聯盟並制定出新規則:四人平分金幣,將1號扔進大海……這就是阿q式的革命理想:高舉平均主義的旗幟,將富人扔進死亡深淵……

制度規範行為,理性戰勝愚昧

微軟面試題

題目 小明和小強都是張老師的學生,張老師的生日是m月n日,2人都知道張老師的生日是下列10組中的一天,張老師把m值告訴了小明,把n值告訴了小強,張老師問他們知道他的生日是那一天嗎?3月4日 3月5日 3月8日 6月4日 6月7日 9月1日 9月5日 12月1日 12月2日 12月8日 小明說 如果我...

微軟面試題

fly.c4 推薦您必看!六.演算法題 說明 這些題就不是什麼花樣了,考的是你的基礎知識怎麼樣。再聰明而沒有實學的人都將會被這些題所淘汰。1.鍊錶和陣列的區別在 2.編寫實現鍊錶排序的一種演算法。說明為什麼你會選擇用這樣的方法?3.編寫實現陣列排序的一種演算法。說明為什麼你會選擇用這樣的方法?4.請...

微軟面試題

1.燒一根不均勻的繩,從頭燒到尾總共需要1個小時。現在有若干條材質相同的繩子,問如何用燒繩的方法來計時乙個小時十五分鐘呢?答 點燃繩子a的兩端,和繩子b的 一端,當a燒完時,b餘下的可以燒半個小時 這時把b的另一端點燃,並開始計時,等b燒完時可確定15分鐘,然後再點燃繩子c 兩端 燒完總時間為1小時...