玩石頭剪刀布存在什么制勝原理嗎?
這是個很有意思的問題,我特地去拜讀了一下研究報告的原文,這里我給出鏈接,感興趣的朋友可以去看一下。
中國科學院理論物理研究所的文章介紹:http://www.itp.cas.cn/xwzx/kydt/201407/t20140730_4169491.html
報告原文(英文版的):
https://www.nature.com/articles/srep05830
研究報告說了什么?論文首先報告了在浙江大學實驗社會學實驗室進行的跨度近四年的實驗(12.2010—03.2014)。實驗一共招募了浙江大學 360位學生,將他們分成 60 組,每組6 名學生,每一組都玩石頭-剪刀-布的游戲 300 輪,每一輪都是這同樣 6 名學生隨機兩兩配對廝殺以攢取點數。游戲結束后,每名學生根據其贏得的總點數獲得相應的真實報酬。從這些實驗結果,三位作者發現每個學生的游戲策略似乎很符合經典博弈論的納什均衡理論,即石頭、剪刀、布三種動作在每輪被選中的概率大約是三分之一。但是一個有趣的現象是,由 6 名學生組成的群體的行為在統計上表現出偏離完全隨機的定向轉動行為。這一定向轉動行為不同的組內都觀察到了(不同的組有不同的游戲獎勵參數)。這一非平衡集體現象不能由基于完全理性假設的納什均衡策略解釋。
通過對實驗數據進行更細致的分析,三位研究者發現學生在重復玩石頭-剪刀-布游戲時有一些比較顯著的行為統計模式,即如果上一輪的結果是贏,那么下一輪有最高的概率仍然采取上一輪已經采用過的動作(石頭、剪刀、或布);如果上一輪的結果是平,那么下一輪保持同樣動作的概率也較高,但也有較高的概率逆時針改變動作(即從石頭變為布、或從布變為剪刀、或從剪刀變為石頭);但是,如果上一輪的結果是輸,那么下一輪就有最高的概率順時針改變動作(即從石頭變為剪刀、或從剪刀變為布、或者從布變為石頭)。這三位研究者將這樣的統計模式稱為是條件反應模式。
研究者然后基于條件反應模式進行了理論建模,發現只考慮了條件反應模式的理論模型能夠定量地解釋幾乎所有的實驗觀察事實,例如群體層次的定向轉動行為、個體層次的動作選擇慣性效應等等。這項研究就說明,人們看上去非常復雜的個體決策行為和群體動力學行為實際上可以基于很簡單的條件反應模式進行理解。而且理論計算表明,通過優化條件反應模式的決策參數,群體有可能獲得比采用納什均衡策略更高的平均收益,因而實現更高的群體效益。
(摘自中國科學院理論物理研究所的介紹)
不存在制勝原理這個研究中,研究者們尋找的不是怎么樣玩贏“剪刀石頭布”,而是通過人們在石頭剪刀布里的行為來判斷哪一種理論更能預測人類——是傳統的博弈論的納什均衡,還是演化博弈論。
而所謂的“制勝原理”,只是被帶起來的節奏,是輿論所關心的點,而不是研究本身的意愿。
最后,說一點很有意思的內容當年這個報道可是引起了很大的爭論的,因為很多網友覺得,憑經驗就能得出來的東西,還要你大量人力物力財力去研究?三歲小孩子都會的石頭剪刀布,還值得研究?
事實是簡單,但是在事實背后真相的探尋卻不簡單,我們都知道蘋果熟了會落下來,可就是透過這么簡單的常識,牛頓從中發現了萬有引力。囚徒困境,有些人看來就是個互相拆臺的問題,可是在科學家眼里就是博弈論。
(囚徒困境示意圖。圖片來源:Encyclopaedia Britannica)
我特別欣賞當時的一條評論,這里給大家分享一下。
當學者們以科學的態度對待“剪刀石頭布”,而網民們卻是以“剪刀石頭布”的心態對待科學時,到底誰更可笑,又是誰贏了誰呢?