系列專題:《思維方式大變革:三天讀懂博弈學(xué)》
我們用收益矩陣分析囚徒困境的情況(如下表): 埃爾 供認(rèn) 不供認(rèn)

鮑伯 供認(rèn) 10年,10年 0年,20年 不供認(rèn) 20年,0年 1年,1年 收益矩陣可以這樣解釋:囚犯的戰(zhàn)略是供認(rèn)或不供認(rèn),每個囚犯選擇其中一種戰(zhàn)略。豎列代表埃爾的戰(zhàn)略,橫行代表鮑勃的戰(zhàn)略。矩陣中的每組數(shù)字是兩個囚犯選擇不同戰(zhàn)略得到的相應(yīng)結(jié)果,逗號左邊的數(shù)字為鮑勃的收益,右邊數(shù)字為埃爾的收益。以第一列為例,若兩囚犯都認(rèn)罪,都被判入獄10年;若埃爾認(rèn)罪,鮑勃不認(rèn)罪,鮑勃入獄20年,埃爾獲釋。 那么,到底應(yīng)該如何解決這一博弈問題呢?如果二人都想入獄時間最短,什么樣的戰(zhàn)略才是理性的呢?埃爾可能作如下思考:"有兩種可能性會發(fā)生:鮑勃認(rèn)罪或保持沉默。假定鮑勃認(rèn)罪,則我不認(rèn)罪將入獄20年,認(rèn)罪將入獄10年,所以該情況下最佳的選擇是認(rèn)罪。相反,假定鮑勃不認(rèn)罪,則我不認(rèn)罪將入獄1年,認(rèn)罪將獲得自由,認(rèn)罪還是最佳選擇??傊?,我應(yīng)該認(rèn)罪。" ⊙托馬斯·謝林的博弈收益矩陣 托馬斯·謝林教授對博弈論的重大貢獻之一就是首先用矩陣形式的表格表示兩個參與者的博弈所得。謝林教授曾經(jīng)說過:"假如真有人問我有沒有對博弈論做出一點貢獻,我會回答有的。若問是什么,我會說我發(fā)明了一個矩陣反映雙方得失的做法……我不認(rèn)為這個發(fā)明可以申請專利,所以我免費贈送,不過除了我的學(xué)生,幾乎沒有人愿意利用這個便利。現(xiàn)在,我也供給各位免費使用我發(fā)明的矩陣。" 上文中我們所用的用來表示囚徒困境的矩陣,就是謝林教授"免費"提供給我們的。 同樣,鮑勃也將按照相同的思維確定自己的行為選擇,其結(jié)果是兩人都認(rèn)罪,被判入獄10年。然而,如果二人非理性行事,保持沉默,每人只會入獄1年。 由此可見,對于鮑伯來說,無論埃爾采取什么策略,他坦白總是對自己有利的,兩相比較,坦白是他的優(yōu)勢策略;對于埃爾同樣如此。因此,在這個博弈中,坦白是雙方的優(yōu)勢策略,那么,抵賴就是劣勢策略。 實際上,囚徒困境正是個人理性沖突與集體理性沖突的經(jīng)典情形。正因為在囚徒困境中,每個人都根據(jù)自己的利益做出決策,但最后的結(jié)果卻是誰也撈不到好處。這種情形在生活中也會遇到,比如排隊購物時,如果大家都在排隊而只有一個人擠上前去插隊,他將得到好處;可是如果大家都蜂擁而上,將會出現(xiàn)混亂無序的局面,此時你只能跟著大家一起擠才有可能盡快買到你想要的東西,否則你將成為最后一個--也是最吃虧的一個。
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/9101032201/301048.html
愛華網(wǎng)



