發(fā)布時間:2022年04月15日 04:28:34分享人:風(fēng)從天堂來來源:互聯(lián)網(wǎng)18

約翰·納什1948年作為年輕數(shù)學(xué)博士生進(jìn)入普林斯頓大學(xué)。其研究成果見于題為《非合作博弈》(19————50)的博士論文。該博士論文導(dǎo)致了《n人博弈中的均衡點》(1950)和題為《非合作博弈》(1951)兩篇論文的發(fā)表。納什在上述論文中,介紹了合作博弈與非合作博弈的區(qū)別。他對非合作博弈的最重要貢獻(xiàn)是闡明了包含任意人數(shù)局中人和任意偏好的一種通用解概念,也就是不限于兩人零和博弈。該解概念后來被稱為納什均衡。
定義
假設(shè)有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的納什均衡
最優(yōu)策略(個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個策略組合(StrategyProfile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質(zhì)上說,是一種非合作博弈狀態(tài)?! 〖{什均衡達(dá)成時,并不意味著博弈雙方都處于不動的狀態(tài),在順序博弈中這個均衡是在博弈者連續(xù)的動作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個整體的最優(yōu)狀態(tài),以下的囚徒困境就是一個例子。
標(biāo)準(zhǔn)定義
納什均衡的定義:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各個博弈方的各一個策略組成的某個策論組合(s1*,…,sn*)中,任一博弈方i的策論si*,都是對其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)對任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個納什均衡。
納什均衡經(jīng)典案例:囚徒困境
?。?950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時,講到兩個囚犯的故事。) 假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證納什均衡
據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。 囚徒困境博弈| A╲B | 坦白 | 抵賴 |
| 坦白 | -8,-8 | 0,-10 |
| 抵賴 | -10,0 | -1,-1 |
關(guān)于案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當(dāng)·斯密的理論,假設(shè)每個人都是“理性的經(jīng)濟(jì)人”,都會從利己的目的出發(fā)進(jìn)行選擇。這兩個人都會有這樣一個盤算過程:假如他坦白,我抵賴,得坐10年監(jiān)獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結(jié)果都被判8年刑期?! 』诮?jīng)濟(jì)學(xué)中Rationalagent的前提假設(shè),兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被釋放就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場經(jīng)濟(jì)中,每一個人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。
另一個簡單的例子
你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。”那么該不該和這位姑娘玩這個游戲呢?這基本是廢話,當(dāng)然該。問題是,這個游戲公平嗎? 每一種游戲依具其規(guī)則的不同會存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個游戲中,便應(yīng)該采用混合策略納什均衡?! ?table width="99%">| nm | 美女出正面 | 美女出反面 |
| 你出正面 | +3,-3 | -2,+2 |
| 你出反面 | -2,+2 | +1,-1 |
假設(shè)我們出正面的概率是x,反面的概率是1-x。為了使利益最大化,應(yīng)該在對手出正面或反面的時候我們的收益都相等,不然對手總是可以改變正反面出現(xiàn)的概率讓我們的總收入減少,由此列出方程就是 3x + (-2)*(1-x)=(-2) * x + 1*( 1-x ) 解方程得x=3/8,也就是說平均每八次出示3次正面,5次反面是我們的最優(yōu)策略。而將x= 3/8代入到收益表達(dá)式 3*x +(-2)*(1-x) 中就可得到每次的期望收入,計算結(jié)果是 -1/8元?! ⊥瑯?,設(shè)美女出正面的概率是y,反面的概率是1-y,列方程 -3y + 2( 1-y )= 2y + (-1) * ( 1-y ) 解得y也等于3/8,而美女每次的期望收益則是 2(1-y)- 3y =1/8元。這告訴我們,在雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元?! ∑鋵嵵灰琅扇×?3/8,5/8)這個方案,不論你再采用什么方案,都是不能改變局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略無非只是上面兩種策略的線性組合,所以期望還是-1/8元。但是當(dāng)你也采用最佳策略時,至少可以保證自己輸?shù)米钌佟7駝t,你肯定就會被美女采用的策略針對,從而賠掉更多。
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/25101015/256083.html
更多閱讀

點擊查看>>>約迪馬什(Jodie Marsh)爆乳呼之欲出【全集】

11月22日是斯嘉麗·約翰遜的生日,而今年恰好是她的30歲生日。一轉(zhuǎn)眼,她從當(dāng)年的童星,變成了文藝女青年,又變成性感女神,以及如今的女打星,身份多變,卻一直深受歡迎。于是,讓我們用圖片,看她的30年。還是個小朋友,眉宇間有沒有今日的樣子呢?

偉大的數(shù)學(xué)家1994諾貝爾獎得主約翰·納什美麗的心靈(2010-03-16 21:31:04)轉(zhuǎn)載標(biāo)簽: 雜談偉大的數(shù)學(xué)家 1994諾貝爾獎得主約翰·納什生平約翰·納什生于1928年6月13日。納什的數(shù)學(xué)天分大約在14歲開始展現(xiàn)。他在普林斯頓大學(xué)讀博士時剛

約翰納什姓名:約翰•納什 性別:男 國籍:美國 出生年月:1928 專業(yè)領(lǐng)域:經(jīng)濟(jì)學(xué)(博弈論) 畢業(yè)院校:普林斯頓英文姓名:JOHN F.NASH榮譽:1994年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者,美國計量經(jīng)濟(jì)學(xué)委員會委員生平大事:納什在普林斯頓讀博士時剛剛20歲出頭

家庭·在法國和洛杉磯都有自己的房產(chǎn)。·擁有部分美國納瓦霍人的印第安血統(tǒng)。·父親約翰尼·克里斯托弗,母親貝蒂·蘇·帕爾默?!ぴ謩e和謝瑞琳·芬,詹妮弗·格雷及薇諾娜·賴德訂婚?!に头材萆づ晾辖z保持了最長的女友關(guān)系,她