定義
假設(shè)有n個(gè)局中人參與博弈,給定其他人策略的條件下,每個(gè)局中人選擇自己的 最優(yōu)策略(個(gè)人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合(Strategy Profile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實(shí)質(zhì)上說(shuō),是一種非合作博弈狀態(tài)。
納什均衡達(dá)成時(shí),并不意味著博弈雙方都處于不動(dòng)的狀態(tài),在順序博弈中這個(gè)均衡是在博弈者連續(xù)的動(dòng)作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個(gè)整體的最優(yōu)狀態(tài),以下的囚徒困境就是一個(gè)例子。
標(biāo)準(zhǔn)定義
納什均衡的定義:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策論組合(s1*,…,sn*)中,任一博弈方i的策論si*,都是對(duì)其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對(duì)策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)對(duì)任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個(gè)納什均衡。
納什均衡經(jīng)典案例:囚徒困境
(1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事。)
假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證 據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個(gè)博弈的支付矩陣。
表2.2 囚徒困境博弈
A╲B坦白抵賴
坦白-8,-80,-10
抵賴-10,0-1,-1
關(guān)于案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來(lái)看,當(dāng)事雙方都會(huì)懷疑對(duì)方會(huì)出賣自己以求自保、其次才是亞當(dāng)·斯密的理論,假設(shè)每個(gè)人都是“理性的經(jīng)濟(jì)人”,都會(huì)從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會(huì)有這樣一個(gè)盤算過(guò)程:假如他坦白,我抵賴,得坐10年監(jiān)獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會(huì)坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對(duì)我而言都是坦白了劃算。兩個(gè)人都會(huì)動(dòng)這樣的腦筋,最終,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期。
基于經(jīng)濟(jì)學(xué)中Rational agent的前提假設(shè),兩個(gè)囚犯符合自己利益的選擇是坦白招供,原
本對(duì)雙方都有利的策略不招供從而均被釋放就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。
另一個(gè)簡(jiǎn)單的例子
你正在圖書館枯坐,一位陌生美女主動(dòng)過(guò)來(lái)和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。”那么該不該和這位姑娘玩這個(gè)游戲呢?這基本是廢話,當(dāng)然該。問(wèn)題是,這個(gè)游戲公平嗎?
每一種游戲依具其規(guī)則的不同會(huì)存在兩種納什均衡,一種是純策略納什均衡,也就是說(shuō)玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個(gè)游戲中,便應(yīng)該采用混合策略納什均衡。
nm美女出正面美女出反面
你出正面+3,-3-2,+2
你出反面-2,+2+1,-1
假設(shè)我們出正面的概率是x,反面的概率是1-x。為了使利益最大化,應(yīng)該在對(duì)手出正面或反面的時(shí)候我們的收益都相等,不然對(duì)手總是可以改變正反面出現(xiàn)的概率讓我們的總收入減少,由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
解方程得x=3/8,也就是說(shuō)平均每八次出示3次正面,5次反面是我們的最優(yōu)策略。而將x= 3/8代入到收益表達(dá)式 3*x + (-2)*(1-x) 中就可得到每次的期望收入,計(jì)算結(jié)果是 -1/8元。
同樣,設(shè)美女出正面的概率是y,反面的概率是1-y,列方程
-3y + 2( 1-y )= 2y + (-1) * ( 1-y )
解得y也等于3/8,而美女每次的期望收益則是 2(1-y)- 3y = 1/8元。這告訴我們,在雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。
其實(shí)只要美女采取了(3/8,5/8)這個(gè)方案,不論你再采用什么方案,都是不能改變局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任 何策略無(wú)非只是上面兩種策略的線性組合,所以期望還是-1/8元。但是當(dāng)你也采用最佳策略時(shí),至少可以保證自己輸?shù)米钌佟7駝t,你肯定就會(huì)被美女采用的策略針對(duì),從而賠掉更多。
重要影響
納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建?!芬粫囊灾兴f(shuō),“在過(guò)去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語(yǔ)言、概念等方面,經(jīng)歷了一場(chǎng)溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營(yíng)銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域。”納什均衡的重要影響可以概括為以下六個(gè)方面
1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。
2.?dāng)U展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問(wèn)題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。

3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡(jiǎn)單化處理,分析問(wèn)題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問(wèn)題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問(wèn)題。
4.形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問(wèn)題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。
5.?dāng)U大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無(wú)處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。
6.改變了經(jīng)濟(jì)學(xué)的語(yǔ)言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利(Kandori,1997)對(duì)保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過(guò)一個(gè)幽默的引申,他說(shuō),“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。
納什的傳記:《普林斯頓的幽靈》
《普林斯頓的幽靈》(又譯為《美麗心靈》后被改編為電影)
西爾維婭。娜薩
理論介紹
1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的獲得者是美國(guó)普林斯頓大學(xué)的約翰·納什。納什獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的原因是他在博弈論領(lǐng)域的貢獻(xiàn),他提出了“納什均衡”理論、關(guān)于博奕論,流傳最廣的是一個(gè)叫做“囚徒困境”的故事:
話說(shuō)有一天,一個(gè)富翁在家中被殺,財(cái)物被盜;警方在此案的偵破過(guò)程中,抓到兩個(gè)犯罪嫌疑人張三和李四,并從他們的住處搜出被害人家中丟失的財(cái)物。但是,他們矢口否認(rèn)曾殺過(guò)人,辯稱他們只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。警察分別對(duì)張三和李四說(shuō),“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們1年刑期。但是,我可以和你做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你3個(gè)月的監(jiān)禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判10年刑,他只判3個(gè)月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑?!?br />
張三和李四怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無(wú)法串供,按照亞當(dāng)·斯密的理論,每一個(gè)人都是一個(gè)“理性的經(jīng)濟(jì)人”,都會(huì)從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會(huì)有這樣一個(gè)盤算過(guò)程:假如他招了,我不招,得坐10年監(jiān)獄,招了才5年,所以招了劃算;假如我招了,他也招,得坐5年,他要是不招,我就只坐3個(gè)月,而他會(huì)坐10年牢,也是招了劃算。綜合以上幾種情況考慮,不管他招不招,對(duì)我而言都是招了劃算。兩個(gè)人都會(huì)動(dòng)這樣的腦筋,最終,兩個(gè)人都選擇了招?結(jié)果都被判5年刑期。原本對(duì)雙方都有利的策略(抵賴)和結(jié)局 (被判1年刑)就不會(huì)出現(xiàn)。這就是著名的“囚徒困境”。它實(shí)際上反映了一個(gè)很深刻的問(wèn)題,這就是個(gè)人理性與集體理性的矛盾。
實(shí)際上,如果兩個(gè)都抵賴,各判刑1年,顯然比都判5年好,但實(shí)際上做不到,因?yàn)樗粷M足個(gè)人理性要求。作為一個(gè)理性的人,張三和李四都會(huì)想,如果我抵賴而對(duì)方坦白的話,自己就可能判刑10年,理性的人是不會(huì)冒這種險(xiǎn)的。但張三和李四都理性選擇的結(jié)果,兩人都被判了5年,最優(yōu)的被判1年的結(jié)果并沒有出現(xiàn)。也就是說(shuō),對(duì)每個(gè)人而言都是理性的選擇,但對(duì)于整個(gè)集體來(lái)說(shuō)卻是不理性的。
這與傳統(tǒng)經(jīng)濟(jì)學(xué)所言的結(jié)論相悖。傳統(tǒng)經(jīng)濟(jì)學(xué)認(rèn)為市場(chǎng)經(jīng)濟(jì)存在“看不見的手”,它調(diào)節(jié)的結(jié)果是每個(gè)人的理性選擇最終會(huì)造成對(duì)整個(gè)集體的最大利益。實(shí)際上,就像囚徒困境一樣,這只看不見的手在參與選擇的人數(shù)只有少數(shù)幾個(gè)的時(shí)候會(huì)失去作用,因?yàn)檫@個(gè)時(shí)候,人們決策的過(guò)程會(huì)考慮其他參與者的想法,就像賭博和下棋的時(shí)候一樣,這就和買家和賣家數(shù)量都巨大時(shí)的完全競(jìng)爭(zhēng)不完全一樣,需要新的一套思路進(jìn)行研究。
在上面的例子中,我們注意到了一個(gè)并非最優(yōu)的結(jié)果,就是兩人都選擇坦白的策略以及因此被判5年的結(jié)果,這個(gè)結(jié)果被稱為“納什均衡”,也叫非合作均衡。博奕論中最基本的概念就是“納什均衡”,一談到博奕論,人們說(shuō)的最多的最著名的也是“納什均衡”。納什均衡指的是這樣一種戰(zhàn)略組合,這種戰(zhàn)略組合由所有參與人的最優(yōu)戰(zhàn)略組成,也就是說(shuō),給定別人戰(zhàn)略的情況下,沒有任何單個(gè)參與人有積極性選擇其他戰(zhàn)略使自己獲得更大利益,從而沒有任何人有積極性打破這種均衡。
當(dāng)然,“納什均衡”雖然是由單個(gè)人的最優(yōu)戰(zhàn)略組成,但并不意味著是一個(gè)總體最優(yōu)的結(jié)果。如上述,在個(gè)人理性與集體理性的沖突的情況下,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。
從這個(gè)意義上說(shuō),“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。同時(shí),它也提示我們:合作是有利的“利己策略”。實(shí)際上,如果上述兩個(gè)囚徒能夠串供進(jìn)行合作,那么他們一定會(huì)選擇都抵賴從而只因偷盜罪被判1年,當(dāng)然,正是考慮到了這一點(diǎn),所以警察才對(duì)他們隔離審查從而獲知了事實(shí)真相,對(duì)囚徒而言最有利的合作結(jié)果才沒有出現(xiàn)?!凹{什均衡”描述的就是一種非合作博奕均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對(duì)馮·諾依曼和摩根斯特恩的合作博奕理論的重大發(fā)展,甚至可以說(shuō)是一場(chǎng)革命。
今天,納什均衡被廣泛應(yīng)用于各個(gè)領(lǐng)域的研究,尤其在進(jìn)行制度分析時(shí),我們可應(yīng)用它得出一個(gè)很重要結(jié)論:一種制度(體制)安排要發(fā)生效力,必須是一種納什均衡。否則,這種制度安排便不能成立。(據(jù)《諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)經(jīng)典理論》一書)
納什均衡現(xiàn)象
鮮花插牛糞
為什么許多美女最后嫁給了讓許多男性跌碎眼鏡的男士,一些帥哥最后也好不到哪里去。如果我們用納什均衡對(duì)這一現(xiàn)象進(jìn)行剖析就有許多有趣的結(jié)論。納什均衡的基礎(chǔ)原理是,如果對(duì)方的策略是確定的,那么我的策略是最優(yōu)的,而對(duì)方的策略是不肯定的,那么我的策略就很難是最優(yōu)的。
許多人知道有名的ABCD男女理論,由于男性的節(jié)制性偏向,導(dǎo)致其一般會(huì)降一格選擇異性伙伴,因此實(shí)際社會(huì)中的典范完配是A男配B女,B男配C女,C男配D女,而A女與D男輪空。這個(gè)時(shí)候發(fā)生了兩個(gè)確定性,A女(鮮花)確定D牛糞男是沒人要的,而D男確定A女是追不到的。這種確定導(dǎo)致了兩個(gè)最有可能的均衡策略,A女如果在某種情形下選擇了D男,則D男必定會(huì)接收,而D男去追A女則確定不會(huì)有成果,但反正D男也沒人要?jiǎng)t追A與不追A都一樣不會(huì)有損失,所以D男出于無(wú)聊或其它動(dòng)機(jī)仍非常有可能追A女。
在納什本身的假定的情景下,如果有4優(yōu)男看到4美女加一絕色美女,通常每男都假定其他男的可能會(huì)去排隊(duì)追此絕色美女,故追到絕美的不確定性最強(qiáng)(而如果真的產(chǎn)生了多男追絕美,絕美的確也可能表示出相當(dāng)?shù)牟豢隙ㄐ耘c優(yōu)勝感),讓他很難有最優(yōu)機(jī)遇,為防止“損了夫人又折兵”,每一男去追或者認(rèn)真追的將會(huì)是普通美女,而普通美女與絕色美女比擬知道本身的差距,在有確定的尋求者的時(shí)候,會(huì)明白本身的清楚的逢迎策略,因此一般美女對(duì)比絕美的不肯定策略會(huì)更具吸引力,成果導(dǎo)致絕美輪空或無(wú)人敢認(rèn)真追她。
事實(shí)上,納什假設(shè)中沒有斟酌一類情況,就是增添有高度不確定性的花心男的存在?;ㄐ哪蟹螦男甚至超A男,擁有眾多的A、B、C女的尋求,花心男除了符合優(yōu)良男士的諸多外在尺度外,由于某種原由無(wú)意與任何一女成為長(zhǎng)期確定組合,因此在心理上更有超脫性,氣質(zhì)上更有瀟灑性,而花心經(jīng)驗(yàn)又使其比較了解女性心理,并理解如何把持,花心男的典范模式是在其初始表示出確定的情圣模樣,而使絕美或其ta美女上鉤,認(rèn)為ta是確定的幻想對(duì)象因而絕美或ta美女很容易表示出傾心,最終花心男又會(huì)以浪蕩子形象顯露本身的高度不確定與不靠譜(自扮壞人形象),使絕美與ta女能接收傷心而去的成果,這種始定終棄的模式是花心男屢使不爽的伎倆。而女性的情緒懦弱性往往使她們?cè)诒粭壷螅x擇那本無(wú)可選擇或毫無(wú)盼望的D牛糞男,“鮮花插牛糞”正式成立。
歷史研討非常有趣地顯示,這種現(xiàn)象在歷史上導(dǎo)致了非常多的女鮮花插在牛糞男上,,以及部分男鮮花插女牛糞上的案例,而且也在某些女性中形成了一種“與那瀟灑的做情人,與那渾厚的做夫妻”的社會(huì)意理定規(guī)。最近正好看到一香港前亞姐因成為富商棄婦而賣淫的報(bào)道。在陳冠希艷照門中,wo們可以一窺,一個(gè)花心男與一大票絕美的這種浪蕩游戲,同時(shí)我們又會(huì)看到這種游戲?qū)δ蠥中想老實(shí)從良或本為良民的如謝霆鋒之類的損害,wo的勇敢預(yù)言,那些絕美中的一些人后來(lái)必然會(huì)把本身玩到插牛糞的水平。機(jī)遇也是宿命,紅顏命薄固然可嘆,其實(shí)往往也是因?yàn)橛锌蓺饪珊蘅蓱z的情節(jié)在前的。不過(guò),換個(gè)角度說(shuō),鮮花插了牛糞也未必就是最差策略,至少那牛糞是比擬靠得住的一面,閱歷了滄桑的鮮花終也須要淀泊了,只要見到那花心男類的不再心癢難耐就行。比之插在花心地子處的鮮花,那插在牛糞上的也不能不說(shuō)是榮幸的了。
鮮花一般是不追人的,所以鮮花損失了自動(dòng)、選擇性獲得相對(duì)較優(yōu)的A男、B男或C男的機(jī)遇,而最有可能會(huì)追鮮花者來(lái)自A+男(花心男)和D男(牛糞男),這實(shí)際上極大限制了鮮花的選擇范疇,并結(jié)構(gòu)了其極易發(fā)生極端自我誤區(qū)(從開端開心腸接收花心男的尋求?“wo就要這樣浪漫男人”到“男人沒有一個(gè)好東西”從而傷心腸把自身插在牛糞上這樣兩極化的心理波動(dòng))。除非鮮花清楚了這個(gè)道理,自我破解,才否則就很難走出這個(gè)近乎宿命的“鮮花插牛糞”困境,從而實(shí)現(xiàn)相對(duì)較優(yōu)的組合??蓱z很多的鮮花是沒有知性素質(zhì)的。
基于納什均衡的管理者薪酬分析
【摘 要】 文章從期望理論對(duì)管理者激勵(lì)薪酬的影響出發(fā),指出了管理者薪酬計(jì)劃的基礎(chǔ)——績(jī)效評(píng)價(jià)指標(biāo)應(yīng)滿足的條件,并在此基礎(chǔ)上,從納什均衡理論的角度對(duì)管理者激勵(lì)薪酬和不同資本結(jié)構(gòu)管理者的薪酬作了分析。
【關(guān)鍵詞】 納什均衡; 績(jī)效評(píng)價(jià); 管理者薪酬
制定合理的管理者薪酬是現(xiàn)代企業(yè)管理成功的關(guān)鍵。良好的薪酬管理計(jì)劃可以協(xié)調(diào)企業(yè)目標(biāo)與管理者目標(biāo),引導(dǎo)企業(yè)朝著戰(zhàn)略目標(biāo)健康發(fā)展,從而增加所有者財(cái)富,提升企業(yè)價(jià)值。期望理論為管理者薪酬的設(shè)計(jì)提供了管理學(xué)角度的理論指導(dǎo),而納什均衡理論又可以從經(jīng)濟(jì)學(xué)的角度探討管理者激勵(lì)薪酬的設(shè)計(jì)。
一、管理者激勵(lì)薪酬及其業(yè)績(jī)指標(biāo)的特點(diǎn)
企業(yè)是由多層級(jí)的委托關(guān)系構(gòu)成的,委托人和代理人之間存在信息不對(duì)稱,使得代理沖突、利益沖突在出資者與經(jīng)營(yíng)者之間不可避免。二者在企業(yè)管理目標(biāo)上必定存在著差異甚至背離。在委托代理關(guān)系的鏈條中,為了防止利益沖突和非均衡性,保證代理人的行為符合委托人的意志,應(yīng)在激勵(lì)機(jī)制方面設(shè)計(jì)一套科學(xué)的方案,制定的企業(yè)管理者薪酬契約應(yīng)使出資者利益、經(jīng)營(yíng)者利益之間實(shí)現(xiàn)最大程度的協(xié)調(diào)與統(tǒng)一。期望理論為設(shè)立合適的企業(yè)管理者薪酬契約提供了理論指導(dǎo)。
期望理論認(rèn)為,人總是渴求滿足一定的需要并設(shè)法達(dá)到一定的目標(biāo)。這個(gè)目標(biāo)在尚未實(shí)現(xiàn)時(shí),表現(xiàn)為一種期望,這時(shí)目標(biāo)反過(guò)來(lái)對(duì)個(gè)人的動(dòng)機(jī)又是一種激發(fā)的力量,反映為:個(gè)人努力個(gè)人成績(jī)(績(jī)效)組織獎(jiǎng)勵(lì)(薪酬)個(gè)人需要。
在這個(gè)期望模式中的四個(gè)因素,體現(xiàn)了三個(gè)方面的關(guān)系:努力和績(jī)效的關(guān)系;績(jī)效與獎(jiǎng)勵(lì)的關(guān)系;獎(jiǎng)勵(lì)和個(gè)人需要的關(guān)系??梢钥闯觯挥性O(shè)立合理的激勵(lì)薪酬機(jī)制,協(xié)調(diào)管理者和企業(yè)之間的利益沖突,才能促進(jìn)企業(yè)健康發(fā)展,提升企業(yè)價(jià)值。
如何計(jì)劃管理者薪酬,對(duì)于激勵(lì)管理者,協(xié)調(diào)所有者利益與管理者利益,提升企業(yè)價(jià)值起著至關(guān)重要的作用。而合理的管理者薪酬計(jì)劃應(yīng)以合理的績(jī)效評(píng)價(jià)指標(biāo)為基礎(chǔ)。合理的,能起到激勵(lì)作用的績(jī)效評(píng)價(jià)指標(biāo)應(yīng)具有如下特點(diǎn):
第一,績(jī)效評(píng)價(jià)指標(biāo)應(yīng)當(dāng)明確、具體,設(shè)置的目標(biāo)要考慮到被激勵(lì)者的能力,讓他經(jīng)過(guò)努力是可以達(dá)到的。第二,要考慮組織目標(biāo)和被激勵(lì)者的需要,被激勵(lì)者對(duì)自己看重的目標(biāo)會(huì)努力奮斗;如果企業(yè)管理的目標(biāo)落后于時(shí)代發(fā)展,與企業(yè)所處的政治、經(jīng)濟(jì)環(huán)境不相協(xié)調(diào),就不能起到激勵(lì)員工士氣的作用。第三,對(duì)管理者績(jī)效的評(píng)價(jià)指標(biāo)必須符合整體性和長(zhǎng)遠(yuǎn)性要求。另外,合理的績(jī)效指標(biāo)必須保障企業(yè)持續(xù)穩(wěn)定發(fā)展,避免在經(jīng)營(yíng)過(guò)程中因企業(yè)的短期行為而影響企業(yè)的長(zhǎng)遠(yuǎn)利益。第四,為管理者設(shè)立的績(jī)效評(píng)價(jià)指標(biāo)必須具有可行性。第五,制定的績(jī)效評(píng)價(jià)指標(biāo)應(yīng)使代理成本盡可能低,使利益各方的目標(biāo)達(dá)到協(xié)調(diào)一致。最后,企業(yè)不同的決策活動(dòng)應(yīng)有不同的細(xì)化的績(jī)效評(píng)價(jià)指標(biāo),而不應(yīng)該僅僅籠統(tǒng)地采用利潤(rùn)率,每股收益或EVA指標(biāo)來(lái)衡量企業(yè)整體績(jī)效。
二、管理者激勵(lì)薪酬的納什均衡分析
合理的管理者薪酬計(jì)劃的作用之一就是協(xié)調(diào)委托人和代理人之間的利益,但是由于二者對(duì)待風(fēng)險(xiǎn)的態(tài)度不同,信息不對(duì)稱,實(shí)施監(jiān)督的困難性等原因,二者之間永遠(yuǎn)存在利益沖突,從而產(chǎn)生代理成本。代理成本包括:對(duì)管理者的激勵(lì)薪酬成本;監(jiān)督管理者行為的成本;管理者行為偏離所有者利益的成本。合理的管理者薪酬應(yīng)該使代理成本盡可能低。從管理者的角度看,管理者因自己的行為給所有者帶來(lái)的收益不會(huì)全部歸管理者,因此,他有動(dòng)機(jī)減少此類能帶給所有者利益卻不能滿足它自身期望利益的決策行為,同時(shí)也有將公司資源轉(zhuǎn)移給自身消費(fèi)的動(dòng)機(jī)。這形成了很大的代理成本。管理者薪酬與企業(yè)績(jī)效評(píng)價(jià)指標(biāo)應(yīng)能將所有者利益與管理者利益統(tǒng)一起來(lái),股東財(cái)富的變化應(yīng)能影響管理者財(cái)富的變化。
管理者薪酬可以通過(guò)納什均衡理論來(lái)設(shè)計(jì)。用G表示一個(gè)博弈,如該博弈有n個(gè)博弈方,每個(gè)博弈方可選擇的策略的集合為Si(i從1-n),Sij表示博弈方i的第j個(gè)策略,P表示博弈方j(luò)的得益,是各博弈方策略的多元函數(shù);在博弈G={Si,Pj}中,如果由每個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合{S1,S2,…,Sn}中,任一博弈方i的策略Si都是對(duì)其余博弈方策略的組合的最佳策略對(duì)策,則(S1,S2,…,Sn)為G的一個(gè)“納什均衡”。在企業(yè)的委托代理關(guān)系中,主要存在委托人(所有者)和代理人(管理者)兩個(gè)博弈方。設(shè)代理人有機(jī)會(huì)成本O,其努力水平E分布在一個(gè)連續(xù)空間,其產(chǎn)出(業(yè)績(jī))P=P(E),努力的負(fù)效用C=C(E),此外,由于與代理人的努力水平無(wú)關(guān)的不確定性風(fēng)險(xiǎn)R的存在,委托人需向代理人支付固定薪水F(R),F(xiàn)(R)相對(duì)于E來(lái)說(shuō),是個(gè)常量。則:
委托人支付的薪酬W=W(P)=W[P(E)]+F(R);
委托人的得益函數(shù)為P-W=P(E)-W[P(E)]-F(R);
代理人的得益函數(shù)為W-C=W[P(E)]+F(R)-C(E)。
當(dāng)代理人的得益不小于其接受委托的機(jī)會(huì)成本O時(shí),才愿意接受委托,即,W[P(E)]+F(R)-C(E)≥O。在代理人接受委托的前提下,委托人則希望支付的薪酬越小越好,則約束條件為W[P(E)]+F(R)=C(E)+O。因此,委托人的得益函數(shù)為P(E)
-W[P(E)]-F(R)=P(E)-C(E)-O。因此,委托人必須找出一個(gè)努力水平E*,對(duì)于任意E,使他的得益函數(shù)P(E*)-C(E*)-O
≥P(E)-C(E)-O。
但代理人根據(jù)自身利益最大化來(lái)行為,其努力水平不一定選E*。要使代理人自覺選擇努力水平E*,必須使W[P(E*)]+F(R)-C(E*)最大,即,對(duì)于任意E,W[P(E*)+F(R)-C(E*)≥W[P(E)]+F(R)-C(E)
如果委托人按這兩個(gè)條件設(shè)計(jì)薪酬函數(shù),就可以使代理人的行為符合自己的利益,即,對(duì)E求導(dǎo),使:
P′(E)-C′(E)=0
W′[P(E)]-C′(E)=0
即,當(dāng)W′[P(E)]=P′(E)時(shí),達(dá)到了兩個(gè)博弈方的均衡??梢钥闯?,為了達(dá)到這個(gè)納什均衡,關(guān)鍵是對(duì)企業(yè)績(jī)效評(píng)價(jià)指標(biāo)P(E)和以此為基礎(chǔ)的管理者薪酬W[P(E)]的合理設(shè)計(jì)和分析。
上述分析中,為了簡(jiǎn)化明了,隱藏了債權(quán)利益。需要注意的是,這里的管理者薪酬W[P(E)]盡管只是企業(yè)績(jī)效P(E)的函數(shù),但也包含著債權(quán)人利益這一隱函數(shù)對(duì)管理者薪酬的影響。
三、不同資本結(jié)構(gòu)下管理者薪酬的均衡分析
(一)無(wú)負(fù)債企業(yè)管理者薪酬的納什均衡
無(wú)負(fù)債公司由于沒有債權(quán)人,此類企業(yè)的代理成本就是管理者與所有者之間的沖突成本,包括管理者的激勵(lì)薪酬成本,監(jiān)督管理者行為的成本和管理者行為偏離所有者利益的成本,不含債務(wù)代理成本。從這個(gè)角度講,管理者的任何決策都只會(huì)影響所有者和管理者兩方的利益,不會(huì)涉及第三方利益。即企業(yè)的績(jī)效與所有者利益是統(tǒng)一的,管理者的薪酬應(yīng)該和公司的績(jī)效高度相關(guān)。在這種情況下,不存在債權(quán)人利益,管理者的薪酬W[P(E)]只需考慮企業(yè)績(jī)效函數(shù)P(E),就可以達(dá)到納什均衡。
以投資決策為例,假設(shè)公司有兩個(gè)投資機(jī)會(huì),一個(gè)是無(wú)風(fēng)險(xiǎn)項(xiàng)目,一個(gè)是風(fēng)險(xiǎn)項(xiàng)目,投資額相同。無(wú)風(fēng)險(xiǎn)項(xiàng)目的投資回報(bào)的現(xiàn)值為I。風(fēng)險(xiǎn)項(xiàng)目可能有高回報(bào),也可能有低回報(bào),獲得高回報(bào)的現(xiàn)值為H,概率為p;獲得低回報(bào)的現(xiàn)值為L(zhǎng),概率為1-p,則風(fēng)險(xiǎn)項(xiàng)目的投資回報(bào)現(xiàn)值為p×H+(1-P)×L。其中,H≥I≥L。
當(dāng)p×H+(1-P)×L≥I時(shí),投資風(fēng)險(xiǎn)項(xiàng)目會(huì)增加所有者財(cái)富,反之,應(yīng)投資無(wú)風(fēng)險(xiǎn)項(xiàng)目。在沒有約束的條件下,管理者選擇何種投資只會(huì)考慮自身利益,而不會(huì)關(guān)注所有者財(cái)富是否會(huì)增加,這種情況下,管理者的薪酬應(yīng)該按如下方法設(shè)計(jì),才能使管理者的決策符合所有者利益。
管理者的薪酬應(yīng)該包括固定薪酬F,如果投資風(fēng)險(xiǎn)項(xiàng)目獲得高回報(bào)H,則管理者取得激勵(lì)性薪酬а×H,а相當(dāng)于績(jī)效的提成比例;如果獲得低回報(bào)L,則受到失職性懲罰β;如果投資無(wú)風(fēng)險(xiǎn)項(xiàng)目,管理者的薪酬為F+а×I,а同上。在這種情況下,如果滿足條件:(1)p×(F+а×H)+(1-p)×(F-β)≥F+а×I,管理者就會(huì)選擇風(fēng)險(xiǎn)項(xiàng)目。而這同時(shí)應(yīng)滿足條件:(2)p×H+(1-P)×L
≥I。對(duì)條件(1)進(jìn)行整理,得p×H+(1-p)×L(-β/а)≥I,與條件(2)結(jié)合,得出結(jié)論,只要(-β/а)≤L,管理者就會(huì)選擇符合所有者利益的決策。即,在設(shè)計(jì)管理者薪酬時(shí),考慮投資失敗時(shí)的懲罰性額度β,投資成功時(shí)的獎(jiǎng)勵(lì)提成比例а與投資失敗的回報(bào)L時(shí)三者的關(guān)系滿足(-β/а)≤L即可約束管理者行為,使其作出的決策符合所有者利益。
(二)有負(fù)債企業(yè)管理者薪酬的納什均衡
當(dāng)企業(yè)的資本結(jié)構(gòu)中包括負(fù)債時(shí),企業(yè)存在兩方面的代理成本,其一是所有者與管理者之間的權(quán)益代理成本;其二是所有者與債權(quán)人之間的代理成本。前者的代理成本內(nèi)容上文已分析,不再贅述。后者的代理成本主要是來(lái)自所有者和債權(quán)人之間的利益沖突,即,所有者財(cái)富的增加可能建立在債權(quán)人利益減少的基礎(chǔ)上。權(quán)益性代理成本和債務(wù)性代理成本二者此消彼長(zhǎng)。當(dāng)企業(yè)制定的管理者薪酬合約將管理者利益與所有者財(cái)富相統(tǒng)一時(shí),管理者會(huì)采取增加自身利益(同時(shí)增加所有者財(cái)富)的行為,從而減少權(quán)益代理成本。但這種行為有可能損害債權(quán)人利益。理智的債權(quán)人意識(shí)到這種情況發(fā)生的可能性,就會(huì)在債券市場(chǎng)上采取行動(dòng),迫使公司發(fā)行的債券價(jià)格下降,從而產(chǎn)生主要的債務(wù)代理成本。所以,當(dāng)企業(yè)的資本結(jié)構(gòu)中包括債務(wù)時(shí),最優(yōu)的管理者薪酬合約應(yīng)該是在所有者財(cái)富、債權(quán)人利益和管理者利益之間達(dá)到一個(gè)“納什均衡”。
仍以上述投資決策為例,由于增加了博弈方債權(quán)人,企業(yè)在制定管理者薪酬計(jì)劃時(shí),須考慮債務(wù)代理成本,表現(xiàn)為向債權(quán)人償還的本金和支付的利息,設(shè)其現(xiàn)值為ф,當(dāng),①p×(H-ф)+(1-p)×(L-ф)≥I-ф時(shí),應(yīng)滿足條件:②p×[F+а×(H-ф)]+(1-p)×(F-β)≥F+а×(I-ф)。整理?xiàng)l件②得出結(jié)論,只要(-β/а)≤(L-ф),就會(huì)使管理者利益與所有者財(cái)富一致。而要使全部代理成本最低,還應(yīng)滿足權(quán)益代理成本與債權(quán)代理成本之和最低,所有者財(cái)富才能達(dá)到最大。二者的關(guān)系可以用圖1表示。
坐標(biāo)的橫軸表示管理者利益與所有者財(cái)富的一致程度,縱軸表示企業(yè)代理成本,L1是權(quán)益代理成本,隨著管理者利益與所有者財(cái)富一致程度的提高而降低,L2是債務(wù)代理成本,隨著管理者利益與所有者財(cái)富一致程度的提高而上升。L1與L2的交點(diǎn)P是所有者財(cái)富最大的點(diǎn)。即,企業(yè)制定的管理者薪酬應(yīng)該使債務(wù)代理成本與權(quán)益代理成本相等,這時(shí)二者之和最小,所有者財(cái)富最大。
愛華網(wǎng)



