納什均衡定義_第1頁
納什均衡定義_第2頁
納什均衡定義_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、納什均衡定義:假設(shè)有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優(yōu)策略(個人最優(yōu) 策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己效用最大化。所有局中人策略構(gòu)成一個策略組合 (Strategy Profile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在 給定別人策略的情況下,沒有人有足夠理由打破這種均衡。囚徒困境(prisoners dilemma):兩個被捕的囚徒之間的一種特殊博弈,說明為什么甚至在合作對雙方都 有利時,保持合作也是困難的。囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇并非團(tuán)體最佳選擇。雖然困境本身

2、只屬模型性質(zhì),但現(xiàn)實(shí)中的價格競爭、環(huán)境保護(hù)等方面,也會頻繁出現(xiàn)類似情況。來源囚徒困境的故事講 的是,兩個嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠 的證據(jù)。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個 坦白而另一個抵賴,坦白的放出去,抵賴的判十年。于是,每個囚徒都面臨兩種選擇:坦白或抵賴。然而, 不管同伙選擇什么,每個囚徒的最優(yōu)選擇是坦白:如果同伙抵賴、自己坦白的話放出去,不坦白的話判一 年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,不坦白的話判十年,坦白還是比不坦白好。 結(jié)果,兩個嫌疑犯都選擇坦白,各判刑

3、八年。如果兩人都抵賴,各判一年,顯然這個結(jié)果好。但這個帕累 托改進(jìn)辦不到,因?yàn)樗荒軡M足人類的理性要求。囚徒困境所反映出的深刻問題是,人類的個人理性有時 能導(dǎo)致集體的非理性一一聰明的人類會因自己的聰明而作繭自縛。主旨囚徒們雖然彼此合作,堅不吐實(shí), 可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因?yàn)槌鲑u同伙可為自己帶來利益(縮短刑期), 也因?yàn)橥锇炎约赫谐鰜砜蔀樗麕砝?,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。 但實(shí)際上,執(zhí)法機(jī)構(gòu)不可能設(shè)立如此情境來誘使所有囚徒招供,因?yàn)榍敉絺儽仨毧紤]刑期以外之因素(出 賣同伙會受到報復(fù)等),而無法完全以執(zhí)法者所設(shè)立之利益(刑期)作

4、考量。“囚徒困境”定義是1950年 美國蘭德公司提出的博弈論模型。兩個共謀犯罪的人被關(guān)入監(jiān)獄,不能互相溝通情況。如果兩個人都不揭 發(fā)對方,則由于證據(jù)不確定,每個人都坐牢半年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓?獲釋,沉默者因不合作而入獄十年;若互相揭發(fā),則因證據(jù)確實(shí),二者都判刑兩年。由于囚徒無法信任對 方,因此傾向于互相揭發(fā),而不是同守沉默。2)匚納什均衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優(yōu)反應(yīng)。假設(shè)有n個局中人參與博弈,如果某情況下無一參與者可以獨(dú)自行動而增加收益(即為了自身利益的 最大化,沒有任何單獨(dú)的一方愿意改變其策略的1),則此策略組合被稱為納什均

5、衡納什均衡所有局中人策略構(gòu)成一個策略組合(Strategy Profile)。納什均衡,從實(shí)質(zhì)上說,是一種非合作博 弈狀態(tài)。納什均衡達(dá)成時,并不意味著博弈雙方都處于不動的狀態(tài),在順序博弈中這個均衡是在博弈者連 續(xù)的動作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個整體的最優(yōu)狀態(tài),經(jīng)濟(jì)學(xué)定義所謂納 什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨(dú)改變策略都不會得到好處。 換句話說,如果在一個策略組合上,當(dāng)所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略 組合就是一個納什均衡。特性:存在性在同時博弈中(純策略的)納什均衡可能存在,也可能不存在。唯一性在納什均衡

6、存在的條件下,它既可能是唯一的,也可能不唯一。最優(yōu)性如果納什均衡存在,則它既可能是最優(yōu)的,也可能不是最優(yōu)的。經(jīng)典案例囚徒困境1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時,講到兩個囚 犯的故事。)假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房 間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物, 于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判開8年;如果另一個犯 罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因巳有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8 年,立即釋放

7、。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人 各判入獄1年。囚徒困境博弈AB坦白抵賴坦白-8,-80,-10抵賴-10,0-1,-1關(guān)于案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況, 首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當(dāng)斯密的理 論,假設(shè)每個人都是“理性的經(jīng)濟(jì)人”,都會從利己的目的出發(fā)進(jìn)行選擇。這兩個人都會有這樣一個盤算 過程:假如他坦白,如果我抵賴,得坐10年監(jiān)獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵 賴,我就會被判一年,如果我坦白就可以被釋放,而他會坐10年

8、牢。綜合以上幾種情況考慮,不管他坦白 與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結(jié)果都被判8 年刑期?;诮?jīng)濟(jì)學(xué)中Rational agent的前提假設(shè),兩個囚犯符合自己利益的選擇是坦白招供,原本對雙 方都有利的策略不招供從而均被釋放就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納 什均衡”首先對亞當(dāng)斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場經(jīng)濟(jì)中,每一個 人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。但是我們可以從“納什均衡”中引出“看不見的 手”原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。 重要影

9、響納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990) 在博弈論和經(jīng)濟(jì)建模一書的引言中所說,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言、概念等 方面,經(jīng)歷了一場溫和的革命,非合作博弈理論巳經(jīng)成為范式的中心在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān) 的金融、會計、營銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們巳經(jīng)很難找到不懂納什均衡能夠消費(fèi)近期文獻(xiàn)的 領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個方面1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概 念、內(nèi)容、模型和分析工具等,均巳滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng) 濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些

10、學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究 范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。2.擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問 題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動環(huán)境因素以及經(jīng)濟(jì)個體之間的交互作用模式化的有效辦 法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆 推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究 的深度。納什均衡理論不回避經(jīng)濟(jì)個體之間直接的交互作用,不滿足于對經(jīng)濟(jì)個體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡 單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)

11、律,強(qiáng)調(diào)從微觀個 體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。4.形成了基于經(jīng)典博弈 的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng) 典博弈的分析方法和模型進(jìn)行研究,將一個領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個領(lǐng)域。5.擴(kuò)大和加強(qiáng)了 經(jīng)濟(jì)學(xué)與其他社會科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無處不 在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動和發(fā)展的規(guī)律。 納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其 他學(xué)科相互促進(jìn)

12、的良性循環(huán)。6.改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利(Kandori,1997)對保羅薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個訓(xùn)練 有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個詞,那就是供給和需求”,曾做過一個幽默的引申, 他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個詞,那就是納什均衡”。青蛙現(xiàn)象:把一只青蛙直接放進(jìn)熱水鍋里,由于它對不良環(huán)境的反應(yīng)十分敏感,就會迅速跳出鍋外。如果 把一個青蛙放進(jìn)冷水鍋里,慢慢地加溫,青蛙并不會立即跳出鍋外,水溫逐漸提高的最終結(jié)局是青蛙被煮 死了,因?yàn)榈人疁馗叩角嗤軣o法忍受時,它巳經(jīng)來不及、或者說是沒有能力跳出鍋外

13、了。青蛙現(xiàn)象告訴我 們,一些突變事件,往往容易引起人們的警覺,而易致人于死地的卻是在自我感覺良好的情況下,對實(shí)際 情況的逐漸惡化,沒有清醒的察覺。我們的組織和社會生存的主要威脅,并非來自突如其來的事件,而是 由緩慢漸進(jìn)而無法察覺的過程形成。人們目光短淺,只看到局部,而無法縱觀全局,對于突如其來的變化, 可以從容面對,對于悄悄發(fā)生的大的變化,而無法察覺,最終會帶給我們更加嚴(yán)重的危害!.刺猬法則:兩只困倦的刺猬,由于寒冷而擁在一起??梢?yàn)楦髯陨砩隙奸L著刺,于是它們離開了一段距 離,但又冷得受不了,于是湊到一起。幾經(jīng)折騰,兩只刺猬終于找到一個合適的距離:既能互相獲得對方 的溫暖而又不至于被扎。刺猬法則主要是指人際交往中的“心理距離效應(yīng)”。八.手表定律:手表定律是指一個人有一只表時,可以知道現(xiàn)在是幾點(diǎn)鐘,而當(dāng)他同時擁有兩只時卻無法 確定。兩只表并不能告訴一個人更準(zhǔn)確的時間,反而會使看表的人失去對準(zhǔn)確時間的信心。對于一個人不 能同時選擇兩種不同的價值觀,否則他的行為將陷于混亂。在人生的每一個十字路口,我們都要面對“魚 與熊掌不能兼得”的苦惱。在面對矛盾選擇的時候,我們推薦使用“模糊心理”。所謂“模糊心理”,就 是在一個很難決策的情況下,以潛意識的心理為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論