下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、論日常生活中的“納什均衡” 論文關(guān)鍵詞:囚徒困境 納什均衡 價(jià)格競(jìng)爭(zhēng) 論文摘要:“囚徒困境”是非合作博弈的均衡即“納什均衡”的最經(jīng)典的例子。從這個(gè)例子,我們能知道“納什均衡”的精要所在。本文從“囚徒困境”案例出發(fā),總結(jié)出“納什均衡”的原理,并由此去探尋日常生活中的非合作博弈。 1950年和 1951年納什的兩篇關(guān)于非合作博弈的重要論文,徹底改變了人們對(duì)競(jìng)爭(zhēng)和市場(chǎng)的看法。他證明了非合作博弈極其均衡解 ,并證明了均衡解的存在性,即著名的“納什均衡”,從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系
2、奠定了現(xiàn)代非合作博弈論的基石。 要了解納什均衡,首先要知道什么是非合作博弈問題?!扒敉嚼Ь场笔窃搯栴}最經(jīng)典的例子,我們也從該例為切入點(diǎn)進(jìn)行探討: 首先,一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做 出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。 “囚徒困境”:兩個(gè)嫌疑犯(A和 B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴(yán)”,如果兩人
3、都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白則因證據(jù)不足各判1年。 在這個(gè)例子里,博弈的參加者就是兩個(gè)嫌疑犯 A和 B,他們每個(gè)人都有兩個(gè)策略即坦白和不坦白,判刑的年數(shù)就是他們的支付。可能出現(xiàn)的四種情況:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B坦白A不坦白,是博弈的結(jié)果。在此,兩個(gè)嫌疑犯 A和 B面臨著兩難的選擇坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判 1年。但由于兩人處于隔離情況下無(wú)法串供。所以,按照亞當(dāng)?斯密的理論,每一個(gè)人都是
4、從利 己的目的出發(fā),他們選擇坦白交代是最佳策略。因?yàn)樘拱捉淮梢云谕玫阶詈玫慕鉀Q辦法釋放,但前提是同伙抵賴,顯然要比自己抵賴要坐 1O年牢好得多。這種策略是損人利 己的策略。不僅如此,坦白還有更多的好處。如果對(duì)方坦白了而自己抵賴了,那自己就得坐 1O年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判 8年,總 比被判 10年好。結(jié)果 ,兩人合理的選擇是坦白,原本對(duì)雙方都有利的策略(抵賴)和結(jié)局(各被判1年刑)就不會(huì) 出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判
5、;8年 的結(jié)局被稱為“納什均衡”,也叫非合作均衡因?yàn)?,每一方在選擇策略時(shí)都沒有“共謀”(串供),他們只是選擇對(duì)自己最有利的策略,而不考慮社會(huì)福利或任何其他對(duì)手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會(huì)主動(dòng)改變有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長(zhǎng)的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁結(jié)果?!凹{什均衡”首先對(duì)亞當(dāng)?斯密的“看不見的手”的原理提
6、出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。不妨讓我們重溫一下這位經(jīng)濟(jì)學(xué)圣人在國(guó)富論中的名言:“通過追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益?!睆摹凹{什均衡”我們引出了“看不見的手”的原理的一個(gè)悖論:從利己目的出發(fā) ,結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說,“納什均衡”提出的悖論實(shí)際上動(dòng)搖 了西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利 己策略”。但它必須符合以下黃金律:按照你愿意別人對(duì)你的方式來對(duì)別人,但只有他們
7、也按同樣方式行事才行。也就是中國(guó)人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對(duì)馮?諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場(chǎng)革命。 從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟(jì)、社會(huì)、政治、國(guó)防、管理和日常生活中的博弈現(xiàn)象: (1)電信價(jià)格競(jìng)爭(zhēng) 根據(jù)我國(guó)電信業(yè)的實(shí)際情況,我們來構(gòu)造電信業(yè)價(jià)格戰(zhàn)的博弈模型。假設(shè)此博弈的參加者為電信運(yùn)營(yíng)商 A與B,他們?cè)陔娦拍骋活I(lǐng)域展開競(jìng)爭(zhēng),一開始的價(jià)格都是 PoA(中國(guó)電信)是老牌企業(yè),實(shí)力雄厚,
8、占據(jù)了絕大多數(shù)的市場(chǎng)份額;B(中國(guó)聯(lián)通)則 剛成立不久 ,翅膀還沒長(zhǎng)硬 ,是政府為了打破壟斷鼓勵(lì)競(jìng)爭(zhēng)而籌建起來的。 正因?yàn)?#160;B是政府扶植起來鼓勵(lì)競(jìng)爭(zhēng)的,所以 B得到了政府的一些優(yōu)惠,其中就有 B的價(jià)格可以比Po低 10。這一舉動(dòng),還不會(huì)對(duì) A產(chǎn)生多大的影響,因?yàn)?#160;A的根基實(shí)在是太牢固了。在這樣的市場(chǎng)分配下,A、B可以達(dá)到平衡,但由于 B在價(jià)格方面的優(yōu)勢(shì),市場(chǎng)份額逐步壯大,到了一定程度對(duì) A造成了影響。這時(shí)候,A該怎么做?不妨假定: A降價(jià)而B維持,則A獲利
9、60;15,B損失5,整體獲利10; A維持且B也維持,則 A獲利5,B獲利10,整體獲利15; A維持而 B降價(jià),則 A損失 10,B獲利 15,整體獲利5; A降價(jià)且 B也降價(jià),則 A損失 5,B損失 5,整體損失10。 從 A角度看 ,顯然降價(jià)要 比維持好,降價(jià)至少可以保證比 B好,在概率均等的情況下,A降價(jià)的收益為 15 x50一5 x 50 =5,維持的收益為 5
10、;x 50一10 x 50 =一25,為了自身利益的最大化,A就不可避免地選擇了降價(jià)。從 B角度看,效果也一樣,降價(jià)同樣比維持好,其降價(jià)收益為 5,維持收益為25,它也同樣會(huì)選擇降價(jià)。在這輪博弈中,A、B都將降價(jià)作為策略,因此各損失 5,整體損失 10,整體收益是最差的。這就是此博弈最終所出現(xiàn)的納什均衡。我們構(gòu)造的這一電信業(yè)價(jià)格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象,各個(gè)局部都尋求利益的最大化,而整體利益卻不是最優(yōu),甚至是最差。 許多其他行業(yè)的價(jià)格競(jìng)爭(zhēng)都是典型的囚徒困境現(xiàn)象,如可口可樂公司和百事可樂公司之間的競(jìng)
11、爭(zhēng)、各大航空公司之間的價(jià)格競(jìng)爭(zhēng)等等。 (2)OPEC組織成員國(guó)之間的合作與背叛 “囚徒困境”告訴我們,個(gè)人理性和集體理性之間存在矛盾,基于個(gè)人理性的正確選擇會(huì)降低大家的福利,也就是說,基于個(gè)人利益最大化的前提下,帕累托改進(jìn)得不到進(jìn)行,帕累托最優(yōu)得不到實(shí)現(xiàn)。 上述我們?cè)趯?duì)電信價(jià)格競(jìng)爭(zhēng)的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降價(jià)的納什均衡。而在現(xiàn)實(shí)生活當(dāng)中,信任與合作很少達(dá)到如此兩難的境地,無(wú)論在自然界還是在人類社會(huì),“合作”都是一種隨處可見的現(xiàn)象。比如中東石油輸出國(guó)組織(Organization of PetroleumE
12、xporting Countries簡(jiǎn)稱 OPEC)的成立,本身就是要限制各石油生產(chǎn)國(guó)的產(chǎn)量,以保持石油價(jià)格,以便獲取利潤(rùn),是合作的產(chǎn)物。OPEC之所以能夠成立,各組織成員國(guó)之間之所以能夠合作,是因?yàn)榍敉嚼Ь橙绻且淮涡圆┺牡脑挘趥€(gè)人利益最大化,得到納什均衡解,但如果是多次博弈,人們就有了合作的可能性,囚徒困境就有可能破解 ,合作就有可能達(dá)成。連續(xù)的合作有可能成為重復(fù)的囚徒困境的均衡解。這也是博弈論上著名的“大眾定理”(Folk Theorem)的含義。 但合作的可能性不是必然性。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一
13、方(最好是實(shí)力更強(qiáng)的一方)必須主動(dòng)通過可信的承諾(Credible commitr em),向另一方表示合作的善意,努力把這個(gè)善意表達(dá)清楚,并傳達(dá)出去。如果該困境同時(shí)涉及多個(gè)對(duì)手,則要在博弈對(duì)手中形成聲譽(yù),并用心地維護(hù)這個(gè)聲譽(yù)。這里“可信的承諾”是一個(gè)很牽強(qiáng)的翻譯,“Credible commitment”并不是什么空口諾言,而是實(shí)實(shí)在在的付出。所以合作是非常困難的。所以 OPEC組織經(jīng)常會(huì)有成員國(guó)不遵守組織的協(xié)定私 自增加石油產(chǎn)量。每個(gè)成員國(guó)都這樣想,只要他們不增加產(chǎn)量,我增加一點(diǎn)點(diǎn)產(chǎn)量對(duì)價(jià)格沒什么影響,結(jié)果每個(gè)國(guó)家都增加產(chǎn)量,造成石油價(jià)格下
14、跌 ,大家的利潤(rùn)都受到損失。當(dāng)然,一些產(chǎn)量增加較少的國(guó)家損失更多,于是也更加大量生產(chǎn),造成價(jià)格進(jìn)一步下降結(jié)果,陷入一個(gè)困境大家都增加產(chǎn)量,價(jià)格下跌,大家再增加產(chǎn)量,價(jià)格再下跌理論上,幾乎所有的卡特爾都會(huì)遭到失敗,原因就在于卡特爾的協(xié)定(類似囚犯的攻守同盟 )不是一個(gè)納什均衡沒有成員有興趣遵守。那么是不是不可能有卡特爾合作成功了?理論上,如果是無(wú)限期的合作 ,雙方考慮長(zhǎng)遠(yuǎn)利益他們的合作是會(huì)成功的。但只要是有限次的合作 ,合作就不會(huì)成功。比如合作 10次,那么在第九次博弈參與人就會(huì)采取不合作態(tài)度 ,因?yàn)榇蠹叶枷氤米詈笠淮螜C(jī)會(huì)撈一把,反正以
15、后我也不會(huì)跟你合作了。但是大家料到第九次會(huì)出現(xiàn)不合作,那么就很可能在第八次就采取不合作的態(tài)度。第八次不合作會(huì)使大家在第七次就不合作一直到,從第一次開始大家都不會(huì)采取合作態(tài)度。 還存在其他一些“非合作博議”的情況: (1)污染博弈 假如市場(chǎng)經(jīng)濟(jì)中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤(rùn)的最大化,寧愿以犧牲環(huán)境為代價(jià)也絕不會(huì)主動(dòng)增加環(huán)保設(shè)備投資。按照看不見的手的原理 ,所有企業(yè)都會(huì)從利己的 目的出發(fā),采取不顧環(huán)境的策略 ,從而進(jìn)入“納什均衡”狀態(tài)。如果一個(gè)企業(yè)從利他的目的出發(fā),投資治理污染 ,而其他企業(yè)仍然不顧環(huán)
16、境污染,那么這個(gè)企業(yè)的生產(chǎn)成本就會(huì)增加 ,價(jià)格就要提高,它的產(chǎn)品就沒有競(jìng)爭(zhēng)力 ,甚至企業(yè)還要破產(chǎn)。這是一個(gè)“看不見的手的有效的完全競(jìng)爭(zhēng)機(jī)制”失敗的例證。直到 20世紀(jì) 90年代中期 ,中國(guó)鄉(xiāng)鎮(zhèn)企業(yè)的盲 目發(fā)展造成嚴(yán)重污染的情況就是如此。只有在政府加強(qiáng)污染管制時(shí),企業(yè)才會(huì)采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤(rùn),但環(huán)境將更好。 (2)貿(mào)易自由與壁壘 這個(gè)問題對(duì)于剛剛加入 WTO的中國(guó)而言尤為重要。任何一個(gè)國(guó)家在國(guó)際貿(mào)易中都面臨著保持貿(mào)易自由與實(shí)行貿(mào)易保護(hù)主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個(gè)“納什均衡”,這個(gè)均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。x國(guó)試圖對(duì) Y國(guó)進(jìn)行進(jìn)口貿(mào)易限制,比如提高關(guān)稅 ,則 Y國(guó)必然會(huì)進(jìn)行反擊,也提高關(guān)稅,結(jié)果誰(shuí)也沒有撈到好處。反之,如 x和 Y能達(dá)成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 房地產(chǎn)開發(fā)臨建房施工合同
- 家電賣場(chǎng)裝飾施工合同
- 別墅建造合同樣本
- 汽車站返聘退休調(diào)度員勞務(wù)合同
- 消防應(yīng)急泵車租賃協(xié)議
- 智能監(jiān)控工程承包合同
- 建筑材料物流合作協(xié)議模板
- 端午節(jié)促銷活動(dòng)方案
- 高爐煉鐵應(yīng)急預(yù)案
- 中職生主題班會(huì)課件-情商VS智商
- 甘肅省黃金礦產(chǎn)資源概況
- 診所消防安全應(yīng)急方案
- 譯林版一年級(jí)上冊(cè)英語(yǔ)全冊(cè)課件
- 中小學(xué)德育工作指南考核試題及答案
- 凈現(xiàn)值NPV分析和總結(jié)
- 國(guó)網(wǎng)基建各專業(yè)考試題庫(kù)大全-質(zhì)量專業(yè)-中(多選題匯總)
- LTC流程介紹完整版
- 飼料加工系統(tǒng)粉塵防爆安全規(guī)程
- 一年級(jí)上冊(cè)美術(shù)課件-第11課-花兒寄深情-▏人教新課標(biāo)
- 植物的象征意義
- 夏商周考古課件 第5章 西周文化(1、2節(jié))
評(píng)論
0/150
提交評(píng)論