




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
納什均衡與我們的生活摘要:納什均衡是博弈論的一個(gè)重要術(shù)語(yǔ),以約翰?納什命名。納什均衡就是在人有限非合作博弈中的所有參與人的最優(yōu)策略組合。由于一個(gè)博弈的納什均衡解可能只有一個(gè),也可能有多個(gè),于是關(guān)于納什平衡點(diǎn)精煉的問題逐漸被提出,而每一種精煉都是為了剔除某種不合理或者脆弱的納什平衡點(diǎn),從而就產(chǎn)生了子博弈納什均衡、貝葉斯納什均衡、精煉貝葉斯納什均衡。關(guān)鍵詞:博弈論納什均衡生活納什均衡(Nashequilibrium),又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語(yǔ),以約翰?納什命名。博弈論,又叫做游戲理論或?qū)Σ哒摚且婚T以數(shù)學(xué)為基礎(chǔ),研究對(duì)抗沖突中最優(yōu)解問題的學(xué)科。雖然博弈論從本質(zhì)上來(lái)講是研究決策問題,但與傳統(tǒng)的決策分析相比,博弈論更加關(guān)注的是博弈決策中博弈各方的互動(dòng)行為。博弈論思想最早源于中國(guó)古代,成書于春秋時(shí)期的《孫子兵法》中的軍事理論與治國(guó)策略就蘊(yùn)含了豐富深刻的對(duì)策思想。博弈論真正成為數(shù)學(xué)的一個(gè)分支始于1944年,VonNeumann和Morgenstern合作的《博弈論與經(jīng)濟(jì)行為》一書的出版,第一次給博弈(game)以明確的數(shù)學(xué)描述;對(duì)博弈現(xiàn)象最早用數(shù)學(xué)方法來(lái)研究的則是數(shù)學(xué)家E.Zermelo,始于國(guó)際象棋,體現(xiàn)于其論文《集合論在象棋對(duì)策中的應(yīng)用》(1912);其后法國(guó)數(shù)學(xué)家Borel討論引入了“最優(yōu)策略”,并證明了其普遍存在性,同時(shí)預(yù)測(cè)了一些結(jié)論;在1950年和1951年,納什提出了非合作博弈的均衡解,并證明了均衡解的存在,自此博弈發(fā)展到了一個(gè)很重要的階段;到了二十世紀(jì)八九十年代,博弈論逐漸走向成熟,其發(fā)展已進(jìn)入前所未有的輝煌時(shí)期,博弈論重構(gòu)經(jīng)濟(jì)學(xué)大廈的趨勢(shì)正逐步變?yōu)楝F(xiàn)實(shí),在經(jīng)濟(jì)學(xué)中的應(yīng)用越來(lái)越廣泛,并正以主流經(jīng)濟(jì)學(xué)的面貌出現(xiàn)。隨著博弈論的不斷成熟,它不僅僅在經(jīng)濟(jì)領(lǐng)域和數(shù)學(xué)領(lǐng)域被廣泛研究,我們發(fā)現(xiàn)博弈的思想在日常生活中無(wú)處不在,博弈就像空氣,時(shí)刻伴隨在我們身邊,例如有名的“囚徒困境”、“智豬博弈”、“性別大戰(zhàn)”等,還有小孩子們玩的“石頭剪刀布”、“擲硬幣”,大人們玩的“斗地主”、麻將、象棋、乒乓球等都是博弈論的應(yīng)用。如果將博弈論與生活結(jié)合起來(lái),那么生活中每個(gè)人都如同棋手,其每一種行為如同在一張隱形的棋盤上布一個(gè)子,精明慎重的棋手們相互揣摩、相互牽制,人人爭(zhēng)贏,下出許多精彩紛呈、變化多端的棋局,而博弈論正是研究棋手們的策略與技巧,并將其系統(tǒng)化的一門科學(xué)。換句話說(shuō),就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中找到最合理的策略。在博弈論中,納什是完全信息靜態(tài)博弈的代表人物,他在1950年和1951年發(fā)表的兩篇論文中定義了非合作博弈及其均衡解,并給出了均衡解的證明,后來(lái)人們稱它為納什均衡,即是假設(shè)有個(gè)參與人博弈,給定其他人戰(zhàn)略的情況下,每個(gè)人選擇自己的最優(yōu)策略(個(gè)人最優(yōu)策略可依賴于也可能不依賴于其他人的策略),所有參與人選擇的策略一起構(gòu)成一個(gè)策略組合。納什均衡指的就是所有參與人的最優(yōu)策略組合。為了清楚地了解納什均衡,我們就以“囚徒困境”為例。據(jù)說(shuō)有一位富翁家中財(cái)物被盜,警方通過(guò)此偵破此案,發(fā)現(xiàn)有兩個(gè)嫌疑人A和B,將他們抓獲后從他們的住處搜出受害人家中丟失的財(cái)物。但是,他們都矢口否認(rèn),于是警方將兩人分開審訊。為了擊垮他們的心理防線,警方告訴他們,如果主動(dòng)坦白,可以從輕處罰;如果頑抗到底,一旦同伙招供,就要受到嚴(yán)懲。當(dāng)然,如果兩人都坦白,就不存在“主動(dòng)交代”,兩人都要受到嚴(yán)懲,只不過(guò)比抵賴要處罰輕一些。在這種情形下,兩個(gè)囚犯都可以作出自己的選擇,或者招供,即與警察合作,從而背叛他的同伙;或者保持沉默,與警察對(duì)抗到底。這樣,就會(huì)出現(xiàn)以下幾種情況:在這個(gè)例子里,納什均衡就是(坦白,坦白),在給定B坦白的情況下,A的最優(yōu)策略是坦白,同理,給定A坦白的情況下,B的最優(yōu)策略也是坦白。實(shí)際上,這里的(坦白,坦白)不僅是納什均衡,而且是一個(gè)占優(yōu)策略均衡,就是說(shuō),不論對(duì)方如何選擇,個(gè)人的最優(yōu)選擇都是坦白。比如說(shuō),若B抵賴,A坦白的話被放出來(lái),抵賴的話被判1年,所以坦白比抵賴好;若B坦白,A坦白的話被判8年,抵賴的話被判10年,所以坦白還是比抵賴好,這樣坦白既是A的占優(yōu)策略,又是B的占優(yōu)策略,結(jié)果是每個(gè)人都選擇坦白,各判8年?!扒敉嚼Ь场狈从沉藗€(gè)人理性與集體理性的矛盾,雖然兩個(gè)都抵賴各判刑1年顯然比都坦白各判刑8年好,但是他不滿足個(gè)人理性要求,即(抵賴,抵賴)不是納什均衡?!扒敉嚼Ь场钡乃枷朐谖覀兊娜粘I钪杏兄鴱V泛的應(yīng)用,比如市場(chǎng)上的商家常常通過(guò)降價(jià)來(lái)爭(zhēng)奪市場(chǎng),假設(shè)商家A和商家B是某市場(chǎng)上的兩個(gè)競(jìng)爭(zhēng)對(duì)手,他們?cè)瓉?lái)用同一種較高的價(jià)格銷售相同的產(chǎn)品,若這兩商家不滿足他們?cè)瓉?lái)的市場(chǎng)份額和利潤(rùn),就都想通過(guò)降價(jià)來(lái)爭(zhēng)奪更大的市場(chǎng)份額和利潤(rùn)。但值得注意的是,當(dāng)自己的降價(jià)引起對(duì)手的報(bào)復(fù)時(shí),這種目的就不一定達(dá)到。假設(shè)兩商家在原來(lái)的高價(jià)策略下各可以獲利200萬(wàn)元,若商家A單獨(dú)降價(jià)可以獲得250萬(wàn)元利潤(rùn),此時(shí)商家B因?yàn)槭袌?chǎng)份額被商家A搶去利潤(rùn)將下降到80萬(wàn)元,此時(shí)商家B也采取了降價(jià),則兩商家都只能得到120萬(wàn)元利潤(rùn),此時(shí)博弈可以由下表表示:由此表容易看出,假設(shè)商家B采用高價(jià)策略,那么商家A采用高價(jià)的200萬(wàn),采用低價(jià)得250萬(wàn),由于250大于200,商家A應(yīng)采用低價(jià),假設(shè)商家B采用低價(jià),那么商家A采用高價(jià)得益80萬(wàn),采用低價(jià)得益120萬(wàn),由于120大于80,因此商家A也采用低價(jià),用同樣的方法分析商家B,商家B也應(yīng)選低價(jià)策略,因而這個(gè)博弈的最終結(jié)果就是兩商家都采用低價(jià),最終各得120萬(wàn)元利潤(rùn),即(120,120)就是納什均衡解。當(dāng)然囚徒困境思想的應(yīng)用不僅僅是這一個(gè)例子,它還應(yīng)用在公共產(chǎn)品的供給、軍備競(jìng)賽、股票市場(chǎng)等許多方面。若女兒與小伙子不斷絕戀愛關(guān)系,她就與女兒斷絕母女關(guān)系。若女兒相信母親的話,女兒就會(huì)中斷與小伙子的戀愛關(guān)系,因?yàn)閼偃丝梢灾匦逻x擇,而母親則無(wú)法重新選擇。問題是假設(shè)女兒堅(jiān)持到底最終與小伙子結(jié)婚,母親難道真的會(huì)去斷絕母女關(guān)系嗎?一般來(lái)說(shuō)是不會(huì)的,因?yàn)閿嘟^母女關(guān)系對(duì)母親的損害會(huì)更大,這就是說(shuō),母親的威脅是不可置信的。聰明的女兒當(dāng)然會(huì)明白,一旦與男友生米煮成熟飯,母親只好妥協(xié)。結(jié)果是女兒會(huì)勇敢地堅(jiān)持戀愛并結(jié)婚,母親最終承認(rèn)那個(gè)她當(dāng)初并不喜歡的女婿。這就是此博弈中唯一的精煉納什均衡。納什均衡和子博弈完美納什均衡所反映的博弈都包括了一個(gè)基本假設(shè),即博弈的結(jié)構(gòu)、博弈的規(guī)則、所有局中人的策略空間和支付函數(shù)都是共同知道的,滿足這樣一個(gè)假設(shè)的博弈稱為“完全信息博弈”,但在現(xiàn)實(shí)生活中這一假設(shè)往往得不到滿足。在非合作博弈中,局中人對(duì)博弈的結(jié)構(gòu)和其他局中人的特征并沒有準(zhǔn)確的了解的情況叫“不完全信息博弈”。在1967年以前,博弈論專家對(duì)不完全信息博弈是束手無(wú)策的,直到1967年至1968年海薩尼提出了不完全信息靜態(tài)博弈,并定義了貝葉斯納什均衡,即在不完全信息靜態(tài)博弈中,參與人同時(shí)行動(dòng),沒有機(jī)會(huì)觀察到別人的選擇,給定別人的戰(zhàn)略選擇,每個(gè)參與人的最優(yōu)策略依賴于自己的類型,由于每個(gè)參與人僅知道其他參與人的類型的概率分布而不知道其真實(shí)類型,他不可能準(zhǔn)確地知道其他參與人實(shí)際上會(huì)選擇什么策略,這樣他決策的目標(biāo)就是在給定自己的類型和別人的類型依從策略的情況下,最大化自己的期望效用。也就是說(shuō),貝葉斯納什均衡就是給定自己的類型和別人類型的概率分布的情況下,每個(gè)參與人的期望效用達(dá)到了最大化。這種類型的例子在生活中也是無(wú)處不在,例如:某交通局有一段柏油路要包出去,通過(guò)招投標(biāo)來(lái)進(jìn)行。假設(shè)招標(biāo)的辦法為一級(jí)密封投標(biāo),讓每個(gè)投標(biāo)者將自己的標(biāo)價(jià)寫下并裝入信封,一同交給交通局,信封打開后交通局選擇標(biāo)價(jià)最低者為中標(biāo)者,此時(shí)不同的投標(biāo)者之間進(jìn)行的就是一場(chǎng)博弈。假定每個(gè)投標(biāo)者都不知道其他投標(biāo)者的真實(shí)生產(chǎn)成本而僅僅知道其概率分布,那么他在選擇自己的報(bào)價(jià)時(shí)就面臨著一種交替:一方面報(bào)價(jià)越低,中標(biāo)的可能性越大,但另一方面,給定中標(biāo)的情況,報(bào)價(jià)越低,利潤(rùn)就越小。分析證明,每個(gè)投標(biāo)人的標(biāo)價(jià)都依賴于他的生產(chǎn)成本,但一般來(lái)說(shuō),生產(chǎn)成本會(huì)低于貝葉斯納什均衡標(biāo)價(jià),二者之間的差異隨總投標(biāo)人數(shù)的增加而減少,也就是說(shuō),投標(biāo)人越多,交通局越有利。前面說(shuō)了靜態(tài)博弈,其實(shí)在生活中還有動(dòng)態(tài)博弈。在一個(gè)動(dòng)態(tài)博弈中,行動(dòng)是分先后次序的,后行動(dòng)者可以通過(guò)觀察先行動(dòng)者的行動(dòng)獲得有關(guān)后者偏好、戰(zhàn)略空間等方面的信息,修正自己的判斷。就像日常生活中通過(guò)觀察某人的行為表現(xiàn)來(lái)了解其品德一樣,顯然,先行動(dòng)者知道自己的行為有傳遞自己特征信息的作用,就會(huì)有意識(shí)地選擇某種行動(dòng)來(lái)掩飾自己的真實(shí)面目。當(dāng)然,在均衡狀態(tài)下,理性人是不會(huì)被蒙混的。1975年澤爾騰和克瑞普斯(1982年)等人相繼給出了不完全信息動(dòng)態(tài)博弈的精煉貝葉斯納什均衡的定義,即是當(dāng)事人根據(jù)所觀察到的他人的行為來(lái)修正自己有關(guān)后者類型的主觀概率,并由此選擇自己的行動(dòng)。在我們的生活中,這樣的例子也很多,例如:“黔驢之技”的就是一個(gè)不完全信息動(dòng)態(tài)博弈:一頭毛驢被帶到貴州時(shí),老虎從沒見過(guò)驢子見它威武高大,心想它的本領(lǐng)一定很大。老虎就很好奇,于是憑著這個(gè)判斷,老虎就躲在樹林里偷偷觀察毛驢,這是它的最優(yōu)選擇。過(guò)了一會(huì)兒,老虎走出樹林,逐漸靠近毛驢,就想獲得這個(gè)龐然大物的真實(shí)本領(lǐng)的信息。突然毛驢大叫一聲,老虎嚇了一跳,急忙逃走,這也是老虎的最優(yōu)選擇,因?yàn)槊H的叫聲是老虎意料之外的。過(guò)了兩天,老虎又來(lái)觀看,發(fā)現(xiàn)毛驢除了會(huì)大聲叫之外沒什么本領(lǐng),可是仍然不敢吃毛驢,因?yàn)樗€是不完全了解毛驢的真實(shí)本領(lǐng)。后來(lái),老虎逐漸靠近毛驢,并故意往毛驢身上擠,毛驢實(shí)在忍無(wú)可忍,就往老虎身上踢了一腳,這下老虎反倒高興了,因?yàn)樗懒嗣H不過(guò)就這點(diǎn)真實(shí)本領(lǐng),此時(shí),老虎對(duì)毛驢就有了全面的了解,于是撲過(guò)去就把毛驢吃掉了。在這個(gè)里,老虎通過(guò)觀察毛驢的行為逐漸修正了對(duì)毛驢的看法,直到看清它的真實(shí)本領(lǐng),最后把它吃掉,就是一個(gè)精煉貝葉斯均衡,而老虎的每一步行動(dòng)都是給定它的判斷下最優(yōu)的。事實(shí)上,毛驢的行為也是理性的,它知道自己技能有限,不到萬(wàn)不得已它不會(huì)用僅有的一技,否則它早就被老虎吃掉了。這種博弈的思想在生活中也很多,比如:強(qiáng)者欺負(fù)弱者,信號(hào)傳遞模型,等等。以上這些例子是我們?nèi)粘I钪薪?jīng)常碰到的,這些博弈的思想也不知不覺地被人們使用,雖然博弈的例子數(shù)不勝數(shù),但有一個(gè)共同特點(diǎn),即參與者都是在每一場(chǎng)博弈中尋求自己的最優(yōu)解。其實(shí),人生就是一個(gè)不斷合作和競(jìng)爭(zhēng)的過(guò)程,在這些合作與競(jìng)爭(zhēng)中,每個(gè)人都想使自己的利益最大化,從而得到一個(gè)自己認(rèn)為滿意的結(jié)果。由此看來(lái),學(xué)習(xí)博弈論的目的不在于解法而在于尋求巧妙的策略,學(xué)習(xí)博弈論不是為了享受分析博弈的過(guò)程,而在于贏得更好的結(jié)果。博弈的思想來(lái)自現(xiàn)實(shí)生活,它既可以高度抽象地用數(shù)學(xué)來(lái)表述,又可以用日常事例來(lái)說(shuō)明,并運(yùn)用到生活中去,沒有高深的數(shù)學(xué)知識(shí),我們同樣可以學(xué)習(xí)博弈論并成為生活中的策略高手,就像孫臏沒有學(xué)過(guò)高數(shù),但是這并不影響他通過(guò)最優(yōu)策略來(lái)幫助田忌贏得賽馬。
承諾書是承諾人對(duì)要約人的要約完全同意的意思,以書面形式表示。我愛文學(xué)網(wǎng)今天為大家精心準(zhǔn)備
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商業(yè)地下停車位租賃合同協(xié)議
- 3食物的消化(教學(xué)設(shè)計(jì))-2023-2024學(xué)年科學(xué)六年級(jí)上冊(cè)粵教版
- 版權(quán)許可合同 廣播電視節(jié)目播放權(quán)許可合同
- 地下停車場(chǎng)使用合同
- 2023-2024學(xué)年陜教版小學(xué)信息技術(shù)三年級(jí)下冊(cè) 第一單元 第3課 認(rèn)識(shí)鍵盤大家族(教學(xué)設(shè)計(jì))
- 機(jī)械施工勞務(wù)合同范本
- 7《健康看電視》(教學(xué)設(shè)計(jì))2024-2025學(xué)年統(tǒng)編版道德與法治四年級(jí)上冊(cè)
- 5 玲玲的畫(教學(xué)設(shè)計(jì))-2024-2025學(xué)年統(tǒng)編版語(yǔ)文二年級(jí)上冊(cè)
- 借款經(jīng)營(yíng)合同范本
- 贈(zèng)與過(guò)戶合同范本
- 《老年人權(quán)益保障法》
- 2025年交管12123駕駛證學(xué)法減分題庫(kù)與參考答案
- 2025下半年上海事業(yè)單位招考易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 天津市和平區(qū)2024-2025學(xué)年高一(上)期末質(zhì)量調(diào)查物理試卷(含解析)
- 《呼吸》系列油畫創(chuàng)作中詩(shī)意建構(gòu)的研究與實(shí)踐
- 客流統(tǒng)計(jì)系統(tǒng)施工方案
- 船舶制造設(shè)施安全生產(chǎn)培訓(xùn)
- 全國(guó)駕駛員考試(科目一)考試題庫(kù)下載1500道題(中英文對(duì)照版本)
- 設(shè)備損壞評(píng)估報(bào)告范文
- 標(biāo)準(zhǔn)和計(jì)量管理制度范文(2篇)
- 透析患者心理問題護(hù)理干預(yù)
評(píng)論
0/150
提交評(píng)論