![博弈論的幾個(gè)經(jīng)典模型詳解演示文稿_第1頁(yè)](http://file4.renrendoc.com/view/bc6a2b6efa313f5f5925b2f8ca32956f/bc6a2b6efa313f5f5925b2f8ca32956f1.gif)
![博弈論的幾個(gè)經(jīng)典模型詳解演示文稿_第2頁(yè)](http://file4.renrendoc.com/view/bc6a2b6efa313f5f5925b2f8ca32956f/bc6a2b6efa313f5f5925b2f8ca32956f2.gif)
![博弈論的幾個(gè)經(jīng)典模型詳解演示文稿_第3頁(yè)](http://file4.renrendoc.com/view/bc6a2b6efa313f5f5925b2f8ca32956f/bc6a2b6efa313f5f5925b2f8ca32956f3.gif)
![博弈論的幾個(gè)經(jīng)典模型詳解演示文稿_第4頁(yè)](http://file4.renrendoc.com/view/bc6a2b6efa313f5f5925b2f8ca32956f/bc6a2b6efa313f5f5925b2f8ca32956f4.gif)
![博弈論的幾個(gè)經(jīng)典模型詳解演示文稿_第5頁(yè)](http://file4.renrendoc.com/view/bc6a2b6efa313f5f5925b2f8ca32956f/bc6a2b6efa313f5f5925b2f8ca32956f5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論的幾個(gè)經(jīng)典模型詳解演示文稿目前一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)優(yōu)選博弈論的幾個(gè)經(jīng)典模型目前二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈論的應(yīng)用領(lǐng)域十分廣泛,在經(jīng)濟(jì)學(xué)、政治科學(xué)(國(guó)內(nèi)的以及國(guó)際的)、軍事戰(zhàn)略問(wèn)題、進(jìn)化生物學(xué)以及當(dāng)代的計(jì)算機(jī)科學(xué)等領(lǐng)域都已成為重要的研究和分析工具。此外,它還與會(huì)計(jì)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)基礎(chǔ)、社會(huì)心理學(xué)以及諸如認(rèn)識(shí)論與倫理學(xué)等哲學(xué)分支有重要聯(lián)系。引言目前三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)按照Aumann所撰寫的《新帕爾格雷夫經(jīng)濟(jì)學(xué)大辭典》“博弈論”辭條的看法,標(biāo)準(zhǔn)的博弈論分析出發(fā)點(diǎn)是理性的,而不是心理的或社會(huì)的角度。不過(guò),近30年來(lái)結(jié)合心理學(xué)和行為科學(xué)、實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究成就而對(duì)博弈論進(jìn)行一定改造的行為博弈論(behavoiralgametheory)也日益興起。引言目前四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)失火了,你往哪個(gè)門跑——這就是博弈論
一天晚上,你參加一個(gè)派對(duì),屋里有很多人,你玩得很開(kāi)心。這時(shí)候,屋里突然失火,火勢(shì)很大,無(wú)法撲滅。此時(shí)你想逃生。你的面前有兩個(gè)門,左門和右門,你必須在它們之間選擇。但問(wèn)題是,其他人也要爭(zhēng)搶這兩個(gè)門出逃。如果你選擇的門是很多人選擇的,那么你將因人多擁擠、沖不出去而燒死;相反,如果你選擇的是較少人選擇的,那么你將逃生。這里我們不考慮道德因素,你將如何選擇?目前五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)你的選擇必須考慮其他人的選擇,而其他人的選擇也考慮你的選擇。你的結(jié)果——博弈論稱之為支付,不僅取決于你的行動(dòng)選擇——博弈論稱之為策略選擇,同時(shí)取決于他人的策略選擇。你和這群人構(gòu)成一個(gè)博弈(game)。上述博弈是一個(gè)叫張翼成的中國(guó)人在1997年提出的一個(gè)博弈論模型,被稱之為少數(shù)者博弈或少數(shù)派博弈(MinorityGame)。生活中博弈的案例很多,你會(huì)見(jiàn)到很多例子。只要涉及到人群的互動(dòng),就有博弈。
引言目前六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)什么叫博弈?博弈的英文為game,我們一般將它翻譯成“游戲”。而在西方,game的意義不同于漢語(yǔ)中的游戲。在英語(yǔ)中,game即是人們遵循一定規(guī)則下的活動(dòng),進(jìn)行活動(dòng)的人的目的是使自己“贏”。奧林匹克運(yùn)動(dòng)會(huì)叫OlympicGames。在英文中,game有競(jìng)賽的意思,進(jìn)行g(shù)ame的人是很認(rèn)真的,不同于漢語(yǔ)中游戲的概念。在漢語(yǔ)中,游戲有兒戲的味道。因此將關(guān)于game的理論,即gametheory翻譯成博弈論或者對(duì)策論,是恰當(dāng)?shù)摹?/p>
引言目前七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈論的出現(xiàn)只有60多年的歷史。博弈論的開(kāi)創(chuàng)者為諾意曼與摩根斯坦,他們1944年出版了《博弈論與經(jīng)濟(jì)行為》。博弈論天才納什(JohnNash)的開(kāi)創(chuàng)性論文《n人博弈的均衡點(diǎn)》(1950)、《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。今天博弈論已發(fā)展成一個(gè)較完善的學(xué)科。博弈論對(duì)于社會(huì)科學(xué)有著重要的意義,它正成為社會(huì)科學(xué)研究范式中的一種核心工具,以至于我們可稱博弈論是“社會(huì)科學(xué)的數(shù)學(xué)”,或者說(shuō)是關(guān)于社會(huì)的數(shù)學(xué)。引言目前八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
1994年經(jīng)濟(jì)學(xué)諾貝爾獎(jiǎng)?lì)C發(fā)給三位博弈論專家:納什、塞爾屯(R.Selten)、海薩尼(JohnC.Harsanyi),而像1985年獲得諾貝爾獎(jiǎng)的公共選擇學(xué)派的領(lǐng)導(dǎo)者布坎南,1995年獲得諾貝爾獎(jiǎng)的理性主義學(xué)派的領(lǐng)袖盧卡斯(Lukas),其理論與博弈論都有著較深的聯(lián)系?,F(xiàn)在博弈論正滲透到各門社會(huì)科學(xué),更重要的是它正深刻地改變著人們的思維。引言目前九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)汪賢裕、肖玉明編著,博弈論及其應(yīng)用,科學(xué)出版社,2008年2月潘天群著,博弈生存(第二版),中央編譯出版社,2004年10月王春永編著,博弈論的詭計(jì),中國(guó)發(fā)展出版社,2007年1月參考書目前十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈論研究的對(duì)象:是理性的行動(dòng)者或參與者如何選擇策略或如何作出行動(dòng)的決定。理性的人是對(duì)現(xiàn)實(shí)的人的基本假定,即假定參與者努力用自己的推理能力使自己的目標(biāo)最大化?!袄硇缘摹迸c“道德的”不是一回事,理性的與道德的有時(shí)會(huì)發(fā)生沖突,但是理性的人不一定是不道德的。基本術(shù)語(yǔ)目前十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈涉及哪些內(nèi)容呢?博弈涉及至少兩個(gè)獨(dú)立的博弈參與者(player)。博弈涉及行動(dòng)者存在著策略(strategy)選擇的可能,博弈論用策略空間來(lái)表示參與者可以選擇的策略。
參與者在不同策略組合下會(huì)得到一定的支付(payoff)。對(duì)于博弈參與者來(lái)說(shuō),存在著一博弈結(jié)果。博弈涉及均衡。重要的均衡——納什均衡?;拘g(shù)語(yǔ)目前十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動(dòng),博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。合作性博弈:是指參與者從自己的利益出發(fā)與其他參與者談判達(dá)成協(xié)議或形成聯(lián)盟,其結(jié)果對(duì)聯(lián)盟方均有利;
非合作性博弈:是指參與者在行動(dòng)選擇時(shí)無(wú)法達(dá)成約束性的協(xié)議。人們分工與交換的經(jīng)濟(jì)活動(dòng)就是合作性的博弈,而囚徒困境則是非合作性的博弈。博弈的類型目前十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈又可分靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈:指參與者同時(shí)采取行動(dòng),或者盡管參與者行動(dòng)的采取有先后順序,但后行動(dòng)的人不知道先采取行動(dòng)的人采取的是什么行動(dòng)。動(dòng)態(tài)博弈:指參與者的行動(dòng)有先后順序,并且后采取行動(dòng)的人可以知道先采取行動(dòng)的人所采取的行動(dòng)。
博弈的類型目前十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)從知識(shí)的擁有程度來(lái)看,博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內(nèi)容。完全信息博弈:參與者對(duì)所有參與者的策略空間及策略組合下的支付有“完全的了解”,否則是不完全信息博弈。嚴(yán)格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識(shí)”的博弈。不完全信息博弈:參與者所做的是努力使自己的期望支付或期望效用最大化。
博弈的類型目前十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)例:豬圈里有兩只豬,一只比較大,一只比較小。豬圈狹長(zhǎng),豬食槽在一頭,豬食按鈕在另一頭,按一下會(huì)有10個(gè)單位的豬食落進(jìn)槽里。由于按鈕和食槽距離較遠(yuǎn),按按鈕的體力耗費(fèi)相當(dāng)于2個(gè)單位的食物。
模型一、智豬博弈/完全信息靜態(tài)博弈
小豬大豬按不按(等待)按(5,1)(5,3)不按(等待)(9,-1)(0,0)大豬和小豬分別該如何選擇。
目前十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)選擇等待是小豬的占優(yōu)策略。大豬的最佳選擇取決于小豬的行動(dòng),如果小豬去按,大豬最好選擇等待;如果小豬不去按,則最佳選擇是大豬親自去按。也就是說(shuō),在智豬博弈中,大豬沒(méi)有占優(yōu)策略,而小豬有占優(yōu)策略,它的最佳選擇就是耐心等待大豬去按鈕,才能獲得最佳結(jié)果?!靶∝i躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。模型一、智豬博弈/完全信息靜態(tài)博弈目前十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。改變方案一:減量方案。改變方案二:增量方案。改變方案三:減量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?而多勞者多得。每次的收獲剛好消費(fèi)完。
對(duì)于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。模型一、智豬博弈/完全信息靜態(tài)博弈目前十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”(prisoners’dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個(gè)警察與小偷的故事。模型二、囚徒困境/非合作博弈目前十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)假設(shè):有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒(méi)有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。模型二、囚徒困境/非合作博弈目前二十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡。模型二、囚徒困境/非合作博弈乙
甲坦白抵賴坦白(-8,-8)(0,-10)抵賴(-10,0)(-1,-1)目前二十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)對(duì)于兩個(gè)犯罪嫌疑人總體而言,他們?cè)O(shè)想的最好的策略可能是都不交代。但任何一個(gè)犯罪嫌疑人在選擇不交代的策略時(shí),都要冒很大的風(fēng)險(xiǎn),一旦自己不交代而另一犯罪嫌疑人交代了,自己就將可能處于非常不利的境地。對(duì)于A而言,不管B采取何種策略,他的最佳策略都是交代。對(duì)于B而言也是如此。最后兩人都會(huì)選擇交代。模型二、囚徒困境/非合作博弈目前二十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)該博弈刻劃了兩大難題:沖突情形下,參與人的目標(biāo)是什么?是采用(作為個(gè)人)他自己的最好策略,還是采用(作為集體的一員)他們共同的最好策略?前者導(dǎo)致均衡策略(坦白,坦白),支付為(-8,-8);后者的最好策略是(抵賴,抵賴),支付為(-1,-1)。這里反映了個(gè)體理性行為與集體理性行為之間的矛盾、沖突。此博弈只進(jìn)行一次還是重復(fù)進(jìn)行?如果博弈只進(jìn)行一次,參與人似乎只有坦白才是最好的策略,因?yàn)闆](méi)有理由相信對(duì)手會(huì)對(duì)你有信心,他總認(rèn)為你自己會(huì)坦白;因此,雙方都采取坦白策略。然而,若博弈進(jìn)行多次,則結(jié)論將會(huì)發(fā)生變化。模型二、囚徒困境/非合作博弈目前二十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)囚徒困境可以用來(lái)說(shuō)明許多現(xiàn)象。寡頭定價(jià)拍賣出價(jià)推銷員的努力政治上的討價(jià)還價(jià)軍備競(jìng)賽等(沖突中出現(xiàn)兩敗俱傷的情況,往往要考慮到囚徒困境)
*(純策略)納什均衡模型二、囚徒困境/非合作博弈目前二十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)什么是博弈論?試舉兩個(gè)你生活中的例子說(shuō)明。某年在荷蘭召開(kāi)了一次“合作及社會(huì)兩難困境研討會(huì)”,與會(huì)者都是博弈論的專家。當(dāng)大會(huì)結(jié)束之后,有兩個(gè)學(xué)者,麥息克和路特提議大家玩一個(gè)游戲。他們將一個(gè)大信封拿出來(lái),請(qǐng)?jiān)趫?chǎng)的43位專家拿出金錢裝到這個(gè)信封里。如果到最后這信封里的錢超過(guò)250元,麥息克和路特將自己掏腰包,退還每人10元。不過(guò),如果最后信封內(nèi)的錢不足250元,就統(tǒng)統(tǒng)沒(méi)收,大家拿不到半毛錢。
仔細(xì)想一想,如果你也在場(chǎng),你會(huì)奉獻(xiàn)多少錢呢?問(wèn)題與思考目前二十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)什么是海薩尼轉(zhuǎn)換?海薩尼提出了一種處理不完全信息博弈的方法,即引入一個(gè)虛擬的局中人——“自然”。自然首先行動(dòng),它決定每個(gè)局中人的特征。每個(gè)局中人知道自己的特征,但不知道別的局中人特征。這種方法將不完全信息靜態(tài)博弈變成一個(gè)兩階段動(dòng)態(tài)博弈,第一個(gè)階段是自然N的行動(dòng)選擇,第二階段是除N外的局中人的靜態(tài)博弈。這種轉(zhuǎn)換被稱為“海薩尼轉(zhuǎn)換”,這個(gè)轉(zhuǎn)換把“不完全信息”轉(zhuǎn)變成為完全但不完美信息,從而可以用分析完全信息博弈的方法進(jìn)行分析。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)海薩尼轉(zhuǎn)換的具體方法一個(gè)虛擬的參與人“自然”,自然首先決定參與人的類型,賦予各參與人的類型向量,其中;
自然告知參與者自己的類型,卻不告訴其他參與者的類型;參與者同時(shí)選擇行動(dòng),每一參與者從可行集中選擇行動(dòng)方案;各方得到收益。借助于第一步和第二步中虛構(gòu)的參與者“自然”的行動(dòng),我們可以把一個(gè)不完全信息的博弈表述為一個(gè)不完美信息的博弈。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)海薩尼轉(zhuǎn)換分析海薩尼轉(zhuǎn)換是處理不完全信息博弈的標(biāo)準(zhǔn)方法。一般地,“自然”在博弈開(kāi)始的時(shí)候選擇參與人的類型,參與人的某個(gè)類型包括表征類型的各個(gè)特征如策略空間、信息集、得益函數(shù)等,這些又稱為該類型參與人所擁有的個(gè)人信息。不完全信息意味著博弈各方中至少有一個(gè)參與人有多個(gè)類型。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)通過(guò)海薩尼轉(zhuǎn)換,博弈開(kāi)始時(shí),所有參與人有關(guān)“自然”的行動(dòng)有一致的信念,即都知道所有參與人類型的概率分布函數(shù),此即“海薩尼公理”。
模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)經(jīng)典案例解析例:某一市場(chǎng)原來(lái)被A企業(yè)所壟斷?,F(xiàn)在B企業(yè)考慮是否進(jìn)入。B企業(yè)知道,A企業(yè)是否允許它進(jìn)入,取決于A企業(yè)阻撓B企業(yè)進(jìn)入所花費(fèi)的成本。如果阻撓的成本低,那么,正如下表后兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是阻撓,博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡——A阻撓,B不進(jìn)入。如果阻撓的成本高,那么,正如下表前兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是默許B進(jìn)入,博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡——A默許,B進(jìn)入。B企業(yè)所不知道的,是A企業(yè)的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在本例中,阻撓成本就是A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前三十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)海薩尼轉(zhuǎn)換后的市場(chǎng)進(jìn)入博弈:模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈
AB高成本低成本默許阻撓默許阻撓進(jìn)入(40,50)(-10,0)(30,100)(-10,140)不進(jìn)入(0,300)(0,300)(0,400)(0,400)顯然,在這里,B所遇到的,是不確定性條件下的選擇問(wèn)題。因?yàn)锽不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。目前三十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
按照海薩尼的方法,所有參與人的真實(shí)類型都是給定的。其他參與人雖然不清楚某一參與人的真實(shí)類型,但知道這些可能出現(xiàn)的類型的分布概率,而且這種概率是公共知識(shí)。用本例來(lái)說(shuō),公共知識(shí)不僅意味著B(niǎo)企業(yè)知道A企業(yè)高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前三十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈N低成本高成本ABB(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)ABB默許默許阻撓阻撓進(jìn)入不進(jìn)入進(jìn)入進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入不進(jìn)入*貝葉斯納什均衡
目前三十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)言語(yǔ)博弈中的“威脅”與“承諾”
在現(xiàn)實(shí)中,我們經(jīng)??吹铰暦Q的策略決定,但是這些聲稱的策略可信嗎?聲稱的策略包括“威脅”與“承諾”。在國(guó)際核武器問(wèn)題上,我國(guó)及其他一些國(guó)家承諾“不首先使用核武器”就是一種言語(yǔ)承諾。博弈論中,經(jīng)常用“可置信”和“不可置信”的“威脅”或“承諾”來(lái)區(qū)分行動(dòng)者說(shuō)出來(lái)的策略,我們?cè)趯?duì)動(dòng)態(tài)博弈的分析中會(huì)分析什么樣的策略是可置信的,什么樣的策略是不可置信的。而分析“威脅”或“承諾”是可置信的還是不可置信的方法是倒推法。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前三十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)倒推法(backwardinduction)也叫逆向歸納法。那么什么是倒推法?要理解什么是倒推法,先來(lái)看一下商界里經(jīng)常見(jiàn)到的博弈。在某個(gè)城市假定只有一家房地產(chǎn)開(kāi)發(fā)商A,我們知道任何沒(méi)有競(jìng)爭(zhēng)下的壟斷利潤(rùn)是很高的,假定A此時(shí)每年的壟斷利潤(rùn)是10億元。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前三十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)現(xiàn)在假定有另外一個(gè)企業(yè)B,準(zhǔn)備從事房地產(chǎn)開(kāi)發(fā)。面對(duì)著B(niǎo)要進(jìn)入其壟斷的行業(yè),A想:一旦B進(jìn)入,A的利潤(rùn)將受損很多,B最好不要進(jìn)入。所以A向B表示,你進(jìn)入的話,我將阻撓你進(jìn)入。假定當(dāng)B進(jìn)入時(shí)A阻撓的話,A的利潤(rùn)降低到2,B的利潤(rùn)是-1。而如果A不阻撓的話,A的利潤(rùn)是4,B的利潤(rùn)也是4。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前三十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這樣一個(gè)博弈可用下圖表示:模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
B進(jìn)入不進(jìn)入AA:10;B:0阻撓不阻撓A:2;B:-1A:4;B:4目前三十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
上圖稱之為博弈樹(shù)。由上圖可見(jiàn),這個(gè)博弈由兩階段構(gòu)成。我們稱之為動(dòng)態(tài)博弈,或者兩階段的動(dòng)態(tài)博弈。博弈樹(shù)是表示動(dòng)態(tài)博弈的一個(gè)好方法。
現(xiàn)在讓我們回到房地產(chǎn)開(kāi)發(fā)商之間的博弈問(wèn)題。A的最好結(jié)局是“B不進(jìn)入”,而B(niǎo)的最好結(jié)局是“進(jìn)入”而A“不阻撓”。這兩個(gè)最好的結(jié)局不能構(gòu)成均衡。那么結(jié)果是什么呢?模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前三十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)A向B發(fā)出威脅:如果你進(jìn)入,我將阻撓。而對(duì)B來(lái)說(shuō),如果進(jìn)入,A真的阻撓的話,它將受損失-1(假定-1是它的機(jī)會(huì)成本),當(dāng)然此時(shí)A也有損失。對(duì)于B來(lái)說(shuō),問(wèn)題是:A的威脅可置信嗎?B通過(guò)分析得出:A的威脅是不可置信的。原因是:當(dāng)B進(jìn)入的時(shí)候,A阻撓的收益是2,而不阻撓的收益是4。4>2,理性人是不會(huì)選擇做非理性的事情的。也就是說(shuō),一旦B進(jìn)入,A的最好策略是合作,而不是阻撓。因此,通過(guò)分析,B選擇了進(jìn)入,而A選擇了合作。雙方的收益各為4。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前三十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
在這個(gè)博弈中,B采用的方法為倒推法,或者說(shuō)逆向歸納法,即:當(dāng)參與者作出決策時(shí),他要通過(guò)對(duì)最后階段的分析,準(zhǔn)確預(yù)測(cè)對(duì)方的行為,從而確定自己的行為。在這里,雙方必須都是理性的。如果不滿足這個(gè)條件,就無(wú)法進(jìn)行分析了。這個(gè)例子只是簡(jiǎn)單的兩階段博弈,而三階段或更多階段的博弈,可用同樣方法加以分析。在動(dòng)態(tài)博弈中,涉及“威脅”與“承諾”是不是可信的問(wèn)題。靜態(tài)地看,一博弈存在許多均衡。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前四十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)上述“進(jìn)入——阻撓”問(wèn)題的博弈樹(shù)可用支付矩陣表示:模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
BA進(jìn)入阻撓阻撓(2,-1)(10,0)不阻撓(4,4)(10,0)在這個(gè)矩陣中,納什均衡點(diǎn)有兩個(gè):(合作,進(jìn)入)和(阻撓,不進(jìn)入)。我們可以驗(yàn)證,在這兩點(diǎn)上誰(shuí)都不愿意改變策略。然而(阻撓,不進(jìn)入)這個(gè)均衡是達(dá)不到的。因?yàn)檫@是動(dòng)態(tài)博弈,在這個(gè)動(dòng)態(tài)博弈中,存在著先后策略選擇順序。目前四十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這里分析的是完全且完美信息下的動(dòng)態(tài)博弈。所謂完全信息是指:博弈的支付函數(shù)是“公共知識(shí)”。本書中未涉及不完全信息的博弈問(wèn)題,如囚徒困境這樣的靜態(tài)博弈也是完全信息博弈。完美信息是針對(duì)動(dòng)態(tài)博弈而言的,指參與者知道博弈的所有歷史。倒推法是動(dòng)態(tài)博弈中有用的工具,它可以說(shuō)是理性的人自然的推理方式。然而倒推法面臨著一個(gè)困難,這就是蜈蚣博弈的悖論。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前四十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)前面我們分析了“威脅”是否可信,我們也可用同樣的思路分析一個(gè)“承諾”是否可信?!安皇紫仁褂煤宋淦鳌钡某兄Z可信嗎?
*子博弈完美納什均衡模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈
目前四十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)光天化日之下的違法行為為什么總能成功?
人類有許多關(guān)于猴子的故事,比如朝三暮四,殺雞給猴看。其實(shí)猴子是沒(méi)有思維的,它們有一定的群體意識(shí),但沒(méi)有社會(huì)意識(shí),人們關(guān)于它們的故事其實(shí)是說(shuō)人自己的。我們這里也講一個(gè)猴子的故事……。在現(xiàn)實(shí)社會(huì)中,竊賊在公共場(chǎng)所比如公共汽車上偷東西時(shí),車上的乘客看到了,但不敢吭聲。沒(méi)有被偷的人想,反正被偷的待宰猴群的結(jié)局人不是我,我反抗了,我得不到任何好處,反而遭到傷害;而不反抗雖不得益,但也不受損,我何必要反抗呢?這就是光天化日之下的偷竊行為為什么總能成功的原因。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)竊賊在偷東西時(shí)發(fā)出這樣的信號(hào):如果誰(shuí)反抗,將毆打誰(shuí)。乘客想,竊賊的威脅是可信的:因?yàn)槿绻麄€(gè)別乘客反抗,而竊賊不毆打該乘客的話,就會(huì)有更多的乘客抓竊賊,竊賊將有可能被抓,因此竊賊必然歐打反抗的乘客。乘客的策略及可能的支付為:反抗,有可能被毆打甚至受傷;不反抗,無(wú)所得也無(wú)所失。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客:受傷竊賊:可能被抓,可能逃脫乘客:無(wú)所得,無(wú)所失竊賊:被抓竊賊毆打不毆打乘客:受傷竊賊:得到贓物乘客:無(wú)所得,無(wú)所失竊賊:得到贓物目前四十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
對(duì)于乘客來(lái)說(shuō),竊賊的威脅是可信的,因而乘客的最優(yōu)策略是“不反抗”;而對(duì)于竊賊來(lái)說(shuō),乘客“不反抗”下的“不毆打”策略為最憂。這一博弈的結(jié)果是,竊賊偷東西時(shí)“乘客不反抗,竊賊不敢打”,這是一“子精煉納什均衡”。這樣一種群體不反抗的結(jié)果將使社會(huì)風(fēng)氣惡化,偷竊之風(fēng)盛行。對(duì)個(gè)體來(lái)說(shuō),雖然這一次被偷的不是你,但下次你被偷的幾率增加了。這使得我們都如同待宰的猴子,我們不知道什么時(shí)候輪到我們自己。這樣,我們每個(gè)人的處境比以前更差。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)如何從這種困境中擺脫出來(lái)?我們看到,使乘客采取“反抗”策略,而非“不反抗”策略在于加大采取“反抗”策略的獲益,而減少不反抗的獲益。當(dāng)“反抗”策略下的獲益大于“不反抗”策略下的獲益時(shí),乘客就會(huì)采取“反抗”的策略。加大道德宣傳,培養(yǎng)人的道德感可以解決這個(gè)囚徒困境。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客:受傷,但沒(méi)有道德滿足感竊賊:可能被抓,可能逃脫乘客:沒(méi)有受傷并有道德滿足感竊賊:被抓竊賊毆打不毆打乘客:受傷,并有道德恥辱感竊賊:得到贓物乘客:道德恥辱感竊賊:得到贓物上述博弈過(guò)程為:目前四十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這樣,當(dāng)小偷偷東西時(shí),盡管乘客認(rèn)為竊賊的威脅是可信的,但是如果乘客是道德感強(qiáng)的人,那么博弈結(jié)果是“乘客反抗,小偷毆打”,從而小偷有可能被抓住,這也是一“子精煉納什均衡”。博弈論對(duì)不合作的博弈結(jié)果的預(yù)測(cè)是令人悲哀的。但是,從這個(gè)例子我們看到,道德就是由群體實(shí)施的對(duì)所謂“非道德”的行為進(jìn)行非強(qiáng)制性的懲罰機(jī)制,而法律及實(shí)施法律的國(guó)家的形成與改進(jìn)就是建立一個(gè)對(duì)所謂“違法行為”實(shí)施的中心懲罰機(jī)制。
*精煉貝葉斯納什均衡;混同均衡;分離均衡模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前五十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)哪種策略更能贏?假定我們的社會(huì)已經(jīng)形成約束行動(dòng)者的道德規(guī)范。如果對(duì)不道德的行為不能產(chǎn)生即時(shí)的懲罰,不道德的行為在社會(huì)中往往能給行為者帶來(lái)好處。這表現(xiàn)在一次性的非合作的博弈中,行為者理性地選取對(duì)自己有利的行動(dòng)。但是,如果存在重復(fù)博弈,參與者之間對(duì)不合作行為就會(huì)形成懲罰機(jī)制。對(duì)囚徒困境進(jìn)行無(wú)限次的重復(fù)博弈,什么樣的策略會(huì)贏?模型六、有效工資率/重復(fù)博弈
目前五十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這里涉及參與者以什么樣的態(tài)度對(duì)待對(duì)方的不合作策略。在博弈論里,有兩個(gè)著名的策略。如果一方采取不合作的策略另一方隨即也采取不合作策略并且永遠(yuǎn)采取不合作策略,在博弈論里面稱之為觸發(fā)策略,或稱冷酷策略,英文叫triggerstrategy。模型六、有效工資率/重復(fù)博弈
乙甲不合作合作不合作(1,1)(4,0)合作(0,4)(2,2)目前五十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)如果對(duì)方知道你的策略是觸發(fā)策略,那么對(duì)方將不敢采取不合作策略,因?yàn)橐坏┧扇×瞬缓献鞑呗?,雙方便永遠(yuǎn)進(jìn)入不合作的困境。因此,只要有人采取觸發(fā)策略,那么雙方均愿意采取合作策略。但是這個(gè)策略面臨著這樣一個(gè)問(wèn)題:如果雙方存在誤解,或者由于一方發(fā)生選擇性的錯(cuò)誤,這個(gè)錯(cuò)誤是無(wú)意的,那么結(jié)果將是雙方均采取不合作的策略。也就是說(shuō),這種策略不給對(duì)方一個(gè)改正錯(cuò)誤或解釋錯(cuò)誤的機(jī)會(huì)。模型六、有效工資率/重復(fù)博弈
目前五十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)第二種策略是,若你采取不合作策略,我也采取不合作策略,但是如果你采取了合作策略,我也采取合作策略。這叫“一報(bào)還一報(bào)”策略,或者稱之為“針?shù)h相對(duì)”,英文叫tit-for-tat。美國(guó)密執(zhí)安大學(xué)的羅伯特·??怂沽_德(RobertAxerold)主持了一次計(jì)算機(jī)比賽,看誰(shuí)寫出來(lái)的程序能夠贏。參加者有政治學(xué)家、數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家,他們都詳細(xì)研究過(guò)囚徒困境。獲勝者是加拿大多倫多大學(xué)的拉波波特寫出的tit-for-tat策略。這個(gè)程序非常簡(jiǎn)單:第一步采取合作,接著對(duì)方采取什么策略,他便跟著做什么。模型六、有效工資率/重復(fù)博弈
目前五十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
當(dāng)然有多種策略,如對(duì)方采取了不合作,但自己永遠(yuǎn)采取合作策略,這個(gè)策略可以叫做“以德報(bào)怨”策略。這個(gè)策略對(duì)行動(dòng)者最為不利,因?yàn)閷?duì)方知道你采取這種策略,他會(huì)永遠(yuǎn)采取不合作的策略,因而理性的人是不會(huì)采取這種“以德報(bào)怨”策略的。然而,極端道德的人是超越理性的限制的,此時(shí)他會(huì)采取“以德報(bào)怨”策略。佛說(shuō):“我不入地獄,誰(shuí)入地獄?”基督說(shuō):“愛(ài)你的敵人?!彼麄儛?ài)一切人而不會(huì)計(jì)算他愛(ài)的行動(dòng)會(huì)給他帶來(lái)利益或?yàn)?zāi)難,而是希望他的行動(dòng)感化眾生。模型六、有效工資率/重復(fù)博弈
目前五十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
如果是有限次的囚徒困境,那么情況就不同于上述無(wú)限次的囚徒困境的重復(fù)博弈。當(dāng)臨近博弈的終點(diǎn)時(shí),采取不合作策略的可能性加大,如果參與人以前的所有策略均為合作策略,并且被告知下一次博弈是最后一次,那么雙方肯定采取不合作的策略。
這可以解釋許多商業(yè)行為。一次性的買賣往往發(fā)生在雙方以后不再有買賣機(jī)會(huì)的時(shí)候,盡量謀取高利并且?guī)垓_性是其特點(diǎn)。而靠“熟客”、“回頭客”便是通過(guò)薄利行為使得雙方能繼續(xù)合作下去。模型六、有效工資率/重復(fù)博弈
目前五十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
非合作博弈理論把存在于如銀行業(yè)經(jīng)營(yíng)、國(guó)際融資選擇、商業(yè)周期出現(xiàn)、社會(huì)習(xí)俗形成和中介機(jī)構(gòu)出現(xiàn)及制度設(shè)計(jì)等各經(jīng)濟(jì)領(lǐng)域的協(xié)調(diào)問(wèn)題模型化為協(xié)調(diào)博弈,存在多個(gè)嚴(yán)格納什均衡是這類博弈根本特點(diǎn),協(xié)調(diào)博弈成為了繼囚徒困境博弈之后又一被廣泛研究的博弈類型。多重均衡是對(duì)傳統(tǒng)經(jīng)濟(jì)理論的一個(gè)挑戰(zhàn),也是非合作博弈理論致命之所在,為尋找解決協(xié)調(diào)問(wèn)題的方法,學(xué)者們從理論上對(duì)協(xié)調(diào)博弈進(jìn)行了廣泛而深入的探討。協(xié)調(diào)博弈理論研究有助于解決非合作博弈的多重均衡問(wèn)題,在近十幾年成了為學(xué)術(shù)界關(guān)注的焦點(diǎn)。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前五十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
對(duì)稱協(xié)調(diào)博弈是指無(wú)角色區(qū)分的參與之間進(jìn)行的協(xié)調(diào)博弈,它表現(xiàn)在支付函數(shù)的對(duì)稱上,策略集是一樣的。從形式上看:對(duì)稱協(xié)調(diào)博弈就是博弈支付矩陣主對(duì)角線上的元素都是納什均衡的博弈。協(xié)調(diào)博弈的均衡選擇并不涉及到激勵(lì)問(wèn)題而依賴于參與人之間對(duì)博弈如何進(jìn)行有充分相似的信念。正是由于信念形成是一個(gè)相對(duì)復(fù)雜的過(guò)程,所以對(duì)協(xié)調(diào)博弈均衡問(wèn)題的研究也就顯得非常復(fù)雜,不同的信念形成過(guò)程動(dòng)態(tài)就會(huì)產(chǎn)生不同的均衡。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前五十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
對(duì)稱協(xié)調(diào)博弈是一類特殊的博弈,均衡選擇不僅要滿足預(yù)期的一致性,而且要滿足行動(dòng)的一致性,因此,博弈結(jié)果必定收斂到純策略而非混合策略納什均衡。更為重要的是,協(xié)調(diào)博弈還有策略互補(bǔ)性及支付外溢性這兩個(gè)重要特征,它是分析協(xié)調(diào)博弈多重均衡問(wèn)題的出發(fā)點(diǎn)。對(duì)稱協(xié)調(diào)博弈分成三類:支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致;支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)一致(嚴(yán)格納什均衡可進(jìn)行帕累托排序均衡);無(wú)占優(yōu)性可比的協(xié)調(diào)博弈。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前五十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致的協(xié)調(diào)博弈這類博弈最典型的例子就是獵鹿博弈。有兩個(gè)打獵人,他們可以合作去獵鹿也可以單獨(dú)去獵兔,如果合作獵鹿,那么兩個(gè)都可以分得4個(gè)單位的支付;如果一個(gè)人去獵鹿而另一個(gè)人去獵兔,那么前者支付為0(因?yàn)楂C鹿需要兩個(gè)人合作可以成功)后者的支付為2;如果兩個(gè)人不合作都去獵兔,那么他們都可以得到3單位的支付。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈獵鹿獵兔獵鹿4,40,2獵兔2,03,3目前六十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
顯然該博弈有兩個(gè)純策略嚴(yán)格納什均衡,即要么兩個(gè)合作獵鹿,要么兩人去獵兔與一個(gè)混合策略納什均衡。按HarsayiandSelten(1988)的定義,純策略獵鹿是支付占優(yōu)納什均衡、純策略獵兔是風(fēng)險(xiǎn)占優(yōu)納什均衡。獵兔策略是一個(gè)保險(xiǎn)策略,而獵鹿博弈則是一個(gè)帕累托效率策略,但行動(dòng)的不確定性使獵鹿策略具有較大的風(fēng)險(xiǎn)。因此,均衡選擇取決于參與人對(duì)風(fēng)險(xiǎn)的態(tài)度。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
由于存在兩個(gè)純策略納什均衡,現(xiàn)實(shí)中究竟哪個(gè)均衡會(huì)出現(xiàn)就是一個(gè)問(wèn)題,這是多重納什均衡下的困境。通過(guò)比較“獵鹿博弈”,明顯的事實(shí)是:兩人一起去獵鹿的好處比各自打兔的好處要大得多。用一個(gè)經(jīng)濟(jì)學(xué)術(shù)語(yǔ)來(lái)說(shuō),兩人起去人頭獵鹿比各自去打兔更符合帕累托最優(yōu)原則。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這一案例中有一個(gè)隱含的假設(shè):兩個(gè)獵人的能力和貢獻(xiàn)差不多,所以雙方均分獵物。但是實(shí)際情況顯然不會(huì)這么簡(jiǎn)單。如果一個(gè)獵人的能力強(qiáng)、貢獻(xiàn)大,他就會(huì)要求得到較大的一份,這樣分配的結(jié)果就可能是(14,6)或(15,5)。但有一點(diǎn)是肯定的,能力較差的獵人的所得,至少要多于他獨(dú)自打獵的所獲,否則他就沒(méi)有合作的動(dòng)機(jī)。假設(shè)獵人甲在獵鹿過(guò)程中幾乎承擔(dān)了全部的工作,他據(jù)此要求最后的分配結(jié)果是(17,3)。這時(shí)模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)相對(duì)于分別獵兔的收益(4,4),合作獵鹿就不具有帕累托優(yōu)勢(shì)。雖然這樣17比4多,改善了很多,17+3也比4+4大得多,獵人總體收益也改善了很多,但是由于3比4小,獵人乙的境遇不僅沒(méi)有改善,反而惡化。也就是說(shuō)他的收益受到了損害。所以站在乙的立場(chǎng),(17,3)沒(méi)有(4,4)好。如果合作結(jié)果是這樣,那么,乙一定不愿合作。所以,為了實(shí)現(xiàn)帕累托最優(yōu),就必須充分照顧到合作者的利益,使他的收益大于不合作時(shí),他才會(huì)愿意選擇合作,從而實(shí)現(xiàn)雙贏的最佳結(jié)局。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)協(xié)調(diào)、合作與互動(dòng)
在許多研究中,人們通常把協(xié)調(diào)與合作看作同一個(gè)事物,容易引起混淆,但博弈論卻能夠很好地進(jìn)行區(qū)分,下面以囚徒困境與獵鹿博弈來(lái)給予說(shuō)明,支付矩陣如下表4表5:模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈1,13,0欺騙0,32,2合作欺騙合作表4:囚徒困境博弈3,32,0獵兔0,24,4獵鹿獵兔獵鹿表5:獵鹿博弈目前六十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
協(xié)調(diào)博弈解決的是源于參與人之間策略不確定性以及由此引起的行為預(yù)期問(wèn)題。
獵鹿博弈中,如果一個(gè)參與人選擇獵兔,另一個(gè)參與人選擇獵鹿,那么前者得到支付2,后者得到支付0,獵兔策略不是占優(yōu)策略。由于不能夠確定其他參與人是否會(huì)選擇獵鹿策略,盡管每個(gè)參與人都意識(shí)到這樣可以帶來(lái)更多的支付,但他們不會(huì)選擇有較高風(fēng)險(xiǎn)的獵鹿策略,因而系統(tǒng)難以達(dá)到帕累托效率均衡,因此,解決協(xié)調(diào)問(wèn)題就要參與人相信其他人會(huì)選擇帕累托效率策略,在這里需要強(qiáng)化參與人之間的相互信任。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)
囚徒困境博弈研究的是處于競(jìng)爭(zhēng)關(guān)系兩參與人之間的合作問(wèn)題,如果一個(gè)參與人選擇欺騙,另一個(gè)參與人選擇合作,那么前者得到支付3,后者得到支付0,欺騙策略是占優(yōu)的。求解囚徒困境博弈的困難在于個(gè)人激勵(lì)與群體目標(biāo)并不一致,因而,要求參與人把個(gè)人目標(biāo)放到第二位,而把集體目標(biāo)放在第一位。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)協(xié)調(diào)博弈與囚徒困境博弈存在著兩種不同形式的互動(dòng):協(xié)調(diào)互動(dòng)合作互動(dòng)協(xié)調(diào)互動(dòng)是指一個(gè)參與人獲得的支付依賴于其他參與人是否選擇了相同行動(dòng),如左行右行博弈,如果兩個(gè)相對(duì)而行的參與人選擇不同的方向行進(jìn),那么他們會(huì)相碰,而選擇相同方向則可以順利通過(guò)。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈合作互動(dòng)是指既存在協(xié)調(diào)又存在沖突的博弈,協(xié)調(diào)是因?yàn)閮蓚€(gè)參與同時(shí)改變行動(dòng)可以變得更好,沖突是因?yàn)楸M管其他參與人承諾行動(dòng),也不一定有利于該參與人支付的增加,前者可能引起無(wú)效率,后者則意意味著無(wú)效率狀態(tài)會(huì)成為均衡,目前六十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)獵鹿類型協(xié)調(diào)博弈,由策略不確定性所引起的均衡結(jié)果依賴于參與人之間的行為預(yù)期、博弈支付與策略風(fēng)險(xiǎn);當(dāng)時(shí)也是最小努力類型協(xié)調(diào)博弈支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)是統(tǒng)一的,均衡結(jié)果依賴于行為預(yù)期與博弈支付?,F(xiàn)在進(jìn)一步分析支付值x的變化對(duì)合作與協(xié)調(diào)的影響。囚徒困境博弈中,隨著支付值x的增加,不合作的激勵(lì)就會(huì)越大,追求個(gè)人理性的參與人使系統(tǒng)更易于偏離集體目標(biāo)。獵鹿類型博弈中,參與人對(duì)系統(tǒng)達(dá)到支付占優(yōu)均衡的期望值會(huì)隨著支付值x的增加而減少,選擇合作的風(fēng)險(xiǎn)就會(huì)越來(lái)越大;最小努力類型博弈中,盡管結(jié)果(欺騙,欺騙)是一個(gè)均衡,但x的下降使欺騙策略會(huì)面臨更大的風(fēng)險(xiǎn)。合作欺騙合作2,20,x欺騙x,01,1當(dāng)時(shí)就是囚徒困境博弈,個(gè)人理性并不追求集體最大化目標(biāo),唯一的均衡是(欺騙,欺騙);當(dāng)時(shí)就是目前六十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)夏普里(Shapley)值與夏普里一蘇比克權(quán)力指數(shù)夏普里一蘇比克權(quán)力指數(shù)是最早提出的一種權(quán)力指數(shù),它是夏普里和蘇比克在1954年的一篇文章“評(píng)價(jià)委員會(huì)中權(quán)力分布的一個(gè)方法”中提出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年產(chǎn)品銷售運(yùn)輸三方協(xié)議(2篇)
- 2025年亮化工程施工合同標(biāo)準(zhǔn)版本(4篇)
- 2025年臨時(shí)人員勞動(dòng)合同常用版(2篇)
- 2025年個(gè)人購(gòu)買墓地協(xié)議(2篇)
- 旗艦店鋪內(nèi)墻裝修工程協(xié)議
- 2025年度安全生產(chǎn)費(fèi)用使用監(jiān)督合同
- 2025年度城市綜合體安全保衛(wèi)服務(wù)合同范本
- 化妝品運(yùn)輸保險(xiǎn)協(xié)議樣本
- 繩鋸切割樓板施工方案
- 出租車租賃合同范例
- 有限空間作業(yè)審批表
- 內(nèi)地居民前往香港或者澳門定居申請(qǐng)表
- DB43-T 2612-2023林下竹蓀栽培技術(shù)規(guī)程
- 高中體育與健康-足球踢墻式“二過(guò)一”戰(zhàn)術(shù)教學(xué)課件設(shè)計(jì)
- 三下《動(dòng)物的一生》教材解讀
- 神木市孫家岔鎮(zhèn)神能乾安煤礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 非煤礦山安全應(yīng)急預(yù)案
- 高一英語(yǔ)閱讀理解專練20篇
- 浙江省公安民警心理測(cè)驗(yàn)考試題目
- 一圖看懂《診所備案管理暫行辦法》學(xué)習(xí)解讀課件
- 工作票與安全施工作業(yè)票培訓(xùn)
評(píng)論
0/150
提交評(píng)論