版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
導(dǎo)論:博弈論與經(jīng)濟(jì)學(xué)
一、博弈論與經(jīng)濟(jì)學(xué)的聯(lián)系與區(qū)別1、傳統(tǒng)經(jīng)濟(jì)學(xué)主要研究經(jīng)濟(jì)市場的兩個極端情況:(1)壟斷市場(2)完全競爭市場價格制度(或稱市場制度、價格理論)是其集中的體現(xiàn)。兩個基本假設(shè):1、市場的參與人較多;2、所有參與人對信息的把握是完全對稱的;這兩個假設(shè)在現(xiàn)實(shí)中是不完全存在的。兩個決策主體:1、經(jīng)濟(jì)主體人;2、市場。但市場是千千萬萬個消費(fèi)者的消費(fèi)意愿和消費(fèi)能力的總和,所以它已不再具有人格化的面貌。導(dǎo)論:博弈論與經(jīng)濟(jì)學(xué)一、博弈論與經(jīng)12、博弈論與微觀經(jīng)濟(jì)學(xué)各自對均衡問題探討的不同:
一般均衡理論是整個經(jīng)濟(jì)學(xué)的理論基石
在完全競爭的市場和民主政府下,平等和效率可以兼顧。然而在下列情況下,一般均衡理論是不成立的:(1)非完全競爭;(2)外在性;(3)公共產(chǎn)品;(4)逆向選擇問題(信息不對稱會造成市場失靈)(5)道德風(fēng)險問題(是新制度經(jīng)濟(jì)學(xué)和企業(yè)理論的核心)
價格學(xué)說與策略對局;微觀中均衡會導(dǎo)致帕累脫最優(yōu);
博弈存在著多樣性的均衡:一個均衡點(diǎn)、多個均衡點(diǎn)、穩(wěn)定均衡、概率均衡
3、博弈論更貼近現(xiàn)實(shí),分化出豐富的實(shí)證模型;2、博弈論與微觀經(jīng)濟(jì)學(xué)各自對均衡問題探討的不同:24、博弈論是伴隨著經(jīng)濟(jì)學(xué)對信息的重視而發(fā)展起來的(1)完全信息:對參與人特征、戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識;(2)完全信息靜態(tài)博弈:納什均衡;(3)不完全信息靜態(tài)博弈:海薩尼轉(zhuǎn)換——把不同的信息看成是不同的類型,不同類型的出現(xiàn)有其不同的主觀判斷的概率;貝葉斯均衡——對不完全信息的均衡有貝葉斯技術(shù)給出,利用條件概率,把先驗(yàn)分布經(jīng)由似然函數(shù)向后驗(yàn)分布轉(zhuǎn)化;4、博弈論是伴隨著經(jīng)濟(jì)學(xué)對信息的重視而發(fā)展起來的35、博弈論為解決經(jīng)濟(jì)學(xué)的時序問題提供了有力的工具(1)完全信息動態(tài)博弈——子博弈精練納什均衡
逆向推理演繹法(2)不完全信息動態(tài)博弈——精練貝葉斯納什均衡委托代理:參與約束;激勵相容約束;信號傳遞與逆向選擇:委托人在簽定合同時不知道代理人的類型,問題是選擇什么樣的合同來獲得代理人的私人信息。
5、博弈論為解決經(jīng)濟(jì)學(xué)的時序問題提供了有力的工具4二、經(jīng)濟(jì)學(xué)的發(fā)展方向博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映了經(jīng)濟(jì)學(xué)發(fā)展的以下幾個趨勢:1、經(jīng)濟(jì)學(xué)研究的對象越來越轉(zhuǎn)向個體,放棄了一些沒有微觀基礎(chǔ)的假定,如消費(fèi)函數(shù)及其投資函數(shù),消費(fèi)最大化等,一切從個人效用函數(shù)及其約束條件開始,解約束條件下的效用最大化問題而導(dǎo)出行為及均衡結(jié)果。這正是博弈論的范式:給出個人的支付函數(shù)及戰(zhàn)略空間,然后看當(dāng)每個人都選擇其最優(yōu)戰(zhàn)略以最大化個人支付函數(shù)時將發(fā)生什么。二、經(jīng)濟(jì)學(xué)的發(fā)展方向博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映52、經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究,特別是人與人之間行為的相互影響和作用(沖突與一致、競爭與合作)。特別注意到個人理性行為可能導(dǎo)致的集體非理性。3、經(jīng)濟(jì)學(xué)越來越重視對信息的研究,特別是信息不對稱對個人選擇及制度安排的影響。在70年代,當(dāng)經(jīng)濟(jì)學(xué)家們開始將注意力集中于研究具有理性行為、但只擁有有限信息的個體時,信息就成了許多模型的焦點(diǎn)——形成完全信息與不完全信息博弈論。當(dāng)個體行為受到重視之后,他們采取行動的時間順序也開始被明確的結(jié)合了起來——形成由靜態(tài)到動態(tài)的博弈論。2、經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究,特別是人與人之間行為的6三、博弈論的歷史**1、起步于馮?諾依曼(VonNeumann)與摩跟斯坦恩(Morgenstern)1944年出版的《博弈理論與經(jīng)濟(jì)行為》。普林斯頓**2、塔克(Tucher)發(fā)展了“囚徒困境”(1950)(庫恩)**3、納什(Nash)發(fā)表了關(guān)于均衡的定義與存在性的文章。4、納什與夏普利(Sharpley)發(fā)展了關(guān)于“討價還價博弈”文章(1953)。到了1953年,所有將被經(jīng)濟(jì)學(xué)家們在此后二十年中運(yùn)用到的博弈理論事實(shí)上都已被發(fā)現(xiàn)了。但直到70年代中期,博弈論還保持著獨(dú)立領(lǐng)域的地位,之后經(jīng)濟(jì)學(xué)家開始發(fā)現(xiàn)將博弈論與復(fù)雜的經(jīng)濟(jì)問題結(jié)合起來可能會得到什么結(jié)果。在80年代,博弈論迅速成為主流經(jīng)濟(jì)學(xué)的重要組成部分。事實(shí)上,他幾乎吞并了整個微觀經(jīng)濟(jì)學(xué)。三、博弈論的歷史**1、起步于馮?諾依曼(VonNeuma7重要的文獻(xiàn)還有:5、澤爾騰(Selten)關(guān)于“完美性”的文章(1965)德國波恩大學(xué)6、海薩尼(Harsanyi)關(guān)于“不完全信息”的文章(1967)。美國伯克利大學(xué)7、克瑞普斯(Kreps)和威爾遜(Wilson)對完美性加以擴(kuò)展的文章(1982)。8、Kreps、Milgrom(米爾格羅姆)、Roberts(羅伯茨)&Wilson關(guān)于不完全信息重復(fù)博弈的文章。重要的文獻(xiàn)還有:8四、實(shí)例化理論與推崇最基本假設(shè)和最大化行為的潮流同時興起的還有對簡潔的追求:稱做“實(shí)例化理論”。簡單的說,就是把某一類現(xiàn)象精練成一個簡潔而把握其精髓的故事,并模型化形成理論,然后用于解決實(shí)際問題。實(shí)例理論如:囚徒困境、智豬博弈、斗雞博弈、福利博弈等。四、實(shí)例化理論與推崇最基本假設(shè)和最大化行為的潮流同時興起的還9五、博弈論的架構(gòu)完全信息靜態(tài)博弈:納什均衡完全信息動態(tài)博弈:子博弈精練納什均衡不完全信息靜態(tài)博弈:貝葉斯納什均衡不完全信息動態(tài)博弈:精練貝葉斯納什均衡五、博弈論的架構(gòu)完全信息靜態(tài)博弈:納什均衡10第一章引論1—1策略博弈,從故事開始例1:如果給你兩個師的兵力,有你來當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市,而敵人的守備力量是三的師,規(guī)定雙方的兵力只能整師調(diào)動。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時候,你的兵力超過敵人,你勝;你的兵力少于或等于敵人守備的兵力,你就失敗。問:敵我各有幾種布兵策略?敵我取勝的概率各多少?分析:(一)敵軍的四種部署方案A、三個師住守甲方向,B、兩個師守甲方向,一個師守乙方向,C、一個師守甲方向,兩個師守乙方向,D、三個師住守乙方向。第一章引論1—1策略博11(二)我軍的三種部署方案a、集中全部的兩個師的兵力從甲方向進(jìn)攻,b、分兵兩路同時攻擊,一從甲方向,一從乙方向,c、集中全部的兩個師的兵力從乙方向進(jìn)攻?!?,++,——,+—,++,——,+—,+—,++,—+,—+,—+,—敵方3-02-11-20-3我軍—,+—,+—,+—,++,—+,—敵方2-11-2我軍—,+—,++,—+,—我軍2-01-10-22-01-10-22-00-2敵方2-11-2(二)我軍的三種部署方案—,++,——,+—,++,——12一、什么是博弈論
“博弈”字面解就是“豐富多彩的對抗性游戲”。例1石頭、剪刀、布。
張威石頭剪刀布進(jìn)步,原地
小剛石頭
剪刀布進(jìn)步,原地進(jìn)步,原地原地,原地原地,原地原地,原地原地,進(jìn)步原地,進(jìn)步原地,進(jìn)步
小剛、張威分別出什么招,關(guān)鍵在于他們對對手可能出什么招的“猜測”上。即他們各自的策略是相互依存的。1-2、博弈的基本概念和囚徒困境
一、什么是博弈論13例2鴿派與鷹派
美國鴿派政策鷹派政策0,0+1,-1-1,+1-x,-x前蘇聯(lián)鴿派政策鷹派政策鴿派代表妥協(xié)路線鷹派代表強(qiáng)硬路線為了最大化自身的利益,美蘇各方的政策選擇,依賴于對手策略的選擇。例2鴿派與鷹派美14博弈的定義:
博弈是指決策主體人在相互對抗中,對抗雙方(或多方)相互依存的一系列策略和行動的過程集合。注意:
博弈論是專門研究博弈如何出現(xiàn)均衡的規(guī)律的科學(xué)。1、博弈中的參與者各自追求的利益具有沖突性。2、博弈是一個過程的集合。3、博弈的一個本質(zhì)特征就是策略的相互依存性。博弈的定義:1、博弈中的參與者各自追求的利益具有沖突15
二、一個博弈中必不可少的要素包括:
參與人(players)行動(action)信息(information)策略(strategies)支付函數(shù)(payoff)結(jié)果(outcome)均衡(equilibria)1、參與人:指的是博弈中選擇行動以最大化自己效用的決策主體(可能是個人,也可能是團(tuán)體,如國家、企業(yè);)2、行動:是參與人的決策變量,即參與人所能做的某一選擇。3、戰(zhàn)略:是參與人選擇行動的規(guī)則,它告訴參與人在什么時候選擇什么行動(如“人不犯我,我不犯人,人若犯我,我必犯人”是一種戰(zhàn)略)
二、一個博弈中必不可少的要素包括:164、信息:指的是參與人在博弈中的知識,特別是有關(guān)其他參與人(對手)的特征和行動的知識;5、支付函數(shù):是參與人從博弈中獲得的效用水平,它是所有參與人戰(zhàn)略或行動的函數(shù);(支付可以是實(shí)數(shù),也可以是序數(shù))6、均衡:是所有參與人的最優(yōu)戰(zhàn)略或行動的組合。
4、信息:指的是參與人在博弈中的知識,特別是有關(guān)其他參與人(17三、二人博弈的支付矩陣博弈的矩陣型表示,此種表示的博弈叫矩陣型博弈。它不同于數(shù)學(xué)中的矩陣:1、符號不同;2、一是單矩陣一是雙矩陣;-1,11,-1-1,1-1,11,-1-1,1-1,1-1,11,-11,-11,-11,-1敵方3-02-11-20-3我軍2-01-10-2概念行參與人列參與人三、二人博弈的支付矩陣-1,11,-1-1,1-1,118四、囚徒困境
例1:囚徒困境兩個嫌疑犯被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果兩人都坦白,各判刑8年徒刑;如果兩個都抵賴,各判2年徒刑,如果其中一人坦白另一人抵賴,坦白的放出去,不坦白的判刑10年徒刑。(一)給出囚徒困境的戰(zhàn)略式表述1、參與人:囚徒A,囚徒B。2、博弈的策略:(都有兩策略)坦白、抵賴3、支付函數(shù):(二)囚徒困境的矩陣式表示(見右上圖)(三)三人博弈、多人博弈的表示。坦白抵賴囚徒B-8,-80,-10-10,0-2,-2坦白抵賴囚徒A四、囚徒困境坦白抵賴囚徒B-8,-80,-10191-3“抓錢博弈”一、利益一致的“抓錢博弈”1、游戲過程描述2、游戲特點(diǎn)分析同時決策博弈,屬靜態(tài)博弈;決策有先有后的序貫決策博弈,屬動態(tài)博弈3、動態(tài)博弈的表示——博弈樹決策節(jié)點(diǎn)、起始(根)節(jié)點(diǎn)、末端節(jié)點(diǎn)、節(jié)點(diǎn)決策人、枝(棱)——代表決策可能的選擇;支付順序;樹型博弈(展開型博弈)。甲乙甲乙不拿不拿不拿不拿拿拿拿拿(1,1)(2,2)(3,3)(4,4)(5,5)1-3“抓錢博弈”甲乙20二、“你死我活”的抓錢游戲1、此博弈規(guī)則時刻1…時刻2……時刻5…2、注意在“利益一致”抓錢游戲和“你死我活”的抓錢游戲中,在對應(yīng)的各步的兩參與人的支付總和是相同的,但制度安排不同,結(jié)果就大相徑庭。3、關(guān)于故事的編排和博弈名稱的說明。(10,0)(2,0)(0,4)(6,0)(0,8)甲乙甲乙不拿不拿不拿不拿拿拿拿拿二、“你死我活”(10,0)(2,0)(0,4)(6,0)(21三、“溫和對抗”的抓錢游戲是一個小跌、大漲、小跌、大漲的循環(huán)游戲。結(jié)論:制度設(shè)置不同,參與人的支付就不同,博弈的結(jié)果就不同。(2,0)(1,3)(4,2)(3,5)甲乙甲乙不拿不拿不拿不拿拿拿拿拿(6,4)三、“溫和對抗”(2,0)(1,3)(4,2)(3,5)甲221-4利益是交易的前提一、建立在自愿交易上的命題:
1、在交易的當(dāng)時,交易各方都不會吃虧;2、事后叫吃虧,涉及到信息結(jié)構(gòu)發(fā)生了變化的問題。二、幾個概念
1、交易價格2、買方的保留價格3、賣方的保留價格4、交易利益5、標(biāo)的物的評價6、私人信息1-4利益是交易的前提23三、市場曲線生產(chǎn)者剩余:在存在市場的條件下,眾多賣者所分享的交易利益的總和。消費(fèi)者剩余:在存在市場的條件下,眾多買者所分享的交易利益的總和。PQSD四、在一對一的交易中,交易價格取決交易雙方的討價還價的能力。三、市場曲線PQSD四、在一對一的交易中,交易價格取決交易雙24五、互利大局下的利益沖突1、資源配置2、無差異曲線3、紡錘形的交易互利區(qū)域DMCBA五、互利大局下的利益沖突DMCBA25六、艾奇沃斯交換的競爭均衡1、主體人的提供曲線2、競爭均衡點(diǎn)CMDBAE六、艾奇沃斯交換CMDBAE26七、艾奇沃斯交換的壟斷均衡MCEAB七、艾奇沃斯交換MCEAB27三、博弈的分類一)按兩者行動的先后順序劃分,從這個角度,博弈可以劃分為靜態(tài)博弈和動態(tài)博弈。1、靜態(tài)博弈:指的是博弈中,參與人同時選擇行動或雖非同時但后行動者并不知道前行動者采取了什么具體行動;2、動態(tài)博弈指的是參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。三、博弈的分類28二)從參與人對有關(guān)其他人(對手)的特征、戰(zhàn)略空間及支付函數(shù)的知識的角度,博弈可以劃分為完全信息博弈和不完全信息博弈.1、完全信息博弈指的是每一個參與人對所有其他參與人的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識;2、否則,就是不完全信息。3、將上述兩個角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈:完全信息靜態(tài)博弈;不完全信息靜態(tài)博弈;完全信息動態(tài)博弈;不完全信息動態(tài)博弈。4、與上述四種博弈相對應(yīng)的四個均衡概念:納什均衡;子博弈精練納什均衡;貝葉斯納什均衡;精煉貝葉斯納什均衡;
見下表0.1
二)從參與人對有關(guān)其他人(對手)的特征、戰(zhàn)略空間及支付函數(shù)的29
表0.1博弈的分類及對應(yīng)的均衡概念
行動順序信息靜態(tài)動態(tài)完全信息不完全信息完全信息靜態(tài)博弈;納什均衡納什(1950,1951)完全信息動態(tài)博弈;子博弈精練納什均衡澤爾騰(1965)不完全信息靜態(tài)博弈;貝葉斯納什均衡海薩尼(1967)不完全信息動態(tài)博弈;精練貝葉斯納什均衡;澤爾騰(1975),Kreps&Wilson(1982)Fudenberg&Tirole(91)表0.1博弈的分類及對應(yīng)的均衡概念完30博弈的分類還有以下幾種:
一、完美信息博弈與不完美信息博弈二、零和博弈和非零和博弈三、合作博弈(存在具有行動約束力的聯(lián)盟)和非合作博弈(不存在具有行動約束力的聯(lián)盟)導(dǎo)論博弈論與經(jīng)濟(jì)學(xué)課件31
2.1完全信息靜態(tài)博弈:納什均衡一、什么是“納什均衡”
具體講,假設(shè)有n個人參與博弈,給定其他人戰(zhàn)略的條件下,每個人選擇自己的最優(yōu)戰(zhàn)略,所有參與人選擇的戰(zhàn)略一起構(gòu)成一個戰(zhàn)略組合。納什均衡指的是由所有參與人所選擇的最優(yōu)戰(zhàn)略組成那種戰(zhàn)略組合。也就是說,給定別人戰(zhàn)略的情況下,沒有任何單個參與人有積極性選擇其他戰(zhàn)略,從而沒有任何人有積極性打破這種均衡。
2.1完全信息靜態(tài)博弈:納什均衡一、什么是“納什均衡”32
例1:囚徒困境兩個嫌疑犯被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果兩人都坦白,各判刑8年徒刑;如果兩個都抵賴,各判2年徒刑,如果其中一人坦白另一人抵賴,坦白的放出去,不坦白的判刑10年徒刑。1、表0.2給出囚徒困境的戰(zhàn)略式表述(解釋表的意義)
坦白抵賴囚徒B-8,-80,-10-10,0-2,-2坦白抵賴囚徒A返回應(yīng)用坦白抵賴囚徒B-8,-80,-10-10,0-2,-2坦白332、博弈論的表述方式:戰(zhàn)略式表述(或稱矩陣式表述)3、在這個例子里,納什均衡就是(坦白,坦白):給定B坦白的情況下,A的最優(yōu)戰(zhàn)略是坦白;同樣,給定A坦白的情況下,B的最優(yōu)戰(zhàn)略也是坦白。事實(shí)上,這里(坦白,坦白)不僅是納什均衡,而且是一個占優(yōu)戰(zhàn)略均衡,就是說,不論對方如何選擇,個人的最優(yōu)選擇是坦白。
*4、納什均衡可以從另一個角度來理解:假設(shè)博弈中的所有參與人事先達(dá)成一項協(xié)議,規(guī)定出每個人的行為規(guī)則;在沒有外在的強(qiáng)制力約束時,當(dāng)事人是否會自覺地遵守這個協(xié)議?2、博弈論的表述方式:戰(zhàn)略式表述(或稱矩陣式表述)345、囚徒困境反映了一個很深刻的問題,這就是個人理性與集體理性的矛盾。6、囚徒困境的事例:(1)兩個寡頭企業(yè)選擇產(chǎn)量的博弈。(2)公共產(chǎn)品的供給也是一個囚徒困境問題。(3)軍備競賽。(4)教育減負(fù)還有象盜版書與正版書、劣幣驅(qū)逐良幣、劣行遇到良行、拍賣出價、推銷員的努力、政治上的討價還價等,
從囚徒困境中,我們可以引出一個很重要的結(jié)論:一種制度(體制)安排,要發(fā)生效力,必須是一種納什均衡;否則,這種制度安排便不能成立。
5、囚徒困境反映了一個很深刻的問題,這就是個人理性與集體理性35例2:智豬博弈。
這個例子講的是,豬圈里圈兩頭豬,一頭大豬,—頭小豬。豬圈的一頭有一個豬食槽,另一頭安裝一個按鈕,控制著豬食的供應(yīng).按一下按鈕會有10個單位的豬食進(jìn)槽,但誰按按鈕誰就需要付2個單位的成本。若大豬先到,大豬吃到9個單位,小豬只能吃到1個單位;若同時到,大豬吃7個單位,小豬吃3個單儀,若小豬先到,大豬吃6個單位,小豬吃4個單位。1、什么是本例的納什均衡?答案是大豬按;小豬等待,各得4個單位。多勞者不多得。因?yàn)椴徽摯筘i選擇“按”還是“等待”,小豬的最優(yōu)選擇均是“等待”.“等待”是小豬的占優(yōu)戰(zhàn)略。給定小猜總是選擇“等待”,大豬的員優(yōu)選擇只能是“按”。
小豬按等待大豬按等待5,14,49,-10,0例2:智豬博弈。小豬大豬按5,14362、智豬博弈的應(yīng)用:(1)比如說股份公司中,大股東和小股東之間,大股東承擔(dān)著監(jiān)督的任務(wù)及監(jiān)督成本。納什均衡是,大股東擔(dān)當(dāng)起搜集信息、監(jiān)督經(jīng)理的責(zé)任,小股東則搭大股東的便車。(2)股票市場上炒股票,大戶與小戶的關(guān)系。(3)大企業(yè)與小企業(yè)之間,在新產(chǎn)品的研究、開發(fā)、打廣告問題上。(4)北約中,美國承擔(dān)超出比例的防務(wù)費(fèi)用。(4)優(yōu)秀學(xué)生與一般學(xué)生在文明寢室的建設(shè)上等等。所以,智豬博弈的納什均衡常被稱做“富人的紳士風(fēng)度”或稱“小國對大國的剝削”、“搭便車”。2、智豬博弈的應(yīng)用:37例3:性別戰(zhàn)
講的是熱戀中的情人,安排業(yè)余活動,或者去看足球比賽,或者看芭蕾舞演出.男的偏好足球,女的則更喜歡芭蕾,但他們都寧愿在一起,不愿分開.表0.4給出支付矩陣。這個博弈中,有兩個納什均衡:
(足球,足球),(芭蕾,芭蕾)。那么,究竟哪一個納什均衡會實(shí)際發(fā)生?這里有一個先動優(yōu)勢,或者形成一種默契。(另:兩要好同學(xué)選課、二戰(zhàn)英美在支持巴頓還是蒙哥瑪利的問題、兩企業(yè)合建共水站等)-1,-1
女足球芭蕾足球芭蕾男2,10,01,2例3:性別戰(zhàn)-1,-1女足球381、二戰(zhàn)例2、兩同學(xué)選課
英國支持巴頓支持蒙帥美國支持巴頓支持蒙帥4,32,21,13,4哲理:在利益一致的前提下,又存在各自的小算盤,即有利大利小的沖突。1、二戰(zhàn)例39例4:斗雞博弈設(shè)想兩個人舉著火棍從獨(dú)木橋的兩端走向中央進(jìn)行火拚;每個人都有兩種戰(zhàn)略:繼續(xù)前進(jìn),或退下陣來。若兩人都繼續(xù)前進(jìn),則兩敗俱傷,若一方前進(jìn)另一方退下來;前進(jìn)者取得勝利,退下來的丟了面子;若兩人都退下來,兩人都丟面子。支付矩陣如表0.5所示。
這個博棄里也有兩個納什均衡:如果一方進(jìn),另一方的最優(yōu)戰(zhàn)略就是退。兩人都進(jìn)或都退都不是納什均衡。
這個例子也有許多應(yīng)用.1)冷戰(zhàn)期間,蘇美兩個軍事集團(tuán)在世界各地?fù)屨嫉乇P,也是一種斗雞博弈。2)還有警察與游行隊伍的例子。3)夫妻間矛盾也是個斗雞問題。
B進(jìn)退進(jìn)退A-3,-32,00,20,0例4:斗雞博弈B進(jìn)40例5:市場進(jìn)入阻撓
設(shè)想有一個壟斷企業(yè)已在市場上(稱為“在位者”),另一個企業(yè)虎視眈眈想進(jìn)入(稱為“進(jìn)入者”)。在位者想保持自己的壟斷地位,所以就要阻撓進(jìn)入者進(jìn)入。進(jìn)入者有兩種戰(zhàn)略:進(jìn)入、不進(jìn)入;在位者也有兩種戰(zhàn)略:默許、斗爭.其支付矩陣如表0.6所示。
這個博弈也有兩個納什均衡,即
(進(jìn)入,默許)(不進(jìn)入,斗爭)*
在位者默許斗爭進(jìn)入不進(jìn)入進(jìn)入者40,50-10,00,3000,300作業(yè):納什均衡是什么?均衡收益各多少?例5:市場進(jìn)入阻撓在位者進(jìn)入進(jìn)入者441例6:雜貨鋪定位與西方兩黨政治的穩(wěn)定性和欺騙性35,3550,4040,5020,205,510,4010,8040,1080,10搖滾樂鄉(xiāng)村音樂談話維德庫爾搖滾樂鄉(xiāng)村音樂談話例7:電臺節(jié)目選擇博弈例6:雜貨鋪定位與西方兩黨政治的穩(wěn)定性和欺騙性35,355042
謝林點(diǎn)多納什均衡的存在,說明納什均衡從理論上說是不完美的。實(shí)際中到底哪一個均衡會發(fā)生?謝林給出了回答。在節(jié)目選擇博弈中,如果庫爾電臺一直是一家成功的搖滾樂電臺,則維德當(dāng)然會選擇鄉(xiāng)村音樂。謝林從歷史線索中,判斷出一個均衡發(fā)生的概率大于另一個均衡,這種以線索為基礎(chǔ)選擇出的均衡稱為謝林點(diǎn)。謝林點(diǎn)43
帕累托優(yōu)勢與風(fēng)險優(yōu)勢問題討論例9:推與不推均衡假如吉姆和卡爾駕車行駛在同一條公路上,橫臥在路上的一棵大樹擋住了他們的去路。他們只有齊心協(xié)力移走大樹才能繼續(xù)前進(jìn),否則只能回頭。面臨著推與不推的博弈矩陣如圖所示:
(推,推):收益占優(yōu)均衡(不推,不推):風(fēng)險占優(yōu)均衡
吉姆推不推推不推卡爾5,5-10,00,-101,1帕累托優(yōu)勢與風(fēng)險優(yōu)勢問題討論吉姆44再談風(fēng)險優(yōu)勢
乙獵鹿打兔獵鹿打兔甲10,100,44,04,4
乙左右上下甲6,6-1000,55,-10004,4再談帕累托優(yōu)勢:獵人博弈乙獵鹿甲10,100,44,045
博弈有什么用?1、囚徒困境2、智豬博弈3、斗雞博弈再舉幾個例子:4、領(lǐng)先還是不領(lǐng)先:(1)帆船競賽,美國的“自由號”與“澳大利亞二號”。(2)劍橋大學(xué)五月舞會的輪盤賭問題?!髣觾?yōu)勝策略。博46二、看穿對手的策略
在同時行動的博弈里,沒有一個參與者可以在自己行動之前得知另一個參與者的整個計劃。在這種情況下,互動推理不能通過觀察對方的策略進(jìn)行,而是必須通過看穿對手的策略才能展開。每一個人不得不同時擔(dān)任兩個人的角色,一個是自己,一個是對手,從而找出雙方的最佳行動方式。你怎樣才能看穿所有那些錯綜復(fù)雜而又看不見的策略呢?這里基于兩個簡單的概念:優(yōu)勢策略與均衡,推出三個簡單法則。二、看穿對手的策略47相繼進(jìn)行的博弈—動態(tài)博弈的均衡方法例二、分蛋糕博弈1、一次性分蛋糕2、二次性分蛋糕3、三次性分蛋糕4、N次性分蛋糕新潔得10萬美圓快潔得10萬美圓新潔虧20萬美圓快潔虧10萬美圓新潔得0萬美圓快潔得30萬美圓打價格戰(zhàn)不進(jìn)入進(jìn)入快潔接納新潔原則一:向前展望,到后推理例一吸塵器市場“快潔”獨(dú)占市場,現(xiàn)在“新潔”決定是否進(jìn)入市場,其博弈過程和支付如下圖:例三相繼進(jìn)行的博弈—動態(tài)博弈的均衡方法例二、分蛋糕博弈新潔得1048例四:課堂實(shí)驗(yàn)——學(xué)生分分?jǐn)?shù)問題一次、二次、三次分配;公平性問題:1、平均分配原則2、所得與自己的貢獻(xiàn)相等例五八個金幣的故事約克和湯姆結(jié)對旅游。約克帶了3塊餅,湯姆帶了5塊餅。一路人路過,被邀一起吃餅。吃完后路人感謝了8個金幣。兩人為金幣的分配爭執(zhí)起來:湯姆堅持自得5給約克3,約克堅持各得4。你認(rèn)為怎樣分配這8個金幣呢?例四:課堂實(shí)驗(yàn)——學(xué)生分分?jǐn)?shù)問題一次、二次、三次分配;49海盜分寶石:公平原則下的不公平
例六5個強(qiáng)盜把搶來的100顆寶石進(jìn)行分配,分配規(guī)則是:1、抽簽確定分配順序;2、由抽到1號簽的海盜提出分配方案,然后5人進(jìn)行表決,有半數(shù)及以上的人同意,則按其方案進(jìn)行,否則,將提出方案的人扔進(jìn)大海;3、如果1還被扔進(jìn)大海,2號提出分配方案,規(guī)則同前…問題:1號海盜提出怎樣的方案才能既不使自己被扔進(jìn)大海,又能使自己得到最多的寶石?海盜分寶石:公平原則下的不公平50尋找均衡的方法1、優(yōu)勢策略均衡用嚴(yán)格(弱)劣勢策略逐次消去法2、相對優(yōu)勢策略劃線法3、箭頭指向法上下B1,30,10,22,0左中右1,00,4坦白抵賴囚徒B-8-8,-100,0-10,-2-2,坦白抵賴A囚徒A尋找均衡的方法上B1,30,10,22,0左51法則二:假如你有一個優(yōu)勢策略,請按優(yōu)勢策略辦。說明:1、以策略的觀點(diǎn)來看,各方均有一個優(yōu)勢策略的博弈是最簡單的博弈。占有戰(zhàn)略均衡只要求每個參與人是理性的,而并不要求每個參與人知道其他參與人是理性的,即不要求“理性”是共同知識。
2、囚徒困境反映了一個深刻的問題,即個人理性與團(tuán)體理性的沖突。本來,(抵賴,抵賴)策略,各只判刑1年,比8年好,但這個帕累托改進(jìn)做不到,因?yàn)樗粷M足個人理性的要求。3、帕累托效率準(zhǔn)則:經(jīng)濟(jì)效率體現(xiàn)于配置社會資源以改善人們的境況,主要看資源是否已經(jīng)被充分利用。達(dá)到帕累托效率,是指要改善任何人都必須損害別的人。如獵人博弈法則二:假如你有一個優(yōu)勢策略,請按優(yōu)勢策略辦。520.2.3重復(fù)剔除的占優(yōu)均衡一、定義:優(yōu)勢策略均衡如果無論其他參與人選擇什么策略,策略都是參與人i的強(qiáng)最佳應(yīng)對,那么就稱為占優(yōu)戰(zhàn)略。這意味著無論別人選擇什么策略,都是參與人i的支付最大化。從數(shù)學(xué)上講,就是
對于參與人i而言較差的策略即所有的稱為劣勢策略。
定義:在博弈的戰(zhàn)略式表述中,如果對于所有的i,是i的占優(yōu)戰(zhàn)略,戰(zhàn)略組合稱為占優(yōu)戰(zhàn)略均衡。0.2.3重復(fù)剔除的占優(yōu)均衡53但有時候,某參與者有一個優(yōu)勢策略,其他參與者沒有。由此我們可以推出重復(fù)剔除的占優(yōu)均衡。
考慮“智豬博弈”的例子,
顯然,這個博弈里,小豬有占優(yōu)戰(zhàn)略,而大豬沒有。因而博弈沒有占優(yōu)戰(zhàn)略均衡。(區(qū)分:占優(yōu)戰(zhàn)略與占優(yōu)戰(zhàn)略均衡)
假如小豬是理性的,則小豬會選擇“等待”;又假如大豬也是理性的,并知道小豬是理性的,則大豬會正確的預(yù)測到小豬會選擇等待,在這個預(yù)測下,大豬的最優(yōu)選擇只能是“按”,則“按,等待”是這個博弈的唯一均衡。這正是應(yīng)用了“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路。但有時候,某參與者有一個優(yōu)勢策略,其他參與者沒54一、重復(fù)剔除嚴(yán)格劣戰(zhàn)略的思路1、劣戰(zhàn)略的定義策略劣于另一個策略,如果對于其他局中人的每一個策略,后者與至少一樣好,而對于其他局中人的某些策略,嚴(yán)格地好于,以致
則稱為的劣策略。2、非劣策略:如果一個策略不劣于任何其他策略,則稱非劣策略一、重復(fù)剔除嚴(yán)格劣戰(zhàn)略的思路1、劣戰(zhàn)略的定義55
2、思路
首先找出某個參與人的劣戰(zhàn)略(假如存在),把這個劣戰(zhàn)略剔除掉,重新構(gòu)成一個不包含已剔除戰(zhàn)略的新的戰(zhàn)略;然后再提出這個新的博弈中的某個參與人的劣戰(zhàn)略;繼續(xù)這個過程,一直到只剩下一個唯一的戰(zhàn)略組合為止。此組合即為“重復(fù)剔除的占優(yōu)均衡”例1:
參與人BLMNUD參與人A1,00,32,00,10,11,2LMUD參與人A1,00,30,11,2LMU參與人A1,01,2參與人B2、思路參與人BU參與人A1,00,32,00,10,1156練習(xí)題:俾斯麥海之戰(zhàn)木村受命運(yùn)兵到新幾內(nèi)亞,其間要穿過俾斯麥海,有兩條航線:較短的北線和較長的南線。肯尼奉命予于轟炸。支付矩陣如表1.5。分析其均衡策略。均衡的敏感性問題
盡管重復(fù)剔除的占優(yōu)均衡是一個合理的預(yù)測,但這一點(diǎn)受到下列極端情況的挑戰(zhàn)。見下表1.6占優(yōu)戰(zhàn)略均衡是(U,L)但實(shí)際中均衡極有可能是(D,L),因?yàn)锽的策略只要有一點(diǎn)擾動,A就會受到很大的損失,即博弈的結(jié)果對行為的不確定性是很敏感的。參與人BLMUD參與人A8,107,66,5-1000,9木村北南北南肯尼2,-21,-13,-32,-2表1.6表1.5練習(xí)題:俾斯麥海之戰(zhàn)參與人BU參與人A8,107,66,57法則三:剔除所有劣勢戰(zhàn)略,不予考慮,
如此一步一步的做下去。例2:假如在海灣戰(zhàn)爭中,伊拉克艦艇在I點(diǎn),伊企圖發(fā)射一導(dǎo)彈擊毀美國在A點(diǎn)的艦艇,為避免美軍發(fā)射導(dǎo)彈進(jìn)行攔截,伊導(dǎo)彈采取每隔20秒隨機(jī)直角轉(zhuǎn)彎的策略,美攔截導(dǎo)彈也有同樣的90度轉(zhuǎn)彎功能。導(dǎo)彈可能的行進(jìn)路線如右圖。導(dǎo)彈所裝的燃料只夠它飛行1分鐘,即它只能走過三個節(jié)點(diǎn)。問雙方各有多少種導(dǎo)彈發(fā)射策略?找出雙方的最佳策略。CDBFEGHAI法則三:剔除所有劣勢戰(zhàn)略,不予考慮,
58例2的矩陣表述:擊中與錯過圖美國的策略美國的策略表一表二A8-ADEBHHHHHHHO例2的矩陣表述:擊中與錯過圖美國的策略美國的策略表一表二A859***利用重復(fù)剔出劣勢策略的原則所得到的結(jié)果,此結(jié)果沒有均衡。***均衡概念的誤區(qū):當(dāng)我們說博弈的結(jié)果是均衡,并不意味著這就是對所有參與者最有利的結(jié)果。更不意味著是對整個社會作為一個整體而言最有利的結(jié)果。法則三:走完尋找優(yōu)勢策略和剔除劣勢策略的捷徑之后,下一步就是尋找這個博弈的均衡。美國的策略伊拉克的策略表三美國的策略伊拉克的策略表三60二、多均衡問題1、行車問題2、打電話問題五、無純策略均衡問題——混合策略1、美、伊導(dǎo)彈問題2、網(wǎng)球與稅務(wù)審計:
——說明策略的優(yōu)勝在于不可預(yù)測性。二、多均衡問題61六、案例分析:股票收購問題羅伯特.坎普在第一次投標(biāo)收購聯(lián)盟商店的時候,運(yùn)用了一個稱為兩階段出價法的竟購方案。假設(shè)當(dāng)時的股票市價是100美圓,第一階段以105美圓的價格收購50%的股票;另一半出讓的股份進(jìn)入第二階段,以90美圓收購。1、收購失敗(X%<50%)2、收購成功(X%>50%)3、全部收購問股價是多少?第二個收購者:全部以每股102美圓的價格收購,前提是他能得到該公司的大部分股票。你愿意賣給哪一家?作出分析。六、案例分析:股票收購問題62三、納什均衡的正式定義
1、納什均衡是完全信息靜態(tài)博弈解的一般概念,它建立在“參與者是理性人”的假設(shè)基礎(chǔ)之上。如果參與人事先協(xié)商達(dá)成了一個協(xié)議,規(guī)定每個人選擇一個特定的戰(zhàn)略。那么,在沒有強(qiáng)制力約束的條件下,參與者是否有積極性遵守這個協(xié)議呢?顯然,只有當(dāng)遵守協(xié)議帶來的效用大于不遵守協(xié)議時的效用時,一個人才會遵守這個協(xié)議?!@個協(xié)議才構(gòu)成納什均衡。
三、納什均衡的正式定義632、定義:設(shè)是n人博弈G={S1,…,Sn;u1,…,un}的一個戰(zhàn)略組合如果對于每一個局中人i,
對于所有都成立,則我們稱是該博弈的一個納什均衡?;蛘哂昧硪环N表述方式,是下述最大化問題解:
,i=1,2,…,n2、定義:設(shè)64一個符號的約定:考慮戰(zhàn)略組合表述的復(fù)雜性,現(xiàn)給一個符號約定:定義:有n個參與人的戰(zhàn)略式表述博弈G={S1,…,Sn;u1,…,un},戰(zhàn)略組合
是一個納什均衡,如果對于每一個i,是給定其他參與人選擇的情況下第i個參與人的最優(yōu)戰(zhàn)略,即:
一個符號的約定:653、定義的說明:考慮戰(zhàn)略組合,說不是G的一個納什均衡等價于說至少對于某些i而言,不是i的最優(yōu)戰(zhàn)略(給定),換言之,至少存在一個,使得3、定義的說明:664、強(qiáng)納什均衡
如果給定其他參與人的戰(zhàn)略,每一個參與人的最優(yōu)選擇是唯一的。即若是一個強(qiáng)納什均衡,當(dāng)只當(dāng)對于所有的i,,5、弱納什均衡
在弱納什均衡的情況下,有些參與人可能在均衡戰(zhàn)略與非均衡戰(zhàn)略之間是無差異的。4、強(qiáng)納什均衡67三、納什均衡的戰(zhàn)略式表述(一)納什均衡有兩種表述:1)戰(zhàn)略式表述,適合于靜態(tài)博弈;2)擴(kuò)展式表述,適用于動態(tài)博弈。具體的講,戰(zhàn)略式表述給出:1、博弈的參與人集合:=(1,2,…,n)2、每個參與人的戰(zhàn)略空間:,I=1,2,…,n3、每個參與人的支付函數(shù):,i=1,2,…,n我們用代表戰(zhàn)略式表述博弈。例如在兩個寡頭產(chǎn)量博弈里,企業(yè)是參與人,產(chǎn)量是戰(zhàn)略空間,利潤是支付;戰(zhàn)略式表述博弈為:
這里的和分別是第i個企業(yè)的產(chǎn)量和利潤。三、納什均衡的戰(zhàn)略式表述68(二)有限博弈第一,參與人的個數(shù)是有限的,第二,每個參與人可選擇的戰(zhàn)略是有限的。(三)兩個體的有限博弈戰(zhàn)略式表述可以用矩陣表來直觀的表述。例:如果市場上有兩棟樓出售,需求大時,每棟售價可達(dá)1.4億,需求小時,售價為7千萬,如果市場上只有一棟出售,需求大時為1.8億,需求小時為1.1億。
4000,40008000,00,80000,0
開發(fā)商B開發(fā)不開發(fā)
開發(fā)不開發(fā)開發(fā)商A-3000,-30001000,00,10000,0
開發(fā)商B開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)商Aa、低需求情況a、高需求情況(二)有限博弈4000,40008000,00,800069策略為連續(xù)情形的納什均衡
當(dāng)參與人多于三個人或策略集不是有限的時候,無法用雙矩陣把博弈表述出來,劣勢策略消去法、相對優(yōu)勢策略畫線法、箭頭指向法都無用武之地。但是,對于策略集都是實(shí)數(shù)的開區(qū)間并且支付函數(shù)都是可微的多元函數(shù)的情形,運(yùn)用微分方法,可以很方便的找出納什均衡。連續(xù)情形的納什均衡的必要條件:設(shè)n人博弈的策略集都是實(shí)數(shù)的開區(qū)間,并且支付函數(shù)都是可微的多元函數(shù)。如果一個策略組合是這個博弈的納什均衡的話,那么它必須是方程組的解。策略為連續(xù)情形的納什均衡當(dāng)參與人多于70連續(xù)情形納什均衡的驗(yàn)證方法對于n人博弈,如果一個策略組合
是納什均衡必要條件(2.1)的唯一解,并且對每一個i,都有:
那么策略組合就是博弈
的一個納什均衡。連續(xù)情形納什均衡的驗(yàn)證方法對于n人博弈71例1:設(shè)在一個3個局中人的策略型博弈中,每個局中人的策略集都是正實(shí)數(shù)開區(qū)間,他們的策略變量分別是x,y,z,他們的支付函數(shù)分別為:求這個博弈的納什均衡。例1:設(shè)在一個3個局中人的策略型博弈中,每個局中人的策略集都72例2:設(shè)在3人博弈中,每個局中人的策略集是,他們的策略變量分別是x,y,z,其支付函數(shù)分別是:求其納什均衡。例2:設(shè)在3人博弈73二、幾個概念“理性”要求:與占優(yōu)戰(zhàn)略均衡不同,重復(fù)剔除的占優(yōu)均衡不僅要求每個參與人是理性的,而且要求“理性”是參與人的共同知識。概念:共同知識即所有參與人是理性的,所有參與人知道所有參與人是理性的,所有參與人知道所有參與人知道所有參與人是理性的。
(用例1解釋)(協(xié)同攻擊的難題)二、幾個概念“理性”要求:與占優(yōu)戰(zhàn)略均衡不同,重復(fù)剔除的占優(yōu)74例1帽子是紅色的還是白色的?有四個人圍坐在一起,每個人頭戴一頂帽子,帽子為紅色和白色兩種,每個人看不到自己帽子的顏色,但能看到別人帽子的顏色。一個局外人走過來對他們說:你們之中至少一位頭戴的是紅色的帽子。然后他問:“你們知道你們頭上帽子的顏色嗎?”四人都答:“不知道”。局外人又問第二次、第三次;四人仍都答:“不知道”;局外人又問第四次;這時四人均說答:“知道了”。為什么?例1帽子是紅色的還是白色的?75例2在一個偏僻的山村,這里的女人掌權(quán)。村里有一百對夫婦。村里有一個約定俗成的規(guī)矩。如果女人發(fā)現(xiàn)自己的丈夫?qū)ψ约翰恢业脑?,就會毫不猶豫地將他殺死,而且,就在當(dāng)天執(zhí)行。由于這個原因,某個女人發(fā)現(xiàn)某個男人不忠。她不會將之告訴那個不忠男人的妻子。但她告訴其他人的妻子,并且女人會相互傳遞這一消息,因此最后,一個男人不忠,除了其妻子不知道外,其他女人都知道。事實(shí)上,村里這100對男人都不忠,但由于女人不會將他知道的事實(shí)告訴不忠男人的妻子,每個女人都不知道自己的男人不忠。因此村里很穩(wěn)定,沒有發(fā)生妻子殺死丈夫的行為。村里有個德高望重的老太太,人人都向他匯報村里的情況,因此她知道每個男人都不忠。一天她很平靜地對100個女人說:你們的男人當(dāng)中至少有一個是不忠的。于是,村里發(fā)生了這樣的事情:前99天,村里風(fēng)平浪靜,但到了第一百天,所有女人都?xì)⑺懒怂麄兊恼煞?。為什么?同理,思考一下《皇帝的新裝》。例2在一個偏僻的山村,這里的女人掌權(quán)。村里有一百對夫婦。76知識結(jié)構(gòu)問題共同知識、非共同知識與虛假知識(信息)例:1、“教與學(xué)”——教育的知識結(jié)構(gòu)分析2、諸葛亮、周瑜的掌中之“火”知識結(jié)構(gòu)問題共同知識、非共同知識與虛假知識(信息)77●均衡的結(jié)果與剔除的順序有關(guān):路徑依賴問題剔除序1:R3、C3、C2、R2均衡為(R1、C1)剔除序2,C2、R2、C1、R3均衡為(R1、C3)如:電腦的匹配問題;婚姻問題;選專業(yè)、擇業(yè)問題;職員搬家問題;里程積分問題;廠齡工資問題。參與人BC1C2C3R1R2R3參與人A2,120,120,110,101,121,100,120,100,13●均衡的結(jié)果與剔除的順序有關(guān):路徑依賴問題參與人BR1參78路徑依賴,類似物理學(xué)中的“慣性”,事物一旦進(jìn)入某一路徑,就可能對這種路徑產(chǎn)生依賴。
例1兩條鐵路之間的標(biāo)準(zhǔn)距離是四英尺八點(diǎn)五英寸。為什么?
例2路徑依賴型產(chǎn)業(yè)——既這個產(chǎn)品對于消費(fèi)者的價值隨著消費(fèi)者數(shù)量的增加而增加。如電話、傳真機(jī)、微軟的發(fā)展。
馬太效應(yīng):任何個體、群體或地區(qū),一旦在一方面(金錢、名譽(yù)、地位)獲得成功和進(jìn)步,產(chǎn)生積累優(yōu)勢,就會有更多的機(jī)會取得更大的成功和進(jìn)步。主流產(chǎn)品即使價值更高也有人愿意買。在這里,價高少買、價低多買的需求規(guī)律對信息產(chǎn)品似乎也不起作用了;新經(jīng)濟(jì)條件下的經(jīng)濟(jì)規(guī)律是:使用者越多,出價就越高,或者說是“邊際收益遞增”路徑依賴,類似物理學(xué)中的“慣性”,事物一旦進(jìn)入某79沉沒成本—指過去已發(fā)生或已投入而未來無法改變的成本。前期的投入就像萬能膠一樣,把決策粘在原來的思路上,使人無法做出客觀的選擇。沉沒成本—指過去已發(fā)生或已投入而未來無法改變的成本。80導(dǎo)論博弈論與經(jīng)濟(jì)學(xué)課件81導(dǎo)論:博弈論與經(jīng)濟(jì)學(xué)
一、博弈論與經(jīng)濟(jì)學(xué)的聯(lián)系與區(qū)別1、傳統(tǒng)經(jīng)濟(jì)學(xué)主要研究經(jīng)濟(jì)市場的兩個極端情況:(1)壟斷市場(2)完全競爭市場價格制度(或稱市場制度、價格理論)是其集中的體現(xiàn)。兩個基本假設(shè):1、市場的參與人較多;2、所有參與人對信息的把握是完全對稱的;這兩個假設(shè)在現(xiàn)實(shí)中是不完全存在的。兩個決策主體:1、經(jīng)濟(jì)主體人;2、市場。但市場是千千萬萬個消費(fèi)者的消費(fèi)意愿和消費(fèi)能力的總和,所以它已不再具有人格化的面貌。導(dǎo)論:博弈論與經(jīng)濟(jì)學(xué)一、博弈論與經(jīng)822、博弈論與微觀經(jīng)濟(jì)學(xué)各自對均衡問題探討的不同:
一般均衡理論是整個經(jīng)濟(jì)學(xué)的理論基石
在完全競爭的市場和民主政府下,平等和效率可以兼顧。然而在下列情況下,一般均衡理論是不成立的:(1)非完全競爭;(2)外在性;(3)公共產(chǎn)品;(4)逆向選擇問題(信息不對稱會造成市場失靈)(5)道德風(fēng)險問題(是新制度經(jīng)濟(jì)學(xué)和企業(yè)理論的核心)
價格學(xué)說與策略對局;微觀中均衡會導(dǎo)致帕累脫最優(yōu);
博弈存在著多樣性的均衡:一個均衡點(diǎn)、多個均衡點(diǎn)、穩(wěn)定均衡、概率均衡
3、博弈論更貼近現(xiàn)實(shí),分化出豐富的實(shí)證模型;2、博弈論與微觀經(jīng)濟(jì)學(xué)各自對均衡問題探討的不同:834、博弈論是伴隨著經(jīng)濟(jì)學(xué)對信息的重視而發(fā)展起來的(1)完全信息:對參與人特征、戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識;(2)完全信息靜態(tài)博弈:納什均衡;(3)不完全信息靜態(tài)博弈:海薩尼轉(zhuǎn)換——把不同的信息看成是不同的類型,不同類型的出現(xiàn)有其不同的主觀判斷的概率;貝葉斯均衡——對不完全信息的均衡有貝葉斯技術(shù)給出,利用條件概率,把先驗(yàn)分布經(jīng)由似然函數(shù)向后驗(yàn)分布轉(zhuǎn)化;4、博弈論是伴隨著經(jīng)濟(jì)學(xué)對信息的重視而發(fā)展起來的845、博弈論為解決經(jīng)濟(jì)學(xué)的時序問題提供了有力的工具(1)完全信息動態(tài)博弈——子博弈精練納什均衡
逆向推理演繹法(2)不完全信息動態(tài)博弈——精練貝葉斯納什均衡委托代理:參與約束;激勵相容約束;信號傳遞與逆向選擇:委托人在簽定合同時不知道代理人的類型,問題是選擇什么樣的合同來獲得代理人的私人信息。
5、博弈論為解決經(jīng)濟(jì)學(xué)的時序問題提供了有力的工具85二、經(jīng)濟(jì)學(xué)的發(fā)展方向博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映了經(jīng)濟(jì)學(xué)發(fā)展的以下幾個趨勢:1、經(jīng)濟(jì)學(xué)研究的對象越來越轉(zhuǎn)向個體,放棄了一些沒有微觀基礎(chǔ)的假定,如消費(fèi)函數(shù)及其投資函數(shù),消費(fèi)最大化等,一切從個人效用函數(shù)及其約束條件開始,解約束條件下的效用最大化問題而導(dǎo)出行為及均衡結(jié)果。這正是博弈論的范式:給出個人的支付函數(shù)及戰(zhàn)略空間,然后看當(dāng)每個人都選擇其最優(yōu)戰(zhàn)略以最大化個人支付函數(shù)時將發(fā)生什么。二、經(jīng)濟(jì)學(xué)的發(fā)展方向博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映862、經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究,特別是人與人之間行為的相互影響和作用(沖突與一致、競爭與合作)。特別注意到個人理性行為可能導(dǎo)致的集體非理性。3、經(jīng)濟(jì)學(xué)越來越重視對信息的研究,特別是信息不對稱對個人選擇及制度安排的影響。在70年代,當(dāng)經(jīng)濟(jì)學(xué)家們開始將注意力集中于研究具有理性行為、但只擁有有限信息的個體時,信息就成了許多模型的焦點(diǎn)——形成完全信息與不完全信息博弈論。當(dāng)個體行為受到重視之后,他們采取行動的時間順序也開始被明確的結(jié)合了起來——形成由靜態(tài)到動態(tài)的博弈論。2、經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究,特別是人與人之間行為的87三、博弈論的歷史**1、起步于馮?諾依曼(VonNeumann)與摩跟斯坦恩(Morgenstern)1944年出版的《博弈理論與經(jīng)濟(jì)行為》。普林斯頓**2、塔克(Tucher)發(fā)展了“囚徒困境”(1950)(庫恩)**3、納什(Nash)發(fā)表了關(guān)于均衡的定義與存在性的文章。4、納什與夏普利(Sharpley)發(fā)展了關(guān)于“討價還價博弈”文章(1953)。到了1953年,所有將被經(jīng)濟(jì)學(xué)家們在此后二十年中運(yùn)用到的博弈理論事實(shí)上都已被發(fā)現(xiàn)了。但直到70年代中期,博弈論還保持著獨(dú)立領(lǐng)域的地位,之后經(jīng)濟(jì)學(xué)家開始發(fā)現(xiàn)將博弈論與復(fù)雜的經(jīng)濟(jì)問題結(jié)合起來可能會得到什么結(jié)果。在80年代,博弈論迅速成為主流經(jīng)濟(jì)學(xué)的重要組成部分。事實(shí)上,他幾乎吞并了整個微觀經(jīng)濟(jì)學(xué)。三、博弈論的歷史**1、起步于馮?諾依曼(VonNeuma88重要的文獻(xiàn)還有:5、澤爾騰(Selten)關(guān)于“完美性”的文章(1965)德國波恩大學(xué)6、海薩尼(Harsanyi)關(guān)于“不完全信息”的文章(1967)。美國伯克利大學(xué)7、克瑞普斯(Kreps)和威爾遜(Wilson)對完美性加以擴(kuò)展的文章(1982)。8、Kreps、Milgrom(米爾格羅姆)、Roberts(羅伯茨)&Wilson關(guān)于不完全信息重復(fù)博弈的文章。重要的文獻(xiàn)還有:89四、實(shí)例化理論與推崇最基本假設(shè)和最大化行為的潮流同時興起的還有對簡潔的追求:稱做“實(shí)例化理論”。簡單的說,就是把某一類現(xiàn)象精練成一個簡潔而把握其精髓的故事,并模型化形成理論,然后用于解決實(shí)際問題。實(shí)例理論如:囚徒困境、智豬博弈、斗雞博弈、福利博弈等。四、實(shí)例化理論與推崇最基本假設(shè)和最大化行為的潮流同時興起的還90五、博弈論的架構(gòu)完全信息靜態(tài)博弈:納什均衡完全信息動態(tài)博弈:子博弈精練納什均衡不完全信息靜態(tài)博弈:貝葉斯納什均衡不完全信息動態(tài)博弈:精練貝葉斯納什均衡五、博弈論的架構(gòu)完全信息靜態(tài)博弈:納什均衡91第一章引論1—1策略博弈,從故事開始例1:如果給你兩個師的兵力,有你來當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市,而敵人的守備力量是三的師,規(guī)定雙方的兵力只能整師調(diào)動。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時候,你的兵力超過敵人,你勝;你的兵力少于或等于敵人守備的兵力,你就失敗。問:敵我各有幾種布兵策略?敵我取勝的概率各多少?分析:(一)敵軍的四種部署方案A、三個師住守甲方向,B、兩個師守甲方向,一個師守乙方向,C、一個師守甲方向,兩個師守乙方向,D、三個師住守乙方向。第一章引論1—1策略博92(二)我軍的三種部署方案a、集中全部的兩個師的兵力從甲方向進(jìn)攻,b、分兵兩路同時攻擊,一從甲方向,一從乙方向,c、集中全部的兩個師的兵力從乙方向進(jìn)攻。—,++,——,+—,++,——,+—,+—,++,—+,—+,—+,—敵方3-02-11-20-3我軍—,+—,+—,+—,++,—+,—敵方2-11-2我軍—,+—,++,—+,—我軍2-01-10-22-01-10-22-00-2敵方2-11-2(二)我軍的三種部署方案—,++,——,+—,++,——93一、什么是博弈論
“博弈”字面解就是“豐富多彩的對抗性游戲”。例1石頭、剪刀、布。
張威石頭剪刀布進(jìn)步,原地
小剛石頭
剪刀布進(jìn)步,原地進(jìn)步,原地原地,原地原地,原地原地,原地原地,進(jìn)步原地,進(jìn)步原地,進(jìn)步
小剛、張威分別出什么招,關(guān)鍵在于他們對對手可能出什么招的“猜測”上。即他們各自的策略是相互依存的。1-2、博弈的基本概念和囚徒困境
一、什么是博弈論94例2鴿派與鷹派
美國鴿派政策鷹派政策0,0+1,-1-1,+1-x,-x前蘇聯(lián)鴿派政策鷹派政策鴿派代表妥協(xié)路線鷹派代表強(qiáng)硬路線為了最大化自身的利益,美蘇各方的政策選擇,依賴于對手策略的選擇。例2鴿派與鷹派美95博弈的定義:
博弈是指決策主體人在相互對抗中,對抗雙方(或多方)相互依存的一系列策略和行動的過程集合。注意:
博弈論是專門研究博弈如何出現(xiàn)均衡的規(guī)律的科學(xué)。1、博弈中的參與者各自追求的利益具有沖突性。2、博弈是一個過程的集合。3、博弈的一個本質(zhì)特征就是策略的相互依存性。博弈的定義:1、博弈中的參與者各自追求的利益具有沖突96
二、一個博弈中必不可少的要素包括:
參與人(players)行動(action)信息(information)策略(strategies)支付函數(shù)(payoff)結(jié)果(outcome)均衡(equilibria)1、參與人:指的是博弈中選擇行動以最大化自己效用的決策主體(可能是個人,也可能是團(tuán)體,如國家、企業(yè);)2、行動:是參與人的決策變量,即參與人所能做的某一選擇。3、戰(zhàn)略:是參與人選擇行動的規(guī)則,它告訴參與人在什么時候選擇什么行動(如“人不犯我,我不犯人,人若犯我,我必犯人”是一種戰(zhàn)略)
二、一個博弈中必不可少的要素包括:974、信息:指的是參與人在博弈中的知識,特別是有關(guān)其他參與人(對手)的特征和行動的知識;5、支付函數(shù):是參與人從博弈中獲得的效用水平,它是所有參與人戰(zhàn)略或行動的函數(shù);(支付可以是實(shí)數(shù),也可以是序數(shù))6、均衡:是所有參與人的最優(yōu)戰(zhàn)略或行動的組合。
4、信息:指的是參與人在博弈中的知識,特別是有關(guān)其他參與人(98三、二人博弈的支付矩陣博弈的矩陣型表示,此種表示的博弈叫矩陣型博弈。它不同于數(shù)學(xué)中的矩陣:1、符號不同;2、一是單矩陣一是雙矩陣;-1,11,-1-1,1-1,11,-1-1,1-1,1-1,11,-11,-11,-11,-1敵方3-02-11-20-3我軍2-01-10-2概念行參與人列參與人三、二人博弈的支付矩陣-1,11,-1-1,1-1,199四、囚徒困境
例1:囚徒困境兩個嫌疑犯被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果兩人都坦白,各判刑8年徒刑;如果兩個都抵賴,各判2年徒刑,如果其中一人坦白另一人抵賴,坦白的放出去,不坦白的判刑10年徒刑。(一)給出囚徒困境的戰(zhàn)略式表述1、參與人:囚徒A,囚徒B。2、博弈的策略:(都有兩策略)坦白、抵賴3、支付函數(shù):(二)囚徒困境的矩陣式表示(見右上圖)(三)三人博弈、多人博弈的表示。坦白抵賴囚徒B-8,-80,-10-10,0-2,-2坦白抵賴囚徒A四、囚徒困境坦白抵賴囚徒B-8,-80,-101001-3“抓錢博弈”一、利益一致的“抓錢博弈”1、游戲過程描述2、游戲特點(diǎn)分析同時決策博弈,屬靜態(tài)博弈;決策有先有后的序貫決策博弈,屬動態(tài)博弈3、動態(tài)博弈的表示——博弈樹決策節(jié)點(diǎn)、起始(根)節(jié)點(diǎn)、末端節(jié)點(diǎn)、節(jié)點(diǎn)決策人、枝(棱)——代表決策可能的選擇;支付順序;樹型博弈(展開型博弈)。甲乙甲乙不拿不拿不拿不拿拿拿拿拿(1,1)(2,2)(3,3)(4,4)(5,5)1-3“抓錢博弈”甲乙101二、“你死我活”的抓錢游戲1、此博弈規(guī)則時刻1…時刻2……時刻5…2、注意在“利益一致”抓錢游戲和“你死我活”的抓錢游戲中,在對應(yīng)的各步的兩參與人的支付總和是相同的,但制度安排不同,結(jié)果就大相徑庭。3、關(guān)于故事的編排和博弈名稱的說明。(10,0)(2,0)(0,4)(6,0)(0,8)甲乙甲乙不拿不拿不拿不拿拿拿拿拿二、“你死我活”(10,0)(2,0)(0,4)(6,0)(102三、“溫和對抗”的抓錢游戲是一個小跌、大漲、小跌、大漲的循環(huán)游戲。結(jié)論:制度設(shè)置不同,參與人的支付就不同,博弈的結(jié)果就不同。(2,0)(1,3)(4,2)(3,5)甲乙甲乙不拿不拿不拿不拿拿拿拿拿(6,4)三、“溫和對抗”(2,0)(1,3)(4,2)(3,5)甲1031-4利益是交易的前提一、建立在自愿交易上的命題:
1、在交易的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版城市綜合體臨電箱式變壓器安全運(yùn)行保障合同4篇
- 2025年度床上用品電商平臺合作推廣合同3篇
- 2025年度存量房買賣風(fēng)險評估及居間服務(wù)合同4篇
- 2025年度寵物食品原料采購與質(zhì)量控制合同2篇
- 2025年度智能物流配送中心建設(shè)與運(yùn)營合同4篇
- 2025年瓦工班組新型環(huán)保材料施工勞務(wù)分包合同6篇
- 二零二五版苗木種植與土壤改良技術(shù)服務(wù)合同3篇
- 二零二五年度商鋪物業(yè)管理與智能繳費(fèi)系統(tǒng)合同4篇
- 二零二五年度醫(yī)療設(shè)備代理合同終止函4篇
- 2025年度建筑模板研發(fā)與應(yīng)用合同4篇
- 春節(jié)文化常識單選題100道及答案
- 12123交管學(xué)法減分考試題及答案
- 2024年杭州師范大學(xué)附屬醫(yī)院招聘高層次緊缺專業(yè)人才筆試真題
- 制造業(yè)BCM業(yè)務(wù)連續(xù)性管理培訓(xùn)
- 商場停車場管理制度
- 2025年寒假實(shí)踐特色作業(yè)設(shè)計模板
- 24年追覓在線測評28題及答案
- TGDNAS 043-2024 成人靜脈中等長度導(dǎo)管置管技術(shù)
- 《陸上風(fēng)電場工程概算定額》NBT 31010-2019
- 藥房(冰柜)溫濕度表
- QJ903.9A-1995航天產(chǎn)品工藝文件管理制度管理用工藝文件編制規(guī)則
評論
0/150
提交評論