月英語六級CET6真題名師優(yōu)質(zhì)課賽課一等獎市公開課獲獎?wù)n件_第1頁
月英語六級CET6真題名師優(yōu)質(zhì)課賽課一等獎市公開課獲獎?wù)n件_第2頁
月英語六級CET6真題名師優(yōu)質(zhì)課賽課一等獎市公開課獲獎?wù)n件_第3頁
月英語六級CET6真題名師優(yōu)質(zhì)課賽課一等獎市公開課獲獎?wù)n件_第4頁
月英語六級CET6真題名師優(yōu)質(zhì)課賽課一等獎市公開課獲獎?wù)n件_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章

完全信息動態(tài)博弈第1頁在完全信息動態(tài)博弈中,博弈參加者行動存在先后次序。能夠用博弈樹表示完全信息動態(tài)博弈。能夠經(jīng)過逆向歸納法求解完全信息動態(tài)博弈子博弈精煉納什均衡,剔除不可置信威脅。第2頁第一節(jié)完全信息動態(tài)博弈概述一、完全信息動態(tài)博弈定義在完全信息靜態(tài)博弈中,博弈參加者同時采取行動。但在完全信息動態(tài)博弈中,博弈參加者行動存在先后次序。從信息角度上,完全信息動態(tài)博弈與完全信息靜態(tài)博弈類似,博弈參加者對博弈結(jié)構(gòu)、博弈次序、雙方收益等信息都具備完全了解。第3頁二、博弈樹在動態(tài)博弈中,因?yàn)椴┺膮⒓诱咝袆哟嬖谙群蟠涡?,所以能夠用更形象方法來表示動態(tài)博弈:博弈樹(GameTree)。經(jīng)過支付矩陣形式表示博弈通常被稱為策略型或正則型博弈(NormalFormGame)。經(jīng)過博弈樹表示博弈通常被稱為擴(kuò)展型博弈(ExtensiveFormGame)。第4頁動態(tài)市場爭奪戰(zhàn)博弈擴(kuò)展型表示方式如圖所表示“市場爭奪戰(zhàn)”博弈擴(kuò)展型表示形式第5頁1.博弈樹組成要素(1)博弈參加者(2)行動次序:在動態(tài)博弈中,博弈參加者行動存在先后次序。(3)行動策略空間(ActionSet):指博弈參加者能夠采取全部可能策略。(4)信息集(InformationSet):指博弈參加者在博弈過程中所知道信息。(5)支付函數(shù)指博弈參加者采取特定策略與所能得到收益之間關(guān)系。第6頁2.博弈樹結(jié)構(gòu)(1)博弈樹結(jié)構(gòu)方法首先行動一方位于博弈樹最上端,依據(jù)動態(tài)博弈過程中各方行動次序,博弈數(shù)自上至下延展。也有學(xué)者習(xí)慣自左至右結(jié)構(gòu)博弈樹。橫向博弈樹第7頁博弈樹中包含若干“節(jié)點(diǎn)”,節(jié)點(diǎn)用小圓圈表示。位于博弈樹最上端節(jié)點(diǎn)稱為“初始節(jié)點(diǎn)”。初始節(jié)點(diǎn)用空心小圓圈表示,其它節(jié)點(diǎn)均用實(shí)心小圓圈表示。在每個節(jié)點(diǎn)處均對應(yīng)某個博弈參加者,將節(jié)點(diǎn)對應(yīng)博弈參加者標(biāo)識在節(jié)點(diǎn)旁邊。比如:在“市場爭奪戰(zhàn)”博弈中,因?yàn)闈撛谶M(jìn)入者先行動,所以初始節(jié)點(diǎn)處對應(yīng)博弈參加者為潛在進(jìn)入者。將潛在進(jìn)入者標(biāo)識在博弈樹初始節(jié)點(diǎn)旁邊。當(dāng)潛在進(jìn)入者決議之后,輪到在位者進(jìn)行決議。在位者所在節(jié)點(diǎn)稱為“后續(xù)節(jié)點(diǎn)”。在位者位于兩個后續(xù)節(jié)點(diǎn)上。在位者都有兩種策略選擇:“斗爭”和“默許”。第8頁假如初始節(jié)點(diǎn)處博弈參加者存在N種策略,那么就從初始節(jié)點(diǎn)處罰出N條路徑。路徑用線段表示。在線段旁注明對應(yīng)策略。在“市場爭奪戰(zhàn)”博弈中,首先行動潛在進(jìn)入者能夠采取兩種策略:“不進(jìn)入”和“進(jìn)入”。所以,從初始節(jié)點(diǎn)處引出兩條線段,在兩條線段旁分別標(biāo)識“不進(jìn)入”和“進(jìn)入”。當(dāng)潛在進(jìn)入者選擇結(jié)束后,到達(dá)在位者節(jié)點(diǎn)。在位者有兩個選擇:“斗爭”和“默許”。所以,從在位者節(jié)點(diǎn)處引出兩條線段,在兩條線段旁分別標(biāo)識“斗爭”和“默許”。第9頁當(dāng)博弈不再有后續(xù)節(jié)點(diǎn)時,需要將博弈收益標(biāo)識在博弈樹末端。將博弈參加者收益放在括號里。需要注意是:各博弈參加者收益需要按照各參加者行動次序進(jìn)行排列。先行動博弈參加者收益寫在左邊,依次類推,從左到右,最終行動博弈參加者收益寫在最右邊。各個博弈參加者收益之間用逗號分割。第10頁(2)博弈樹與博弈次序博弈樹各節(jié)點(diǎn)之間存在次序關(guān)系,博弈樹由上至下節(jié)點(diǎn)次序表示各博弈參加者進(jìn)行決議次序。第11頁從博弈樹節(jié)點(diǎn)能夠引出多條線段,但不能從博弈樹多個節(jié)點(diǎn)共同抵達(dá)博弈樹下方同一個后續(xù)節(jié)點(diǎn)。錯誤博弈樹結(jié)構(gòu)方法第12頁正確博弈樹結(jié)構(gòu)方法正確博弈樹結(jié)構(gòu)方法第13頁結(jié)構(gòu)博弈樹時只能按照由上至下路徑,而不能存在由下向上路徑,也不能形成循環(huán)路徑?;厮萋窂轿ㄒ恍栽谇蠼馔耆畔討B(tài)博弈時非常主要。因?yàn)樵谇蠼鈩討B(tài)博弈均衡時,一個很主要方法是“逆向歸納法(BackwardInduction)”。只有首先確保從博弈樹任何最終節(jié)點(diǎn)向上回溯時路徑唯一,才能確保逆向歸納法可操作性。第14頁正確博弈樹結(jié)構(gòu)方法正確博弈樹結(jié)構(gòu)方法第15頁錯誤博弈樹結(jié)構(gòu)方法錯誤博弈樹結(jié)構(gòu)方法第16頁三、信息集與三人罷工博弈在完全信息動態(tài)博弈中,假如將博弈樹多個節(jié)點(diǎn)用虛線連接起來,表明這多個節(jié)點(diǎn)位于同一個博弈信息集中。也就是說:博弈參加者不知道自己位于同一個信息中哪個博弈節(jié)點(diǎn)上。能夠經(jīng)過“三人罷工博弈”來說明信息集含義以及信息集在動態(tài)博弈中主要性。第17頁1.三人罷工博弈定義三人罷工博弈博弈樹第18頁2.三人罷工博弈策略選擇與信息員工2只有一個信息集博弈樹第19頁員工3不能觀察到員工2決議策略第20頁員工3不知道員工1決議策略第21頁員工3不知道員工1和員工2決議策略第22頁三名員工都只有一個信息集博弈第23頁四、博弈樹與靜態(tài)博弈博弈樹方法不但能表示動態(tài)博弈,還能表示靜態(tài)博弈。所謂“博弈先后次序”,它主要是一個信息概念,而不是一個純時間先后概念。用博弈樹表示囚徒困境第24頁下面三種博弈表示方式所表示博弈內(nèi)涵相同嫌疑人乙坦白不坦白嫌疑人甲坦白(5,5)(1,10)不坦白(10,1)(2,2)第25頁第二節(jié)完全且完美信息動態(tài)博弈概述在完全且完美信息動態(tài)博弈(DynamicGamewithPerfectandCompleteInformation)中,每個博弈參加者均知道在自己之前進(jìn)行決議參加者選擇策略和博弈結(jié)構(gòu)。博弈樹中每個節(jié)點(diǎn)都獨(dú)立組成一個信息集,沒有虛線連接兩個或多個博弈樹節(jié)點(diǎn)。求解完全且完美信息動態(tài)博弈主要方法之一是:逆向歸納法。能夠經(jīng)過“海盜分寶博弈”這個生動有趣故事對“逆向歸納法”進(jìn)行一個直觀介紹。第26頁一、海盜分寶博弈1.海盜分寶博弈規(guī)則五個海盜首先進(jìn)行抽簽,確定決議次序。五個海盜按照決議次序依次提出對100個金幣分配方案。第一個海盜提出一個分配方案,如超出半數(shù)海盜(包含提出分配方案海盜)同意第一個海盜分配方案,即大于等于3名海盜同意第一個海盜分配方案時,那么該方案被經(jīng)過,博弈結(jié)束。假如第一個海盜提出分配方案沒有得到超出半數(shù)海盜同意,那么第一個海盜將被扔到海里喂鯊魚。接下來由第二個海盜提出分配方案,假如超出半數(shù)海盜同意第二個海盜分配方案時,那么該方案被經(jīng)過,博弈結(jié)束。第27頁假如第二個海盜提出分配方案沒有得到超出半數(shù)海盜同意,那么第二個海盜也將被扔到海里喂鯊魚。接下來由第三個海盜提出分配方案,假如超出半數(shù)海盜,即大于等于2名海盜,同意第三個海盜分配方案時,那么該方案被經(jīng)過,博弈結(jié)束。假如第三個海盜提出分配方案沒有得到超出半數(shù)海盜同意,那么第三個海盜也將被扔到海里喂鯊魚。接下來由第四個海盜提出分配方案。假如超出半數(shù)海盜同意第四個海盜分配方案時,那么該方案被經(jīng)過,博弈結(jié)束。第28頁假如第四個海盜提出分配方案沒有得到超出半數(shù)海盜同意,那么第四個海盜也將被扔到海里喂鯊魚。這時就只剩下第五個海盜了,第五個海盜將獨(dú)吞搶劫來100個金幣,博弈結(jié)束。在這種分配規(guī)則下,第一個海盜將提出怎樣分配方案?第一個海盜提出分配方案需要滿足兩個條件。第一,確保超出半數(shù)海盜同意第一個海盜分配方案。第二:第一個海盜最大化自己能分到金幣。假如直接從第一個海盜決議策略入手,此問題相對復(fù)雜。不妨從第五個海盜入手,然后按照從后向前次序依次逆向考查海盜策略選擇。第29頁2.求解海盜分寶博弈均衡第一個海盜將提出怎樣分配方案?此分配方案在確保能得到超出半數(shù)海盜同意前提下應(yīng)最大化第一個海盜利益。輪次分配方案提出者分配方案最終一輪海盜5自己獨(dú)吞全部100個金幣倒數(shù)第二輪海盜4任何分配方案都得不到經(jīng)過倒數(shù)第三輪海盜3分配給第三個海盜100個金幣,第四個海盜0個金幣,第五個海盜0個金幣。倒數(shù)第四輪海盜2分配給自己98個金幣,第三個海盜0個金幣,第四個海盜1個金幣、第5個海盜1個金幣。經(jīng)過逆向歸納法推導(dǎo)出財寶分配方案第30頁3.海盜分寶博弈均衡第一個海盜分配方案能夠有兩種。分配方案1:分配給自己97個金幣,給第二個海盜0個金幣,給第三個海盜1個金幣,給第四個海盜2個金幣,給第五個海盜0個金幣。分配方案2:分配給自己97個金幣,給第二個海盜0個金幣,給第三個海盜1個金幣,給第四個海盜0個金幣,給第五個海盜2個金幣。假如第一個海盜提出分配方案1,那么第二個海盜和第五個海盜將反對,而第一個、第三個和第四個海盜將同意,所以第一個海盜提議將取得經(jīng)過。假如第一個海盜提出分配方案2,那么第二個海盜和第四個海盜將反對,而第一個、第三個和第五個海盜將同意,所以第一個海盜提議將取得經(jīng)過。第31頁二、擴(kuò)展形式博弈策略表示方式1.將擴(kuò)展形式博弈改寫為策略形式動態(tài)博弈擴(kuò)展表示形式第32頁參加者2UV參加者1L(a1,b1)(a2,b2)R(a3,b3)(a4,b4

)錯誤動態(tài)博弈策略表示形式第33頁參加者2(U,U)(U,V)(V,U)(V,V)參加者1L(a1,b1)(a1,b1)(a2,b2)(a2,b2)R(a3,b3)(a4,b4)(a3,b3)(a4,b4)動態(tài)博弈策略表示形式第34頁參加者2(U,U,U)(U,U,V)(U,V,U)(U,V,V)(V,U,U)(V,U,V)(V,V,U)(V,V,V)參加者1L(a1,b1)(a1,b1)(a1,b1)(a1,b1)(a2,b2)(a2,b2)(a2,b2)(a2,b2)M(a3,b3)(a3,b3)(a4,b4)(a4,b4)(a3,b3)(a3,b3)(a4,b4)(a4,b4)R(a5,b5)(a6,b6)(a5,b5)(a6,b6)(a5,b5)(a6,b6)(a5,b5)(a6,b6)動態(tài)博弈擴(kuò)展表示形式動態(tài)博弈策略表示形式第35頁2.?dāng)U展形式轉(zhuǎn)化為策略形式時規(guī)律參加者1純策略空間為:參加者2純策略空間為:參加者3純策略空間為:第36頁參加者2純策略空間為:參加者1純策略空間為:第37頁第三節(jié)子博弈與逆向歸納法在圖中,用虛線框起來部分稱作一個子博弈(Sub-Game)。第38頁一、子博弈子博弈是原始動態(tài)博弈一部分。子博弈包含博弈所需各種信息,能獨(dú)立組成一個博弈。一個博弈子博弈需要滿足四個條件。1.子博弈起始節(jié)點(diǎn)不能是原來博弈起始節(jié)點(diǎn)2.子博弈不能分割信息集3.有些博弈包含多個子博弈4.有些博弈沒有子博弈第39頁二、逆向歸納法1.逆向歸納法定義和求解方法逆向歸納法指:在求解動態(tài)博弈時,首先找到博弈次序在最終子博弈,找到子博弈中博弈參加者策略選擇,然后按博弈次序由后向前逆向歸納,直至博弈樹初始節(jié)點(diǎn),從而找到博弈均衡。第40頁1.逆向歸納法定義和求解方法逆向歸納法指:在求解動態(tài)博弈時,首先找到博弈次序在最終子博弈,找到子博弈中博弈參加者策略選擇,然后按博弈次序由后向前逆向歸納,直至博弈樹初始節(jié)點(diǎn),從而找到博弈均衡。第41頁第42頁2.經(jīng)過逆向歸納法求解博弈均衡實(shí)例第43頁三、斯塔貝爾伯格寡頭博弈斯塔貝爾伯格博弈(StackelbergDuopolyGame)是寡頭博弈一個常見形式,是一個完全信息動態(tài)博弈。1.斯塔貝爾伯格寡頭博弈定義斯塔貝爾伯格寡頭博弈:市場中有兩個廠商。廠商1先行動,選擇本身產(chǎn)量。廠商2觀察到廠商1選擇產(chǎn)量后,再決議自己產(chǎn)量。廠商1通常被稱為領(lǐng)先者,廠商2通常被稱為跟隨者。第44頁2.求解斯塔貝爾伯格寡頭博弈依據(jù)逆向歸納法,首先考慮廠商2怎樣選擇自己產(chǎn)量.作為領(lǐng)先者,廠商1在決定自己產(chǎn)量時會考慮自己決議產(chǎn)量對廠商2影響。求解得到:作為領(lǐng)先者廠商1產(chǎn)量為:作為跟隨者廠商2產(chǎn)量為:第45頁3.古諾寡頭博弈與斯塔貝爾伯格寡頭博弈在古諾寡頭博弈中,市場需求函數(shù)和廠商成本函數(shù)與斯塔貝爾伯格博弈均相同。二者主要區(qū)分是:在古諾寡頭博弈中,兩家廠商同時進(jìn)行決議,是一個完全信息靜態(tài)博弈。在斯塔貝爾伯格寡頭博弈中,廠商1先行動,廠商2后行動,是一個完全信息動態(tài)博弈。古諾寡頭博弈均衡是:斯坦貝爾伯格寡頭博弈均衡是:第46頁斯塔貝爾博弈寡頭博弈均衡示意圖第47頁第四節(jié)子博弈精煉納什均衡澤爾滕(Selten)在1965年提出了“子博弈精煉納什均衡(SubgamePerfectNashEquilibrium)”概念。子博弈精煉納什均衡也被稱為子博弈完美納什均衡。子博弈精煉納什均衡與納什均衡不一樣。納什均衡要求:給定其它參加者在均衡處策略,任何一方博弈參加者在均衡處選擇策略都是自己所能選擇最優(yōu)策略,沒有博弈參加者有動機(jī)改變自己在均衡時策略。子博弈精煉納什均衡不但要求均衡解是納什均衡,而且要求均衡解在每一個信息集上都是最優(yōu)解。第48頁一、子博弈精煉納什均衡含義經(jīng)過逆向歸納法求解博弈樹得到均衡是子博弈精煉納什均衡。納什均衡僅需要在均衡處,每個博弈參加者沒有動機(jī)改變自己策略。子博弈納什均衡不但要求均衡滿足納什均衡要求條件,還要求在動態(tài)博弈中,此均衡是每個子博弈最優(yōu)解。也就是說:納什均衡只對均衡處策略有要求。子博弈精煉納什均衡不但對均衡處策略有要求,而且對抵達(dá)均衡路徑有要求。要求從博弈初始節(jié)點(diǎn)開始,博弈參加者抵達(dá)均衡處所經(jīng)過路徑也必須是最優(yōu)。第49頁在“市場爭奪戰(zhàn)”博弈中,假如在位者選擇“斗爭”,那么潛在進(jìn)入者會選擇“不進(jìn)入”。假如在位者選擇“默許”,那么潛在進(jìn)入者會選擇“進(jìn)入”。對潛在進(jìn)入者來說,在位者“斗爭”策略是一個不可置信威脅(NoncredibleThreat)或空洞威脅(EmptyThreat)。子博弈精煉納什均衡就是把包含不可置信威脅納什均衡從可能均衡中剔除出去。顧名思義,“子博弈精練納什均衡”是對納什均衡“精練”。經(jīng)過剔除包含不可置信威脅納什均衡,降低納什均衡數(shù)目。第50頁二、不可置信威脅在很多完全信息動態(tài)博弈中,都存在不可置信威脅。1.“市場爭奪戰(zhàn)”博弈在“市場爭奪戰(zhàn)”博弈中,(潛在進(jìn)入者不進(jìn)入,在位者斗爭)這個納什均衡包含不可置信威脅,所以不是一個子博弈精練納什均衡。假如在位者把“斗爭”變成一個可置信威脅(CredibleThreat),那么博弈均衡就會不一樣。第51頁2.斯塔貝爾伯格寡頭博弈假如后行動跟隨者做出一個“威脅”:不論先行動領(lǐng)先者選擇何種產(chǎn)量,自己都會將產(chǎn)量定在對于領(lǐng)先者廠商來說,這是一個可置信威脅假如跟隨者在含有法律約束力公證機(jī)構(gòu)簽署一項(xiàng)承諾:不論領(lǐng)先者選取何種產(chǎn)量水平,自己都會將產(chǎn)量定在,假如自己違反承諾,那么將自動捐出收益。跟隨者廠商承諾變?yōu)橐粋€可置信承諾。跟隨者廠商不可置信威脅不會影響到先行動領(lǐng)先者廠商產(chǎn)量決議。然而跟隨者可置信威脅確實(shí)會影響到先行動領(lǐng)先者廠商產(chǎn)量決議,進(jìn)而影響博弈均衡。第52頁三、逆向歸納法擴(kuò)展應(yīng)用逆向歸納法不但在求解完全且完美信息動態(tài)博弈時非常有用,在一些完全但不完美信息動態(tài)博弈中,逆向歸納法也有一定用武之地。第53頁完全且完美信息動態(tài)博弈博弈均衡路徑是:參加者1選擇策略R,然后參加者2進(jìn)行決議參加者2選擇策略T,博弈結(jié)束。參加者1得到收益3、參加者2得到收益1。第54頁四、逆向歸納法局限和“蜈蚣博弈”即使逆向歸納法是求解動態(tài)博弈子博弈精煉納什均衡有力工具,但依據(jù)逆向歸納法求解出均衡有時卻是和常理相悖?;蛘哒f:經(jīng)過逆向歸納法有時也會求解出“不合理”均衡。經(jīng)濟(jì)學(xué)家羅森賽爾(Rosenthsal)提出“蜈蚣博弈(CentipedeGame)”就是這么一個經(jīng)典例證。即使經(jīng)過逆向歸納法能夠求出蜈蚣博弈均衡解,但此均衡解合理性受到了普遍挑戰(zhàn)。所以,蜈蚣博弈有時也被稱為“蜈蚣博弈悖論”,簡稱“蜈蚣悖論(CentipedeParadox)”。第55頁1.蜈蚣博弈定義假設(shè)有兩名博弈參加者:參加者1和參加者2。兩名參加者輪番進(jìn)行決議:首先由參加者1進(jìn)行決議,然后是參加者2,再次是博弈參加者1,然后是博弈參加者2,依次類推。在博弈初始節(jié)點(diǎn)處,參加者1有兩個策略能夠選擇:T和C。策略T表示結(jié)束博弈(Terminate),策略C表示繼續(xù)(Continue)博弈。當(dāng)參加者1選擇策略T時,博弈結(jié)束。參加者1得到收益1,參加者2得到收益1。當(dāng)參加者1選擇策略C時,輪到博弈參加者2進(jìn)行決議。參加者2一樣面臨兩個策略選擇:策略T和策略C。第56頁當(dāng)參加者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論