序貫決策博弈相關(guān)資料_第1頁
序貫決策博弈相關(guān)資料_第2頁
序貫決策博弈相關(guān)資料_第3頁
序貫決策博弈相關(guān)資料_第4頁
序貫決策博弈相關(guān)資料_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章序貫決策博弈序貫決策博弈:局中人做出策略選擇時(shí)知道對(duì)手的策略選擇。

本章討論動(dòng)態(tài)博弈,所有博弈方都對(duì)博弈過程和得益完全了解的完全且完美信息動(dòng)態(tài)博弈。這類博弈也是現(xiàn)實(shí)中常見的基本博弈類型。由于動(dòng)態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對(duì)動(dòng)態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動(dòng)態(tài)博弈模型。主要內(nèi)容1、序貫博弈的定義和表示方法2、尋找序貫博弈納什均衡的“虛線排除確定法”3、尋找序貫博弈納什均衡的“倒推法”4、先動(dòng)優(yōu)勢(shì)和后動(dòng)優(yōu)勢(shì)5、“倒退法”的缺陷一、序貫博弈的定義和表示方法在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,而且后行動(dòng)者在自己行動(dòng)之前能觀察到先行動(dòng)者的行動(dòng)。博弈的三要素策略是在整個(gè)博弈中所有選擇、行為的“完整計(jì)劃”。什么是計(jì)劃:“如果對(duì)手選A,我將采取行動(dòng)X,如果…,我將采取行動(dòng)…?!痹谕瑫r(shí)決策博弈中,行動(dòng)就是策略,但在序貫決策博弈中,行動(dòng)是指每一個(gè)決策點(diǎn)上局中人的決策變量或行動(dòng)的具體抉擇。結(jié)果是上述“計(jì)劃型”策略的策略組合,構(gòu)成一條路徑。支付對(duì)應(yīng)每條路徑,而不是對(duì)應(yīng)每步選擇、行為。支付向量中,數(shù)字的排列按局中人的出場(chǎng)順序出現(xiàn)。構(gòu)造博弈戰(zhàn)略式表述在進(jìn)入障礙博弈中潛在進(jìn)入者只有一個(gè)信息集,兩個(gè)可選擇的行動(dòng),其行動(dòng)空間為:SA=(進(jìn)入,不進(jìn)入)壟斷者有兩個(gè)信息集,每個(gè)信息集上有兩個(gè)可選擇的行動(dòng),其行動(dòng)空間為:(進(jìn)入,容忍)、(進(jìn)入,對(duì)抗)、(不進(jìn)入,容忍)、(不進(jìn)入,對(duì)抗)擴(kuò)展式表述博弈博弈的擴(kuò)展式表述:參與人集合;參與人的行動(dòng)順序;行動(dòng)空間;信息集;支付函數(shù);外生事件(即自然的選擇)的概率分布。在擴(kuò)展式表述博弈,參與人是相機(jī)行事,即“等待”博弈到達(dá)自己的信息集(包括一個(gè)或多個(gè)決策)后再?zèng)Q定如何行動(dòng);在戰(zhàn)略式表述博弈,參與人似乎是在博弈開始之前,就制定出了一個(gè)完全的相機(jī)行動(dòng)計(jì)劃,即“如果…發(fā)生,那么我將現(xiàn)在…”。博弈的擴(kuò)展式表述——博弈樹它描述了博弈參與人的一個(gè)序貫決策過程,從博弈數(shù)的根開始,到末端點(diǎn)結(jié)束。擁有初始決策節(jié)點(diǎn)的局中人先做出決策,他的決策引出博弈樹的棱,而棱的末端將是下一個(gè)局中人做出決策,依此類推。舉例假如某個(gè)壟斷企業(yè)一年可以賺10億元的利潤(rùn),假定別的企業(yè)為了進(jìn)入該行業(yè)需要投資4億元。當(dāng)新的企業(yè)準(zhǔn)備進(jìn)入時(shí),原有壟斷企業(yè)有兩種決策(1)“容忍”,但利潤(rùn)要變?yōu)?億元。這時(shí)新的企業(yè)可以得5億,減去4億投資,仍有1億。(2)“抵抗”,例如降低價(jià)格,企業(yè)的利潤(rùn)變?yōu)?億元,且新的企業(yè)也只得2億,但減去投資,虧損2億。誰先動(dòng)?潛在進(jìn)入者如何表示該博弈?進(jìn)入障礙博弈進(jìn)入者●進(jìn)入不進(jìn)●壟斷者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)壟斷者二、序貫博博弈的納什什均衡例如:性別別戰(zhàn).男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1))(0,0))◆◆◆(-1,-1)(1,2))策略組合該博弈有八八種可能的的策略組合合:({足球球},{((上)足球球,(下))足球}))({足球球},{((上)足球球,(下))芭蕾}))({足球球},{((上)芭蕾蕾,(下))足球}))({足球球},{((上)芭蕾蕾,(下))芭蕾}))({芭蕾蕾},{((上)足球球,(下))足球}))({芭蕾蕾},{((上)足球球,(下))芭蕾}))({芭蕾蕾},{((上)芭蕾蕾,(下))足球}))({芭蕾蕾},{((上)芭蕾蕾,(下))芭蕾}))用虛線排除除確定法尋尋找納什均均衡將以上策略略在博弈書書中用粗線線表示。將存在單獨(dú)獨(dú)改變激勵(lì)勵(lì)的策略用用虛線表示示。方法如如下:(1)找到到第二階段段兩根粗線線所對(duì)應(yīng)的的支付。(2)比較較這兩個(gè)支支付前面的的數(shù)字,如如果大的數(shù)數(shù)字所對(duì)應(yīng)應(yīng)的那條““樹枝”是是細(xì)的,則則男方存在在單獨(dú)偏離離的動(dòng)機(jī),,則男方的的策略選擇擇“樹枝””用虛線表表示。(3)比較較這兩個(gè)后后面付前面面的數(shù)字,,其中對(duì)應(yīng)應(yīng)第一階段段“樹枝””是細(xì)的那那個(gè)數(shù)字可可以不再考考慮,因?yàn)闉槟蟹經(jīng)]選選這個(gè)方向向。它是““虛”的。。(4)因此此只在男方方選的那個(gè)個(gè)“樹丫””上進(jìn)行比比較女方的的支付,如如果大的數(shù)數(shù)字對(duì)應(yīng)的的“樹枝””是細(xì)的,,則女方的的策略選擇擇“樹枝””用虛線表表示。(P159)虛線排除確確定法的缺缺陷該方法可以以找到納什什均衡,但但找不到博博弈的最終終結(jié)果。均衡是策略略的組合,,而結(jié)果則則是行動(dòng)的的組合。因此,我們們一般用倒倒推法(BackwardsInduction)來來尋找序貫貫博弈的結(jié)結(jié)果。三、、尋尋找找序序貫貫博博弈弈的的結(jié)結(jié)果果————倒倒推推法法從動(dòng)動(dòng)態(tài)態(tài)博博弈弈的的最最后后一一個(gè)個(gè)階階段段博博弈弈方方的的行行為為開開始始分分析析,,逐逐步步倒倒推推回回前前一一個(gè)個(gè)階階段段相相應(yīng)應(yīng)博博弈弈方方的的行行為為選選擇擇,,一一直直到到第第一一個(gè)個(gè)階階段段的的分分析析方方法法,,稱稱為為““逆逆推推歸歸納納法法””。。逆推推歸歸納納法法是是動(dòng)動(dòng)態(tài)態(tài)博博弈弈分分析析最最重重要要、、基基本本的的方方法法。。步驟驟::從博博弈弈的的最最后后一一個(gè)個(gè)階階段段開開始始分分析析,,通通過過比比較較最最后后一一個(gè)個(gè)參參與與決決策策的的局局中中人人的的支支付付,,推推斷斷他他或或她她的的選選擇擇,,從從而而將將他他不不會(huì)會(huì)選選的的策策略略————““枝枝椏椏””砍砍掉掉,,從從而而回回到到上上一一個(gè)個(gè)階階段段,,比比較較該該階階段段參參與與決決策策的的局局中中人人的的支支付付,,將將他他或或她她不不會(huì)會(huì)選選的的策策略略砍砍掉掉,,依依此此類類推推……男●足球球芭蕾蕾●女足球球芭蕾蕾●足球球芭蕾蕾◆(2,1)(0,,0)◆◆◆(-1,-1)(1,2)×××倒推法法:(1)在在上面面一個(gè)個(gè)枝椏椏上,,由于最最后一一階段段是女女方做做決策策,因因此比比較女女方的的支付付1和和0,,將0所對(duì)對(duì)應(yīng)的的芭蕾蕾策略略砍掉掉,沒沒砍掉掉的打打上箭箭頭。。(2)在在下面面一個(gè)個(gè)枝椏椏上,,由于于最后后一階階段是是女方方做決決策,,因此此比較較女方方的支支付-1和和2,,將-1所所對(duì)應(yīng)應(yīng)的足足球策策略砍砍掉,,沒砍砍掉的的打上上箭頭頭。((3))回到到第一一個(gè)階階段,,比較較帶箭箭頭的的兩個(gè)個(gè)策略略男方方的支支付((因?yàn)闉榇藭r(shí)時(shí)男方方做決決策)),將將支付付將較較小的的策略略砍掉掉。女練習(xí)開金礦礦博弈弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)×××倒推法法的評(píng)評(píng)價(jià)逆推歸歸納法法只能能分析析明確確設(shè)定定的博博弈問問題,,要求求博弈弈的結(jié)結(jié)構(gòu),,包括括次序序、規(guī)規(guī)則和和得益益情況況等都都非常常清楚楚,并并且各各個(gè)博博弈方方了解解博弈弈結(jié)構(gòu)構(gòu),相相互知知道對(duì)對(duì)方了了解博博弈結(jié)結(jié)構(gòu)。。這些些可能能有脫脫實(shí)際際的可可能逆推歸歸納法法也不不能分分析比比較復(fù)復(fù)雜的的動(dòng)態(tài)態(tài)博弈弈在遇到到兩條條路徑徑利益益相同同的情情況時(shí)時(shí)逆推推歸納納法也也會(huì)發(fā)發(fā)生選選擇困困難對(duì)博弈弈方的的理性性要求求太高高,不不僅要要求所所有博博弈方方都有有高度度的理理性,,不允允許犯犯任何何錯(cuò)誤誤,而而且要要求所所有博博弈方方相互互了解解和信信任對(duì)對(duì)方的的理性性,對(duì)對(duì)理性性有相相同的的理解解,或或進(jìn)一一步有有“理理性的的共同同知識(shí)識(shí)”。。四、先先動(dòng)優(yōu)優(yōu)勢(shì)與與后動(dòng)動(dòng)優(yōu)勢(shì)勢(shì)在序貫貫情侶侶博弈弈中,,任何何一方方率先先采取取行動(dòng)動(dòng)可能能得到到的好好處,,都比比他或或她后后行動(dòng)動(dòng)可能能得到到的好好處大大。這這種局局中人人先動(dòng)動(dòng)得益益大于于后行行得益益的情情況,,叫做做先動(dòng)優(yōu)優(yōu)勢(shì)。請(qǐng)比較較:男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,,0)◆◆◆(-1,-1)(1,2)×××女先動(dòng)優(yōu)優(yōu)勢(shì)當(dāng)男方方先動(dòng)動(dòng)時(shí),,男方方得2,女女方得得1,,但當(dāng)當(dāng)女方方先動(dòng)動(dòng)時(shí),,男方方得1,女女方得得2。?!跋认孪率譃闉閺?qiáng)””女●足球芭蕾●男足球芭蕾●足球芭蕾◆(1,,2))(-1,-1))◆◆◆(0,,0))(2,,1))×××男序貫博博弈中中的性性別戰(zhàn)戰(zhàn)舉例::情侶侶博弈弈中往往往是是先動(dòng)動(dòng)一方方,比比如女女方已已經(jīng)買買好了了電影影票,,再比比如男男方曾曾經(jīng)多多次告告訴女女方,,世界界杯就就算不不上班班也要要看D!后動(dòng)優(yōu)勢(shì)后動(dòng)優(yōu)勢(shì)::后行動(dòng)的的得益比先先行動(dòng)的得得益大的情情況。例如:石頭頭、剪刀、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論