經(jīng)濟(jì)博弈論考試復(fù)習(xí)_第1頁(yè)
經(jīng)濟(jì)博弈論考試復(fù)習(xí)_第2頁(yè)
經(jīng)濟(jì)博弈論考試復(fù)習(xí)_第3頁(yè)
經(jīng)濟(jì)博弈論考試復(fù)習(xí)_第4頁(yè)
經(jīng)濟(jì)博弈論考試復(fù)習(xí)_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、經(jīng)濟(jì)博弈論考試復(fù)習(xí)一、1.什么是博弈論?“博弈論”譯自英文“game theory”,直譯就是“游戲理論”。是系統(tǒng)研究各種博弈問(wèn)題,尋求在各博弈方具有充分或者有限理性、能力的條件下,合理的策略選擇和合理選擇策略時(shí)博弈的結(jié)果,并分析這些結(jié)果的經(jīng)濟(jì)意義、效率意義的理論和方法。博弈:一些個(gè)人、組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)律下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過(guò)程。包括:博弈的參加者,各博弈方的全部策略或行為集合,進(jìn)行博弈的次序,博弈方的得益四方面。2.什么是納什均衡? 在博弈g=,;,, 中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略

2、組合(*,, *)中,任一博弈方i的策略*,都是對(duì)其余博弈方策略組合(*,,*, *,*, *)的最佳對(duì)策,也即(*,,*, *,*, *)(*,,*, *,*, *)對(duì)任意都成立,則稱(chēng)(*,, *)為g的一個(gè)“納什均衡”。(假設(shè)有n個(gè)局中人參與博弈,給定其他人策略的條件下,每個(gè)局中人選擇自己的最優(yōu)策略,從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合就是納什均衡。這種策略組合由所有參與人最優(yōu)策略組成,即在給定別人策略的情況下,沒(méi)有人有足夠理由打破這種均衡。)3.什么是囚徒困境?囚徒困境的基本模型是這樣的:警察抓住了兩個(gè)合伙犯罪的罪犯。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押以防止他們

3、竄供或結(jié)成攻守同盟:如果他們兩人都拒不認(rèn)罪,則他們會(huì)被以較輕的妨礙公務(wù)罪各判一年徒刑;如果兩人中有一人坦白認(rèn)罪,則坦白這從輕處理,立即釋放,而另一人則將重判八年徒刑;如果兩人同時(shí)坦白認(rèn)罪,他們將各被判五年監(jiān)禁。囚徒1坦白 不坦白(囚徒2)坦白-5,-50,-8不坦白-8, 0-1,-1雙方的利益不僅取決于他們自己的策略選擇也取決于對(duì)方的策略選擇。由于這兩個(gè)囚徒不能串通,個(gè)人都追求自己的最大利益而不會(huì)顧及同伙的利益,又不敢相信對(duì)方,以此只能實(shí)現(xiàn)他們都不理想的結(jié)果。該博弈揭示了個(gè)體理性與團(tuán)體立項(xiàng)之間的矛盾從個(gè)體理性出發(fā)的行為往往不能實(shí)現(xiàn)團(tuán)體的最大利益,最終也不能真正實(shí)現(xiàn)個(gè)體的最大利益,甚至?xí)玫较?/p>

4、當(dāng)差的結(jié)果。二、1什么是完全信息靜態(tài)博弈?完全信息靜態(tài)博弈是指各博弈方同時(shí)決策,且所有的博弈方對(duì)各方得益都了解的博弈。完全信息是指信息的充分性、對(duì)稱(chēng)性和透明性,靜態(tài)是指同時(shí)決策,沒(méi)有時(shí)間的差別。2如何求解納什均衡?求解納什均衡的4種方法: 離散、有限策略博弈:劃線(xiàn)法 連續(xù)、無(wú)限策略博弈:反映函數(shù)法 零和博弈:最大最小法 循環(huán)相克博弈:混合戰(zhàn)略(無(wú)差異原則)(1)離散有限劃線(xiàn)法通過(guò)在每個(gè)博弈方對(duì)其他博弈方每個(gè)策略或策略組合的最佳對(duì)策對(duì)應(yīng)的得益下劃線(xiàn),分析博弈的方法稱(chēng)為“劃線(xiàn)法”。例:囚徒的困境博弈囚徒1坦白 不坦白(囚徒2)坦白-5,-50,-8不坦白-8, 0-1,-1可以看出,只有策略組合(

5、坦白,坦白)對(duì)應(yīng)的得益系數(shù)(-5,-5)下面都劃有短線(xiàn),意味著只有這個(gè)策略滿(mǎn)足雙方的策略相互使對(duì)對(duì)方策略的最佳對(duì)策。就是博弈的結(jié)果。劃線(xiàn)法一策略之間的相對(duì)優(yōu)劣為基礎(chǔ),在分析用得益矩陣表示的博弈問(wèn)題時(shí)十分有普遍適用性。但事實(shí)上,也有許多博弈根本不存在確定性的結(jié)果,無(wú)法用這種方法。(2)連續(xù)無(wú)限函數(shù)法(求導(dǎo),建立拉格朗日方程)反應(yīng)函數(shù)法:對(duì)一個(gè)一般的博弈,只要是得益是策略的多元連續(xù)函數(shù),我們都可以求每個(gè)博弈方針對(duì)其他博弈方策略的最佳反應(yīng)構(gòu)成的函數(shù),也就是反應(yīng)函數(shù),而解出的各個(gè)博弈方反應(yīng)函數(shù)的交點(diǎn)就是納什均衡。利用反應(yīng)函數(shù)求博弈的納什均衡的方法稱(chēng)為“反應(yīng)函數(shù)法”設(shè):ux=ux(x,y) uy=uy(

6、x,y)x,y,ux,uy連續(xù),ux,uy二階可微并且 0, 0,則求解反映函數(shù): =0 =0。其解即為nash均衡例:養(yǎng)羊博弈模型(p67)局限性:1)對(duì)于不連續(xù)的得益函數(shù)無(wú)法用先求導(dǎo)數(shù)找出各個(gè)博弈方的反應(yīng)函數(shù)的方法求納什均衡,所以無(wú)法發(fā)揮作用。 2)并不能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別是唯一的交點(diǎn)。(3)零和博弈1)有限離散策略最大最小值法:x給出一個(gè)策略ax,則y會(huì)給出一個(gè)行動(dòng)ay,使ux(ax,ay)=minux(ax,ay),而x要選擇一個(gè)ax*,使ux最大,ux(ax*,ay*)=max minux(ax,ay)=min maxux(ax*,ay*).y的一個(gè)策略ay,x卻會(huì)選

7、一個(gè)ax使ux最大,即ux(ax,ay)=maxux(ax,ay),則y會(huì)選一個(gè)ay*使ux(ax*,ay*)=minmaxux(ax,ay)2)無(wú)限連續(xù)策略反應(yīng)函數(shù)方程(同上反應(yīng)函數(shù)法)(4)循環(huán)相克博弈(混合戰(zhàn)略)無(wú)差異法 1)所謂循環(huán)相克博弈是指博弈者的任何一項(xiàng)戰(zhàn)略行為都受到對(duì)方某種戰(zhàn)略的完全克制,對(duì)手之間的各個(gè)戰(zhàn)略,形成相互克制的封閉環(huán)。如: “石頭、剪子、布”游戲 2)所謂混合戰(zhàn)略:設(shè): ,ax=ax1,ax2,axn,ay=ay1,ay2,aym設(shè)x在ax中隨機(jī)選擇戰(zhàn)略,且某種戰(zhàn)略被選擇概率是,=1,則=是x的混合戰(zhàn)略。同理,y的混合戰(zhàn)略 = 例:p7480 3)混合戰(zhàn)略nash均

8、衡的確定原則無(wú)差異原則即給定我的混合戰(zhàn)略,你的任何戰(zhàn)略都是無(wú)差異的。同時(shí),給定你的混合戰(zhàn)略,我的任何戰(zhàn)略也都是無(wú)差異的。在循環(huán)相克博弈中,均衡的狀態(tài)就是從彼此克制中擺脫,使彼此相克轉(zhuǎn)為彼此都不能相克彼此不被對(duì)方克制的狀態(tài)就是一種雙方同時(shí)實(shí)現(xiàn)最優(yōu)的狀態(tài)。因?yàn)?,任何一種純戰(zhàn)略都會(huì)陷入被對(duì)方克制的局面,只有采取一種混合戰(zhàn)略,才能擺脫相互克制的局面。同時(shí),這種混合戰(zhàn)略還必須使對(duì)方的戰(zhàn)略都無(wú)差異。3.如何甄別、區(qū)分多重均衡?(1)帕累托最優(yōu)型nash均衡 設(shè)x,y是兩個(gè)player,(ax1,ay1)和(ax2,ay2)是兩組nash均衡策略,(ux1,uy1)和(ux,uy)是x和y在兩種nash均衡

9、策略下的效用()如果滿(mǎn)足ux1ux,并且uy1uy,則稱(chēng),(ax1,ay1)是帕累托最優(yōu)的nash均衡。例:戰(zhàn)爭(zhēng)與和平博弈-5 , -58 , -10-10 , 810 , 10這里有兩組nash均衡:(戰(zhàn)爭(zhēng),戰(zhàn)爭(zhēng)),(和平,和平)。但ux和平ux戰(zhàn)爭(zhēng),并且uy和平uy戰(zhàn)爭(zhēng),因此,(ax和平,ay戰(zhàn)爭(zhēng))是比(ax和平,ay戰(zhàn)爭(zhēng))帕累托占優(yōu)的nash均衡。(2)風(fēng)險(xiǎn)穩(wěn)定(浮動(dòng))型nash均衡 設(shè)(ax1,ay1),(ax2,ay2)是兩組nash均衡, (ux1,uy1),(ux,uy)是x和y的nash均衡效用如果ax1出現(xiàn)一個(gè)微量浮動(dòng)ax1,則ay1就不再是y的最優(yōu)策略,uy(ax1+ax1

10、 ,ay1)uy(ax2+ax2,ay1)。則稱(chēng)(ax2,ay2)是風(fēng)險(xiǎn)穩(wěn)定型nash均衡。(3)聚點(diǎn)均衡 在多重nash均衡中,如果存在某種因素使其中的一種均衡成為更可能繁盛的聚焦點(diǎn),則這一nash均衡稱(chēng)為聚占均衡。(這種因素可能使文化、歷史、信息等)(4)相關(guān)均衡 多重博弈均衡的實(shí)現(xiàn)與博弈的解的某種事件相關(guān)。三、1. 什么是完全信息動(dòng)態(tài)博弈? 完全且完美信息動(dòng)態(tài)博弈簡(jiǎn)稱(chēng)動(dòng)態(tài)博弈,也稱(chēng)為多階段博弈、序列博弈或擴(kuò)展型博弈。特征是博弈方依次選擇行動(dòng),后選擇行為者是在看到先選擇行為者的選擇后在選擇,博弈方互相了解得益情況。對(duì)比靜態(tài)博弈:博弈選擇有先后順序,行為者可觀(guān)察到對(duì)手的策略選擇,博弈過(guò)程要你

11、來(lái)我往的多個(gè)回合 序貫動(dòng)態(tài)博弈:每一階段博弈的結(jié)構(gòu)(信息、策略、資源、稟賦)都不相同,博弈路徑具有依賴(lài)、繼承與擴(kuò)展性。2.什么是子博弈精煉納什均衡?為什么要找它?什么是子博弈?由博弈路徑上一個(gè)單結(jié)信息集開(kāi)始的,并且它的后續(xù)結(jié)不與其它信息集粘連的博弈過(guò)程。即動(dòng)態(tài)博弈中滿(mǎn)足一定要求的局部所構(gòu)成的次級(jí)博弈。 特點(diǎn):a.信息確定 b.信息不丟失,過(guò)去知道的現(xiàn)在亦知道。子博弈精練nash均衡如果在一個(gè)完美信息的動(dòng)態(tài)博弈中,個(gè)博弈方的策略構(gòu)成的一個(gè)策略組合滿(mǎn)足,在整個(gè)動(dòng)態(tài)博弈及它的作業(yè)子博弈中都構(gòu)成納什均衡,那么這個(gè)策略組合稱(chēng)為該動(dòng)態(tài)博弈的一個(gè)“子博弈完美納什均衡”:第一,s是原博弈的納什均衡。第二,s在

12、每一個(gè)子博弈上給出納什均衡。子博弈精練nash均衡的價(jià)值在于剔除掉那些不可信的、只在特定的博弈路徑(子博弈)上成立的均衡,因此是可信的、穩(wěn)定的,在所有博弈路徑上成立的均衡。3什么是逆向歸納法?從動(dòng)態(tài)博弈的最后一級(jí)子博弈開(kāi)始,逐步倒推回博弈方在各級(jí)子博弈中的最優(yōu)選擇,最終找出第一個(gè)階段的分析方法。理論基礎(chǔ):動(dòng)態(tài)博弈中先行為的理性的博弈方,在前面階段選擇行為時(shí)必然會(huì)先考慮后行為博弈方在后面階段中將會(huì)怎樣選擇行為,只有在博弈的最好一個(gè)階段選擇的,不在有后續(xù)階段牽制的博弈方,才能直接做出明確的選擇。四、1.什么是演化博弈?通常把研究有限理性博弈的理論稱(chēng)為“演化博弈論”,它是把博弈理論分析和動(dòng)態(tài)演化過(guò)程

13、分析結(jié)合起來(lái)的一種新理論,以大樣本行為群體(而不是小樣本的具體的行為個(gè)體)為博弈主體;以有限理性的學(xué)習(xí)、比較、模仿(而不是完全理性的精確算計(jì))為行為策略選擇機(jī)理;其均衡是群體演化的均衡穩(wěn)定狀態(tài)(而不是個(gè)體博弈的戰(zhàn)略納什均衡)。什么是演化博弈?(1)博弈主體大樣本行為群體、而不是小樣本的具體的行為個(gè)體;(2)行為策略選擇機(jī)理有限理性的學(xué)習(xí)、比較、模仿,而不是完全理性的精確算計(jì);(3)演化博弈均衡群體演化的均衡穩(wěn)定狀態(tài),而不是個(gè)體博弈的戰(zhàn)略納什均衡;(擷自網(wǎng)上,僅做參考:演化博弈論是把博弈理論分析和動(dòng)態(tài)演化過(guò)程分析結(jié)合起來(lái)的一種新理論,最初產(chǎn)生于行為生態(tài)學(xué)。它從有限理性的個(gè)體出發(fā),以群體為研究對(duì)象

14、,認(rèn)為現(xiàn)實(shí)中個(gè)體并不是行為最優(yōu)化者,個(gè)體的決策是通過(guò)個(gè)體之間模仿、學(xué)習(xí)和突變等動(dòng)態(tài)過(guò)程來(lái)實(shí)現(xiàn)的。演化博弈理論主要研究某一群體隨著時(shí)間變化的動(dòng)態(tài)過(guò)程,解釋為何群體將達(dá)到目前的這一狀態(tài)以及如何達(dá)到。)演化博弈的特點(diǎn):假定參與者理性是非常有限的,在行動(dòng)上被慣例的 惰性和簡(jiǎn)單模仿所驅(qū)使,但是無(wú)法保證均衡結(jié)果的 收斂。 適用范圍:側(cè)重于人類(lèi)以觀(guān)察為基礎(chǔ)的歸納能力,可以分析以 慣例、習(xí)俗體現(xiàn)的規(guī)則的自發(fā)演化。有限理性條件下的行為策略選擇機(jī)制(1)“姜是老的辣”遵循習(xí)慣與經(jīng)驗(yàn);“守成式選擇”。(2)“它山之石,可以攻玉”學(xué)習(xí)、比較、模仿、跟風(fēng);“模仿式選擇”。(3)“摸石頭過(guò)河”試錯(cuò)性創(chuàng)新法;“創(chuàng)新式選擇”

15、。2什么是演化方程?如何構(gòu)建演化方程? 生物演化方程:設(shè)x是某生命物種在整個(gè)生物世界的占有比例,u是該物種在生存環(huán)境中的適應(yīng)性,u是所有生物物種的平均適應(yīng)性。 則有:dx/dt=x(u- u)復(fù)制動(dòng)態(tài)方程,即演化方程。復(fù)制動(dòng)態(tài)方程實(shí)質(zhì)上是描述某一特定策略在一個(gè)種群中被采用的比例或頻率的動(dòng)態(tài)微分方程,假設(shè): x為一個(gè)種群中博弈方采用策略s的比例;us為該博弈方采用策略s的期望得益;u為該博弈方采用其策略空間中所有策略的平均得益; dx/dt為該博弈方采用策略的比例隨時(shí)間的變化率。上述動(dòng)態(tài)微分方程與生物演化中描述的特性個(gè)體頻數(shù)變化其自然選擇過(guò)程的“復(fù)制動(dòng)態(tài)”過(guò)程相一致,因此稱(chēng)為“復(fù)制動(dòng)態(tài)方程”。 采用s 不采用s a a b c c b d d 采用s 不采用s 采用策略s的得益為:us=xa+(1-x)b不采用策略s的得益為:ut=xc+(1-x)d策略空間中所有策略的平均得益為:u=xus +(1-x)ut演化方程為:dx/dt=x(us-u)=x(1-x)x(a-c)+(1-x)(b-d)3.如何求解ess?對(duì)于dx/dt=x(us-u)=x(1-x)x(a-c)+(1-x)(b-d)若us-u0,即dx/dt0,則演化趨勢(shì)為擴(kuò)張;若us-u0,即dx/dt0,則演化趨勢(shì)為萎縮。若us-u=0,即dx/dt

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論