經(jīng)濟(jì)博弈論考試復(fù)習(xí)

上傳人：活*** IP屬地：寧夏上傳時(shí)間：2021-10-07 格式：DOC 頁數(shù)：7 大?。?48KB 積分：8.4 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、經(jīng)濟(jì)博弈論考試復(fù)習(xí)一、1.什么是博弈論？“博弈論”譯自英文“game theory”，直譯就是“游戲理論”。是系統(tǒng)研究各種博弈問題，尋求在各博弈方具有充分或者有限理性、能力的條件下，合理的策略選擇和合理選擇策略時(shí)博弈的結(jié)果，并分析這些結(jié)果的經(jīng)濟(jì)意義、效率意義的理論和方法。博弈：一些個(gè)人、組織，面對一定的環(huán)境條件，在一定的規(guī)律下，同時(shí)或先后，一次或多次，從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施，各自取得相應(yīng)結(jié)果的過程。包括：博弈的參加者，各博弈方的全部策略或行為集合，進(jìn)行博弈的次序，博弈方的得益四方面。2.什么是納什均衡？在博弈g=,；，, 中，如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略

2、組合（*，, *）中，任一博弈方i的策略*，都是對其余博弈方策略組合（*，,*, *,*， *）的最佳對策，也即（*，,*, *,*， *）（*，,*, *,*， *）對任意都成立，則稱（*，, *）為g的一個(gè)“納什均衡”。（假設(shè)有n個(gè)局中人參與博弈，給定其他人策略的條件下，每個(gè)局中人選擇自己的最優(yōu)策略，從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合就是納什均衡。這種策略組合由所有參與人最優(yōu)策略組成，即在給定別人策略的情況下，沒有人有足夠理由打破這種均衡。）3.什么是囚徒困境？囚徒困境的基本模型是這樣的：警察抓住了兩個(gè)合伙犯罪的罪犯。為了得到所需的口供，警察將這兩名罪犯分別關(guān)押以防止他們

3、竄供或結(jié)成攻守同盟：如果他們兩人都拒不認(rèn)罪，則他們會被以較輕的妨礙公務(wù)罪各判一年徒刑；如果兩人中有一人坦白認(rèn)罪，則坦白這從輕處理，立即釋放，而另一人則將重判八年徒刑；如果兩人同時(shí)坦白認(rèn)罪，他們將各被判五年監(jiān)禁。囚徒1坦白不坦白（囚徒2）坦白-5，-50，-8不坦白-8, 0-1，-1雙方的利益不僅取決于他們自己的策略選擇也取決于對方的策略選擇。由于這兩個(gè)囚徒不能串通，個(gè)人都追求自己的最大利益而不會顧及同伙的利益，又不敢相信對方，以此只能實(shí)現(xiàn)他們都不理想的結(jié)果。該博弈揭示了個(gè)體理性與團(tuán)體立項(xiàng)之間的矛盾從個(gè)體理性出發(fā)的行為往往不能實(shí)現(xiàn)團(tuán)體的最大利益，最終也不能真正實(shí)現(xiàn)個(gè)體的最大利益，甚至?xí)玫较?/p>

4、當(dāng)差的結(jié)果。二、1什么是完全信息靜態(tài)博弈？完全信息靜態(tài)博弈是指各博弈方同時(shí)決策，且所有的博弈方對各方得益都了解的博弈。完全信息是指信息的充分性、對稱性和透明性，靜態(tài)是指同時(shí)決策，沒有時(shí)間的差別。2如何求解納什均衡？求解納什均衡的4種方法：離散、有限策略博弈：劃線法連續(xù)、無限策略博弈：反映函數(shù)法零和博弈：最大最小法循環(huán)相克博弈：混合戰(zhàn)略（無差異原則）（1）離散有限劃線法通過在每個(gè)博弈方對其他博弈方每個(gè)策略或策略組合的最佳對策對應(yīng)的得益下劃線，分析博弈的方法稱為“劃線法”。例：囚徒的困境博弈囚徒1坦白不坦白（囚徒2）坦白-5，-50，-8不坦白-8, 0-1，-1可以看出，只有策略組合（

5、坦白，坦白）對應(yīng)的得益系數(shù)（-5，-5）下面都劃有短線，意味著只有這個(gè)策略滿足雙方的策略相互使對對方策略的最佳對策。就是博弈的結(jié)果。劃線法一策略之間的相對優(yōu)劣為基礎(chǔ)，在分析用得益矩陣表示的博弈問題時(shí)十分有普遍適用性。但事實(shí)上，也有許多博弈根本不存在確定性的結(jié)果，無法用這種方法。（2）連續(xù)無限函數(shù)法（求導(dǎo)，建立拉格朗日方程）反應(yīng)函數(shù)法：對一個(gè)一般的博弈，只要是得益是策略的多元連續(xù)函數(shù)，我們都可以求每個(gè)博弈方針對其他博弈方策略的最佳反應(yīng)構(gòu)成的函數(shù)，也就是反應(yīng)函數(shù)，而解出的各個(gè)博弈方反應(yīng)函數(shù)的交點(diǎn)就是納什均衡。利用反應(yīng)函數(shù)求博弈的納什均衡的方法稱為“反應(yīng)函數(shù)法”設(shè):ux=ux(x,y) uy=uy(

6、x,y)x,y,ux,uy連續(xù)，ux,uy二階可微并且 0, 0,則求解反映函數(shù): =0 =0。其解即為nash均衡例：養(yǎng)羊博弈模型（p67）局限性：1）對于不連續(xù)的得益函數(shù)無法用先求導(dǎo)數(shù)找出各個(gè)博弈方的反應(yīng)函數(shù)的方法求納什均衡，所以無法發(fā)揮作用。 2）并不能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn)，特別是唯一的交點(diǎn)。（3）零和博弈1）有限離散策略最大最小值法:x給出一個(gè)策略ax，則y會給出一個(gè)行動ay，使ux(ax,ay)=minux(ax,ay),而x要選擇一個(gè)ax*,使ux最大,ux(ax*,ay*)=max minux(ax,ay)=min maxux(ax*,ay*).y的一個(gè)策略ay，x卻會選

7、一個(gè)ax使ux最大，即ux(ax,ay)=maxux(ax,ay),則y會選一個(gè)ay*使ux(ax*,ay*)=minmaxux(ax,ay)2）無限連續(xù)策略反應(yīng)函數(shù)方程（同上反應(yīng)函數(shù)法）（4）循環(huán)相克博弈（混合戰(zhàn)略）無差異法 1)所謂循環(huán)相克博弈是指博弈者的任何一項(xiàng)戰(zhàn)略行為都受到對方某種戰(zhàn)略的完全克制,對手之間的各個(gè)戰(zhàn)略,形成相互克制的封閉環(huán)。如： “石頭、剪子、布”游戲 2)所謂混合戰(zhàn)略：設(shè): ,ax=ax1,ax2,axn,ay=ay1,ay2,aym設(shè)x在ax中隨機(jī)選擇戰(zhàn)略，且某種戰(zhàn)略被選擇概率是，=1,則=是x的混合戰(zhàn)略。同理，y的混合戰(zhàn)略 = 例：p7480 3)混合戰(zhàn)略nash均

8、衡的確定原則無差異原則即給定我的混合戰(zhàn)略，你的任何戰(zhàn)略都是無差異的。同時(shí)，給定你的混合戰(zhàn)略，我的任何戰(zhàn)略也都是無差異的。在循環(huán)相克博弈中，均衡的狀態(tài)就是從彼此克制中擺脫，使彼此相克轉(zhuǎn)為彼此都不能相克彼此不被對方克制的狀態(tài)就是一種雙方同時(shí)實(shí)現(xiàn)最優(yōu)的狀態(tài)。因?yàn)?，任何一種純戰(zhàn)略都會陷入被對方克制的局面，只有采取一種混合戰(zhàn)略，才能擺脫相互克制的局面。同時(shí)，這種混合戰(zhàn)略還必須使對方的戰(zhàn)略都無差異。3.如何甄別、區(qū)分多重均衡？（1）帕累托最優(yōu)型nash均衡設(shè)x,y是兩個(gè)player,(ax1,ay1)和(ax2,ay2)是兩組nash均衡策略，(ux1,uy1)和(ux,uy)是x和y在兩種nash均衡

9、策略下的效用（）如果滿足ux1ux，并且uy1uy，則稱,(ax1,ay1)是帕累托最優(yōu)的nash均衡。例：戰(zhàn)爭與和平博弈-5 , -58 , -10-10 , 810 , 10這里有兩組nash均衡：（戰(zhàn)爭，戰(zhàn)爭），（和平，和平）。但ux和平ux戰(zhàn)爭，并且uy和平uy戰(zhàn)爭，因此,(ax和平,ay戰(zhàn)爭)是比(ax和平,ay戰(zhàn)爭)帕累托占優(yōu)的nash均衡。（2）風(fēng)險(xiǎn)穩(wěn)定(浮動)型nash均衡設(shè)(ax1,ay1),(ax2,ay2)是兩組nash均衡, (ux1,uy1),(ux,uy)是x和y的nash均衡效用如果ax1出現(xiàn)一個(gè)微量浮動ax1,則ay1就不再是y的最優(yōu)策略,uy(ax1+ax1

10、 ,ay1)uy(ax2+ax2,ay1)。則稱(ax2,ay2)是風(fēng)險(xiǎn)穩(wěn)定型nash均衡。（3）聚點(diǎn)均衡在多重nash均衡中，如果存在某種因素使其中的一種均衡成為更可能繁盛的聚焦點(diǎn)，則這一nash均衡稱為聚占均衡。（這種因素可能使文化、歷史、信息等）（4）相關(guān)均衡多重博弈均衡的實(shí)現(xiàn)與博弈的解的某種事件相關(guān)。三、1. 什么是完全信息動態(tài)博弈？完全且完美信息動態(tài)博弈簡稱動態(tài)博弈，也稱為多階段博弈、序列博弈或擴(kuò)展型博弈。特征是博弈方依次選擇行動，后選擇行為者是在看到先選擇行為者的選擇后在選擇，博弈方互相了解得益情況。對比靜態(tài)博弈：博弈選擇有先后順序，行為者可觀察到對手的策略選擇，博弈過程要你

11、來我往的多個(gè)回合序貫動態(tài)博弈：每一階段博弈的結(jié)構(gòu)（信息、策略、資源、稟賦）都不相同，博弈路徑具有依賴、繼承與擴(kuò)展性。2.什么是子博弈精煉納什均衡？為什么要找它？什么是子博弈？由博弈路徑上一個(gè)單結(jié)信息集開始的，并且它的后續(xù)結(jié)不與其它信息集粘連的博弈過程。即動態(tài)博弈中滿足一定要求的局部所構(gòu)成的次級博弈。特點(diǎn)：a.信息確定 b.信息不丟失，過去知道的現(xiàn)在亦知道。子博弈精練nash均衡如果在一個(gè)完美信息的動態(tài)博弈中，個(gè)博弈方的策略構(gòu)成的一個(gè)策略組合滿足，在整個(gè)動態(tài)博弈及它的作業(yè)子博弈中都構(gòu)成納什均衡，那么這個(gè)策略組合稱為該動態(tài)博弈的一個(gè)“子博弈完美納什均衡”：第一，s是原博弈的納什均衡。第二，s在

12、每一個(gè)子博弈上給出納什均衡。子博弈精練nash均衡的價(jià)值在于剔除掉那些不可信的、只在特定的博弈路徑（子博弈）上成立的均衡，因此是可信的、穩(wěn)定的，在所有博弈路徑上成立的均衡。3什么是逆向歸納法？從動態(tài)博弈的最后一級子博弈開始，逐步倒推回博弈方在各級子博弈中的最優(yōu)選擇，最終找出第一個(gè)階段的分析方法。理論基礎(chǔ)：動態(tài)博弈中先行為的理性的博弈方，在前面階段選擇行為時(shí)必然會先考慮后行為博弈方在后面階段中將會怎樣選擇行為，只有在博弈的最好一個(gè)階段選擇的，不在有后續(xù)階段牽制的博弈方，才能直接做出明確的選擇。四、1.什么是演化博弈？通常把研究有限理性博弈的理論稱為“演化博弈論”，它是把博弈理論分析和動態(tài)演化過程

13、分析結(jié)合起來的一種新理論，以大樣本行為群體（而不是小樣本的具體的行為個(gè)體）為博弈主體；以有限理性的學(xué)習(xí)、比較、模仿（而不是完全理性的精確算計(jì)）為行為策略選擇機(jī)理；其均衡是群體演化的均衡穩(wěn)定狀態(tài)（而不是個(gè)體博弈的戰(zhàn)略納什均衡）。什么是演化博弈？（1）博弈主體大樣本行為群體、而不是小樣本的具體的行為個(gè)體；（2）行為策略選擇機(jī)理有限理性的學(xué)習(xí)、比較、模仿，而不是完全理性的精確算計(jì)；（3）演化博弈均衡群體演化的均衡穩(wěn)定狀態(tài)，而不是個(gè)體博弈的戰(zhàn)略納什均衡；（擷自網(wǎng)上，僅做參考：演化博弈論是把博弈理論分析和動態(tài)演化過程分析結(jié)合起來的一種新理論,最初產(chǎn)生于行為生態(tài)學(xué)。它從有限理性的個(gè)體出發(fā),以群體為研究對象

14、,認(rèn)為現(xiàn)實(shí)中個(gè)體并不是行為最優(yōu)化者,個(gè)體的決策是通過個(gè)體之間模仿、學(xué)習(xí)和突變等動態(tài)過程來實(shí)現(xiàn)的。演化博弈理論主要研究某一群體隨著時(shí)間變化的動態(tài)過程,解釋為何群體將達(dá)到目前的這一狀態(tài)以及如何達(dá)到。）演化博弈的特點(diǎn)：假定參與者理性是非常有限的，在行動上被慣例的惰性和簡單模仿所驅(qū)使，但是無法保證均衡結(jié)果的收斂。適用范圍：側(cè)重于人類以觀察為基礎(chǔ)的歸納能力，可以分析以慣例、習(xí)俗體現(xiàn)的規(guī)則的自發(fā)演化。有限理性條件下的行為策略選擇機(jī)制（1）“姜是老的辣”遵循習(xí)慣與經(jīng)驗(yàn)；“守成式選擇”。（2）“它山之石，可以攻玉”學(xué)習(xí)、比較、模仿、跟風(fēng)；“模仿式選擇”。（3）“摸石頭過河”試錯(cuò)性創(chuàng)新法；“創(chuàng)新式選擇”

15、。2什么是演化方程？如何構(gòu)建演化方程？生物演化方程：設(shè)x是某生命物種在整個(gè)生物世界的占有比例，u是該物種在生存環(huán)境中的適應(yīng)性，u是所有生物物種的平均適應(yīng)性。則有：dx/dt=x（u- u）復(fù)制動態(tài)方程，即演化方程。復(fù)制動態(tài)方程實(shí)質(zhì)上是描述某一特定策略在一個(gè)種群中被采用的比例或頻率的動態(tài)微分方程，假設(shè): x為一個(gè)種群中博弈方采用策略s的比例；us為該博弈方采用策略s的期望得益；u為該博弈方采用其策略空間中所有策略的平均得益; dx/dt為該博弈方采用策略的比例隨時(shí)間的變化率。上述動態(tài)微分方程與生物演化中描述的特性個(gè)體頻數(shù)變化其自然選擇過程的“復(fù)制動態(tài)”過程相一致,因此稱為“復(fù)制動態(tài)方程”。采用s 不采用s a a b c c b d d 采用s 不采用s 采用策略s的得益為：us=xa+（1-x）b不采用策略s的得益為：ut=xc+（1-x）d策略空間中所有策略的平均得益為：u=xus +（1-x）ut演化方程為：dx/dt=x(us-u)=x（1-x）x（a-c）+（1-x）（b-d）3.如何求解ess？對于dx/dt=x(us-u)=x（1-x）x（a-c）+（1-x）（b-d）若us-u0，即dx/dt0，則演化趨勢為擴(kuò)張；若us-u0，即dx/dt0，則演化趨勢為萎縮。若us-u=0，即dx/dt

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

經(jīng)濟(jì)博弈論考試復(fù)習(xí)

文檔簡介

溫馨提示

最新文檔

評論

經(jīng)濟(jì)博弈論考試復(fù)習(xí)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔