北大課件:《博弈論與公共政策》之完全信息靜態(tài)博弈_第1頁(yè)
北大課件:《博弈論與公共政策》之完全信息靜態(tài)博弈_第2頁(yè)
北大課件:《博弈論與公共政策》之完全信息靜態(tài)博弈_第3頁(yè)
北大課件:《博弈論與公共政策》之完全信息靜態(tài)博弈_第4頁(yè)
北大課件:《博弈論與公共政策》之完全信息靜態(tài)博弈_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《博弈論與公共政策》之完全信息靜態(tài)博弈本課程介紹博弈論的基本概念,并探討其在公共政策制定中的應(yīng)用。什么是靜態(tài)博弈?參與者同時(shí)做出決策,決策是同時(shí)進(jìn)行的,不能觀察到其他參與者的行動(dòng)。參與者在做出決策時(shí),不知道其他參與者的行動(dòng)是什么,也無(wú)法預(yù)測(cè)。每個(gè)參與者的收益取決于所有參與者的行動(dòng),且每個(gè)參與者只能選擇一個(gè)行動(dòng)。靜態(tài)博弈的特點(diǎn)同時(shí)決策參與者同時(shí)做出決策,無(wú)需等待其他參與者行動(dòng)。信息完全所有參與者對(duì)博弈規(guī)則、參與者數(shù)量和收益函數(shù)都了如指掌。一次性決策參與者只能做出一次決策,不能根據(jù)其他參與者的行動(dòng)進(jìn)行調(diào)整。完全信息靜態(tài)博弈的定義參與者完全了解博弈所有參與者都知道其他參與者的策略集和效用函數(shù)。參與者同時(shí)行動(dòng)參與者在不知道其他參與者選擇的情況下同時(shí)做出決策。完全信息靜態(tài)博弈的構(gòu)成要素1博弈者參與博弈的個(gè)體或群體,他們擁有自己的目標(biāo)和偏好。2策略集每個(gè)博弈者可以選擇的所有行動(dòng)方案的集合,代表他們的行動(dòng)空間。3效用函數(shù)反映每個(gè)博弈者對(duì)所有可能結(jié)果的偏好,用數(shù)值表示他們對(duì)不同結(jié)果的滿意程度。博弈者的策略集策略集定義策略集指的是每個(gè)博弈者在博弈過(guò)程中可供選擇的行動(dòng)方案的集合。策略集示例例如,在一個(gè)簡(jiǎn)單的“石頭剪刀布”游戲中,每個(gè)博弈者的策略集為{石頭,剪刀,布}。策略集的重要性明確定義每個(gè)博弈者的策略集是分析博弈的關(guān)鍵步驟,它為后續(xù)分析提供了基礎(chǔ)。博弈者的效用函數(shù)效用函數(shù)效用函數(shù)是描述博弈者對(duì)各種結(jié)果偏好的數(shù)學(xué)函數(shù),可以反映每個(gè)博弈者在不同情況下獲得的收益或損失。效用函數(shù)的定義效用函數(shù)將博弈者的偏好映射到一個(gè)實(shí)數(shù),數(shù)字越大代表效用越高。例如,一個(gè)博弈者在獲得10元時(shí)獲得的效用可能高于獲得5元時(shí)的效用。靜態(tài)博弈的解概念納什均衡在靜態(tài)博弈中,納什均衡是一個(gè)穩(wěn)定狀態(tài),其中每個(gè)博弈者都選擇了最優(yōu)策略,考慮到其他博弈者的策略。帕累托最優(yōu)帕累托最優(yōu)是指一個(gè)狀態(tài),在這個(gè)狀態(tài)下,無(wú)法通過(guò)改變?nèi)魏我粋€(gè)博弈者的策略,使至少一個(gè)博弈者變得更好,而其他博弈者不變得更差。納什均衡的概念穩(wěn)定策略納什均衡是一種博弈策略組合,其中每個(gè)玩家都選擇最佳策略,假設(shè)其他玩家也選擇最佳策略。沒(méi)有激勵(lì)改變?cè)诩{什均衡狀態(tài)下,任何玩家都不會(huì)通過(guò)單方面改變策略來(lái)獲得更高的收益。多種均衡一個(gè)博弈可能存在多個(gè)納什均衡,需要進(jìn)一步分析以確定最佳策略。尋找納什均衡的步驟確定博弈者確定博弈中參與決策的各個(gè)主體。確定策略集列出每個(gè)博弈者可選擇的行動(dòng)方案。確定效用函數(shù)定義每個(gè)博弈者對(duì)不同行動(dòng)結(jié)果的偏好。尋找納什均衡找到一個(gè)策略組合,使得每個(gè)博弈者在給定其他博弈者策略的情況下,都無(wú)法通過(guò)單方面改變策略而獲得更高的效用。利用優(yōu)勢(shì)策略尋找納什均衡1優(yōu)勢(shì)策略無(wú)論對(duì)手采取什么策略,都能獲得最佳結(jié)果的策略。2納什均衡當(dāng)所有博弈者都選擇自己的優(yōu)勢(shì)策略時(shí),所達(dá)成的均衡狀態(tài)。3尋找納什均衡通過(guò)分析每個(gè)博弈者的優(yōu)勢(shì)策略,找到所有博弈者的優(yōu)勢(shì)策略組合。迭代優(yōu)勢(shì)刪除法尋找納什均衡1刪除劣勢(shì)策略無(wú)論其他博弈者選擇什么策略,該策略都不會(huì)帶來(lái)最好的結(jié)果。2重復(fù)刪除不斷重復(fù)刪除劣勢(shì)策略,直至只剩下唯一一種策略組合。3納什均衡剩余的策略組合即為納什均衡,因?yàn)槿魏我环蕉紱](méi)有動(dòng)機(jī)改變。囚徒困境模型囚徒困境模型是博弈論中最經(jīng)典的模型之一,它描述了兩個(gè)理性個(gè)體在缺乏溝通的情況下,即使合作對(duì)雙方都有利,但由于缺乏信任,最終都會(huì)選擇背叛對(duì)方,從而導(dǎo)致雙方都陷入更糟糕的境地。囚徒困境的解決之道重復(fù)博弈通過(guò)重復(fù)博弈,博弈雙方可以建立信任和合作關(guān)系,從而打破囚徒困境。契約約束制定有效的契約可以約束博弈雙方,使他們選擇合作而非背叛。溝通協(xié)商通過(guò)溝通協(xié)商,博弈雙方可以達(dá)成合作共識(shí),避免陷入囚徒困境。鷹與鴿博弈模型鷹與鴿博弈模型是博弈論中一個(gè)經(jīng)典模型,用于解釋動(dòng)物或人類在競(jìng)爭(zhēng)資源時(shí)的行為策略。該模型假設(shè)兩個(gè)個(gè)體(或群體)爭(zhēng)奪有限資源,每個(gè)個(gè)體可以選擇兩種策略:鷹(攻擊)或鴿(退讓)。模型分析了不同策略組合下的結(jié)果,并解釋了在競(jìng)爭(zhēng)中,鷹與鴿的策略選擇和結(jié)果的影響因素。鷹與鴿博弈的應(yīng)用分析國(guó)際關(guān)系鷹與鴿博弈可以解釋國(guó)家之間的競(jìng)爭(zhēng)與合作,例如冷戰(zhàn)期間美蘇之間的對(duì)抗。商業(yè)談判在商業(yè)談判中,企業(yè)可以通過(guò)鷹與鴿博弈策略來(lái)權(quán)衡利益和風(fēng)險(xiǎn),以達(dá)成最佳的合作協(xié)議。政治選舉鷹與鴿博弈模型可以幫助理解政治候選人之間的策略選擇,例如競(jìng)選策略的制定。休倫比薩博弈模型休倫比薩博弈模型是一個(gè)經(jīng)典的博弈模型,用來(lái)模擬兩個(gè)玩家爭(zhēng)奪有限資源的場(chǎng)景。模型中,兩個(gè)玩家可以選擇合作,共同分享比薩,或者競(jìng)爭(zhēng),獨(dú)自享用比薩。如果玩家選擇合作,他們都能獲得中等收益;如果選擇競(jìng)爭(zhēng),勝者獲得高收益,敗者則顆粒無(wú)收。休倫比薩博弈模型揭示了合作和競(jìng)爭(zhēng)之間微妙的博弈關(guān)系。在實(shí)際生活中,類似的博弈場(chǎng)景隨處可見(jiàn),例如企業(yè)之間的市場(chǎng)競(jìng)爭(zhēng)、國(guó)家之間的資源爭(zhēng)奪等等。休倫比薩博弈的現(xiàn)實(shí)案例公司并購(gòu)兩家公司為了爭(zhēng)奪市場(chǎng)份額,可能進(jìn)行激烈的價(jià)格戰(zhàn),最終導(dǎo)致兩敗俱傷,而合作則可以帶來(lái)更高的利潤(rùn)。國(guó)際貿(mào)易國(guó)家之間為了保護(hù)本國(guó)產(chǎn)業(yè),可能采取貿(mào)易保護(hù)主義措施,但最終可能導(dǎo)致貿(mào)易壁壘增多,損害全球經(jīng)濟(jì)發(fā)展。環(huán)境保護(hù)各國(guó)為了減少污染,需要共同合作,但如果每個(gè)國(guó)家都只顧自身利益,最終會(huì)導(dǎo)致環(huán)境污染加劇。最后通牒博弈模型最后通牒博弈模型是一個(gè)經(jīng)典的博弈論模型,它描述了在分配有限資源時(shí),一方擁有絕對(duì)的權(quán)力決定分配方案,而另一方只有接受或拒絕的選擇。在這個(gè)模型中,提出者可以提出一份分配方案,接受者可以選擇接受或拒絕。如果接受者拒絕,則雙方都得不到任何東西。這個(gè)模型突出了談判中的力量動(dòng)態(tài)和利益分配問(wèn)題。最后通牒博弈的政策啟示公平與效率最后通牒博弈強(qiáng)調(diào)了公平分配的重要性,但同時(shí)也提醒我們,過(guò)度追求公平可能會(huì)導(dǎo)致效率低下。博弈策略在政策制定中,要考慮不同利益群體之間的博弈關(guān)系,制定合理的策略以達(dá)成最佳的社會(huì)結(jié)果。重復(fù)博弈的理論分析策略迭代重復(fù)博弈中,博弈者可以根據(jù)之前的博弈結(jié)果調(diào)整策略,從而實(shí)現(xiàn)更優(yōu)的收益。合作可能重復(fù)博弈可以促進(jìn)博弈者之間的合作,因?yàn)椴┺恼呖梢酝ㄟ^(guò)懲罰背叛行為來(lái)維持合作關(guān)系。聲譽(yù)效應(yīng)重復(fù)博弈中的聲譽(yù)效應(yīng)可以激勵(lì)博弈者保持良好的行為,以獲得未來(lái)合作的機(jī)會(huì)。重復(fù)博弈的政策應(yīng)用長(zhǎng)期合作重復(fù)博弈促使博弈雙方更注重長(zhǎng)期利益,從而建立合作關(guān)系。政策制定重復(fù)博弈可以幫助政府制定更有效的政策,例如環(huán)境保護(hù),減排等。經(jīng)濟(jì)發(fā)展重復(fù)博弈能夠促進(jìn)企業(yè)間的合作,從而推動(dòng)經(jīng)濟(jì)發(fā)展。不完全信息靜態(tài)博弈信息不對(duì)稱參與者對(duì)其他參與者的策略、收益信息存在不完全了解。不確定性博弈結(jié)果存在不確定性,取決于參與者對(duì)信息的理解和行動(dòng)選擇。策略調(diào)整參與者需要根據(jù)有限的信息和對(duì)對(duì)方行為的預(yù)期做出最佳策略調(diào)整。不完全信息靜態(tài)博弈的構(gòu)成要素玩家參與博弈的個(gè)人或群體。策略集每個(gè)玩家可選擇的行動(dòng)方案。信息集玩家在進(jìn)行決策時(shí)所擁有的信息。效用函數(shù)每個(gè)玩家對(duì)不同結(jié)果的偏好。貝葉斯均衡的概念信息不對(duì)稱貝葉斯均衡主要應(yīng)用于信息不對(duì)稱的博弈中,即玩家對(duì)其他玩家的信息或策略存在不確定性。理性預(yù)期玩家基于自身信息和對(duì)其他玩家行為的理性預(yù)期,選擇最優(yōu)策略,最終達(dá)到均衡狀態(tài)。后驗(yàn)概率貝葉斯均衡的計(jì)算依賴于貝葉斯定理,通過(guò)觀察到的信息更新對(duì)其他玩家策略的概率估計(jì)。尋找貝葉斯均衡的步驟1確定玩家的策略集確定每個(gè)玩家在所有可能情況下可采取的行動(dòng)。2確定玩家的類型和先驗(yàn)概率識(shí)別每個(gè)玩家的可能類型和每個(gè)類型發(fā)生的概率。3定義玩家的效用函數(shù)確定每個(gè)玩家在不同情況下獲得的效用值。4計(jì)算貝葉斯均衡利用貝葉斯定理,計(jì)算每個(gè)玩家在每個(gè)類型下采取最佳策略的概率。不確定性博弈與公共政策信息不對(duì)稱公共政策決策者經(jīng)常面臨信息不對(duì)稱的情況,難以準(zhǔn)確了解公民的需求和利益。風(fēng)險(xiǎn)評(píng)估公共政策實(shí)施結(jié)果的不確定性要求決策者進(jìn)行風(fēng)險(xiǎn)評(píng)估,權(quán)衡各種方案的利弊。利益博弈不同利益群體在公共政策制定過(guò)程中進(jìn)行博弈,影響決策結(jié)果的走向。博弈論在公共政策中的未來(lái)發(fā)展數(shù)據(jù)分析將博弈論模型與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論