版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二講(1)完全信息靜態(tài)博弈
所謂完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了解的博弈問題納什均衡無限策略博弈的解和反應(yīng)函數(shù)混合策略納什均衡的存在性2.1納什均衡博弈的解和納什均衡嚴(yán)格下策反復(fù)消去法與納什均衡2.1.1博弈的解和納什均衡定義在博弈中,如果策略組合中任一博弈方i的策略都是對其余博弈方的策略組合的最佳對策,也即對任意都成立,則稱為G的一個納什均衡。2.1.1博弈的解和納什均衡劃線法
囚徒2
不坦白坦白囚不坦白徒
1坦白箭頭法囚徒2
不坦白坦白囚不坦白徒
1坦白
-1,-1
-8,0
0,-8
-5,-5-1,-1
-8,00,-8
-5,-52.1.2嚴(yán)格下策反復(fù)消去法與納什均衡嚴(yán)格下策:對于某一策略,若則稱為的嚴(yán)格下策。命題2.1在n個博弈方的博弈中,如果嚴(yán)格下策反復(fù)消去法排除了以外的所有策略組合,則一定是G的唯一的納什均衡。命題2.2在n個博弈方的博弈中,如果是G的一個納什均衡,則嚴(yán)格下策反復(fù)消去法一定不會將它消去。2.1納什均衡納什均衡點(diǎn)是一種局部均衡點(diǎn),可以有很多個,也可以不存在。來源于策略組合的策略可能有n!個(離散),也可能無窮多個(連續(xù)),那么求解將會十分煩瑣。得益對于任一策略(s1,…,sn),其總得益為各博弈方得益之和那么對于具有多個納什均衡點(diǎn)的博弈,則對應(yīng)的應(yīng)有最優(yōu)納什均衡的概念,而對應(yīng)于最優(yōu)納什均衡的點(diǎn)為全局最優(yōu)點(diǎn)。此處最優(yōu)的含義為穩(wěn)定性而不是得益之和最大。如何均衡穩(wěn)定與收益?2.2無限策略的解和反應(yīng)函數(shù)古諾的寡頭模型反應(yīng)函數(shù)伯特蘭德的寡頭模型公共資源問題2.2.1古諾的寡頭模型
博弈方1利潤:博弈方2利潤:在本博弈中,的納什均衡的充分必要條件是和的最大值問題:社會收益最大化:假設(shè)總產(chǎn)量為Q,總收益為U=QP(Q)-CQ
=Q(8-Q)-2Q=6Q-Q2
其最大值為Q*=3,U=9
該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。2023/2/594.5,4.55,3.753.75,54,4不突破突破廠商2不突破突破廠商1以自身最大利益為目標(biāo):各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈2.2.2反應(yīng)函數(shù)
反應(yīng)函數(shù)-每個博弈方針對其他博弈方所有策略的最佳反應(yīng)構(gòu)成的函數(shù)。而各個博弈方反應(yīng)函數(shù)的交點(diǎn)(如果有的話)就是納什均衡。2.2.2反應(yīng)函數(shù)-古諾模型在古諾模型中廠商1和廠商2的反應(yīng)函數(shù)分別為q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)
從左圖可以看出,當(dāng)一方的選擇為0時,另一方的最佳反應(yīng)為3,這正是我們前面所說過的實(shí)現(xiàn)總體最大利益的產(chǎn)量,因?yàn)橐患耶a(chǎn)量為零,意味著另一家壟斷市場。當(dāng)一方的產(chǎn)量達(dá)到6時,另一方則被迫選擇0,因?yàn)閷?shí)際上堅持生產(chǎn)已無利可圖。2.2.3伯特蘭德的寡頭模型在該模型中廠商選擇價格而不是產(chǎn)量廠商1的價格與需求函數(shù):P1,廠商2的價格與需求函數(shù):
P2,其中,d1,d2>0為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無固定成本,邊際成本分別為c1和c2。收益:納什均衡:2023/2/513公共地悲劇英國人哈定:十八世紀(jì)以前,蘇格蘭地區(qū)大量草地,由于屬公共資源導(dǎo)致過度放牧,致使草地消失,生態(tài)破壞2.2.4公共資源問題2023/2/514公共產(chǎn)品的供給
如果大家都出錢興辦公用事業(yè),所有人的福利都會增加。問題是,如果我出錢你不出錢,我得不償失,而如果你出錢我不出錢,我就可以占你的便宜。所以每個人的最優(yōu)選擇都是“不出錢”,結(jié)果使所有人的福利都得不到提高。軍備競賽
兩國都不搞軍備競賽,都把資源用于民用,兩國福利都變好。但由于都怕受威脅而大搞軍備競賽,結(jié)果兩國福利都變得更糟。經(jīng)濟(jì)改革經(jīng)濟(jì)改革要付出成本(包括風(fēng)險),而改革的成果大家享受,結(jié)果是,盡管人人都認(rèn)為改革好,卻很難有人真正去改革,大家只好在都不滿意的體制下繼續(xù)生活下去。2.2.4公共資源問題2.2.4公共資源問題公共資源(1)沒有哪個個人、企業(yè)或其他經(jīng)濟(jì)組織擁有;(2)大家都可以自由利用這兩個特征的自然資源或人類生產(chǎn)的供大眾免費(fèi)使用的設(shè)施或財貨。例設(shè)某村莊有n個農(nóng)戶,一公共草地,可養(yǎng)羊數(shù)為qi(i=1,…,n)為n個農(nóng)戶各自的策略空間,當(dāng)各戶養(yǎng)羊數(shù)為q1,…,qn時,總數(shù)為Q=q1+…+qn,每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)V=V(Q)=V(q1+…+qn),假設(shè)每只羊的成本為c,則農(nóng)戶i養(yǎng)qi只羊的得益為:ui=qiV(Q)-qic2.2.4公共資源問題-實(shí)例
設(shè)n=3,V=100-Q=100-(q1+q2+q3),c=4
三農(nóng)戶的得益函數(shù)和反應(yīng)函數(shù):
u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3
u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3
u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2
納什均衡:q1*=q2*=q3*=24,
u1*=u2*=u3*=576
最大總體收益:u*=2304Q*=48
由此說明,納什均衡的解常常是低效率的,而在現(xiàn)實(shí)生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略(集體理性),那么個體的貪婪性將會來破壞這一平衡。2.3混合策略概念應(yīng)用2.3.1概念的提出在前面的例子,如猜硬幣,齊威王田忌賽馬,夫妻之爭等博弈問題不存在納什均衡策略組合,然而這類問題十分常見。例1小偷與守衛(wèi)的博弈守衛(wèi)睡不睡小偷偷不偷V,-D-P,00,S0,02023/2/519小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對首位的處罰:短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概略0-D-D’守衛(wèi)得益((睡)SPt小偷偷的概率12.3.1概念的提出2023/2/520V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會是的守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概略1小偷和守衛(wèi)的博弈猜硬幣博弈
猜硬幣方正面反面蓋硬正面幣方反面該博弈與上一個例子相似,即取勝的關(guān)鍵都是不能讓另一方猜到自己的策略而同時自己又要盡可能猜出對方的策略。若p>1/2,則猜硬幣方全猜正面,他的期望得益為p×1+(1-p)×(-1)=2p-1>0,即平均來說,猜硬幣方贏多輸少。
-1,11,-11,-1-1,1例2猜硬幣
1.若被對手事先知道出現(xiàn)哪一面,肯定輸
2.若正面出現(xiàn)的概率為p,負(fù)面為1-p,且p>0.5,則猜正面的話贏的幾率就比較大。2.3.1概念的提出2023/2/522
混合策略反應(yīng)函數(shù)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布2023/2/523
混合策略反應(yīng)函數(shù)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布2.3.1概念的提出特點(diǎn):1.自己的選擇不能讓對手預(yù)先知道2.若重復(fù)多次,則不讓對手發(fā)現(xiàn)其中的規(guī)律。除非有意輸(一種行賄的手段),注意行賄只是一個手段,有意無意間讓對手了解自己的策略或規(guī)律。2.3.1概念的提出定義:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空間為Si={si1,…,sik},則博弈方i以概率分布pi=(pi1,…,pik)隨機(jī)選擇其k個可選策略稱為一個“混合策略”,其中0≤pik≤1對k=1,…,k都成立且pi1+…+pik=1。相對于這種以一定概率分布在一些策略中隨機(jī)選擇的混合策略,確定性的具體的策略我們稱為“純策略”混合策略的原則:自己的策略選擇不能被另一方預(yù)知或猜到。即在決策時利用隨機(jī)性。選擇每種策略的概率一定要恰好使對方無機(jī)可乘,即讓對方無法通過有針對性的傾向某一策略而占上風(fēng)。2.3.2應(yīng)用博弈方1選A、B的概率:pA,pB;博弈方2選C、D的概率:pC,pD。原則應(yīng)用:博弈方1選A和B的概率pA和pB一定要使博弈方2選C的期望得益和選D的期望得益相等。即pA×
3
+pB×1=pA×
2
+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1應(yīng)選的混合策略。同理可得博弈方2的混合策略為pC=0.8,pD=0.2。納什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6
單獨(dú)一次博弈的結(jié)果可能是四種狀態(tài)的任何一種,然而多次獨(dú)立重復(fù)博弈得到如上的結(jié)果是可能的。
2,35,23,11,5
2CDA1B2.3.2應(yīng)用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同樣可應(yīng)用于存在多個純策略納什均衡的博弈問題。例夫妻之爭該博弈與上一個博弈的不同之處在于每一方所希望對方知道自己的策略選擇以達(dá)到有利于自己的結(jié)果。現(xiàn)實(shí)中,這類問題多通過協(xié)商解決以免兩敗俱傷。在此我們假設(shè)夫妻雙方不可協(xié)商,互不通消息。令pw(時),pw(足)分別表示妻子選擇時裝表演和足球的概率;
ph(時),
ph(足)為丈夫選擇時裝表演和足球的概率。同樣的分析方法可得pw(時)=0.75,pw(足)=0.25;ph(時)=1/3,ph(足)=2/3.雙方的期望得益分別為uwe=0.67,uhe=0.75。
丈夫時裝足球妻時裝子足球2,10,00,01,32023/2/5282.3.2應(yīng)用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同樣可應(yīng)用于存在多個純策略納什均衡的博弈問題。例夫妻之爭該博弈與上一個博弈的不同之處在于每一方所希望對方知道自己的策略選擇以達(dá)到有利于自己的結(jié)果?,F(xiàn)實(shí)中,這類問題多通過協(xié)商解決以免兩敗俱傷。在此我們假設(shè)夫妻雙方不可協(xié)商,互不通消息。令pw(時),pw(足)分別表示妻子選擇時裝表演和足球的概率;
ph(時),
ph(足)為丈夫選擇時裝表演和足球的概率。同樣的分析方法可得pw(時)=0.75,pw(足)=0.25;ph(時)=1/3,ph(足)=2/3.雙方的期望得益分別為uwe=0.67,uhe=0.75。
丈夫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 前臺酒店員工辭職報告(集錦15篇)
- 一年級品德與生活上冊 我的第一個寒假教學(xué)實(shí)錄 首師大版
- 2024-2025學(xué)年高中物理 第五章 交變電流 1 交變電流(2)教學(xué)實(shí)錄 新人教版選修3-2
- 銀行收單業(yè)務(wù)總結(jié)
- 物流標(biāo)準(zhǔn)化管理(全文)
- 九年級道德與法治下冊 第二單元 世界舞臺上的中國 第三課 與世界緊相連 第2框 與世界深度互動教學(xué)實(shí)錄 新人教版
- “放管服”改革工作總結(jié)
- 愛心晚會主持稿
- 大學(xué)畢業(yè)生實(shí)習(xí)報告集合15篇
- 師德師風(fēng)演講稿集合15篇
- 慢性心衰患者的治療新選擇-CRT
- MSA-GRR數(shù)據(jù)自動生成工具(已經(jīng)解密)
- 機(jī)器設(shè)備維護(hù)保養(yǎng)記錄表
- 自動控制原理(山東大學(xué))智慧樹知到課后章節(jié)答案2023年下山東大學(xué)
- 第三課-冬天快要到了課件
- 地腳螺栓技術(shù)交底
- 機(jī)器人柔性滾邊技術(shù)說明
- 建筑工程鋼管扣件租賃合同(總結(jié)3篇)
- 六年級上冊英語教案- Module 6 Unit 2 I've got a stamp from China. -外研社(三起)
- 教育的另一種可能
- 《電力安全工作規(guī)程》電氣部分
評論
0/150
提交評論