版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、Ch 7 Game Theory: Introduction博弈論初步v博弈的描畫v參與者playersv行動(actions)v信息(information)v戰(zhàn)略strategiesv支付(payoff)博弈的描畫v參與者 Nv 決策主體,其目的是經(jīng)過選擇行動來最大化本身的成效v虛擬參與者:自然在博弈的特定時點上以特定的概率隨機決議行動博弈的描畫v行動 aiv 參與者所可以做的某一選擇v行動集:Aiv 參與者i在某一時點可以選擇一切行動的集合v行動順序v 設(shè)定何時哪些行動可行v行動組合: a=(a1,aN)博弈的描畫v信息信息集v當(dāng)處于行動位置時,參與者所知道的關(guān)于其他參與者包括自然過去行
2、動的知識。博弈的描畫v戰(zhàn)略 siv給定信息集下,一個戰(zhàn)略決議了在每一個時點上選擇何種行動。v是參與者行動方案的一個完好描畫,通知參與者在每一種可預(yù)見的情況下選擇什么行動。v戰(zhàn)略集 Siv戰(zhàn)略組合:s=(s1,sN)1NjisS注:戰(zhàn)略中隱含了關(guān)于參與者信息、行動集、行動順序的信息博弈的描畫v支付 uiv當(dāng)一切參與者包括自然都選擇了各自的戰(zhàn)略,而且博弈以及完成之后,參與者i所得到的成效。v支付函數(shù):ui:1NjiSR:參與者的支付函數(shù)符號 S-i :其他一切人的戰(zhàn)略ui(s)= ui(si ,s-i)博弈的描畫v博弈結(jié)果 (outcome)v博弈終了后,建模者從行動、支付和其他變量的取值中所挑出
3、來的他感興趣的要素的集合。博弈的描畫v建模原那么v現(xiàn)實性v求解的方便性v表述的明晰性博弈的描畫v平衡模型的解:v 是指由博弈中N個參與者選擇的最優(yōu)戰(zhàn)略所組成的一個戰(zhàn)略組合。*1(,.,)Nsss如:占優(yōu)戰(zhàn)略平衡、反復(fù)剔除嚴(yán)厲劣戰(zhàn)略平衡 、納什平衡、子博弈精練平衡 等存在性、獨一性信息v共同知識Common Knowledgev我們說知識M是共同知識,假設(shè)每個參與者知道M,每個參與者知道“每個參與者知道M,信息v私人信息v在博弈中開場博弈前或博弈中,參與者 i 的私人信息是指他知道,但不是一切參與者的共同知識。信息v不完全信息博弈v自然首先行動,而且他的行動至少對某一參與者來說是不可察看的。(R
4、asmueson)v部分參與者不知道其他參與者的支付函數(shù)Funderberg & Tirolev在參與者開場方案本人的戰(zhàn)略行動前,部分參與者具有其他人不知道的私人信息初始私人信息博弈的描畫v博弈的分類完全信息不完全信息靜態(tài)靜態(tài)完全信息靜態(tài)不完全信息博弈動態(tài)動態(tài)完全信息動態(tài)不完全信息博弈博弈的描畫v舉例:v囚徒姿態(tài)v不完全信息古諾博弈v企業(yè)1不知道企業(yè)2的本錢類型: (cL, cH)v反復(fù)博弈vStackelberg 產(chǎn)量博弈博弈的描畫v支付矩陣v參與者、戰(zhàn)略集、支付 囚徒1囚徒2囚徒姿態(tài)抵賴坦率抵賴坦率-1,-1-9, 00, -9-8, -8博弈的表述v戰(zhàn)略式博弈1(,)NiiiGS uS1
5、= S2=抵賴、坦率112NjiSSS(抵賴,抵賴)、(抵賴,坦率)、 (坦率,抵賴)、 (坦率,坦率)1),(1ccu9),(1dcu1),(2ccu8),(1ddu0),(1cdu8),(2ddu9),(2cdu0),(2dcu例:囚徒姿態(tài)根本假設(shè)v博弈規(guī)那么是共同知識v“參與者是理性的是共同知識v并且每個參與者在不確定下的成效函數(shù)都具有期望成效函數(shù)性質(zhì)。v最優(yōu)反響函數(shù)v給定其他參與者的戰(zhàn)略選擇s-i的最優(yōu)反響戰(zhàn)略可以最大化其支付的戰(zhàn)略*is)(*iiisrs. .ts*(,)(,) iiiiiiiiu ssu ssssv最優(yōu)反響函數(shù): 抵賴坦率抵賴-1,-1-9,0坦率0, -9-8,
6、-8囚徒1囚徒2抵賴坦率抵賴坦率0-80-8v嚴(yán)厲占優(yōu)戰(zhàn)略 Strictly Dominant Strategiesv不論其他參與者選擇怎樣的戰(zhàn)略, 一直是參與者i 的最優(yōu)反響。 is iiiiiiiissssussu ),(), (iiSs v占優(yōu)戰(zhàn)略平衡v由每個參與者的嚴(yán)厲占優(yōu)戰(zhàn)略組成的戰(zhàn)略組合 -1,-1-9, , -9囚徒1囚徒2抵賴坦率抵賴坦率0-80-8v協(xié)作博弈與非協(xié)作博弈v假設(shè)參與者可以達成有約束力的協(xié)議,那么該博弈稱為協(xié)作博弈 (Cooperative Game) LMRU 3,00,-50,-4C1,-13,3-2,4D2,44,1-1,8參與者1參與者2v嚴(yán)厲劣戰(zhàn)略v稱參
7、與者戰(zhàn)略 是戰(zhàn)略 的嚴(yán)厲占優(yōu)戰(zhàn)略,假設(shè)有 v v 同時稱 為參與者在S上的嚴(yán)厲劣戰(zhàn)略isis iiiiiiiiSsssussu ),(),(isv嚴(yán)厲劣戰(zhàn)略v對于戰(zhàn)略 ,假設(shè)存在戰(zhàn)略 ,v 那么稱 為參與者在S上的嚴(yán)厲劣戰(zhàn)略isis iiiiiiiiSsssussu ),(),(isv嚴(yán)厲劣戰(zhàn)略 LMRU 3,00,-50,-4C1,-13,3-2,4D2,44,1-1,8參與者1參與者2v反復(fù)剔除嚴(yán)厲劣戰(zhàn)略平衡 LMRU 3,00,-50,-4C1,-13,3-2,4D2,44,1-1,8參與者1參與者2,101DCUSS,11DUS ,12RLS ,202RMLSS21US 22LS v
8、為經(jīng)過n輪反復(fù)剔除嚴(yán)厲劣戰(zhàn)略后i的戰(zhàn)略集。:niS1n niisSvIteratively Strictly Undominated Strategiesv戰(zhàn)略si,假設(shè) ,都有 ,那么稱該戰(zhàn)略為ISUSv俾斯麥海之戰(zhàn)(1943)v日軍上將木村:將日軍運送到新西蘭v美軍上將肯尼:轟炸日軍運輸船 肯尼木村北線(短) 南線(長)北線南線2,-22,-21, -14, -4v弱劣戰(zhàn)略v對于戰(zhàn)略 ,假設(shè)存在戰(zhàn)略 ,v 那么稱 為參與者在S上的弱劣戰(zhàn)略isis (,)(,) iiiiiiiiu ssu sssSisv反復(fù)剔除弱劣戰(zhàn)略平衡v 肯尼木村北線(短) 南線(長)北線南線2,-22,-21, -1
9、4, -4v 為經(jīng)過n輪反復(fù)剔除弱劣戰(zhàn)略后i的戰(zhàn)略集。:niW1n niisWvIteratively Weakly Undominated Strategiesv戰(zhàn)略si,假設(shè) ,都有 ,那么稱該戰(zhàn)略為IWUSv占優(yōu)可解性dominance solvabilityv可以經(jīng)過反復(fù)剔除劣戰(zhàn)略求解博弈。v問題:多重平衡v智豬博弈 大豬小豬按鍵等待按鍵等待5,14,49, -10, 0v建模者的姿態(tài) -1,-1-9, , -9囚徒1囚徒2抵賴坦率抵賴坦率0-80-80,0v性別戰(zhàn) 男女足球芭蕾足球芭蕾2,10,00, 01, 2納什平衡v納什平衡v給定其他參與者都選擇了平衡戰(zhàn)略,那么每個參與者都沒有
10、一方偏離的鼓勵,即選擇平衡戰(zhàn)略是最優(yōu)的。1(,)NiiiGS u iisS ,isis( )iu,isis( )iuv純戰(zhàn)略納什平衡v給定戰(zhàn)略式博弈 ,戰(zhàn)略組合 是一個純戰(zhàn)略納什平衡,假設(shè)對每一個參與者都有 s納什平衡v求解 男女足球芭蕾足球芭蕾2,10,00, 01, 2納什平衡v分級協(xié)調(diào)博弈 大 小 大2,2-1,-1小 -1,1公司1公司21, 1納什平衡v猜硬幣 參與者1出牌參與者2猜上下上下-1,11,-11, -1-1, 1不存在純戰(zhàn)略納什平衡納什平衡v零和博弈Zero Game212212( ,)( ,)us sus s 1212 ( ,)ss sSS納什平衡v混合戰(zhàn)略v 給定一
11、個有限的戰(zhàn)略式博弈 ,參與者i的一個混合戰(zhàn)略 mi是在戰(zhàn)略集上的一個概率分布 v混合戰(zhàn)略集:Mi1(,)NiiiGS umi=(p1 ,p2 ,pk)( )iu s1NiiMM11( )()NNm sms( )is Su m混合戰(zhàn)略組合:m=(m1, ,mN)支付:納什平衡1(,)NiiiGS u iimM ,imim( )iu,imim( )iuv納什平衡NEv給定戰(zhàn)略式博弈 ,戰(zhàn)略組合 是一個納什平衡,假設(shè)對每一個參與者都有 m納什平衡v定理7.1 va、 是納什平衡vb、對每個參與者i而言,在NE中賦予正概率的戰(zhàn)略si都有 ,而對于其他賦予0概率的戰(zhàn)略都有vc、對一切參與者都有: m( , )iiu s( )iu mim( , )iiu s( )iu mim( , )iiu s( )iu mimi isS納什平衡v證明:ab iimM ,imim( )iu,imim( )iu是NE m令mi=(0,0,1,.0) iisS m( )iu,isim( )iu=si還需證明:( , )iiu s( )iu mim ( )0iiif m s納什平衡v證明:v例:(1)t xty0,1tmin , x y假設(shè)(1)t xtyymax , x y 0,1max (1)tt xtyt*=1納什平衡v證明:假設(shè):( , )iiu s( )iu mim( ,)ii
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)保密協(xié)議書編寫技巧
- 物業(yè)租賃代理費用基金合同
- 股權(quán)代持入股合作協(xié)議書
- 2024購銷合同協(xié)議精要
- 二手電動自行車轉(zhuǎn)讓合同
- 2024版企業(yè)技術(shù)成果保護協(xié)議
- 影視作品制片權(quán)許可合同
- 土地使用權(quán)轉(zhuǎn)讓協(xié)議書示例
- 2024年設(shè)立股份公司資金注入?yún)f(xié)議
- 七年級地理上冊-5.1-世界的人口教案-商務(wù)星球版(1)(2021學(xué)年)
- 幼兒園:我中獎了(實驗版)
- 趙學(xué)慧-老年社會工作理論與實務(wù)-教案
- 《世界主要海峽》
- 住院醫(yī)師規(guī)范化培訓(xùn)師資培訓(xùn)
- “三新”背景下的數(shù)學(xué)課堂教學(xué) 論文
- 中央企業(yè)商業(yè)秘密安全保護技術(shù)指引2015版
- 螺旋果蔬榨汁機的設(shè)計
- 《脊柱整脊方法》
- 會計與財務(wù)管理專業(yè)英語智慧樹知到答案章節(jié)測試2023年哈爾濱商業(yè)大學(xué)
- 廣東省2020年中考英語試題【含答案】
- 0417 教學(xué)能力大賽 公共基礎(chǔ)《英語 》教學(xué)實施報告 電子商務(wù)專業(yè)
評論
0/150
提交評論