博弈論知識(shí)點(diǎn)總結(jié)_第1頁
博弈論知識(shí)點(diǎn)總結(jié)_第2頁
博弈論知識(shí)點(diǎn)總結(jié)_第3頁
博弈論知識(shí)點(diǎn)總結(jié)_第4頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論知識(shí)總結(jié)博弈論概述 :1、博弈論概念:博弈論:就是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。博弈論研究的假設(shè):1、 決策主體是理性的,最大化自己的收益。2、 完全理性是共同知識(shí)3、 每個(gè)參與人被假定為可以對(duì)所處環(huán)境以及其他參與者的行為形成正確的信念與預(yù)期2、和博弈有關(guān)的變量:博弈參與人:博弈中選擇行動(dòng)以最大化自己受益的決策主體。行動(dòng):參與人的決策選擇戰(zhàn)略:參與人的行動(dòng)規(guī)則, 即事件與決策主體行動(dòng)之間的映射, 也是參與人行動(dòng)的規(guī)則。信息:參與人在博弈中的知識(shí), 尤其是其他決策主體的戰(zhàn)略、 收益、類型(不完全信息)等的信息。完全信息:每個(gè)參與人對(duì)其他參與人的支付函數(shù)有

2、準(zhǔn)確的了解;完美信息:在博弈過程的任何時(shí)點(diǎn)每個(gè)參與人都能觀察并記憶之前各局中人所選擇的行動(dòng),否則為不完美信息。不完全信息:參與人沒有完全掌握其他參與人的特征、戰(zhàn)略空間及支付函數(shù)等信息,即存在著有關(guān)其他參與人的不確定性因素。支付:決策主體在博弈中的收益。在博弈中支付是所有決策主題所選擇的行動(dòng)的函數(shù)。從經(jīng)濟(jì)學(xué)的角度講, 博弈是決策主體之間的相互作用,因此和傳統(tǒng)個(gè)人決策存在著區(qū)別:3、博弈論與傳統(tǒng)決策的區(qū)別:1、 傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個(gè)人決策就是在給定市場(chǎng)價(jià)格、消費(fèi)者收入條件下,最大化自己效用,研究工具是無差異曲線??杀硎緸椋簃axU(P,I),其中 P 為市場(chǎng)價(jià)格, I 為消費(fèi)者可支配收入。2、 其他

3、消費(fèi)者對(duì)個(gè)人的綜合影響表示為一個(gè)參數(shù)市場(chǎng)價(jià)格,所以在市場(chǎng)價(jià)格既定下,消費(fèi)者效用只依賴于自己的收入和偏好,不用考慮其他消費(fèi)者的影響。但是在博弈論理個(gè)人效用函數(shù)還依賴于其他決策者的選擇和效用函數(shù)。4、博弈的表示形式:戰(zhàn)略式博弈和擴(kuò)展式博弈戰(zhàn)略式博弈 :是博弈問題的一種規(guī)范性描述,有時(shí)亦稱標(biāo)準(zhǔn)式博弈。戰(zhàn)略式博弈是一種假設(shè)每個(gè)參與人僅選擇一次行動(dòng)或戰(zhàn)略,并且參與人同時(shí)進(jìn)行選擇的決策模型, 因此, 從本質(zhì)上來講戰(zhàn)略式博弈是一種靜態(tài)模型,一般適用于描述不需要考慮博弈進(jìn)程的完全信息靜態(tài)博弈問題。1、參與人集合 1 , 2,.,n :2、每位參與人非空的戰(zhàn)略集Sins i(s1 ,.,s i ,., s n

4、) 上的效用函數(shù) Ui(s1,s2, ,sn).3、每位參與人定義在戰(zhàn)略組合i1擴(kuò)展式博弈 :是博弈問題的一種規(guī)范性描述。與戰(zhàn)略式博弈側(cè)重博弈結(jié)果的描述相比, 擴(kuò)展式博弈更注重對(duì)參與人在博弈過程中遇到?jīng)Q策問題時(shí)序列結(jié)構(gòu)的分析。包含要素:1 、 參與人集合 1 , 2,.,n 類型完全信息靜態(tài)博弈2 、 參與人的行動(dòng)順序,即每個(gè)參與人在何時(shí)行動(dòng);3 、 序列結(jié)構(gòu):每個(gè)參與人行動(dòng)時(shí)面臨的決策問題,包括參與人行動(dòng)時(shí)可供選擇的行動(dòng)方案、所了解的信息;4 、 參與人的支付函數(shù)。比較 :1、戰(zhàn)略式博弈從本質(zhì)上來講是一種靜態(tài)模型。2、擴(kuò)展式博弈從本質(zhì)上來講是一種動(dòng)態(tài)模型。5、博弈論分類:按決策主體的行為相互

5、作用時(shí),當(dāng)事人能否達(dá)成一個(gè)具有約束力的協(xié)議可分為:1、合作博弈(強(qiáng)調(diào)團(tuán)體理性、團(tuán)體最優(yōu)決策、效率)2、非合作博弈(強(qiáng)調(diào)個(gè)人理性,個(gè)人最優(yōu)決策)按參與人行動(dòng)先后順序可分為:1、 靜態(tài)博弈:博弈中參與人同時(shí)行動(dòng),或者雖然不是同時(shí)行動(dòng),但是在行動(dòng)前不知道其他參與人所選擇的行動(dòng)。2、 動(dòng)態(tài)博弈:參與人的行動(dòng)有先后順序,后行動(dòng)者獲得先行動(dòng)者的行動(dòng)信息。按參與人對(duì)信息的掌握程度可分為:1、 完全信息:每個(gè)參與人對(duì)其他所有參與人的特征、戰(zhàn)略空間及支付函數(shù)有精確的了解,博弈開始時(shí)不存在不確定性因素。2、 不完全信息:參與人沒有完全掌握其他參與人的特征、戰(zhàn)略空間及支付函數(shù)等信息,即存在著有關(guān)其他參與人的不確定性

6、因素。按決策主體對(duì)信息的掌握程度和行動(dòng)的先后順序,博弈可以分為: 完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈。靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈均衡:納什均衡均衡:子博弈精煉納什均衡不完全信息不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈均衡:貝葉斯納什均衡均衡:精煉貝葉斯納什均衡6、根據(jù)所學(xué)這四種博弈的特點(diǎn)對(duì)這四種博弈做一個(gè)對(duì)比分析:信息和行動(dòng)特點(diǎn)均衡均衡類型特別均衡求解方法學(xué)過的例子性質(zhì)每個(gè)參與人對(duì)其納什均純戰(zhàn)略納占優(yōu)戰(zhàn)略納箭頭法Hotelling 價(jià)格競(jìng)多重性和存他所有參與人的衡什 均 衡什 均 衡劃線法爭(zhēng)在性特征、戰(zhàn)略空間及(PNE)( DSE)庫諾

7、特價(jià)格競(jìng)爭(zhēng)支付函數(shù)有精確重復(fù)剔除的不斷剔除劣一般一個(gè)博弈中的了解,博弈開始占有均衡戰(zhàn)略(弱劣存在參與者有多時(shí)不存在不確定(IFDE)戰(zhàn)略的剔除個(gè)行動(dòng)時(shí)可以先性因素,參與人同順序會(huì)影響考慮能否剔除弱時(shí)行動(dòng)或者不是均衡結(jié)果戰(zhàn)略簡(jiǎn)化博弈同時(shí)行動(dòng)但是后混合戰(zhàn)略聚點(diǎn)均衡支付最大化社會(huì)福利博弈行動(dòng)者不知道行納什均衡法小偷守衛(wèi)博弈動(dòng)者的行動(dòng)信息。(MNE)支付等值法戰(zhàn)略和行動(dòng)相同。完全信在博弈 開始之 前子博弈息動(dòng)態(tài)參與人 之間的 信精煉納博弈息不存 在不確 定什均衡性,但是參與人行動(dòng)存在先后順序。在完全 信息動(dòng) 態(tài)博弈中,為了表示參與人 之間的 信息掌握關(guān)系, 引入了信息及的概念。不完全在博弈 開始之 前

8、貝葉斯信息靜參與人 之間的 信納什均態(tài)博弈息存在不確定性,衡但是參 與人同 時(shí)行動(dòng)或 者不是 同時(shí)行動(dòng) 但是后 行動(dòng)者不 知道行 動(dòng)者的行動(dòng)信息。不確定 是參與 人的了性 的不確 定性子博弈精有限次重復(fù)與納什均衡連鎖店悖論煉納什均博弈均衡的唯一性有衡關(guān)無限次重復(fù)與貼現(xiàn)因子囚徒困境(冷酷博弈均衡有關(guān)戰(zhàn)略)(無名氏定無限期輪流討價(jià)理)還價(jià)模型一般博弈逆向歸納法斯坦科爾伯格寡求解頭競(jìng)爭(zhēng)雇主與公會(huì)之間的競(jìng)爭(zhēng)貝葉斯納混合戰(zhàn)略對(duì)原混合戰(zhàn)性別戰(zhàn)什均衡(不完全信略加入少許息情況下純不確定性因戰(zhàn)略均衡的素,求極限。極限)一般貝葉斯Harsanyi 轉(zhuǎn)機(jī)制設(shè)計(jì)均衡換1、均衡結(jié)果 是 原博 弈 的Nash 均衡;2

9、、同時(shí)在每 一 個(gè)子 博 弈上 構(gòu) 成Nash 均衡1、均衡存在性2、不確定性體現(xiàn)為類型的不確定性不完全信息動(dòng)態(tài)博弈在博弈開始前參精煉貝信號(hào)傳遞分離均衡與人之間的信息葉斯納博弈存在不確定性, 同什均衡混同均衡時(shí)參與人行動(dòng)存在先后順序。 不完準(zhǔn)分離均衡全信息動(dòng)態(tài)博弈過程不僅是參與人選擇行動(dòng)的過程,而且是參與人不斷修正信念的過程。根據(jù)所得信信號(hào)傳遞博弈不完全信息息修正判斷不完全信息重復(fù)動(dòng)態(tài)博弈子概率,根據(jù)博弈與聲譽(yù)博弈精煉納收益最大化Milgrom-Roberts什均衡與海決策壟斷限價(jià)模型薩尼不完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。二、四種博弈類型具體分述1、完全信息靜態(tài)博弈1.1 完全信息靜態(tài)博弈特

10、點(diǎn) :每個(gè)參與人對(duì)其他所有參與人的特征、戰(zhàn)略空間及支付函數(shù)有精確的了解,博弈開始時(shí)不存在不確定性因素,參與人同時(shí)行動(dòng)或者不是同時(shí)行動(dòng)但是后行動(dòng)者不知道行動(dòng)者的行動(dòng)信息。戰(zhàn)略和行動(dòng)相同。1.2完全信靜態(tài)博弈相關(guān)概念:以新產(chǎn)品開發(fā)博弈舉例說明:參與人 :參與人1 和 2。參與人的集合卡表示為:=1,2, n.表示所有參與人的集合,在新產(chǎn)品開發(fā)博弈中為:=1,2行動(dòng) :開發(fā)、不開發(fā)。Ai 表示參與人行動(dòng)的集合。新產(chǎn)品開發(fā)博弈中參與人的行動(dòng)集合為A1=A2=a,b,其中 a為開發(fā), b 為不開發(fā)。a=a1,a2 an表示參與人的行動(dòng)組合。新產(chǎn)品開發(fā)博弈中為:A=( a,a),(a,b),(b,a),(

11、b,b)戰(zhàn)略 :參與人的行動(dòng)規(guī)則。在博弈中的戰(zhàn)略可以定義為從觀測(cè)集到行動(dòng)集的映射關(guān)系,即:Si:Xi Ai。用Si=si表示參與人所有戰(zhàn)略的集合。在 n 人博弈中,用 S=(s1,s2,s3 ,sn )表示 n 個(gè)參與人的戰(zhàn)略組合,它表示博弈中每個(gè)參與人采取戰(zhàn)略 si 的一種博弈情形。在完全信息靜態(tài)博弈中,由于不存在決策時(shí)序上的差異,所有參與人在同一決策時(shí)點(diǎn)即博弈開始的那一時(shí)刻決策,因此,所有參與人面臨的決策情形都只有一種,所以, 參與人的戰(zhàn)略集與行動(dòng)集相同。支付 :是指參與人在博弈中的所得。一般情況下也是用效用函數(shù)來表示參與人在博弈中的所得。 因此,參與人的支付就可表示為一種特定博弈情形下參

12、與人得到的確定效用水平或期望效用水平。 支付一般用ui(1,2,n)表示參與人i 的支付 (效用水平 ),支付組合 u=(u1,u2,un)表示參與人在特定博弈情形下所得到的支付,其中為參與人i 的支付。因此,參與人i=(i=1,2,n)的支付就可表示為:ui=ui(si ,s-i).信息 :是參與人所具有的有關(guān)博弈的所有知識(shí),如有關(guān)其它參與人行動(dòng)或戰(zhàn)略的知識(shí)、有關(guān)參與人支付的知識(shí)等等。在“新產(chǎn)品開發(fā)博弈”中,如果兩個(gè)企業(yè)都知道市場(chǎng)需求,那么這樣的博弈情形就是我們前面所提到的完全信息假設(shè);如果兩個(gè)企業(yè)中至少有一個(gè)不知道市場(chǎng)需求,那么這樣的博弈情形就是我們前面所提到的不完全信息假設(shè)。1.3純戰(zhàn)略

13、納什均衡純戰(zhàn)略 :參與人在給定信息下只選擇一種特定(或確定性)的戰(zhàn)略混合戰(zhàn)略: 混合戰(zhàn)略解釋了一個(gè)參與人對(duì)其他參與人所采取的行動(dòng)的不確定性, 它描述了參與人在給定信息下以某種概率分布隨機(jī)地選擇不同的行動(dòng)或戰(zhàn)略。純戰(zhàn)略納什均衡中包括:占有均衡、重復(fù)剔除劣戰(zhàn)略均衡、一般純戰(zhàn)略納什均衡等。1、占優(yōu)均衡占優(yōu)戰(zhàn)略: 參與人的最優(yōu)戰(zhàn)略 si * 與其他參與人的選擇s-i 無關(guān)。無論其他參與人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略總是唯一的,這樣的最優(yōu)戰(zhàn)略稱之為“占優(yōu)戰(zhàn)略”。在 n 人博弈中,如果對(duì)于所有的其他參與人的選擇s-i,si * 都是參與人i 的最優(yōu)選擇ui (si* , s i ) ui (si , s

14、 i )則稱 si *為參與人的占優(yōu)戰(zhàn)略。在 n 人博弈中, 如果對(duì)所有參與人都存在占優(yōu)戰(zhàn)略si * ,則占優(yōu)戰(zhàn)略組合si*=(s1 * si2*, ,sn *)稱為占優(yōu)戰(zhàn)略均衡。如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么占優(yōu)戰(zhàn)略均衡就是唯一的所有理性參與人可以預(yù)測(cè)到的博弈結(jié)果。2、重復(fù)剔除劣戰(zhàn)略如果在一個(gè)博弈中,參與人不存在占優(yōu)戰(zhàn)略,但是參與人i 存在兩個(gè)戰(zhàn)略,其中一ui ( si, s i ) ui (si , s i )個(gè)戰(zhàn)略叫另一個(gè)戰(zhàn)略的所得效用要大,則理性的參與人絕對(duì)不會(huì)選擇戰(zhàn)略。嚴(yán)格劣戰(zhàn)略 :ui ( si , s i ) u i ( si , s i )u ( si , s i )u

15、i ( si , s i )弱劣戰(zhàn)略 :若重復(fù)剔除過程一直可持續(xù)到只剩下唯一的戰(zhàn)略組合,則該戰(zhàn)略組合即為重復(fù)剔除的占優(yōu)均衡,此時(shí)該博弈是重復(fù)剔除戰(zhàn)略可解。要點(diǎn):再重復(fù)剔除過程中,如果每次剔除的是嚴(yán)格劣戰(zhàn)略,均衡結(jié)果與剔除順序無關(guān);如果剔除的是弱劣戰(zhàn)略,均衡結(jié)果可能與剔除順序有關(guān)。3、一般 Nash 均衡Nash 均衡是完全信息靜態(tài)博弈的解的概念,戰(zhàn)略是不可剔除的,即不存在任何一個(gè)戰(zhàn)略嚴(yán)格優(yōu)于在完全信息靜態(tài)博弈中,Nash 均衡戰(zhàn)略。構(gòu)成Nash 均衡的求解納什均衡的方法劃線法、箭頭法。劃線法 :1、考察參與人1 的最優(yōu)戰(zhàn)略2、用上述方法找出參與人2 的最優(yōu)戰(zhàn)略3、找出最優(yōu)戰(zhàn)略組合箭頭法:1、

16、對(duì)于每個(gè)戰(zhàn)略組合,檢查是否有參與人會(huì)偏離這個(gè)戰(zhàn)略組合2、 直至找出沒有參與人會(huì)偏離的戰(zhàn)略組合純戰(zhàn)略均衡反映函數(shù):各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng)。1.4 混合戰(zhàn)略納什均衡混合戰(zhàn)略:在博弈G ; S1 ,., Sn ;u1,., un中,對(duì)任一參與人i ,設(shè) Si=S i1, ,S ik, 則參與人i 的一個(gè)混合戰(zhàn)略為定義在戰(zhàn)略集Si上的一個(gè)概率分布i= i 1, , ik, 其中 i j(j=1,k )表示參與人 i 選擇戰(zhàn)略 表示參與人 i 選擇戰(zhàn)略ij的概率的概率,即ijS滿足 0 ij 1,其中概率之和為1。支付:混合戰(zhàn)略的支付為各種概率下收益的加權(quán)平均。混合戰(zhàn)略納什均衡:在

17、博弈G ; S1,., Sn ; u1 ,., un 中,混合戰(zhàn)略組合i= 1* , , n* 為一個(gè) Nash均衡。當(dāng)且僅當(dāng)i,ii ,有vi ( i* , *i ) vi ( i ,* i ) ?;旌蠎?zhàn)略 Nash 均衡的求解:1.支付最大化法;2.支付等值法;混合戰(zhàn)略均衡反映函數(shù):在混合策略的范疇內(nèi),博弈方的決策是選擇概率分布,因此,反應(yīng)函數(shù)就是一方對(duì)另一方選擇的概率分布的反應(yīng)。聚點(diǎn)均衡:在現(xiàn)實(shí)生活中, 參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個(gè)“聚點(diǎn)”均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過去博弈的歷史有關(guān)。不同均衡概念之間的關(guān)系:占優(yōu)均衡 <重復(fù)剔除劣戰(zhàn)略均衡<

18、純戰(zhàn)略納什均衡 <混合戰(zhàn)略納什均衡1.5 納什均衡的多重性與存在性存在性:每個(gè)有限戰(zhàn)略式博弈(參與人與相應(yīng)的戰(zhàn)略集均為有限)必存在納什均衡,這個(gè)均衡可能是純戰(zhàn)略納什均衡,也可能是混合戰(zhàn)略納什均衡。多重性: 一個(gè)博弈可能有多個(gè)均衡,博弈論并沒有一個(gè)一般的理論證明,哪一個(gè)納什均衡結(jié)果一定能出現(xiàn)。2、完全信息動(dòng)態(tài)博弈2.1完全信息動(dòng)態(tài)博弈特點(diǎn):在博弈開始之前參與人之間的信息不存在不確定性,但是參與人行動(dòng)存在先后順序。在完全信息動(dòng)態(tài)博弈中,為了表示參與人之間的信息掌握關(guān)系,引入了信息及的概念。2.2完全信息動(dòng)態(tài)博弈有關(guān)概念:信息集 :信息集 I i 是參與人 i 決策結(jié)的一個(gè)集合,它滿足以下兩個(gè)

19、條件:1 、 I i 中的每個(gè)決策結(jié)都是參與人i 的決策結(jié);2、當(dāng)博弈到達(dá)I i 時(shí),參與人i知道自己處在該信息集中的某個(gè)決策結(jié),但不知道是哪一個(gè)。在博弈樹中,屬于同一信息集的決策結(jié)一般用虛線連接起來。結(jié):包括決策結(jié)和終點(diǎn)結(jié)兩類。決策結(jié)是參與人采取行動(dòng)的點(diǎn)時(shí)點(diǎn),終點(diǎn)結(jié)是博弈行動(dòng)路徑的終點(diǎn)。一個(gè)信息集可能只包含一個(gè)決策結(jié),也可能包含多個(gè)決策結(jié)。如果只包含一個(gè)決策結(jié)的信息集就是但單結(jié)信息集。如果博弈中所有信息集都是單結(jié)的則成為完美信息博弈。子博弈 :是原博弈的一部分,它始于原博弈中一個(gè)單結(jié)信息集中的決策結(jié)x,并由決策結(jié)x 及其后續(xù)結(jié)共同組成。1、 子博弈可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析,并且與原博弈

20、具有相同的信息結(jié)構(gòu);2、 原博弈可以作為自身的一個(gè)子博弈;2.3不完全信息靜態(tài)博弈均衡子博弈精煉Nash 均衡:解決 Nash 均衡多重性問題的一種主要方法就是精煉的方法,即在Nash 均衡的基礎(chǔ)上,通過定義更加合理的博弈解并剔除不合理的均衡。子博弈精煉納什均衡的引入就是將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈結(jié)果的一個(gè)合理預(yù)測(cè)。即子博弈精煉納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每個(gè)信息集上都是最優(yōu)的。擴(kuò)展式博弈的戰(zhàn)略組合足以下條件:1、是原博弈的Nash 均衡s*(s1* ,., sn* ) ,是一個(gè)子博弈精煉Nash 均衡,當(dāng)且僅當(dāng)滿2、在每一個(gè)子博弈上構(gòu)成Nash 均

21、衡一個(gè)戰(zhàn)略組合是子博弈精煉Nash 均衡當(dāng)且僅當(dāng)它對(duì)所有的子博弈( 包括原博弈) 構(gòu)成Nash 均衡,同時(shí)也意味著原博弈的Nash 均衡并不一定是子博弈精煉Nash 均衡,除非它還對(duì)所有子博弈構(gòu)成Nash 均衡。2.4不完全信息靜態(tài)博弈均衡求解逆推歸納法逆推歸納法是最常用的求解子博弈精煉Nash 均衡的方法,其步驟為:其中 ( xi ) 代表博弈中由最底層到博弈起點(diǎn)的順序,以 ( x3) 為最底層,則有:1、 找出博弈的所有子博弈;2、 按照博弈進(jìn)程的“反方向”逐一求解各個(gè)子博弈,即最先求解最底層的子博弈,再求解上一層的子博弈,.,直至原博弈。由于逆推歸納法對(duì)各個(gè)子博弈逐一進(jìn)行求解,因此,逆推

22、歸納法所得到的解在各子博弈上構(gòu)成 Nash 均衡 , 即意味著逆推歸納法所得的解為子博弈精煉納什均衡2.5完全信息動(dòng)態(tài)博弈中承諾行動(dòng)的均衡結(jié)果分析:承諾行動(dòng): 就是在博弈開始之前參與人采取某種改變自己支付或戰(zhàn)略空間的行動(dòng),該行動(dòng)使原本不可信的威脅變得可信。但是參與人的承諾行動(dòng)是有成本的,否則這種承諾就不可信。例子 :要挾訴訟要挾訴訟就是指那種原告幾乎不可能勝訴而其惟一的目的是希望通過私了而得到一筆賠償?shù)脑V訟。 該博弈的結(jié)果為原告選擇不指控,博弈結(jié)束。 博弈的結(jié)果似乎與人們觀測(cè)到的現(xiàn)實(shí)并不相符,因?yàn)楝F(xiàn)實(shí)中人們常常看到各種“要挾”發(fā)生。在上述模型中,“要挾”之所以沒有成功,關(guān)鍵在于原告將會(huì)起訴的威

23、脅并不可信。要是威脅變得可信, 就必須采取承諾行動(dòng)(沉沒成本) 。這樣參與人的威脅就會(huì)變得可信,從而使其他博弈參與人改變策略。2.6重復(fù)博弈議題:1、將來可信的威脅或承諾如何影響到當(dāng)前的行動(dòng)2、在一次博弈中無法實(shí)現(xiàn)的均衡,在重復(fù)博弈中能否實(shí)現(xiàn)有限次重復(fù)博弈 :對(duì)于給定的階段博弈,令 ( )表示G重復(fù)進(jìn)行 T 次的有限重復(fù)博弈,GG T并且在下一次博弈開始前,所有以前博弈的進(jìn)程都可被觀測(cè)到。有限次重復(fù)博弈均衡結(jié)論 :如果階段博弈 G有唯一的 Nash 均衡,則對(duì)任意有限的T,重復(fù)博弈 G( T) 有唯一的子博弈精煉解,即 G的 Nash 均衡結(jié)果在每一個(gè)階段重復(fù)進(jìn)行。而且在有限次重復(fù)博弈中, 如

24、果在單階段博弈中均衡解不只有一個(gè),則對(duì)將來行動(dòng)所作的可信威脅或承諾可以影響到當(dāng)前的行動(dòng)。無限次重復(fù)博弈: 給定一階段博弈G,令 G( , ) 表示相應(yīng)的無限重復(fù)博弈, 其中 G將無限次的重復(fù)進(jìn)行,且參與人的貼現(xiàn)率為。對(duì)每個(gè) t ,之前 t -1次階段博弈的結(jié)果在 t 階段開始進(jìn)行前都可以被觀測(cè)到,每個(gè)參與人在G( , ) 中的收益都是該參與人在無限次的階段博弈中所得收益的現(xiàn)值。無限次重復(fù)博弈的解無名氏定理:用令 G為一個(gè) n 人階段博弈,令( e1,e2,en )為 G的一個(gè) Nash 均衡下的收益,且(x1,x2,xn) 表示 G的其它任何可行收益,表示可行收益的集合。若存在xiei ,對(duì)i

25、 , xiX則存在貼現(xiàn)率,使無限重復(fù)博弈G(, ) 存在一個(gè)子博弈精煉Nash 均衡,其平均收益可達(dá)到 (x1,x2,xn) 。無名氏定理的解釋:在無限次重復(fù)博弈中,如果參與人具有足夠的耐心(只要滿足一定的條件),那么任何滿足個(gè)人理性的可行收益向量都可以通過一個(gè)特定的子博弈精煉Nash均衡得到。影響重復(fù)博弈結(jié)果的因素:影響重復(fù)博弈結(jié)果的是重復(fù)的次數(shù)和信息的完備性。2.7子博弈精煉Nash 均衡與 Nash 均衡的區(qū)別:由于子博弈精煉Nash 均衡在任一決策結(jié)上都能給出最優(yōu)決策,這也使得子博弈精煉納什均衡不僅在均衡路徑( 即均衡戰(zhàn)略組合所對(duì)應(yīng)的路徑) 上給出參與人的最優(yōu)選擇,而且在非均衡路徑 (

26、 即除均衡路徑以外的其它路徑) 上也能給出參與人的最優(yōu)選擇。即子博弈精煉Nash 均衡不會(huì)含有參與人在博弈進(jìn)程中不合理的、不可置信的行動(dòng)。3、 不完全信息靜態(tài)博弈3 1不完全信息靜態(tài)博弈特點(diǎn):在博弈開始之前參與人之間的信息存在不確定性,但是參與人同時(shí)行動(dòng)或者不是同時(shí)行動(dòng)但是后行動(dòng)者不知道行動(dòng)者的行動(dòng)信息。在不完全信息靜態(tài)博弈中, 在博弈開始前存在關(guān)于博弈人信息的不確定性, 這個(gè)不確定像通常是博弈參與人的類型。在市場(chǎng)進(jìn)入博弈中不完全信息表現(xiàn)為:在位者的成本類型(高成本、低成本)在斗雞博弈中不完全信息表現(xiàn)為:參與人的性格類型(強(qiáng)硬,軟弱)3.2海薩尼轉(zhuǎn)換由于在不完全信息靜態(tài)博弈中, 參與人的類型存

27、在不確定性, 所以當(dāng)一個(gè)參與人并不知道在與誰博弈時(shí), 博弈的規(guī)則是無法定義的, 海薩尼提出了海薩尼轉(zhuǎn)換解決這種不確定的問題。解決方法 :海薩尼指出, 引入虛擬參與人自然,由自然先決定參與人的不同類型,將不完全信息博弈轉(zhuǎn)換為不完美信息博弈。海薩尼通過引入“虛擬”參與人,將博弈的起始點(diǎn)提前, 從而將原博弈中參與人的事前不確定性轉(zhuǎn)變?yōu)椴┺拈_始后的不確定性。這種通過引入“虛擬”參與人來處理不完全信息博弈問題的方法稱為Harsanyi轉(zhuǎn)換。海薩尼轉(zhuǎn)換注意要點(diǎn):1、海薩尼轉(zhuǎn)換規(guī)定:參與人關(guān)于“自然”選擇的推斷為共同知識(shí)。2、“自然”的選擇。在一般的不完全信息博弈問題中,Harsanyi 轉(zhuǎn)換規(guī)定“自然”選

28、擇的是參與人的類型 (type)。除了根據(jù)參與人的支付來劃分參與人的類型以外,還可以根據(jù)參與人的行動(dòng)空間, 甚至根據(jù)參與人掌握信息的多少( 或程度 ) 來劃分參與人的類型。3、參與人關(guān)于“自然”選擇的推斷是基于自己類型判斷的條件概率。3.3 不完全信息靜態(tài)博弈均衡貝葉斯納什均衡貝葉斯博弈的定義:貝葉斯博弈包含以下五個(gè)要素:1、 參與人集合 B=1,2 , ,n2、 參與人的類型集合 T1, ,T23、 參與人關(guān)于其他參與人類型的推斷P1(t -1|t1) , ,Pn(t-1 n|t n)4、 參與人類型相依的行動(dòng)集1A(tnA(t ), ,)5、 參與人類型相依的支付函數(shù)貝葉斯博弈的戰(zhàn)略 :在

29、貝葉斯博弈G= ;(Ti);( Pi );( A( t i );( ui ( a( t ); t i ) 中,參與人 i的一個(gè)戰(zhàn)略是從參與人的類型集ii(ti) ;它包含T 到其行動(dòng)集的一個(gè)函數(shù)s了當(dāng)自然賦予i 的類型為 ti時(shí), i 將從可行的行動(dòng)集ii) 中選擇的行動(dòng)。A (t貝葉斯博弈的時(shí)間順序 :1、“自然”選擇參與人的類型組合t=(t1, ,t n)2、參與人同時(shí)選擇行動(dòng),每個(gè)參與人i從行動(dòng)集 Ai(t i ) 中選擇行動(dòng) ai (ti )3、參與人 i得到 支付貝葉斯納什均衡 :在貝葉斯博弈中,對(duì)于一個(gè)理性的參與人i ,當(dāng)他只知道自己的類型t i 而不知道其他參與人的類型時(shí),給定其

30、他參與人的戰(zhàn)略s-i ,他將選擇使自己期望效*(t i ) ,其中用 ( 支付 ) 最大化的行動(dòng) a iai( ti)argmaxaiAi (ti )vi(ai, si ; ti)貝葉斯博弈納什均衡的存在性:一個(gè)有限的貝葉斯博弈一定存在貝葉斯Nash 均衡。3.4 貝葉斯博弈與混合戰(zhàn)略均衡(關(guān)于混合戰(zhàn)略納什均衡的一個(gè)解釋)首先,混合策略均衡不是現(xiàn)實(shí)生活的一個(gè)合理描述,人們并不是根據(jù)概率分布來選擇自己行動(dòng);海薩尼證明,在完全信息情況下的混合策略均衡可以解釋為不完全信息情況下純策略均衡的極限?;旌喜呗缘谋举|(zhì):混合策略的本質(zhì)不在于參與人隨機(jī)的選擇行動(dòng),而在于他不能確定其他參與人將選擇什么純策略,這種

31、不確定性可能來自于參與人不知道其他參與人的類型。海薩尼的基本思想:只要在原來的博弈中加入少許不完全信息因素,使得參與人的支付函數(shù)中的收益不再是確定的,而是和一個(gè)有范圍的不確定參數(shù)有關(guān),從而通過將混合戰(zhàn)略均衡求解轉(zhuǎn)換為貝葉斯均衡的極限解,但是得到的純戰(zhàn)略貝葉斯均衡就與完全信息下的混合戰(zhàn)略均衡相似。結(jié)論 :完全信息博弈的混合戰(zhàn)略 Nash 均衡可以解釋為與之密切相關(guān)、存在一點(diǎn)點(diǎn)非完全信息的純戰(zhàn)略貝葉斯 Nash 均衡。同時(shí)海薩尼給出了描述混合策略和純策略之間關(guān)系的一個(gè)正式的定理:混合策略均衡的純化定理。3.5貝葉斯均衡 Eg:機(jī)制設(shè)計(jì)問題機(jī)制設(shè)計(jì)問題實(shí)際上就是探討設(shè)計(jì)者如何向參與人提供激勵(lì),以促使

32、參與人向設(shè)計(jì)者透露其掌握的信息(說真話) ,從而確定對(duì)設(shè)計(jì)者有利的結(jié)果的問題。這一機(jī)制對(duì)應(yīng)于一個(gè)博弈形式, 設(shè)計(jì)者需要設(shè)計(jì)出一個(gè)博弈形式,讓參與人在這個(gè)博弈形式下進(jìn)行博弈從而實(shí)現(xiàn)他的目標(biāo)。博弈形式不同, 實(shí)現(xiàn)目標(biāo)的程度也不一樣, 設(shè)計(jì)者必須選擇對(duì)他來說是最有利的博弈形式,即最有利的機(jī)制。機(jī)制設(shè)計(jì)的基本模型:機(jī)制設(shè)計(jì)是典型的 3 階段不完全信息博弈,期階段如下:階段 1:機(jī)制設(shè)計(jì)者 ( 委托人 ) 設(shè)計(jì)一種 “機(jī)制”,或者“契約”,或者“激勵(lì)方案”;階段 2:代理人選擇接受或拒絕該機(jī)制,拒絕的代理人得到某個(gè)外生的“保留效用”;階段 3:接受機(jī)制的代理人選擇自己的行動(dòng)( 或者戰(zhàn)略 ) ,實(shí)現(xiàn)一個(gè)博

33、弈結(jié)果。機(jī)制設(shè)計(jì)模型中的有關(guān)概念:參與約束:由于代理人在第二階段總可以選擇不接受該機(jī)制從而獲得一個(gè)保留效用,因此,代理人接受這個(gè)機(jī)制獲得的效用必須不小于拒絕這個(gè)機(jī)制時(shí)獲得的效用。激勵(lì)相容約束: 這意味著, 對(duì)于代理人而言, 代理人真實(shí)報(bào)告自己的類型時(shí)獲得的效用必須不小于謊報(bào)自己類型時(shí)獲得的效用??尚袡C(jī)制:滿足參與約束的機(jī)制被稱為可行機(jī)制。可實(shí)施機(jī)制:滿足激勵(lì)相容約束的機(jī)制稱為可實(shí)施機(jī)制可行的可實(shí)施機(jī)制:如果一個(gè)機(jī)制既滿足參與約束,又滿足激勵(lì)相容約束。機(jī)制設(shè)計(jì)的目的:機(jī)制設(shè)計(jì)的目的就是要設(shè)計(jì)出可行的可實(shí)施機(jī)制,從而在該機(jī)制中找出最優(yōu)規(guī)則以追求最大化收益。4、不完全信息動(dòng)態(tài)博弈4.1不完全信息動(dòng)態(tài)

34、博弈特點(diǎn):在博弈開始之前參與人之間的信息存在不確定性,同時(shí)參與人行動(dòng)存在先后順序。不完全信息動(dòng)態(tài)博弈過程不僅是參與人選擇行動(dòng)的過程,而且是參與人不斷修正信念的過程。4.2不完全信息動(dòng)態(tài)博弈的有關(guān)概念類型 : 是指參與者的類型。在不完全信息動(dòng)態(tài)博弈中自然首先選擇參與人的類型。動(dòng)態(tài)博弈:行動(dòng)有先有后。所以后行動(dòng)者可以觀察到先行動(dòng)者的行動(dòng)信息,從而可以修正自己對(duì)于參與人的類型的信息的判斷。類型相依:參與者的行動(dòng)傳遞著有關(guān)自己的類型的信息,對(duì)方可通過參與人的行動(dòng)來推斷自己的最優(yōu)行動(dòng)。 先行動(dòng)者預(yù)測(cè)到自己的行動(dòng)被后行動(dòng)者利用,就會(huì)設(shè)法傳遞對(duì)自己最有利的信息。4.3不完全信息動(dòng)態(tài)博弈的納什均衡精煉貝葉斯均

35、衡對(duì)應(yīng)于不完全信息動(dòng)態(tài)博弈的納什均衡稱為精煉貝葉斯均衡;精練貝葉斯均衡是澤爾騰不完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡與海薩尼不完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。1、不完全信息動(dòng)態(tài)博弈均衡求解的基本思路:不完全信息動(dòng)態(tài)博弈將子博弈精煉 Nash 均衡中“均衡精煉”的思想應(yīng)用到不完全信息擴(kuò)展式博弈中,但是有提前條件:1、對(duì)每個(gè)參與人i ,在其信息集上給出關(guān)于自己位于該信息集中哪一個(gè)決策結(jié)的信念(或推斷 )。2、對(duì)參與人i 的每個(gè)信息集,在給定參與人i在該信息集上的信念( 或推斷) 情況下,參與人的戰(zhàn)略是對(duì)其他參與人戰(zhàn)略的一個(gè)最優(yōu)反應(yīng)。與靜態(tài)博弈不同的是:在觀測(cè)到先行動(dòng)者第一階段選擇后,后行動(dòng)者可以修

36、正對(duì)先行動(dòng)者類型的先驗(yàn)概率,因?yàn)橄刃袆?dòng)者的行動(dòng)可能包含其類型的信息,即行動(dòng)就是類型的反映,不同的行動(dòng)反映不同的類型信息。參與人最初對(duì)于對(duì)手類型信息概率的判斷成為先驗(yàn)概率,對(duì)于根據(jù)行動(dòng)反映出得信息修正后的概率成為后驗(yàn)概率。先驗(yàn)概率 (prior probability):修正之前的判斷;后驗(yàn)概率 (posterior probability):修正之后的判斷先驗(yàn)概率和后驗(yàn)概率的轉(zhuǎn)化是根據(jù)貝葉斯法則計(jì)算:在不完全信息動(dòng)態(tài)博弈博弈均衡解的求解過程中, 如果不可置信的威脅, 均衡就是不合理的, 所以要對(duì)均衡結(jié)果精煉, 剔除那些不可置信的威脅。 從而引入子博弈精練納什均衡的概念, 但是,在不完全信息動(dòng)態(tài)博弈中, 只有一個(gè)子博弈,不能將上述方法直接用于求不完全信息動(dòng)態(tài)博弈的均衡解。合理的均衡應(yīng)該是滿足:給定每一個(gè)參與人有關(guān)其他參與人類型的后驗(yàn)信念,參與人的戰(zhàn)略組合在每一個(gè)后續(xù)博弈上構(gòu)成貝葉斯均衡, 我們將通過這種方式得到的納什均衡稱為精煉貝葉斯納什均衡。精煉貝葉斯均衡是貝葉斯均衡、 子博弈精煉納什均衡和貝葉斯推斷的結(jié)合, 精煉貝葉斯均衡要求:1、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論