版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、博弈論知識(shí)總結(jié)博弈論概述 :1、博弈論概念: 博弈論:就是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問(wèn) 題。博弈論研究的假設(shè):1、決策主體是理性的,最大化自己的收益。2、完全理性是共同知識(shí)3、每個(gè)參與人被假定為可以對(duì)所處環(huán)境以及其他參與者的行為形成正確的信念 與預(yù)期2、和博弈有關(guān)的變量: 博弈參與人:博弈中選擇行動(dòng)以最大化自己受益的決策主體。行動(dòng):參與人的決策選擇戰(zhàn)略:參與人的行動(dòng)規(guī)則, 即事件與決策主體行動(dòng)之間的映射, 也是參與人行動(dòng)的規(guī)則。 信息:參與人在博弈中的知識(shí), 尤其是其他決策主體的戰(zhàn)略、 收益、 類型(不完全信息) 等的信息。完全信息:每個(gè)參與人對(duì)其他參與人的支
2、付函數(shù)有準(zhǔn)確的了解;完美信息:在博 弈過(guò)程的任何時(shí)點(diǎn)每個(gè)參與人都能觀察并記憶之前各局中人所選擇的行動(dòng),否則 為不完美信息。不完全信息:參與人沒(méi)有完全掌握其他參與人的特征、戰(zhàn)略空間及支付函數(shù)等信 息,即存在著有關(guān)其他參與人的不確定性因素。支付:決策主體在博弈中的收益。在博弈中支付是所有決策主題所選擇的行動(dòng)的函數(shù)。 從經(jīng)濟(jì)學(xué)的角度講, 博弈是決策主體之間的相互作用, 因此和傳統(tǒng)個(gè)人決策存在著區(qū)別:3、博弈論與傳統(tǒng)決策的區(qū)別:1、傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個(gè)人決策就是在給定市場(chǎng)價(jià)格、消費(fèi)者收入條件下,最大化自己效用,研究工具是無(wú)差異曲線。可表示為:maxU(Pi),其中P為市場(chǎng)價(jià)格,I為消費(fèi)者可支配收入。2、
3、其他消費(fèi)者對(duì)個(gè)人的綜合影響表示為一個(gè)參數(shù)市場(chǎng)價(jià)格,所以在市場(chǎng)價(jià)格既定下,消費(fèi)者效用只依賴于自己的收入和偏好,不用考慮其他消費(fèi)者的影響。但是在 博弈論理個(gè)人效用函數(shù)還依賴于其他決策者的選擇和效用函數(shù)。4、博弈的表示形式 :戰(zhàn)略式博弈和擴(kuò)展式博弈戰(zhàn)略式博弈 :是博弈問(wèn)題的一種規(guī)性描述,有時(shí)亦稱標(biāo)準(zhǔn)式博弈。戰(zhàn)略式博弈是一種假設(shè)每個(gè)參與人僅選擇一次行動(dòng)或戰(zhàn)略, 并且參與人同時(shí)進(jìn)行選 擇的決策模型, 因此, 從本質(zhì)上來(lái)講戰(zhàn)略式博弈是一種靜態(tài)模型, 一般適用于描述不需 要考慮博弈進(jìn)程的完全信息靜態(tài)博弈問(wèn)題。1、參與人集合 1, 2,.,n :2、每位參與人非空的戰(zhàn)略集Si nsi ( s1 ,., si
4、,., s n )i13、每位 參與人定 義在戰(zhàn) 略組合 上的 效用函 數(shù)Ui(s1,s2,s n).擴(kuò)展式博弈 :是博弈問(wèn)題的一種規(guī)性描述。與戰(zhàn)略式博弈側(cè)重博弈結(jié)果的描述相比, 擴(kuò)展式博弈更注重對(duì)參與人在博弈過(guò)程中 遇到?jīng)Q策問(wèn)題時(shí)序列結(jié)構(gòu)的分析。包含要素:1 、 1, 2,.,n 參與人集合2 、 參與人的行動(dòng)順序, 即每個(gè)參與 人在何時(shí)行動(dòng);3、序列結(jié)構(gòu): 每個(gè)參與人行動(dòng)時(shí)面臨的決策問(wèn)題,包括參與人行動(dòng)時(shí)可供選擇的行動(dòng)方案、所了解的信息;4 、參與人的支付函數(shù)。比較 :1 、戰(zhàn)略式博弈從本質(zhì)上來(lái)講是一種靜態(tài)模型。2、擴(kuò)展式博弈從本質(zhì)上來(lái)講是一種動(dòng)態(tài)模型。5、博弈論分類:按決策主體的行為相互
5、作用時(shí),當(dāng)事人能否達(dá)成一個(gè)具有約束力的協(xié)議可分為:1、合作博弈(強(qiáng)調(diào)團(tuán)體理性、團(tuán)體最優(yōu)決策、效率)2、非合作博弈(強(qiáng)調(diào)個(gè)人理性,個(gè)人最優(yōu)決策)按參與人行動(dòng)先后順序可分為:1、靜態(tài)博弈:博弈中參與人同時(shí)行動(dòng),或者雖然不是同時(shí)行動(dòng),但是在行動(dòng)前不知道其他參與人所選擇的行動(dòng)。2、動(dòng)態(tài)博弈:參與人的行動(dòng)有先后順序,后行動(dòng)者獲得先行動(dòng)者的行動(dòng)信息。按參與人對(duì)信息的掌握程度可分為:1、完全信息:每個(gè)參與人對(duì)其他所有參與人的特征、戰(zhàn)略空間及支付函數(shù)有精確的 了解,博弈開(kāi)始時(shí)不存在不確定性因素。2、不完全信息:參與人沒(méi)有完全掌握其他參與人的特征、戰(zhàn)略空間及支付函數(shù)等信息,即存在著有關(guān)其他參與人的不確定性因素。
6、按決策主體對(duì)信息的掌握程度和行動(dòng)的先后順序,博弈可以分為:完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈。靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈均衡:納什均衡均衡:子博弈精煉納什均衡不完全信息不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈均衡:貝葉斯納什均衡均衡:精煉貝葉斯納什均衡6、根據(jù)所學(xué)這四種博弈的特點(diǎn)對(duì)這四種博弈做一個(gè)對(duì)比分析:類型信息和行動(dòng)特點(diǎn)均衡均衡類型特別均衡求解方法學(xué)過(guò)的例子性質(zhì)完全信 息靜態(tài) 博弈每個(gè)參與人對(duì)其 他所有參與人的 特征、戰(zhàn)略空間及 支付函數(shù)有精確納什均衡純戰(zhàn)略納什均衡(PNE)占優(yōu)戰(zhàn)略納 什均衡(DSE箭頭法劃線法Hotelling價(jià)
7、格競(jìng)爭(zhēng)庫(kù)諾特價(jià)格競(jìng)爭(zhēng)多重性和存在性的了解,博弈開(kāi)始 時(shí)不存在不確定 性因素,參與人同 時(shí)行動(dòng)或者不是 同時(shí)行動(dòng)但是后 行動(dòng)者不知道行 動(dòng)者的行動(dòng)信息。 戰(zhàn)略和行動(dòng)相同。重復(fù)剔除的 占有均衡(IFDE)不斷剔除劣 戰(zhàn)略(弱劣 戰(zhàn)略的剔除 順序會(huì)影響 均衡結(jié)果一般一個(gè)博弈中 存在參與者有多 個(gè)行動(dòng)時(shí)可以先 考慮能否剔除弱 戰(zhàn)略簡(jiǎn)化博弈混合戰(zhàn)略納什均衡(MNE)聚點(diǎn)均衡支付最大化法支付等值法社會(huì)福利博弈小偷-守衛(wèi)博弈完全信 息動(dòng)態(tài) 博弈在博弈開(kāi)始之前 參與人之間的信 息不存在不確定 性,但是參與人行 動(dòng)存在先后順序。在完全信息動(dòng)態(tài) 博弈中,為了表示 參與人之間的信 息掌握關(guān)系,引入 了信息及的概念。
8、子博弈精煉納什均衡子博弈精煉納什均衡有限次重復(fù)博弈均衡與納什均衡 的唯一性有 關(guān)連鎖店悖論1、均衡結(jié) 果是原 博弈的Nash 均 衡;2、同時(shí)在 每一個(gè) 子博弈 上構(gòu)成Nash 均 衡無(wú)限次重復(fù) 博弈均衡(無(wú)名氏定理)與貼現(xiàn)因子, 亠 、/有關(guān)囚徒困境(冷酷 戰(zhàn)略)無(wú)限期輪流討價(jià) 還價(jià)模型一般博弈逆向歸納法求解斯坦科爾伯格寡 頭競(jìng)爭(zhēng)雇主與公會(huì)之間 的競(jìng)爭(zhēng)不完全 信息靜 態(tài)博弈在博弈開(kāi)始之前 參與人之間的信 息存在不確定性, 但是參與人同時(shí) 行動(dòng)或者不是同 時(shí)行動(dòng)但是后行 動(dòng)者不知道行動(dòng) 者的行動(dòng)信息。不確定是參與人 的了性的不確定 性貝葉斯 納什均 衡貝葉斯納什均衡混合戰(zhàn)略(不完全信 息情況下
9、純 戰(zhàn)略均衡的 極限)對(duì)原混合戰(zhàn) 略加入少許 不確定性因 素,求極限。性別戰(zhàn)1、均衡存在 性2、不確定性 體現(xiàn)為類型 的不確定性一般貝葉斯均衡Harsanyi 轉(zhuǎn)換機(jī)制設(shè)計(jì)不完全信息動(dòng)態(tài)博弈在博弈開(kāi)始前參 與人之間的信息 存在不確定性,同 時(shí)參與人行動(dòng)存 在先后順序。不完 全信息動(dòng)態(tài)博弈 過(guò)程不僅是參與 人選擇行動(dòng)的過(guò) 程,而且是參與人 不斷修正信念的 過(guò)程。精煉貝葉斯納什均衡信號(hào)傳遞 博弈分離均衡根據(jù)所得信 息修正判斷 概率,根據(jù) 收益最大化 決策信號(hào)傳遞博弈不完全信息重復(fù)博弈與聲譽(yù)Milgrom-Roberts壟斷限價(jià)模型不完全信息 動(dòng)態(tài)博弈子 博弈精煉納 什均衡與海 薩尼不完全 信息靜態(tài)
10、博 弈貝葉斯均 衡的結(jié)合?;焱鉁?zhǔn)分離均衡二、四種博弈類型具體分述1完全信息靜態(tài)博弈1.1完全信息靜態(tài)博弈特點(diǎn):每個(gè)參與人對(duì)其他所有參與人的特征、戰(zhàn)略空間及支付 函數(shù)有精確的了解,博弈開(kāi)始時(shí)不存在不確定性因素,參與人同時(shí)行動(dòng)或者不是同時(shí)行 動(dòng)但是后行動(dòng)者不知道行動(dòng)者的行動(dòng)信息。戰(zhàn)略和行動(dòng)相同。1.2 完全信靜態(tài)博弈相關(guān)概念:以新產(chǎn)品開(kāi)發(fā)博弈舉例說(shuō)明:參與人:參與人1和2。參與人的集合卡表示為:r =1,2, -n表示所有參與人的集合,在新產(chǎn)品開(kāi)發(fā)博弈中為:r =1,2行動(dòng):開(kāi)發(fā)、不開(kāi)發(fā)。Ai表示參與人行動(dòng)的集合。新產(chǎn)品開(kāi)發(fā)博弈中參與人的行動(dòng)集合為A1=A2=a,b,其中a為開(kāi)發(fā),b為不開(kāi)發(fā)。
11、a=a1,a2an表示參與人的行動(dòng)組合。新產(chǎn)品開(kāi)發(fā)博弈中為:A= ( a,a) ,(a,b),(b,a),(b,b)戰(zhàn)略:參與人的行動(dòng)規(guī)則。在博弈中的戰(zhàn)略可以定義為從觀測(cè)集到行動(dòng)集的映射關(guān)系,即:Si:X Ai。用Si=si表示參與人所有戰(zhàn)略的集合。在n人博弈中,用S=(Sl,S2,S3,Sn)表示n個(gè)參與人的戰(zhàn)略組合,它表示博弈中每個(gè)參與 人采取戰(zhàn)略 si 的一種博弈情形。在完全信息靜態(tài)博弈中,由于不存在決策時(shí)序上的差異,所有參與人在同一決策時(shí)點(diǎn)即 博弈開(kāi)始的那一時(shí)刻決策,因此,所有參與人面臨的決策情形都只有一種,所以, 參與人的戰(zhàn)略集與行動(dòng)集相同。支付 :是指參與人在博弈中的所得。 一般情
12、況下也是用效用函數(shù)來(lái)表示參與人在博弈中 的所得。 因此, 參與人的支付就可表示為一種特定博弈情形下參與人得到的確定效用水平或 期望效用水平。支付一般用ui(1,2,n)表示參與人i的支付(效用水平),支付組合u=(u1,u2un) 表示參與人在特定博弈情形下所得到的支付,其中為參與人i 的支付。因此,參與人i=(i=1,2,n)的支付就可表示為:ui=ui(si ,s-i).信息 :是參與人所具有的有關(guān)博弈的所有知識(shí),如有關(guān)其它參與人行動(dòng)或戰(zhàn)略的知識(shí)、 有關(guān)參與人支付的知識(shí)等等。在“新產(chǎn)品開(kāi)發(fā)博弈”中,如果兩個(gè)企業(yè)都知道市場(chǎng)需求,那 么這樣的博弈情形就是我們前面所提到的完全信息假設(shè); 如果兩個(gè)
13、企業(yè)中至少有一個(gè)不知道 市場(chǎng)需求,那么這樣的博弈情形就是我們前面所提到的不完全信息假設(shè)。1.3 純戰(zhàn)略納什均衡純戰(zhàn)略 :參與人在給定信息下只選擇一種特定(或確定性)的戰(zhàn)略混合戰(zhàn)略: 混合戰(zhàn)略解釋了一個(gè)參與人對(duì)其他參與人所采取的行動(dòng)的不確定性,它描述了參與人在給定信息下以某種概率分布隨機(jī)地選擇不同的行動(dòng)或戰(zhàn)略。純戰(zhàn)略納什均衡中包括:占有均衡、重復(fù)剔除劣戰(zhàn)略均衡、一般純戰(zhàn)略納什均衡等。1 、占優(yōu)均衡占優(yōu)戰(zhàn)略:參與人的最優(yōu)戰(zhàn)略si *與其他參與人的選擇s無(wú)關(guān)。無(wú)論其他參與人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略總是唯一的,這樣的最優(yōu)戰(zhàn)略稱之為“占優(yōu)戰(zhàn)略”。在n人博弈中,如果對(duì)于所有的其他參與人的選擇s-i,
14、 si *都是參與人i的最優(yōu)選擇*ui(si*,s i) ui(si,s i)則稱 si *為參與人的占優(yōu)戰(zhàn)略。在 n 人博弈中, 如果對(duì)所有參與人都存在占優(yōu)戰(zhàn)略 si *,則占優(yōu)戰(zhàn)略組合 si*=(s1 * si2*, , sn *)稱為占優(yōu)戰(zhàn)略均衡。如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么占優(yōu)戰(zhàn)略均衡就是唯一 的所有理性參與人可以預(yù)測(cè)到的博弈結(jié)果。2、重復(fù)剔除劣戰(zhàn)略i 存在兩個(gè)戰(zhàn)略,其中一如果在一個(gè)博弈中,參與人不存在占優(yōu)戰(zhàn)略,但是參與人 ui(si ,s i) ui (si ,s i)個(gè)戰(zhàn)略叫另一個(gè)戰(zhàn)略的所得效用要大,則理性的參與人絕對(duì)不會(huì)選擇戰(zhàn)略。ui(si ,s i) ui(si ,s
15、i) 嚴(yán)格劣戰(zhàn)略 :u(si ,s i ) u i (si ,s i ) 弱劣戰(zhàn)略 :若重復(fù)剔除過(guò)程一直可持續(xù)到只剩下唯一的戰(zhàn)略組合,則該戰(zhàn)略組合即為重復(fù)剔除 的占優(yōu)均衡,此時(shí)該博弈是重復(fù)剔除戰(zhàn)略可解。要點(diǎn):再重復(fù)剔除過(guò)程中,如果每次剔除的是嚴(yán)格劣戰(zhàn)略,均衡結(jié)果與剔除順序無(wú) 關(guān);如果剔除的是弱劣戰(zhàn)略,均衡結(jié)果可能與剔除順序有關(guān)。3、一般 Nash 均衡Nash均衡是完全信息靜態(tài)博弈的解的概念,在完全信息靜態(tài)博弈中, 構(gòu)成Nash均衡的戰(zhàn)略是不可剔除的,即不存在任何一個(gè)戰(zhàn)略嚴(yán)格優(yōu)于Nash均衡戰(zhàn)略。求解納什均衡的方法劃線法、箭頭法。劃線法 :1、考察參與人 1 的最優(yōu)戰(zhàn)略2、 用上述方法找出參與
16、人2 的最優(yōu)戰(zhàn)略3、找出最優(yōu)戰(zhàn)略組合箭頭法:1、對(duì)于每個(gè)戰(zhàn)略組合,檢查是否有參與人會(huì)偏離這個(gè)戰(zhàn)略組合2、直至找出沒(méi)有參與人會(huì)偏離的戰(zhàn)略組合純戰(zhàn)略均衡反映函數(shù) :各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng)。1.4 混合戰(zhàn)略納什均衡混合戰(zhàn)略:在博弈 G ;S,,Sn;Ui,山中,對(duì)任一參與人i,設(shè)Si=Si1,Sik,則參與人i的一個(gè)混合戰(zhàn)略為定義在戰(zhàn)略集Si上的一個(gè)概率分布3i= S i 1,S i k,其中S ij(j=1,k )表示參與人i選擇戰(zhàn)略 表示參與人i選擇戰(zhàn)略S"的概率的概率,即S iJ滿足OWS ij W 1,其中概率之和為 1。支付:混合戰(zhàn)略的支付為各種概率下收益的
17、加權(quán)平均?;旌蠎?zhàn)略納什均衡:在博弈G Sn;5,Un中,混合戰(zhàn)略組合S i= S 1*,S n*為一個(gè)Nash* * *均衡。當(dāng)且僅當(dāng) i , i i,有vi( i, i) v( i, i )?;旌蠎?zhàn)略 Nash 均衡的求解:1. 支付最大化法;2. 支付等值法;混合戰(zhàn)略均衡反映函數(shù): 在混合策略的疇,博弈方的決策是選擇概率分布, 因此, 反應(yīng)函數(shù) 就是一方對(duì)另一方選擇的概率分布的反應(yīng)。聚點(diǎn)均衡: 在現(xiàn)實(shí)生活中, 參與人可能使用某些被博弈模型抽象掉的信息來(lái)達(dá)到一個(gè) “聚點(diǎn)” 均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過(guò)去博弈的歷史有關(guān)。不同均衡概念之間的關(guān)系:占優(yōu)均衡 重復(fù)剔除劣戰(zhàn)略均衡 純戰(zhàn)略
18、納什均衡 混合戰(zhàn)略納什均衡1.5 納什均衡的多重性與存在性存在性:每個(gè)有限戰(zhàn)略式博弈(參與人與相應(yīng)的戰(zhàn)略集均為有限)必存在納什均衡,這個(gè)均衡可能是純戰(zhàn)略納什均衡,也可能是混合戰(zhàn)略納什均衡。多重性: 一個(gè)博弈可能有多個(gè)均衡, 博弈論并沒(méi)有一個(gè)一般的理論證明, 哪一個(gè)納什均衡結(jié) 果一定能出現(xiàn)。2、完全信息動(dòng)態(tài)博弈2.1 完全信息動(dòng)態(tài)博弈特點(diǎn): 在博弈開(kāi)始之前參與人之間的信息不存在不確定性,但是參 與人行動(dòng)存在先后順序。在完全信息動(dòng)態(tài)博弈中,為了表示參與人之間的信息掌握關(guān)系,引入了信息及的概念。2.2 完全信息動(dòng)態(tài)博弈有關(guān)概念:信息集 :信息集 Ii 是參與人 i 決策結(jié)的一個(gè)集合,它滿足以下兩個(gè)條
19、件:1、 I i中的每個(gè)決策結(jié)都是參與人i的決策結(jié);2、當(dāng)博弈到達(dá) I i 時(shí),參與人 i 知道自己處在該信息集中的某個(gè)決策結(jié),但不知道是哪 一個(gè)。在博弈樹(shù)中,屬于同一信息集的決策結(jié)一般用虛線連接起來(lái)。結(jié) :包括決策結(jié)和終點(diǎn)結(jié)兩類。 決策結(jié)是參與人采取行動(dòng)的點(diǎn)時(shí)點(diǎn), 終點(diǎn)結(jié)是博弈行動(dòng)路 徑的終點(diǎn)。一個(gè)信息集可能只包含一個(gè)決策結(jié), 也可能包含多個(gè)決策結(jié)。 如果只包含一個(gè)決策結(jié)的信息集就是但單結(jié)信息集。如果博弈中所有信息集都是單結(jié)的則成為完美信息博弈。子博弈:是原博弈的一部分,它始于原博弈中一個(gè)單結(jié)信息集中的決策結(jié)x,并由決策結(jié)x 及其后續(xù)結(jié)共同組成。1、子博弈可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析,并且
20、與原博弈具有相同的信 息結(jié)構(gòu);2、原博弈可以作為自身的一個(gè)子博弈;2.3 不完全信息靜態(tài)博弈均衡子博弈精煉 Nash 均衡:解決Nash均衡多重性問(wèn)題的一種主要方法就是精煉的方法,即在Nash均衡的基礎(chǔ)上,通過(guò)定義更加合理的博弈解并剔除不合理的均衡。子博弈精煉納什均衡的引入就是將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔 除,從而給出動(dòng)態(tài)博弈結(jié)果的一個(gè)合理預(yù)測(cè)。 即子博弈精煉納什均衡要求均衡戰(zhàn)略的行為規(guī) 則在每個(gè)信息集上都是最優(yōu)的。擴(kuò)展式博弈的戰(zhàn)略組合s*(s;,., S:),是一個(gè)子博弈精煉 Nash均衡,當(dāng)且僅當(dāng)滿足以下條件:1 、是原博弈的 Nash 均衡2、在每一個(gè)子博弈上構(gòu)成Nas
21、h均衡一個(gè)戰(zhàn)略組合是子博弈精煉 Nash 均衡當(dāng)且僅當(dāng)它對(duì)所有的子博弈 ( 包括原博弈 ) 構(gòu)成 Nash 均衡,同時(shí)也意味著原博弈的 Nash 均衡并不一定是子博弈精煉 Nash 均衡,除非它還 對(duì)所有子博弈構(gòu)成 Nash均衡。2.4 不完全信息靜態(tài)博弈均衡求解逆推歸納法逆推歸納法是最常用的求解子博弈精煉 Nash 均衡的方法,其步驟為:其中r (x)代表博弈中由最底層到博弈起點(diǎn)的順序,以r(x»為最底層,則有:1、找出博弈的所有子博弈;2、按照博弈進(jìn)程的“反方向”逐一求解各個(gè)子博弈,即最先求解最底層的子博弈,再求解上一層的子博弈, ,直至原博弈。由于逆推歸納法對(duì)各個(gè)子博弈逐一進(jìn)行
22、求解, 因此,逆推歸納法所得到的解在各子博弈 上構(gòu)成Nash均衡,即意味著逆推歸納法所得的解為子博弈精煉納什均衡2.5 完全信息動(dòng)態(tài)博弈中承諾行動(dòng)的均衡結(jié)果分析:承諾行動(dòng): 就是在博弈開(kāi)始之前參與人采取某種改變自己支付或戰(zhàn)略空間的行動(dòng),該行動(dòng)使原本不可信的威脅變得可信。但是參與人的承諾行動(dòng)是有成本的,否則這種承諾就不可信。例子 :要挾訴訟要挾訴訟就是指那種原告幾乎不可能勝訴而其惟一的目的是希望通過(guò)私了而得到一筆 賠償?shù)脑V訟。 該博弈的結(jié)果為原告選擇不指控, 博弈結(jié)束。 博弈的結(jié)果似乎與人們觀測(cè)到的 現(xiàn)實(shí)并不相符,因?yàn)楝F(xiàn)實(shí)中人們常常看到各種“要挾”發(fā)生。在上述模型中,“要挾”之所以沒(méi)有成功,關(guān)鍵
23、在于原告將會(huì)起訴的威脅并不可信。要是威脅變得可信, 就必須采取承諾行動(dòng) (沉沒(méi)成本) 。這樣參與人的威脅就會(huì)變得可 信,從而使其他博弈參與人改變策略。2.6 重復(fù)博弈議題:1、將來(lái)可信的威脅或承諾如何影響到當(dāng)前的行動(dòng)2、在一次博弈中無(wú)法實(shí)現(xiàn)的均衡,在重復(fù)博弈中能否實(shí)現(xiàn)有限次重復(fù)博弈:對(duì)于給定的階段博弈 G令G(T)表示G重復(fù)進(jìn)行T次的有限重復(fù)博弈, 并且在下一次博弈開(kāi)始前,所有以前博弈的進(jìn)程都可被觀測(cè)到。有限次重復(fù)博弈均衡結(jié)論 :如果階段博弈 G有唯一的Nash均衡,則對(duì)任意有限的 T,重復(fù)博弈G(T)有唯一的子 博弈精煉解,即G的Nash均衡結(jié)果在每一個(gè)階段重復(fù)進(jìn)行。而且在有限次重復(fù)博弈中,
24、 如果在單階段博弈中均衡解不只有一個(gè), 則對(duì)將來(lái)行動(dòng)所作 的可信威脅或承諾可以影響到當(dāng)前的行動(dòng)。無(wú)限次重復(fù)博弈:給定一階段博弈 G令G( 0, 3 )表示相應(yīng)的無(wú)限重復(fù)博弈,其中G將無(wú)限次的重復(fù)進(jìn)行,且參與人的貼現(xiàn)率為。對(duì)每個(gè) t ,之前 t -1 次階段博弈的結(jié)果在 t 階段開(kāi)始進(jìn)行前都可以被觀測(cè)到,每個(gè)參與人在 G( 0,3 )中的收益都是該參與人在無(wú)限次的階段博弈中所得收益的現(xiàn)值。無(wú)限次重復(fù)博弈的解無(wú)名氏定理:令G為一個(gè)n人階段博弈,令(e1,e2,en )為G的一個(gè)Nash均衡下的收益,且用(x1,x2,xn)表示G的其它任何可行收益,表示可行收益的集合。若存在xiei, 對(duì) i,xi
25、 X則存在貼現(xiàn)率3,使無(wú)限重復(fù)博弈G(0, 3 )存在一個(gè)子博弈精煉 Nash 均衡,其平均收益可達(dá)到 (x1,x2, ,xn) 。無(wú)名氏定理的解釋 :在無(wú)限次重復(fù)博弈中,如果參與人具有足夠的耐心(只要滿足一定的條件),那么任何滿足個(gè)人理性的可行收益向量都可以通過(guò)一個(gè)特定的子博弈精煉Nash均衡得到。影響重復(fù)博弈結(jié)果的因素 :影響重復(fù)博弈結(jié)果的是重復(fù)的次數(shù)和信息的完備性。2.7 子博弈精煉 Nash 均衡與 Nash 均衡的區(qū)別:由于子博弈精煉 Nash 均衡在任一決策結(jié)上都能給出最優(yōu)決策,這也使得子博弈精煉納 什均衡不僅在均衡路徑 (即均衡戰(zhàn)略組合所對(duì)應(yīng)的路徑 )上給出參與人的最優(yōu)選擇, 而
26、且在非 均衡路徑 (即除均衡路徑以外的其它路徑 )上也能給出參與人的最優(yōu)選擇。即子博弈精煉 Nash均衡不會(huì)含有參與人在博弈進(jìn)程中不合理的、不可置信的行動(dòng)。3、不完全信息靜態(tài)博弈31 不完全信息靜態(tài)博弈特點(diǎn): 在博弈開(kāi)始之前參與人之間的信息存在不確定性,但是 參與人同時(shí)行動(dòng)或者不是同時(shí)行動(dòng)但是后行動(dòng)者不知道行動(dòng)者的行動(dòng)信息。在不完全信息靜態(tài)博弈中, 在博弈開(kāi)始前存在關(guān)于博弈人信息的不確定性, 這個(gè)不確定 像通常是博弈參與人的類型。在市場(chǎng)進(jìn)入博弈中不完全信息表現(xiàn)為:在位者的成本類型(高成本、低成本) 在斗雞博弈中不完全信息表現(xiàn)為:參與人的性格類型(強(qiáng)硬,軟弱)3.2 海薩尼轉(zhuǎn)換由于在不完全信息靜
27、態(tài)博弈中, 參與人的類型存在不確定性, 所以當(dāng)一個(gè)參與人并不知 道在與誰(shuí)博弈時(shí), 博弈的規(guī)則是無(wú)法定義的, 海薩尼提出了海薩尼轉(zhuǎn)換解決這種不確定的問(wèn) 題。解決方法 :海薩尼指出, 引入虛擬參與人自然, 由自然先決定參與人的不同類型, 將不完 全信息博弈轉(zhuǎn)換為不完美信息博弈 。海薩尼通過(guò)引入“虛擬”參與人,將博弈的起始 點(diǎn)提前, 從而將原博弈中參與人的事前不確定性轉(zhuǎn)變?yōu)椴┺拈_(kāi)始后的不確定性。 這種通 過(guò)引入“虛擬”參與人來(lái)處理不完全信息博弈問(wèn)題的方法稱為 Harsanyi 轉(zhuǎn)換。海薩尼轉(zhuǎn)換注意要點(diǎn):1、海薩尼轉(zhuǎn)換規(guī)定:參與人關(guān)于“自然”選擇的推斷為共同知識(shí)。2、“自然”的選擇。在一般的不完全信息
28、博弈問(wèn)題中,Harsanyi 轉(zhuǎn)換規(guī)定“自然”選擇的是參與人的類型 (type) 。除了根據(jù)參與人的支付來(lái)劃分參與人的類型以外, 還可以 根據(jù)參與人的行動(dòng)空間,甚至根據(jù)參與人掌握信息的多少 ( 或程度 ) 來(lái)劃分參與人的類 型。3、參與人關(guān)于“自然”選擇的推斷是基于自己類型判斷的條件概率。3.3 不完全信息靜態(tài)博弈均衡貝葉斯納什均衡貝葉斯博弈的定義:貝葉斯博弈包含以下五個(gè)要素:1、參與人集合Br =1,2,,n2、參與人的類型集合 Ti,,T23、參與人關(guān)于其他參與人類型的推斷P1(t -1 |t 1) , ,Pn(t -1n|t n)4、參與人類型相依的行動(dòng)集A(t 1), , A(t n)
29、5、參與人類型相依的支付函數(shù)貝葉斯博弈的戰(zhàn)略:在貝葉斯博弈 G= r ;(Ti); ( Pi); (A (ti); ( ui (a (t); ti) 中,參與人i的一個(gè)戰(zhàn)略是從參與人的類型集 T到其行動(dòng)集的一個(gè)函數(shù) si(t i);它包含 了當(dāng)自然賦予i的類型為ti時(shí),i將從可行的行動(dòng)集 A(t i)中選擇的行動(dòng)。貝葉斯博弈的時(shí)間順序1、 “自然”選擇參與人的類型組合t=(t 1,,tn)2、 參與人同時(shí)選擇行動(dòng),每個(gè)參與人i 從行動(dòng)集 Ai(t i )中選擇行動(dòng) ai(t i )3、參與人 i 得到 支付貝葉斯納什均衡 :在貝葉斯博弈中,對(duì)于一個(gè)理性的參與人 i ,當(dāng)他只知道自己的類型ti而
30、不知道其他參與人的類型時(shí),給定其他參與人的戰(zhàn)略S-i ,他將選擇使自己期望效用(支付)最大化的行動(dòng)a(ti),其中ai(ti) arg ami aAix(ti)vi(ai,s i;ti)貝葉斯博弈納什均衡的存在性 :一個(gè)有限的貝葉斯博弈一定存在貝葉斯Nash均衡。3.4 貝葉斯博弈與混合戰(zhàn)略均衡(關(guān)于混合戰(zhàn)略納什均衡的一個(gè)解釋)首先,混合策略均衡不是現(xiàn)實(shí)生活的一個(gè)合理描述,人們并不是根據(jù)概率分布來(lái)選擇 自己行動(dòng);海薩尼證明,在完全信息情況下的混合策略均衡可以解釋為不完全信息情況下 純策略均衡的極限。混合策略的本質(zhì):混合策略的本質(zhì)不在于參與人隨機(jī)的選擇行動(dòng),而在于他不能確定其他參與人將選擇 什么
31、純策略,這種不確定性可能來(lái)自于參與人不知道其他參與人的類型。海薩尼的基本思想:只要在原來(lái)的博弈中加入少許不完全信息因素,使得參與人的支付函數(shù)中的收益不再 是確定的,而是和一個(gè)有圍的不確定參數(shù)有關(guān),從而通過(guò)將混合戰(zhàn)略均衡求解轉(zhuǎn)換為貝葉 斯均衡的極限解,但是得到的純戰(zhàn)略貝葉斯均衡就與完全信息下的混合戰(zhàn)略均衡相似。結(jié)論:完全信息博弈的混合戰(zhàn)略 Nash均衡可以解釋為與之密切相關(guān)、存在一點(diǎn)點(diǎn)非 完全信息的純戰(zhàn)略貝葉斯 Nash 均衡。同時(shí)海薩尼給出了描述混合策略和純策略之間關(guān)系的 一個(gè)正式的定理:混合策略均衡的純化定理。3.5 貝葉斯均衡 Eg: 機(jī)制設(shè)計(jì)問(wèn)題機(jī)制設(shè)計(jì)問(wèn)題實(shí)際上就是探討設(shè)計(jì)者如何向參與
32、人提供激勵(lì),以促使參與人向設(shè)計(jì)者透露其掌握的信息(說(shuō)真話) ,從而確定對(duì)設(shè)計(jì)者有利的結(jié)果的問(wèn)題。這一機(jī)制對(duì) 應(yīng)于一個(gè)博弈形式, 設(shè)計(jì)者需要設(shè)計(jì)出一個(gè)博弈形式, 讓參與人在這個(gè)博弈形式下進(jìn) 行博弈從而實(shí)現(xiàn)他的目標(biāo)。 博弈形式不同, 實(shí)現(xiàn)目標(biāo)的程度也不一樣, 設(shè)計(jì)者必須選 擇對(duì)他來(lái)說(shuō)是最有利的博弈形式,即最有利的機(jī)制。機(jī)制設(shè)計(jì)的基本模型:機(jī)制設(shè)計(jì)是典型的 3 階段不完全信息博弈,期階段如下:階段 1:機(jī)制設(shè)計(jì)者 (委托人 )設(shè)計(jì)一種“機(jī)制”,或者“契約”,或者“激勵(lì)方案”;階段 2:代理人選擇接受或拒絕該機(jī)制,拒絕的代理人得到某個(gè)外生的“保留效 用”;階段 3:接受機(jī)制的代理人選擇自己的行動(dòng) (或
33、者戰(zhàn)略 ) ,實(shí)現(xiàn)一個(gè)博弈結(jié)果。機(jī)制設(shè)計(jì)模型中的有關(guān)概念 :參與約束:由于代理人在第二階段總可以選擇不接受該機(jī)制從而獲得一個(gè)保留效用, 因此,代理人接受這個(gè)機(jī)制獲得的效用必須不小于拒絕這個(gè)機(jī)制時(shí)獲得的效用。激勵(lì)相容約束: 這意味著, 對(duì)于代理人而言, 代理人真實(shí)報(bào)告自己的類型時(shí)獲得的效 用必須不小于謊報(bào)自己類型時(shí)獲得的效用。可行機(jī)制:滿足參與約束的機(jī)制被稱為可行機(jī)制。可實(shí)施機(jī)制:滿足激勵(lì)相容約束的機(jī)制稱為可實(shí)施機(jī)制可行的可實(shí)施機(jī)制:如果一個(gè)機(jī)制既滿足參與約束,又滿足激勵(lì)相容約束。機(jī)制設(shè)計(jì)的目的:機(jī)制設(shè)計(jì)的目的就是要設(shè)計(jì)出可行的可實(shí)施機(jī)制, 從而在該機(jī)制中找出最優(yōu)規(guī)則以追 求最大化收益。4、不完
34、全信息動(dòng)態(tài)博弈4.1 不完全信息動(dòng)態(tài)博弈特點(diǎn): 在博弈開(kāi)始之前參與人之間的信息存在不確定性,同時(shí) 參與人行動(dòng)存在先后順序。 不完全信息動(dòng)態(tài)博弈過(guò)程不僅是參與人選擇行動(dòng)的過(guò)程, 而 且是參與人不斷修正信念的過(guò)程。4.2 不完全信息動(dòng)態(tài)博弈的有關(guān)概念類型 :是指參與者的類型。在不完全信息動(dòng)態(tài)博弈中自然首先選擇參與人的類型。 動(dòng)態(tài)博弈:行動(dòng)有先有后。所以后行動(dòng)者可以觀察到先行動(dòng)者的行動(dòng)信息,從而可以 修正自己對(duì)于參與人的類型的信息的判斷。類型相依:參與者的行動(dòng)傳遞著有關(guān)自己的類型的信息,對(duì)方可通過(guò)參與人的行動(dòng)來(lái)推斷自己的最優(yōu)行動(dòng)。 先行動(dòng)者預(yù)測(cè)到自己的行動(dòng)被后行動(dòng)者利用, 就會(huì)設(shè)法傳遞對(duì)自己最有利的
35、信息。4.3 不完全信息動(dòng)態(tài)博弈的納什均衡一一精煉貝葉斯均衡對(duì)應(yīng)于不完全信息動(dòng)態(tài)博弈的納什均衡稱為精煉貝葉斯均衡;精練貝葉斯均衡是澤爾騰不完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡與海薩尼不完全信息靜態(tài)博弈貝葉斯均 衡的結(jié)合。1、不完全信息動(dòng)態(tài)博弈均衡求解的基本思路:不完全信息動(dòng)態(tài)博弈將子博弈精煉Nash均衡中“均衡精煉”的思想應(yīng)用到不完全信息擴(kuò)展式博弈中,但是有提前條件:1、 對(duì)每個(gè)參與人i,在其信息集上給出關(guān)于自己位于該信息集中哪一個(gè)決策結(jié)的信念 (或推斷)。2、 對(duì)參與人i的每個(gè)信息集,在給定參與人i在該信息集上的信念(或推斷)情況下, 參與人的戰(zhàn)略是對(duì)其他參與人戰(zhàn)略的一個(gè)最優(yōu)反應(yīng)。與靜態(tài)博弈不
36、同的是: 在觀測(cè)到先行動(dòng)者第一階段選擇后, 后行動(dòng)者可以修正對(duì)先行動(dòng)者類型的先驗(yàn)概率, 因?yàn)橄刃袆?dòng)者的行動(dòng)可能包含其類型的信息,即行動(dòng)就是類型的反映,不同的行動(dòng)反映不同的類型信息。參與人最初對(duì)于對(duì)手類型信息概率的判斷成為先驗(yàn)概率,對(duì)于根據(jù)行動(dòng)反映出得信息修正后的概率成為后驗(yàn)概率。先驗(yàn)概率(prior probability):修正之前的判斷;后驗(yàn)概率(posterior probability):修正之后的判斷先驗(yàn)概率和后驗(yàn)概率的轉(zhuǎn)化是根據(jù)貝葉斯法則計(jì)算:Pr(A|H) = FT而K 乙31型在不完全信息動(dòng)態(tài)博弈博弈均衡解的求解過(guò)程中,如果不可置信的威脅,均衡就是不合理的,所以要對(duì)均衡結(jié)果精煉,剔除那些不可置信的威脅。從而引入子博弈精練納 什均衡的概念,但是,在不完全信息動(dòng)態(tài)博弈中,只有一個(gè)子博弈,不能將上述方法直接用于求不完全信息動(dòng)態(tài)博弈的均衡解。參與人的合理的均衡應(yīng)該是滿足: 給定每一個(gè)參與人有關(guān)其他參與人類型的后驗(yàn)信念,戰(zhàn)略組合在每一個(gè)后續(xù)博弈上構(gòu)成貝葉斯均衡,我們將通過(guò)這種方式得到的納什均衡稱為精 煉貝葉斯納什均衡。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人旅游資金過(guò)橋借款協(xié)議2篇
- 2025年物流企業(yè)產(chǎn)品研發(fā)與技術(shù)支持合同3篇
- 二零二五版門衛(wèi)人員勞動(dòng)合同及職業(yè)素養(yǎng)提升協(xié)議4篇
- 2025年物業(yè)管理公司風(fēng)險(xiǎn)管理與保險(xiǎn)采購(gòu)合同3篇
- 2025年度個(gè)人信用卡透支額度調(diào)整協(xié)議3篇
- 2025年金融產(chǎn)品銷售擔(dān)保合同書規(guī)范文本2篇
- 建設(shè)公司合同范本(2篇)
- 2025年度園林苗木繁育與推廣合作協(xié)議4篇
- 2024年重慶高職分類考試《電工基礎(chǔ)》備考試題庫(kù)大全-下(判斷、填空題)
- 二零二五版酒店客房家具更換分期支付合同3篇
- 國(guó)家自然科學(xué)基金項(xiàng)目申請(qǐng)書
- 電力電纜故障分析報(bào)告
- 中國(guó)電信網(wǎng)絡(luò)資源管理系統(tǒng)介紹
- 2024年浙江首考高考選考技術(shù)試卷試題真題(答案詳解)
- 《品牌形象設(shè)計(jì)》課件
- 倉(cāng)庫(kù)管理基礎(chǔ)知識(shí)培訓(xùn)課件1
- 藥品的收貨與驗(yàn)收培訓(xùn)課件
- GH-T 1388-2022 脫水大蒜標(biāo)準(zhǔn)規(guī)范
- 高中英語(yǔ)人教版必修第一二冊(cè)語(yǔ)境記單詞清單
- 政府機(jī)關(guān)保潔服務(wù)投標(biāo)方案(技術(shù)方案)
- HIV感染者合并慢性腎病的治療指南
評(píng)論
0/150
提交評(píng)論