版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四部份:不完全資訊動(dòng)態(tài)賽局第八章:不完全資訊動(dòng)態(tài)賽局第一節(jié):信念與信念一致性本書第五章定義行動(dòng)有先後順序的詳盡式賽局以及SPNE概念。但是對(duì)於有些詳盡式賽局,SPNE概念還是無法幫助我們求解,現(xiàn)以下例說明之。再回到緊臨校園的獨(dú)佔(zhàn)飲食店與潛在競(jìng)爭(zhēng)廠商的賽局。假設(shè)排骨大王M廠商是原來的獨(dú)佔(zhàn)廠商,而另外有兩家可能進(jìn)入的潛在競(jìng)爭(zhēng)者,其中PH廠商的專長(zhǎng)是50元匹薩,BN廠商的專長(zhǎng)是牛肉麵。在賽局的一開始,PH廠商有三種選擇:自行開店賣匹薩 下畫線的粗體字表示策略。、不進(jìn)入市場(chǎng)、以及邀約BN廠商結(jié)盟一起進(jìn)入市場(chǎng)。不論P(yáng)H廠商是否進(jìn)入,BN廠商也要選擇在校園旁開店賣牛肉麵,或是不進(jìn)入市場(chǎng);而如果收到PH廠
2、商的邀約,BN廠商可以選擇同意參加結(jié)盟或是拒絕。在上述況組合中,原來獨(dú)佔(zhàn)的M廠商可以區(qū)分出以下可能情況:沒有對(duì)手進(jìn)入,校園旁有兩家新店快要開張,或是校園旁只有一家新店快要開張。事實(shí)上,一家新店又有三種可能:是牛肉麵店、是牛肉麵與披薩結(jié)盟店,或是披薩店。其中單獨(dú)一家披薩店又有兩種可能性:是PH店一開始就選擇自行進(jìn)入;或是PH店邀約BN店結(jié)盟並遭到拒絕後再?zèng)Q定自行進(jìn)入。不論如何,只要有新店開張,M廠商就必須要決定是採(cǎi)取積極的市場(chǎng)策略反擊對(duì)手(例如展開價(jià)格戰(zhàn)、增加商品的種類,贈(zèng)送積點(diǎn)折扣券等),還是要和平共存,容忍對(duì)手的存在。以上互動(dòng)情況可以表達(dá)為下列動(dòng)態(tài)不完全資訊賽局。練習(xí):請(qǐng)寫出下列賽局中PH、
3、BN、和M三名參賽者的單純策略集合,試為每位參賽者寫出一個(gè)混合策略。 PH 披薩 不進(jìn)入 結(jié)盟BN BN BN 牛肉麵 不進(jìn)入 牛肉麵 不進(jìn)入 結(jié)盟 拒絕 0 PH 0 8 披薩 不進(jìn)入 0 M M M M M 08 反擊 容忍 反擊 容忍 反擊 容忍 反擊 容忍 反擊 容忍 1 4 2 4 0 0 3 6 1 22 2 0 0 1 5 1 3 0 01 1 1 4 4 3 2 1 4 3 圖此賽局沒有適當(dāng)子賽局proper subgame,因此無法求解SPNE子賽局完美均衡。賽局中M廠商有兩個(gè)資訊集合,寫成,我們將第二個(gè)資訊集合所包含的四點(diǎn)寫做,其中a點(diǎn)是PH店一開始就自行進(jìn)入,b點(diǎn)是只有B
4、N牛肉麵店進(jìn)入,c點(diǎn)則是PH和BN結(jié)盟一起進(jìn)入,d點(diǎn)則是PH提出結(jié)盟邀約遭到BN拒絕後,PH仍然單獨(dú)進(jìn)入開設(shè)披薩店。本書前面只講到包含四點(diǎn)表示M廠商無法區(qū)別a、b、c、d四點(diǎn)所代表的狀況?,F(xiàn)在我們進(jìn)一步定義M廠商在資訊集合上的信念belief 信念也可以稱為是參賽者的想法、判斷。 就是一個(gè)機(jī)率分配,例如表示M廠商認(rèn)為自己置身於a、b、c、d定義:令為詳盡式賽局中的任一個(gè)資訊集合,則是定義在上的信念表示對(duì)所有,並且。機(jī)率分配表示M廠商判斷他在資訊集合上的可能位置,M廠商也用來計(jì)算他在資訊集合選擇不同行動(dòng)所能得到的預(yù)期報(bào)酬,寫成,表示當(dāng)?shù)竭_(dá)資訊集合,對(duì)內(nèi)各點(diǎn)的判斷是時(shí),M選擇“反擊”會(huì)得到的預(yù)期報(bào)
5、酬,同理可算出。但是的信念是否合理?賽局理論認(rèn)為參賽者應(yīng)該根據(jù)事前機(jī)率、對(duì)手的策略再運(yùn)用統(tǒng)計(jì)學(xué)的貝氏法則(Bayes rule)來計(jì)算一致信念(consistent belief)。在說明計(jì)算一致性信念之前,我們先定義參賽者的行為策略。在詳盡式賽局中,混合策略的概念太複雜,難以應(yīng)用。上例中BN廠商的單純策略集合包含8個(gè)元素,而BN廠商的一個(gè)混合策略則是一組機(jī)率分配,。我們一般不用如此複雜的混合策略,而行為策略則是考慮參賽者在他的每一個(gè)資訊集合隨機(jī)選擇行動(dòng)。例如圖的賽局中BN廠商有三個(gè)資訊集合,。行為策略說明BN廠商在選擇的機(jī)率分別是,在選擇的機(jī)率是,在選擇的機(jī)率是。再假設(shè)PH廠商的行為策略說明
6、是他在選擇的機(jī)率是,在選擇的機(jī)率是。 PH 披薩 不進(jìn)入 結(jié)盟 0.1 0.1 0.8BN BN BN 0.4 0.6 0.9 0.1 0.7 0.3牛肉麵 不進(jìn)入 牛肉麵 不進(jìn)入 結(jié)盟 拒絕 0 PH 0 8 披薩 不進(jìn)入 0.8 0.2 0 M a b c d 08 反擊 容忍 反擊 容忍 反擊 容忍 反擊 容忍 反擊 容忍 1 4 2 4 0 0 3 6 1 22 2 0 0 1 5 1 3 0 01 1 1 4 4 3 2 1 4 3 圖為了便於解釋一致性信念的計(jì)算方式,我們將行為策略及標(biāo)明於賽局樹上得到圖及後,a、b、c及d各點(diǎn)發(fā)生的機(jī)率是節(jié)點(diǎn)發(fā)生機(jī)率A0.1×0.6=0.
7、06B0.1×0.9=0.09C0.8×0.7=0.56D0.8×0.3×0.8=0.192資訊集合0.060.090.560.1920.902 表資訊集合是由a、b、c、d四點(diǎn)組成,所以資訊集合發(fā)生的機(jī)率就是四點(diǎn)發(fā)生機(jī)率的總和。由上表就可算出a、b、c、d四點(diǎn)在資訊集合中所佔(zhàn)的比重,這些根據(jù)、策略,再用貝氏法則所算出的條件機(jī)率也就是M廠商的一致性信念。事件條件機(jī)率A在中發(fā)生B在中發(fā)生C在中發(fā)生D在中發(fā)生表現(xiàn)在用嚴(yán)謹(jǐn)?shù)姆?hào)表達(dá)以上分析。首先我們將對(duì)手的行為策略寫成。代表策略賽局會(huì)進(jìn)行到a點(diǎn)的機(jī)率,也就是表中所計(jì)算的機(jī)率。代表在策略下賽局會(huì)進(jìn)行到時(shí),M廠商
8、位於a點(diǎn)的機(jī)率是:這也就是在策略下,a點(diǎn)在中發(fā)生的機(jī)率。同理可寫出b、c、d點(diǎn)的機(jī)率是:,。故利用貝氏法則,我們算出與策略一致的信念是第二節(jié):弱完美貝氏均衡Weak Perfect Bayesian Equilibrium (WPBE) 本書以前所定義的均衡都是由策略組態(tài)構(gòu)成,弱完美貝氏均衡(以下簡(jiǎn)稱WPBE)則包含兩部份:策略組態(tài)描述參賽者在各個(gè)情況如何做選擇,信念則說明參賽者在處境不明時(shí)如何做判斷。定義:WPBE是一組策略組態(tài)及信念,滿足下列條件:(一) 序列理性sequential rationality: 給定及,每一位參賽者所選擇的都是對(duì)他自己最好的,也就是能使的預(yù)期報(bào)酬達(dá)到極大。(
9、二) 信念一致性belief consistency:參賽者的信念是根據(jù)事前機(jī)率、策略組態(tài)並使用貝氏法則計(jì)算得出?,F(xiàn)在求解圖賽局的WPBE:步驟一. 先分析BN廠商在他第二和第三個(gè)資訊集合的選擇。在:BN選牛肉麵得1或5,選不進(jìn)入得0,故BN會(huì)選牛肉麵。在:BN選結(jié)盟得1或3,選不進(jìn)入得0,故BN會(huì)選結(jié)盟。步驟二. 回溯分析PH廠商在賽局一開始的行動(dòng)。1. PH選披薩時(shí)M廠商反擊則PH得1或2,M廠商容忍則PH得4。2. PH選不進(jìn)入得0。3. PH選結(jié)盟時(shí)由步驟一知BN也會(huì)選結(jié)盟,故M廠商反擊則PH得3,M廠商容忍則PH得6。比較之後PH廠商會(huì)選擇結(jié)盟。步驟三. 步驟一、二告訴我們PH廠商一
10、開始會(huì)選結(jié)盟,之後BN也會(huì)選結(jié)盟,故在資訊集合中,M廠商一定是落在c點(diǎn)。也就是說與步驟一、二一致的信念是。步驟四. 因?yàn)镸廠商相信自己一定在c點(diǎn),故M廠商選反擊得2,選容忍得1。比較之下,M廠商會(huì)選擇容忍。步驟五. 再分析M廠商在他第一個(gè)資訊集合的選擇。在:M廠商選反擊得1,選容忍得2。比較之下,M廠商會(huì)選擇容忍。步驟六. 再分析BN廠商在他第一個(gè)資訊集合的選擇。在:BN選牛肉麵M廠商會(huì)容忍,BN得2;BN選不進(jìn)入得0,比較之下BN會(huì)選牛肉麵。步驟七. 再分析PH廠商在他第二個(gè)資訊集合的選擇。在:PH選披薩就到資訊集合,而M廠商會(huì)容忍,故PH選披薩得2;PH選不進(jìn)入得0,比較之下PH會(huì)選披薩。
11、我們所求出的WPBE = ,其中,, ,, 練習(xí)PH、BN及M的單純策略集合分別是:,和。PH的混合策略是,其中,。練習(xí)題2 P1 0.8 0.2 P2 P2 0.9 0.1 0.7 0.3 P3 x y z上圖中P3的第二個(gè)資訊集合是,P1和P2的行為策略標(biāo)於圖中,請(qǐng)計(jì)算P3在的一致性信念。練習(xí)題3 P1 0.8 0.2 P2 P2 0.9 0.1 0.7 0.3 P3 P3 x y上圖中P3的第三個(gè)資訊集合是,P1和P2的行為策略標(biāo)於圖中,請(qǐng)計(jì)算P3在的一致性信念。練習(xí)題4 P1 1 0 P2 P2 0.9 0.1 0.7 0.3 P3 P3 x y上圖中P3的第三個(gè)資訊集合是,P1和P2的行為策略標(biāo)於圖中,請(qǐng)計(jì)算P3在的一致性信念。請(qǐng)注意,依照貝氏法則的公式計(jì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人股權(quán)轉(zhuǎn)讓與股權(quán)激勵(lì)計(jì)劃合同4篇
- 2025年在線娛樂服務(wù)合同
- 2025年借殼上市銷售協(xié)議
- 2025年化工品供應(yīng)協(xié)議
- 2025年辦公用品采購(gòu)合同
- 2025年倉(cāng)庫(kù)租賃業(yè)務(wù)保密協(xié)議
- 2025年度互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)運(yùn)營(yíng)管理合同范本4篇
- 二零二五版智慧小區(qū)門禁系統(tǒng)采購(gòu)與維護(hù)協(xié)議4篇
- 二零二五年度二手船舶購(gòu)置協(xié)議材料船舶買賣3篇
- 2025版儲(chǔ)罐租賃及物聯(lián)網(wǎng)技術(shù)應(yīng)用合同3篇
- 餐廚垃圾收運(yùn)安全操作規(guī)范
- 皮膚內(nèi)科過敏反應(yīng)病例分析
- 電影《獅子王》的視聽語(yǔ)言解析
- 妊娠合并低鉀血癥護(hù)理查房
- 煤礦反三違培訓(xùn)課件
- 向流程設(shè)計(jì)要效率
- 2024年中國(guó)航空發(fā)動(dòng)機(jī)集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 當(dāng)代中外公司治理典型案例剖析(中科院研究生課件)
- 動(dòng)力管道設(shè)計(jì)手冊(cè)-第2版
- 2022年重慶市中考物理試卷A卷(附答案)
- Python繪圖庫(kù)Turtle詳解(含豐富示例)
評(píng)論
0/150
提交評(píng)論