版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第五講完全信息動態(tài)博弈 前面講述的納什均衡有三個問題:第一,納什均 衡的多重性,但這并不是納什均衡最嚴(yán)重的問題; 第二,在納什均衡中,參與人在選擇自己的策略 時,把其他參與人的策略當(dāng)作是給定的,不考慮 自己的選擇如何影響對手的策略。動態(tài)博弈時這 就有問題了。當(dāng)一個人行動在先,另一個人行動 在后時,后者自然會理性地預(yù)期這一點,所以不 可能不考慮自己的選擇對其對手選擇的影響。第 三,這由第二個問題引發(fā)來,由于不考慮自己選 擇對別人選擇的影響,納什均衡允許了不可置信 威脅的存在。 威脅是指一個參與人承諾一旦其他參與人 偏離均衡,他將采取的某種行動,威脅是 有 一定影響力的,盡管可能它從未被實施 過。
2、 在位者 默許 斗爭 進入 40,50 -10,0 進入者 不進入 0,300 0,300 市場進入博弈中,如若進入者真的進入,在位者的最優(yōu)行 動顯然是默許而不是斗爭,因為默許帶來50的利潤,所以 斗爭就是一種不可置信的威脅。但納什均衡概念承認了這 種不可置信的威脅,所以(不進入,斗爭)就成為一個納 什均衡。 R (0,0) U L (3,1) D (2,2) 修改的市場進入博弈 1 2 試說明上述不可置信的威脅是什么? 現(xiàn)實生活中的例子:父親堅決不同意女兒 的婚事,威脅說,如果女兒不與相愛的人 斷絕關(guān)系,他就與女兒斷絕父女關(guān)系。 逆向歸納法 逆向歸納法可以排除不可置信的威脅。之 所以可以如此
3、,根本原因在于采用了一種 分析動態(tài)博弈的有效方法逆向歸納法, 即從動態(tài)博弈的最后一個階段博弈方的行 為開始分析,逐步倒推回前一個階段相應(yīng) 博弈方的行為選擇,一直到第一個階段的 分析方法。一般方法是:從最后一階段開 始分析,每一次確定出所分析階段博弈方 的選擇和路徑,然后再確定前一階段的博 弈方選擇和路徑。 借錢投資問題 設(shè)甲準(zhǔn)備投資開采一個價值4萬元的金礦, 但缺1萬元資金,而乙正好有1萬元可以投 入。甲向乙借這1萬元用于開礦,并承諾收 益雙方平分。假設(shè)金礦的價值經(jīng)權(quán)威探測, 是確實的。乙是否應(yīng)該借錢給甲呢? 乙最關(guān)心的是甲得到金子后是否履行諾 言跟乙平分收益。萬一甲采到金子后不分 收益,甚至
4、賴賬,乙連本錢都收不回來 。 我們用下面的擴展形的方法分析: 借款投資的擴展形(博弈樹) 乙 甲 借不借 分 不分 (2,2) (0,4) (1,0) 分析 乙先決策:不借,則博弈結(jié)束,乙保住自己的1萬 元,但得不到投資利潤。若乙選擇借,則到博弈 的另一階段,由甲決策:分或是不分。不論分與 不分,博弈都將結(jié)束。分,則皆大歡喜,甲得到 了2萬元采金收益,乙的1萬元投資也增值到2萬 元。不分,則甲獨得4萬元,而乙則一無所有。 乙清楚自己的處境,他決策完全取決于甲的分錢 承諾是否可信。不考慮道德因素,甲的分錢承諾 并不可信。因為,甲不分才能使自己收益最大化。 所以,本博弈以乙不借錢而結(jié)束。 改進 本
5、博弈因為甲的不可信的分錢承諾而使甲乙的合 作沒有成功,開礦帶來的3萬元的社會效益也沒能 實現(xiàn)。能否改進措施,使甲的承諾變?yōu)榭尚牛课?們增加一個對甲的行為的制約。 當(dāng)甲選擇分錢時,雙方達到最佳結(jié)局。當(dāng)甲選擇 不分時,讓乙通過打官司來保護自己的利益,打 官司乙肯定能贏,但要耗費財力物力,假設(shè)乙除 掉打官司的花費,正好收回1萬元投資,而甲的全 部采金收入將被沒收。這樣,就變成了三階段的 動態(tài)博弈。 有可信的諾言和威脅時的博弈樹 乙 甲 乙 不借 借 分 不分 打 不打 (2,2) (1,0) (0,4) (1,0) 分析 加上了第三博弈階段,結(jié)果就不同了。當(dāng)甲選擇 不分時,乙不打官司,則什么都沒有了
6、,但打官 司可以收回自己的1萬元投資,即使不以懲罰甲帶 來的心理效用來考慮,乙的打官司威脅是可信的。 則甲的分錢承諾就是可信的了。所以本博弈的解 應(yīng)是乙先選擇借,當(dāng)甲選擇不分時選擇打官司。 均衡路徑是借分。達到最佳結(jié)果。 可見,完善的法律制度,不僅能保障社會公平, 還能提高社會經(jīng)濟效率。 但是要充分保障社會公平和經(jīng)濟活動的效 率,法律制度必須要有足夠的震懾作用,而且 法律制度要充分發(fā)揮作用,必須和人們的公 平觀等價值觀、習(xí)俗等非正式制度相一致, 為人們接受才能發(fā)揮作用。這樣,如果發(fā) 生糾紛,人們就會求諸于法律制度,而不 是私下解決。 現(xiàn)實中的法律制度總不是那么理想,贏了 官司反而虧了錢的事有一
7、定的普遍性。 法律保障不足時的博弈樹 乙 甲 乙 不借 借 分 不分 打 不打 (2,2) (-1,0) (0,4) (1,0) 市場占領(lǐng)有可信威脅的情形 后進者 先到者 進 不進 打擊 不打擊 (-3,6) (5,5) (0,10) 市場占領(lǐng)有不可信威脅的情形 先到者 進 不進 打擊 不打擊 (-3,6) (5,8) (0,10) 后進者 分析 前一個圖中,當(dāng)后來者選擇進入市場時,先到者 打擊的收益是6,不打擊的收益是5,因此,打擊 是一個可信的威脅,那么后來者選擇進得-3,不 進得0,當(dāng)然應(yīng)選擇不進。 后一個圖中,當(dāng)后來者選擇進入市場時,先到者 打擊的收益是6,不打擊的收益是8,因此,打擊
8、 是一個不可信的威脅,那么后來者選擇進得5,不 進得0,當(dāng)然應(yīng)選擇進。 后一種情形是可能的。當(dāng)后進者進入市場后,進 一步開拓了市場,其得益并非從前者手中奪取的。 子博弈完美納什均衡 澤爾騰(1965)提出了“子博弈完美納什 均衡”(sub-game perfect Nash equilibrium)概念的目的就是要將那些包含 不可置信威脅策略的納什均衡從均衡中剔 除,從而給出動態(tài)博弈結(jié)果的一個合理預(yù) 測。 子博弈是一個對于所有參與人的信息集來 說都是單結(jié)的結(jié),這個結(jié)的后續(xù)結(jié)以及在 相應(yīng)的終點結(jié)處的支付這三個要素所組成 的博弈。 一個策略組合是一個完美子博弈納什均衡, 如果:1它是整個博弈的納什
9、均衡;2它是 每個子博弈的納什均衡。 跟隨領(lǐng)頭羊表明只要添加一點復(fù)雜性,就 使得策略式表述變得晦澀難懂,幾無用武之 地。策略式如下。 瓊斯 L/L,L/S L/L,S/S S/L,L/S S/L,S/S 大 2,2 2,2 -1,-1 -1,-1 史密斯 小 -1,-1 1,1 -1,-1 1,1 均衡 策略 結(jié)果 E1 大,(L/L,L/S) 雙方都選擇大 E2 大,( L/L,S/S) 雙方都選擇大 E3 小, (S/L,S/S) 雙方都選擇小 在以后的分析中我們將討論均衡E1和E3可 以被我們通過納什均衡的精煉所排除。 小 (1,1) 小 大 (-1,-1) 小 (-1,-1) 大 大
10、(2,2) 圖1擴展式下的跟隨領(lǐng)頭羊 S J1 J2 跟隨領(lǐng)頭羊有三個子博弈:(1)整個博 弈;(2)從結(jié)J1開始的子博弈;(3)從 結(jié)J2開始的子博弈。 E1只能在子博弈(1)和(3)上達到納什 均衡; E3只能在子博弈(1)和(2)上達到納什 均衡;所以只有E2在所有的子博弈上是納 什均衡 下面分析房地產(chǎn)開發(fā)博弈 開發(fā) (-3,-3) 開發(fā) 不開發(fā) (1,0) 開發(fā) (0,1) 不開發(fā) 不開發(fā) (0,0) 房地產(chǎn)開發(fā)博弈 A B1 B2 1寫出房地產(chǎn)開發(fā)商博弈的策略式表達 2找出有哪幾個純策略納什均衡 3找出子博弈完美納什均衡 開發(fā)商A 開發(fā),開發(fā) 開發(fā),不開發(fā) 不開發(fā),開發(fā) 不開發(fā),不開
11、發(fā) 開發(fā) -3,-3 -3,-3 1,0 1,0 B 不開發(fā) 0,1 0,0 0,1 0,0 有三個純策略納什均衡,(開發(fā),不開 發(fā),開發(fā)), (開發(fā),不開發(fā),不開 發(fā)), (不開發(fā),開發(fā),開發(fā))。 唯一的子博弈完美納什均衡是開發(fā),不 開發(fā),不開發(fā))。 找出子博弈完美納什均衡 1 2 1 U D L R D U (0,2) (0,1) (1,3) (2,0) 在第三階段,參與人1的最優(yōu)選擇是U;在 第二階段,因為參與人2知道,如果自己選 擇R,參與人將在第三階段選擇U,因此參 與人2在第二階段最優(yōu)選擇是L;在第一階 段,參與人1知道,如果博弈進入第二階段, 參與人2的最優(yōu)選擇是L,因此參與人在
12、第 一階段的最優(yōu)選擇是U。 這樣均衡結(jié)果是參與人在第一階段選擇U結(jié) 束。 子博弈完美納什均衡是(U, U ,L) 這里的U和L分別是參與人1和參與人2在非 均衡路徑上的選擇。 承諾行動與子博弈完美納什均衡 如果參與人能在博弈之前采取某種措施改 變自己的行動空間或支付函數(shù),原來不可 置信的承諾或威脅就可能變得可置信,博 弈的精煉均衡就會相應(yīng)改變。我們將這些 為改變博弈結(jié)果而采取的措施稱為“承諾 行動”(commitmment) 將承諾行動納入房地產(chǎn)開發(fā)博弈,如果在A 決策之前,B 與某個客戶簽訂一個合同,規(guī) 定B在某一時刻交付若干面積的寫字樓辦公 室,如果B不履約,將賠償客戶3.5。這個 合同就
13、是一個承諾行動。有了這個承諾行 動,B的開發(fā)就不再是個不可置信的威脅, 而是可置信的威脅,因為此時B的最優(yōu)選擇 是開發(fā),不管A的選擇是什么。子博弈納什 均衡是(不開發(fā),開發(fā),開發(fā))。 在許多情況下,承諾行動對當(dāng)事人是很有 價值的。特別地,有些情況下,一個參與 人可以通過減少自己的選擇機會使自己受 益,原因在于保證自己不選擇某些行動可 以改變對手的最優(yōu)選擇。承諾行動的一個 典型例子就是項羽的“破釜沉舟”。 序貫理性(sequential rationality)是這樣 一種概念:一個參與人在博弈的每一個點 上都重新優(yōu)化自己的選擇并且把自己在將 來會重新優(yōu)化其選擇這一點考慮在內(nèi)了, 也就是說考慮了
14、別人的選擇和自己的選擇 的互相影響。這是忽略沉沒成本和理性預(yù) 期這兩種經(jīng)濟學(xué)觀點的結(jié)合。如今序貫理 性已經(jīng)成為均衡的標(biāo)準(zhǔn)準(zhǔn)則。 子博弈完美納什均衡存在的問題 逆推歸納法最大的問題是對博弈方理性的 要求太高,不僅要求所有博弈方都有高度 的理性,不允許犯任何錯誤,而且要求博 弈方相互了解和信任對方的理性,或者說 有“理性的共同知識”。而現(xiàn)實生活中的 決策者通常達不到這樣的理性高度。 這樣的話,如果其他博弈方偏離子博弈完 美納什均衡,應(yīng)該怎么樣進行后面的博弈 呢? 1 2 1 L R M N S T (0,2) (0,1) (1,3) (2,0) 用逆推法可以找出該博弈的子博弈納什完 美均衡為“博弈
15、方1在第一階段選擇L,第 三階段選擇T;博弈方2在第二階段選擇N”, 相應(yīng)博弈路徑是博弈方1第一階段選擇L。 如果考慮到博弈方的有限理性(Bounded Rationality),博弈方1就有可能在第一階 段犯錯誤,采用R而不是L。如果博弈方2是 理性的,他應(yīng)該如何選擇呢? 這樣博弈方2在第二階段的選擇就出現(xiàn)了問 題,博弈方2還應(yīng)該相信博弈方1是理性的 嗎?或者說博弈方2應(yīng)該認為博弈方1的錯 誤是偶然發(fā)生的嗎? 澤爾滕(Selten)為了捍衛(wèi)逆推歸納法理論, 將偏離行為解釋為均衡的“顫抖” (trembles)他認為,擴展式隱含了參與人 犯錯誤的可能;如果參與人在每個信息集 上犯錯誤的概率是獨
16、立的小概率(因而參 與人不會犯系統(tǒng)性錯誤),那么不論過去 的行為與逆推歸納法有如何的不同,參與 人應(yīng)該繼續(xù)使用逆推歸納法。 顫抖手均衡 博弈方相互怎樣理解對方的錯誤? 如果不相信犯錯誤的博弈方的理性,后面怎樣 進行自己的判斷?澤爾頓提出的“顫抖手均衡” 思想是解決這類問題的重要思想。先用一個簡單 的靜態(tài)博弈問題來說明。 2 L R U 1 D 10,06,2 10,1 2,0 這里(U,R)和(D,L)都是納什均衡。如果不考慮 偏差,兩個均衡都是穩(wěn)定的。 如果考慮偏差,不論多小,博弈方1選擇U都比選 D好。因此(D,L)就變成不穩(wěn)定的了。組合 (U,R) 則不同,不論博弈方2是否偏離R,博弈方
17、1 都不必要偏離U,反過來,雖然博弈方1從U偏離到 D對他的支付有不利影響,只要博弈方1偏離的可 能性不超過2/3,博弈方2就不必選L,因此(U,R)是 穩(wěn)定的。就是說(U,R)對于有較小的偏差來說, 具有穩(wěn)定性,象這樣的策略組合稱為“顫抖手均 衡” 顫抖手均衡 博弈方相互怎樣理解對方的錯誤? 如果我們把上面這個博弈中博弈方1的支付作少 量的改變。就使得原來的兩個納什均衡都變成了 顫抖手均衡。 2 L R U 1 D 9,06,2 10,1 2,0 這樣(D,L)也變成了顫抖手均衡。因為 即使博弈方1仍然會考慮博弈方2偏離L錯誤 選擇R的可能性,但只要這種可能性小于 1/5,那么博弈方1堅持選
18、擇D,而不是選擇 U 。 從上不難看出,一個策略組合要是一個顫 抖手均衡,首先必須是納什均衡,其次不 能包括任何“弱劣均衡”,也就是偏離對 偏離者沒有損失的策略。包括弱劣策略的 納什均衡不可能是顫抖手均衡,因為它經(jīng) 不起任何非完全理性的“擾動”,缺乏在 有限理性條件下的穩(wěn)定性,就象經(jīng)不起考 驗的“愛情”,真正的“愛情” 應(yīng)該是滿 足顫抖手均衡或者說是真正的“愛情” “顫抖手的愛情”。 順推歸納法 顫抖手均衡只是理解博弈方錯誤和完美均衡 的方法之一,現(xiàn)實中也有用順推歸納法來處 理這樣的問題。 所謂順推歸納法,就是博弈方根據(jù)前面階段 的行為,包括偏離特定均衡路徑的行為,推 斷他們的思路并為后面階段
19、的博弈提供依據(jù) 的分析方法。它考慮的是博弈方有意識偏離 子博弈完美納什均衡的可能性,而不是偶然 的錯誤。 2 s w 1 s w 這是一個第二階段為靜態(tài)博弈的動態(tài)博弈問題。如 果第一階段1選d,則博弈結(jié)束,雙方各得2;如果1 選r則第二階段有三個納什均衡:純策略的(s,w)和 混合策略的雙方以1/4和3/4選s和w。 r d 2,2 0,03,1 1,30,0 三個均衡的平均得益都小于1選D的得益2. 博弈的均衡之一是1在第一階段選D,如果到了 第二階段選w.(Dw,s)是子博弈完美納什均衡, 也是顫抖手均衡。 但這個均衡是不穩(wěn)定的。第一階段1選R就是為 了在第二階段選s實現(xiàn)更大收益。如果1是
20、有意 這樣做,那么2在第二階段就只能選w,這樣在 這個博弈中更可能實現(xiàn)的就是另一個子博弈完 美納什均衡(R s,w). 這種分析的方法就是順推歸納法。作為博弈方 的2要考慮的是1的有意識選擇,而不是無意的 錯誤。 把上面的問題簡化為下面的靜態(tài)博弈 博弈的簡化形式: 2 s w d 1 r s r w 2,2 2,2 0,0 3,1 1,30,0 前面討論的主要問題是現(xiàn)實中決策者理性 的局限對逆推歸納法和子博弈完美納什均 衡分析預(yù)測能力的影響。似乎隱含著如果 決策者滿足完全理性的假設(shè),那么博弈的 結(jié)果就一定可以通過逆推歸納法和子博弈 完美納什均衡分析預(yù)測,如果進一步運用 顫抖手均衡和順推歸納法等
21、思想,就可以 得出更精確的預(yù)測。但這不完全是事實, 因為在動態(tài)博弈中還有其他意想不到的困 難。 蜈蚣博弈蜈蚣博弈 前面討論了現(xiàn)實中決策者的理性局限和逆推歸前面討論了現(xiàn)實中決策者的理性局限和逆推歸 納法、子博弈完美納什均衡,如果進一步考慮納法、子博弈完美納什均衡,如果進一步考慮 顫抖手均衡和順推歸納法,是否就可以完美的顫抖手均衡和順推歸納法,是否就可以完美的 解決此類的博弈問題?解決此類的博弈問題? 12 11 2 DdD D d RrR R (1,1) (0,3)(2,2)(99,99)(98,101) r (100,100) 這是一個完全且完美信息的動態(tài)博弈。這是一個完全且完美信息的動態(tài)博弈
22、。 如果用逆推歸納法,得到的子博弈完美納如果用逆推歸納法,得到的子博弈完美納 什均衡是第一階段什均衡是第一階段1選選D,博弈結(jié)束,雙方,博弈結(jié)束,雙方 得益都是得益都是1。 在這里可以看出,從個體理性出發(fā)的最優(yōu)在這里可以看出,從個體理性出發(fā)的最優(yōu) 選擇卻可能導(dǎo)出極差的結(jié)果。但蜈蚣博弈選擇卻可能導(dǎo)出極差的結(jié)果。但蜈蚣博弈 受到重視,是直覺上的結(jié)論和分析的結(jié)果受到重視,是直覺上的結(jié)論和分析的結(jié)果 不一致。不一致。 人們曾經(jīng)進行實驗,絕大多數(shù)隨意選擇的人們曾經(jīng)進行實驗,絕大多數(shù)隨意選擇的 博弈方在進行博弈時,都不會出現(xiàn)上述逆博弈方在進行博弈時,都不會出現(xiàn)上述逆 推歸納法給出的預(yù)測結(jié)果。推歸納法給出的預(yù)測結(jié)果。 問題在哪里?從問題在哪里?從1第一階段選第一階段選R把主動權(quán)交給把主動權(quán)交給2 這一點,可以知道,這一點,可以知道,1的損失是的損失是1,即使,即使2選擇了選擇了 d,自己的損失也
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玻璃隔斷拆除施工方案
- 玻璃鋼立式儲罐課程設(shè)計
- 玻璃櫥窗檢修方案
- 玻璃幕墻拆除施工方案
- 玻璃企業(yè)應(yīng)急處置方案
- 愛的對對碰課程設(shè)計
- 愛護公司財物管理方案
- 濱水景觀變遷研究報告
- 濱州古建牌坊施工方案
- 泵站排水環(huán)保方案
- 招投標(biāo)咨詢合同文本
- 2025年中考語文復(fù)習(xí)之文言文閱讀
- 2024統(tǒng)編版(2024)道德與法治小學(xué)一年級上冊教學(xué)設(shè)計(附目錄)
- 2.2 直線的方程(分層練習(xí))(解析版)
- 《保密法》培訓(xùn)課件
- 北京市2024-2025學(xué)年高三上學(xué)期第二次普通高中學(xué)業(yè)水平合格性考試英語試卷 含解析
- 2024年全球 二次元移動游戲市場研究報告-點點數(shù)據(jù)
- 第6課《我們神圣的國土》第1課時(教學(xué)設(shè)計)-部編版道德與法治五年級上冊
- 綿陽市高中2022級(2025屆)高三第一次診斷性考試(一診)物理試卷(含標(biāo)準(zhǔn)答案)
- 2024年廣西高考歷史試卷真題(含答案解析)
- 正常流產(chǎn)護理查房模板
評論
0/150
提交評論