第二章納什均衡與一致預(yù)測(cè)性

上傳人：1*** IP屬地：湖北上傳時(shí)間：2021-11-25 格式：PPT 頁數(shù)：30 大?。?3.50KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩25頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章納什均衡與一致預(yù)測(cè)性柯華慶2.1 博弈論的基本假設(shè) 2.1.1 理性人rational 非合作博弈僅僅從自己利益出發(fā)，僅僅利己。合作博弈是利人利己，利人也是為了利己，集體利益最大化以后再在集體中對(duì)個(gè)人進(jìn)行補(bǔ)償。 2.1.2 智能人intelligent 共同知識(shí)Common knowledge：如果每個(gè)人都知道某個(gè)知識(shí)，每個(gè)局中人都知道每個(gè)局中人都知道它，如此等等，從而行如 “（每個(gè)局中人都知道）k每個(gè)局中人都知道它”的語句對(duì)k=0,1,2都是正確的，那么我們就稱這個(gè)知識(shí)為局中人中間的共同知識(shí)。有趣的例子：妻子不貞。2.1 博弈的基本結(jié)構(gòu) 2.1.1 游戲(game) 很多游戲都有一

2、個(gè)特點(diǎn)：策略或者計(jì)謀有舉足輕重的作用。 2.1.1.1齊威王田忌賽馬：每次雙方各出三匹馬，一比一比賽三場，每一場的輸方要賠一千斤銅給對(duì)方。 2.1.1.2猜硬幣游戲 2.1.2 博弈的基本結(jié)構(gòu) 2.1.2.1 局中人player (誰與誰玩？） 2.1.2.2 策略 strategy（幾種玩法？） 2.1.2.3 次序 order（誰先玩？還是同時(shí) 玩？） 2.1.2.4 信息 information(依靠什么玩？） 2.1.2.5 得益 payoff（每種玩法得到什么？不是僅僅玩）2.2 靜態(tài)博弈 2.2.1 規(guī)則：所有局中人同時(shí)選擇行動(dòng)且只選擇一次。任何一方在選擇策略時(shí)都不可能知道另一

3、方的選擇是什么，因此不管他們決策的時(shí)間是否相同，我們可以把他們的決策看作是同時(shí)作出的；每一方都知道對(duì)方的得益情況；這兩個(gè)決定了是完全信息靜態(tài)博弈。 “同時(shí)”是信息概念，不是時(shí)間概念。 2.2.2占優(yōu)策略 2.2.2.1在博弈中，如果不管其他博弈方選擇什么策略，一博弈方的某個(gè)策略給他帶來的收益始終高于其他策略，至少不低于其他策略，此時(shí)“某個(gè)策略”必然是該博弈方愿意選擇的策略。稱為“上策”或“占優(yōu)策略”。 2.2.2.2如果一個(gè)博弈的某個(gè)策略組合中的策略都是各個(gè)博弈方各自的上策，那么這個(gè)策略組合肯定是所有博弈方都愿意選擇的，必然是該博弈比較穩(wěn)定的結(jié)果。稱這樣的策略組合為“上策均衡”。因?yàn)樯喜呔夥?/p>

4、映了所有博弈方的絕對(duì)偏好，因此非常穩(wěn)定，根據(jù)上策均衡可以對(duì)博弈結(jié)果作出最肯定的預(yù)測(cè)。 2.2.2.3上策均衡是博弈論中最強(qiáng)的觀念，一個(gè)參與人如有可能總是選取一個(gè)嚴(yán)格占優(yōu)策略并且總是不選取任何嚴(yán)格劣策略。上策均衡只要求每個(gè)參與人是理性的，而并不要求每個(gè)參與人知道其他參與人是理性的，這是因?yàn)?，不論其他參與人是否理性，上策總是一個(gè)理性參與人的最優(yōu)選擇。最有名的博弈模型“囚徒困境”就有上策均衡。 2.2.2.4“囚徒困境” 兩個(gè)犯罪嫌疑人被捕并受到指控，但除非至少其中有一個(gè)人供認(rèn)犯罪，警方缺乏足夠的證據(jù)指證他們所犯的罪行，從而將他們按罪判刑。為了得到所需的口供，警察將這兩名罪犯關(guān)押在不同牢房以防止他們

5、串供或結(jié)成攻守聯(lián)盟，并給他們同樣的選擇機(jī)會(huì)：如果他們兩人都拒不認(rèn)罪，則根據(jù)已經(jīng)掌握的證據(jù)他們會(huì)被判以 1 年徒刑；如果雙方都坦白招認(rèn)，都將被判入獄 5 年（比事實(shí)上的罪行要輕）；如果兩人中有一人坦白認(rèn)罪，則坦白者從輕處理，立即釋放（信息費(fèi)用），而另一人則重判 8 年徒刑。得益矩陣如下：囚徒困境杰克約翰沉默坦白沉默 - 1 -1 0-8坦白 -80 -5-5 第一，根據(jù)個(gè)體理性行為準(zhǔn)則和完全理性行為準(zhǔn)則，兩個(gè)博弈方的目標(biāo)都想要實(shí)現(xiàn)也有能力判斷自身的最大利益。實(shí)際上對(duì)雙方來說最佳結(jié)果是（-1 ，-1 ），對(duì)單方最佳結(jié)果是（-8 ， 0 ）或（ 0 ，-8 ），問題就在于他們都看到對(duì)自己有利的結(jié)

6、果，兩者之間不能串通，雙方都不敢相信或者期望對(duì)方有合作精神，所以最后的結(jié)果是（-5 ，-5 ）。第二，對(duì)結(jié)果評(píng)價(jià)的多視角：就囚徒而言，是有害的；對(duì)警察有利、對(duì)社會(huì)利益來說是非常理想的結(jié)果，因?yàn)楣?jié)省了信息費(fèi)用（調(diào)查事實(shí)真相的費(fèi)用）第三個(gè)體理性與集體理性從博弈論的一般性來看（不涉及具體人），兩個(gè)決策者的立場是不明智的（“聰明反被聰明誤”），因?yàn)榧葲]有實(shí)現(xiàn)團(tuán)體的最大利益，也沒有真正實(shí)現(xiàn)自身的個(gè)體最大利益。一般認(rèn)為該博弈揭示了個(gè)體理性與集體理性的矛盾，對(duì)經(jīng)濟(jì)學(xué)中斯密“看不見的手”理論是一種重創(chuàng)?！八苤恢豢床灰姷氖种笇?dǎo)，去盡力達(dá)到一個(gè)并非他本意想要達(dá)到的目的。他追求自己的利益，往往使他能比

7、在真正出于本意的情況下更有效地促進(jìn)社會(huì)的利益”。單個(gè)囚徒僅僅考慮自己，由于策略的相互依存性，最后的結(jié)果違背了囚徒自身的利益（仍然是個(gè)體利益）。所以囚徒困境揭示的是“事與愿違”，原因在于社會(huì)中策略的相互依存性，即個(gè)體追求自身利益要考慮其他人的策略，單純從自身考慮最后的結(jié)果可能正好相反。第四，“囚徒困境”時(shí)有廣義和狹義之分。狹義的“囚徒困境”是特指囚徒的困境。廣義的“囚徒困境”是指個(gè)人追求收益最大化的策略由于策略的相互依賴性最后得到的結(jié)果違背了自身的利益。在市場競爭的各個(gè)領(lǐng)域、在資源利用和環(huán)境保護(hù)，以及政治、軍事上大量存在“囚徒困境”。例如兩個(gè)寡頭的降價(jià)（反壟斷法），“沉默現(xiàn)象”（兩個(gè)乘客在遇到

8、一個(gè)歹徒搶劫財(cái)物）、當(dāng)事人向法官行賄，公共產(chǎn)品的提供。一般性囚徒困境代數(shù)圖（ABCD且2BA+D）杰克約翰合作背叛合作 B B AD背叛 DA CC公共產(chǎn)品的供給與囚徒困境李四修不修張三修 11 3-1不修 -13 00 2.2.2.5 囚徒困境與獎(jiǎng)懲機(jī)制 “囚徒困境”主要是雙方不信任的結(jié)果，同時(shí)沒有組織性。如果相互信任的話，就不會(huì)出現(xiàn)這種情況。如果他們屬于黑社會(huì)組織或者是其他組織，在他們內(nèi)部有一個(gè)懲罰措施，這時(shí)是合作博弈，結(jié)果肯定是兩個(gè)囚徒都選擇抵賴。在囚徒困境中，盡管每個(gè)人都選擇抵賴比選擇坦白要好，但是這個(gè)帕累托改善做不到，因?yàn)樗粷M足個(gè)人理性要求，（抵賴，抵賴）不是一個(gè)均衡。假定

9、兩個(gè)囚徒在作案之前建立一個(gè)攻守同盟（絕不坦白），這個(gè)攻守同盟也沒有用，因?yàn)闆]有人有積極性遵守協(xié)定。這就是合作博弈與非合作博弈的區(qū)別。假定有約束力有約束力的協(xié)議：獎(jiǎng)懲如果我們?cè)试S博弈中存在 “有約束力的協(xié)議”，使得博弈方采取符合集體利益最大化而不符合個(gè)體利益最大化的行為時(shí)，能夠得到有效的補(bǔ)償，那么個(gè)體利益和集體利益之間的矛盾就可以被克服，從而使博弈方按照集體理性決策和行為成為可能。黑社會(huì)中的獎(jiǎng)懲制度！法律也是獎(jiǎng)懲制度！用法律解決囚徒困境（ABCD且2BA+D，XA-B）杰克約翰合作背叛合作 B B A-X（B-）D背叛 DA-X （B-） CC 2.2.2 占優(yōu)策略的局限性在典型的博弈問

10、題中，博弈方之間普遍存在策略依存的特征，也就是說一個(gè)博弈方的不同策略之間，往往不存在絕對(duì)的優(yōu)劣關(guān)系，而只存在相對(duì)的、有條件的優(yōu)劣關(guān)系，因此利用策略之間的絕對(duì)優(yōu)劣關(guān)系分析篩選的上策均衡法也就無法應(yīng)用。所以，上策均衡法不是普遍適用的博弈分析方法。適用性較強(qiáng)的博弈分析方法必然是以策略之間的相對(duì)優(yōu)劣關(guān)系，而不是絕對(duì)優(yōu)劣關(guān)系為基礎(chǔ)的。博弈方的最大目標(biāo)都是實(shí)現(xiàn)自身的最大得益。在具有策略和利益相互依存性的博弈問題中，各個(gè)博弈方的得益既取決于自己選擇的策略，還與其他博弈方選擇的策略有關(guān)，因此博弈方在決策時(shí)必須考慮其他博弈方的存在和策略選擇。 2.2.3 納什均衡 2.2.3.1劃線法先找出自己針對(duì)其他博弈方

11、每種策略或策略組合（對(duì)多人博弈）的最佳對(duì)策，即自己的可選策略中與其他博弈方的策略或策略組合配合，給自己帶來最大得益的策略（這種相對(duì)最佳策略總是存在的，不過不一定唯一），然后在此基礎(chǔ)上，通過對(duì)其他博弈方策略選擇的判斷，包括對(duì)其他博弈方對(duì)自己策略判斷的判斷等，預(yù)測(cè)博弈的可能結(jié)果和確定自己的最優(yōu)策略。這就是劃線法。 2.2.3.2 箭頭法箭頭法對(duì)于理解博弈關(guān)系很有好處的尋找相對(duì)穩(wěn)定性策略組合的分析方法。箭頭法的基本思路是對(duì)博弈中的每個(gè)策略組合進(jìn)行分析，考察在每個(gè)策略組合處各個(gè)博弈方能否通過改變自己的策略而增加得益。如能，則從所分析的策略組合對(duì)應(yīng)的得益數(shù)組引一箭頭到改變策略后策略組合對(duì)應(yīng)的得益數(shù)組。

12、最后綜合對(duì)每個(gè)策略組合的分析情況，形成對(duì)博弈結(jié)果的判斷。劃線法和箭頭法的結(jié)果是一致的，可以相互替代。通過劃線法和箭頭法得到的具有穩(wěn)定性的策略組合，不管是否唯一，都有一個(gè)共同的特性，就是其中每個(gè)博弈方的策略都是針對(duì)其他博弈方策略或策略組合的最佳對(duì)策。 2.2.3.3 納什均衡的通俗定義納什均衡是一種策略組合，給定對(duì)手的策略，每個(gè)參與人選擇自己的最優(yōu)策略。根據(jù)納什均衡的定義，劃線法和箭頭法事實(shí)上是尋找納什均衡的方法。 2.2.3.4 納什均衡的存在性 “每一個(gè)有限博弈都至少有一個(gè)納什均衡?！爆F(xiàn)實(shí)中的博弈都是可以當(dāng)作有限博弈來解決。這樣納什均衡的存在就是普遍的。納什均衡的普遍存在性是納什均衡概

13、念最重要的性質(zhì)。猜硬幣博弈李四張三正面反面正面 1-1 -11反面 -11 1-1情侶博弈麗鵑大海足球芭蕾足球 12 00芭蕾 00 21 2.2.3.5納什均衡的一致預(yù)測(cè)性納什均衡概念之所以在現(xiàn)實(shí)中有廣泛的應(yīng)用則是因?yàn)樗c一致預(yù)測(cè)性質(zhì)的等價(jià)性。一致預(yù)測(cè)性是指：如果所有博弈方都預(yù)測(cè)一個(gè)特定的博弈結(jié)果會(huì)出現(xiàn)，那么所有的博弈方都不會(huì)利用該預(yù)測(cè)或者這種預(yù)測(cè)能力來選擇與預(yù)測(cè)結(jié)果不一致的策略，即沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望，因此這個(gè)預(yù)測(cè)結(jié)果最終就真會(huì)成為博弈的結(jié)果?！耙恢隆钡囊饬x在于各博弈方的實(shí)際行為選擇與他們的預(yù)測(cè)一致。任何非納什均衡的預(yù)測(cè)都不是一致預(yù)測(cè)，因此一致預(yù)測(cè)正是納什均衡的本

14、質(zhì)屬性。一致預(yù)測(cè)性在博弈分析中重要的原因，主要在于一個(gè)博弈方在博弈中所作預(yù)測(cè)的內(nèi)容包括他自己的選擇，因此博弈方有可能會(huì)利用預(yù)測(cè)改變自己的選擇，而具有一致預(yù)測(cè)性質(zhì)的博弈分析概念就能避免這樣的矛盾，從而是穩(wěn)定的和自我實(shí)施的（自我強(qiáng)制的），相應(yīng)選擇也才是真正可預(yù)測(cè)的。不具有一致預(yù)測(cè)性質(zhì)的博弈分析概念，在分析和預(yù)測(cè)博弈結(jié)果時(shí)，則難以避免預(yù)測(cè)和行為之間的矛盾，因此是不穩(wěn)定的，甚至是自我否定的，作用和價(jià)值必然很有限。納什均衡的一致預(yù)測(cè)性質(zhì)有兩個(gè)推論：推論1，各博弈方可以預(yù)測(cè)它，可以預(yù)測(cè)他們的對(duì)手預(yù)測(cè)它，還可以預(yù)測(cè)他們的對(duì)手會(huì)預(yù)測(cè)自己會(huì)預(yù)測(cè)它。推論2，預(yù)測(cè)到了任何非納什均衡策略組合是博弈的最終結(jié)果，

15、則意味著要么各博弈方的預(yù)測(cè)其實(shí)并不相同（預(yù)測(cè)不同的納什均衡會(huì)出現(xiàn)等），要么至少一個(gè)博弈方要“犯錯(cuò)誤”，包括對(duì)博弈結(jié)構(gòu)理解的錯(cuò)誤，對(duì)其他博弈方的策略預(yù)測(cè)錯(cuò)誤，其信息結(jié)構(gòu)、理性或計(jì)算能力有問題，或者是實(shí)施策略時(shí)會(huì)出現(xiàn)差錯(cuò)等。因此在假設(shè)各博弈方預(yù)測(cè)的策略組合相同，以及各博弈方都有完全的理性，也就是不會(huì)犯錯(cuò)誤的情況下，不可能預(yù)測(cè)任何非納什均衡是博弈的結(jié)果。2.2.3.6 納什均衡的立法意義納什均衡是一種僵局，其他參與人的策略一定，沒有任何人有積極性偏離這種均衡的局面。給定別人遵守協(xié)議的情況下，沒有人有積極性偏離協(xié)議規(guī)定的自己的行為規(guī)則。如果一個(gè)協(xié)議不構(gòu)成納什均衡，它就不可能自動(dòng)實(shí)施，因?yàn)橹辽儆幸粋€(gè)人會(huì)

16、違背這個(gè)協(xié)議，不滿足納什均衡要求的協(xié)議是沒有意義的。這是納什均衡的立法意義。立法的目標(biāo)與其實(shí)施的結(jié)果要一致，必須使得參與博弈的各方達(dá)到納什均衡。否則，立法就僅僅是正式或官方規(guī)則，而實(shí)際有效的支配人們的是潛規(guī)則。潛規(guī)則的要害是三方博弈：私下達(dá)成默契的雙方，蒙騙正式制度和公正原則的代表。納什均衡具有一致預(yù)測(cè)的本質(zhì)屬性是它在非合作博弈分析中具有不可替代重要地位的根本原因之一。預(yù)測(cè)是博弈分析最基本的目的之一。也就是說，我們之所以要進(jìn)行博弈分析，最重要的原因就是預(yù)測(cè)特定博弈的博弈方究竟會(huì)采取什么行動(dòng)，博弈將有怎樣的結(jié)果。因此一個(gè)博弈分析概念的作用和價(jià)值很大程度上是由其對(duì)博弈結(jié)果預(yù)測(cè)能力的大小決定的。納什均衡的一致預(yù)測(cè)性質(zhì)正是其預(yù)測(cè)能力的基本保證。2.2.3.6納什均衡應(yīng)用的局限性我們對(duì)納什均衡應(yīng)用的廣泛性和有效性不能過分夸大，盡管納什均衡非常重要，但不是說學(xué)到了這種分析方法你就能預(yù)測(cè)所有博弈的結(jié)果（人類社會(huì)人與人之間的關(guān)系就是博

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第二章納什均衡與一致預(yù)測(cè)性

文檔簡介

溫馨提示

最新文檔

評(píng)論

第二章 納什均衡與一致預(yù)測(cè)性

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第二章納什均衡與一致預(yù)測(cè)性