第五講博弈論105

上傳人：6*** IP屬地：湖北上傳時間：2023-02-04 格式：PPT 頁數(shù)：128 大小：848KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩123頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

主要內(nèi)容§1.博弈論概述§2.完全信息靜態(tài)博弈§3.完全信息動態(tài)博弈博弈論概述保羅·薩繆爾森說：“要想在現(xiàn)代社會做一個有文化的人,你必須對博弈論有一個大致的了解。”人們在日常生活中進(jìn)行著博弈，與配偶，朋友，陌生人，老板/員工，教授等。類似的博弈也在商業(yè)活動、政治和外交事務(wù)、戰(zhàn)爭中進(jìn)行著——在任何一種情況下，人們相互影響以達(dá)成彼此有利的協(xié)議或者解決爭端。博弈論為眾多學(xué)科提供了分析的概念和方法：經(jīng)濟(jì)學(xué)和商學(xué),政治科學(xué),生物學(xué),

心理學(xué)和哲學(xué)。1.1與傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的比較

傳統(tǒng)經(jīng)濟(jì)學(xué)涉及的個人決策，是在給定價格參數(shù)和收入的條件下，追求效用最大化的決策（消費(fèi)者均衡或生產(chǎn)者均衡）；個人效用只依賴于自己的選擇，而不在于他人的選擇；個人最優(yōu)選擇只是價格和收入的函數(shù)而不包含其他人選擇的函數(shù)。在博弈論看來，個人效用不僅依賴于自己的選擇，而且依賴于他人的選擇；個人的最優(yōu)選擇是其他人選擇的函數(shù)。1.1與傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的比較一致性利益最大化原則均衡原則不一致人與人之間的關(guān)系-個人理性導(dǎo)致集體非理性-設(shè)計(jì)協(xié)調(diào)性機(jī)制-滿足個人理性前提下達(dá)到集體理性信息不完全-委托-代理理論、信號傳遞與信息篩選模型1.2博弈論的發(fā)展簡史博弈思想最早產(chǎn)生于我國古代。早在兩千多年的春秋時期，孫武在《孫子兵法》中論述的軍事思想和治國策略，就蘊(yùn)育了豐富和深刻的對策論思想。孫武的后代孫臏，為田忌謀劃，巧勝齊王，這個著名的“田忌賽馬”，就是典型的對策思想的成功運(yùn)用。田忌賽馬齊國的大將田忌，很喜歡賽馬，有一回，他和齊威王約定，要進(jìn)行一場比賽。他們商量好，把各自的馬分成上，中，下三等。比賽的時候，要上馬對上馬，中馬對中馬，下馬對下馬。由于齊威王每個等級的馬都比田忌的馬強(qiáng)得多，所以比賽了幾次，田忌都失敗了。田忌覺得很掃興，比賽還沒有結(jié)束，就垂頭喪氣地離開賽馬場，這時，田忌抬頭一看，人群中有個人，原來是自己的好朋友孫臏。孫臏招呼田忌過來，拍著他的肩膀說：“我剛才看了賽馬，威王的馬比你的馬快不了多少呀?！碧锛少愸R孫臏還沒有說完，田忌瞪了他一眼：“想不到你也來挖苦我！”孫臏說：“我不是挖苦你，我是說你再同他賽一次，我有辦法準(zhǔn)能讓你贏了他?！碧锛梢苫蟮乜粗鴮O臏：“你是說另換一匹馬來？”孫臏搖搖頭說：“連一匹馬也不需要更換。”田忌毫無信心地說：“那還不是照樣得輸！”孫臏胸有成竹地說：“你就按照我的安排辦事吧?！碧锛少愸R齊威王屢戰(zhàn)屢勝，正在得意洋洋地夸耀自己馬匹的時候，看見田忌陪著孫臏迎面走來，便站起來譏諷地說：“怎么，莫非你還不服氣？”田忌說：“當(dāng)然不服氣，咱們再賽一次！”說著，“嘩啦”一聲，把一大堆銀錢倒在桌子上，作為他下的賭錢。齊威王一看，心里暗暗好笑，于是吩咐手下，把前幾次贏得的銀錢全部抬來，另外又加了一千兩黃金，也放在桌子上。齊威王輕蔑地說：“那就開始吧！”一聲鑼響，比賽開始了。田忌賽馬孫臏先以下等馬對齊威王的上等馬，第一局輸了。齊威王站起來說：“想不到赫赫有名的孫臏先生，竟然想出這樣拙劣的對策?！睂O臏不去理他。接著進(jìn)行第二場比賽。孫臏拿上等馬對齊威王的中等馬，獲勝了一局。齊威王有點(diǎn)心慌意亂了。第三局比賽，孫臏拿中等馬對齊威王的下等馬，又戰(zhàn)勝了一局。這下，齊威王目瞪口呆了。比賽的結(jié)果是三局兩勝，當(dāng)然是田忌贏了齊威王。還是同樣的馬匹，由于調(diào)換一下比賽的出場順序，就得到轉(zhuǎn)敗為勝的結(jié)果。1.2博弈論的發(fā)展簡史一、

起源法國經(jīng)濟(jì)學(xué)家奧古斯丁·古諾(AugustinCournot1838)——古諾模型英國經(jīng)濟(jì)學(xué)家弗朗西斯·埃奇沃斯(FrancisEdgeworth1881)伯川德(Bertrand)和斯坦克伯格(Stackelberg)二、

早期突破E·策墨羅(E·Zermelo)于1913年對于象棋游戲的研究。證明了象棋游戲總是有解，即在棋盤的任何一種狀態(tài)，兩個參與者中的一個有贏的策略。開創(chuàng)了求解一類博弈的技巧，即后退歸納法三、近代(1)約翰·馮·諾依曼(JohnvonNeumann)于1928發(fā)表的論文(2)1944年，科學(xué)家馮·諾伊曼和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦合著《博弈與經(jīng)濟(jì)行為的理論》(ThetheoryofGamesandEconomicBehaviour)被公認(rèn)為是博弈論的開山之作。以往的數(shù)學(xué)是在物理學(xué)的基礎(chǔ)上發(fā)展起來的，描述的是客觀世界行為，而經(jīng)濟(jì)學(xué)研究的對象更像是一場游戲中的參與者，相互之間預(yù)期對方的行動，因此，描述、觀察研究對象就需要一系列的數(shù)學(xué)工具，這一套新的數(shù)學(xué)工具，被他們命名為博弈論。奧斯卡·摩根斯坦（OskarMorgenstern）1902－1977，生于西里西亞的戈?duì)柪摺?944年加入美國籍。熱心于將數(shù)學(xué)應(yīng)用于人類的各種戰(zhàn)略問題（不管是商業(yè)、戰(zhàn)爭，還是科學(xué)研究），以便獲得最大利益和盡可能地減少損失。他認(rèn)為這些原理也同樣適用于哪怕簡單得象拋擲硬幣這樣的游戲，因而提出了對策論（博弈論）。約翰·馮·諾依曼

（JohnVonNeumann）1903－1957，美藉匈牙利人。18歲與老師合作發(fā)表第一篇數(shù)學(xué)論文，22歲獲數(shù)學(xué)博士學(xué)位。1927年一1929年馮·諾依曼相繼在柏林大學(xué)和漢堡大學(xué)擔(dān)任數(shù)學(xué)講師。1931年成為美國普林斯頓大學(xué)的第一批終身教授。1933年轉(zhuǎn)到該校的高級研究所，成為最初六位教授之一，并在那里工作了一生．馮·諾依曼是普林斯頓大學(xué)、賓夕法尼亞大學(xué)、哈佛大學(xué)、伊斯坦堡大學(xué)、馬里蘭大學(xué)、哥倫比亞大學(xué)和慕尼黑高等技術(shù)學(xué)院等校的榮譽(yù)博士．是美國國家科學(xué)院、秘魯國立自然科學(xué)院和意大利國立林且學(xué)院等院的院士．1954年任美國原子能委員會委員；1951年至1953年任美國數(shù)學(xué)會主席?！坝?jì)算機(jī)之父”“博弈論之父”。馮·諾依曼和摩根斯坦的貢獻(xiàn)1，提出博弈的概念；2，對效用理論給予公理依據(jù)；3，零和博弈(Zero-sumGames)的最優(yōu)解；4，引進(jìn)博弈論的一種形式，即合作博弈(cooperativeGames)博弈論的發(fā)展簡史四、發(fā)展1、納什均衡(Nash-Equilibrium)1950年，約翰·納什(JohnNash)引入均衡(解)的概念，即納什均衡，將博弈論從零和博弈推進(jìn)到非零和博弈(即參與人會出現(xiàn)雙贏或雙輸?shù)那闆r)合作博弈中的討價還價模型定義非合作博弈及證明均衡解的存在納什獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎2、

子博弈完美納什均衡和貝葉斯納什均衡(Subgame-PerfectNash-Equilibrium;Bayes-NashEquilibrium)1965年和1975年蘭哈德·澤爾藤(ReinhardSelten)把納什均衡推廣到動態(tài)博弈，并提出子博弈完美納什均衡；1967-1968年間，約翰·海薩尼(JohnHarsanyi)把納什思想推廣到不完全信息模型，提出貝葉斯均衡；他們與納什一起分享1994年諾貝爾經(jīng)濟(jì)學(xué)獎3、

不對稱信息條件下交易的對策1996年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者詹姆斯·莫里斯教授和威廉姆·維克瑞教授在20世紀(jì)60、70年代提示不對稱信息對交易帶來的影響，并提出相應(yīng)對策。4、

信息經(jīng)濟(jì)2001年諾貝爾經(jīng)濟(jì)學(xué)獎授予美國喬治·阿克爾洛夫教授、邁克爾·斯彭斯教授、約瑟夫·斯蒂格利茨教授。20世紀(jì)70年代他們提示當(dāng)代信息經(jīng)濟(jì)的核心，信息是有價值的。1970年阿克爾洛夫提出舊車市場模型并提出：市場放開不能解決所有問題，信息是有價值的1973年斯彭斯通過剖析人才市場盛行的造假行為指出人才市場存在用人單位與應(yīng)聘者之間的信息不對稱，造成“劣幣”驅(qū)逐“良幣”現(xiàn)象斯蒂格利茨將信息不對稱理論應(yīng)用于保險和金融市場52005年，以色列經(jīng)濟(jì)學(xué)家羅伯特-奧曼和美國經(jīng)濟(jì)學(xué)家托馬斯-謝林，因“通過博弈論分析加強(qiáng)了我們對沖突和合作的理解”所作出的貢獻(xiàn)而獲獎。三、博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎獲得者

1994年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者美國人約翰-海薩尼(JohnC.Harsanyi)和美國人約翰-納什(JohnF.NashJr.)以及德國人萊因哈德-澤爾騰(ReinhardSelten)

獲獎理由：在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn)，對博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。

約翰·納什

1928年生于美國約翰·海薩尼

1920年生于美國萊因哈德·澤爾騰，1930年生于德國1996年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者英國人詹姆斯·莫里斯(JamesA.Mirrlees)和美國人威廉-維克瑞(WilliamVickrey)獲獎理由：前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn)，尤其是不對稱信息條件下的經(jīng)濟(jì)激勵理論的論述；后者在信息經(jīng)濟(jì)學(xué)、激勵理論、博弈論等方面都做出了重大貢獻(xiàn)。詹姆斯·莫里斯

1936年生于英國威廉·維克瑞，1914-1996，生于美國2001年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者三位美國學(xué)者喬治-阿克爾洛夫(GeorgeA.Akerlof)、邁克爾-斯彭斯(A.MichaelSpence)和約瑟夫-斯蒂格利茨(JosephE.Stiglitz)獲獎理由：在“對充滿不對稱信息市場進(jìn)行分析”領(lǐng)域做出了重要貢獻(xiàn)。

約瑟夫·斯蒂格利茨，1943年生于美國的印第安納州，1967年獲美國麻省理工學(xué)院博士頭銜，曾擔(dān)任世界銀行的首席經(jīng)濟(jì)學(xué)家，現(xiàn)任美國哥倫比亞大學(xué)經(jīng)濟(jì)學(xué)教授喬治·阿克爾洛夫

1940年生于美國的紐黑文，1966年獲美國麻省理工學(xué)院博士頭銜，現(xiàn)為美國加利福尼亞州大學(xué)經(jīng)濟(jì)學(xué)教授。邁克爾·斯彭斯

1948年生于美國的新澤西，1972年獲美國哈佛大學(xué)博士頭銜，現(xiàn)兼任美國哈佛和斯坦福兩所大學(xué)的教授。2005年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者以羅伯特·奧曼色列經(jīng)濟(jì)學(xué)家羅伯特－奧曼（RobertJ.Aumann）和美國經(jīng)濟(jì)學(xué)家托馬斯·謝林（ThomasC.Schelling）

獲獎原因：“通過博弈論分析加強(qiáng)了我們對沖突和合作的理解”所作出的貢獻(xiàn)而獲獎。

羅伯特·奧曼托馬斯·謝林

1．博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域中應(yīng)用最廣泛，最成功；博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來發(fā)展引申的;2．經(jīng)濟(jì)學(xué)家對博弈論的貢獻(xiàn)也越來越大，特別是在動態(tài)分析和不完全信息引入博弈后，例如克瑞普斯，威爾遜都是經(jīng)濟(jì)學(xué)家;3．最根本性的原因是經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的，都強(qiáng)調(diào)個人理性，即追求給定條件下效用最大化。博弈專家之所以獲經(jīng)濟(jì)學(xué)獎，原因大致有三點(diǎn)：

★博弈論的基本概念

博弈是指一些個人、團(tuán)隊(duì)或組織，面對一定的環(huán)境條件，在一定的規(guī)則下，同時或先后，一次或多次，從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施，各自從中取得相應(yīng)結(jié)果的過程。

博弈論就是描述在這種形勢下各方理性地選擇自己的行動所實(shí)現(xiàn)的結(jié)果，分析各決策主體的行為發(fā)生相互作用時的決策以及這種決策的均衡問題。例：房地產(chǎn)開發(fā)1、AB兩個開發(fā)商，投資1億；2、如果市場上有兩棟房出售，需求大，每棟：1.4億；需求小，每棟：7千萬；如果市場上有一棟房出售，需求大，每棟：1.8億；需求小，每棟：1.1億；3、開發(fā)與不開發(fā)。

8種可能的結(jié)果1、需求大，A開發(fā)，B不開發(fā)，則A的利潤8千萬，B的利潤為0；2、需求大，A開發(fā)，B開發(fā)，則A的利潤4千萬，B的利潤4千萬；3、需求大，A不開發(fā)，B開發(fā)，則A的利潤0，B的利潤為8千萬；4、需求大，A不開發(fā)，B不開發(fā)，利潤各為05、需求小，A開發(fā)，B不開發(fā)，則A的利潤1千萬，B的利潤為0；6、需求小，A開發(fā)，B開發(fā)，則A的利潤-3千萬，B的利潤-3千萬；7、需求小，A不開發(fā)，B開發(fā)，則A的利潤0，B的利潤為1千萬；8、需求小，A不開發(fā)，B不開發(fā)，利潤各為0

如果需求是不確定的，是否開發(fā)依賴于各自在多大程度上認(rèn)為市場需求是大的及對方是否開發(fā)。例：如需求大的概率為0.3，A認(rèn)為B開發(fā)的可能性為x,那么A開發(fā)的期望利潤為：

Eu=0.3[4000x+8000(1-x)]+0.7[-3000x+1000(1-x)]A不開發(fā)的期望利潤為0。解Eu>0x<31/40★博弈三要素、信息及博弈均衡（1）局中人（player）：指參加博弈的各個決策個體，既可以是自然人，也可以是團(tuán)體。局中人都是“理性”的，即他清楚地了解自己的目標(biāo)或利益所在，在決策時考慮自己的知識（信息）以及對其他局中人策略的期望，總是采取最佳行動（或策略）以實(shí)現(xiàn)其支付的最大化。

虛擬局中人：自然，是外部隨機(jī)變量，對所有利益主體都無差異。一般用i=1…,n代表參與人，N代表自然

（2）行動與戰(zhàn)略（actionsorstrategies）。行動是局中人在博弈的某個時點(diǎn)的決策變量；每一個局中人的所有可能選擇的行動的集合稱這該局中人的行動空間（actionspace）；所有局中人的行動的一個有序集合稱為該博弈的一個行動組合（actionprofile）；

表示第i個參與人的一個特定行動；Ai={ai}表示可供i選擇的所有行動的集合；在n人博弈中，n個參與人的行動的有序集a=(a1,….,

ai,…..an)稱為行動組合

（2）行動與戰(zhàn)略（strategies）。是局中人在所有給定信息集（信息集是局中人在特定時刻進(jìn)行決策時所面對的集合）下的行動規(guī)則，他規(guī)定局中人在什么時候選擇什么行動。

表示第i個參與人的一個特定戰(zhàn)略；Si={si}表示可供i選擇的所有可選擇的戰(zhàn)略集合；在n人博弈中，n個參與人每人選擇一個戰(zhàn)略，n維向量s=(s1,….,

si,…..sn)稱為一個戰(zhàn)略組合

（3）信息（information）：是局中人有關(guān)博弈的知識，特別是有關(guān)其他局中人的特征（如策略空間、支付函數(shù)等等）和行動的知識。信息集（informationsets）是局中人在特定時刻進(jìn)行決策時，所面對的信息變量值的集合。共同知識（commonknowledge）是指“所有局中人知道，所有局中人知道所有局人知道，……”（或信息）。如果局中人的策略選擇、支付函數(shù)等都是共同知識，則稱之為完全信息（completeinformation），否則就是不完全信息（incompleteinformation）

（4）支付（payoff）：指在一個特定的策略組合下，局中人得到的效用水平或期望效用水平。一個局中人的支付是所有局中人的策略選擇的函數(shù)，它不僅取決于自己的策略選擇，而且還取決于（他所設(shè)想的）所有其他局中人的策略選擇，任何一個局中人改變自己的策略都將影響其他局中人的支付水平，即，局中人之間的利益是相互牽制的和制約的。所有局中人的支付的一個有序集合稱為博弈的一個支付組合（payoffprofile。

Ui=Ui(s1,s2,…si…sn)

參與博弈的多個局中人的收益可用一個矩陣或框圖表示，這種矩陣或框圖叫做收益矩陣。

（5）博弈均衡（gamesequilibrium）：是指所有局中人的最優(yōu)策略組合。S*=（S1*，…Si*,…Sn*)其中，Si*是第i個參與人在均衡情況下的最優(yōu)策略，它是i的所有可能的戰(zhàn)略中使Ui或Eui最大化的戰(zhàn)略。

（5）博弈均衡（gamesequilibrium）：為了把一個特定的參與人與其他參與人相區(qū)別，用那么，說博弈的類型

①根據(jù)博弈者選擇的策略，博弈論可劃分為合作博弈與非合作博弈。納什（Nash）、澤爾騰（Selten）和豪爾紹尼（Harsanyi）（1994諾貝爾經(jīng)濟(jì)學(xué)獎獲得者）的主要貢獻(xiàn)在于非合作博弈方面，而且現(xiàn)在大多數(shù)經(jīng)濟(jì)學(xué)家論及博弈時，也主要是指非合作博弈。

合作博弈和非合作博弈的區(qū)別在于人們的行動為相互作用時，當(dāng)事人能否達(dá)成一個具有約束力（bindingagreement）的協(xié)議。若有，就是合作博弈；否則就是非合作博弈。合作博弈強(qiáng)調(diào)的是團(tuán)體理性、效率、公正和公平。非合作博弈強(qiáng)調(diào)的是個人理性、個人最優(yōu)決策，其結(jié)果可能是有效率的，也可能是無效率的。

②從局中人行動的先后順序可劃分為靜態(tài)博弈（Staticgame）和動態(tài)博弈（dynamicgame）。靜態(tài)博弈是指在博弈中，局中人同時選擇行動或雖非同時行動但后行動者并不知道先行動者采取了什么具體行動。動態(tài)博弈是指局中人的行動有先后順序，且后行動者能夠觀察到先行動者所選擇的行動。

③從局中人是否具有有關(guān)其他參與人（對手）的特征、策略空間及支付函數(shù)方面的知識的角度，可劃分為完全信息博弈(gameofcompleteinformation)和不完全信息博弈(gameofincomplete

information)。

★博弈的分類特征完全信息不完全信息靜態(tài)納什均衡納什（1950，1951）貝葉斯納什均衡豪爾紹尼（1967，1968）動態(tài)子博弈精練納什均衡澤爾騰（1965）精練貝葉斯納什均衡澤爾騰（1975）克瑞普斯和威爾遜（1982）零和博弈與非零和博弈

(zero-sumgameandnon-zero-sumgame)如果一個博弈在所有各種對局下全體參與人之得益總和總是保持為零，這個博弈就叫零和博弈；相反，如果一個博弈在所有各種對局下全體參與人之得益總和不總是保持為零，這個博弈就叫非零和博弈。零和博弈是利益對抗程度最高的博弈。常和博弈與非常和博弈

（constant-sumgameandvariable-sumgame）如果一個博弈在所有各種對局下全體參與人之得益總和總是保持為一個常數(shù)，這個博弈就叫常和博弈；相反，如果一個博弈在所有各種對局下全體參與人之得益總和不總是保持為一個常數(shù)，這個博弈就叫非常和博弈。常和博弈也是利益對抗程度最高的博弈。非常和（變和）博弈蘊(yùn)含雙贏或多贏。博弈的表述方式：戰(zhàn)略式與擴(kuò)展式戰(zhàn)略式表述又稱為標(biāo)準(zhǔn)式表述，在這種表述中，所有參與人同時選擇各自的戰(zhàn)略，所有參與人選擇的戰(zhàn)略一起決定每個參與人的支付。博弈的表述方式：策略式與擴(kuò)展式策略式：支付矩陣

囚犯B的策略囚犯A的策略坦白抵賴坦白-8，-80，-10抵賴-10，0-1，-1擴(kuò)展式：博弈樹（4,4）（8,0）（-3,-3）（1,0）（0,8）（0,0）（0,1）（0,0）開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)BBBB大大小小開發(fā)不開發(fā)NN（1/2）（1/2）（1/2）（1/2）8-1A

博弈論進(jìn)入主流經(jīng)濟(jì)學(xué)，反映了經(jīng)濟(jì)學(xué)發(fā)展的以下幾個趨勢：

第一，經(jīng)濟(jì)學(xué)研究的對象越來越轉(zhuǎn)向個體，放棄了一些沒有微觀基礎(chǔ)的假定，如消費(fèi)函數(shù)及其投資函數(shù)、銷售最大化等，一切從個人效用函數(shù)及其約束條件開始，解約束條件下的個人效用函數(shù)及其約束條件開始，解約束條件下的個人效用最大化問題而導(dǎo)出行為及均衡結(jié)果。

第二，經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究，特別是人與人之間行為的相互影響和作用，人們之間的利益沖突與一致，競爭與合作的研究。第三，經(jīng)濟(jì)學(xué)越來越重視對信息的研究，特別是信息不對稱對個人選擇及制度安排的影響。完全信息靜態(tài)博弈一、占有戰(zhàn)略均衡二、重復(fù)剔除的占優(yōu)戰(zhàn)略均衡三、納什均衡四、混合戰(zhàn)略納什均衡五、納什均衡的存在性與多重性完全信息靜態(tài)博弈的幾點(diǎn)特性同時出招，出招一次；知道博弈結(jié)構(gòu)與游戲規(guī)則（共同知識）；不管是否溝通過，無法做出有約束力的承諾（非合作）

一、占優(yōu)戰(zhàn)略均衡

通常情況下，每個局中人的支付是博弈中所有參與人策略的函數(shù)，故每個局中人的最優(yōu)策略選擇依賴于所有其他參與人的策略選擇。但在一些特殊博弈中，一個參與人的最優(yōu)策略選擇可能并不依賴于其他參與人的策略選擇，即無論其他參與人選擇什么策略，他的最優(yōu)策略是唯一的，這種最優(yōu)策略被稱為“占優(yōu)策略”（dominantstrategy）。定義：在博弈G={N,(Si)iN,(Ui)iN}中，如果對所有的參與人i,si*是它的占優(yōu)戰(zhàn)略，那么所有參與人選擇的戰(zhàn)略組合（s1*,…,sn*）成為該對策的占優(yōu)戰(zhàn)略均衡。例：“囚徒困境”囚徒困境是博弈論中的經(jīng)典案例。該故事講的是，兩個嫌疑犯作案后被警察抓住，分別被關(guān)在不同的房間里進(jìn)行審訊。警察知道兩人有罪，但缺乏有力的證據(jù)，除非兩人之中有一個坦白。警察告訴每個人，他們的可選擇的策略與支付如下表：一、占優(yōu)策略均衡

在該博弈中，每個囚徒有兩種可能選擇的策略：坦白和抵賴。顯然，無論同伙選擇什么策略，每個囚徒的最優(yōu)策略都是“坦白”。如，B選擇坦白，若A選擇坦白時支付為-8，選擇抵賴時支付為-10，因而坦白比抵賴好；若B選擇抵賴，A坦白時的支付為0，抵賴時為-1，因而坦白比抵賴好。即是說，“坦白”是A的占優(yōu)策略。同樣，“坦白”也是B的占優(yōu)策略。

囚犯B的策略囚犯A的策略坦白抵賴坦白-8，-80，-10抵賴-10，0-1，-1“囚犯困境”的擴(kuò)展兩個寡頭企業(yè)選擇產(chǎn)量公共產(chǎn)品的供給軍備競賽經(jīng)濟(jì)改革結(jié)論：一種制度安排，要發(fā)生效力。必須是一種納什均衡；否則，制度安排便不能成立。價格大戰(zhàn)低價高價低價3，36，1高價1，65，5支付百事可樂可口可樂二、重復(fù)剔除的占優(yōu)戰(zhàn)略均衡

在絕大多數(shù)博弈中，并不存在占優(yōu)策略均衡。但在有些博弈中，仍可應(yīng)用占優(yōu)的邏輯找出均衡。案例：“豬智博弈”豬圈里有兩頭豬（大豬和小豬），豬圈一頭有一豬食槽,另一頭安裝著一個按制豬食供應(yīng)的按鈕，按一下鈕，有8個單位的豬食進(jìn)槽，但需2個單位的成本。兩頭豬有兩種策略：按鈕和等待。具體的博弈支付和結(jié)果如下表：

按按鈕的豬吃到的豬食大豬小豬大豬44小豬71兩豬同時53

按按鈕對對吃食量的影響小豬按按鈕等待大豬按按鈕3，12，4等待7，-10，0

豬智博弈

依賴于小豬的策略：若小豬選“等待”，大豬的最優(yōu)策略是“按”；若小豬選“按”，大豬的最優(yōu)策略為“等待”。因此，不能用上述占優(yōu)策略找出均衡。可能的均衡是什么呢？若小豬是理性的，他只會選“等待”，因?yàn)椤暗却眹?yán)格優(yōu)于“按”。假定大豬知道小豬是理性的，則會預(yù)測到小豬的選擇；此時，大豬的最優(yōu)選擇只能是“按”。因此，（按，等待）是該博弈唯一的均衡。找出上述均衡的思路是：先找出某個參與人的劣策略（假定存在），把它剔除，重新構(gòu)造一個不包含已剔除策略的新博弈；然后再剔除新博弈中某個參與人的劣策略；……直至剩下一個唯一的策略組合。該策略組合就是博弈的均衡解，稱為“重復(fù)剔除的占優(yōu)策略智豬博弈的擴(kuò)展股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東股票市場上炒股票的大戶與小戶市場中大企業(yè)與小企業(yè)在研發(fā)、廣告上的博弈公共產(chǎn)品的提供（富戶與窮戶）改革中不同利益分配對改革的推動二、重復(fù)剔除的占優(yōu)戰(zhàn)略均衡絕對劣勢戰(zhàn)略：si是一絕對劣勢戰(zhàn)略當(dāng)且僅當(dāng)存在另一戰(zhàn)略si’Si使得ui(si,s-i)<ui(si’,s-i)對所有s-iS-i均成立。（si’未必是優(yōu)勢戰(zhàn)略）重復(fù)剔除的占優(yōu)戰(zhàn)略均衡：逐次刪去絕對劣勢戰(zhàn)略得到唯一的占優(yōu)戰(zhàn)略。

例：找出下列博弈的重復(fù)剔除的占優(yōu)策略均衡局中人BLMR局中人AU1，01，20，1D0，30，12，0

解：局中人BLM局中人AU1，01，2D0，30，1局中人BLM局中人AU1，01，2三、納什均衡定義：指一戰(zhàn)略組合有以下特性：當(dāng)參與人持此戰(zhàn)略后，任一參與人均無誘因偏離這一均衡；s*=(s1*,…,sn*)=(si*,s-i*)是一納什均衡，當(dāng)且僅當(dāng)對所有參與人而言，ui(si*,s-i*)ui(si’,s-i*)對所有si’Si

均成立。簡單而言，當(dāng)s1*是對s2*的最適反應(yīng)，s2*也是s1*的最適反應(yīng)時，（s1*,s2*）就是二人博弈的納什均衡。命題1：納什均衡在占優(yōu)戰(zhàn)略重復(fù)剔除解法中不會被剔除命題2：重復(fù)剔除的嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡。

策略組合就是一個納什均衡。表Ⅰ參與人BLCR參與人AU0，44，05，3M4，00，45，3D3，53，56，6先看看書上怎么定義通俗地說設(shè)想在博弈論預(yù)測的博弈結(jié)果中，為使該預(yù)測是正確的，局中人自愿選擇的戰(zhàn)略必須是理論給他推導(dǎo)出的戰(zhàn)略。這樣，每個局中人要選擇的戰(zhàn)略必須是針對其他參與者選擇戰(zhàn)略的最優(yōu)戰(zhàn)略。這種理論推測結(jié)果可以叫做“戰(zhàn)略穩(wěn)定”或“自動實(shí)施”的，因?yàn)闆]有參與人愿意獨(dú)自離棄他所選定的戰(zhàn)略，我們把這一狀態(tài)稱為納什均衡。再通俗一點(diǎn)給定你的策略，我的策略是最好的策略；給定我的策略，你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。假設(shè)n個參與人在博弈之前達(dá)成一個協(xié)議，規(guī)定每一個參與人選擇一個特定的戰(zhàn)略，在沒有外在強(qiáng)制力的情況下，如果沒有任何人有積極性破壞這個協(xié)議，則這個協(xié)議是自動實(shí)施的。這個協(xié)議就構(gòu)成了一個納什均衡。一個例子在電影《美麗心靈》中，納什和他的伙伴到酒吧喝酒。遇到一位漂亮的金發(fā)美女和她的女伴們，此時音樂響起。男士和女士可以結(jié)伴跳舞。Bob和Tom是僅有的想邀請女士跳舞的兩位男士，而想跳舞的女士加上金發(fā)美女一共有3人，相對于其他女士，男士們更喜歡與金發(fā)美女共舞，不過有女伴要比無人陪伴要好。電影中，納什發(fā)現(xiàn)如果所有男士都去追求金發(fā)美女，他們不僅會被拒絕。還將惹惱其他女士，結(jié)果是男士都沒有找到女伴，這是最壞的結(jié)果。四、混合戰(zhàn)略納什均衡單純戰(zhàn)略與混合戰(zhàn)略的定義如果一個戰(zhàn)略規(guī)定參與人在每一個給定的信息情況下只選擇一種特定的行動，則稱該戰(zhàn)略為純戰(zhàn)略；如果一個戰(zhàn)略規(guī)定參與人在給定的信息情況下以某種概率分布隨機(jī)地選擇不同的行動，則稱該戰(zhàn)略為混合戰(zhàn)略。定義：在n個參與人博弈的戰(zhàn)略式表述單純戰(zhàn)略與混合戰(zhàn)略的定義單純戰(zhàn)略是混合戰(zhàn)略的特例，因?yàn)槿我粏渭儜?zhàn)略si都可以理解為i以概率1選擇si，以0概率選取其他所有單純戰(zhàn)略。引入混合戰(zhàn)略，參與人的目標(biāo)需要修改為“最大化自己的期望支付”社會福利博弈

流浪漢的策略政府的策略尋找工作游蕩救濟(jì)3，2-1，3不救濟(jì)-1，10，0政府的期望效用：流浪漢的期望效用：擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支付

p1-pq1-q參與人1:maxEu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1))=-pq+q-pq+p-pq-1+q+p-pq=-4pq+2q+2p-1一階條件為零求得：p=1/2擲硬幣的分析給定參與人1（q,1-q），參與人2的支付是：q+(-1)(1-q)（正面）=(-1)q+(1-q)（反面）;給定參與人2（p,1-p），參與人1的支付為：p(-1)+(1-p)（正面）=p+(-1)(1-p)（反面）；求得（1/2，1/2）是納什混合戰(zhàn)略均衡

混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對方知道或猜到自己的選擇，因而必須在決策時利用隨機(jī)性；兩博弈方選擇每種策略的概率一定要恰好使對方無機(jī)可乘，即讓對方無法通過針對性地傾向某一策略而在博弈中占上風(fēng)。例：在擲硬幣的博弈中，參與人1選正面、反面的概率q,1-q，一定要使參與人2選正面的和反面的期望得益相等。五納什均衡的存在性與多重性混合戰(zhàn)略納什均衡純戰(zhàn)略納什均衡重復(fù)剔除占優(yōu)均衡占優(yōu)均衡不同均衡概念之間的關(guān)系納什均衡的存在性每一個有限博弈（博弈有有限個參與人且每個參與人有有限個純戰(zhàn)略）至少存在一個納什均衡，這均衡有可能是混合戰(zhàn)略均衡納什均衡的多重性納什均衡不唯一，如性別戰(zhàn)斗雞博弈0，00，2退2，0-3，-3進(jìn)退進(jìn)12支付“斗雞博弈”的擴(kuò)展夫妻間吵架警察與游行隊(duì)伍公共產(chǎn)品的供給（兩富戶修路）案例性別戰(zhàn)1，30，0足球0，02，1時裝足球時裝妻子支付

p1-pq1-q丈夫性別戰(zhàn)：混合策略均衡給定妻子分別以q,1-q的概率選擇時裝、足球，則丈夫選擇時裝、足球的期望收益相等，即1.q+0.(1-q)=0.q+3.(1-q)，解得妻子選擇時裝、足球的概率分別為（3/4，1/4）給定丈夫分別以p,1-p的概率選擇時裝、足球，則妻子選擇時裝、足球的期望收益相等，即2.p+0.(1-p)=0.p+1.(1-p)，解得妻子選擇時裝、足球的概率分別為（1/3，2/3）當(dāng)妻子以（3/4，1/4）的概率分布隨機(jī)選擇時裝表演和足球，丈夫以（1/3，2/3）的概率隨機(jī)選擇時裝表演和足球時，雙方都無法通過單獨(dú)改變策略，即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益，因此雙方的上述概率分布的組合構(gòu)成一個混合策略納什均衡。該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為：q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4雙方的期望收益均小于純策略時的期望收益。性別戰(zhàn)：混合策略均衡焦點(diǎn)均衡（focalpoint）當(dāng)一個博弈有多個納什均衡時，博弈論并沒有一個一般的理論來證明納什均衡結(jié)果一定會出現(xiàn)。在現(xiàn)實(shí)生活中，參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個“焦點(diǎn)”均衡。這些信息可能與社會文化習(xí)慣、參與人過去博弈的歷史有關(guān)。（Schelling,1960)例，在性別戰(zhàn)中，如果今天是丈夫的生日，（足球、足球）可能是一個焦點(diǎn)均衡；而如果是妻子的生日，（時裝、時裝）可能是一個焦點(diǎn)均衡。完全信息動態(tài)博弈1.博弈的擴(kuò)展式要點(diǎn)解釋2.房地產(chǎn)開發(fā)博弈的另外幾種類型解釋3.逆向歸納法1.博弈的擴(kuò)展式在靜態(tài)博弈中，所有參與人同時行動（或行動雖有先后，但沒有人在自己行動之前觀測到別人的行動）；在動態(tài)博弈中，參與人的行動有先后順序，且后行動者在自己行動之前能觀測到先行動的行動。正如博弈論專家習(xí)慣于用戰(zhàn)略式表述描述和分析靜態(tài)一樣，他們也習(xí)慣于用擴(kuò)展式表述來描述和分析動態(tài)博弈。博弈的擴(kuò)展式表述所“擴(kuò)展”的主要是參與人的戰(zhàn)略空間。擴(kuò)展式表述要給出每個戰(zhàn)略的動態(tài)描述：誰在什么時候行動，每次行動時有些什么具體行動可供選擇，以及知道些什么。簡單地說，在擴(kuò)展式表述中，戰(zhàn)略對應(yīng)于參與人的相機(jī)行動規(guī)則，即什么情況下選擇什么行動，而不是簡單的、與環(huán)境無關(guān)的行動選擇。具體來講，博弈的擴(kuò)展式表述包括以下要素：參與人集合：i=1，…，n，此外，我們將用N代表虛擬參與人“自然”；參與人的行動順序：誰在什么時候行動；參與人的行動空間：在每次行動時，參與人有些什么選擇；參與人的信息集：每次行動時，參與人知道些什么；參與人的支付函數(shù)：在行動結(jié)束之后，每個參與人得到些什么（支付是所有行動的函數(shù)）；外生事件（即自然的選擇）的概率分布。文字表述的博弈擴(kuò)展式要點(diǎn)的含義為:1.參與人:開發(fā)商A與開發(fā)商B2.行動順序：⑴開發(fā)商首先行動，選擇開發(fā)或不開發(fā)；⑵在A決策后，自然選擇市場需求的大??；⑶開發(fā)商B在觀測到A的決策和市場需求后，決定開發(fā)或不開發(fā)。3.戰(zhàn)略空間：

A只有一個信息集，兩個可選擇的行動，因而A的行動空間也即戰(zhàn)略空間：SA=（開發(fā)，不開發(fā)）。但B有兩個信息集，每個信息集上有兩個可選擇的行動，因而B有四個純戰(zhàn)略，分別為：⑴不論A開發(fā)還是不開發(fā)，我開發(fā)；⑵A開發(fā)我開發(fā)，A不開發(fā)我不開發(fā)；⑶A開發(fā)我不開發(fā)，A不開發(fā)我開發(fā)；⑷不論A開發(fā)還是不開發(fā)，我不開發(fā)?？珊唽憺閧開發(fā)，開發(fā)}，{開發(fā)，不開發(fā)}，{不開發(fā)，開發(fā)}和{不開發(fā)，不開發(fā)}。4.信息集：開發(fā)商A行動時有兩種選擇——“開發(fā)”和“不開發(fā)”，開發(fā)商A行動時不知道開發(fā)商B的行動開發(fā)商B行動時有兩者選擇——“開發(fā)”和“不開發(fā)”，但開發(fā)商B行動時已經(jīng)知道了開發(fā)商的行動。5.支付函數(shù)：開發(fā)商A開發(fā)：投入1億元資金不開發(fā)：不投入資金，利潤為0需求大需求小對手不開發(fā)，獲利潤8千萬對手開發(fā)，獲利潤4千萬對手不開發(fā)，獲利潤1千萬對手開發(fā)，虧損3千萬在上述例子中，我們用文字描述的方法給出了博弈問題的擴(kuò)展式描述。也可以采用更為直觀的擴(kuò)展式博弈的描述方式——博弈樹。博弈樹的構(gòu)成1．結(jié)(nodes)：結(jié)包括決策結(jié)(decisionnodes)和終點(diǎn)結(jié)(terminalnodes)兩類。決策結(jié)是參與人采取行動的時點(diǎn)，終點(diǎn)結(jié)是博弈行動路徑的終點(diǎn)。在博弈樹中，“誰在什么時候行動”用在決策結(jié)旁邊標(biāo)注參與人的辦法來表示。參與人的支付標(biāo)注在博弈樹終點(diǎn)結(jié)處。2．枝(branches)：在博弈樹上，枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線，每一個枝代表參與人的一個行動選擇。3．信息集(informationsets)：博弈樹上的所有決策結(jié)分割成不同的信息集。每一個信息集是決策結(jié)集合的一個子集。該子集包括所有滿足下列條件的決策結(jié)：(1)每一個決策結(jié)都是同一參與人的決策結(jié)；(2)該參與人知道博弈進(jìn)入該集合的的某個決策結(jié)，但不知道自己究竟處于哪一個決策結(jié)。A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點(diǎn)結(jié)枝結(jié),初始結(jié)

信息集參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

B在決策時不確切地知道自然的選擇;B的決策結(jié)由4個變?yōu)?個房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

B知道自然的選擇;但不知道A的選擇(或A、B同時決策)

房地產(chǎn)開發(fā)博弈信息集：博弈樹上的所有決策結(jié)分割成不同的信息集。滿足下列條件：（1）每一個決策結(jié)都是同一參與人的決策結(jié)。（2）該參與人知道博弈進(jìn)入該集合的某個決策結(jié)，但不知道自己處于哪一個決策結(jié)。2.房地產(chǎn)開發(fā)博弈的類型解釋博弈Ⅰ：B知道A的選擇和自然選擇之后決策。博弈Ⅱ：B在決策時并不確切知道自然的選擇。博弈Ⅲ：B知道N但不知道A的選擇，A既不知道N的選擇也不知道B的選擇。如果博弈樹的所有信息都是單結(jié)的，該博弈稱為完美信息博弈。在博弈樹上，完美信息意味著沒有任何兩個決策結(jié)實(shí)用虛線連起來的。自然的信息集總是假定為單結(jié)的。因?yàn)樽匀皇请S機(jī)行動的，自然在參與人決策之后行動等價于自然在參與人決策之前行動但參與人不能觀測到自然的行動。因而博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛線取決于我們?nèi)绾蝿潧Q策結(jié)的順序。改變圖2.1的決策順序3.逆向歸納法(backwardinduction)在有限博弈中，我們可以用逆向歸納法求解精煉納什均衡：從最后一個決策點(diǎn)開始，找出該子博弈的納什均衡；然后再倒回到倒數(shù)第二個決策點(diǎn)，找出決策者的最優(yōu)決策（假定最后一個決策者的決策是最優(yōu)的；如此一直到初始決策點(diǎn)，所有子博弈上的最優(yōu)選擇就是精煉納什均衡。又稱“rollback”.如同重復(fù)剔除的占優(yōu)均衡要求“所有參與人是理性的”是共同知識一樣，用逆向歸納法求解均衡也要求“所行參與人是理性的”是共同知識。舉例121（2，0）（5，0）（4，2）（1，1）UDRLU’D’最終結(jié)果，1選擇U，2的信息集不在均衡路徑。蜈蚣博弈悖論“蜈蚣博弈悖論”（簡稱“蜈蚣悖論”）是在博弈論及博弈邏輯的研究中發(fā)現(xiàn)的悖論，是一種合理行為選擇的悖論。“蜈蚣博弈”(centipedegame)是由羅森塞爾(Rosenthal)在1981年提出的一個動態(tài)博弈問題。由于這個博弈的擴(kuò)展形很像一條蜈蚣，因此被稱為“蜈蚣博弈”。它是指這樣一個博弈：兩個博弈方A、B輪流進(jìn)行策略選擇，可供選擇的策略有“合作”和“不合作”兩種。他們的博弈展開式如下：A——B——A——……A——B——A——B——(10,10)|****|***|******|****|****|***|(1,1)*(0,3)*(2,2)***(8,8)*(7,10)*(9,9)*(8,11)逆向歸納法的問題逆向歸納法只能分析明確設(shè)定的博弈問題，要求博弈的結(jié)構(gòu)，包括次序、規(guī)則和得益情況等都非常清楚，并且各個博弈方了解博弈結(jié)構(gòu)，相互知道對方了解博弈結(jié)構(gòu)。這些可能有脫離實(shí)際的可能逆向歸納法也不能分析比較復(fù)雜的動態(tài)博弈在遇到兩條路徑利益相同的情況時逆推歸納法也會發(fā)生選擇困難對博弈方的理性要求太高，不僅要求所有博弈方都有高度的理性，不允許犯任何錯誤，而且要求所有博弈方相互了解和信任對方的理性，對理性有相同的理解，或進(jìn)一步有“理性的共同知識”A——B——A——……A——B——A——B——(10,10)

|****|***|******|****|****|***|

(1,1)*(0,3)*(2,2)***(8,8)*(7,10)*(9,9)*(8,11)在圖中，博弈從左到右進(jìn)行，橫向連桿代表合作策略，向下的連桿代表不合作策略。每個人下面對應(yīng)的括號代表相應(yīng)的人采取不合作策略，博弈結(jié)束后，各自的收益，括號內(nèi)左邊的數(shù)字代表A的收益，右邊代表B的收益。如果一開始A就選擇了不合作，則兩人各得1的收益，而A如果選擇合作，則輪到B選擇，B如果選擇不合作，則A收益為0，B的收益為3，如果B選擇合作，則博弈繼續(xù)進(jìn)行下去?？梢钥吹矫看魏献骱罂偸找嬖诓粩嘣黾樱献髅坷^續(xù)一次總收益增加1，如第一個括號中總收益為1＋1＝2，第二個括號為0＋3＝3，第二個括號則為2＋2＝4。這樣一直下去，直到最后兩人都得到10的收益，總體效益最大。遺憾的是這個圓滿結(jié)局很難達(dá)到！A——B——A——……A——B——A——B——(10,10)

|****|***|******|****|****|***|

(1,1)*(0,3)*(2,2)***(8,8)*(7,10)*(9,9)*(8,11)大家注意，在上圖中最后一步由B選擇時，B選擇合作的收益為10，選擇不合作的收益為11。根據(jù)理性人假設(shè)，B將選擇不合作，而這時A的收益僅為8。A考慮到B在最后一步將選擇不合作，因此他在前一步將選擇不合作，因?yàn)檫@樣他的收益為9，比8高。B也考慮到了這一點(diǎn)，所以他也要搶先A一步采取不合作策略……如此推論下去，最后的結(jié)論是：在第一步A將選擇不合作，此時各自的收益為1！這個結(jié)論是令人悲傷的。不難看出，在該博弈的推理過程中，運(yùn)用的是逆推法。從邏輯推理來看，逆推法是嚴(yán)密的，但結(jié)論是不合理的。因?yàn)橐婚_始就停止的策略A、B均只能獲取1，而采取合作性策略有可能均獲取10，當(dāng)然A一開始采取合作性策略有可能獲得0，但1或者0與10相比實(shí)在是很小。直覺告訴我們采取“合作”策略是好的。而從邏輯的角度看，A一開始應(yīng)選擇“不合作”的策略。人們在博弈中的真實(shí)行動“偏離”了運(yùn)用逆推法關(guān)于博弈的理論預(yù)測，造成二者間的矛盾和

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第五講博弈論105

文檔簡介

溫馨提示

最新文檔

評論

第五講 博弈論105

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第五講博弈論105