




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、博弈模型,第一部分、博弈論基本概念,宇宙間處處存在矛盾、沖突、爭斗、合作、共生等現(xiàn)象,這些現(xiàn)象很很早就引起各類學(xué)者的重視。哲學(xué)家們對此作過深刻討論,毛澤東的矛盾論便是其中的代表。另一方面,數(shù)學(xué)被認(rèn)為是科學(xué)的語言,能否用數(shù)學(xué)語言描述各種帶有矛盾因素的模型或現(xiàn)象?博弈論便是這樣一種處理各類帶有矛盾因素的模型的數(shù)學(xué)工具,現(xiàn)在已被數(shù)學(xué)、經(jīng)濟(jì)學(xué)、社會學(xué)、軍事學(xué)、生物學(xué)等專家廣泛應(yīng)用于討論各類帶有沖突、矛盾、合作、競爭、進(jìn)化等問題及相關(guān)模型之中。博弈論已成為人們分析復(fù)雜系統(tǒng)與作重大決策時的有力工具。,一、引言,數(shù)學(xué)歷史悠久,并且不斷發(fā)展前進(jìn),被稱為“科學(xué)的語言”。在20世紀(jì)前,它最有效的應(yīng)用范圍是天文、物
2、理、力學(xué)等所謂精確的自然科學(xué)。由于概率論與統(tǒng)計理論的發(fā)展,數(shù)學(xué)又逐漸應(yīng)用于生物學(xué)與社會科學(xué),而分析矛盾現(xiàn)象的數(shù)學(xué)方法和理論也是在這一背景下于20世紀(jì)初開始萌芽并逐步發(fā)展起來的,這個數(shù)學(xué)分枝稱為博弈論(Game Theory)。,數(shù)學(xué)研究的方法是從大量的同類現(xiàn)象中抽象出基本要素,進(jìn)步構(gòu)造出能描述這類現(xiàn)象的模型。許多沖突模型在游戲中就存在,博弈論早期就是由研究國際象棋開始的,所以被命名為Game Theory。人們很快認(rèn)識到此種理論可用于經(jīng)濟(jì)、政治、軍事等領(lǐng)域,所謂“世事紛爭一棋局”,正說明其中一些道理。1944年馮諾曼(John,Von Neumann)和奧摩根斯特恩(Osker Morgent
3、ern)合著的競賽論與經(jīng)濟(jì)行為(Theory Of GSmes and Economic Behavior)問世,總結(jié)了初期研究成果,奠定了博弈論的基礎(chǔ)。由于該理論主要討論在復(fù)雜的矛盾沖突等活動中,局中人(Player)采取何種合理的策略(strategy)而能處于“優(yōu)越”的地位,以便取得較好效益,所以將它譯為博弈論。,博弈論(Game theory)可以被定義為是對智能的理性決策者之間沖突與合作的數(shù)學(xué)模型的研究。博弈論為分析那些涉及兩個或更多個參與者且其決策會影響相互間的福利的局勢提供了一般的數(shù)學(xué)方法。就此而論,博弈論便為社會科學(xué)各分支的學(xué)者和實際的決策者提供了非常重要的視角。博奕理論家所研
4、究的局勢,不僅僅是“游戲(Game)”一詞所不幸表示的消遣活動,“沖突分析”或“相互影響的決策理論”或許是描述博弈論更為準(zhǔn)確的術(shù)語。,博弈理論家力圖通過研究定量模型和假設(shè)例子來理解沖突與合作。這些例子可能在很多方面都是脫離現(xiàn)實的簡化,但與實際生活中大量更為復(fù)雜的情況相比,這種簡化能使我們更容易看出沖突與合作的一些基本問題。當(dāng)然,這也是任何一個研究領(lǐng)域都應(yīng)用的分析方法把問題放在忽略掉現(xiàn)實中不重要的細(xì)枝末節(jié)的一個簡化模型中加以考慮。因此,即使從未遇到像博弈理論家在研究中明確規(guī)定局中人立場的局勢,研究過這些假設(shè)例子的人們,仍然能夠較好地理解實際的競爭局勢。,常見的游戲如棋類,兩人對奕,此兩人便稱為局
5、中人,他們各有一套棋路,或善于用馬,或長于用炮。在每次輪到一方走子時,他可能有許多走法,這些走法依賴于當(dāng)時棋局形勢以及棋手想要達(dá)到的目的,以及他慣用的走法,從而形成他走棋的指導(dǎo)思想。對奕時指導(dǎo)棋手行動的思想便稱為策略。對局終了可能有三種結(jié)局:甲勝;乙勝;和局。如果用數(shù)量表示各種結(jié)局,例如勝家贏得彩金若干(設(shè)所得彩金由輸家付給,則輸家當(dāng)然失去若干),和局時都不能取得彩金,此種表示結(jié)局的數(shù)稱為支付(payoff)。局中人、策略、支付是博弈論中常見的基本概念。,有些游戲中并無“機(jī)會”(chance)因素,而是全憑局中人的技藝。但某些游戲如“橋牌”、“打百分”等,“機(jī)會”卻有較大作用,分發(fā)到游戲者手中
6、的牌是隨機(jī)的,它們情況要復(fù)雜一些。,游戲并非只有雙方,可以有多方,如三人玩的跳棋便有三個局中人。一般只有兩個局中人的稱為兩人博奕(或二人對策),有二個局中人的稱為n人博弈。,在博弈論的語言中,一個博弈(game)指的是涉及到兩個或更多個參與人的某個社會局勢。博弈所涉及的參與人被稱為局中人(players)。正如前面博弈論的定義所述,博弈理論家一般要對局中人做兩個基本的假設(shè):他們都是理性的和他們都是智能的。這兩個形容詞在這里都是技術(shù)性術(shù)語,所以需要對其逐一解釋。,如果一個決策者在追逐其目標(biāo)時能前后一致地做決策,我們就稱他是理性的(rational)。在基于決策理論的基本結(jié)論而建立起來的博弈論中,
7、我們假設(shè)每個局中人的目標(biāo)是追求其個人期望支付值的最大化,支付則是用某個效用(Utility)尺度來度量的。理性決策者應(yīng)該按使自己的期望支付最大化的方式去做決策的思想,至少可以追溯到伯努里(Bernoull,1738),但這個思想在近代被辨明為是正當(dāng)?shù)模瑒t應(yīng)歸功于馮諾依曼和摩根斯特恩(1947)。借助關(guān)于理性決策者應(yīng)該如何行動方面所做的一些非常弱的假設(shè),他們證明了,對任一理性的決策者,一定存在某種方式對他所關(guān)心的各種可能結(jié)果賦予效用數(shù)值,使其總是選擇最大化自己的期望效用。我們稱這一結(jié)論為期望效用最大化定理(expectedutility maximization theorem)。,二、 博弈論
8、概述,、博弈論幾個經(jīng)典的例子 、博弈論的基本概念 、博弈論與經(jīng)濟(jì)學(xué),、博弈論幾個經(jīng)典的例子,兩個共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一個人招認(rèn)犯罪,否則警方無充分證據(jù)將他們按罪判刑。警方把他們關(guān)入不同的牢室,并對他們說明不同行動帶來的后果。如果兩人都采取沉默的抗拒態(tài)度,因警方證據(jù)不足,兩人將均被判為輕度犯罪入獄1個月;如果雙方都坦白,根據(jù)案情兩人將被判入獄6個月;如果一個招工而另一個拒不坦白,招認(rèn)者因有主動認(rèn)罪立功表現(xiàn)將立即釋放,而另一人將被判入獄9個月(所犯罪行判6個月,干擾司法加判3個月)。,例一 囚徒困境,囚徒困境問題可以用圖11所示的雙變量矩陣的形式來描述。,在此博弈中,每個
9、囚徒有兩種戰(zhàn)略可供選擇:坦白(或招認(rèn))、不坦白(或沉默)。圖1-1的矩陣中每一個單元的兩個數(shù)字表示一組特定的戰(zhàn)略組合下兩個囚犯的收益(或支付、效用,這里已經(jīng)開始引用經(jīng)濟(jì)學(xué)的術(shù)語了),其中第1個數(shù)字是囚徒1(習(xí)慣上是位于矩陣橫行上的參與者)的收益,第2個數(shù)字是囚徒2(位于豎行上的參與者)的收益。如果囚徒1選擇沉默,而囚徒2選擇坦白,那么囚徒1的收益是9(表示判刑9個月),囚徒2的收益為0(表示馬上釋放)。,博弈論囚徒困境問題提供的解是戰(zhàn)略組合(坦白,坦白)。嚴(yán)格的定義與詳細(xì)的闡述留到第2章討論。這個戰(zhàn)略組合是個占優(yōu)戰(zhàn)略組合,因為無論對方如何選擇,自己的最優(yōu)選擇都是坦白。如果囚徒2不坦白,囚徒1坦
10、白的話他就會馬上獲釋,不坦白的話還得坐一個月的牢,所以坦白比不坦白好;如果囚徒2坦白,囚徒1坦白的話要判6個月,不坦白的話則要判9個月,這樣對囚徒1來說,還是坦白比不坦白好。因此坦白是囚徒1的占優(yōu)戰(zhàn)略。同樣的分析表明,坦白也是囚徒2的占優(yōu)戰(zhàn)略。均衡的結(jié)果是每個囚徒都選擇坦白,各判刑6個月。,初次接觸博弈論的人,難免會提出這樣的問題:戰(zhàn)略組合(沉默,沉默),即如果兩個人都不坦白,各人只判刑一個月,不是比戰(zhàn)略組合(坦白,坦白)帶來的各判刑6個月要好嗎?如果經(jīng)濟(jì)學(xué)中的“有效”的術(shù)語,(沉默,沉默)是一個有效結(jié)局。有效結(jié)局并不是囚徒問題的博弈解,與此相關(guān)的理論問題在第2章里可以找到答案。,與囚徒困境類
11、似的博弈問題在經(jīng)濟(jì)、社會領(lǐng)域有許許多多的版本,下面再舉幾個例子。,A,B兩個公司以高低兩種價格向市場競相銷售同一種產(chǎn)品。雙方協(xié)定以高價格壟斷市場,可以使彼此獲得滿意的利潤收益,至少要好于雙方都以低價格出售產(chǎn)品的情形。但如果某一方堅持高價,而另一方為了獨占市場卻將產(chǎn)品以低價格推銷(協(xié)定不受遵守而不受處罰),那么后者將獲高盈利而前者將損失慘重。市場上商品的價格戰(zhàn),常常出現(xiàn)的結(jié)局一般是以低價格銷售商品,消費者從中得到好處,這種結(jié)果正是博弈論預(yù)測的合理結(jié)局,你們不妨自己設(shè)計一個類似于圖1-1的A,B公司的收益矩陣。,公司產(chǎn)品的供給也是一個類似囚徒困境的問題。每個人可供選擇的戰(zhàn)略是:出錢、不出錢。如果大
12、家都出錢興辦公共事業(yè),所有人的福利都會增加。問題是,如果我出錢,你不出錢,我得不償失;如果我不出錢你出錢,我就可以占你的便宜。結(jié)果是每個人的最優(yōu)選擇都是不出錢。,再有個例子是軍備競賽問題。美蘇冷戰(zhàn)期間,兩個超級大國構(gòu)成博弈的兩方,可供選擇的戰(zhàn)略是:擴(kuò)軍(增加軍費運算)、裁軍(減少軍費運算)。如果雙方都熱衷于擴(kuò)軍,兩國都要為此付出高額軍費(從社會福利角度來看這是一筆龐大的付收益);如果雙方都選擇裁軍,則可省下這筆錢;如果一方面裁軍而另一方面進(jìn)行擴(kuò)軍,擴(kuò)軍的一方到時候就會以武力相威脅甚至發(fā)動戰(zhàn)爭,這是,戰(zhàn)爭勝敗雙方的收益與支付將出現(xiàn)難以估量的差異。我們可以給出一個假象的雙變量收益矩陣,如圖1-2所
13、示。,博弈論給出軍備競賽問題的是戰(zhàn)略組合(擴(kuò)軍,擴(kuò)軍),博弈理論預(yù)測雙方都擴(kuò)軍可以達(dá)到對抗中的相對穩(wěn)定,這是一個符合現(xiàn)實的合理結(jié)局。,例二 海灘占位,甲乙兩個冷飲攤販,他們在一個直線狀的海灘上,以同樣的價格、相同的質(zhì)量向均勻分布在海灘上的眾多游客(他們來此享受海水和陽光,進(jìn)行日光浴或游泳活動)銷售冷飲。既然是做生意,目的總是希望盡可能多賺點錢,甲乙兩人又是在同一地點做同樣的生意,競爭就是不可避免的事情了。這兩個冷飲攤販應(yīng)該如何安置自己的攤位,才能相安無事地做各自的生意呢?,假定游客總是到距離自己最近的攤位購買冷飲,這也是合乎常情的。為了敘述方便,不妨將海灘長度標(biāo)準(zhǔn)化為1。按通常的想法,如果海灘
14、左端定為0,甲在1/4處設(shè)攤,乙在3/4處設(shè)攤(見圖13),這樣既方便了顧客,又照顧到甲乙二人各占約一半顧客的生意,可謂公平合理。問題不是簡單的解決了嗎?,事情并不像想象的那么簡單。甲乙二人做同樣的生意,兩人之間就存在競爭,這就構(gòu)成了一個博弈問題。站在甲的角度考慮,只要手段合法,多攬一點顧客就可以多賺一點錢。基于這樣的理性想法,甲就會將自己的攤位向右挪動到A點(見圖13)。這時,從0到M(這里M是A至3/4處的中點)范圍內(nèi)的顧客都會去買甲的冷飲,甲就從乙的手里挖走一部分顧客,即圖13中陰影所示的1/2到N的那一部分。乙也是一個理性的生意人,他會估計到甲可能作出的動作,因此,他也會將自己的攤位向
15、左邊移動。照此下去,最后的結(jié)果是甲乙二人都擠在一起,緊接著,在海灘的中點(1/2處)做冷飲生意。,博弈論對海灘占位問題的解是甲乙二人均選擇在海灘中點(1/2處)設(shè)攤,而不是原先想象的甲乙分別在1/4和3/4處占位,即使集中在一起營業(yè)會給海灘兩端的顧客帶來不便。,社會經(jīng)濟(jì)領(lǐng)域內(nèi),就有不少與海灘占位博弈類似的現(xiàn)象。比如,在城市商業(yè)網(wǎng)點的布局上,常常會出現(xiàn)相同行業(yè)的多家商店都擠在一起,形成“電子一條街”、“裝飾城”、“飲食廣場”等。只要把這個城市想象成東西或南北方向的一個“海灘”,從博弈論中就不難找到答案。,又如,同一城市的不同航空公司經(jīng)營的飛往同一目的地的航班,常常出現(xiàn)起飛時刻幾乎相同的現(xiàn)象。,就
16、是在文化娛樂方面,也能運用海灘占位的博弈結(jié)論予以解釋。如果把電視中高雅藝術(shù)節(jié)目與較低檔的節(jié)目比作海灘的兩端,那么眾多的電視觀眾就可以看作是散布在海灘上的游客。電視臺常常將黃金時段的電視節(jié)目定位在中等檔次,以提高收視率。,例三 智豬爭食,豬圈里喂養(yǎng)兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個豬食槽,對面的一邊裝有控制開關(guān)。只要豬用鼻頭去拱控制開關(guān),就會一次有6個單位的飼料流進(jìn)豬食槽。如果大豬和小豬都不去拱開關(guān),那么它們都吃不到飼料。如果小豬去拱開關(guān),那么等它跑到另一邊的豬食槽時,大豬已將流出的飼料全部都吃光了。如果大豬去拱開關(guān),那么等它跑到豬食槽旁邊,小豬差不多已吃掉了5個單位的飼料,結(jié)果大豬只
17、能吃到1個單位的飼料。如果大豬、小豬一起去拱開關(guān),再一起跑去吃食,那么大豬可搶到4個單位的飼料,小豬也只能吃掉2個單位的飼料。假定每拱一次開關(guān)需要消耗0.5個單位飼料的能量。大豬和小豬長期在一起進(jìn)食,上面所說的情況(信息、知識)已為它們所掌握。仿照例一囚徒困境的情形,就可以畫出如圖14所示的雙變量矩陣。,在這個博弈中,大豬與小豬都有兩種戰(zhàn)略選擇:拱、不拱。在這個例子中可以發(fā)現(xiàn),不論大豬選擇拱還是不供,小豬的最優(yōu)選擇總是不拱。這是因為,如果大豬去拱開關(guān),小豬不拱(等在豬食槽旁邊)比拱后再跑回去爭食要劃算(51.5);如果大豬不去拱開關(guān),小豬不拱頂多都不得食,而去拱就要白白消耗能量,不劃算(0-0
18、.5)。所以,不拱是小豬的占優(yōu)戰(zhàn)略。給定小豬總是選擇不拱,大豬的最優(yōu)選擇總是拱。這樣,智豬爭食問題的博弈論解是戰(zhàn)略組合(拱,不拱)。,智豬爭食模型在社會經(jīng)濟(jì)領(lǐng)域也可以找到許多實例。,比如股份公司中就有大股東和小股東之分。股東都有監(jiān)督經(jīng)理的職能,他們從監(jiān)督中得到的收益并不一樣。在監(jiān)督成本相同的情況下,大股東從監(jiān)督中得到的好處顯然多于小股東。通常在股份公司里,總是由大股東擔(dān)當(dāng)監(jiān)督任務(wù),而小股東則搭大股東的便車。 股票市場上也有類似現(xiàn)象。一般大戶總是重視搜集信息,積極進(jìn)行行情分析。對小戶而言,跟大戶是常見現(xiàn)象。,進(jìn)行產(chǎn)品研究、開發(fā)以及新產(chǎn)品廣告宣傳時,對大企業(yè)而言,其資金實力及可望的收益會使大企業(yè)有
19、投資的積極性,而小企業(yè)往往會得不償失。小企業(yè)通常采取與大企業(yè)建立協(xié)作生產(chǎn)或移植部分技術(shù)的做法。,介紹上面三個博弈論的例子,首先,是讓你們對博弈論有一個初步的感性認(rèn)識。雖然在闡述中也涉及了專業(yè)術(shù)語,諸如理性、有效、戰(zhàn)略、占優(yōu)戰(zhàn)略、博弈解等,但是這些術(shù)語的含義是你們可以接受的。其次,通過這些例子想給你們留下一個深刻印象:博弈論與社會經(jīng)濟(jì)等諸多領(lǐng)域的聯(lián)系是如此廣泛、如此密切。下面章節(jié)對囚徒困境博弈在不同的理論的高度還要進(jìn)行研究和分析,這個例子還會在不同地方被引用。,二、博弈論的基本概念,什么是博弈論?簡而言之,博弈論是研究多人謀略和決策問題的理論。要較深入地理解這句話,還需要關(guān)注以下一些問題。首先,
20、一個博弈問題必須至少有兩個參與博弈的主體(可能是個人,也可能是團(tuán)體,如企業(yè)、國家),他們在博弈過程中都有各自的切身利益。由于利益的驅(qū)動,他們在作出自己的決策時,總想使出最好的招數(shù)(最優(yōu)戰(zhàn)略)。,其次,博弈中的各個主體之間總不可避免地存在著競爭。競爭自然貫穿博弈的全過程,競爭又將博弈的主體緊緊地聯(lián)系在一起,相互依存,相互較量(說得通俗一些就是“鉤心斗角”)。再者,既然主體間要進(jìn)行較量,每一個博弈主體就不會閉目塞聽,靠靈機(jī)一動想出高招去贏得對手,而是需要“眼觀六路,耳聽八方”。盡量掌握博弈中對手的特點和已經(jīng)采取或可能采取的行動的知識和信息。最后,就是博弈主體最為關(guān)心的博弈結(jié)果了。博弈結(jié)果隨主體之間
21、使出招數(shù)(戰(zhàn)略)的不同而不同。博弈結(jié)果通俗的說就是輸贏的大小,博弈論用收益(或效用)來描述博弈的結(jié)果。博弈論就是從理論上進(jìn)行研究和分析,為博弈預(yù)測出一個理想的結(jié)局。預(yù)測結(jié)局的正確性體現(xiàn)在博弈主體各方面都能自愿選擇理論給他推導(dǎo)出的戰(zhàn)略,并且沒有博弈主體愿意獨自偏離他依照博弈理論所選定的戰(zhàn)略??上攵?每個博弈主體所選戰(zhàn)略一定是針對其他主體所選戰(zhàn)略的最優(yōu)反應(yīng)。,以上只是對博弈論粗線條的描述,為了后面對博弈理論進(jìn)行深入的討論,下面對博弈論的幾個重要的基本概念給出明確的定義。,(1)參與者。參與者指的是一個博弈中的決策主體,通常又稱為參與人或局中人。參與者參加博弈的目的是通過合理選擇自己的行動,以期
22、取得最大化自己的收益(或效用)水平。參與者可以是自然人,也可以是企業(yè)、團(tuán)體、國家,甚至是國家組成的集團(tuán)(如歐盟、OPEC等)。對參與者而言,在博弈過程中,他必須有不同的行動可作應(yīng)對選擇。在博弈的結(jié)局中,他能知道或計算出各參與者不同的行動組合產(chǎn)生的效益(或效用)。1節(jié)中三個例子的參與者是不言自明的。,在博弈論中,為了分析研究問題的需要,還有一個虛擬參與者“自然”。這里,“自然”就是指不以博弈參與者的意志為轉(zhuǎn)移的外生事件。“自然”選擇的是外生事件的各種可能現(xiàn)象,并且用概率分布來描述“自然”的選擇肌理。,例四 房地產(chǎn)開發(fā)博弈,現(xiàn)有開發(fā)商A(按博弈論說法是參與者1)正在考慮是否要投資開發(fā)一座商住樓。他
23、面臨的行動選擇是開發(fā)或不開發(fā)。如果要開發(fā),就必須投入1億元資金;如果不去開發(fā),投資就是0。房地產(chǎn)開發(fā)市場總是存在風(fēng)險的。首先,風(fēng)險來自市場需求的不確定性,需求可能大,也可能小。其次,風(fēng)險來源是競爭對手房地產(chǎn)開發(fā)商B(參與者2)。開發(fā)商B也面臨與開發(fā)商A相同的決策問題。,假定市場上有兩座樓出售,需求大時,每座售價可達(dá)1.4億元;需求小時,售價為7千萬元。如果市場上只有一座樓出售,需求大時,售價高達(dá)1.8億元;需求小時,也能賣出1.1億元可以用圖1-5所示的雙變量矩陣描述這個博弈問題。,在這個例子中,市場需求就是作為虛擬參與者“自然”出現(xiàn)在博弈問題之中?!白匀弧保ㄊ袌鲂枨螅┦且砸欢ǖ母拍畋憩F(xiàn)出不同
24、的狀態(tài)(需求大還是?。?。不言而喻,“自然”直接關(guān)系到博弈的決策結(jié)果。這個例子幾乎涉及到博弈論討論的重要問題的方方面面。相關(guān)的研究分析將在后面有關(guān)章節(jié)闡述。,在博弈論的討論中,一般都是用i=1,2,n 代表參與者,用N代表“自然”。,(2)信息。信息指的是參與者在博弈過程中能了解到和觀察到的知識。這些知識包括“自然”的選擇,其他參與者的特征和行動等。信息對參與者是至關(guān)重要的,因為一個參與者在每一次進(jìn)行決策之前,必須根據(jù)觀察到的其他參與者的行動和了解的有關(guān)情況作出自己的最佳選擇。,由于信息內(nèi)涵的不同,派生出各種有關(guān)信息的概念將博弈論劃分成不同的類型,因此尋求博弈間的方法也不同。本著由淺入深認(rèn)識事物
25、的規(guī)律,這里不打算把這些概念一股腦兒和盤托出,而是分散到以后的章節(jié)中,逐步予以介紹。這里只就信息有關(guān)的兩個基本的、重要的概念進(jìn)行討論。,首先,關(guān)于“共同知識”的概念。一個博弈問題所涉及的“自然”的不同選擇、參與者的行動以及相應(yīng)產(chǎn)生的效用(效果、收益)都是一種知識(信息)。比如,房地產(chǎn)開發(fā)商博弈問題,市場需求的大小,開發(fā)商A、B是開發(fā)還是不開發(fā),不同情況下的利潤和虧損,都是知識。開發(fā)商A、B知道這些知識也是一種信息,開發(fā)商A知道開發(fā)商B知道這些知識也是一種信息,如此等等。博弈論所謂的共同知識指的是“所有參與者知道,所有參與者知道所有參與者知道,所有參與者知道所有參與者知道所有參與者知道”的知識。
26、可以聯(lián)想到市場需求大小是一種知識??赡荛_發(fā)商A、B都知道市場需求有大與小兩種狀態(tài),但是開發(fā)商A并不知道開發(fā)商B知道市場需求,這時市場需求就不構(gòu)成共同知識,而只能說是A與B“共同”享有的知識。,為了說明共同知識的重要性,我引用一個眾所周知的寓言。故事發(fā)生在一個村莊,村里有100對已婚夫婦,他們都是地道的邏輯學(xué)家,但也有一些多少有點奇特的社會風(fēng)俗。每天晚上,村里的男人們都將點起篝火,繞圈圍坐舉行一個會議,且每個人都談?wù)撟约旱钠拮?。在會議開始時,如果一個男人有理由認(rèn)為他的妻子對他總是守貞的,那么他就對在坐的男人們贊揚(yáng)她的美德。另一方面,如果在當(dāng)前會議之前的任何時間,只要他發(fā)現(xiàn)了他妻子不貞的證據(jù),那他
27、就會悲鳴慟哭,并祈求神靈嚴(yán)厲地懲罰她。再則,如果一個妻子曾有不貞,那她和她的情人將會立即通知村里除她丈夫外所有的男人。所有這些傳統(tǒng)都是村民們的共同知識。,事實上,每個妻子都已對自己的丈夫不忠。于是,每個丈夫都知道除自己的妻子外都是不貞的女人,而對自己的妻子每晚都要贊揚(yáng)。,這種狀況持續(xù)了很多年,直到一個傳教徒走訪到這個村莊。他坐在髯火旁參加了一次會議并聽到每個男人都贊揚(yáng)自己的妻子之后,他站到丈夫們圍坐的圓中心,大聲地說:“這個村里有一個妻子已經(jīng)不貞了。”在此后的99個晚上丈夫們繼續(xù)開會并贊揚(yáng)他們的妻子,但在第100個晚上,他們?nèi)急Q偷哭并祈求嚴(yán)厲地懲罰他們的妻子。,為了理解在這個寓言中發(fā)生了什
28、么,首先注意到若只有一個妻子不貞,則因為(知道沒有另外的不貞女人,且若有的話他是知道的)她丈夫能夠立刻知道這個不貞的女人是他的妻子,所以在傳教徒訪問后的第一天晚上就會悲鳴慟哭。而且,由歸納法可以證明,對于1與100之間的任一正整數(shù),如果恰有個不貞的妻子,那么在傳教徒訪問后的連續(xù)個晚上,所有的丈夫仍全都贊揚(yáng)自己的妻子,但在第個晚上,個不貞妻子的丈夫會悲鳴慟哭。于是,在99個贊揚(yáng)之夜過后的第100個晚上,每個丈夫都知道一定有100個不貞的妻子,包括他自己的妻子在內(nèi)。,現(xiàn)在,讓我們試問一下,這個傳教徒告訴了這些丈夫們他們所不知道的什么?每個丈夫都已經(jīng)知道了99個不貞的妻子,故這對任何人來說都不是新聞
29、。但“這個傳教徒對所有男人做了一個聲明”是共同知識,從而這個傳教徒所聲明的內(nèi)容,即有一個不貞的妻子,也就成了所有男人中間的共同知識。在傳教徒宣告之前,每個形如“(每個丈夫知道)有一個不貞的妻子”的判斷對于99都是正確的,但對100就不正確了。例如,若從1到100對丈夫們編號,則1已經(jīng)知道2已經(jīng)知道3已經(jīng)知道99已經(jīng)知道100的妻子是不貞的,但1不知道2已經(jīng)知道3已經(jīng)知道99已經(jīng)知道100已經(jīng)知道1的妻子是不貞的。因而,從這個寓言中引申出的含義是,從一個共同知識的事實推出的結(jié)果與從(例如)只知道每個人已經(jīng)知道每個人已經(jīng)知道的一個事實推出的結(jié)果可以非常不同。,其次,關(guān)于“完全信息”的概念。完全信息
30、是博弈論非常重要的基本概念,有了上述的共同知識概念,這里就可以給出完全信息的嚴(yán)格定義。完全信息指的是所有參與者各自選擇的行動的不同組合所決定的各參與者的收益對所有參與者來說是共同知識。簡單通俗地說,完全信息是指每一個參與者對自己以及其他參與者的行動,以及各參與者選擇的行動組合產(chǎn)生的收益等知識有完全的了解。,(3)戰(zhàn)略。戰(zhàn)略是參與者如何對其他參與者的行動作出反應(yīng)的行動規(guī)則,它規(guī)定參與者在什么時候該選擇什么行動?;蛘哒f。戰(zhàn)略是參與者“相機(jī)行動方案”。,戰(zhàn)略是一個與過程有關(guān)的概念,行動是與時序無關(guān)的動作。打個比方,行動好比拳術(shù)中的一招一式,戰(zhàn)略就是一招一式構(gòu)成的套路。,(4)收益。在博弈論中,收益指
31、的是在一個特定的戰(zhàn)略組合下參與者得到的確定效用或期望效用。效用通常表現(xiàn)為博弈結(jié)果中 的輸贏、得失、盈虧。效用必須能用數(shù)值刻畫其大小。收益是博弈參與者真正關(guān)心的問題。,博弈論的一個基本特征是一個參與者的收益不僅取決于自己的戰(zhàn)略選擇,而且取決于所有參與者的戰(zhàn)略選擇?;蛘哒f,收益是所有參與者各選定一個戰(zhàn)略形成的戰(zhàn)略組合的函數(shù)。在博弈論中,通常用ui表示參與者i的收益,一個戰(zhàn)略組合是,每個參與者的收益可以表示為,均衡是博弈論最重要、最基礎(chǔ)的一個概念,對于不同類型、不同條件的博弈問題又形成各種各樣特定的均衡的概念,它們構(gòu)成博弈論五彩繽紛的預(yù)測結(jié)果。各種均衡在社會經(jīng)濟(jì)等不同的領(lǐng)域都展現(xiàn)出廣闊的應(yīng)用前景。讀
32、者充分、深刻地理解這些均衡概念是非常重要的。,有了上面完全信息的概念,再結(jié)合參與者行動的先后次序的界定,就可以對博弈論的類型作出劃分。如果參與者同時選擇各自的行動,則這類博弈稱為靜態(tài)的。值得注意的是,這里所說的“同時”具有雙層含義。一種含義就是“同時”的字面解釋,也就是參與者在同一時間一起行動;另一種含義是參與者行動雖然有先后,但后行動者并不知道先行動者采取了什么具體行動。,動態(tài)博弈指的是參與者的行動有先后順序,并且后行動者能夠觀察到先行動者所選擇的行動。后行動者就可以依據(jù)獲得的信息,采取自己認(rèn)為最有力的戰(zhàn)略。憑直觀理解,完全信息總要比不完全信息要好一些,靜態(tài)的情形又要比動態(tài)的情形要簡單一些。
33、如果將信息的完全與不完全、狀態(tài)的靜與動交叉組合,就構(gòu)成了四種不同類型的博弈。從簡單到復(fù)雜排列,就是完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈。,3、博弈論研究著名學(xué)者簡介,(1)、計算機(jī)之父、博弈論創(chuàng)始人馮諾伊曼,約翰馮諾伊曼(John Von Neumann,19031957),美籍匈牙利人。19211923年在蘇黎世大學(xué)學(xué)習(xí)。很快又在1926年以優(yōu)異的成績獲得了布達(dá)佩斯大學(xué)數(shù)學(xué)博士學(xué)位,此時馮諾伊曼年僅22歲。馮諾伊曼是20世紀(jì)最優(yōu)秀的數(shù)學(xué)家之一,因1946年發(fā)明電子計算機(jī)而被西方人譽(yù)為“計算機(jī)之父”。,19271929年馮諾伊曼相繼在柏林大學(xué)和漢堡大學(xué)擔(dān)任數(shù)學(xué)講
34、師。1930年接受了普林斯頓大學(xué)客座教授的職位,西渡美國,1931年成為該校終身教授。他是美國國家科學(xué)院、秘魯國立自然科學(xué)院和意大利國立林且學(xué)院的院士。 馮諾伊曼建立了算子代數(shù)這門新的數(shù)學(xué)分支。在格論、連續(xù)幾何、理論物理、動力學(xué)、連續(xù)介質(zhì)力學(xué)、氣象計算、原子能和經(jīng)濟(jì)學(xué)等領(lǐng)域都做過重要的工作。然而,馮諾伊曼對人類的最大貢獻(xiàn)是對計算機(jī)科學(xué)、計算機(jī)技術(shù)和數(shù)值分析的開拓性工作。 馮諾伊曼于20世紀(jì)20年代開始創(chuàng)立博弈理論,1944年他與經(jīng)濟(jì)學(xué)家奧斯卡摩根斯特恩合作出版的巨著博弈論與經(jīng)濟(jì)行為,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。馮諾伊曼和摩根斯特恩在該書中提出的標(biāo)準(zhǔn)型、擴(kuò)展型和合作型博弈模型解的概念和分析
35、方法,奠定了這門學(xué)科的理論基礎(chǔ)。,()、博弈論大師納什,納什(John Nash),1928年6月13日出生于美國弗吉尼亞西部的“布魯菲爾德”(Bluefield),高中畢業(yè)后進(jìn)入卡內(nèi)基梅隆大學(xué)學(xué)習(xí)化學(xué)工程專業(yè), 由于對數(shù)學(xué)的喜好和天賦,一年后正式轉(zhuǎn)到數(shù)學(xué)系。在畢業(yè)時,他取得數(shù)學(xué)學(xué)士和理學(xué)學(xué)士兩個學(xué)位。 1950年納什22歲時通過論文答辯獲得普林斯頓大學(xué)的博士學(xué)位。正是這篇天才論文,奠定了他博弈論大師的地位,并為他鋪墊了通向諾貝爾經(jīng)濟(jì)學(xué)獎的道路。1951年納什又發(fā)表了第二篇題為“非合作博弈”(NonCooperativeGames,Annals of Mathematics1951)的論文。在
36、此之前,他還撰寫了“討價還價問題”。1958年財富雜志把納什評為新一代 天才數(shù)學(xué)家中最出色的人物。也許是天妒英才,正當(dāng)麻省理工學(xué)院準(zhǔn)備提升他為正教授時,年方30歲的納什得了嚴(yán)重的“妄想型精神分裂癥”,從此他從學(xué)術(shù)界銷聲匿跡,飽受精神病的折磨長達(dá)30多年。,納什的主要貢獻(xiàn)是1950年和1951年發(fā)表的兩篇關(guān)于非合作博弈論的重要論文,他的研究徹底改變了人們對競爭和市場的看法。1950年納什發(fā)表的“非合作對策”博士論文提出了與諾伊曼的合作對策論相對立的觀點。納什在論文中引入了著名的“納什均衡”理論,對有混合利益的競爭者之間的對抗進(jìn)行了數(shù)學(xué)分析。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即
37、著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,他是繼馮諾伊曼之后最偉大的博弈論大師之一,他提出的著名的納什均衡的概念在非合作博弈理論中起著核心作用。后續(xù)的研究者對博弈論的貢獻(xiàn),都是建立在這一概念之上的。納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、社會學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅實的理論基礎(chǔ)。,()、動態(tài)博弈理論的開創(chuàng)者澤爾騰,澤爾騰(R.Selten)1930年10月10日出生于德國的布雷斯勞(二戰(zhàn)后,此地歸于波蘭),19511957年,他在法蘭克福大學(xué)學(xué)習(xí)數(shù)學(xué)。1961年在馬恩法蘭克福大學(xué)獲得了數(shù)學(xué)博士學(xué)位。1967196
38、8年,澤爾騰到加州大學(xué)伯克利分校做客座教授,19691972年在柏林大學(xué)做經(jīng)濟(jì)學(xué)教授,而后在比勒菲爾德大學(xué)工作了12年。1984年澤爾騰離開比勒菲爾德大學(xué),到波恩大學(xué)從教,致力于實驗經(jīng)濟(jì)學(xué)的研究。,澤爾騰的主要貢獻(xiàn)是在納什均衡的基礎(chǔ)上深入研究了動態(tài)博弈問題。澤爾騰通過研究發(fā)現(xiàn),“納什均衡”概念在實際應(yīng)用中存在缺陷。納什均衡的缺陷是,一般情況下能夠保證存在性,但不能保證唯一性。大多數(shù)情況下納什均衡有多個,由此帶來的問題就是,多個納什均衡中究竟哪一個才是博弈的理性結(jié)局?澤爾騰認(rèn)為“納什均衡”概念只適用于分析一些靜態(tài)的“重復(fù)性博弈”,而不適用于分析動態(tài)博弈問題。他對“納什均衡”概念進(jìn)行了精心的研究,
39、先后提出了兩個著名均衡新概念:子博弈完美均衡,顫抖手完美均衡。他采用“逆向歸納法”,在多個納什均衡中剔除了一些按照一定規(guī)則不合理的均衡點,從而形成了納什均衡的“精煉”概念,在擴(kuò)展型博弈分析方面取得了重大成果。,()、不完全信息博弈理論的奠基者海薩尼,約翰海薩尼(John CHarsanyi),美國人,由于受到納什成果的影響,從20世紀(jì)50年代開始潛心于博弈論的研究。海薩尼的研究成果非常豐富:(1)在合作博弈論研究上,給出了合作博弈的通解N人議價模型,建立了一個合作博弈論的非合作博弈模型;(2)在不完全信息博弈研究上,提出了以類型為基礎(chǔ)的不完全信息博弈建模方法,引入了貝葉斯技術(shù)求解方法,對混合策
40、略進(jìn)行了重新解釋,提出了基于隨機(jī)變量的變動收益博弈模型;(3)在均衡選擇研究上,與澤爾騰合作完成了博弈論均衡選擇的一般理論。 約翰海薩尼通過多方面的研究將自己的思想構(gòu)成了一個完整的體系,他提出的不完全信息博弈思想及貝葉斯納什均衡概念,對博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。,(5)、米爾利斯,詹姆斯亞歷山大米爾利斯(J.Y.Morlis),出生于1936年7月5日蘇格蘭柯庫布里郡明尼加大。1996年10月8日,由于對不對稱信息條件下的激勵經(jīng)濟(jì)理論做出了基礎(chǔ)性貢獻(xiàn),與威廉維克里分享諾貝爾經(jīng)濟(jì)學(xué)獎。 米爾利斯對不對稱信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)包括:在最優(yōu)所得稅機(jī)制設(shè)計問題上,探討了政府在面臨信息不完全的情況下如何去
41、設(shè)計出一種“激勵性相容”的最優(yōu)稅收體制,提出了顯示原則:解決激勵問題的關(guān)鍵是要通過一種與個人利益相容的方式,引導(dǎo)所有人如實表露自己的信息;在最優(yōu)契約設(shè)計問題上,以“委托人一代理人方法”對道德危險問題進(jìn)行了重新闡 述,得出的結(jié)論是:為了使代理人有足夠的激勵去自動選擇有利于委托人的行動,就必須在合同的設(shè)計中讓代理人也承擔(dān)一部分結(jié)果不確定的風(fēng)險;在信號篩選理論方面,提出了區(qū)分 不同信號的“斯彭斯一米爾利斯條件”。,第二部分、完全信息靜態(tài)博弈,博弈的標(biāo)準(zhǔn)式表述 嚴(yán)格占優(yōu)戰(zhàn)略均衡 逐步剔除嚴(yán)格戰(zhàn)略均衡 納什均衡應(yīng)用舉例 混合戰(zhàn)略納什均衡 納什均衡的存在性,一、博弈的標(biāo)準(zhǔn)式表述與納什均衡,本章重點介紹完全
42、信息靜態(tài)博弈,它是一種最基本的最簡單的博弈。上一章給出了完全信息和靜態(tài)博弈的概念,這里簡要回顧一下。完全信息指的是博弈的每一個參與者對自己以及其他參與者的行動空間、收益函數(shù)等知識是完全了解的。靜態(tài)博弈指的是博弈的參與者同時選擇各自的行動,如果選擇行動有先后的話,那么后行動者也不知道先行動者采取了什么行動。博弈論入門的兩個最基本問題是:如何描述一個博弈問題和如何求得博弈問題的解。本章對完全信息靜態(tài)博弈的標(biāo)準(zhǔn)式表述、尋求均衡(博弈預(yù)測的結(jié)果)方法以及納什均衡的有關(guān)定義、理論與方法進(jìn)行討論。,(一)、博弈的標(biāo)準(zhǔn)式表述,(二)、嚴(yán)格占優(yōu)戰(zhàn)略均衡,博弈分析的目的是預(yù)測博弈的均衡結(jié)果。簡言之,就是求解博弈
43、問題。這里需要假定“參與者是理性的”是共同知識。經(jīng)濟(jì)學(xué)對理性的描述是,在給定的約束條件下追求效用最大化。參與者在博弈過程中,在每一步斟酌的取舍(選優(yōu)剔劣)時,都應(yīng)依據(jù)這個假定行事。一般說來,由于每個參與者的收益是博弈中所有參與者所選戰(zhàn)略的函數(shù),因此,每個參與者的最優(yōu)戰(zhàn)略選擇必須考慮所有其他參與者的戰(zhàn)略選擇。但在一些特殊的博弈中,一個參與者的最優(yōu)戰(zhàn)略可能不需要考慮其他參與者如何選擇戰(zhàn)略,就是說,不論其他參與者選擇什么戰(zhàn)略,該參與者有唯一一個最優(yōu)戰(zhàn)略,這個最優(yōu)戰(zhàn)略稱為嚴(yán)格占優(yōu)戰(zhàn)略。下面給出嚴(yán)格占優(yōu)戰(zhàn)略定義。,顯然,在一個博弈問題中,如果所有參與者都有一個嚴(yán)格占優(yōu)戰(zhàn)略,那么每一個理性的參與者誰也不會
44、放棄他的嚴(yán)格占優(yōu)戰(zhàn)略。這樣,由全部嚴(yán)格占優(yōu)戰(zhàn)略就構(gòu)成博弈的解嚴(yán)格占優(yōu)戰(zhàn)略均衡。,應(yīng)該指出的是,嚴(yán)格占優(yōu)戰(zhàn)略只要求每個參與者是理性的,而并不要求每個參與者知道其他參與者是理性的(即不要求“理性”是共同知識)。這是因為,不論知道與否,嚴(yán)格占優(yōu)戰(zhàn)略總是一個理性參與者的最佳選擇。,值得注意的是,囚徒困境博弈暴露了個人理性與團(tuán)體理性的沖突問題。因為囚徒1與囚徒2都選擇沉默,每人只判刑1個月,這顯然要比(坦白,坦白)都判刑6個月有利。(沉默,沉默)不是一個均衡,因為它不滿足個人理性的要求。換個角度考慮,即使兩個囚徒在被捕前訂立了攻守同盟(拒不坦白),這個同盟也沒有用,因為沒有人會嚴(yán)格遵守同盟協(xié)定(這時,只
45、要誰一坦白,他就立即獲得釋放)。,(三)、逐步剔除嚴(yán)格劣戰(zhàn)略均衡,尋求博弈問題的解的過程就是參與者選擇戰(zhàn)略的過程。選擇有兩種途徑:選優(yōu)與去劣。上面尋求嚴(yán)格占優(yōu)戰(zhàn)略均衡走的就是選優(yōu)的路子。下面介紹的逐步剔除嚴(yán)格劣戰(zhàn)略尋求均衡走的就是去劣的路子。,研究圖21所示的一個博弈問題。,這樣一來,參與者1就可以將圖21所示的博弈視同為圖22所示的博弈。,在圖22中,對參與者1來說,戰(zhàn)略“下”相對于戰(zhàn)略“上”是嚴(yán)格劣戰(zhàn)略(因為01,且01)。于是,如果參與者1是理性的(并且參與者1知道參與者2是理性的,原博弈才能簡化為圖22),那么參與者1就不會選擇“下”。這時,如果參與者2知道參與者1是理性的,并且參與者
46、2知道參與者1知道參與者2是理性的(只有這樣,參與者2知道原博弈已被簡化為圖22所示博弈),那么參與者2就可以把“下”從參與者1的戰(zhàn)略空間S1中剔除。,這樣一來,參與者2又可以進(jìn)一步將圖22所示博弈簡化為圖23所示博弈,那么,圖24的博弈有沒有均衡結(jié)果呢?后面我們還會討論。,另外,嚴(yán)格占優(yōu)戰(zhàn)略均衡和逐步剔除嚴(yán)格劣戰(zhàn)略均衡對參與者理性的要求是不同的。前者只要每個參與者是理性的,而后者卻要求理性是參與者的共同知識。只有在“參與者2是理性的,且參與者1知道參與者2是理性的”條件下,圖21的博弈才能簡化為圖22的情形。一共用了三步剔除得到了結(jié)果。顯然,參與者的戰(zhàn)略空間越大,剔除的步驟就越多,對共同知識
47、的要求就越嚴(yán)格。,定義 在標(biāo)準(zhǔn)式的博弈中,設(shè)si和si是參與者i的兩個可行戰(zhàn)略。若下式,類似于運用逐步剔除嚴(yán)格劣戰(zhàn)略去尋求一個均衡結(jié)果,自然想到運用逐步剔除劣勢戰(zhàn)略也是求解博弈問題的一種方法。,考察下面圖25所示的博弈問題。,(四)、納什(Nash)均衡,納什均衡是完全信息靜態(tài)博弈的解的一般概念,它是對非常廣泛博弈問題給出更加嚴(yán)格的結(jié)果。首先,許多不存在嚴(yán)格占優(yōu)戰(zhàn)略均衡或逐步剔除嚴(yán)格劣戰(zhàn)略均衡的博弈,卻存在納什均衡。其次,嚴(yán)格占優(yōu)戰(zhàn)略均衡一定就是博弈問題的惟一的納什均衡。再者納什均衡一定不會被逐步剔除嚴(yán)格劣戰(zhàn)略所剔除??梢赃@么說,沒有任何一個戰(zhàn)略組合嚴(yán)格優(yōu)于納什均衡。 為了理解納什均衡的含義,
48、設(shè)想博弈理論對一個n個參與者博弈中的每一個參與者選定的一個戰(zhàn)略,預(yù)測的博弈結(jié)果為s*(s1*,si*,sn*)。其中,si*是理論上導(dǎo)出的參與者i的戰(zhàn)略。首先,理論上確定的每個參與者要選擇的戰(zhàn)略必須是針對其他參與者選擇戰(zhàn)略的最優(yōu)反應(yīng)。其次,遵循理論結(jié)果產(chǎn)生的效用不會小于偏離理論結(jié)果時的效用,也就是沒有參與者愿意單獨偏離理論給他選定的戰(zhàn)略,這種理論導(dǎo)出的結(jié)果時一種“戰(zhàn)略相對穩(wěn)定”狀態(tài)。我們就把這種狀態(tài)稱為一個納什均衡。,和納什均衡的導(dǎo)出密切相關(guān)的是協(xié)議的理念。對給定的博弈,如果參與者之間要商定一個協(xié)議決定博弈如何進(jìn)行,那么一個有效的協(xié)議中的戰(zhàn)略組織必須是納什均衡的戰(zhàn)略組合,否則至少有一個參與者會
49、不遵循該協(xié)議。,運用上述定義中不等式(NE)的條件,就可以檢查一個特定的戰(zhàn)略組合是不是納什均衡。比如,在囚徒困境中,對參與者1(囚徒1)選s1*坦白,對參與者2(囚徒2)選s2*坦白。,考察圖24所示的博弈。,從圖26可以看出,一個單元中只有一個數(shù)值下面劃了橫線,表明只有一方的戰(zhàn)略上針對另一方戰(zhàn)略的最優(yōu)反應(yīng),而另一方的戰(zhàn)略卻表示針對對方戰(zhàn)略的最優(yōu)反應(yīng)。因此該單元對應(yīng)的戰(zhàn)略組合就不是雙方同時愿意接受的結(jié)果,因而也就構(gòu)不成納什均衡。,通過上面闡述,讀者已經(jīng)接觸了各種博弈均衡的概念和尋求均衡結(jié)果的方法,現(xiàn)在著重分析一下它們之間的關(guān)系。,(1) 每一個嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡,反之不然。,(2) 每一個逐步剔除嚴(yán)格占優(yōu)戰(zhàn)略均衡是納什均衡,反之不然。,這里就不作嚴(yán)格的論證了?;仡欀秦i爭食博弈和圖21所示的博弈,對逐步剔除嚴(yán)格劣戰(zhàn)略過程和劃橫線方法尋求納什均衡的過程的比較,可以領(lǐng)會上述結(jié)論的含義。反例可以從圖26所示博弈看出。s*(下,右)是納什均衡,但該博弈逐步剔除嚴(yán)格劣戰(zhàn)略卻一步也不能施行。,(3) 如果戰(zhàn)略組合是納什均衡,那么它一定不會被逐步剔除嚴(yán)格劣戰(zhàn)略剔除。,成立。,在本章的最后,再
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 探討對2025年證券從業(yè)資格證考試的遞延策略試題及答案
- 現(xiàn)代審計與風(fēng)險控制的結(jié)合試題及答案
- 財務(wù)決策應(yīng)對策略試題及答案2025
- 江蘇省泰州市本年度(2025)小學(xué)一年級數(shù)學(xué)部編版隨堂測試(下學(xué)期)試卷及答案
- 財務(wù)分析工具金融理財師考試試題及答案
- 證券市場信息不對稱現(xiàn)象試題及答案
- 常見財務(wù)報表分析方法試題及答案
- 考前沖刺微生物檢驗試題及答案
- 微生物同時檢驗技術(shù)相關(guān)試題
- 項目管理技能檢驗試題及答案
- 防止電力生產(chǎn)事故的二十五項重點
- 第二屆全國物流設(shè)計大賽一等獎作品:北京交通大學(xué)一隊全國決賽作品
- ABB變頻器ACS510說明書
- 汽車4S店維修結(jié)算清單
- 校園網(wǎng)站設(shè)計論文
- GB/T 17213.4-2015工業(yè)過程控制閥第4部分:檢驗和例行試驗
- 磷酸鐵鋰生產(chǎn)配方及工藝
- 電工電子技術(shù)及應(yīng)用全套課件
- DB33T 1233-2021 基坑工程地下連續(xù)墻技術(shù)規(guī)程
- 《新農(nóng)技推廣法解讀》ppt課件
- 社區(qū)家庭病床護(hù)理記錄文本匯總
評論
0/150
提交評論