課數(shù)學(xué)建模博弈模型課件_第1頁(yè)
課數(shù)學(xué)建模博弈模型課件_第2頁(yè)
課數(shù)學(xué)建模博弈模型課件_第3頁(yè)
課數(shù)學(xué)建模博弈模型課件_第4頁(yè)
課數(shù)學(xué)建模博弈模型課件_第5頁(yè)
已閱讀5頁(yè),還剩127頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈模型第一部分、博弈論基本概念

宇宙間處處存在矛盾、沖突、爭(zhēng)斗、合作、共生等現(xiàn)象,這些現(xiàn)象很很早就引起各類學(xué)者的重視。數(shù)學(xué)被認(rèn)為是科學(xué)的語(yǔ)言,能否用數(shù)學(xué)語(yǔ)言描述各種帶有矛盾因素的模型或現(xiàn)象?博弈論便是這樣一種處理各類帶有矛盾因素的模型的數(shù)學(xué)工具,現(xiàn)在已被數(shù)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、軍事學(xué)、生物學(xué)等專家廣泛應(yīng)用于討論各類帶有沖突、矛盾、合作、競(jìng)爭(zhēng)、進(jìn)化等問(wèn)題及相關(guān)模型之中。博弈論已成為人們分析復(fù)雜系統(tǒng)與作重大決策時(shí)的有力工具。一、引言數(shù)學(xué)研究的方法是從大量的同類現(xiàn)象中抽象出基本要素,進(jìn)步構(gòu)造出能描述這類現(xiàn)象的模型。許多沖突模型在游戲中就存在,博弈論早期就是由研究國(guó)際象棋開始的,所以被命名為GameTheory。人們很快認(rèn)識(shí)到此種理論可用于經(jīng)濟(jì)、政治、軍事等領(lǐng)域,所謂“世事紛爭(zhēng)一棋局”,正說(shuō)明其中一些道理。1944年馮·諾曼(John,VonNeumann)和奧·摩根斯特恩(OskerMor-gentern)合著的《競(jìng)賽論與經(jīng)濟(jì)行為》(TheoryOfGSmesandEconomicBehavior)問(wèn)世,總結(jié)了初期研究成果,奠定了博弈論的基礎(chǔ)。由于該理論主要討論在復(fù)雜的矛盾沖突等活動(dòng)中,局中人(Player)采取何種合理的策略(strategy)而能處于“優(yōu)越”的地位,以便取得較好效益,所以將它譯為博弈論。

博弈論(Gametheory)可以被定義為是對(duì)智能的理性決策者之間沖突與合作的數(shù)學(xué)模型的研究。博弈論為分析那些涉及兩個(gè)或更多個(gè)參與者且其決策會(huì)影響相互間的福利的局勢(shì)提供了一般的數(shù)學(xué)方法。就此而論,博弈論便為社會(huì)科學(xué)各分支的學(xué)者和實(shí)際的決策者提供了非常重要的視角。博奕理論家所研究的局勢(shì),不僅僅是“游戲(Game)”一詞所不幸表示的消遣活動(dòng),“沖突分析”或“相互影響的決策理論”或許是描述博弈論更為準(zhǔn)確的術(shù)語(yǔ)。常見(jiàn)的游戲如棋類,兩人對(duì)奕,此兩人便稱為局中人,他們各有一套棋路,或善于用馬,或長(zhǎng)于用炮。在每次輪到一方走子時(shí),他可能有許多走法,這些走法依賴于當(dāng)時(shí)棋局形勢(shì)以及棋手想要達(dá)到的目的,以及他慣用的走法,從而形成他走棋的指導(dǎo)思想。對(duì)奕時(shí)指導(dǎo)棋手行動(dòng)的思想便稱為策略。對(duì)局終了可能有三種結(jié)局:甲勝;乙勝;和局。如果用數(shù)量表示各種結(jié)局,例如勝家贏得彩金若干(設(shè)所得彩金由輸家付給,則輸家當(dāng)然失去若干),和局時(shí)都不能取得彩金,此種表示結(jié)局的數(shù)稱為支付(payoff)。局中人、策略、支付是博弈論中常見(jiàn)的基本概念。

有些游戲中并無(wú)“機(jī)會(huì)”(chance)因素,而是全憑局中人的技藝。但某些游戲如“橋牌”、“打百分”等,“機(jī)會(huì)”卻有較大作用,分發(fā)到游戲者手中的牌是隨機(jī)的,它們情況要復(fù)雜一些。

游戲并非只有雙方,可以有多方,如三人玩的跳棋便有三個(gè)局中人。一般只有兩個(gè)局中人的稱為兩人博奕(或二人對(duì)策),有二個(gè)局中人的稱為n人博弈。在博弈論的語(yǔ)言中,一個(gè)博弈(game)指的是涉及到兩個(gè)或更多個(gè)參與人的某個(gè)社會(huì)局勢(shì)。博弈所涉及的參與人被稱為局中人(players)。正如前面博弈論的定義所述,博弈理論家一般要對(duì)局中人做兩個(gè)基本的假設(shè):他們都是理性的和他們都是智能的。這兩個(gè)形容詞在這里都是技術(shù)性術(shù)語(yǔ),所以需要對(duì)其逐一解釋。1、博弈論幾個(gè)經(jīng)典的例子

兩個(gè)共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一個(gè)人招認(rèn)犯罪,否則警方無(wú)充分證據(jù)將他們按罪判刑。警方把他們關(guān)入不同的牢室,并對(duì)他們說(shuō)明不同行動(dòng)帶來(lái)的后果。如果兩人都采取沉默的抗拒態(tài)度,因警方證據(jù)不足,兩人將均被判為輕度犯罪入獄1個(gè)月;如果雙方都坦白,根據(jù)案情兩人將被判入獄6個(gè)月;如果一個(gè)招工而另一個(gè)拒不坦白,招認(rèn)者因有主動(dòng)認(rèn)罪立功表現(xiàn)將立即釋放,而另一人將被判入獄9個(gè)月(所犯罪行判6個(gè)月,干擾司法加判3個(gè)月)。例一囚徒困境

囚徒困境問(wèn)題可以用圖1-1所示的雙變量矩陣的形式來(lái)描述。

在此博弈中,每個(gè)囚徒有兩種戰(zhàn)略可供選擇:坦白(或招認(rèn))、不坦白(或沉默)。圖1-1的矩陣中每一個(gè)單元的兩個(gè)數(shù)字表示一組特定的戰(zhàn)略組合下兩個(gè)囚犯的收益(或支付、效用,這里已經(jīng)開始引用經(jīng)濟(jì)學(xué)的術(shù)語(yǔ)了),其中第1個(gè)數(shù)字是囚徒1(習(xí)慣上是位于矩陣橫行上的參與者)的收益,第2個(gè)數(shù)字是囚徒2(位于豎行上的參與者)的收益。如果囚徒1選擇沉默,而囚徒2選擇坦白,那么囚徒1的收益是-9(表示判刑9個(gè)月),囚徒2的收益為0(表示馬上釋放)。

博弈論囚徒困境問(wèn)題提供的解是戰(zhàn)略組合(坦白,坦白)。嚴(yán)格的定義與詳細(xì)的闡述留到第2章討論。這個(gè)戰(zhàn)略組合是個(gè)占優(yōu)戰(zhàn)略組合,因?yàn)闊o(wú)論對(duì)方如何選擇,自己的最優(yōu)選擇都是坦白。如果囚徒2不坦白,囚徒1坦白的話他就會(huì)馬上獲釋,不坦白的話還得坐一個(gè)月的牢,所以坦白比不坦白好;如果囚徒2坦白,囚徒1坦白的話要判6個(gè)月,不坦白的話則要判9個(gè)月,這樣對(duì)囚徒1來(lái)說(shuō),還是坦白比不坦白好。因此坦白是囚徒1的占優(yōu)戰(zhàn)略。同樣的分析表明,坦白也是囚徒2的占優(yōu)戰(zhàn)略。均衡的結(jié)果是每個(gè)囚徒都選擇坦白,各判刑6個(gè)月。

初次接觸博弈論的人,難免會(huì)提出這樣的問(wèn)題:戰(zhàn)略組合(沉默,沉默),即如果兩個(gè)人都不坦白,各人只判刑一個(gè)月,不是比戰(zhàn)略組合(坦白,坦白)帶來(lái)的各判刑6個(gè)月要好嗎?如果經(jīng)濟(jì)學(xué)中的“有效”的術(shù)語(yǔ),(沉默,沉默)是一個(gè)有效結(jié)局。有效結(jié)局并不是囚徒問(wèn)題的博弈解,與此相關(guān)的理論問(wèn)題在第2章里可以找到答案。

與囚徒困境類似的博弈問(wèn)題在經(jīng)濟(jì)、社會(huì)領(lǐng)域有許許多多的版本,下面再舉幾個(gè)例子。

A,B兩個(gè)公司以高低兩種價(jià)格向市場(chǎng)競(jìng)相銷售同一種產(chǎn)品。雙方協(xié)定以高價(jià)格壟斷市場(chǎng),可以使彼此獲得滿意的利潤(rùn)收益,至少要好于雙方都以低價(jià)格出售產(chǎn)品的情形。但如果某一方堅(jiān)持高價(jià),而另一方為了獨(dú)占市場(chǎng)卻將產(chǎn)品以低價(jià)格推銷(協(xié)定不受遵守而不受處罰),那么后者將獲高盈利而前者將損失慘重。市場(chǎng)上商品的價(jià)格戰(zhàn),常常出現(xiàn)的結(jié)局一般是以低價(jià)格銷售商品,消費(fèi)者從中得到好處,這種結(jié)果正是博弈論預(yù)測(cè)的合理結(jié)局,你們不妨自己設(shè)計(jì)一個(gè)類似于圖1-1的A,B公司的收益矩陣。

公司產(chǎn)品的供給也是一個(gè)類似囚徒困境的問(wèn)題。每個(gè)人可供選擇的戰(zhàn)略是:出錢、不出錢。如果大家都出錢興辦公共事業(yè),所有人的福利都會(huì)增加。問(wèn)題是,如果我出錢,你不出錢,我得不償失;如果我不出錢你出錢,我就可以占你的便宜。結(jié)果是每個(gè)人的最優(yōu)選擇都是不出錢。再有個(gè)例子是軍備競(jìng)賽問(wèn)題。美蘇冷戰(zhàn)期間,兩個(gè)超級(jí)大國(guó)構(gòu)成博弈的兩方,可供選擇的戰(zhàn)略是:擴(kuò)軍(增加軍費(fèi)運(yùn)算)、裁軍(減少軍費(fèi)運(yùn)算)。如果雙方都熱衷于擴(kuò)軍,兩國(guó)都要為此付出高額軍費(fèi)(從社會(huì)福利角度來(lái)看這是一筆龐大的付收益);如果雙方都選擇裁軍,則可省下這筆錢;如果一方面裁軍而另一方面進(jìn)行擴(kuò)軍,擴(kuò)軍的一方到時(shí)候就會(huì)以武力相威脅甚至發(fā)動(dòng)戰(zhàn)爭(zhēng),這是,戰(zhàn)爭(zhēng)勝敗雙方的收益與支付將出現(xiàn)難以估量的差異。我們可以給出一個(gè)假象的雙變量收益矩陣,如圖1-2所示。

博弈論給出軍備競(jìng)賽問(wèn)題的是戰(zhàn)略組合(擴(kuò)軍,擴(kuò)軍),博弈理論預(yù)測(cè)雙方都擴(kuò)軍可以達(dá)到對(duì)抗中的相對(duì)穩(wěn)定,這是一個(gè)符合現(xiàn)實(shí)的合理結(jié)局。例二

海灘占位

甲乙兩個(gè)冷飲攤販,他們?cè)谝粋€(gè)直線狀的海灘上,以同樣的價(jià)格、相同的質(zhì)量向均勻分布在海灘上的眾多游客(他們來(lái)此享受海水和陽(yáng)光,進(jìn)行日光浴或游泳活動(dòng))銷售冷飲。既然是做生意,目的總是希望盡可能多賺點(diǎn)錢,甲乙兩人又是在同一地點(diǎn)做同樣的生意,競(jìng)爭(zhēng)就是不可避免的事情了。這兩個(gè)冷飲攤販應(yīng)該如何安置自己的攤位,才能相安無(wú)事地做各自的生意呢?

假定游客總是到距離自己最近的攤位購(gòu)買冷飲,這也是合乎常情的。為了敘述方便,不妨將海灘長(zhǎng)度標(biāo)準(zhǔn)化為1。按通常的想法,如果海灘左端定為0,甲在1/4處設(shè)攤,乙在3/4處設(shè)攤(見(jiàn)圖1-3),這樣既方便了顧客,又照顧到甲乙二人各占約一半顧客的生意,可謂公平合理。問(wèn)題不是簡(jiǎn)單的解決了嗎?

博弈論對(duì)海灘占位問(wèn)題的解是甲乙二人均選擇在海灘中點(diǎn)(1/2處)設(shè)攤,而不是原先想象的甲乙分別在1/4和3/4處占位,即使集中在一起營(yíng)業(yè)會(huì)給海灘兩端的顧客帶來(lái)不便。社會(huì)經(jīng)濟(jì)領(lǐng)域內(nèi),就有不少與海灘占位博弈類似的現(xiàn)象。比如,在城市商業(yè)網(wǎng)點(diǎn)的布局上,常常會(huì)出現(xiàn)相同行業(yè)的多家商店都擠在一起,形成“電子一條街”、“裝飾城”、“飲食廣場(chǎng)”等。只要把這個(gè)城市想象成東西或南北方向的一個(gè)“海灘”,從博弈論中就不難找到答案。又如,同一城市的不同航空公司經(jīng)營(yíng)的飛往同一目的地的航班,常常出現(xiàn)起飛時(shí)刻幾乎相同的現(xiàn)象。

就是在文化娛樂(lè)方面,也能運(yùn)用海灘占位的博弈結(jié)論予以解釋。如果把電視中高雅藝術(shù)節(jié)目與較低檔的節(jié)目比作海灘的兩端,那么眾多的電視觀眾就可以看作是散布在海灘上的游客。電視臺(tái)常常將黃金時(shí)段的電視節(jié)目定位在中等檔次,以提高收視率。例三智豬爭(zhēng)食

豬圈里喂養(yǎng)兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個(gè)豬食槽,對(duì)面的一邊裝有控制開關(guān)。只要豬用鼻頭去拱控制開關(guān),就會(huì)一次有6個(gè)單位的飼料流進(jìn)豬食槽。如果大豬和小豬都不去拱開關(guān),那么它們都吃不到飼料。如果小豬去拱開關(guān),那么等它跑到另一邊的豬食槽時(shí),大豬已將流出的飼料全部都吃光了。如果大豬去拱開關(guān),那么等它跑到豬食槽旁邊,小豬差不多已吃掉了5個(gè)單位的飼料,結(jié)果大豬只能吃到1個(gè)單位的飼料。如果大豬、小豬一起去拱開關(guān),再一起跑去吃食,那么大豬可搶到4個(gè)單位的飼料,小豬也只能吃掉2個(gè)單位的飼料。假定每拱一次開關(guān)需要消耗0.5個(gè)單位飼料的能量。大豬和小豬長(zhǎng)期在一起進(jìn)食,上面所說(shuō)的情況(信息、知識(shí))已為它們所掌握。仿照例一囚徒困境的情形,就可以畫出如圖1-4所示的雙變量矩陣。

在這個(gè)博弈中,大豬與小豬都有兩種戰(zhàn)略選擇:拱、不拱。在這個(gè)例子中可以發(fā)現(xiàn),不論大豬選擇拱還是不供,小豬的最優(yōu)選擇總是不拱。這是因?yàn)椋绻筘i去拱開關(guān),小豬不拱(等在豬食槽旁邊)比拱后再跑回去爭(zhēng)食要?jiǎng)澦悖?>1.5);如果大豬不去拱開關(guān),小豬不拱頂多都不得食,而去拱就要白白消耗能量,不劃算(0>-0.5)。所以,不拱是小豬的占優(yōu)戰(zhàn)略。給定小豬總是選擇不拱,大豬的最優(yōu)選擇總是拱。這樣,智豬爭(zhēng)食問(wèn)題的博弈論解是戰(zhàn)略組合(拱,不拱)。智豬爭(zhēng)食模型在社會(huì)經(jīng)濟(jì)領(lǐng)域也可以找到許多實(shí)例。

比如股份公司中就有大股東和小股東之分。股東都有監(jiān)督經(jīng)理的職能,他們從監(jiān)督中得到的收益并不一樣。在監(jiān)督成本相同的情況下,大股東從監(jiān)督中得到的好處顯然多于小股東。通常在股份公司里,總是由大股東擔(dān)當(dāng)監(jiān)督任務(wù),而小股東則搭大股東的便車。股票市場(chǎng)上也有類似現(xiàn)象。一般大戶總是重視搜集信息,積極進(jìn)行行情分析。對(duì)小戶而言,跟大戶是常見(jiàn)現(xiàn)象。

進(jìn)行產(chǎn)品研究、開發(fā)以及新產(chǎn)品廣告宣傳時(shí),對(duì)大企業(yè)而言,其資金實(shí)力及可望的收益會(huì)使大企業(yè)有投資的積極性,而小企業(yè)往往會(huì)得不償失。小企業(yè)通常采取與大企業(yè)建立協(xié)作生產(chǎn)或移植部分技術(shù)的做法。

介紹上面三個(gè)博弈論的例子,首先,是讓你們對(duì)博弈論有一個(gè)初步的感性認(rèn)識(shí)。雖然在闡述中也涉及了專業(yè)術(shù)語(yǔ),諸如理性、有效、戰(zhàn)略、占優(yōu)戰(zhàn)略、博弈解等,但是這些術(shù)語(yǔ)的含義是你們可以接受的。其次,通過(guò)這些例子想給你們留下一個(gè)深刻印象:博弈論與社會(huì)經(jīng)濟(jì)等諸多領(lǐng)域的聯(lián)系是如此廣泛、如此密切。下面章節(jié)對(duì)囚徒困境博弈在不同的理論的高度還要進(jìn)行研究和分析,這個(gè)例子還會(huì)在不同地方被引用。二、博弈論的基本概念

什么是博弈論?簡(jiǎn)而言之,博弈論是研究多人謀略和決策問(wèn)題的理論。要較深入地理解這句話,還需要關(guān)注以下一些問(wèn)題。首先,一個(gè)博弈問(wèn)題必須至少有兩個(gè)參與博弈的主體(可能是個(gè)人,也可能是團(tuán)體,如企業(yè)、國(guó)家),他們?cè)诓┺倪^(guò)程中都有各自的切身利益。由于利益的驅(qū)動(dòng),他們?cè)谧鞒鲎约旱臎Q策時(shí),總想使出最好的招數(shù)(最優(yōu)戰(zhàn)略)。

其次,博弈中的各個(gè)主體之間總不可避免地存在著競(jìng)爭(zhēng)。競(jìng)爭(zhēng)自然貫穿博弈的全過(guò)程,競(jìng)爭(zhēng)又將博弈的主體緊緊地聯(lián)系在一起,相互依存,相互較量(說(shuō)得通俗一些就是“鉤心斗角”)。再者,既然主體間要進(jìn)行較量,每一個(gè)博弈主體就不會(huì)閉目塞聽(tīng),靠靈機(jī)一動(dòng)想出高招去贏得對(duì)手,而是需要“眼觀六路,耳聽(tīng)八方”。盡量掌握博弈中對(duì)手的特點(diǎn)和已經(jīng)采取或可能采取的行動(dòng)的知識(shí)和信息。最后,就是博弈主體最為關(guān)心的博弈結(jié)果了。博弈結(jié)果隨主體之間使出招數(shù)(戰(zhàn)略)的不同而不同。博弈結(jié)果通俗的說(shuō)就是輸贏的大小,博弈論用收益(或效用)來(lái)描述博弈的結(jié)果。博弈論就是從理論上進(jìn)行研究和分析,為博弈預(yù)測(cè)出一個(gè)理想的結(jié)局。預(yù)測(cè)結(jié)局的正確性體現(xiàn)在博弈主體各方面都能自愿選擇理論給他推導(dǎo)出的戰(zhàn)略,并且沒(méi)有博弈主體愿意獨(dú)自偏離他依照博弈理論所選定的戰(zhàn)略。可想而知,每個(gè)博弈主體所選戰(zhàn)略一定是針對(duì)其他主體所選戰(zhàn)略的最優(yōu)反應(yīng)。

以上只是對(duì)博弈論粗線條的描述,為了后面對(duì)博弈理論進(jìn)行深入的討論,下面對(duì)博弈論的幾個(gè)重要的基本概念給出明確的定義。(1)參與者。參與者指的是一個(gè)博弈中的決策主體,通常又稱為參與人或局中人。參與者參加博弈的目的是通過(guò)合理選擇自己的行動(dòng),以期取得最大化自己的收益(或效用)水平。參與者可以是自然人,也可以是企業(yè)、團(tuán)體、國(guó)家,甚至是國(guó)家組成的集團(tuán)(如歐盟、OPEC等)。對(duì)參與者而言,在博弈過(guò)程中,他必須有不同的行動(dòng)可作應(yīng)對(duì)選擇。在博弈的結(jié)局中,他能知道或計(jì)算出各參與者不同的行動(dòng)組合產(chǎn)生的效益(或效用)。

在博弈論中,為了分析研究問(wèn)題的需要,還有一個(gè)虛擬參與者——“自然”。這里,“自然”就是指不以博弈參與者的意志為轉(zhuǎn)移的外生事件?!白匀弧边x擇的是外生事件的各種可能現(xiàn)象,并且用概率分布來(lái)描述“自然”的選擇肌理。例四房地產(chǎn)開發(fā)博弈

現(xiàn)有開發(fā)商A(按博弈論說(shuō)法是參與者1)正在考慮是否要投資開發(fā)一座商住樓。他面臨的行動(dòng)選擇是開發(fā)或不開發(fā)。如果要開發(fā),就必須投入1億元資金;如果不去開發(fā),投資就是0。房地產(chǎn)開發(fā)市場(chǎng)總是存在風(fēng)險(xiǎn)的。首先,風(fēng)險(xiǎn)來(lái)自市場(chǎng)需求的不確定性,需求可能大,也可能小。其次,風(fēng)險(xiǎn)來(lái)源是競(jìng)爭(zhēng)對(duì)手——房地產(chǎn)開發(fā)商B(參與者2)。開發(fā)商B也面臨與開發(fā)商A相同的決策問(wèn)題。

假定市場(chǎng)上有兩座樓出售,需求大時(shí),每座售價(jià)可達(dá)1.4億元;需求小時(shí),售價(jià)為7千萬(wàn)元。如果市場(chǎng)上只有一座樓出售,需求大時(shí),售價(jià)高達(dá)1.8億元;需求小時(shí),也能賣出1.1億元可以用圖1-5所示的雙變量矩陣描述這個(gè)博弈問(wèn)題。

在這個(gè)例子中,市場(chǎng)需求就是作為虛擬參與者“自然”出現(xiàn)在博弈問(wèn)題之中?!白匀弧保ㄊ袌?chǎng)需求)是以一定的概念表現(xiàn)出不同的狀態(tài)(需求大還是小)。不言而喻,“自然”直接關(guān)系到博弈的決策結(jié)果。這個(gè)例子幾乎涉及到博弈論討論的重要問(wèn)題的方方面面。相關(guān)的研究分析將在后面有關(guān)章節(jié)闡述。

在博弈論的討論中,一般都是用i=1,2,…,n

代表參與者,用N代表“自然”。(2)信息。信息指的是參與者在博弈過(guò)程中能了解到和觀察到的知識(shí)。這些知識(shí)包括“自然”的選擇,其他參與者的特征和行動(dòng)等。信息對(duì)參與者是至關(guān)重要的,因?yàn)橐粋€(gè)參與者在每一次進(jìn)行決策之前,必須根據(jù)觀察到的其他參與者的行動(dòng)和了解的有關(guān)情況作出自己的最佳選擇。

由于信息內(nèi)涵的不同,派生出各種有關(guān)信息的概念將博弈論劃分成不同的類型,因此尋求博弈間的方法也不同。本著由淺入深認(rèn)識(shí)事物的規(guī)律,這里不打算把這些概念一股腦兒和盤托出,而是分散到以后的章節(jié)中,逐步予以介紹。這里只就信息有關(guān)的兩個(gè)基本的、重要的概念進(jìn)行討論。

首先,關(guān)于“共同知識(shí)”的概念。一個(gè)博弈問(wèn)題所涉及的“自然”的不同選擇、參與者的行動(dòng)以及相應(yīng)產(chǎn)生的效用(效果、收益)都是一種知識(shí)(信息)。比如,房地產(chǎn)開發(fā)商博弈問(wèn)題,市場(chǎng)需求的大小,開發(fā)商A、B是開發(fā)還是不開發(fā),不同情況下的利潤(rùn)和虧損,都是知識(shí)。開發(fā)商A、B知道這些知識(shí)也是一種信息,開發(fā)商A知道開發(fā)商B知道這些知識(shí)也是一種信息,如此等等。博弈論所謂的共同知識(shí)指的是“所有參與者知道,所有參與者知道所有參與者知道,所有參與者知道所有參與者知道所有參與者知道……”的知識(shí)。可以聯(lián)想到市場(chǎng)需求大小是一種知識(shí)。可能開發(fā)商A、B都知道市場(chǎng)需求有大與小兩種狀態(tài),但是開發(fā)商A并不知道開發(fā)商B知道市場(chǎng)需求,這時(shí)市場(chǎng)需求就不構(gòu)成共同知識(shí),而只能說(shuō)是A與B“共同”享有的知識(shí)。

為了說(shuō)明共同知識(shí)的重要性,我引用一個(gè)眾所周知的寓言。故事發(fā)生在一個(gè)村莊,村里有100對(duì)已婚夫婦,他們都是地道的邏輯學(xué)家,但也有一些多少有點(diǎn)奇特的社會(huì)風(fēng)俗。每天晚上,村里的男人們都將點(diǎn)起篝火,繞圈圍坐舉行一個(gè)會(huì)議,且每個(gè)人都談?wù)撟约旱钠拮印T跁?huì)議開始時(shí),如果一個(gè)男人有理由認(rèn)為他的妻子對(duì)他總是守貞的,那么他就對(duì)在坐的男人們贊揚(yáng)她的美德。另一方面,如果在當(dāng)前會(huì)議之前的任何時(shí)間,只要他發(fā)現(xiàn)了他妻子不貞的證據(jù),那他就會(huì)悲鳴慟哭,并祈求神靈嚴(yán)厲地懲罰她。再則,如果一個(gè)妻子曾有不貞,那她和她的情人將會(huì)立即通知村里除她丈夫外所有的男人。所有這些傳統(tǒng)都是村民們的共同知識(shí)。

事實(shí)上,每個(gè)妻子都已對(duì)自己的丈夫不忠。于是,每個(gè)丈夫都知道除自己的妻子外都是不貞的女人,而對(duì)自己的妻子每晚都要贊揚(yáng)。

這種狀況持續(xù)了很多年,直到一個(gè)傳教徒走訪到這個(gè)村莊。他坐在髯火旁參加了一次會(huì)議并聽(tīng)到每個(gè)男人都贊揚(yáng)自己的妻子之后,他站到丈夫們圍坐的圓中心,大聲地說(shuō):“這個(gè)村里有一個(gè)妻子已經(jīng)不貞了?!痹诖撕蟮?9個(gè)晚上丈夫們繼續(xù)開會(huì)并贊揚(yáng)他們的妻子,但在第100個(gè)晚上,他們?nèi)急Q偷哭并祈求嚴(yán)厲地懲罰他們的妻子。

為了理解在這個(gè)寓言中發(fā)生了什么,首先注意到若只有一個(gè)妻子不貞,則因?yàn)椋ㄖ罌](méi)有另外的不貞女人,且若有的話他是知道的)她丈夫能夠立刻知道這個(gè)不貞的女人是他的妻子,所以在傳教徒訪問(wèn)后的第一天晚上就會(huì)悲鳴慟哭。而且,由歸納法可以證明,對(duì)于1與100之間的任一正整數(shù),如果恰有個(gè)不貞的妻子,那么在傳教徒訪問(wèn)后的連續(xù)個(gè)晚上,所有的丈夫仍全都贊揚(yáng)自己的妻子,但在第個(gè)晚上,個(gè)不貞妻子的丈夫會(huì)悲鳴慟哭。于是,在99個(gè)贊揚(yáng)之夜過(guò)后的第100個(gè)晚上,每個(gè)丈夫都知道一定有100個(gè)不貞的妻子,包括他自己的妻子在內(nèi)。

現(xiàn)在,讓我們?cè)噯?wèn)一下,這個(gè)傳教徒告訴了這些丈夫們他們所不知道的什么?每個(gè)丈夫都已經(jīng)知道了99個(gè)不貞的妻子,故這對(duì)任何人來(lái)說(shuō)都不是新聞。但“這個(gè)傳教徒對(duì)所有男人做了一個(gè)聲明”是共同知識(shí),從而這個(gè)傳教徒所聲明的內(nèi)容,即有一個(gè)不貞的妻子,也就成了所有男人中間的共同知識(shí)。在傳教徒宣告之前,每個(gè)形如“(每個(gè)丈夫知道)有一個(gè)不貞的妻子”的判斷對(duì)于99都是正確的,但對(duì)100就不正確了。例如,若從1到100對(duì)丈夫們編號(hào),則1已經(jīng)知道2已經(jīng)知道3已經(jīng)知道…99已經(jīng)知道100的妻子是不貞的,但1不知道2已經(jīng)知道3已經(jīng)知道…99已經(jīng)知道100已經(jīng)知道1的妻子是不貞的。因而,從這個(gè)寓言中引申出的含義是,從一個(gè)共同知識(shí)的事實(shí)推出的結(jié)果與從(例如)只知道每個(gè)人已經(jīng)知道每個(gè)人已經(jīng)知道的一個(gè)事實(shí)推出的結(jié)果可以非常不同。

其次,關(guān)于“完全信息”的概念。完全信息是博弈論非常重要的基本概念,有了上述的共同知識(shí)概念,這里就可以給出完全信息的嚴(yán)格定義。完全信息指的是所有參與者各自選擇的行動(dòng)的不同組合所決定的各參與者的收益對(duì)所有參與者來(lái)說(shuō)是共同知識(shí)。簡(jiǎn)單通俗地說(shuō),完全信息是指每一個(gè)參與者對(duì)自己以及其他參與者的行動(dòng),以及各參與者選擇的行動(dòng)組合產(chǎn)生的收益等知識(shí)有完全的了解。(3)戰(zhàn)略。戰(zhàn)略是參與者如何對(duì)其他參與者的行動(dòng)作出反應(yīng)的行動(dòng)規(guī)則,它規(guī)定參與者在什么時(shí)候該選擇什么行動(dòng)。或者說(shuō)。戰(zhàn)略是參與者“相機(jī)行動(dòng)方案”。

戰(zhàn)略是一個(gè)與過(guò)程有關(guān)的概念,行動(dòng)是與時(shí)序無(wú)關(guān)的動(dòng)作。打個(gè)比方,行動(dòng)好比拳術(shù)中的一招一式,戰(zhàn)略就是一招一式構(gòu)成的套路。(4)收益。在博弈論中,收益指的是在一個(gè)特定的戰(zhàn)略組合下參與者得到的確定效用或期望效用。效用通常表現(xiàn)為博弈結(jié)果中的輸贏、得失、盈虧。效用必須能用數(shù)值刻畫其大小。收益是博弈參與者真正關(guān)心的問(wèn)題。

博弈論的一個(gè)基本特征是一個(gè)參與者的收益不僅取決于自己的戰(zhàn)略選擇,而且取決于所有參與者的戰(zhàn)略選擇。或者說(shuō),收益是所有參與者各選定一個(gè)戰(zhàn)略形成的戰(zhàn)略組合的函數(shù)。在博弈論中,通常用ui表示參與者i的收益,一個(gè)戰(zhàn)略組合是,每個(gè)參與者的收益可以表示為

均衡是博弈論最重要、最基礎(chǔ)的一個(gè)概念,對(duì)于不同類型、不同條件的博弈問(wèn)題又形成各種各樣特定的均衡的概念,它們構(gòu)成博弈論五彩繽紛的預(yù)測(cè)結(jié)果。各種均衡在社會(huì)經(jīng)濟(jì)等不同的領(lǐng)域都展現(xiàn)出廣闊的應(yīng)用前景。讀者充分、深刻地理解這些均衡概念是非常重要的。

有了上面完全信息的概念,再結(jié)合參與者行動(dòng)的先后次序的界定,就可以對(duì)博弈論的類型作出劃分。如果參與者同時(shí)選擇各自的行動(dòng),則這類博弈稱為靜態(tài)的。值得注意的是,這里所說(shuō)的“同時(shí)”具有雙層含義。一種含義就是“同時(shí)”的字面解釋,也就是參與者在同一時(shí)間一起行動(dòng);另一種含義是參與者行動(dòng)雖然有先后,但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。

動(dòng)態(tài)博弈指的是參與者的行動(dòng)有先后順序,并且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。后行動(dòng)者就可以依據(jù)獲得的信息,采取自己認(rèn)為最有力的戰(zhàn)略。憑直觀理解,完全信息總要比不完全信息要好一些,靜態(tài)的情形又要比動(dòng)態(tài)的情形要簡(jiǎn)單一些。如果將信息的完全與不完全、狀態(tài)的靜與動(dòng)交叉組合,就構(gòu)成了四種不同類型的博弈。從簡(jiǎn)單到復(fù)雜排列,就是完全信息靜態(tài)博弈——完全信息動(dòng)態(tài)博弈——不完全信息靜態(tài)博弈——不完全信息動(dòng)態(tài)博弈。

3、博弈論研究著名學(xué)者簡(jiǎn)介(1)、計(jì)算機(jī)之父、博弈論創(chuàng)始人——馮·諾伊曼約翰·馮·諾伊曼(JohnVonNeumann,1903—1957),美籍匈牙利人。1921—1923年在蘇黎世大學(xué)學(xué)習(xí)。很快又在1926年以優(yōu)異的成績(jī)獲得了布達(dá)佩斯大學(xué)數(shù)學(xué)博士學(xué)位,此時(shí)馮·諾伊曼年僅22歲。馮·諾伊曼是20世紀(jì)最優(yōu)秀的數(shù)學(xué)家之一,因1946年發(fā)明電子計(jì)算機(jī)而被西方人譽(yù)為“計(jì)算機(jī)之父”。1927—1929年馮·諾伊曼相繼在柏林大學(xué)和漢堡大學(xué)擔(dān)任數(shù)學(xué)講師。1930年接受了普林斯頓大學(xué)客座教授的職位,西渡美國(guó),1931年成為該校終身教授。他是美國(guó)國(guó)家科學(xué)院、秘魯國(guó)立自然科學(xué)院和意大利國(guó)立林且學(xué)院的院士。馮·諾伊曼建立了算子代數(shù)這門新的數(shù)學(xué)分支。在格論、連續(xù)幾何、理論物理、動(dòng)力學(xué)、連續(xù)介質(zhì)力學(xué)、氣象計(jì)算、原子能和經(jīng)濟(jì)學(xué)等領(lǐng)域都做過(guò)重要的工作。然而,馮·諾伊曼對(duì)人類的最大貢獻(xiàn)是對(duì)計(jì)算機(jī)科學(xué)、計(jì)算機(jī)技術(shù)和數(shù)值分析的開拓性工作。馮·諾伊曼于20世紀(jì)20年代開始創(chuàng)立博弈理論,1944年他與經(jīng)濟(jì)學(xué)家?jiàn)W斯卡·摩根斯特恩合作出版的巨著《博弈論與經(jīng)濟(jì)行為》,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。馮·諾伊曼和摩根斯特恩在該書中提出的標(biāo)準(zhǔn)型、擴(kuò)展型和合作型博弈模型解的概念和分析方法,奠定了這門學(xué)科的理論基礎(chǔ)。(2)、博弈論大師——納什

納什(JohnNash),1928年6月13日出生于美國(guó)弗吉尼亞西部的“布魯菲爾德”(Bluefield),高中畢業(yè)后進(jìn)入卡內(nèi)基-梅隆大學(xué)學(xué)習(xí)化學(xué)工程專業(yè),由于對(duì)數(shù)學(xué)的喜好和天賦,一年后正式轉(zhuǎn)到數(shù)學(xué)系。在畢業(yè)時(shí),他取得數(shù)學(xué)學(xué)士和理學(xué)學(xué)士?jī)蓚€(gè)學(xué)位。1950年納什22歲時(shí)通過(guò)論文答辯獲得普林斯頓大學(xué)的博士學(xué)位。正是這篇天才論文,奠定了他博弈論大師的地位,并為他鋪墊了通向諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的道路。1951年納什又發(fā)表了第二篇題為“非合作博弈”(Non—CooperativeGames,AnnalsofMathematics1951)的論文。在此之前,他還撰寫了“討價(jià)還價(jià)問(wèn)題”。1958年《財(cái)富》雜志把納什評(píng)為新一代天才數(shù)學(xué)家中最出色的人物。也許是天妒英才,正當(dāng)麻省理工學(xué)院準(zhǔn)備提升他為正教授時(shí),年方30歲的納什得了嚴(yán)重的“妄想型精神分裂癥”,從此他從學(xué)術(shù)界銷聲匿跡,飽受精神病的折磨長(zhǎng)達(dá)30多年。

納什的主要貢獻(xiàn)是1950年和1951年發(fā)表的兩篇關(guān)于非合作博弈論的重要論文,他的研究徹底改變了人們對(duì)競(jìng)爭(zhēng)和市場(chǎng)的看法。1950年納什發(fā)表的“非合作對(duì)策”博士論文提出了與諾伊曼的合作對(duì)策論相對(duì)立的觀點(diǎn)。納什在論文中引入了著名的“納什均衡”理論,對(duì)有混合利益的競(jìng)爭(zhēng)者之間的對(duì)抗進(jìn)行了數(shù)學(xué)分析。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,他是繼馮·諾伊曼之后最偉大的博弈論大師之一,他提出的著名的納什均衡的概念在非合作博弈理論中起著核心作用。后續(xù)的研究者對(duì)博弈論的貢獻(xiàn),都是建立在這一概念之上的。納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、社會(huì)學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅(jiān)實(shí)的理論基礎(chǔ)。

(3)、動(dòng)態(tài)博弈理論的開創(chuàng)者——澤爾騰澤爾騰(R.Selten)1930年10月10日出生于德國(guó)的布雷斯勞(二戰(zhàn)后,此地歸于波蘭),1951—1957年,他在法蘭克福大學(xué)學(xué)習(xí)數(shù)學(xué)。1961年在馬恩法蘭克福大學(xué)獲得了數(shù)學(xué)博士學(xué)位。1967—1968年,澤爾騰到加州大學(xué)伯克利分校做客座教授,1969—1972年在柏林大學(xué)做經(jīng)濟(jì)學(xué)教授,而后在比勒菲爾德大學(xué)工作了12年。1984年澤爾騰離開比勒菲爾德大學(xué),到波恩大學(xué)從教,致力于實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究。

澤爾騰的主要貢獻(xiàn)是在納什均衡的基礎(chǔ)上深入研究了動(dòng)態(tài)博弈問(wèn)題。澤爾騰通過(guò)研究發(fā)現(xiàn),“納什均衡”概念在實(shí)際應(yīng)用中存在缺陷。納什均衡的缺陷是,一般情況下能夠保證存在性,但不能保證唯一性。大多數(shù)情況下納什均衡有多個(gè),由此帶來(lái)的問(wèn)題就是,多個(gè)納什均衡中究竟哪一個(gè)才是博弈的理性結(jié)局?澤爾騰認(rèn)為“納什均衡”概念只適用于分析一些靜態(tài)的“重復(fù)性博弈”,而不適用于分析動(dòng)態(tài)博弈問(wèn)題。他對(duì)“納什均衡”概念進(jìn)行了精心的研究,先后提出了兩個(gè)著名均衡新概念:子博弈完美均衡,顫抖手完美均衡。他采用“逆向歸納法”,在多個(gè)納什均衡中剔除了一些按照一定規(guī)則不合理的均衡點(diǎn),從而形成了納什均衡的“精煉”概念,在擴(kuò)展型博弈分析方面取得了重大成果。(4)、不完全信息博弈理論的奠基者——海薩尼

約翰·海薩尼(JohnC.Harsanyi),美國(guó)人,由于受到納什成果的影響,從20世紀(jì)50年代開始潛心于博弈論的研究。海薩尼的研究成果非常豐富:(1)在合作博弈論研究上,給出了合作博弈的通解——N人議價(jià)模型,建立了一個(gè)合作博弈論的非合作博弈模型;(2)在不完全信息博弈研究上,提出了以類型為基礎(chǔ)的不完全信息博弈建模方法,引入了貝葉斯技術(shù)求解方法,對(duì)混合策略進(jìn)行了重新解釋,提出了基于隨機(jī)變量的變動(dòng)收益博弈模型;(3)在均衡選擇研究上,與澤爾騰合作完成了《博弈論均衡選擇的一般理論》。約翰·海薩尼通過(guò)多方面的研究將自己的思想構(gòu)成了一個(gè)完整的體系,他提出的不完全信息博弈思想及貝葉斯納什均衡概念,對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。(5)、米爾利斯

詹姆斯·亞歷山大·米爾利斯(J.Y.Morlis),出生于1936年7月5日蘇格蘭柯庫(kù)布里郡明尼加大。1996年10月8日,由于對(duì)不對(duì)稱信息條件下的激勵(lì)經(jīng)濟(jì)理論做出了基礎(chǔ)性貢獻(xiàn),與威廉·維克里分享諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。米爾利斯對(duì)不對(duì)稱信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)包括:在最優(yōu)所得稅機(jī)制設(shè)計(jì)問(wèn)題上,探討了政府在面臨信息不完全的情況下如何去設(shè)計(jì)出一種“激勵(lì)性相容”的最優(yōu)稅收體制,提出了顯示原則:解決激勵(lì)問(wèn)題的關(guān)鍵是要通過(guò)一種與個(gè)人利益相容的方式,引導(dǎo)所有人如實(shí)表露自己的信息;在最優(yōu)契約設(shè)計(jì)問(wèn)題上,以“委托人一代理人方法”對(duì)道德危險(xiǎn)問(wèn)題進(jìn)行了重新闡述,得出的結(jié)論是:為了使代理人有足夠的激勵(lì)去自動(dòng)選擇有利于委托人的行動(dòng),就必須在合同的設(shè)計(jì)中讓代理人也承擔(dān)一部分結(jié)果不確定的風(fēng)險(xiǎn);在信號(hào)篩選理論方面,提出了區(qū)分不同信號(hào)的“斯彭斯一米爾利斯條件”。第二部分、幾個(gè)經(jīng)典博弈模型分析

博弈的標(biāo)準(zhǔn)式表述

嚴(yán)格占優(yōu)戰(zhàn)略均衡

逐步剔除嚴(yán)格戰(zhàn)略均衡

納什均衡應(yīng)用舉例

混合戰(zhàn)略納什均衡

納什均衡的存在性

(一)、博弈的標(biāo)準(zhǔn)式表述

一、博弈的標(biāo)準(zhǔn)式表述與納什均衡

(二)、嚴(yán)格占優(yōu)戰(zhàn)略均衡

博弈分析的目的是預(yù)測(cè)博弈的均衡結(jié)果。簡(jiǎn)言之,就是求解博弈問(wèn)題。這里需要假定“參與者是理性的”是共同知識(shí)。經(jīng)濟(jì)學(xué)對(duì)理性的描述是,在給定的約束條件下追求效用最大化。參與者在博弈過(guò)程中,在每一步斟酌的取舍(選優(yōu)剔劣)時(shí),都應(yīng)依據(jù)這個(gè)假定行事。一般說(shuō)來(lái),由于每個(gè)參與者的收益是博弈中所有參與者所選戰(zhàn)略的函數(shù),因此,每個(gè)參與者的最優(yōu)戰(zhàn)略選擇必須考慮所有其他參與者的戰(zhàn)略選擇。但在一些特殊的博弈中,一個(gè)參與者的最優(yōu)戰(zhàn)略可能不需要考慮其他參與者如何選擇戰(zhàn)略,就是說(shuō),不論其他參與者選擇什么戰(zhàn)略,該參與者有唯一一個(gè)最優(yōu)戰(zhàn)略,這個(gè)最優(yōu)戰(zhàn)略稱為嚴(yán)格占優(yōu)戰(zhàn)略。下面給出嚴(yán)格占優(yōu)戰(zhàn)略定義。

顯然,在一個(gè)博弈問(wèn)題中,如果所有參與者都有一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略,那么每一個(gè)理性的參與者誰(shuí)也不會(huì)放棄他的嚴(yán)格占優(yōu)戰(zhàn)略。這樣,由全部嚴(yán)格占優(yōu)戰(zhàn)略就構(gòu)成博弈的解——嚴(yán)格占優(yōu)戰(zhàn)略均衡。

應(yīng)該指出的是,嚴(yán)格占優(yōu)戰(zhàn)略只要求每個(gè)參與者是理性的,而并不要求每個(gè)參與者知道其他參與者是理性的(即不要求“理性”是共同知識(shí))。這是因?yàn)?,不論知道與否,嚴(yán)格占優(yōu)戰(zhàn)略總是一個(gè)理性參與者的最佳選擇。

值得注意的是,囚徒困境博弈暴露了個(gè)人理性與團(tuán)體理性的沖突問(wèn)題。因?yàn)榍敉?與囚徒2都選擇沉默,每人只判刑1個(gè)月,這顯然要比(坦白,坦白)都判刑6個(gè)月有利。(沉默,沉默)不是一個(gè)均衡,因?yàn)樗粷M足個(gè)人理性的要求。換個(gè)角度考慮,即使兩個(gè)囚徒在被捕前訂立了攻守同盟(拒不坦白),這個(gè)同盟也沒(méi)有用,因?yàn)闆](méi)有人會(huì)嚴(yán)格遵守同盟協(xié)定(這時(shí),只要誰(shuí)一坦白,他就立即獲得釋放)。

(三)、逐步剔除嚴(yán)格劣戰(zhàn)略均衡

尋求博弈問(wèn)題的解的過(guò)程就是參與者選擇戰(zhàn)略的過(guò)程。選擇有兩種途徑:選優(yōu)與去劣。上面尋求嚴(yán)格占優(yōu)戰(zhàn)略均衡走的就是選優(yōu)的路子。下面介紹的逐步剔除嚴(yán)格劣戰(zhàn)略尋求均衡走的就是去劣的路子。

研究圖2-1所示的一個(gè)博弈問(wèn)題。

這樣一來(lái),參與者1就可以將圖2-1所示的博弈視同為圖2-2所示的博弈。

在圖2-2中,對(duì)參與者1來(lái)說(shuō),戰(zhàn)略“下”相對(duì)于戰(zhàn)略“上”是嚴(yán)格劣戰(zhàn)略(因?yàn)?<1,且0<1)。于是,如果參與者1是理性的(并且參與者1知道參與者2是理性的,原博弈才能簡(jiǎn)化為圖2-2),那么參與者1就不會(huì)選擇“下”。這時(shí),如果參與者2知道參與者1是理性的,并且參與者2知道參與者1知道參與者2是理性的(只有這樣,參與者2知道原博弈已被簡(jiǎn)化為圖2-2所示博弈),那么參與者2就可以把“下”從參與者1的戰(zhàn)略空間S1中剔除。

這樣一來(lái),參與者2又可以進(jìn)一步將圖2-2所示博弈簡(jiǎn)化為圖2-3所示博弈

那么,圖2-4的博弈有沒(méi)有均衡結(jié)果呢?后面我們還會(huì)討論。

另外,嚴(yán)格占優(yōu)戰(zhàn)略均衡和逐步剔除嚴(yán)格劣戰(zhàn)略均衡對(duì)參與者理性的要求是不同的。前者只要每個(gè)參與者是理性的,而后者卻要求理性是參與者的共同知識(shí)。只有在“參與者2是理性的,且參與者1知道參與者2是理性的”條件下,圖2-1的博弈才能簡(jiǎn)化為圖2-2的情形。一共用了三步剔除得到了結(jié)果。顯然,參與者的戰(zhàn)略空間越大,剔除的步驟就越多,對(duì)共同知識(shí)的要求就越嚴(yán)格。定義在標(biāo)準(zhǔn)式的博弈中,設(shè)si'和si″是參與者i的兩個(gè)可行戰(zhàn)略。若下式

類似于運(yùn)用逐步剔除嚴(yán)格劣戰(zhàn)略去尋求一個(gè)均衡結(jié)果,自然想到運(yùn)用逐步剔除劣勢(shì)戰(zhàn)略也是求解博弈問(wèn)題的一種方法。

考察下面圖2-5所示的博弈問(wèn)題。

(四)、納什(Nash)均衡

納什均衡是完全信息靜態(tài)博弈的解的一般概念,它是對(duì)非常廣泛博弈問(wèn)題給出更加嚴(yán)格的結(jié)果。首先,許多不存在嚴(yán)格占優(yōu)戰(zhàn)略均衡或逐步剔除嚴(yán)格劣戰(zhàn)略均衡的博弈,卻存在納什均衡。其次,嚴(yán)格占優(yōu)戰(zhàn)略均衡一定就是博弈問(wèn)題的惟一的納什均衡。再者納什均衡一定不會(huì)被逐步剔除嚴(yán)格劣戰(zhàn)略所剔除。可以這么說(shuō),沒(méi)有任何一個(gè)戰(zhàn)略組合嚴(yán)格優(yōu)于納什均衡。為了理解納什均衡的含義,設(shè)想博弈理論對(duì)一個(gè)n個(gè)參與者博弈中的每一個(gè)參與者選定的一個(gè)戰(zhàn)略,預(yù)測(cè)的博弈結(jié)果為s*=(s1*,…,si*,…,sn*)。其中,si*是理論上導(dǎo)出的參與者i的戰(zhàn)略。首先,理論上確定的每個(gè)參與者要選擇的戰(zhàn)略必須是針對(duì)其他參與者選擇戰(zhàn)略的最優(yōu)反應(yīng)。其次,遵循理論結(jié)果產(chǎn)生的效用不會(huì)小于偏離理論結(jié)果時(shí)的效用,也就是沒(méi)有參與者愿意單獨(dú)偏離理論給他選定的戰(zhàn)略,這種理論導(dǎo)出的結(jié)果時(shí)一種“戰(zhàn)略相對(duì)穩(wěn)定”狀態(tài)。我們就把這種狀態(tài)稱為一個(gè)納什均衡。

和納什均衡的導(dǎo)出密切相關(guān)的是協(xié)議的理念。對(duì)給定的博弈,如果參與者之間要商定一個(gè)協(xié)議決定博弈如何進(jìn)行,那么一個(gè)有效的協(xié)議中的戰(zhàn)略組織必須是納什均衡的戰(zhàn)略組合,否則至少有一個(gè)參與者會(huì)不遵循該協(xié)議。

運(yùn)用上述定義中不等式(NE)的條件,就可以檢查一個(gè)特定的戰(zhàn)略組合是不是納什均衡。比如,在囚徒困境中,對(duì)參與者1(囚徒1)選s1*=坦白,對(duì)參與者2(囚徒2)選s2*=坦白??疾靾D2-4所示的博弈。

從圖2-6可以看出,一個(gè)單元中只有一個(gè)數(shù)值下面劃了橫線,表明只有一方的戰(zhàn)略上針對(duì)另一方戰(zhàn)略的最優(yōu)反應(yīng),而另一方的戰(zhàn)略卻表示針對(duì)對(duì)方戰(zhàn)略的最優(yōu)反應(yīng)。因此該單元對(duì)應(yīng)的戰(zhàn)略組合就不是雙方同時(shí)愿意接受的結(jié)果,因而也就構(gòu)不成納什均衡。

通過(guò)上面闡述,讀者已經(jīng)接觸了各種博弈均衡的概念和尋求均衡結(jié)果的方法,現(xiàn)在著重分析一下它們之間的關(guān)系。

(1)每一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡,反之不然。(2)每一個(gè)逐步剔除嚴(yán)格占優(yōu)戰(zhàn)略均衡是納什均衡,反之不然。

這里就不作嚴(yán)格的論證了?;仡欀秦i爭(zhēng)食博弈和圖2-1所示的博弈,對(duì)逐步剔除嚴(yán)格劣戰(zhàn)略過(guò)程和劃?rùn)M線方法尋求納什均衡的過(guò)程的比較,可以領(lǐng)會(huì)上述結(jié)論的含義。反例可以從圖2-6所示博弈看出。s*=(下,右)是納什均衡,但該博弈逐步剔除嚴(yán)格劣戰(zhàn)略卻一步也不能施行。(3)如果戰(zhàn)略組合是納什均衡,那么它一定不會(huì)被逐步剔除嚴(yán)格劣戰(zhàn)略剔除。

成立。這個(gè)例子得出的是:(歌劇,歌劇)和(拳擊,拳擊)都是納什均衡。這個(gè)博弈既不存在嚴(yán)格的占優(yōu)戰(zhàn)略均衡,也不存在逐步剔除嚴(yán)格劣戰(zhàn)略均衡。并且對(duì)該博弈的兩個(gè)納什均衡(歌劇,歌?。┖?拳擊,拳擊)不論實(shí)際實(shí)施哪一個(gè)均衡結(jié)果,總有一方感到有點(diǎn)委屈。遇到這樣一類博弈問(wèn)題,納什均衡用于預(yù)測(cè)博弈將任何進(jìn)行的作用就大大減弱了。二、納什均衡應(yīng)用舉例

本節(jié)集中研究分析經(jīng)濟(jì)學(xué)中幾個(gè)博弈問(wèn)題,這些也是博弈論的經(jīng)典之作。通過(guò)對(duì)這些例題的模型的討論,要達(dá)到兩個(gè)目的:①如何

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論