版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二講、完全信息靜態(tài)博弈1完全信息靜態(tài)博弈:納什均衡 納什均衡是著名博弈論專家納什(John Nash)對(duì)博弈論的重要貢獻(xiàn)之一。 納什在世紀(jì)年年的兩篇重要論文中,在一般意義上給定了非合作博弈及其均衡解,并證明了解的存在性。正是納什的這一貢獻(xiàn)奠定了非合作博弈論的理論基礎(chǔ)。納什所定義的均衡稱之謂“納什均衡”。在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對(duì)馮諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說(shuō)是一場(chǎng)革命。 2一、占優(yōu)策略均衡 占優(yōu)策略(dominant strategies)是指這樣一種特殊的博弈:某一參與人的策略可能并不依賴于其他參與人的策略選擇。換句話說(shuō),無(wú)論其他參
2、與人如何選擇自己的策略,該參與人的最優(yōu)策略選擇是惟一的。(一)囚徒困境3 以博弈論中最為著名的囚犯困境(prisoners dilemma)為例,說(shuō)明占優(yōu)策略均衡原理。兩個(gè)合伙作案的犯罪嫌疑人被警方抓獲。警方懷疑他們作案,但警方手中并沒(méi)有掌握他們作案的確鑿證據(jù)。因而,對(duì)兩個(gè)犯罪嫌疑人犯罪事實(shí)的認(rèn)定及相應(yīng)的量刑完全取決于他們自己的供認(rèn)。假定警方對(duì)兩名犯罪嫌疑人實(shí)行隔離關(guān)押,隔離審訊,每個(gè)犯罪嫌疑人都無(wú)法觀察到對(duì)方的選擇。同時(shí),警方明確地分別告知兩名犯罪嫌疑人,他們面臨著以下幾種后果可以用表21表示。該表又稱為“收益矩陣或得益矩陣”。從表21中可以看出,每個(gè)犯罪嫌疑人都有兩種可供選擇的策略:供認(rèn)或
3、不供認(rèn)。而且,每個(gè)犯罪嫌疑人選擇的最優(yōu)策略不依賴于其同伙的策略選擇,4表21 囚 犯 困 境 的 收 益 矩 在博弈中,如果所有參與人都有占優(yōu)策略存在,可以證明,博弈將在所有參與人的占優(yōu)策略的基礎(chǔ)上達(dá)到均衡,這種均衡稱為占優(yōu)策略均衡。上面提到的囚犯困境中的“坦白,坦白”就是占優(yōu)策略均衡解。5囚徒困境現(xiàn)實(shí)中的例子政治學(xué)例子:軍備競(jìng)賽 在政治學(xué)中,兩國(guó)之間的軍備競(jìng)賽可以用囚徒困境來(lái)描述。兩國(guó)都可以聲稱有兩種選擇:增加軍備(背叛)、或是達(dá)成削減武器協(xié)議(合作)。兩國(guó)都無(wú)法肯定對(duì)方會(huì)遵守協(xié)議,因此兩國(guó)最終會(huì)傾向增加軍備。似乎自相矛盾的是,雖然增加軍備會(huì)是兩國(guó)的“理性”行為,但結(jié)果卻顯得“非理性”(例如
4、會(huì)對(duì)經(jīng)濟(jì)造成都有損壞等)。這可視作遏制理論的推論,就是以強(qiáng)大的軍事力量來(lái)遏制對(duì)方的進(jìn)攻,以達(dá)到和平。6經(jīng)濟(jì)學(xué)例子:關(guān)稅戰(zhàn)兩個(gè)國(guó)家,在關(guān)稅上可以有以兩個(gè)選擇:提高關(guān)稅,以保護(hù)自己的商品。(背叛)與對(duì)方達(dá)成關(guān)稅協(xié)定,降低關(guān)稅以利各自商品流通。(合作)當(dāng)一國(guó)因某些因素不遵守關(guān)稅協(xié)定,獨(dú)自提高關(guān)稅(背叛),另一國(guó)也會(huì)作出同樣反應(yīng)(亦背叛),這就引發(fā)了關(guān)稅戰(zhàn),兩國(guó)的商品失去了對(duì)方的市場(chǎng),對(duì)本身經(jīng)濟(jì)也造成損害(共同背叛的結(jié)果)。然后二國(guó)又重新達(dá)成關(guān)稅協(xié)定。(重復(fù)博弈的結(jié)果是將發(fā)現(xiàn)共同合作利益最大。)7 商業(yè)例子:廣告戰(zhàn)商業(yè)活動(dòng)中亦會(huì)出現(xiàn)各種囚徒困境例子。以廣告競(jìng)爭(zhēng)為例。兩個(gè)公司互相競(jìng)爭(zhēng),二公司的廣告互相影
5、響,即一公司的廣告較被顧客接受則會(huì)奪取對(duì)方的部分收入。但若二者同時(shí)期發(fā)出質(zhì)量類(lèi)似的廣告,收入增加很少但成本增加。但若不提高廣告質(zhì)量,生意又會(huì)被對(duì)方奪走。 此二公司可以有二選擇:互相達(dá)成協(xié)議,減少?gòu)V告的開(kāi)支。(合作)增加廣告開(kāi)支,設(shè)法提升廣告的質(zhì)量,壓倒對(duì)方。(背叛)若二公司不信任對(duì)方,無(wú)法合作,背叛成為支配性策略時(shí),二公司將陷入廣告戰(zhàn),而廣告成本的增加損害了二公司的收益,這就是陷入囚徒困境。在現(xiàn)實(shí)中,要二互相競(jìng)爭(zhēng)的公司達(dá)成合作協(xié)議是較為困難的,多數(shù)都會(huì)陷入囚徒困境中。 8金融例子:各國(guó)央行的囚徒困境 拋出還是不拋出由于美國(guó)人經(jīng)年累月的雙赤字,即財(cái)政赤字和貿(mào)易赤字,美元下跌的趨勢(shì)不可避免。那么這
6、個(gè)困境中的博弈,其可能的結(jié)果如下。第一種情況是,如果各國(guó)中央銀行都繼續(xù)持有美元而不拋售,甚至增持美元,其結(jié)果是等著美元慢慢地下跌,這樣的損失最小,就如同囚徒都不坦白只被判較輕的一年罪名一樣。9第二種情況是,如果一個(gè)國(guó)家中央銀行能夠悄悄地大量拋售美元,轉(zhuǎn)持歐元、其他外匯或者黃金又不引起其他國(guó)家注意,而且其他國(guó)家也不拋售的話,那么它就可能在美元大跌之前得以脫身,從而損失很小,而其他國(guó)家則會(huì)遭受慘重?fù)p失。如同囚徒之一坦白從寬被無(wú)罪釋放而另一人被重判10年一樣。第三種情況是,大家都拋售,結(jié)果都造成慘重?fù)p失,兩敗俱傷。就像囚徒的兩個(gè)人都坦白并都被判8年一樣。在博弈的囚徒之間,最可能也是必然的結(jié)果就是,雙
7、方都爭(zhēng)相坦白同時(shí)幻想著對(duì)方不坦白,因?yàn)槿绻麑?duì)方坦白而自己不坦白自己就會(huì)面臨最壞的局面。那么,在各國(guó)銀行處理過(guò)剩美元盈余的策略中,究竟哪一種局面最可能發(fā)生呢?10 有最好的結(jié)果嗎? 第一種情況當(dāng)然是最好的選擇,只是不可能發(fā)生。盡管各國(guó)央行沒(méi)有像囚徒般地被隔離,他們?nèi)绻胗喴粋€(gè)攻守同盟的話沒(méi)有人能阻止他們,而且現(xiàn)在經(jīng)濟(jì)已經(jīng)全球化,各國(guó)銀行之間的協(xié)調(diào)是非常容易的事。但是每個(gè)國(guó)家都以本國(guó)利益為最高目的,無(wú)法做出對(duì)美元不拋售的協(xié)調(diào),就像不能與虎謀皮一樣,并且不會(huì)有任何一種協(xié)調(diào)結(jié)果會(huì)令所有人都滿意的。11 第二種情況也不會(huì)發(fā)生,就像囚徒不能指望別人不坦白而自己坦白一樣。沒(méi)有人天真到會(huì)相信別人能替自己賠錢(qián)。
8、在金融信息快到幾分鐘甚至幾秒鐘就可以從世界一端傳遞到另一端的情況下,各國(guó)中央銀行不可能悄悄地將他們的美元儲(chǔ)備拋出又不驚動(dòng)他人。國(guó)際間的貨幣兌換其實(shí)都是透明的,一個(gè)國(guó)家的外匯儲(chǔ)備從一種貨幣換作另一種貨幣的交易不可能隱藏到不被披露出來(lái)。12 最可能發(fā)生的是第三種情況,就是兩敗俱傷、幾敗俱傷的結(jié)局。因?yàn)槊總€(gè)美元儲(chǔ)備過(guò)剩的國(guó)家都在想盡辦法減少自己的儲(chǔ)備而又不引起其他國(guó)家太多的關(guān)注。他們知道自己對(duì)美元大規(guī)模的拋售必定會(huì)引起其他國(guó)家的恐慌,引起連鎖反應(yīng),造成其他國(guó)家對(duì)美元的大量拋售,就像多米諾骨牌一樣,加速美元的崩潰,損失的是包括他們自己在內(nèi)的所有美元持有人。所以他們每走一步都要看對(duì)方的動(dòng)靜,看市場(chǎng)的反應(yīng)
9、。13金融囚徒困境的結(jié)論: 各國(guó)央行正在玩“誰(shuí)都不能先腳軟”(a reverse game of chicken)的游戲。他們雖然持有大量的美元儲(chǔ)備,也明知道美元必定貶值。卻相互監(jiān)視,務(wù)求沒(méi)有任何一個(gè)國(guó)家可以順利拋售美元資產(chǎn)而得以脫身。就是說(shuō),若有任何一方膽敢拋售,其他人便會(huì)一起加入拋售,這樣反而形成相互威嚇,令各國(guó)央行都不敢擅自行動(dòng)。但是各國(guó)央行能一直站下去而不腳軟嗎?14囚徒困境模型的延伸 羅伯特阿克塞爾羅德在其著作合作的進(jìn)化中,探索了經(jīng)典囚徒困境情景的一個(gè)擴(kuò)展,并把它稱作“重復(fù)的囚徒困境”(IPD)。在這個(gè)博弈中,參與者必須反復(fù)地選擇他們彼此相關(guān)的策略,并且記住他們以前的對(duì)抗。 阿克塞爾
10、羅德發(fā)現(xiàn),采用“寬恕地以牙還牙”策略。當(dāng)這些對(duì)抗被每個(gè)選擇不同策略的參與者一再重復(fù)了很長(zhǎng)時(shí)間之后,從利己的角度來(lái)判斷,最終“貪婪”策略趨向于減少,而比較“利他”策略更多地被采用。他用這個(gè)博弈來(lái)說(shuō)明,通過(guò)自然選擇,一種利他行為的機(jī)制可能從最初純粹的自私機(jī)制進(jìn)化而來(lái)。15 通過(guò)分析高分策略,阿克塞爾羅德指定了策略獲得成功的幾個(gè)必要條件。友善最重要的條件是策略必須“友善”,這就是說(shuō),不要在對(duì)手背叛之前先背叛。幾乎所有的高分策略都是友善的。因此,完全自私的策略僅僅出于自私的原因,也永遠(yuǎn)不會(huì)首先打擊其對(duì)手。報(bào)復(fù)但是,阿克斯洛德主張,成功的策略必須不是一個(gè)盲目樂(lè)觀者。要始終報(bào)復(fù)。一個(gè)非報(bào)復(fù)策略的例子是始終
11、合作。這是一個(gè)非常糟糕的選擇,因?yàn)椤跋铝鳌辈呗詫埧岬貏兿鬟@樣的傻瓜。16寬恕成功策略的另一個(gè)品質(zhì)是必須要寬恕。雖然它們不報(bào)復(fù),但是如果對(duì)手不繼續(xù)背叛,它們會(huì)一再退卻到合作。這停止了報(bào)復(fù)和反報(bào)復(fù)的長(zhǎng)期進(jìn)行,最大化了得分點(diǎn)數(shù)。不嫉妒最后一個(gè)品質(zhì)是不嫉妒,就是說(shuō)不去爭(zhēng)取得到高于對(duì)手的分?jǐn)?shù)(對(duì)于“友善”的策略來(lái)說(shuō)這也是不可能的,也就是說(shuō)“友善”的策略永遠(yuǎn)無(wú)法得到高于對(duì)手的分?jǐn)?shù))。因此,阿克塞爾羅德得到一種給人以烏托邦印象的結(jié)論,認(rèn)為自私的個(gè)人為了其自私的利益會(huì)趨向友善、寬恕和不嫉妒。阿克塞爾羅德關(guān)于重復(fù)囚徒困境的研究的重要結(jié)論之一,是友善的家伙能先完成交易。17 囚犯困境反映了一個(gè)深刻問(wèn)題,這就是個(gè)
12、人理性與團(tuán)體理性的沖突。例如,微觀經(jīng)濟(jì)學(xué)的基本觀點(diǎn)之一,是通過(guò)市場(chǎng)機(jī)制這只“看不見(jiàn)的手”,在人人追求自身利益最大化的基礎(chǔ)上可以達(dá)到全社會(huì)資源的最優(yōu)配置。囚犯困境對(duì)此提出了新的挑戰(zhàn)。18二、重復(fù)剔除的占優(yōu)策略均衡 在每個(gè)參與人都有占優(yōu)策略的情況下,占優(yōu)策略均衡是非常合乎邏輯的。但遺憾的是在絕大多數(shù)博弈中,占優(yōu)策略均衡是不存在的。不過(guò),在有些博弈中,我們?nèi)匀豢梢愿鶕?jù)占優(yōu)的邏輯找出均衡。 智豬博弈(boxed pigs)是博弈論中的另一個(gè)著名的例子。 19 假設(shè)豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一端有一個(gè)豬食槽,另一端安裝了一個(gè)按鈕,控制豬食的供應(yīng)。按一下按鈕,將有個(gè)單位的豬食進(jìn)入豬食槽,供
13、兩頭豬食用。兩頭豬場(chǎng)面臨選擇的策略有兩個(gè):自己去按按鈕或等待另一頭豬去按按鈕。如果某一頭豬作出自己去按按鈕的選擇,它必須付出如下代價(jià):第一,它需要收益相當(dāng)于兩個(gè)單位的成本;第二,由于豬食槽遠(yuǎn)離豬食,它將比另一頭豬后到豬食槽,從而減少吃食的數(shù)量。假定:若大豬先到(小豬按按鈕),大豬將吃到個(gè)單位的豬食,小豬只能吃到個(gè)單位的豬食;若小豬先到(大豬場(chǎng)按按鈕),大豬和小豬各吃到個(gè)單位的豬食;若兩頭豬都選擇等待,實(shí)際上兩頭豬都吃不到豬食,如兩豬同時(shí)按,則大豬吃到個(gè)單位的豬食,小豬吃到個(gè)單位的豬食。20 智豬博弈的收益矩陣如表22所示。表中的數(shù)字表示不同選擇下每頭豬所能吃到的豬食數(shù)量減去按按鈕的成本之后的凈
14、收益水平。 21 從表22中不難看出,在這個(gè)博弈中,不論大豬場(chǎng)選擇什么策略,小豬的占優(yōu)策略均為等待。而對(duì)大豬來(lái)說(shuō),它的選擇就不是如此簡(jiǎn)單了。大豬場(chǎng)的最優(yōu)策略必須依賴于小豬的選擇。如果小豬選擇等待,大豬的最優(yōu)策略是按按鈕,這是,大豬能得到個(gè)單位的凈收益(吃到個(gè)單位豬食減去個(gè)單位的按按鈕成本),否則,大豬的凈收益為;如果小豬選擇按按鈕,大豬的最優(yōu)策略顯然是等待,這時(shí)大豬的凈收益為個(gè)單位。換句話說(shuō),在這個(gè)博弈中,只有小豬有占優(yōu)策略,而大豬沒(méi)有占優(yōu)策略。22 那么這個(gè)博弈的均衡解是什么呢?這個(gè)博弈的均衡解是大豬選擇按按鈕,小豬選擇等待,這是,大豬和小豬的凈收益水平分別為個(gè)單位和個(gè)單位。這是一個(gè)“多勞不
15、多得,少勞不少得”的均衡。23 在找出上述智豬博弈的均衡解時(shí),我們實(shí)際上是按照“重復(fù)剔除嚴(yán)格劣策略”(iterated elimination of strictly dominated strategies)的邏輯思路進(jìn)行的。該思路可以歸納如下:首先找出某參與人的嚴(yán)格劣策略,將它剔除,重新構(gòu)造一個(gè)不包括已剔除策略的新博弈;然后,繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣策略;重復(fù)進(jìn)行這一過(guò)程,直到剩下惟一的參與人策略組合為止。剩下的話這個(gè)惟一的參與人組合,就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占有策略均衡”(iterated dominance equilibrium)。所謂“嚴(yán)格劣策略”(s
16、trictly dominated strategies)是指:在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對(duì)自己嚴(yán)格不利的策略。24 由表22可以看出,無(wú)論大豬選擇什么策略,小豬選擇按按鈕,對(duì)小豬是一個(gè)嚴(yán)格劣策略,我們首先加以剔除。在剔除小豬按按鈕這一選擇后的新博弈中,小豬只有等待一個(gè)選擇,而大豬則有兩個(gè)可供選擇的策略。在大豬這兩個(gè)可供選擇的策略中,選擇等待對(duì)大豬是一個(gè)嚴(yán)格劣策略,我們?cè)偬蕹虏┺闹写筘i的嚴(yán)格劣策略等待。剩下的新博弈中只有小豬等待、大豬按按鈕這一個(gè)可供選擇的策略,就是智豬博弈的最后均衡解,從而達(dá)到重復(fù)剔除的占優(yōu)策略均衡。25智豬博弈的現(xiàn)實(shí)例子 智豬博弈聽(tīng)
17、起來(lái)似乎有些滑稽,但智豬博弈的例子在現(xiàn)實(shí)中確有很多。 例一、股市上等待莊家抬轎的散戶、 等待產(chǎn)業(yè)市場(chǎng)中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資,公司里不創(chuàng)造效益但分享成果的人 26 例二 在股份公司中,股東都承擔(dān)著監(jiān)督經(jīng)理的職能,但是,大小股東從監(jiān)督中獲得的收益大小不一樣。在監(jiān)督成本相同相同的情況下,大股東從監(jiān)督中獲得的收益明顯大于小股東。因此,小股東往往不會(huì)象大股東那樣去監(jiān)督經(jīng)理人員,而大股東也明確無(wú)誤地知道小股東會(huì)選擇不監(jiān)督(這是小股東的占優(yōu)策略),大股東明知道小股東要搭大股東的便車(chē),但是大股東別無(wú)選擇。大股東選擇監(jiān)督經(jīng)理的責(zé)任、獨(dú)自承擔(dān)監(jiān)督成本是在小股東占優(yōu)選擇的前提下必須選擇
18、的最優(yōu)策略。這樣以來(lái),與智豬博弈一樣,從每股的凈收益(每股收益減去每股分擔(dān)的監(jiān)督成本)來(lái)看,小股東要大于大股東。 27智豬博弈模型的延伸思考“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的現(xiàn)象嗎?28 改變方案一:減量方案。投食僅原來(lái)的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì)把食物吃完;大豬去踩,小豬也將會(huì)把食物吃完。誰(shuí)去踩踏板,就意味著為對(duì)方貢獻(xiàn)食物,所以,誰(shuí)也不會(huì)有踩踏板的動(dòng)力了。如果目的是想讓豬們?nèi)ザ嗖忍ぐ澹@個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。
19、 29 改變方案二:增量方案。投食為原來(lái)一倍的分量。結(jié)果是小豬、大豬都會(huì)去踩踏板。誰(shuí)想吃,誰(shuí)就會(huì)去踩踏板。反正對(duì)方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對(duì)豐富的“共產(chǎn)主義”社會(huì),所以,競(jìng)爭(zhēng)意識(shí)都不會(huì)很強(qiáng)。對(duì)于游戲規(guī)則的設(shè)計(jì)者來(lái)說(shuō),這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦?jìng)爭(zhēng)不激烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉焕硐搿?0 改變方案三:減量加移位方案。投食僅為原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?,而多勞者多得。每次的收獲剛好消費(fèi)完。對(duì)于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。 原版的“智豬博弈”故事給了
20、競(jìng)爭(zhēng)中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是,對(duì)于社會(huì)而言,因?yàn)樾∝i未能參加競(jìng)爭(zhēng),小豬搭便車(chē)時(shí)的社會(huì)資源配置得并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則得設(shè)計(jì)者是不愿看見(jiàn)有人搭便車(chē)的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車(chē)”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。31 比如,公司的激勵(lì)制度設(shè)計(jì),獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員個(gè)個(gè)都成了百萬(wàn)富翁,成本高不說(shuō),員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”。如果獎(jiǎng)勵(lì)力度不大,而且見(jiàn)者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì)有動(dòng)力就像“智豬博弈”減量方案一所描述的情形。最好的激勵(lì)機(jī)制設(shè)計(jì)就像改變方案三減
21、量加移位的方法,獎(jiǎng)勵(lì)并非人人有份,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對(duì)公司而言),又消除了“搭便車(chē)”的現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。 32三、納什均衡 前面我們討論了占優(yōu)策略均衡和重復(fù)剔除的策略均衡。但是在現(xiàn)實(shí)生活中,還有相當(dāng)多的博弈,我們無(wú)法使用占優(yōu)策略均衡或重復(fù)剔除的策略均衡的方法找出均衡解。 33 例如,在房地產(chǎn)開(kāi)發(fā)博弈中,假定市場(chǎng)需求有限,、兩個(gè)開(kāi)發(fā)商都想開(kāi)發(fā)一定規(guī)模的房地產(chǎn),但是市場(chǎng)對(duì)房地產(chǎn)的需求只能滿足一個(gè)房地產(chǎn)的開(kāi)發(fā)量,而且,每個(gè)房地產(chǎn)商必須一次性開(kāi)發(fā)這一定規(guī)模的房地產(chǎn)才能獲利。在這種情況下,無(wú)論是對(duì)開(kāi)發(fā)商還是開(kāi)發(fā)商,都不存在一種策略優(yōu)于另一種策略,也不存在嚴(yán)格劣策略:如果選擇開(kāi)發(fā),則的最優(yōu)策略是不開(kāi)發(fā);如果選擇不開(kāi)發(fā),則的最優(yōu)策略是開(kāi)發(fā);類(lèi)似地,如果選擇開(kāi)發(fā),則的最優(yōu)策略是不開(kāi)發(fā);如果選擇不開(kāi)發(fā),則的最優(yōu)策略是開(kāi)發(fā)。研究這類(lèi)博弈的均衡解,需要引人納什均衡。34 納什均衡是指在均衡中,每個(gè)博弈參與人都確信,在給定其他參與人選擇的策略的情況下,該參與人選擇了最優(yōu)策略以回應(yīng)對(duì)手的策略。納什均衡是完全信息靜態(tài)博弈解的一般概念,構(gòu)成納什均衡的策略一定是重復(fù)剔除嚴(yán)格劣策略過(guò)程中不能被剔除的策略。也就是說(shuō),沒(méi)有一種策略嚴(yán)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度石油天然氣設(shè)備維修保障協(xié)議2篇
- 2024年崗位安全教育培訓(xùn)試題及答案新版
- 23年-24年項(xiàng)目安全培訓(xùn)考試題及答案(名校卷)
- 2023年-2024年公司項(xiàng)目部負(fù)責(zé)人安全教育培訓(xùn)試題及答案審定版
- 23年-24年項(xiàng)目部安全管理人員安全培訓(xùn)考試題含完整答案(各地真題)
- 2023年-2024年新員工入職前安全教育培訓(xùn)試題答案各地真題
- 23年-24年項(xiàng)目安全培訓(xùn)考試題含答案【A卷】
- 2024項(xiàng)目部安全培訓(xùn)考試題及答案原創(chuàng)題
- 2023年項(xiàng)目部安全培訓(xùn)考試題附完整答案(奪冠系列)
- 裝修延期合同及清單
- 2023年譯林版英語(yǔ)五年級(jí)下冊(cè)Units-1-2單元測(cè)試卷-含答案
- Unit-3-Reading-and-thinking課文詳解課件-高中英語(yǔ)人教版必修第二冊(cè)
- 施工管理中的文檔管理方法與要求
- DL∕T 547-2020 電力系統(tǒng)光纖通信運(yùn)行管理規(guī)程
- 種子輪投資協(xié)議
- 物業(yè)客服培訓(xùn)課件PPT模板
- 員工工資條模板
- 執(zhí)行依據(jù)主文范文(通用4篇)
- 浙教版七年級(jí)數(shù)學(xué)下冊(cè)全冊(cè)課件
- 華為攜手深圳國(guó)際會(huì)展中心創(chuàng)建世界一流展館
- 2023版思想道德與法治專題2 領(lǐng)悟人生真諦 把握人生方向 第3講 創(chuàng)造有意義的人生
評(píng)論
0/150
提交評(píng)論