數(shù)據(jù)、模型與決策第九講博弈論課件_第1頁
數(shù)據(jù)、模型與決策第九講博弈論課件_第2頁
數(shù)據(jù)、模型與決策第九講博弈論課件_第3頁
數(shù)據(jù)、模型與決策第九講博弈論課件_第4頁
數(shù)據(jù)、模型與決策第九講博弈論課件_第5頁
已閱讀5頁,還剩95頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)、模型與決策

第九講博弈論

主講:鄧旭東教授數(shù)據(jù)、模型與決策

第九講博弈論

主講:鄧旭東教授教學(xué)內(nèi)容博弈論的產(chǎn)生和發(fā)展1博弈論的基本概念與博弈的分類2博弈論的經(jīng)典模型3Nash均衡解的求解方法4合作博弈5教學(xué)內(nèi)容博弈論的產(chǎn)生和發(fā)展1博弈論的基本概念與博弈的分類2博學(xué)習(xí)目標(biāo)了解博弈論的產(chǎn)生和發(fā)展情況掌握博弈及博弈論的概念、博弈論的分類了解和掌握博弈論的經(jīng)典模型掌握純策略和混合策略Nash均衡解的求解方法掌握聯(lián)盟博弈及夏普利值的概念,會求解兩人聯(lián)盟和三人聯(lián)盟情況下的夏普利值培養(yǎng)應(yīng)用博弈論于經(jīng)濟(jì)與管理實(shí)踐的意識學(xué)習(xí)目標(biāo)了解博弈論的產(chǎn)生和發(fā)展情況博弈論、納什均衡及核的概念

博弈論(GameTheory)是一門關(guān)于決策者在對決策結(jié)果沒有完全信息和互動條件下做出理性決策的理論。

所謂“互動”是指這樣一種情況,任何決策者決策的結(jié)果不僅取決于其自身采取的策略,還取決于其他人采取的策略。

納什均衡指兩人或多人互動的結(jié)果:當(dāng)其他人所選策略不變時,沒有任何人可以通過單方面改變其策略而取得更好的結(jié)果。

核指兩個或多個聯(lián)盟互動的結(jié)果:當(dāng)其他聯(lián)盟的策略不變時,沒有任何聯(lián)盟可以通過單方面改變其策略而取得對該聯(lián)盟所有成員更好的結(jié)果。博弈論、納什均衡及核的概念博弈論(Game一、博弈論的產(chǎn)生和發(fā)展20世紀(jì)50年代,合作博弈發(fā)展到全盛期,非合作博弈論也開始創(chuàng)立;20世紀(jì)60年代后,非合作博弈得到進(jìn)一步發(fā)展;幾十年來,眾多的博弈論學(xué)者花費(fèi)了無窮的精力,研究博弈論里博弈的結(jié)構(gòu),發(fā)展納什均衡點(diǎn)的定義,并探討其實(shí)際應(yīng)用的可能性?,F(xiàn)代博弈理論誕生的標(biāo)志:馮·諾依曼和摩根斯坦1944年出版的巨著《博弈論與經(jīng)濟(jì)行為》(TheTheoryofGamesandEconomicBehavior)1994年諾貝爾經(jīng)濟(jì)學(xué)獎:納什、哈薩尼、澤爾騰1996年諾貝爾經(jīng)濟(jì)學(xué)獎:莫里斯、維克瑞2001年諾貝爾經(jīng)濟(jì)學(xué)獎:阿克爾洛夫、斯彭斯、斯蒂格利茨2005年諾貝爾經(jīng)濟(jì)學(xué)獎:奧曼、謝林博弈論的產(chǎn)生博弈論的產(chǎn)生和發(fā)展博弈論的發(fā)展一、博弈論的產(chǎn)生和發(fā)展20世紀(jì)50年代,合作博弈發(fā)展到全盛期1994年諾貝爾經(jīng)濟(jì)學(xué)獎

1994年的諾貝爾經(jīng)濟(jì)學(xué)獎,授予了三位對博弈論做出奠基性貢獻(xiàn)的學(xué)者,他們是美國普林斯頓大學(xué)數(shù)學(xué)系的納什(JohnNash)教授、美國伯克利加州大學(xué)商學(xué)院的哈薩尼(JohnHarsanyi)教授和德國波恩大學(xué)經(jīng)濟(jì)學(xué)系的澤爾騰(ReinhardSelten)教授。納什對博弈論的貢獻(xiàn)有兩個方面:①合作博弈理論中的討價還價模型,稱為納什討價還價解;②非合作博弈論方面,這也是他的主要貢獻(xiàn)所在。納什對非合作博弈論的主要貢獻(xiàn)是他在1950年和1951年的兩篇論文中在非常一般的意義上定義了非合作博弈及其均衡解,并證明了均衡解的存在,由此奠定了非合作博弈論的基礎(chǔ)。1994年諾貝爾經(jīng)濟(jì)學(xué)獎1994年的諾貝爾經(jīng)1996年諾貝爾經(jīng)濟(jì)學(xué)獎1996年的諾貝爾經(jīng)濟(jì)學(xué)獎授予了英國劍橋大學(xué)的詹姆斯·莫里斯(JamesA.Mirrlees)教授和美國哥倫比亞大學(xué)的威廉姆·維克瑞(WilliamVickrey)教授,表彰他們對信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)。這兩位經(jīng)濟(jì)學(xué)家分別在20世紀(jì)60年代和70年代揭示了不對稱信息對交易所帶來的影響,并提出了相應(yīng)的對策。

信息經(jīng)濟(jì)學(xué)是研究信息不對稱條件下交易關(guān)系和契約安排的理論。從本質(zhì)上講,信息經(jīng)濟(jì)學(xué)是不對稱博弈論在經(jīng)濟(jì)學(xué)上的應(yīng)用。不對稱信息指的是某些參與人擁有另一些參與人不擁有的信息。

博弈論是方法論導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,尋找最可能的均衡結(jié)果;信息經(jīng)濟(jì)學(xué)是以問題導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,進(jìn)行最優(yōu)的契約安排。

由于信息經(jīng)濟(jì)學(xué)研究什么是不對稱信息情況下的最優(yōu)交易契約,故又稱為契約理論,或機(jī)制設(shè)計(jì)理論。正因?yàn)樾畔⒉粚ΨQ,不同的制度安排對應(yīng)不同的經(jīng)濟(jì)效率,現(xiàn)在經(jīng)常討論的國有企業(yè)委托人—代理人問題、激勵機(jī)制問題、產(chǎn)權(quán)問題等,都是信息經(jīng)濟(jì)學(xué)的問題。1996年諾貝爾經(jīng)濟(jì)學(xué)獎1996年的諾貝爾經(jīng)濟(jì)學(xué)獎授2001年諾貝爾經(jīng)濟(jì)學(xué)獎

2001年的諾貝爾經(jīng)濟(jì)學(xué)獎授予了三位美國經(jīng)濟(jì)學(xué)家,他們是伯克利加州大學(xué)經(jīng)濟(jì)系的喬治·阿克爾洛夫(GeorgeAkerlof)教授、斯坦福大學(xué)商學(xué)院的邁克爾·斯彭斯(MichaelSpence)教授和哥倫比亞大學(xué)經(jīng)濟(jì)系、商學(xué)院及國際關(guān)系學(xué)院的約瑟夫·斯蒂格利茨(JosephStiglitz)教授。早在20世紀(jì)70年代,他們就揭示了當(dāng)代信息經(jīng)濟(jì)的核心,認(rèn)為信息是有價值的。其應(yīng)用價值對中國目前的改革也有著一定的指導(dǎo)意義。

1970年,阿克爾洛夫?qū)鹘y(tǒng)經(jīng)濟(jì)學(xué)理論提出了挑戰(zhàn),他從分析舊車市場入手,發(fā)現(xiàn)在舊車交易中,賣者顯然比買者對車輛擁有更多的信息,而因?yàn)檫@種信息不對稱,買車的人難以完全信任賣車人提供的信息,因而試圖通過低價來彌補(bǔ)其信息上的損失。由于買者出價過低,賣者又不愿提供好的產(chǎn)品,從而導(dǎo)致次貨的泛濫,其最終的結(jié)果是舊車市場的萎縮。阿克爾洛夫就此得出結(jié)論:市場放開并不能解決所有問題,信息是有價值的。斯彭斯則在1973年通過剖析人才市場盛行的造假行為,指出人才市場同樣存在用人單位與應(yīng)聘者之間信息不對稱的問題,并由此造成了人才市場上“劣幣”驅(qū)逐“良幣”的現(xiàn)象。斯蒂格利茨則將信息不對稱這一理論應(yīng)用到保險和金融市場。2001年諾貝爾經(jīng)濟(jì)學(xué)獎2001年的諾貝爾經(jīng)濟(jì)學(xué)獎授2001年諾貝爾經(jīng)濟(jì)學(xué)獎這三個人從不同領(lǐng)域探討了信息不對稱問題,指出市場體制需要完善、設(shè)計(jì),設(shè)計(jì)里有最優(yōu)。這是對傳統(tǒng)經(jīng)濟(jì)學(xué)的重大突破。

Akerlof,G.(1970)”TheMarketforLemons:QualityUncertaintyandMarketMechanism”,QuarterlyJournalofEconomics,84:488-599.

Spence,M.(1973),”JobMarketSignaling”,QuarterlyJournalofEconomics,87.

Rothschild,M.andStiglitz,J.(1976),”EquilibriuminCompetitiveInsuranceMarket”,QuarterlyJournalofEconomics90:629-49.

2001年諾貝爾經(jīng)濟(jì)學(xué)獎這三個人從不同領(lǐng)域探討了信息2005年諾貝爾經(jīng)濟(jì)學(xué)獎奧曼(RobertJ.Aumann)提出了無限次的重復(fù)博弈的理論,謝林(ThomasC.Schelling)提出了對抗?fàn)顟B(tài)下的“可置信威脅”等概念,深刻地分析了行為選擇的條件對博弈均衡結(jié)果的影響。

奧曼率先提出的“重復(fù)博弈”分析,目前成為所有社會科學(xué)的主流分支,并已應(yīng)用于政治沖突、灌溉系統(tǒng)、國際條約乃至公司相互勾結(jié)等各種各樣的問題。

奧曼對沖突與合作策略思想的貢獻(xiàn)在于,他運(yùn)用了邏輯學(xué)和數(shù)學(xué)來理解,當(dāng)人們每天都面對相同對手或競爭者時,他們所能作出的選擇。當(dāng)策略情形大量重復(fù)出現(xiàn)時,即便個體間有直接的利益沖突,達(dá)成合作的機(jī)率也會上升,因?yàn)槊總€個體在未來時間內(nèi),都會與另一方反復(fù)打交道。

謝林于20世紀(jì)60年代出版《沖突的策略》,著力闡述了在雙方處于僵持時,采取一些策略性手段的重要性。這些手段包括:事先承諾、邊緣政策和有威懾力的威脅。例如,通過限定你自己的選擇范圍,你就可以使對手清楚地知道,你將對他們的行動作出何種反應(yīng)——不管他們采取什么行動,這也就加大了他們作出讓步的可能性。

在地緣政治領(lǐng)域之外,謝林還發(fā)現(xiàn),人通常都是愿意合作的,但當(dāng)他們在一個團(tuán)隊(duì)中完全依理性行事時,則不那么容易合作。2005年諾貝爾經(jīng)濟(jì)學(xué)獎奧曼(RobertJ.A二、博弈論的基本概念與博弈的分類博弈論的基本概念包括參與人、行動、信息、策略、支付、結(jié)果和均衡。其中,參與人、策略和支付是描述一個博弈所需要的最少的要素,而行動和信息是其“積木”。參與人、行動和結(jié)果統(tǒng)稱為“博弈規(guī)則”。博弈分析的目的是使用博弈規(guī)則預(yù)測均衡。參與人——是指在一個博弈中能夠選擇自己的行動方案從而使自身的利益最大化的決策主體,即有決策權(quán)的參加者。個人或組織團(tuán)體,參與人是理性的。行動——是參與人在博弈的某個時點(diǎn)的決策變量。當(dāng)參與人的行動存在先后次序時,后行動者就可以通過觀察先行動者的行動選擇來獲取信息,再決定行動方案。信息——是參與人有關(guān)博弈的知識,特別是有關(guān)自然狀況、其他參與人的特征、偏好和行動等方面的知識?!袄硇浴笔枪餐R,各參與人的偏好也可能是共同知識。二、博弈論的基本概念與博弈的分類博弈論的基本概念包括參與人、博弈論的基本概念策略——是參與人在給定信息集的情況下的行動規(guī)則,它規(guī)定了參與人在何時何種情況下選擇何種行動,是完整的行動方案。各參與人在各自的策略集中選擇一個特定的策略所構(gòu)成的策略組合稱為一個局勢。支付——是指在博弈論中,對應(yīng)一個確定的自然狀況,參與人各選擇一個特定的策略所形成的局勢下參與人得到的效用。當(dāng)自然狀況不確定或參與人隨機(jī)選擇其策略時,參與人關(guān)心的是期望效用。結(jié)果——是一個博弈各種可能的最終后果,如各參與人的最優(yōu)策略、最優(yōu)策略下的效用等。均衡——是各參與人最優(yōu)策略所形成的局勢,在該局勢下,沒有參與人愿意選擇其他的策略。博弈論的基本概念策略——是參與人在給定信息集的情況下的行動規(guī)博弈的分類通過事前交流協(xié)商達(dá)成有約束力的協(xié)議稱為合作。根據(jù)參與人之間是否存在合作,博弈可劃分為合作博弈和非合作博弈。合作博弈與非合作博弈之間的區(qū)別主要在于人們的行為相互作用時,當(dāng)事人能否達(dá)成一個具有約束力的協(xié)議。如果有,就是合作博弈;反之,則是非合作博弈。合作博弈強(qiáng)調(diào)的是團(tuán)體理性,強(qiáng)調(diào)的是效率、公正、公平;非合作博弈強(qiáng)調(diào)的是個人理性、個人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無效率的。根據(jù)參與人行動的先后順序,博弈可以劃分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈指的是博弈中,參與人同時選擇行動或雖非同時但后行動者并不知道先行動者采取了什么具體行動;動態(tài)博弈指的是參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。博弈的分類通過事前交流協(xié)商達(dá)成有約束力的協(xié)議稱為合作。博弈的分類根據(jù)參與人對博弈的整體環(huán)境(即自然狀況及其他參與人的特征、偏好和策略)是否有全面而準(zhǔn)確的知識,博弈可劃分為完全信息博弈和不完全信息博弈。完全信息指的是每一個參與人對所有其他參與人(對手)的特征、策略空間及支付函數(shù)有全面而準(zhǔn)確的知識;否則,就是不完全信息。行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈;納什均衡;納什(1950,1951)完全信息動態(tài)博弈;子博弈精煉納什均衡;澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;哈薩尼(1967-1968)不完全信息動態(tài)博弈;精煉貝葉斯納什均衡;澤爾騰(1975),Kreps和Wilson(1982),F(xiàn)udenberg和Tirole(1991)博弈的分類根據(jù)參與人對博弈的整體環(huán)境(即自然狀況及其他參與人博弈的分類

博弈論的討論基于兩條:①參與人都是理性的,他的目標(biāo)非常明確,就是使自己的效用達(dá)到最大;②博弈論中的例子是簡單而很不實(shí)際的,但是它比一些具體實(shí)際的復(fù)雜的例子更能揭示實(shí)質(zhì),使得很多人即使不去學(xué)習(xí)博弈論的理論,也能理解這些例子中提出的問題和分析的方法,這是有指導(dǎo)意義的。所以我們在學(xué)習(xí)博弈論的知識時,要注意這些簡單而典型的例子,學(xué)習(xí)分析問題,提出概念,解決問題的過程。三、博弈論的經(jīng)典模型博弈的分類博弈論的討論基于兩條:①參與人都是理性的,博弈的分類

乙坦白抵賴坦白甲抵賴

有兩個人因?yàn)樯嫦臃缸锒徊叮痪椒謩e關(guān)在兩個房間內(nèi)審訊。他們面臨的情況是:如果兩個人都坦白罪行,那么將各被判處六年有期徒刑;如果一方坦白另一方抵賴,那么坦白者從寬,判處一年徒刑,抗拒者從嚴(yán),判處八年徒刑;如果兩個人均抵賴,則各被判處兩年徒刑。這樣,兩個囚徒面臨的博弈格局如上圖所示,每個格子中左邊的數(shù)字是甲的支付(盈利或得益),右邊是乙的支付(盈利或得益)。1.囚徒困境(theprisoner’sdilemma)-6,-6-1,-8-8,-1-2,-2博弈的分類博弈的分類①劃線法解囚徒困境

坦白

抵賴

坦白

抵賴

(坦白,坦白):嚴(yán)格優(yōu)勢策略(抵賴,抵賴):嚴(yán)格劣勢策略

實(shí)例思考:價格大戰(zhàn)、廣告大戰(zhàn)、優(yōu)惠大戰(zhàn)合作:“雙贏對局”1.囚徒困境(theprisoner’sdilemma)-6,-6-1,-8-8,-1-2,-2博弈的分類①劃線法解囚徒困境1.囚徒困境(thepriso博弈的分類②可口可樂與百事可樂的價格大戰(zhàn)(單位:億美元)

百事可樂

低價

高價

低價

可口可樂

高價(低價,低價):嚴(yán)格優(yōu)勢策略(高價,高價):嚴(yán)格劣勢策略多數(shù)情形是非合作博弈

卡特爾——幾個大企業(yè)聯(lián)手或勾結(jié)形成對行業(yè)的壟斷,謀求最大利潤而結(jié)成的聯(lián)盟。卡特爾不穩(wěn)定。OPEC——石油輸出國組織

1.囚徒困境(theprisoner’sdilemma)-3,-30,-5-5,0-1,-1博弈的分類②可口可樂與百事可樂的價格大戰(zhàn)(單位:億美博弈的分類③箭頭法解囚徒困境

坦白

抵賴

坦白

抵賴1.囚徒困境(theprisoner’sdilemma)-6,-6-1,-8-8,-1-2,-2博弈的分類③箭頭法解囚徒困境博弈的分類

納什均衡狀態(tài)是市場力量相互作用的穩(wěn)定的結(jié)局。

AA’B’B

0???1

雜貨鋪定位:設(shè)想有一個小居民點(diǎn),居民住宅沿著一條公路均勻地排開。現(xiàn)在有兩家雜貨鋪要在這個小居民點(diǎn)開張,他們賣一樣的東西,價格也完全一樣。那么,兩家雜貨店開在什么地方好呢?商品一樣,價格也一樣,居民到哪個雜貨鋪買東西,就看哪個雜貨鋪離自己比較近。在雜貨鋪定位的博弈中,地盤就是市場份額,地盤就是經(jīng)濟(jì)利益。兩個雜貨鋪在市場競爭的位置博弈中,位于左邊的要向右靠,位于右邊的要向左擠,最后的結(jié)局,是兩家雜貨鋪緊挨著位于中點(diǎn)1/2的位置。這就是納什均衡的位置。因?yàn)檎l要是單獨(dú)移開“一點(diǎn)”,他就會喪失“半點(diǎn)”市場份額。所以誰都不想偏離中點(diǎn)的位置。2.雜貨鋪定位博弈博弈的分類納什均衡狀態(tài)是市場力量相互作用的穩(wěn)定的結(jié)局博弈的分類

海灘占位:據(jù)說西方發(fā)達(dá)國家的不少男男女女有日光浴的愛好,因?yàn)樗欣谏眢w健康。現(xiàn)在設(shè)想較長的海灘上比較均勻地散步著許多日光浴者。太陽的照射使人們需要補(bǔ)充水分。假如有A與B兩個小販來到海灘,以同樣的價格、相同的質(zhì)量向日光浴者提供同一品牌的礦泉水(或啤酒)。在直線狀的海灘上他們應(yīng)當(dāng)如何合理地安置自己的攤位呢?思考:在社會經(jīng)濟(jì)領(lǐng)域內(nèi),有不少現(xiàn)象與上述雜貨鋪定位、海灘占位有著相似之處,從某種意義上也可以用同樣的邏輯進(jìn)行分析和闡述。①超市在商業(yè)街的布局問題。如果地段的繁華等其他原因可以認(rèn)為相同的話,那么,只要條件許可,超市的幾乎相依為鄰現(xiàn)象完全可以看作公正的市場競爭的合理結(jié)果。②同城航空公司航班起飛時刻確定問題。同一城市的兩家航空公司開辟飛往同一目的地的航班,常出現(xiàn)他們各自的起飛時刻被安排在幾乎同一時間的現(xiàn)象。③電視臺對節(jié)目的編排問題。人們對電視節(jié)目的喜愛存在著一定的檔次差異,因此電視臺對節(jié)目的編排將直接影響到收視率。設(shè)想如果將高雅藝術(shù)節(jié)目與較低檔趣味的節(jié)目比作海灘的兩端,那么觀賞電視節(jié)目的觀眾就相當(dāng)于散步在海灘上的日光浴者。因此不少電視臺常將黃金播放時段的文藝節(jié)目定位于中等趣味以提高自己的收視率。此外,各電視臺中一些內(nèi)容雖然不同但情調(diào)卻差不多的娛樂節(jié)目,常在播放時間上撞車。④海灘占位問題在政治學(xué)中也可以找到類似的案例。2.雜貨鋪定位博弈博弈的分類海灘占位:據(jù)說西方發(fā)達(dá)國家的不少男男女女有博弈的分類

女方

足球

芭蕾

足球

男方

芭蕾

情侶博弈與經(jīng)濟(jì)決策的關(guān)系兩個相鄰的企業(yè)都要解決各自的供水問題。如果他們各干各的,成本就會比較高,效益就沒有那么好。如果兩個企業(yè)聯(lián)合起來一起投資建設(shè)共用的供水系統(tǒng),效益就會比較好。但是在選定合作方案的時候,由于各種因素,在攜手合作的大前提下,還是可能有小算盤的考慮。你想這樣,他想那樣,這也是人之常情。這種合作比不合作好,但是在合作的大局下面又不免有小算盤、不免打小九九的對局,這就是情侶博弈。3.情侶博弈(Battleofsexes)2,10,0-1,-11,2博弈的分類博弈的分類

獵鹿打兔

獵鹿

打兔

4只兔子管4天,1只鹿各管10天。

經(jīng)濟(jì)體制改革:

蘇歐“振蕩療法”或“休克療法”,一步到位,社會損失大;中國“漸進(jìn)式改革”、“摸著石頭過河”,社會損失小,體制外體制內(nèi)4.獵人博弈和帕累托優(yōu)勢10,100,44,04,4博弈的分類博弈的分類

B雞

進(jìn)

退

進(jìn)

A雞

退

兩只雞A和B過獨(dú)木橋,雙方都可以選擇進(jìn)退,如果雙方都選擇進(jìn),則雙方就都成了落湯雞。如果一進(jìn)一退,則有一方可以過橋,另一方收益為0。各自的收益如上圖所示。在這個博弈問題中,一進(jìn)一退是博弈的格局。

5.斗雞博弈-3,-32,00,20,0博弈的分類博弈的分類

小豬

大豬

豬圈里有一大一小兩頭豬,豬圈的一端有一個豬食槽,另一端安裝了一個控制豬食供應(yīng)的按鈕。按一下按鈕會有10個單位的豬食進(jìn)槽,但誰按按鈕誰就需付出相當(dāng)于2個單位豬食的成本。大豬先到:大豬吃9個,小豬吃1個同時到:大豬吃7個,小豬吃3個小豬先到:大豬吃6個,小豬吃4個6.智豬博弈和搭便車行為5,14,49,-10,0博弈的分類博弈的分類

受賄

不受賄

受賄

不受賄實(shí)際上許多博弈問題就存在多個Nash均衡解,這為預(yù)測帶來困難,引起Nash均衡解的精煉問題。并且不是任何問題都有純策略Nash均衡解。7.串謀博弈和高薪養(yǎng)廉9,90,88,07,7博弈的分類博弈的分類

守衛(wèi)

不睡

小偷

不偷一小偷欲偷竊有一守衛(wèi)看守的倉庫,如果小偷去偷竊時守衛(wèi)在睡覺,則小偷就能得手,假設(shè)小偷得手可得價值為V的贓物;但如果小偷去偷竊時守衛(wèi)沒有睡覺,則小偷就要被抓住,如被抓住則要坐牢,坐牢的負(fù)效用為-P(設(shè)其單位與贓物的價值相同),再設(shè)守衛(wèi)睡覺而未被偷則有S的正效用;睡覺遭偷則要被解雇,解雇的負(fù)效用為-D,其單位與S的單位相同。如果小偷不偷,則他既無得也無失;守衛(wèi)不睡則出一份力掙一份工資同樣也是既無得也無失。

8.小偷與守衛(wèi)的博弈V,-D-P,00,S0,0博弈的分類①圖解方法求解守衛(wèi)期小偷期望得益望得益

(睡)S

(偷)

V

Pt*小偷偷

Pg*守衛(wèi)睡0Pt′1的概率0Pg′1的概率

-D-P

-D’-P’(a)(b)圖

小偷與守衛(wèi)的混合策略8.小偷與守衛(wèi)的博弈①圖解方法求解8.小偷與守衛(wèi)的博弈②代數(shù)方法求解設(shè)小偷選擇偷的概率為pt,則選擇不偷的概率為1-Pt,那么守衛(wèi)選擇睡覺的期望支付為E睡=(-D)×Pt﹢S×(1-Pt)=S-(D+S)×Pt守衛(wèi)選擇不睡覺的期望支付為E不睡=0×Pt﹢0×(1-Pt)=0要達(dá)到一種均衡狀態(tài),小偷選擇偷與不偷不能讓守衛(wèi)在選擇睡覺與不睡覺之間有明顯的傾向性。因此,必然有E睡=E不睡于是可求得當(dāng)D不變,而S增加時,Pt會增加;而當(dāng)S不變,增加D時,Pt會降低。由此可見,加重對失職守衛(wèi)的懲罰,在長期中會起到抑制盜竊的作用;當(dāng)對守衛(wèi)實(shí)施的懲罰不變,而提高其待遇,意味著S的增加,反而會使盜竊現(xiàn)象更為嚴(yán)重(Pt增加)。8.小偷與守衛(wèi)的博弈②代數(shù)方法求解8.小偷與守衛(wèi)的博弈

設(shè)守衛(wèi)選擇睡的概率為pg,則選擇不睡的概率為1-pg,那么小偷選擇偷的期望支付為

小偷選擇不偷的期望支付為要達(dá)到一種均衡狀態(tài),守衛(wèi)選擇睡與不睡不能讓小偷在選擇偷與不偷之間有明顯的傾向性。因此,必然有于是可求得

當(dāng)V不變,而P增加時,pg會增加,由此可見,加重對小偷的懲罰雖然在短期中能抑制盜竊,但在長期中卻只能使守衛(wèi)多睡覺(pg增加),盜竊的情況卻不會有什么改善,反而,由于守衛(wèi)選擇睡覺的概率增加了,小偷選擇偷的概率會增加,長期來看盜竊現(xiàn)象甚至?xí)鼮閲?yán)重。

8.小偷與守衛(wèi)的博弈設(shè)守衛(wèi)選擇睡的概率為pg,則選擇不睡的概率為1-pg

蜈蚣博弈模型是Rosenthsal在1981年提出的,它是動態(tài)博弈的例子,其模型稱為擴(kuò)展型博弈模型,是用樹來對博弈過程做結(jié)構(gòu)化處理。

ⅠⅡⅠⅡⅠⅡ

AA┄AAAA(100,100)

DDDDDD

(1,1)(0,3)(98,98)(97,100)(99,99)(98,101)這個博弈的結(jié)果是(1,1)。求解過程要用到逆向歸納法,即從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段的分析方法。9.蜈蚣博弈蜈蚣博弈模型是Rosenthsal在1981年提出的1.重復(fù)剔除嚴(yán)格劣勢策略法下面用一個例子說明重復(fù)剔除嚴(yán)格劣勢策略的求解方法。博弈方Ⅱ左中右上博弈方Ⅰ

首先由上表可知,博弈方Ⅰ與Ⅱ都沒有優(yōu)勢策略,所以不存在優(yōu)勢策略均衡解。從博弈方Ⅰ來看,其上下策略中沒有哪一個是嚴(yán)格劣勢策略,但從博弈方Ⅱ來看,右策略嚴(yán)格劣于中策略,故可將右策略剔除。這時就簡化為下表表示的博弈。四、Nash均衡解的求解方法1,01,30,10,40,22,01.重復(fù)剔除嚴(yán)格劣勢策略法四、Nash均衡解的求解方法1,0博弈方Ⅱ左中上博弈方Ⅰ

下觀察上表的博弈又可發(fā)現(xiàn),“下”是博弈方Ⅰ的嚴(yán)格劣勢策略,因此下策略可剔除,這樣又可得表如下。博弈方2

左中

博弈方1上觀察上表又發(fā)現(xiàn),左是博弈方Ⅱ的嚴(yán)格劣勢策略,剔除左策略就得博弈的均衡解(上,中)。純策略Nash均衡解的求解方法1,01,30,40,21.01,3博弈方Ⅱ純策略Nash均衡解的求解方法1,01,30,40,

數(shù)學(xué)上已經(jīng)證明,在n人博弈G={S1,……,Sn;u1,…un}中,重復(fù)剔除嚴(yán)格劣勢策略最后若只剩下唯一的策略對,則此策略對一定是純Nash均衡解;而且重復(fù)剔除嚴(yán)格劣勢策略不會消去Nash均衡解。由此可見,在求Nash均衡解前,先用重復(fù)剔除嚴(yán)格劣勢策略法,即使常常不能求出Nash均衡解,也可能簡化博弈問題。

重復(fù)剔除嚴(yán)格劣勢策略與純策略Nash均衡解的關(guān)系重復(fù)剔除嚴(yán)格劣勢策略與純策略Nash均衡解的關(guān)系

2.劃線法下面用同一個例子來介紹求解純策略Nash均衡解的劃線法。博弈方Ⅱ左中右上博弈方Ⅰ

下博弈方Ⅰ考慮,若Ⅱ方取左策略,自己的最大收益為1,故在1下面劃一條短線;若Ⅱ方取中策略,自己的最大收益也為1,故在第二列數(shù)字1下面劃一條短線;若Ⅱ方取右策略,自己的最大收益為2,故在2下面劃一條短線。博弈方Ⅱ也作同樣考慮,給數(shù)字3、數(shù)字4下面都劃了短線。最后數(shù)對1,3下面都有短劃線,對應(yīng)的策略對為(上,中),這樣劃線法就求得此博弈的解。劃線法的思路是,每個博弈方找出在其他博弈方每一個策略或策略組合下的自己的最佳收益并劃一條線,那么若某組數(shù)都被劃線,就意味著這組數(shù)中的每一個都是在別人策略固定時自己的最佳收益,因此誰也不愿意單方面改變自己的與此最佳收益對應(yīng)的策略,根據(jù)Nash均衡解的定義,這時的策略組合就是Nash均衡解。劃線法1,01,30,10,40,22,02.劃線法劃線法1,01,30,10,40,22,0

3.反應(yīng)函數(shù)法實(shí)際上Nash均衡解的概念也可推廣到連續(xù)策略、無限策略的博弈中。這時常常用反應(yīng)函數(shù)法來求Nash均衡解。反應(yīng)函數(shù)即一博弈方對另一博弈方每一可能策略的最佳反應(yīng)策略所構(gòu)成的函數(shù)。

[例]設(shè)博弈雙方的策略變量分別為q1及q2,q1及q2都在區(qū)間(0,20)取值,雙方同時選擇策略。博弈方1與2的收益函數(shù)分別為u1,u2且u1=6q1-q1q2-q12u2=6q2-q1q2-q22博弈方1針對博弈方2的任一策略q2的策略選擇是求最大化問題Maxu1=max(6q1-q1q2-q12)q1令u1對q1的導(dǎo)數(shù)等于零,可得q1=R1(q2)=1/2(6-q2)這就是博弈方1對博弈方2任一策略q2的最佳反應(yīng),即是其反應(yīng)函數(shù)。同樣,博弈方2針對博弈方1的任一策略q1的策略選擇是求解最大化問題Maxu2=max(6q2-q1q2-q22)q2博弈方2對博弈方1任一策略q1的最佳反應(yīng),即反應(yīng)函數(shù)為q2=R2(q1)=1/2(6-q1)顯然可用坐標(biāo)平面的兩條直線表示這兩條反應(yīng)函數(shù),如圖所示。

反應(yīng)函數(shù)法3.反應(yīng)函數(shù)法反應(yīng)函數(shù)法

q2(0,6)R1(q2)(0,3)(2,2)2R2(q1)

02(6,0)

如圖可得這兩條反應(yīng)函數(shù)直線的交點(diǎn)為(2,2),(2,2)即為Nash均衡解,因?yàn)檫@是博弈雙方共同的最佳反應(yīng)點(diǎn),因而誰也不愿意單方面離開這一點(diǎn)。當(dāng)然用求解方程組的方法也可求出此問題的Nash均衡解。反應(yīng)函數(shù)法q2反應(yīng)函數(shù)法

在沒有純策略Nash均衡解時,可以尋找混合策略Nash均衡解。

定義:對策略式博弈G={S1,…,Sn;u1,…,un},假設(shè)博弈方i的策略集合為Si={si1,…,sik},pik表示博弈方i選擇純策略k的概率,則概率分布Pi=(pi1,…,pik)稱為博弈方i的一個混合策略,其中,0≤pik≤1對所有k(k=1,…,K)都成立,且pi1+…+pik=1。將博弈方的策略定義為混合策略(純策略)是混合策略的特例),策略集合定義為混合策略集合,就可以得出混合策略的Nash均衡解的概念:混合策略的Nash均衡就是各博弈方針對其他博弈方的最優(yōu)反應(yīng)的混合策略組合。

Nash在1950年提出了討論Nash均衡解存在性的定理,后被稱為Nash定理。

Nash定理:在n人策略式博弈G={S1,…,Sn;u1,…,un}中,如果n是有限的,且對每個i,Si是有限的,則博弈至少存在一個Nash均衡解,但可能包括混合策略解。這就是說,每一個有限博弈都至少存在一個混合策略Nash均衡解。但是常常有多個Nash均衡存在,這也為博弈分析帶來困難。人們通過Pareto均衡、風(fēng)險均衡、聚點(diǎn)均衡等來選擇Nash均衡解。

混合策略Nash均衡解在沒有純策略Nash均衡解時,可以尋找混合策略Nas

求Nash均衡解的反應(yīng)函數(shù)法可以應(yīng)用于求混合策略Nash均衡解。在純策略中,反應(yīng)函數(shù)是純策略之間的最佳應(yīng)對,而在混合策略中,反應(yīng)函數(shù)就成了一方對另一方混合策略概率分布的最佳應(yīng)對。

[例]有博弈問題如下,求其Nash均衡解。乙

Ⅱ1

Ⅱ2

Ⅰ1甲

Ⅰ2設(shè)x,y分別表示甲選策略Ⅰ1、乙選策略Ⅱ1的概率,則1-x,1-y就為甲選策略Ⅰ2、乙選策略Ⅱ2的概率,(x,1-x)為甲的混合策略,(y,1-y)為乙的混合策略。假定x*,y*分別為甲、乙的Nash均衡策略,e1(x,y)、e2(x,y)分別代表甲、乙在采取策略對(x,y)時各自收益的期望值,那么,根據(jù)Nash均衡解的定義,對于甲而言,有e1(x*,y*)≥e1(x,y*)混合策略Nash均衡解的求解方法3,22,10,34,4求Nash均衡解的反應(yīng)函數(shù)法可以應(yīng)用于求混合策略Na即,當(dāng)固定乙的策略為y*時,甲不愿意單方面離開x*這個策略。同理,對于乙而言,也有e2(x*,y*)≥e2(x*,y)即,當(dāng)固定甲的策略為x*時,乙不愿意單方面離開y*這個策略。甲的期望收益應(yīng)為e1(x,y)=3xy+2x(1-y)+0(1-x)y+4(1-x)(1-y)=x(5y-2)+4-4y現(xiàn)在求甲的反應(yīng)函數(shù),即y值固定的情況下,使得e1最大的x的取值:若y<2/5,則當(dāng)x=0時,e1達(dá)到最大,且e1=4-4y;若y=2/5,則對任意0≤x≤1,e1都達(dá)到最大,且e1=12/5;若y>2/5,則當(dāng)x=1時,e1達(dá)到最大,且e1=y+2。將博弈方甲反應(yīng)函數(shù)表示在坐標(biāo)圖上。y

1

2/5

0x

1混合策略Nash均衡解的求解方法即,當(dāng)固定乙的策略為y*時,甲不愿意單方面離開x*這個策略。

同理乙的期望收益應(yīng)為e2(x,y)=2xy+x(1-y)+3(1-x)y+4(1-x)(1-y)=y(2x-1)+4-3x乙的反應(yīng)函數(shù),即x值固定的情況下,使得e2最大的y的取值:若x<1/2時,則當(dāng)y=0時,e2達(dá)到最大,且e2=4-3x;若x=1/2時,對任意0≤y≤1,e2都達(dá)到最大,且e2=5/2;若x>1/2時,當(dāng)y=1時,e2達(dá)到最大,且e2=3-x。將博弈方乙的反應(yīng)函數(shù)表示在坐標(biāo)圖上,將上述兩個反應(yīng)函數(shù)畫在一起,得到包括混合策略的Nash均衡解,如下圖所示。yy11

2/5

xx

01/2101/21

混合策略Nash均衡解的求解方法同理乙的期望收益應(yīng)為混合策略Nash均衡解的求解方法

由圖可知,得到雙方反應(yīng)函數(shù)的三個交點(diǎn):

(1)x=0,y=0,即甲、乙選擇策略對(Ⅰ2,Ⅱ2),收益值為(4,4);

(2)x=1,y=1,即甲、乙選擇策略對(Ⅰ1,Ⅱ1),收益值為(3,2);

(3)x=1/2,y=2/5,對應(yīng)的混合策略對為((1/2,1/2),(2/5,3/5)),收益值為(2.4,2.5)。前兩個為純策略Nash均衡解,第三個為混合策略的Nash均衡解。混合策略Nash均衡解的求解方法由圖可知,得到雙方反應(yīng)函數(shù)的三個交點(diǎn):混合策略Nas

在實(shí)際的博弈問題中,如果參與人能夠進(jìn)行協(xié)商、談判,聯(lián)合選擇行動,共同分享利益,這就是合作博弈問題。成功的合作往往能通過協(xié)同效應(yīng),發(fā)揮各方的所長與優(yōu)勢,共同創(chuàng)造共贏的局面,甚至實(shí)現(xiàn)帕累托最優(yōu)。但是,由于參與博弈的各方利益間存在著沖突,搭便車的問題可能導(dǎo)致合作受到破壞。合作首先是一個態(tài)度問題,然而,光有態(tài)度是不夠的,合作能否實(shí)施,重要的是方法。在不同的博弈結(jié)構(gòu)下,有不同類型的合作,因而“共贏”有不同的含義。在某些博弈情況下,“共贏”意味著參與人“共同避免更糟”;有些情況共贏意味著參與人“共同尋求更好”。在很多情況下,將一個復(fù)雜的現(xiàn)實(shí)場景轉(zhuǎn)化成一個嚴(yán)格的非合作博弈模型可能比較困難,而轉(zhuǎn)化為合作博弈框架則可簡化對場景細(xì)節(jié)的描述,突出結(jié)果的形成。一個非合作博弈包括四個構(gòu)成要素:參與人、博弈規(guī)則、博弈結(jié)局和博弈效用。合作博弈將后三個要素抽象為一個部分,這樣合作博弈就由兩部分構(gòu)成:一是所有參與人的集合,二是將不同參與人的組合對應(yīng)其可得集體效用的函數(shù)。

五、合作博弈在實(shí)際的博弈問題中,如果參與人能夠進(jìn)行協(xié)商、談判,聯(lián)

聯(lián)盟博弈是合作博弈的基本表述方式,既是合作博弈,就意味著所有參與人接受與競爭對手共同爭取更多收益的指導(dǎo)思想。在聯(lián)盟博弈中,合作通過特征函數(shù)值的分配來表述。企業(yè)建立聯(lián)盟是有條件的,這個條件便是:訂立協(xié)議、建立聯(lián)盟的聯(lián)盟值大于單獨(dú)行動。如某個市場上兩家企業(yè)A、B共同開發(fā)市場比單個企業(yè)開發(fā)市場有利,其條件是:V(A,B)≥V(A)+V(B)。其中,V(A,B)為A、B企業(yè)共同開發(fā)市場時雙方的收益之和,V(A)、V(B)分別為A、B單獨(dú)開發(fā)市場所得到的收益。提供同種產(chǎn)品的企業(yè)相互合作的形式能夠有多種。比如,混亂的企業(yè)在行業(yè)協(xié)會或某個大企業(yè)的引導(dǎo)下,統(tǒng)一某些技術(shù)標(biāo)準(zhǔn),大家共同使用這些標(biāo)準(zhǔn)。這樣,或者大家的成本降低,或者市場擴(kuò)大了。再如,提供同種產(chǎn)品的不同企業(yè),它們的優(yōu)勢可能不同,若這些不同優(yōu)勢的企業(yè)聯(lián)合起來,共同開發(fā)某些產(chǎn)品,其競爭力往往更大。不同類型的企業(yè)相互合作往往更能成功,因?yàn)橥愋偷钠髽I(yè)沖突度往往大,不同類型的企業(yè)之間往往沒有沖突。

五、合作博弈聯(lián)盟博弈是合作博弈的基本表述方式,既是合作博弈,就意

夏普利值利用公理化方法得到合作博弈的唯一解,這一概念,首先由夏普利(L.S.Shapley)在1953年提出,它為如何決定一個n人討價還價博弈中每個參與人的所得的分配比例提供了一種很好的方法。夏普利值是合作博弈(聯(lián)盟博弈)中的最重要的概念。某個參與人之所以能夠與其他成員結(jié)成聯(lián)盟,是因?yàn)樗膮⑴c能夠給聯(lián)盟帶來附加值,也就是為聯(lián)盟做出貢獻(xiàn)。因此,參與人從聯(lián)盟中獲得利益的多少,取決于或正比于他對聯(lián)盟的貢獻(xiàn)或可能貢獻(xiàn)(期望貢獻(xiàn))。夏普利值便是這樣的期望貢獻(xiàn)的反映。它是指在一個聯(lián)盟博弈中,某個參與人在各種可能的參與人組成的排列中與前面的參與人構(gòu)成的聯(lián)盟的期望貢獻(xiàn)的平均值。

1.兩人聯(lián)盟的情況假定兩個參與人A、B單獨(dú)行動的收益為0,而聯(lián)合行動的收益為c,即V(A)=V(B)=0,V(A,B)=c這樣,A、B對聯(lián)盟都有貢獻(xiàn)。在AB順序下,A的邊際貢獻(xiàn)為0,B的邊際貢獻(xiàn)為c;在BA順序下,B的邊際貢獻(xiàn)為0,A的邊際貢獻(xiàn)為c。在這兩種可能的情況下,A和B的平均貢獻(xiàn)或者期望貢獻(xiàn)為:(0+c)/2=c/2。若按照這樣的方案分配,它是可理解的,兩人的期望貢獻(xiàn)均為c/2,分配也應(yīng)該一樣,為c/2。對于A、B,值Φ(A)=Φ(B)=c/2便是他們的夏普利值。

夏普利值夏普利值利用公理化方法得到合作博弈的唯一解,這一概念

2.三人聯(lián)盟的情況三個參與人A、B、C,各個聯(lián)盟的特征值為

V(A)=V(B)=V(C)=0,V(A,B)=200,V(A,C)=150,V(B,C)=100,V(A,B,C)=250聯(lián)盟ABC可能的排列與邊際貢獻(xiàn)計(jì)算如下表所示。

由表可知,A的邊際貢獻(xiàn)之和為650;B的邊際貢獻(xiàn)之和為500,C的邊際貢獻(xiàn)之和為350。這樣,A、B、C的夏普利值分別為Φ(A)=650/6,Φ(B)=500/6,Φ(C)=350/6。

在聯(lián)盟博弈的分配問題上需要確定“公平的分配標(biāo)準(zhǔn)”。成員的夏普利值反映了該成員對聯(lián)盟的期望貢獻(xiàn),分配應(yīng)當(dāng)?shù)扔谄谕暙I(xiàn)。認(rèn)可這樣的標(biāo)準(zhǔn)的條件下,按照該值進(jìn)行分配,便是公平的;若不按照這樣的值來進(jìn)行分配,便是不公平的。

夏普利值排列ABCACBBACBCACABCBA

A00200150150150B20010000100100C5015050100002.三人聯(lián)盟的情況夏普利值排列ABC

企業(yè)家的創(chuàng)造性也體現(xiàn)在他們能夠在他人看不到的地方建立聯(lián)盟。今天在中國各大城市,麥當(dāng)勞餐廳到處可見。它的成功因素是多方面的,然而其中一個重要因素便是“構(gòu)建聯(lián)盟”。企業(yè)有足夠的資本與技術(shù)不一定必然成功,成功還取決于管理。如何突破經(jīng)營能力的局限呢?下面我們看看麥當(dāng)勞是如何成功的。麥當(dāng)勞公司成立于20世紀(jì)50年代,它的前身為麥當(dāng)勞兄弟1937年在美國的加利福尼亞開設(shè)的一家汽車餐廳。為了使生意做得更大,麥當(dāng)勞兄弟產(chǎn)生了以特許加盟的方式經(jīng)營連鎖店的想法,并做出了嘗試。然而,因?yàn)闄?quán)利和義務(wù)沒有規(guī)定明確,那些付了一定的加盟費(fèi)的加盟店,其經(jīng)營沒有遵循麥當(dāng)勞的經(jīng)營管理制度,結(jié)果使麥當(dāng)勞的形象和聲譽(yù)受到損害,麥當(dāng)勞兄弟的嘗試失敗了。50年代,雷·克羅克看到了麥當(dāng)勞特許加盟和連鎖經(jīng)營的發(fā)展前景,他得到麥當(dāng)勞兄弟的授權(quán),負(fù)責(zé)麥當(dāng)勞特許經(jīng)營權(quán)的轉(zhuǎn)讓事宜。此時,麥當(dāng)勞公司成立了。60年代初,雷·克羅克買下了麥當(dāng)勞公司的所有權(quán),并且大刀闊斧地改進(jìn)了特許加盟和連鎖經(jīng)營制度,使麥當(dāng)勞得到迅速發(fā)展。

案例分析企業(yè)家的創(chuàng)造性也體現(xiàn)在他們能夠在他人看不到的地方建立

麥當(dāng)勞的經(jīng)營策略是:通過獲得特許經(jīng)營人——加盟者——支付的加盟費(fèi)以及營業(yè)額的一定百分比而獲利,加盟者則從餐廳的經(jīng)營中獲利。特許經(jīng)營人可以自己招聘員工,控制經(jīng)營費(fèi)用,并利用麥當(dāng)勞完備的供應(yīng)商系統(tǒng)和分發(fā)中心進(jìn)行運(yùn)作。麥當(dāng)勞的特許加盟和連鎖經(jīng)營制度具有以下特點(diǎn):第一,統(tǒng)一加盟條件并嚴(yán)格挑選加盟商;第二,統(tǒng)一企業(yè)名稱、標(biāo)識與廣告宣傳;第三,統(tǒng)一產(chǎn)品質(zhì)量、服務(wù)規(guī)范、作業(yè)程序與員工培訓(xùn)等。由此我們看到,麥當(dāng)勞總部與加盟者之間構(gòu)成一個合作性的聯(lián)盟:希望加盟者加入到麥當(dāng)勞的行列中來能夠獲得確定的利益,而麥當(dāng)勞總部獲得加盟費(fèi)以及分得一定的經(jīng)營利潤。當(dāng)然,雙方都有義務(wù):加盟者遵守總部規(guī)定的各項(xiàng)標(biāo)準(zhǔn),而麥當(dāng)勞總部要維護(hù)并提升麥當(dāng)勞的品牌價值、改進(jìn)管理措施、提升產(chǎn)品質(zhì)量等。

案例分析麥當(dāng)勞的經(jīng)營策略是:通過獲得特許經(jīng)營人——加盟者——博弈的分類1.如果給你兩個師的兵力,由你來當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市,而敵軍的守備力量是三個師,規(guī)定雙方的兵力只能整師調(diào)動。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時候,你的兵力超過敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案?2.考慮政府對長期無業(yè)人員的救濟(jì)。政府可選擇救濟(jì)或不救濟(jì),無業(yè)人員可選擇尋找工作或繼續(xù)閑蕩。假設(shè)該博弈問題雙方的贏得情況如表所示。分析該問題的納什均衡。政府救濟(jì)博弈練習(xí)題無業(yè)人員政府尋找工作閑蕩救濟(jì)不救濟(jì)3,2-1,1-1,30,0博弈的分類1.如果給你兩個師的兵力,由你來當(dāng)“司令”,任務(wù)是3.求解下表所示博弈的納什均衡。兩參與人博弈支付矩陣表4.性質(zhì)不同的三所大學(xué)在同一地區(qū)辦學(xué)。大學(xué)A有辦某種培訓(xùn)計(jì)劃的資格,B、C則沒有。若A獨(dú)辦,可獲收益a(=100萬元);若A與B合辦,可共獲收益b(=250萬元);若A與C合辦,或A與B、C一起合辦,可共獲收益c(=400萬元)。三校形成聯(lián)盟博弈格局,請問如何分配他們的收益?練習(xí)題ⅠⅡLMRUMD4,32,13,05,18,49,66,23,62,83.求解下表所示博弈的納什均衡。練習(xí)題Ⅰ數(shù)據(jù)、模型與決策

第九講博弈論

主講:鄧旭東教授數(shù)據(jù)、模型與決策

第九講博弈論

主講:鄧旭東教授教學(xué)內(nèi)容博弈論的產(chǎn)生和發(fā)展1博弈論的基本概念與博弈的分類2博弈論的經(jīng)典模型3Nash均衡解的求解方法4合作博弈5教學(xué)內(nèi)容博弈論的產(chǎn)生和發(fā)展1博弈論的基本概念與博弈的分類2博學(xué)習(xí)目標(biāo)了解博弈論的產(chǎn)生和發(fā)展情況掌握博弈及博弈論的概念、博弈論的分類了解和掌握博弈論的經(jīng)典模型掌握純策略和混合策略Nash均衡解的求解方法掌握聯(lián)盟博弈及夏普利值的概念,會求解兩人聯(lián)盟和三人聯(lián)盟情況下的夏普利值培養(yǎng)應(yīng)用博弈論于經(jīng)濟(jì)與管理實(shí)踐的意識學(xué)習(xí)目標(biāo)了解博弈論的產(chǎn)生和發(fā)展情況博弈論、納什均衡及核的概念

博弈論(GameTheory)是一門關(guān)于決策者在對決策結(jié)果沒有完全信息和互動條件下做出理性決策的理論。

所謂“互動”是指這樣一種情況,任何決策者決策的結(jié)果不僅取決于其自身采取的策略,還取決于其他人采取的策略。

納什均衡指兩人或多人互動的結(jié)果:當(dāng)其他人所選策略不變時,沒有任何人可以通過單方面改變其策略而取得更好的結(jié)果。

核指兩個或多個聯(lián)盟互動的結(jié)果:當(dāng)其他聯(lián)盟的策略不變時,沒有任何聯(lián)盟可以通過單方面改變其策略而取得對該聯(lián)盟所有成員更好的結(jié)果。博弈論、納什均衡及核的概念博弈論(Game一、博弈論的產(chǎn)生和發(fā)展20世紀(jì)50年代,合作博弈發(fā)展到全盛期,非合作博弈論也開始創(chuàng)立;20世紀(jì)60年代后,非合作博弈得到進(jìn)一步發(fā)展;幾十年來,眾多的博弈論學(xué)者花費(fèi)了無窮的精力,研究博弈論里博弈的結(jié)構(gòu),發(fā)展納什均衡點(diǎn)的定義,并探討其實(shí)際應(yīng)用的可能性?,F(xiàn)代博弈理論誕生的標(biāo)志:馮·諾依曼和摩根斯坦1944年出版的巨著《博弈論與經(jīng)濟(jì)行為》(TheTheoryofGamesandEconomicBehavior)1994年諾貝爾經(jīng)濟(jì)學(xué)獎:納什、哈薩尼、澤爾騰1996年諾貝爾經(jīng)濟(jì)學(xué)獎:莫里斯、維克瑞2001年諾貝爾經(jīng)濟(jì)學(xué)獎:阿克爾洛夫、斯彭斯、斯蒂格利茨2005年諾貝爾經(jīng)濟(jì)學(xué)獎:奧曼、謝林博弈論的產(chǎn)生博弈論的產(chǎn)生和發(fā)展博弈論的發(fā)展一、博弈論的產(chǎn)生和發(fā)展20世紀(jì)50年代,合作博弈發(fā)展到全盛期1994年諾貝爾經(jīng)濟(jì)學(xué)獎

1994年的諾貝爾經(jīng)濟(jì)學(xué)獎,授予了三位對博弈論做出奠基性貢獻(xiàn)的學(xué)者,他們是美國普林斯頓大學(xué)數(shù)學(xué)系的納什(JohnNash)教授、美國伯克利加州大學(xué)商學(xué)院的哈薩尼(JohnHarsanyi)教授和德國波恩大學(xué)經(jīng)濟(jì)學(xué)系的澤爾騰(ReinhardSelten)教授。納什對博弈論的貢獻(xiàn)有兩個方面:①合作博弈理論中的討價還價模型,稱為納什討價還價解;②非合作博弈論方面,這也是他的主要貢獻(xiàn)所在。納什對非合作博弈論的主要貢獻(xiàn)是他在1950年和1951年的兩篇論文中在非常一般的意義上定義了非合作博弈及其均衡解,并證明了均衡解的存在,由此奠定了非合作博弈論的基礎(chǔ)。1994年諾貝爾經(jīng)濟(jì)學(xué)獎1994年的諾貝爾經(jīng)1996年諾貝爾經(jīng)濟(jì)學(xué)獎1996年的諾貝爾經(jīng)濟(jì)學(xué)獎授予了英國劍橋大學(xué)的詹姆斯·莫里斯(JamesA.Mirrlees)教授和美國哥倫比亞大學(xué)的威廉姆·維克瑞(WilliamVickrey)教授,表彰他們對信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)。這兩位經(jīng)濟(jì)學(xué)家分別在20世紀(jì)60年代和70年代揭示了不對稱信息對交易所帶來的影響,并提出了相應(yīng)的對策。

信息經(jīng)濟(jì)學(xué)是研究信息不對稱條件下交易關(guān)系和契約安排的理論。從本質(zhì)上講,信息經(jīng)濟(jì)學(xué)是不對稱博弈論在經(jīng)濟(jì)學(xué)上的應(yīng)用。不對稱信息指的是某些參與人擁有另一些參與人不擁有的信息。

博弈論是方法論導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,尋找最可能的均衡結(jié)果;信息經(jīng)濟(jì)學(xué)是以問題導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,進(jìn)行最優(yōu)的契約安排。

由于信息經(jīng)濟(jì)學(xué)研究什么是不對稱信息情況下的最優(yōu)交易契約,故又稱為契約理論,或機(jī)制設(shè)計(jì)理論。正因?yàn)樾畔⒉粚ΨQ,不同的制度安排對應(yīng)不同的經(jīng)濟(jì)效率,現(xiàn)在經(jīng)常討論的國有企業(yè)委托人—代理人問題、激勵機(jī)制問題、產(chǎn)權(quán)問題等,都是信息經(jīng)濟(jì)學(xué)的問題。1996年諾貝爾經(jīng)濟(jì)學(xué)獎1996年的諾貝爾經(jīng)濟(jì)學(xué)獎授2001年諾貝爾經(jīng)濟(jì)學(xué)獎

2001年的諾貝爾經(jīng)濟(jì)學(xué)獎授予了三位美國經(jīng)濟(jì)學(xué)家,他們是伯克利加州大學(xué)經(jīng)濟(jì)系的喬治·阿克爾洛夫(GeorgeAkerlof)教授、斯坦福大學(xué)商學(xué)院的邁克爾·斯彭斯(MichaelSpence)教授和哥倫比亞大學(xué)經(jīng)濟(jì)系、商學(xué)院及國際關(guān)系學(xué)院的約瑟夫·斯蒂格利茨(JosephStiglitz)教授。早在20世紀(jì)70年代,他們就揭示了當(dāng)代信息經(jīng)濟(jì)的核心,認(rèn)為信息是有價值的。其應(yīng)用價值對中國目前的改革也有著一定的指導(dǎo)意義。

1970年,阿克爾洛夫?qū)鹘y(tǒng)經(jīng)濟(jì)學(xué)理論提出了挑戰(zhàn),他從分析舊車市場入手,發(fā)現(xiàn)在舊車交易中,賣者顯然比買者對車輛擁有更多的信息,而因?yàn)檫@種信息不對稱,買車的人難以完全信任賣車人提供的信息,因而試圖通過低價來彌補(bǔ)其信息上的損失。由于買者出價過低,賣者又不愿提供好的產(chǎn)品,從而導(dǎo)致次貨的泛濫,其最終的結(jié)果是舊車市場的萎縮。阿克爾洛夫就此得出結(jié)論:市場放開并不能解決所有問題,信息是有價值的。斯彭斯則在1973年通過剖析人才市場盛行的造假行為,指出人才市場同樣存在用人單位與應(yīng)聘者之間信息不對稱的問題,并由此造成了人才市場上“劣幣”驅(qū)逐“良幣”的現(xiàn)象。斯蒂格利茨則將信息不對稱這一理論應(yīng)用到保險和金融市場。2001年諾貝爾經(jīng)濟(jì)學(xué)獎2001年的諾貝爾經(jīng)濟(jì)學(xué)獎授2001年諾貝爾經(jīng)濟(jì)學(xué)獎這三個人從不同領(lǐng)域探討了信息不對稱問題,指出市場體制需要完善、設(shè)計(jì),設(shè)計(jì)里有最優(yōu)。這是對傳統(tǒng)經(jīng)濟(jì)學(xué)的重大突破。

Akerlof,G.(1970)”TheMarketforLemons:QualityUncertaintyandMarketMechanism”,QuarterlyJournalofEconomics,84:488-599.

Spence,M.(1973),”JobMarketSignaling”,QuarterlyJournalofEconomics,87.

Rothschild,M.andStiglitz,J.(1976),”EquilibriuminCompetitiveInsuranceMarket”,QuarterlyJournalofEconomics90:629-49.

2001年諾貝爾經(jīng)濟(jì)學(xué)獎這三個人從不同領(lǐng)域探討了信息2005年諾貝爾經(jīng)濟(jì)學(xué)獎奧曼(RobertJ.Aumann)提出了無限次的重復(fù)博弈的理論,謝林(ThomasC.Schelling)提出了對抗?fàn)顟B(tài)下的“可置信威脅”等概念,深刻地分析了行為選擇的條件對博弈均衡結(jié)果的影響。

奧曼率先提出的“重復(fù)博弈”分析,目前成為所有社會科學(xué)的主流分支,并已應(yīng)用于政治沖突、灌溉系統(tǒng)、國際條約乃至公司相互勾結(jié)等各種各樣的問題。

奧曼對沖突與合作策略思想的貢獻(xiàn)在于,他運(yùn)用了邏輯學(xué)和數(shù)學(xué)來理解,當(dāng)人們每天都面對相同對手或競爭者時,他們所能作出的選擇。當(dāng)策略情形大量重復(fù)出現(xiàn)時,即便個體間有直接的利益沖突,達(dá)成合作的機(jī)率也會上升,因?yàn)槊總€個體在未來時間內(nèi),都會與另一方反復(fù)打交道。

謝林于20世紀(jì)60年代出版《沖突的策略》,著力闡述了在雙方處于僵持時,采取一些策略性手段的重要性。這些手段包括:事先承諾、邊緣政策和有威懾力的威脅。例如,通過限定你自己的選擇范圍,你就可以使對手清楚地知道,你將對他們的行動作出何種反應(yīng)——不管他們采取什么行動,這也就加大了他們作出讓步的可能性。

在地緣政治領(lǐng)域之外,謝林還發(fā)現(xiàn),人通常都是愿意合作的,但當(dāng)他們在一個團(tuán)隊(duì)中完全依理性行事時,則不那么容易合作。2005年諾貝爾經(jīng)濟(jì)學(xué)獎奧曼(RobertJ.A二、博弈論的基本概念與博弈的分類博弈論的基本概念包括參與人、行動、信息、策略、支付、結(jié)果和均衡。其中,參與人、策略和支付是描述一個博弈所需要的最少的要素,而行動和信息是其“積木”。參與人、行動和結(jié)果統(tǒng)稱為“博弈規(guī)則”。博弈分析的目的是使用博弈規(guī)則預(yù)測均衡。參與人——是指在一個博弈中能夠選擇自己的行動方案從而使自身的利益最大化的決策主體,即有決策權(quán)的參加者。個人或組織團(tuán)體,參與人是理性的。行動——是參與人在博弈的某個時點(diǎn)的決策變量。當(dāng)參與人的行動存在先后次序時,后行動者就可以通過觀察先行動者的行動選擇來獲取信息,再決定行動方案。信息——是參與人有關(guān)博弈的知識,特別是有關(guān)自然狀況、其他參與人的特征、偏好和行動等方面的知識。“理性”是共同知識,各參與人的偏好也可能是共同知識。二、博弈論的基本概念與博弈的分類博弈論的基本概念包括參與人、博弈論的基本概念策略——是參與人在給定信息集的情況下的行動規(guī)則,它規(guī)定了參與人在何時何種情況下選擇何種行動,是完整的行動方案。各參與人在各自的策略集中選擇一個特定的策略所構(gòu)成的策略組合稱為一個局勢。支付——是指在博弈論中,對應(yīng)一個確定的自然狀況,參與人各選擇一個特定的策略所形成的局勢下參與人得到的效用。當(dāng)自然狀況不確定或參與人隨機(jī)選擇其策略時,參與人關(guān)心的是期望效用。結(jié)果——是一個博弈各種可能的最終后果,如各參與人的最優(yōu)策略、最優(yōu)策略下的效用等。均衡——是各參與人最優(yōu)策略所形成的局勢,在該局勢下,沒有參與人愿意選擇其他的策略。博弈論的基本概念策略——是參與人在給定信息集的情況下的行動規(guī)博弈的分類通過事前交流協(xié)商達(dá)成有約束力的協(xié)議稱為合作。根據(jù)參與人之間是否存在合作,博弈可劃分為合作博弈和非合作博弈。合作博弈與非合作博弈之間的區(qū)別主要在于人們的行為相互作用時,當(dāng)事人能否達(dá)成一個具有約束力的協(xié)議。如果有,就是合作博弈;反之,則是非合作博弈。合作博弈強(qiáng)調(diào)的是團(tuán)體理性,強(qiáng)調(diào)的是效率、公正、公平;非合作博弈強(qiáng)調(diào)的是個人理性、個人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無效率的。根據(jù)參與人行動的先后順序,博弈可以劃分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈指的是博弈中,參與人同時選擇行動或雖非同時但后行動者并不知道先行動者采取了什么具體行動;動態(tài)博弈指的是參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。博弈的分類通過事前交流協(xié)商達(dá)成有約束力的協(xié)議稱為合作。博弈的分類根據(jù)參與人對博弈的整體環(huán)境(即自然狀況及其他參與人的特征、偏好和策略)是否有全面而準(zhǔn)確的知識,博弈可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論