版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
引例:在一個(gè)風(fēng)雨交加得夜晚,當(dāng)你開著一輛豪華轎車經(jīng)過一個(gè)車站時(shí),正好遇到三個(gè)人在焦急地等待公共汽車,一位是生命危在旦夕的老人;一位是曾經(jīng)救過你的命得醫(yī)生,可以說是你的恩人,你做夢都想報(bào)答他;還有一位是你一見傾心的異性,如果這次錯(cuò)過了,你肯定一輩子都會(huì)后悔。但你的車卻只能在坐一個(gè)人。你到底會(huì)讓誰坐上你的車呢?
1知己知彼百戰(zhàn)不殆他的回答是,“把車鑰匙給醫(yī)生,讓他帶著老人去醫(yī)院看病,我留下來陪著一見鐘情的人雨中漫步?!?知己知彼百戰(zhàn)不殆什么是博弈呢?博弈實(shí)際上就是如何在現(xiàn)有條件下做出最優(yōu)選擇的一種策略。博弈論也叫做對策論,或稱賽局理論,是研究具有斗爭或競爭性質(zhì)的現(xiàn)象的理論和方法。可以簡單的說,博弈論就是運(yùn)用你的智慧和理性思維,在紛繁的選擇中能夠使你的利益達(dá)到最大化的一門科學(xué)。3知己知彼百戰(zhàn)不殆知己知彼百戰(zhàn)不殆4博弈分類:
合作、非合作:是否存在一個(gè)具有約束力的協(xié)議(bindingagreement)前者強(qiáng)調(diào)團(tuán)體理性(效率、公正、公平)后者強(qiáng)調(diào)個(gè)人理性(最優(yōu)決策,不保證效率)知己知彼百戰(zhàn)不殆5完全信息與不完全信息:每一個(gè)局中人對自己及其它局中人是否有完全的了解;包括局中人特征、策略空間、盈利函數(shù)等知識(shí)。動(dòng)態(tài)與靜態(tài):行動(dòng)的先后順序;是否同時(shí)(或不同時(shí)但對方不知)。博弈論2014-1知己知彼百戰(zhàn)不殆6
靜態(tài)
動(dòng)態(tài)
完全信息
完全信息靜態(tài)博弈納什均衡納什(1950,1951)
完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡澤爾滕(1965)
不完全信息
不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)
不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡澤爾滕(1975)博弈論體系第二章
非合作博弈本章提要第一節(jié)占優(yōu)策略均衡第二節(jié)納什均衡的應(yīng)用例子第三節(jié)古諾模型第四節(jié)非零和博弈8知己知彼百戰(zhàn)不殆第1節(jié)占優(yōu)策略與均衡一、嚴(yán)格占優(yōu)策略的定義博弈參與者進(jìn)行策略選擇時(shí),有可能存在某個(gè)策略的收益嚴(yán)格優(yōu)于其他策略的情況,該策略被稱為嚴(yán)格占優(yōu)策略(StrictlyDominantStrategy)。9知己知彼百戰(zhàn)不殆“囚徒困境”博弈與嚴(yán)格占優(yōu)策略不管嫌疑人乙選擇何種策略(坦白還是不坦白),嫌疑人甲的最優(yōu)策略都是坦白。在這種情況下,“坦白”是嫌疑人甲的嚴(yán)格占優(yōu)策略。不管嫌疑人甲選擇何種策略(坦白還是不坦白),嫌疑人乙的最優(yōu)策略都是坦白。因此“坦白”也是嫌疑人乙的嚴(yán)格占優(yōu)策略。嫌疑人乙坦白不坦白嫌疑人甲坦白(5,5)(1,10)不坦白(10,1)(2,2)10知己知彼百戰(zhàn)不殆二通過尋找嚴(yán)格占優(yōu)策略求解博弈均衡在尋找博弈均衡時(shí),如果該博弈某參與者存在嚴(yán)格占優(yōu)策略,那么在博弈均衡中,該參與者會(huì)選擇嚴(yán)格占優(yōu)策略,而不會(huì)選擇其他策略。因?yàn)椴还芷渌麉⑴c者選擇何種策略,該參與者選擇嚴(yán)格占優(yōu)策略的收益均高于選擇其他策略的收益。因此在博弈均衡中,理性參與者一定會(huì)選擇嚴(yán)格占優(yōu)策略。11知己知彼百戰(zhàn)不殆定理:
如果每個(gè)博弈參與者都存在一個(gè)嚴(yán)格占優(yōu)策略,那么在博弈中各參與者必然選擇其嚴(yán)格占優(yōu)策略。各博弈參與者的嚴(yán)格占優(yōu)策略構(gòu)成博弈均衡12知己知彼百戰(zhàn)不殆占優(yōu)策略均衡:當(dāng)一個(gè)博弈中的每位參與者都選擇了各自的占優(yōu)策略時(shí),相應(yīng)的博弈結(jié)果就是占優(yōu)策略均衡社會(huì)兩難博弈從整體利益考慮的解叫做博弈的合作解,一般占優(yōu)策略均衡形成的解都是非合作解,占優(yōu)策略均衡與合作解相悖,稱此類博弈為社會(huì)兩難問題解決途徑合約、法規(guī)、協(xié)議或其他手段使參與者們都能履行協(xié)調(diào)后的策略13知己知彼百戰(zhàn)不殆2政府干預(yù)煙草廣告博弈中的政府干預(yù)的積極作用1996.12.30,我國工商行政管理局禁止利用廣播、電影、電視、報(bào)紙等發(fā)布煙草廣告政府管制使廠商從“囚徒困境中”解放出來,說明自由競爭并不是最有效的經(jīng)濟(jì)體系,適當(dāng)?shù)恼苤瓶梢愿行У奶岣呱鐣?huì)經(jīng)濟(jì)和政治效益14B公司做廣告不做廣告A公司做廣告40,40100,20不做廣告20,10080,80知己知彼百戰(zhàn)不殆3努力還是偷懶15乙努力偷懶甲努力(10,10)(2,15)偷懶(15,2)(5,5)要改變合作困境,即改變博弈的均衡,可采取獎(jiǎng)勤罰懶措施博弈的標(biāo)準(zhǔn)式知己知彼百戰(zhàn)不殆獎(jiǎng)勵(lì)16乙努力偷懶甲努力(8,8)(8,0)偷懶(0,8)(0,0)合作博弈的獎(jiǎng)賞矩陣乙努力偷懶甲努力(10,10)(2,15)偷懶(15,2)(5,5)乙努力偷懶甲努力(18,18)(10,15)偷懶(15,10)(5,5)知己知彼百戰(zhàn)不殆懲罰17乙努力偷懶甲努力(0,0)(0,-8)偷懶(-8,8)(-8,-8)合作博弈的懲罰矩陣乙努力偷懶甲努力(10,10)(2,15)偷懶(15,2)(5,5)乙努力偷懶甲努力(10,10)(2,7)偷懶(7,10)(-3,-3)知己知彼百戰(zhàn)不殆獎(jiǎng)懲使占優(yōu)策略均衡與合作解18乙努力偷懶甲努力(a,a)(d,c)偷懶(c,d)(b,b)設(shè)(努力,努力)最大收益為a,(偷懶,偷懶)的最小收益為b,a>b.兩個(gè)參與者選擇不同策略時(shí)所得的收益分別為c、d(c>d)只要a>c>d>b,占優(yōu)策略均和合作解一致知己知彼百戰(zhàn)不殆一、納什均衡的定義給定其他參與者在博弈均衡時(shí)的策略,任何博弈參與者都沒有動(dòng)機(jī)改變自己在博弈均衡時(shí)的策略選擇。這樣的均衡被稱為“納什均衡”(NashEquilibrium)。在某些博弈中,并不是所有博弈參與者都存在嚴(yán)格占優(yōu)策略均衡第二節(jié)納什均衡19知己知彼百戰(zhàn)不殆博弈論2014-1知己知彼百戰(zhàn)不殆20諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者薩繆爾森有一句話:你可以將一只鸚鵡訓(xùn)練成一個(gè)經(jīng)濟(jì)學(xué)家,因?yàn)樗恍枰獙W(xué)習(xí)兩個(gè)詞:供給和需求。博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟(jì)學(xué)家,這只鸚鵡必須再多學(xué)一個(gè)詞,就是“納什均衡”。1.智豬博弈豬欄里養(yǎng)了兩頭豬,一頭大豬、一頭小豬。在豬圈的一端有一個(gè)盛食槽。在豬圈的另一端有一個(gè)按壓式開關(guān)。開關(guān)每被按壓一次,就有固定數(shù)量的食物出現(xiàn)在盛食槽中。大豬和小豬都在思考是否去按壓開關(guān)。21知己知彼百戰(zhàn)不殆如果大豬和小豬都去按壓開關(guān),然后兩頭豬從開關(guān)處奔向豬圈另一端的盛食槽。由于大豬跑的快,小豬跑得慢,因此大豬會(huì)比小豬早到達(dá)盛食槽并把盛食槽內(nèi)的食物吃光。小豬付出了按壓開關(guān)的勞動(dòng)卻沒有吃到食物。在此種情況下,大豬的收益為5,小豬的收益為-1。如果大豬去按壓開關(guān),小豬在盛食槽旁等待。那么當(dāng)大豬按下開關(guān)后,盛食槽內(nèi)出現(xiàn)食物,小豬立即開始吃,大豬則需要花一定時(shí)間從豬圈一端跑到另一端。當(dāng)大豬到達(dá)盛食槽后,身強(qiáng)力壯的大豬會(huì)把小豬擠到一旁,吃光剩余的食物。在這種情況下,大豬得到的收益是4,小豬得到的收益是2。22知己知彼百戰(zhàn)不殆如果小豬去按壓開關(guān),大豬在盛食槽旁等待。那么當(dāng)小豬按下開關(guān)后,大豬開始吃,即使當(dāng)小豬從開關(guān)處跑到盛食槽旁后,大豬仍然會(huì)霸占著食物,將食物全部吃光,小豬只能無可奈何地被擠在一旁。在這種情況下,大豬可以不勞而獲,得到的收益為10。小豬徒勞無功,看到大豬不勞而獲,更增加了小豬的郁悶,小豬得到收益-2。如果大豬和小豬都不去按壓開關(guān),則大豬和小豬都無法吃到食物,大豬和小豬均得到收益0。23知己知彼百戰(zhàn)不殆小豬按開關(guān)等待大豬按開關(guān)(5,-1)(4,2)等待(10,-2)(0,0)“智豬博弈”的支付矩陣24知己知彼百戰(zhàn)不殆2.通過“劃橫線法”求解“智豬博弈”的均衡如果大豬選擇按開關(guān),那么小豬應(yīng)該如何選擇?理性的小豬會(huì)選擇等待。在小豬選擇等待所對應(yīng)的收益“2”的下方劃一道短橫線。類似可分析其他情況小豬按開關(guān)等待大豬按開關(guān)(5,-1)(4,2)等待(10,-2)(0,0)25知己知彼百戰(zhàn)不殆博弈論2014-1知己知彼百戰(zhàn)不殆26分析:小豬有占優(yōu)策略,大豬沒有,所以不存在占優(yōu)均衡;
應(yīng)用:
此為“多勞不多得,少勞不少得”的奇怪情形,是一種有趣的社會(huì)現(xiàn)象。經(jīng)濟(jì)學(xué)中稱為“搭便車現(xiàn)象”
中國在國際事務(wù)中的“小豬策略”改變方案改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì)把食物吃完;大豬去踩,小豬將也會(huì)把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會(huì)有踩踏板的動(dòng)力了。
如果目的是想讓豬們?nèi)ザ嗖忍ぐ澹@個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。
改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會(huì)去踩踏板。誰想吃,誰就會(huì)去踩踏板。反正對方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會(huì),所以競爭意識(shí)卻不會(huì)很強(qiáng)。
對于游戲規(guī)則的設(shè)計(jì)者來說,這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦偁幉粡?qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?/p>
改變方案三:減量加移位方案。投食僅原來的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?,而多勞者多得。每次的收獲剛好消費(fèi)完。
對于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大知己知彼百戰(zhàn)不殆27原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會(huì)而言,因?yàn)樾∝i未能參與競爭,小豬搭便車時(shí)的社會(huì)資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。
比如,公司的激勵(lì)制度設(shè)計(jì),獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員個(gè)個(gè)都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”
增量方案所描述的情形。但是如果獎(jiǎng)勵(lì)力度不大,而且見者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì)有動(dòng)力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵(lì)機(jī)制設(shè)計(jì)就象改變方案三----減量加移位的辦法,獎(jiǎng)勵(lì)并非人人有份,而是直接針對個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。
許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟(jì)管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個(gè)中道理。知己知彼百戰(zhàn)不殆28性別博弈對男方而言,如果女方選擇看足球,那么男方會(huì)選擇看足球;如果女方選擇聽昆曲,那么男方會(huì)選擇聽昆曲。男方不存在嚴(yán)格占優(yōu)策略。對女方而言,如果男方選擇看足球,那么女方會(huì)選擇看足球;如果男方選擇聽昆曲,那么女方會(huì)選擇聽昆曲。女方也不存在嚴(yán)格占優(yōu)策略。無法通過尋找嚴(yán)格最優(yōu)策略法求解“性別博弈”的均衡解。女方看足球聽昆曲男方看足球(10,2)(-1,-1)聽昆曲(-1,-1)(2,10)二存在多個(gè)納什均衡的博弈29知己知彼百戰(zhàn)不殆二存在多個(gè)納什均衡的博弈1性別博弈采用“劃橫線法”尋找“性別博弈”的納什均衡(男方看足球、女方看足球)和(男方聽昆曲、女方聽昆曲)都是“性別博弈”的納什均衡。在特定情況下,慣例和傳統(tǒng)能夠提供博弈的多重納什均衡中那個(gè)更可能出現(xiàn)女方看足球聽昆曲男方看足球(10,2)(-1,-1)聽昆曲(-1,-1)(2,10)30知己知彼百戰(zhàn)不殆假設(shè)在市場中有兩個(gè)競爭對手。一個(gè)是已經(jīng)在市場中的“在位者”,另一個(gè)是企圖進(jìn)入市場的“潛在進(jìn)入者”。潛在進(jìn)入者有兩個(gè)可以選擇的策略:進(jìn)入、不進(jìn)入。在位者也有兩個(gè)可以選擇的策略:斗爭、默許。如果潛在進(jìn)入者選擇進(jìn)入,在位者選擇斗爭,那么激烈的市場競爭會(huì)使得雙方均虧損,雙方收益均為-10。如果潛在進(jìn)入者選擇進(jìn)入,在位者選擇默許,那么雙方在市場中均可獲得收益5。如果潛在進(jìn)入者選擇不進(jìn)入,在位者選擇斗爭,那么潛在進(jìn)入者的收益為0,在位者的收益為20。如果潛在進(jìn)入者選擇不進(jìn)入,在位者選擇默許,那么潛在進(jìn)入者的收益為0,在位者的收益為152.“市場爭奪戰(zhàn)”博弈31知己知彼百戰(zhàn)不殆采用“劃橫線法”尋找“市場爭奪戰(zhàn)”博弈的納什均衡(潛在進(jìn)入者進(jìn)入、在位者默許)和(潛在進(jìn)入者不進(jìn)入、在位者斗爭)都是“市場爭奪戰(zhàn)”博弈的納什均衡。在位者斗爭默許潛在進(jìn)入者進(jìn)入(-10,-10)(5,5)不進(jìn)入(0,20)(0,15)32知己知彼百戰(zhàn)不殆博弈論2014-1知己知彼百戰(zhàn)不殆33對納什均衡的理解“一致性”特征:局中人預(yù)測到均衡;局中人也預(yù)測到其它人預(yù)測到均衡;沒有局中人有興趣作不同的選擇。是局中人的一致性預(yù)測;但不一定最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 簡易機(jī)械購買合同范例
- 2025套房裝修合同書
- 學(xué)校消毒合同范例
- 店面轉(zhuǎn)租合同范例范例
- 賣榴蓮合同范例
- 碎石合同范例
- 商場演員合同范例
- 生態(tài)停車場建設(shè)合同范例
- 石材供貨單方合同范例
- 2025賠償協(xié)議合同保證承諾書
- 固定資產(chǎn)情況表
- 瀝青路面施工監(jiān)理工作細(xì)則
- 《網(wǎng)吧證件轉(zhuǎn)讓協(xié)議推薦》
- 《彩色的中國》音樂教學(xué)設(shè)計(jì)
- 重慶氣體行業(yè)協(xié)會(huì)
- 人教版八年級上冊英語單詞表默寫版(直接打印)
- 4.初中物理儀器配備目錄清單
- 企業(yè)中高層人員安全管理培訓(xùn)--責(zé)任、案例、管理重點(diǎn)
- 兒童時(shí)期2型糖尿病-(PPTminimizer)
- 高強(qiáng)螺栓施工記錄
- 脫硫塔選型與設(shè)計(jì)
評論
0/150
提交評論