博弈與決策培訓(xùn)教程_第1頁(yè)
博弈與決策培訓(xùn)教程_第2頁(yè)
博弈與決策培訓(xùn)教程_第3頁(yè)
博弈與決策培訓(xùn)教程_第4頁(yè)
博弈與決策培訓(xùn)教程_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章博弈與決策博弈論的基礎(chǔ)知識(shí)完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈博弈論的基礎(chǔ)知識(shí)博弈論(gametheory):是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的學(xué)科。博弈的基本要素包括:參與人,行動(dòng),信息,戰(zhàn)略,支付函數(shù),結(jié)果,均衡。博弈的劃分:行動(dòng)的先后順序:靜態(tài)博弈(staticgame)和動(dòng)態(tài)博弈(dynamicgame)。參與人對(duì)有關(guān)其他參與人的特征、戰(zhàn)略空間以及支付函數(shù)的知識(shí)的了解:完全信息和不完全信息。四種不同的博弈靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈納什均衡(納什)子博弈精煉納什均衡(澤爾騰)不完全信息不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈貝葉斯納什均衡(海薩尼)精煉貝葉斯納什均衡(澤爾騰)行動(dòng)順序信息第一節(jié):完全信息靜態(tài)博弈:納什均衡納什均衡:假設(shè)有n個(gè)人參與博弈,給定其他人戰(zhàn)略的條件下,每個(gè)人選擇自己的最優(yōu)戰(zhàn)略(個(gè)人最優(yōu)戰(zhàn)略可能依賴于也可能不依賴于其他人的戰(zhàn)略),所有參與人選擇的戰(zhàn)略一起構(gòu)成了一個(gè)戰(zhàn)略組合(strategyprofile)。納什均衡是這樣一組戰(zhàn)略組合,這種戰(zhàn)略組合由所有參與人的最優(yōu)戰(zhàn)略構(gòu)成。也就是說,給定別人戰(zhàn)略的情況下,沒有任何單個(gè)參與人有積極性選擇其他戰(zhàn)略,從而沒有任何人有積極性打破這種均衡,即給定別人不動(dòng)的情況下,沒有人有興趣動(dòng)。例一:囚徒困境(prisoner’sdilemma)囚徒B坦白抵賴坦白-8,-80,-10抵賴-10,0-1,-1囚徒A類似例子:公共產(chǎn)品,軍備競(jìng)賽,環(huán)境污染。從囚徒困境中引出一個(gè)重要結(jié)論:一種體制或制度安排要發(fā)生效力,必須是一種納什均衡。否則,這種制度安排便不能成立。例二:智豬博弈(boxedpigs)小豬按不按按5,14,4不按9,-10,0大豬類似例子:股份公司的大股東,股票市場(chǎng)上的大戶,富戶修路。例三:性別戰(zhàn)(battleofsexes)女足球芭蕾足球2,10,0芭蕾0,01,2男這個(gè)博弈中有兩個(gè)納什均衡(足球,足球),(芭蕾,芭蕾)。實(shí)際生活中,這里有一種先動(dòng)優(yōu)勢(shì)(first-moveradvantage)。例四:斗雞博弈(chickengame)B進(jìn)退進(jìn)-3,-32,0退0,20,0A斗雞博弈的應(yīng)用:毛澤東戰(zhàn)略思想,冷戰(zhàn)期間美蘇爭(zhēng)霸,警察與游行隊(duì)伍,夫妻間吵架……例五:市場(chǎng)進(jìn)入阻撓(entrydeterrence)在位者默許斗爭(zhēng)進(jìn)入40,50-10,0不進(jìn)入0,3000,300進(jìn)入者第二節(jié):完全信息動(dòng)態(tài)博弈:子博弈精煉納什均衡博弈的標(biāo)準(zhǔn)型表述有三個(gè)要素:參與人,每個(gè)參與人可選擇的策略,支付函數(shù)博弈的擴(kuò)展型(extensiveform)表述包含五個(gè)要素(1)參與人,(2)每個(gè)參與人選擇行動(dòng)的時(shí)點(diǎn),(3)每個(gè)參與人在每次行動(dòng)時(shí)可供選擇的行動(dòng)集合,(4)每個(gè)參與人在每次行動(dòng)時(shí)有關(guān)對(duì)手過去行動(dòng)選擇的信息,(5)支付函數(shù)博弈樹(gametrees):是擴(kuò)展型的一種形象化表述。市場(chǎng)進(jìn)入阻撓博弈樹進(jìn)入者在位者進(jìn)入不進(jìn)入0,300默許斗爭(zhēng)40,50-10,0一個(gè)納什均衡稱為精煉納什均衡,當(dāng)只當(dāng)參與人的戰(zhàn)略在每一個(gè)子博弈中都構(gòu)成納什均衡,就是說,組成精煉納什均衡的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。一個(gè)精煉納什均衡首先必須是一個(gè)納什均衡,但納什均衡不一定是精煉均衡。只有那些不包含不可置信威脅的納什均衡才是精煉納什均衡。子博弈精煉納什均衡的實(shí)例分析一下,如果一個(gè)姑娘愛上了一個(gè)小伙子,她父親堅(jiān)決不同意,威脅說,如果女兒不與小伙子斷絕戀愛關(guān)系,他就與女兒斷絕父女關(guān)系。最后的結(jié)果會(huì)是怎樣的?父親會(huì)不會(huì)跟女兒斷絕父女關(guān)系?承諾行動(dòng)(commitment)承諾行動(dòng)是當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動(dòng)。一種威脅只有在當(dāng)事人在不施行這種威脅時(shí),就會(huì)遭受更大的損失的時(shí)候。所以,承諾行動(dòng)意味著當(dāng)事人要為自己的“失信”付出成本,盡管這種成本并不一定真的發(fā)生。思考:在市場(chǎng)進(jìn)入博弈中,如果在位者通過某種承諾行動(dòng)使自己的“斗爭(zhēng)”威脅變得可置信,進(jìn)入者就不敢進(jìn)入,在位者就可以獲得300的壟斷利潤(rùn),而不是50的寡頭利潤(rùn)。如何使“斗爭(zhēng)”威脅變得可置信?承諾行動(dòng)(commitment)一個(gè)簡(jiǎn)單的辦法:在位者可以和第三者打賭,如果進(jìn)入者進(jìn)入后他不斗爭(zhēng),他就付給后者100,這時(shí),斗爭(zhēng)的威脅就變得可置信了承諾行動(dòng)的實(shí)例:破釜沉舟《三國(guó)演義》中曹操與袁紹倉(cāng)亭之戰(zhàn)工業(yè)2001畢業(yè)設(shè)計(jì)第三節(jié):不完全信息靜態(tài)博弈:貝葉斯納什均衡仍然以市場(chǎng)進(jìn)入為例在位者默許斗爭(zhēng)進(jìn)入40,50-10,0不進(jìn)入0,3000,300市場(chǎng)進(jìn)入:高成本情況市場(chǎng)進(jìn)入:低成本情況進(jìn)入者在位者默許斗爭(zhēng)進(jìn)入30,100-10,140不進(jìn)入0,4000,400進(jìn)入者貝葉斯均衡貝葉斯均衡是一種類型依從戰(zhàn)略組合:給定自己的類型和別人類型的概率分布的情況下,每個(gè)參與人的期望效用得到了最大化,也就是說,沒有人有積極性選擇其他戰(zhàn)略。在市場(chǎng)進(jìn)入例子中,在位者有兩種類型:高成本或低成本。給定進(jìn)入者選擇進(jìn)入的情況下,在位者選擇默許還是斗爭(zhēng)依賴于他的類型;如果是高成本,就默許;低成本,就斗爭(zhēng)。進(jìn)入者不知道在位者的實(shí)類型,但是,如果他知道在位者高成本的可能性為x,低成本的可能性為1-x,那么進(jìn)入者選擇進(jìn)入得到的期望利潤(rùn)為40x+(-10)(1-x),選擇不進(jìn)入的期望利潤(rùn)為0。當(dāng)x>0.2時(shí),進(jìn)入得到的期望利潤(rùn)大于不進(jìn)入時(shí)的期望利潤(rùn)。假定x>0.2,貝葉斯納什均衡是:進(jìn)入者選擇進(jìn)入,高成本在位者選擇默許,低成本在位者選擇斗爭(zhēng)。例:求愛博弈你接受不接受求愛100,-100-50,0不求愛0,00,0你接受不接受求愛100,100-50,0不求愛0,00,0求愛博弈:品德優(yōu)良者求愛求愛博弈:品德惡劣者求愛求愛者求愛者應(yīng)用領(lǐng)域:招投標(biāo),拍賣第四節(jié):不完全信息動(dòng)態(tài)博弈:精煉貝葉斯均衡精煉貝葉斯均衡是完全信息動(dòng)態(tài)博弈的精煉納什均衡和不完全信息靜態(tài)博弈的貝葉斯均衡的結(jié)合。精煉貝葉斯均衡的要點(diǎn):當(dāng)事人要根據(jù)所觀察到的他人的行為來修正自己有關(guān)后者類型的“信念”(主觀概率),并由此選擇自己的行動(dòng)。這里修正過程中使用的是貝葉斯規(guī)則。精煉貝葉斯均衡是所有參與人戰(zhàn)略和信念的一種結(jié)合,它滿足如下條件(1)給定每個(gè)人有關(guān)其他人類型的信念的情況下,他的戰(zhàn)略選擇是最優(yōu)的;(2)每個(gè)人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論