《戰(zhàn)略與決策》第八章博弈分析方法

上傳人：b*** IP屬地：廣東上傳時間：2022-07-17 格式：PPT 頁數(shù)：66 大?。?95.50KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩61頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、戰(zhàn)略與決策第八章博弈分析方法第八講博弈分析方法8.1 博弈論概述8.1.1 博弈論簡史8.1.2 博弈論的基本概念8.2 博弈的基本類型8.2.1 完全信息靜態(tài)博弈：納什均衡8.2.2 完全信息動態(tài)博弈：子博弈精煉納什均衡8.2.3 不完全信息靜態(tài)博弈：貝葉斯納什均衡8.1 博弈論概述著名經(jīng)濟(jì)學(xué)家泰勒爾（Jean Tirole）說：“正如理性預(yù)期使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣，博弈論廣泛而深遠(yuǎn)地改變了經(jīng)濟(jì)學(xué)家的思維方式?！比绻闆r果真如此，對今天的經(jīng)濟(jì)學(xué)家來說，不懂得博弈論顯然是不行了。8.1.1 博弈論簡史博弈論(game theory)又稱對策論、游戲理論或策略運(yùn)籌學(xué)。它最早由德國數(shù)學(xué)家、

2、哲學(xué)家萊布尼茨于1710年提出。1713年，杰姆斯瓦爾德格雷夫首次提出了對策論中的極大中的極小定理(minimax)。8.1.1 博弈論簡史1944年，以馮諾依曼和奧斯卡摩根斯坦合著的博弈論與經(jīng)濟(jì)行為一書的出版為標(biāo)志，博弈論得以廣泛應(yīng)用于經(jīng)濟(jì)學(xué)領(lǐng)域，并成為微觀學(xué)的一個新的重要組成部分。1994年諾貝爾經(jīng)濟(jì)學(xué)獎授給了三位博弈論專家:美國普林斯頓大學(xué)的納什(Nash)、加利福尼亞大學(xué)的海薩尼(Harsanyi)與德國波恩大學(xué)經(jīng)濟(jì)學(xué)家澤爾騰(Selten). 8.1.1 博弈論簡史博弈論是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題。博弈論與傳統(tǒng)經(jīng)濟(jì)學(xué)有關(guān)決策理論是有區(qū)別的。在傳

3、統(tǒng)微觀經(jīng)濟(jì)學(xué)中，寡頭市場是一個例外，而這一部分正是博弈論最主要的應(yīng)用領(lǐng)域之一。 8.1.1 博弈論簡史博弈論包括合作博弈和非合作博弈兩種類型?，F(xiàn)在經(jīng)濟(jì)學(xué)家談到博弈論，一般指的是非合作博弈，很少指合作博弈。合作博弈與非合作博弈之間的區(qū)別主要在于人們的行為相互作用時，當(dāng)事人能否達(dá)成一個具有約束力的協(xié)議，就是說，有沒有一種binding agreement。如果有，就是合作博弈；反之，則是非合作博弈。 8.1.1 博弈論簡史非合作博弈論創(chuàng)立于20世紀(jì)50年代。1950年，年僅22歲的納什連續(xù)發(fā)表兩篇劃時代的論文,奠定了現(xiàn)代非合作博弈論的基石。澤爾騰則在20世紀(jì)60年代中期將納什均衡的概念引入動態(tài)分

4、析。海薩尼在20世紀(jì)60年代末把不完全信息引入博弈分析。 8.1.1 博弈論簡史進(jìn)入20世紀(jì)80年代后，克瑞普斯(Kreps)和威爾遜(wilson)則對不完全信息動態(tài)博弈的研究作出了突出的貢獻(xiàn)，并提出了更高級的均衡概念：“貝葉斯精煉納什均衡”或“完美貝葉斯均衡”。嚴(yán)格地說，博弈論并不是經(jīng)濟(jì)學(xué)的一個分支。實際上，它屬于數(shù)學(xué)范疇。 8.1.1 博弈論簡史至于博弈論專家獲經(jīng)濟(jì)學(xué)獎，原因大致有三點(diǎn)：博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域應(yīng)用最廣泛、最成功，博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來發(fā)展引申的。經(jīng)濟(jì)學(xué)家對博弈論的貢獻(xiàn)也越來越大，特別是在動態(tài)分析和不完全信息引入博弈后。最根本性的原因是經(jīng)濟(jì)學(xué)和博弈論的研究

5、模式是一樣的，都強(qiáng)調(diào)個人理性，即追求給定條件下效用最大化。 5.1.2 博弈論的基本概念博弈論的基本概念包括：參與人，行動，信息，策略，支付(效用)，結(jié)果和均衡。1)參與人(player)，也叫局中人，指的是一個博弈中的決策主體。他的目的是通過選擇行動(或戰(zhàn)略)以最大化自己的支付(效用)水平。參與人可能是自然人，也可能是團(tuán)體 5.1.2 博弈論的基本概念2)行動(actions)，是參與人在博弈的某個時點(diǎn)的決策變量。參與人的行動可能是離散的，也可能是連續(xù)的。參與人的行動往往是有順序的。行動順序?qū)Σ┺慕Y(jié)果很重要。同樣參與人，同樣行為組合，行動順序不同，會導(dǎo)致每個參與人的最優(yōu)選擇不同，得到不同的

6、博弈結(jié)果。 5.1.2 博弈論的基本概念3)信息(information)，是參與人有關(guān)博弈的知識，特別是有關(guān)“自然”的選擇、其他參與人的特征和行動的知識。信息集理解為參與人在特定時刻有關(guān)變量值的知識。完全信息是指自然不首先行動或自然的初始行動被所有參與人準(zhǔn)確觀察到的情況，即沒有事前的不確定性。 5.1.2 博弈論的基本概念4)策略(strategies)，也叫戰(zhàn)略，是參與人在給定信息集的情況下的行動規(guī)則。它規(guī)定參與人在什么時候選擇什么行動。因為信息集包含了一個參與人有關(guān)其他參與人之前行動的知識，戰(zhàn)略告訴該參與人如何對其他參與人的行動作出反應(yīng)，因而戰(zhàn)略又叫參與人的“相機(jī)行動方案”。 5.1.2

7、博弈論的基本概念5)支付(payoff)，是指在一個特定的戰(zhàn)略組合下參與人得到的確定效用水平，或者是參與人得到的期望效用水平。它是參與人真正關(guān)心的東西，并且是所有參與人戰(zhàn)略或行動的函數(shù)。5.1.2 博弈論的基本概念 6)結(jié)果(outcome)，是博弈分析者所要揭示的東西，是分析者感興趣的要素的集合，如均衡戰(zhàn)略組合、均衡行動組合、均衡支付組合等。 7)均衡(equilibrium)，是所有參與人的最優(yōu)戰(zhàn)略組合或行動組合。一個博弈中可能出現(xiàn)多個均衡。 52 博弈的基本類型博弈的類型可以從兩個角度描述。第一個是從參與人行動的先后順序的角度，博弈可以分為靜態(tài)與動態(tài)兩種。靜態(tài)博弈指的是博弈中，參與人同

8、時選擇行動或雖非同時但后行動者并不知道先行動者采取了什么具體行動；動態(tài)博弈是指參與人行動有先后順序，且后行動者能觀察到先行動者行動的選擇。 52 博弈的基本類型第二個是從參與人對有關(guān)其他參與人(競爭對手)的特征、戰(zhàn)略空間及支付函數(shù)的知識的角度，博弈可分為完全信息博弈和不完全信息博弈。完全信息博弈指的是每一個參與人對所有其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識；否則，就是不完全信息。 52 博弈的基本類型將上述兩種劃分結(jié)合起來，就能得到4種不同類型的博弈，即完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈和不完全信息動態(tài)博弈。與上述4種博弈相對應(yīng)的是4個均衡概念，即納什均衡

9、、子博弈精煉納什均衡、貝葉斯納什均衡以及精煉貝葉斯納什均衡行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡（納什，1950，1951）完全信息動態(tài)博弈子博弈精煉納什均衡澤爾騰（1965）不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡（海薩爾，1967，1968）不完全信息動態(tài)博弈精煉貝葉斯納什均衡澤爾騰（1975）克瑞普斯和威爾遜，1982）(費(fèi)得伯格和泰勒爾，1991)表1 博弈的分類及對應(yīng)的均衡概念 5.2.1 完全信息靜態(tài)博弈：納什均衡完全信息靜態(tài)博弈是一種最簡單的博弈，在這種博弈中，由于每個人是在不知其他人行動的情況下選擇自己的行動，故戰(zhàn)略與行動是一個意思。博弈分析的目的是預(yù)測博弈的

10、結(jié)果，而納什對非合作博弈的主要貢獻(xiàn)正是定義了非合作博弈及其一般均衡解，并證明了這個均衡解的存在，從而奠定了非合作博弈的基礎(chǔ)。一、最優(yōu)策略均衡一般來說，由于每個參與人的支付(效用)是博弈中所有參與人的戰(zhàn)略的函數(shù)，因此每個參與人的最優(yōu)戰(zhàn)略選擇依賴于所有其他參與人的選擇。在一些特殊的博弈中，不論其他參與人的策略如何，能夠使自己的支付(效用)對自己最為有利的策略叫最優(yōu)策略。一、最優(yōu)策略均衡企業(yè)A的策略廣告促銷10，515，0不做廣告6，810，2廣告促銷不做廣告企業(yè)B的策略廣告戰(zhàn)二、重復(fù)剔除的最優(yōu)策略均衡在每個參與人都有最優(yōu)策略的情況下，最優(yōu)策略均衡是很理想的，然而，大多數(shù)情況下，最優(yōu)策

11、略均衡是不存在的。盡管如此，在有些博弈中，我們?nèi)钥梢詰?yīng)用最優(yōu)策略的邏輯找到均衡。二、重復(fù)剔除的最優(yōu)策略均衡假定豬圈內(nèi)有大小豬各一頭，在豬圈的一頭有一個豬食槽，另一頭安裝一個按鈕，控制豬食的供應(yīng)。按一下按鈕，有8個單位豬食進(jìn)槽，但需要支付2個單位成本。若大豬先到，大豬吃到7個單位，小豬只能吃到1個單位；若小豬先到，大豬與小豬各吃到4個單位；若兩豬同時到，大豬吃到5個單位，小豬吃到3個單位。二、重復(fù)剔除的最優(yōu)策略均衡智豬博弈3, 1 2, 4 7,-1 0, 0 大豬按等待小豬按等待三、納什均衡在相當(dāng)多的博弈中，我們無法使用重復(fù)剔除劣戰(zhàn)略的辦法找出均衡解。這時我們需要引入納什均衡。納什均

12、衡是完全信息靜態(tài)博弈解的一般概念。它指在知道其他參與人采取的策略后，能夠使自己的支付效用最為有利的策略組合。三、納什均衡比如：如果B的選擇給定，A的選擇是最優(yōu)的，以及A的選擇給定，B的選擇是最優(yōu)的話，我們就說這一對策略組合是納什均衡。假定A、B兩企業(yè)都有生產(chǎn)麥片食品的業(yè)務(wù)，各自有兩種策略，即生產(chǎn)咸麥片和甜麥片。A、B企業(yè)支付矩陣見下表三、納什均衡 -5,-5 10,10 10,10 -5,-5 A企業(yè)的策略B企業(yè)的策略生產(chǎn)咸麥片生產(chǎn)甜麥片麥片商博弈生產(chǎn)咸麥片生產(chǎn)甜麥片三、納什均衡 -3,-3 2,0 0,20,0 A進(jìn)退B進(jìn)退斗雞博弈四、混合策略每個行為人只作出一個選擇并始終堅持這個選擇

13、的策略稱為純策略。然而，在純策略博弈中，往往會碰到找不到納什均衡的情況。如果允許行為人使他們的策略隨機(jī)化，也就是說，行為人對每項選擇都指定一個概率，并按照這些概率作出他們的選擇，這種策略叫作混合策略。四、混合策略我們可以通過用混合策略代替純策略的方法來求出納什均衡解。比如社會福利博弈，參與人是政府和一個流浪漢。流浪漢有兩種策略：尋找工作或游蕩；政府也有兩種策略：救濟(jì)或不救濟(jì)。政府想幫助流浪漢，但前提是后者必須努力找工作，否則，不予救濟(jì)；而流浪漢只有在得不到政府救濟(jì)時才會尋找工作。四、混合策略3,2 -1,3 -1,1 0,0 政府流浪漢尋找工作游蕩社會福利博弈救濟(jì)不救濟(jì)四、混合策略前面討論的是

14、不存在純策略納什均衡但存在混合策略納什均衡的博弈。有些博弈既存在純策略均衡，也存在混合策略均衡?，F(xiàn)舉一例。有一男一女談戀愛，晚上約會時或者去看足球比賽，或者去看芭蕾舞演出。男的偏好足球，女的則更喜歡芭蕾，但他們都寧愿在一起而不愿分開。四、混合策略2,1 0,00,0 1,2 男女足球芭蕾性別戰(zhàn)足球芭蕾五、囚犯的困境博弈的納什均衡的另一個問題是它并不一定導(dǎo)致帕累托有效的結(jié)果。博弈論中最著名的例子“囚徒的困境”深刻揭示了這一問題：五、囚犯的困境 -3,-3 0,-6 -6,0 -1,-1 囚徒A囚徒B交代不交代囚徒的困境交代不交代五、囚犯的困境囚徒困境反映了個人理性與集體理性的沖突。若兩人

15、都能拒不交代，那么他倆的境況就會比其他策略下更好一些！問題在于雙方?jīng)]有辦法協(xié)調(diào)他們的行動。即使兩囚徒在被捕之前約定雙方都拒不交代仍然于事無補(bǔ)，因為沒有人有積極性遵守事先的約定。五、囚犯的困境囚犯的困境在經(jīng)濟(jì)和政治現(xiàn)象中有廣泛的應(yīng)用。例如，裁軍計劃、停止核試驗其次，兩個寡頭選擇產(chǎn)量的博弈也屬于此類。 5.2.2 完全信息動態(tài)博弈：子博弈精煉納什均衡一、動態(tài)博弈與精煉納什均衡二、有限次重復(fù)博弈：“連鎖店之謎”三、無限次重復(fù)博弈：“針鋒相對(tit for tat)策略一、動態(tài)博弈與精煉納什均衡動態(tài)博弈概念的意義是將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與者的決策在任何時點(diǎn)上都是

16、最優(yōu)的，決策者要“隨機(jī)應(yīng)變”、“向前看”，而不是固守舊略。由于剔除了不可置信的威脅，在許多情況下，精煉納什均衡也就縮小了納什均衡的個數(shù)。一、動態(tài)博弈與精煉納什均衡博弈的標(biāo)準(zhǔn)型表達(dá)有3個要素：參與人、可選擇策略、及支付函數(shù)。博弈的擴(kuò)展型表達(dá)包括五個要素：參與人、每個參與人選擇行動的時點(diǎn)、每個參與人在每次行動時可供選擇的行動集合、每個參與人在每次行動時有關(guān)對手過去行動選擇的信息、支付函數(shù)。一、動態(tài)博弈與精煉納什均衡40,50 -10,00,3000,300 企業(yè)B企業(yè)A高價低價市場進(jìn)入阻撓博弈進(jìn)入不進(jìn)入一、動態(tài)博弈與精煉納什均衡澤爾騰認(rèn)為：只有當(dāng)參與人的策略在每一個子博弈中都構(gòu)成納什均衡才叫

17、作精煉納什均衡?；蛘哒f，組成精煉納什均衡的策略必須在每一個子博弈中都是最優(yōu)的。應(yīng)該強(qiáng)調(diào)的是，一個精煉均衡首先必須是一個納什均衡，反之不然。只有那些不包含不可置信威脅的納什均衡才是精煉的納什均衡。一、動態(tài)博弈與精煉納什均衡企業(yè)B 企業(yè)A0，300進(jìn)入不進(jìn)入40，50-10，0高價合作低價競爭一、動態(tài)博弈與精煉納什均衡有些納什均衡之所以不是精煉均衡，是因為它們包含不可置信的威脅；如果參與人能在博弈之前采取某種措施改變自己的行動空間或支付函數(shù)，使不可信的威脅變得可信，博弈的精煉均衡就會相應(yīng)改變。承諾行動能使不可信的威脅變得可信。一、動態(tài)博弈與精煉納什均衡承諾行動是指當(dāng)事人在不施行這種不可置信

18、威脅時，就會付出更大的代價。盡管這種代價不一定發(fā)生，但承諾行動會給當(dāng)事人帶來很大好處，因為它會改變均衡結(jié)果。一般說來，承諾行動的成本越高，威脅的可信度就越高。例如：破釜沉舟二、有限次重復(fù)博弈：“連鎖店之謎”如果有相同的參與人反復(fù)地進(jìn)行博弈，每個參與人面前都有出現(xiàn)新策略的可能性。如果另一個參與人在這次作出背叛的選擇，那么你就可以在下一次選擇背叛以示報復(fù)。在一個重復(fù)對策中，每一個參與人都有機(jī)會樹立合作的信譽(yù)，并以此鼓勵對方也樹立起合作的信譽(yù)。二、有限次重復(fù)博弈：“連鎖店之謎”影響均衡結(jié)果的主要因素是博弈的次數(shù)及信息的完整性。如果博弈只進(jìn)行一次，參與人只會關(guān)心一次性支付；但如果博弈重復(fù)多次，參

19、與人可能會為長期利益暫時犧牲眼前利益從而選擇不同的策略。二、有限次重復(fù)博弈連鎖店之謎40,50 -10,00,3000,300 企業(yè)B企業(yè)A高價低價市場進(jìn)入博弈進(jìn)入不進(jìn)入二、有限次重復(fù)博弈：“連鎖店之謎”囚徒困境也有類似的情況。強(qiáng)盜分金算法（類比）可以說，只要博弈重復(fù)的次數(shù)是有限的，則博弈的結(jié)果就將與一次性博弈(指對局一次)的結(jié)果相同。強(qiáng)盜分金算法：10987654321109601010101099601010101897010101079701010169801010598010149901039901210001三、無限次重復(fù)博弈：“針鋒相對(tit for tat)策略 “針鋒

20、相對”策略，即在第一局中，你采取合作(不交代)的策略，在以后的每一局中，如果你的對手在上一局采取不合作，那么你也選不合作；反之，如果他合作，那么下一局你也選合作。換句話說，如果你的對手上一局選取什么策略，你在這一局就選擇什么策略。三、無限次重復(fù)博弈：“針鋒相對(tit for tat)策略 “針鋒相對”的策略的確非常令人滿意，因為它能立即對背叛加以懲罰。另一種對策，叫“冷酷策略”。它指如果第一次對方背叛了我，我將永遠(yuǎn)對他進(jìn)行懲罰(采取不合作的策略)，絲毫不給他“贖過自新”的機(jī)會?？死灼账褂嘘P(guān)“聲譽(yù)”的觀點(diǎn)可以用來說明重復(fù)博弈導(dǎo)致帕累托有效的理論。 5.2.3 不完全信息靜態(tài)博弈貝葉斯納什均衡

21、一、不完全信息靜態(tài)博弈與逆運(yùn)算納什均衡二、古諾寡頭競爭模型：貝葉斯納什均衡應(yīng)用三、一級密封價格拍賣貝葉斯均衡應(yīng)用一、不完全信息靜態(tài)博弈與逆運(yùn)算納什均衡不完全信息博弈中，至少有一個參與人不知道其他參與人的支付函數(shù)。以市場進(jìn)入為例：對潛在進(jìn)入者企業(yè)B來說，不知道企業(yè)A的成本函數(shù)，也不知道企業(yè)A是否采取斗爭(低價)策略。在給定企業(yè)B進(jìn)入時，高成本企業(yè)的最優(yōu)選擇是高價(合作)，而低成本企業(yè)的最優(yōu)策略是低價(斗爭)。一、不完全信息靜態(tài)博弈與逆運(yùn)算納什均衡40,50 -10,00,3000,300 企業(yè)B企業(yè)A高價低價市場進(jìn)入：高成本的情況進(jìn)入不進(jìn)入一、不完全信息靜態(tài)博弈與逆運(yùn)算納什均衡30,10

22、0 -10,1400,4000,400 企業(yè)B企業(yè)A高價低價市場進(jìn)入：低成本的情況進(jìn)入不進(jìn)入一、不完全信息靜態(tài)博弈與逆運(yùn)算納什均衡因為企業(yè)B不知道企業(yè)A的成本函數(shù)，所以處于進(jìn)退兩難之境。這種情況的博弈以前人們認(rèn)為是沒法分析的，直到1966年才由海薩尼解決。他引人一個虛擬的參與人“自然”。自然不同于一般參與人之處在于它在所有后果之間是無差異的。一、不完全信息靜態(tài)博弈與逆運(yùn)算納什均衡“貝葉斯納什均衡”的概念，表述為：在靜態(tài)不完全信息博弈中，參與人同時行動，沒有機(jī)會觀察到別人的選擇。給定別人的策略選擇，每個參與人的最優(yōu)策略依賴于自己的類型。它是一種類型依從戰(zhàn)略組合：在給定自己的類型和別人類型的概率分布的情況下，每個參與人的期望效用達(dá)到了最大化，也就是說，沒有人有積極

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《戰(zhàn)略與決策》第八章博弈分析方法

文檔簡介

溫馨提示

最新文檔

評論

《戰(zhàn)略與決策》第八章博弈分析方法

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔