第六章 博弈論_第1頁
第六章 博弈論_第2頁
第六章 博弈論_第3頁
第六章 博弈論_第4頁
第六章 博弈論_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章博弈論1

博弈論用來分析所觀察到的決策主體相互影響時的現(xiàn)象,在給定的條件下尋求最優(yōu)的解決辦法。本章主要介紹博弈論的基本概念,簡單案例分析。2一、博弈論概述

博弈論:用來分析所觀察到的決策主體相互影響時的現(xiàn)象,在給定的條件下尋求最優(yōu)的解決辦法。1、博弈論的發(fā)展

20世紀40年代博弈論思想體系初步建立,經(jīng)過50年代的理論發(fā)展,博弈論在60年代逐步走向成熟。20世紀70年代中后期以后,隨著博弈論在經(jīng)濟分析領(lǐng)域內(nèi)的廣泛和成功應(yīng)用,博弈論也逐步進入主流經(jīng)濟學的體系。3(1)博弈論的發(fā)展1944年,由馮?諾依曼和摩根斯坦恩合著的《博弈論和經(jīng)濟行為》一書的出版標志著現(xiàn)代博弈論作為一種系統(tǒng)理論的創(chuàng)立。20世紀50年代,納什創(chuàng)立了公理化的討價還價理論,證明納什討價還價解的存在性,逐漸形成了以納什非合作博弈理論為核心的現(xiàn)代博弈論體系。20世紀60年代以后,澤爾滕在納什的研究基礎(chǔ)上引入動態(tài)分析,海薩尼則把不完全信息引入到博弈論中。20世紀70年代以后,經(jīng)濟學家開始強調(diào)個人理性。4(2)博弈論與主流經(jīng)濟學博弈論進入主流經(jīng)濟學,反映了經(jīng)濟學發(fā)展的以下幾個趨勢:①經(jīng)濟學研究的對象越來越轉(zhuǎn)向個體,放棄了一些沒有微觀基礎(chǔ)的假定;②經(jīng)濟學越來越轉(zhuǎn)向人與人之間競爭與合作的研究,特別是經(jīng)濟學注意到理性人的個人理性行為可能導致的集體非理性;③經(jīng)濟學越來越重視對信息的研究。博弈可以劃分為合作博弈和非合作博弈。合作博弈與非合作博弈之間的區(qū)別主要在于人們的行為相互作用時,當事人能否達成一個具有約束力的協(xié)議。如果能,就是合作博弈;反之,則是非合作博弈。52、博弈的要素

博弈的要素包括參與人、行動、信息、策略、支付、結(jié)果和均衡,其中,參與人、策略和支付是描述一個博弈所需要的最基本的要素,參與人、行動和結(jié)果統(tǒng)稱為博弈規(guī)則。①參與人:指一個博弈中的決策主體在囚徒困境模型中,有兩個參與人,即“囚徒A”和“囚徒B”。②行動:是參與人在博弈的某個時點的決策變量。在囚徒困境模型中,囚徒A、B都只有兩種行動可供選擇,即“坦白”和“抵賴”。6

③信息是參與人在博弈中的知識,特別是有關(guān)其他參與人(對手)的特征和行動的知識。在囚徒困境模型中,兩囚徒的信息是都知道自己和另一囚徒在選擇坦白和抵賴的不同組合時面對的處罰。④策略:是參與人在擁有既定信息情況下的行動規(guī)則,它規(guī)定參與人在什么時候選擇什么行動。一個參與人的所有可選擇的策略的集合就是這個參與人的策略空間。如果每個參與人選擇一個策略,就構(gòu)成一個策略組合。⑤支付:在博弈論中指一個特定策略組合下參與人得到的確定效用水平,或者是指參與人得到的期望效用7水平。支付是博弈參與人真正關(guān)心的東西。在一個策略組合下,所有參與者的支付就構(gòu)成了一個支付組合。在囚徒困境模型中,如果兩囚徒的策略組合為(抵賴,坦白),那么囚徒A的支付為-10,囚徒B的支付為0,兩囚徒的支付組合為(-10,0);如果兩囚徒的策略組合為(坦白,坦白),那么囚徒A和囚徒B的支付均為-8,兩囚徒的支付組合為(-8,-8)。⑥結(jié)果:是博弈分析者感興趣的所有東西,如均衡策略組合、均衡支付組合等。⑦均衡:是所有參與人的最優(yōu)策略的組合。8二、博弈分析舉例⒈沙灘上的飲料銷售商為了爭取更多的游客,兩家銷售商的銷售位置又會開始向中點移動,最終都將銷售位置定在了中點處。圖10-1博弈分析舉例:沙灘上的飲料銷售商Ⅰ兩家銷售商的初始位置AB1/43/41/21/2Ⅱ銷售商A的位置移動AB3/83/49/167/161/29/16Ⅲ銷售商B的位置移動AB3/85/81/21/21/2Ⅳ兩家銷售商的最終位置A、B1×1/21/29⒉擲幣游戲A、B兩個小孩玩擲幣游戲,兩人各拿出一枚硬幣拋擲在地面上,要么正面朝上,要么反面朝上。①都同為正面或反面朝上,A贏得B一枚硬幣;②一正面一反面朝上,A輸給B一枚硬幣。這個例子中,兩個小孩各自得到的結(jié)果(贏得一枚硬幣或者輸?shù)粢幻队矌牛?,不僅取決于自己擲幣的后果,也取決于對手擲幣的后果,雙方?jīng)Q策的互相影響構(gòu)成博弈。在這個博弈中,一方所得正是其他方所失,這種博弈稱為零和博弈。10⒊囚徒困境囚徒困境講的是兩個嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里審訊。表10-1給出了囚徒困境模型的表述。每個囚徒都有兩種選擇:坦白或抵賴。表中每一格的兩個數(shù)字代表對應(yīng)兩個囚徒選擇組合下各自的刑期。

囚徒B囚徒A

坦白

抵賴

坦白

-8,-8

-1,-10

抵賴

-10,-1

-2,-211

最終,A,B都會現(xiàn)在“坦白”的占優(yōu)戰(zhàn)略,并不出現(xiàn)“兩人都抵賴”的最優(yōu)戰(zhàn)略。個人理性與團體利益的沖突,“經(jīng)濟人”假設(shè)遇到挑戰(zhàn)!12三、博弈的分類表2博弈的分類及對應(yīng)的均衡概念不完全信息動態(tài)博弈精煉貝葉斯納什均衡不完全信息靜態(tài)博弈貝葉斯納什均衡不完全信息完全信息動態(tài)博弈子博弈精煉納什均衡完全信息靜態(tài)博弈納什均衡完全信息動態(tài)靜態(tài)行動順序信息13二、完全信息靜態(tài)博弈

每一個參與人對所有其他參與人(對手)的特征、策略空間及支付函數(shù)有準確的知識,而且博弈的參與人同時選擇行動或雖非同時但后行動者并不知道前行動者采取了什么具體行動,這種情況下參與人的決策就是完全信息靜態(tài)博弈。納什對非合作博弈的主要貢獻是在一般的意義上定義了非合作博弈及其均衡解,并證明了均衡解的存在,這一均衡就被稱為“納什均衡”。14

博弈可以采用兩種不同的方式來表述,一種是策略式表述,一種是擴展式表述。從理論上講,這兩種表述形式幾乎是完全等價的,但策略式表述更適合于分析靜態(tài)博弈,擴展式表述更適合于分析動態(tài)博弈。1、博弈的策略式表述(1)策略式表述n個參與人;說明每個參與人都有哪些策略;每個參與人都選定一種策略時,每個參與人的支付水平(獲得的效用)是多少。根據(jù)上面給出的三要素,策略式表述的博弈就是:15表10-3擲幣游戲1,-1-1,1反面-1,11,-1正面小孩A反面正面小孩B⒉策略式表述的博弈舉例在擲幣游戲中,每個參與人的支付直接用其贏得或輸?shù)舻挠矌艛?shù)量來表示:贏得一枚硬幣的支付為1,輸?shù)粢幻队矌诺闹Ц稙?1。擲幣游戲的支付矩陣見表10-3所示。16表10-4斗雞博弈-1,-10,2撤退2,0-3,-3進攻公雞A撤退進攻公雞B

再如下面的斗雞博弈。試想有兩只公雞遇到一起,每只公雞有兩個行動選擇:一是進攻,一是撤退。如果一只公雞撤退,一只公雞進攻,則進攻的公雞獲得勝利,撤退的公雞很丟面子;如果兩只公雞都撤退則打個平手;如果兩只公雞都進攻,那么兩敗俱傷。設(shè)其支付矩陣見表10-4所示。17二、納什均衡⒈占優(yōu)策略均衡不論其他參與人選擇什么策略,他的最優(yōu)策略是唯一的,這樣的最優(yōu)策略被稱為占優(yōu)策略。在“囚徒困境”的例子中,每個囚徒都有兩種可選擇的策略:坦白或抵賴。但是,不論另一囚徒選擇什么策略,每個囚徒的最優(yōu)策略是“坦白”。所有參與人占優(yōu)策略的組合稱為占優(yōu)策略均衡。18⒉重復剔除的占優(yōu)均衡考慮“智豬博弈”例子。豬圈里圍著兩頭豬,一頭大豬,一頭小豬。豬圈的一頭有一個豬槽,另一頭安裝了一個按鈕,控制著豬食的供應(yīng)。按下一按鈕會有8個單位的豬食進槽,但按下按鈕的豬需要付出2個單位的成本。若大豬先到,大豬吃到7個單位,小豬只能吃1個單位;若同時到,大豬吃5個單位,小豬吃3個單位;若小豬先到,大豬和小豬各吃4個單位。表10-5的Ⅰ表列出對應(yīng)不同策略組合的支付水平,如第一格表示兩頭豬同時按下按鈕,就會同時走到豬食槽,大豬吃5個單位,小豬吃3個,扣除2個單位的成本,支付水平分別為3和1。19表10-5智豬博弈與重復剔除的占優(yōu)均衡0,07,-1等待2,43,1按大豬A等待按小豬BⅠ智豬博弈的支付矩陣0,0等待2,4按大豬A等待小豬BⅡ剔出小豬劣策略的支付矩陣2,4按大豬A等待小豬BⅢ再剔出大豬劣策略的支付矩陣20⒊納什均衡如果重復剔除劣策略后剩下的策略

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論