版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
博弈論及其應(yīng)用
GameTheorywithApplications
第二章:博弈分類
ChapterII:Classification2024/12/11覃燕紅——重慶理工大學(xué)21、博弈定義與要素I博弈定義處于互動局勢中的個體在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。六個基本要素參與人/局中人(players):互動局勢中的行為決策主體行動(actions/moves):局中人可能選擇的行為收益/支付/得益(payoff):局中人的利益或效用戰(zhàn)略(strategies):各種情形下的行動選擇方案(相機行動)信息(information):對他人類型、行為或效用的了解程度次序(order):各博弈方選擇實施行為的先后順序注:某些教材分為四要素或者五要素:參與人、行動或策略、信息、支付2024/12/11覃燕紅——重慶理工大學(xué)31、博弈定義與要素I六個基本要素均衡:確定了博弈要素后,均衡分析就成了博弈分析的主要內(nèi)容均衡是博弈的一種狀態(tài),通常用博弈各方的策略組合來描述均衡狀態(tài)下,滿足如下特征:在其他參與人堅守各自均衡策略的前提下,所有參與人都不愿意單方面改變自己的策略2024/12/11覃燕紅——重慶理工大學(xué)4一項基本假設(shè):完全理性(completerationality)追求個人最大利益——經(jīng)濟(jì)學(xué)中的經(jīng)濟(jì)人假設(shè)非常聰明——在任何情況下都知道如何追求個人最大利益一個專業(yè)術(shù)語:共同知識(commonknowledge)知道對方所知道的,并且知道對方知道自己所知道的,而且知道對方知道自己知道對方所知道的……在博弈論中,關(guān)于對方理性層次的推斷,稱為信念(belief)大量心理學(xué)實驗研究表明,普通人的推理層次不超過七層選美博弈實驗假如你和很多人一起參加一項游戲:要求每個人獨立地選擇1到100之間的任意一個整數(shù),選擇了與大家選擇的數(shù)的平均數(shù)的一半最接近的那個人將獲得一筆豐厚的獎金。面對獎金的誘惑,聰明的你會選擇哪個數(shù)?1、博弈定義與要素II2024/12/11覃燕紅——重慶理工大學(xué)52、博弈模型示例I囚徒困境(Prisoners’Dilemma)來源:普林斯頓大學(xué)的塔克(tunker)教授杜撰(上海演講)的故事梗概:兩個小偷行竊未果被抓,隔離審訊?!疤拱讖膶挘咕軓膰?yán)”:如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。坦白否?六個基本要素分別是什么?基于收益矩陣(payoffmatrix)的模型描述:-8,-80,-10-10,0-1,-1囚徒A坦白抵賴坦白抵賴囚徒B2024/12/11覃燕紅——重慶理工大學(xué)6囚徒困境(Prisoners’Dilemma)沒有實現(xiàn)兩人總體的最大利益沒有實現(xiàn)自身的個人最大利益類似:廣告商之間耗資巨大的廣告營銷戰(zhàn)、人們對公共資源的掠奪式使用、森林砍伐、實際和網(wǎng)絡(luò)上的牛皮廣告等-8,-80,-10-10,0-1,-1囚徒A坦白抵賴坦白抵賴囚徒B2、博弈模型示例I2024/12/11覃燕紅——重慶理工大學(xué)72、博弈模型示例II剪刀-石頭-布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石頭剪子布博弈方2石頭剪子布博弈方1策略相互依存不僅取決于自身的策略選擇,也取決于其他博弈方的策略選擇如果只博弈一次,輸贏主要取決于機會和運氣2024/12/11覃燕紅——重慶理工大學(xué)82、博弈模型示例III田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齊威王2024/12/11覃燕紅——重慶理工大學(xué)93、博弈結(jié)構(gòu)和分類依據(jù)I博弈中的博弈方單人博弈:就是個體最優(yōu)化問題兩人博弈雙方利益很可能不一致掌握信息多的博弈方并不一定保證利益也較多追求最大自身利益的行為,常常不能導(dǎo)致實現(xiàn)整體的最大利益,也常常不能真正實現(xiàn)個人自身的最大利益多人博弈可能存在破壞者:其策略選擇對自身利益并沒有太大影響,但卻會對其他博弈方的利益產(chǎn)生很大的甚至是決定性的影響如三個城市競選??:A城市33票、B城市29票、C城市18票,如果有11票轉(zhuǎn)向B,結(jié)果難確定,破壞者弱者的生存之道——聯(lián)吳抗曹、坐山觀虎斗2024/12/11覃燕紅——重慶理工大學(xué)103、博弈結(jié)構(gòu)和博弈依據(jù)II博弈的過程靜態(tài)博弈所有博弈方同時或可看作同時選擇策略的博弈田忌賽馬,猜硬幣,古諾模型,投標(biāo)活動,隔離審訊動態(tài)博弈各博弈方的選擇和行動有先后次序且后選擇、后行動的博弈方在自己選擇行動之前可以看到其他博弈方選擇的行動如弈棋、市場進(jìn)入、領(lǐng)導(dǎo)——追隨型市場結(jié)構(gòu)等重復(fù)博弈同一個博弈反復(fù)進(jìn)行所構(gòu)成的博弈,提供了實現(xiàn)更有效率博弈結(jié)果的新可能長期客戶、長期合同、信譽問題有限次重復(fù)博弈、無限次重復(fù)博弈2024/12/11覃燕紅——重慶理工大學(xué)113、博弈結(jié)構(gòu)和博弈依據(jù)III博弈中的策略/戰(zhàn)略(strategies)策略博弈中各博弈方的選擇內(nèi)容在靜態(tài)博弈中,策略就是行動(actions)在動態(tài)博弈中,策略是局中人各階段所選擇行動的時序集合不同博弈方之間不僅可選策略不同,而且可選策略數(shù)量也可不同有限博弈——離散情形每個博弈方的策略數(shù)都是有限的無限博弈——連續(xù)情形至少有某些博弈方的策略有無限多個2024/12/11覃燕紅——重慶理工大學(xué)123、博弈結(jié)構(gòu)和博弈依據(jù)IV博弈中的得益/收益/支付(payoffs)得益各博弈方從博弈中所獲得的利益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)零和博弈也稱為“嚴(yán)格競爭博弈”,博弈方之間利益始終是對立的,偏好通常不同如猜硬幣、田忌賽馬、石頭-剪刀-布等。常和博弈博弈方之間利益的總和為常數(shù),博弈方之間的利益是對立的且是競爭關(guān)系,如分配固定數(shù)額的獎金、利潤、遺產(chǎn)官司等。變和博弈零和博弈和常和博弈以外的所有博弈,合作利益存在,博弈效率問題的重要性,如囚徒困境、產(chǎn)量博弈、制式問題等。2024/12/11覃燕紅——重慶理工大學(xué)133、博弈結(jié)構(gòu)和博弈依據(jù)V博弈中的信息結(jié)構(gòu)完全(complete)/對稱(symmetric)信息博弈各博弈方都完全了解所有博弈方在各種情況下的得益不完全信息博弈至少部分博弈方不完全了解其他博弈方的得益,也稱為“不對稱信息博弈”完美(perfect)信息博弈每個輪到行為的博弈方對博弈的進(jìn)程完全了解不完美信息博弈至少某些博弈方在輪到行動時不完全了解此前的進(jìn)程2024/12/11覃燕紅——重慶理工大學(xué)144、博弈總體分類博弈的綜合分類非合作博弈完全理性博弈完全信息靜態(tài)博弈*完全信息動態(tài)博弈*完全且完美信息動態(tài)博弈
+
重復(fù)博弈完全且不完美信息動態(tài)博弈不完全信息靜態(tài)博弈*不完全信息動態(tài)博弈*不完全理性博弈演化博弈合作博弈2024/12/11覃燕紅——重慶理工大學(xué)154、博弈分類區(qū)分I:非合作和合作博弈博弈的分類非合作博弈強調(diào)個人理性博弈方不能達(dá)成有約束力協(xié)議的博弈該門課程主要涉及的內(nèi)容屬于非合作博弈如零和博弈、性別戰(zhàn)、斗雞博弈、囚徒困境博弈等合作博弈強調(diào)群體理性通過人與人之間的討價還價,可以制定一個具有約束力的協(xié)議進(jìn)而達(dá)成合作的實現(xiàn)。參與人之間能夠達(dá)成有約束的協(xié)議??蓚鬟f效用在合作博弈中起著至關(guān)重要的作用,該效用就像貨幣一樣如沃爾瑪和家樂福的達(dá)成可信協(xié)議,最低價承諾,具體見后。如西方國家的小費制度形成、性別戰(zhàn)的默契和習(xí)慣形成合作博弈2024/12/11覃燕紅——重慶理工大學(xué)164、博弈分類區(qū)分I:非合作和合作博弈1、性別戰(zhàn)非合作博弈:個人理性出發(fā)有2個純戰(zhàn)略納什均衡合作博弈:實際生活中,也許會形成一種默契:也許這一次看足球、下一次就看芭蕾,如此循環(huán),形成一種默契,就是合作博弈的情形2,10,00,01,2妻子韓劇足球韓劇足球丈夫4、博弈分類區(qū)分I:非合作和合作博弈2、家樂福和沃爾瑪之間的價格戰(zhàn)2024/12/11覃燕紅——重慶理工大學(xué)184、博弈分類區(qū)分I:非合作和合作博弈2、家樂福和沃爾瑪之間的價格戰(zhàn)2,29,11,96,6家樂福降價不降價降價不降價沃爾瑪非合作博弈:均衡結(jié)果(降價,降價),分別得到(2,2)顯然,(不降價,不降價)是一個帕累托效率結(jié)果,但卻不是納什均衡合作博弈:如果雙方達(dá)成可信協(xié)議,相約絕不降價;同時,家樂福和沃爾瑪都對顧客承諾,如果所售商品不是最低價(刺激購買),愿意承擔(dān)100倍賠償。這個協(xié)議肯定可信?想一想為什么?因此,這個協(xié)議是能夠自動執(zhí)行的合作博弈,從而達(dá)到結(jié)果(6,6),都改善了4。最低價承諾到底對誰有利?2024/12/11覃燕紅——重慶理工大學(xué)194、博弈分類區(qū)分I:非合作和合作博弈3、西方的小費制度4,1-4,510,-52,-1消費者給小費不給優(yōu)質(zhì)服務(wù)一般服務(wù)服務(wù)員非合作博弈:均衡結(jié)果(不給,一般服務(wù)),分別得到(2,-1)顯然,(給小費,優(yōu)質(zhì)服務(wù))是一個帕累托效率結(jié)果,但卻不是納什均衡合作博弈:歐美存在一種潛在的社會規(guī)范,即消費者應(yīng)該通過給小費的方式來表達(dá)對服務(wù)員服務(wù)的勞動尊重和感謝。盡管這不是一個正式的協(xié)議,但作為社會規(guī)范對于消費者同樣具有很強的約束力,因此,構(gòu)成一種可信的協(xié)議2024/12/11覃燕紅——重慶理工大學(xué)204、博弈分類區(qū)分II:完全理性和不完全理性完全理性:人們在決策時遵循最大化原則選擇最優(yōu)方案,謀求最大效益作為決策的主體,始終堅持理性化活動,不存在任何非理性成分。不完全理性:有限理性有限理性決策的前提是現(xiàn)實生活過于復(fù)雜,人們只能遵循滿意原則受到情感、偏好(如公平、互惠、利他)的影響中國人:不患寡,患不均;滴水之恩,涌泉相報;以牙還牙等2024/12/11覃燕紅——重慶理工大學(xué)214、博弈分類區(qū)分III:課程涉及的4種博弈類型靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡完全信息動態(tài)博弈子博弈精煉納什均衡不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡不完全信息動態(tài)博弈精煉貝葉斯納什均衡4種基本的博弈類型完全信息:每個參與人都擁有所有其他參與人的特征、策略及支付函數(shù)等方面準(zhǔn)確信息的博弈。不完全信息:非對稱信息,是指至少存在一個參與人的偏好、支付函數(shù)、策略等方面的知識是不完全的。靜態(tài)博弈:策略等于行動。動態(tài)博弈:區(qū)分策略和行動,策略是一個完備的相機行動方案,要求參與人在任何可能的決策場景都要給出行動方案。2024/12/11覃燕紅——重慶理工大學(xué)224、博弈分類區(qū)分III:課程涉及的4種博弈類型完全信息靜態(tài)博弈所有參與者同時決策,且所有參與者對其他局中人在不同條件下的策略空間和收益函數(shù)完全了解的博弈問題完全信息動態(tài)博弈每個參與者都有關(guān)于各方收益的全部知識(完全信息),但參與者的行動順序有先后(完全且完美、完全但不完美)不完全信息靜態(tài)博弈不僅至少有一個參與者不知道其他參與者的收益函數(shù),而且所有參與者進(jìn)行決策時并不知道其他參與者的策略(或者行動)不完全信息動態(tài)博弈結(jié)合不完全信息和動態(tài)博弈的概念。市場交易中普遍存在的討價還價就是不完全信息動態(tài)博弈的典型例子。了解:根據(jù)后行動者是否能夠完全了解自己行動之前的博弈過程,可以將完全信息動態(tài)博弈分為:A完全且完美信息動態(tài)博弈:所有參與者都具有自己行動之前的博弈過程的信息B完全但不完美信息動態(tài)博弈:只要有一個或一些參與人不知道行動之前的博弈過程2024/12/11覃燕紅——重慶理工大學(xué)235、特殊的博弈重復(fù)博弈Repeatedgames一種與靜態(tài)博弈和動態(tài)博弈都有密切關(guān)系的博弈重復(fù)進(jìn)行某個博弈構(gòu)成的博弈過程構(gòu)成重復(fù)博弈的一次性博弈(one-shotgames),也稱為“原博弈”或者“階段博弈”不能把重復(fù)博弈割裂為一次一次的獨立博弈進(jìn)行分析,必須作為整體進(jìn)行研究重復(fù)博弈是特殊的動態(tài)博弈,原博弈大多為靜態(tài)博弈如果參與人足夠耐心,且當(dāng)前行為對未來有顯著的影響,那么對未來的期許可能會導(dǎo)致當(dāng)前博弈選擇“不那么理性”的行動。如體育競技中的多局制、商業(yè)中的回頭客、企業(yè)之間的長期合作或者競爭等課后習(xí)題
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 花束插畫課程設(shè)計
- 軸的課程設(shè)計怎么做
- 二零二五年度板材行業(yè)節(jié)能減排合作協(xié)議3篇
- 二零二五年度房地產(chǎn)預(yù)告抵押債務(wù)重組合同3篇
- 電儀車間設(shè)備巡檢管理制度(4篇)
- 線上攝影課程設(shè)計
- 二零二五年度家具安裝與環(huán)保材料認(rèn)證服務(wù)協(xié)議3篇
- 事故應(yīng)急救援與演練制度模版(2篇)
- 2025年度E管材供應(yīng)鏈金融合作合同2篇
- 二零二五年度抗震鋼筋工施工承包合同6篇
- 經(jīng)鼻腸梗阻導(dǎo)管護(hù)理課件
- 職業(yè)暴露處理方法與報告流程圖
- 蘇教版一年級上冊《科學(xué)》期末知識點匯總 重點知識梳理 總復(fù)習(xí)【版 】課件
- 青島版小學(xué)科學(xué)三年級下冊課程綱要
- 目標(biāo)、計劃與行動課件
- 動態(tài)變形模量Evd試驗記錄
- 2020-2021學(xué)年浙江省溫州市八年級(上)期末數(shù)學(xué)試卷(附答案詳解)
- 蔬菜籽種采購清單
- 工期定額-民用建筑
- 低壓電能表安裝作業(yè)指導(dǎo)書
- 能見度不良時船舶航行須知
評論
0/150
提交評論