第10章_博弈論初步_第1頁
第10章_博弈論初步_第2頁
第10章_博弈論初步_第3頁
第10章_博弈論初步_第4頁
第10章_博弈論初步_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、12博弈論引例博弈論引例“囚徒困境囚徒困境” 警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指證他們的罪行。如果其中至少一人供認犯罪,就能確認罪名成證他們的罪行。如果其中至少一人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押并給他立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押并給他們同樣的選擇機會:如果他們兩人都拒不認罪,則因缺乏證據(jù),們同樣的選擇機會:如果他們兩人都拒不認罪,則因缺乏證據(jù),他們會被以較輕的妨礙公務罪各判他們會被以較輕的妨礙公務罪各判2年徒刑;如果他們兩人中有年徒刑;如果他們兩人中有一人坦白認罪,則

2、坦白者從輕處理,立即釋放,而另一人則將一人坦白認罪,則坦白者從輕處理,立即釋放,而另一人則將重判重判10年徒刑;如果兩人同時認罪,則他們將各判年徒刑;如果兩人同時認罪,則他們將各判4年徒刑。年徒刑。 囚徒囚徒2 坦白坦白 不坦白不坦白 坦白坦白 -4,-4 0,-10囚徒囚徒1 不坦白不坦白 -10,0 -2,-24 5 。 6 最后,讓我們做一個游戲,來測試一下最后,讓我們做一個游戲,來測試一下你的博弈思維能力。你的博弈思維能力。 要過年了,公司要要過年了,公司要發(fā)年終獎,作為老板,你論功行賞。你發(fā)年終獎,作為老板,你論功行賞。你給每位員工一個信封,并告訴他們:每給每位員工一個信封,并告訴他

3、們:每個信封里面都有一張撲克牌,如果里面?zhèn)€信封里面都有一張撲克牌,如果里面裝著裝著1,就可以去領,就可以去領1000元獎金,是元獎金,是2則則可以領可以領2000元,依此類推,是元,依此類推,是K就可以就可以領領13000元,元,“小王小王”可以領可以領15000元,元,“大王大王”則是則是20000元元7 同時,你還告訴他們:拆開信封后,里同時,你還告訴他們:拆開信封后,里面的撲克牌只能自己看,不能告訴別人。面的撲克牌只能自己看,不能告訴別人。如果對自己的撲克牌(年終獎數(shù)額)不如果對自己的撲克牌(年終獎數(shù)額)不滿意,大家可以相互自由交換,但交換滿意,大家可以相互自由交換,但交換前還是不能讓對

4、方知道自己的撲克牌是前還是不能讓對方知道自己的撲克牌是什么。什么。 問題是:會有多少人能成功與別問題是:會有多少人能成功與別人交換撲克牌,改變自己的年終獎數(shù)額?人交換撲克牌,改變自己的年終獎數(shù)額?8 答案是:一個都不會成功。答案是:一個都不會成功。 讓我們同樣讓我們同樣用用“向前展望,倒后推理向前展望,倒后推理”的辦法來分的辦法來分析一下這個博弈:析一下這個博弈: 對于拿到對于拿到“大王大王”的的人來說(估計你會把這張牌給功勞最大人來說(估計你會把這張牌給功勞最大的副總經(jīng)理),他有交換和不交換兩種的副總經(jīng)理),他有交換和不交換兩種選擇,但他知道沒什么牌比選擇,但他知道沒什么牌比“大王大王”更更

5、大,和誰交換都不合算,因此,不交換大,和誰交換都不合算,因此,不交換是是“大王大王”的占優(yōu)策略。的占優(yōu)策略。 拿到拿到“小王小王”的人知道,除了的人知道,除了“大王大王”,他和誰交換,他和誰交換都不合算,而都不合算,而“大王大王”又不可能和其他又不可能和其他人交換,因此,人交換,因此,“小王小王”的占優(yōu)策略也的占優(yōu)策略也是不交換。是不交換。9 對于拿到對于拿到K的人來說,除了的人來說,除了“大王大王”和和“小王小王”,和其他任何人交換都不合算,和其他任何人交換都不合算,而可想而知,而可想而知,“大王大王”和和“小王小王”肯定肯定不會出來交換,因此,不會出來交換,因此,“K”的占優(yōu)策略的占優(yōu)策略

6、也是不交換。也是不交換。 依此類推,連拿到依此類推,連拿到2的人也明白,即使拿的人也明白,即使拿3的人也肯定不會出的人也肯定不會出來交換,因此,來交換,因此,“2”的占優(yōu)策略也是不的占優(yōu)策略也是不交換。交換。 最后,敢出來與別人交換年終獎最后,敢出來與別人交換年終獎的肯定是那些拿的肯定是那些拿“1”的人。的人。 既然大家的既然大家的年終獎都是最少的年終獎都是最少的1000元,還交換它干元,還交換它干什么?什么? 這種原理,博弈論稱之為這種原理,博弈論稱之為“逆向逆向選擇選擇”。10從游戲到博弈從游戲到博弈博弈就是博弈就是策略對抗策略對抗,或策略有關(guān)鍵作用的游戲,或策略有關(guān)鍵作用的游戲 博弈Ga

7、me,博弈論Game Theory,Game即游戲、競技 游戲和經(jīng)濟等決策,具有競爭較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用游戲游戲下棋、猜大小、石頭剪刀布下棋、猜大小、石頭剪刀布經(jīng)濟經(jīng)濟寡頭產(chǎn)量決策、市場阻入、投標拍賣(新娘拍賣)、股票市場寡頭產(chǎn)量決策、市場阻入、投標拍賣(新娘拍賣)、股票市場政治政治兩黨政治、多黨政治、政黨聯(lián)盟兩黨政治、多黨政治、政黨聯(lián)盟軍事軍事美國和伊拉克、印巴危機、以色列和巴勒斯坦、臺海兩岸(反分裂)美國和伊拉克、印巴危機、以色列和巴勒斯坦、臺海兩岸(反分裂)娛樂娛樂選美選美其他其他婚姻市場婚姻市場12 博弈論與最優(yōu)化理論是不同的決策理論

8、。 最優(yōu)化理論; 博弈論。13 一個所謂博弈(一個所謂博弈(Game/游戲)至少需要三個要素:游戲)至少需要三個要素:(1)參與者參與者。就是在博弈中進行決策的個體;就是在博弈中進行決策的個體;博博弈分析假定參與者都是理性的。弈分析假定參與者都是理性的。(2)參與人的策略參與人的策略,指的是一項規(guī)則,根據(jù)該規(guī)指的是一項規(guī)則,根據(jù)該規(guī)則,參與人在博弈的每一時點上選擇如何行動則,參與人在博弈的每一時點上選擇如何行動;(3)支付(或結(jié)果):支付(或結(jié)果):有可評價優(yōu)劣的博弈結(jié)果有可評價優(yōu)劣的博弈結(jié)果(效用)。博弈論用數(shù)字表示這類結(jié)果,并稱之(效用)。博弈論用數(shù)字表示這類結(jié)果,并稱之為為支付支付(Pa

9、yoff).2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)14博弈的簡單分類博弈的簡單分類 根據(jù)參與人的數(shù)量,可以分為二人博弈根據(jù)參與人的數(shù)量,可以分為二人博弈和多人博弈;根據(jù)參與人的支付情況,可分和多人博弈;根據(jù)參與人的支付情況,可分為零和博弈和非零和博弈;根據(jù)參與人擁有為零和博弈和非零和博弈;根據(jù)參與人擁有的策略的數(shù)量多少,可分為有限博弈和無限的策略的數(shù)量多少,可分為有限博弈和無限博弈;根據(jù)參與人在實施策略上是否有時間博弈;根據(jù)參與人在實施策略上是否有時間的先后,可分為同時博弈和序貫博弈。的先后,可分為同時博弈和序貫博弈。 博弈樹:序貫博弈 例:拋幣游戲。甲乙兩小孩拋硬幣,甲先拋

10、,乙后拋。若硬幣同面,甲贏乙一個硬幣,如硬幣異面,甲輸乙一個硬幣。甲甲正正反反乙乙乙乙正正正正反反反反(1,-1)(1,-1)(-1,1)(-1,1)圖107 競爭者壟斷者博弈2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)1617支付矩陣(支付矩陣(Payoff Matrix,又稱收益矩陣等),又稱收益矩陣等)描述一個博弈結(jié)構(gòu)。下面的支付矩陣中,描述一個博弈結(jié)構(gòu)。下面的支付矩陣中,兩個參兩個參與者與者甲甲和和乙乙各自可以選擇兩種策略;數(shù)字表示雙各自可以選擇兩種策略;數(shù)字表示雙方在不同策略選擇組合下得到的支付,較大數(shù)字方在不同策略選擇組合下得到的支付,較大數(shù)字代表較大利益。代表較大利益

11、。 寡頭間的價格競爭寡頭間的價格競爭 乙廠商策略乙廠商策略合作不合作甲廠商策略甲廠商策略合作5,61,5不合作7,12,3甲廠商的甲廠商的條件策略和條件策略組合條件策略和條件策略組合2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)181. .博弈均衡的概念博弈均衡的概念 當兩個廠商的條件策略組合恰好相當兩個廠商的條件策略組合恰好相同,同,從而,兩個廠商都不再有單獨改變從而,兩個廠商都不再有單獨改變策略的傾向時,整個博弈就達到了均衡,策略的傾向時,整個博弈就達到了均衡,即博弈均衡。即博弈均衡。 博弈均衡是博弈各方最終選取的策博弈均衡是博弈各方最終選取的策略組合,是博弈的最終結(jié)果,是博弈的

12、略組合,是博弈的最終結(jié)果,是博弈的解。解。納什均衡納什均衡2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)192. .對納什均衡的理解對納什均衡的理解 一是一是“單獨改變策略單獨改變策略”是指任何一個參是指任何一個參與人在所有其他人都不改變策略的情況下改與人在所有其他人都不改變策略的情況下改變自己的策略。其他人也同時改變策略的情變自己的策略。其他人也同時改變策略的情況不在考慮之列。況不在考慮之列。 二是二是“不會得到好處不會得到好處” 是指任何一個參是指任何一個參與人在單獨改變策略之后自己的支付不會增與人在單獨改變策略之后自己的支付不會增加,這包括兩種情況:或者支付減少,或者加,這包括

13、兩種情況:或者支付減少,或者支付不變。支付不變。2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)201. .基本方法基本方法 先用下劃線法分別表示甲廠商和乙廠商先用下劃線法分別表示甲廠商和乙廠商的條件策略,最后確定博弈的均衡的條件策略,最后確定博弈的均衡(就是就是找找到在兩個數(shù)字之下都劃線的單元格即可,與到在兩個數(shù)字之下都劃線的單元格即可,與這些單元格相對應的策略組合就是所要求的這些單元格相對應的策略組合就是所要求的均衡策略組合均衡策略組合)。五、尋找五、尋找納什均衡的方法納什均衡的方法條件策略下條件策略下劃線法劃線法2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)212. .

14、條件策略下劃線條件策略下劃線方法的方法的五步法五步法第一,第一,把整個的支付矩陣分解為甲廠商的支把整個的支付矩陣分解為甲廠商的支付矩陣和乙廠商的支付矩陣付矩陣和乙廠商的支付矩陣五、尋找五、尋找納什均衡的方法納什均衡的方法條件策略下劃線法條件策略下劃線法2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)22第十章第十章 博弈論初步博弈論初步第二節(jié)第二節(jié) 同時博弈:純策略均衡同時博弈:純策略均衡2. .條件策略下劃線條件策略下劃線方法的五步法方法的五步法第二,第二,在甲廠商的支付矩陣中,找出在甲廠商的支付矩陣中,找出每一列每一列的最大者(每列的最大者可能不只一個),的最大者(每列的最大者可能

15、不只一個),并在其下劃線并在其下劃線五、尋找納什均衡的方法條件策略下劃線法2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)23第十章第十章 博弈論初步博弈論初步第二節(jié)第二節(jié) 同時博弈:純策略均衡同時博弈:純策略均衡2.2.條件策略下劃線方法的五步法條件策略下劃線方法的五步法第三,第三,在乙廠商的支付矩陣中,找出在乙廠商的支付矩陣中,找出每一行每一行的最大者(每行的最大者也可能不只一個),的最大者(每行的最大者也可能不只一個),并在其下劃線并在其下劃線五、尋找納什均衡的方法條件策略下劃線法2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)24第十章第十章 博弈論初步博弈論初步第二節(jié)

16、第二節(jié) 同時博弈:純策略均衡同時博弈:純策略均衡2.2.條件策略下劃線方法的五步法條件策略下劃線方法的五步法第四,將已經(jīng)劃好線的甲廠商的支付矩陣和第四,將已經(jīng)劃好線的甲廠商的支付矩陣和乙廠商的支付矩陣再合并起來,得到整個的乙廠商的支付矩陣再合并起來,得到整個的有下劃線的支付矩陣有下劃線的支付矩陣五、尋找納什均衡的方法條件策略下劃線法2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)25第十章第十章 博弈論初步博弈論初步第二節(jié)第二節(jié) 同時博弈:純策略均衡同時博弈:純策略均衡2.2.條件策略下劃線方法的五步法條件策略下劃線方法的五步法第五,在帶有下劃線的整個的支付矩陣中,第五,在帶有下劃線的

17、整個的支付矩陣中,找到兩個數(shù)字之下均劃有線的支付組合,則找到兩個數(shù)字之下均劃有線的支付組合,則由該支付組合代表的策略組合就是均衡的策由該支付組合代表的策略組合就是均衡的策略組合略組合五、尋找納什均衡的方法條件策略下劃線法2022年4月25日星期一制作者:張昌廷(河北經(jīng)貿(mào)大學)263. .總結(jié)總結(jié) 在一個單元格中,如果兩個數(shù)字之下均劃有線,在一個單元格中,如果兩個數(shù)字之下均劃有線,則兩個參與人都沒有單獨改變策略的動機,因為這兩則兩個參與人都沒有單獨改變策略的動機,因為這兩個數(shù)字分別是列最大值和行最大值;如果兩個數(shù)字之個數(shù)字分別是列最大值和行最大值;如果兩個數(shù)字之下均沒有線,則兩個參與人都有單獨改

18、變策略的動機,下均沒有線,則兩個參與人都有單獨改變策略的動機,因為這兩個數(shù)字分別不是列最大值和行最大值;如果因為這兩個數(shù)字分別不是列最大值和行最大值;如果兩個數(shù)字中一個下面有線一個下面沒線,則有線的數(shù)兩個數(shù)字中一個下面有線一個下面沒線,則有線的數(shù)字所代表的參與人沒有單獨改變策略的動機,沒線的字所代表的參與人沒有單獨改變策略的動機,沒線的數(shù)字所代表的參與人有單獨改變策略的動機。數(shù)字所代表的參與人有單獨改變策略的動機。五、尋找五、尋找納什均衡的方法納什均衡的方法條件策略下劃線法條件策略下劃線法27 (1)納什均衡的存在性)納什均衡的存在性:在同時博弈中,:在同時博弈中,(純策略)納什均衡可能存在,

19、也可能不存在(純策略)納什均衡可能存在,也可能不存在 案例案例1:沒有納什均衡的同時博弈沒有納什均衡的同時博弈B廠商策略廠商策略左右A廠商策略廠商策略上4,69,1下7,32,828 (2)納什均衡的唯一性:)納什均衡的唯一性:如果納什均衡存如果納什均衡存在,那么,均衡可能是一個,也可能是多個在,那么,均衡可能是一個,也可能是多個 案例案例1:智豬博弈智豬博弈小豬策略:小豬策略:等待等待 智豬博弈智豬博弈 豬圈里有兩頭豬,一頭大豬,一頭小豬,采用豬圈里有兩頭豬,一頭大豬,一頭小豬,采用自動喂養(yǎng),豬圈一頭有一個豬食槽,按鈕在另自動喂養(yǎng),豬圈一頭有一個豬食槽,按鈕在另一頭,控制豬食,按一下會有一頭

20、,控制豬食,按一下會有10個豬食進槽,個豬食進槽,但按的成本為但按的成本為2,若大豬先到,可吃,若大豬先到,可吃9個食,小個食,小豬吃豬吃1個;若同時到,大個;若同時到,大7小小3;若小豬先到,;若小豬先到,大大6小小4。 納什均衡:大豬按,小豬等待,小豬搭便車 智豬博弈的其他含義。 “小豬躺著大豬跑小豬躺著大豬跑”的現(xiàn)象是由于故的現(xiàn)象是由于故事中的事中的游戲規(guī)則游戲規(guī)則所導致的。規(guī)則的核心所導致的。規(guī)則的核心指標是:每次落下的事物數(shù)量和踏板與指標是:每次落下的事物數(shù)量和踏板與投食口之間的距離。投食口之間的距離。 如果改變一下核心指標,豬圈里還如果改變一下核心指標,豬圈里還會出現(xiàn)同樣的會出現(xiàn)同

21、樣的“小豬躺著大豬跑小豬躺著大豬跑”的景的景象嗎?試試看。象嗎?試試看。 30 改變方案:減量方案;增量方案。減量改變方案:減量方案;增量方案。減量加移位方案。投食僅原來的一半分量,加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地搶著踩踏板。等小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收待者不得食,而多勞者多得。每次的收獲剛好消費完。獲剛好消費完。 3132(3)納什均衡的最優(yōu)性:)納什均衡的最優(yōu)性:如果納什均衡存如果納什均衡存在,那么,可能是最優(yōu)的,也可能不是在,那么,可能是最優(yōu)的,也可能不

22、是寡頭價格聯(lián)盟寡頭價格聯(lián)盟的不穩(wěn)定性:的不穩(wěn)定性:每個成員都有每個成員都有強烈的降價獲強烈的降價獲利沖動利沖動3334 例:看芭蕾舞還是球賽?周末,壯壯喜歡去看例:看芭蕾舞還是球賽?周末,壯壯喜歡去看球賽,而他的女朋友麗麗喜歡看芭蕾舞,具體球賽,而他的女朋友麗麗喜歡看芭蕾舞,具體支付如下圖,哪個是最優(yōu)策略?支付如下圖,哪個是最優(yōu)策略?36芭芭蕾蕾足球足球男男 1, 2 -1, -10, 0 2, 1芭蕾芭蕾足球足球女女芭蕾芭蕾足球足球女女二、序貫博弈:二、序貫博弈:情侶博弈(情侶博弈(1)男方先選男方先選博弈均衡:足球博弈均衡:足球37芭芭蕾蕾足球足球女女 2, 1 -1, -10, 0 1

23、2芭蕾芭蕾足球足球男男芭蕾芭蕾足球足球男男情侶博弈(情侶博弈(2)女方先選女方先選博弈均衡:芭蕾博弈均衡:芭蕾38 支付矩陣分析:支付矩陣分析:情侶博弈情侶博弈女女足球足球芭蕾芭蕾教材第教材第314頁頁女女足球芭蕾男男足球2,10,0芭蕾-1,-11,2策略:策略:先下先下手為強手為強 納稅檢查 假定稅務機關(guān)的檢查成本10,納稅人應稅額為20,如果查到逃稅,罰款為兩倍。 結(jié)果不確定:納稅機關(guān)和納稅人均沒有上策 還取決于納稅機關(guān)的檢查概率,比如稅收機關(guān)的檢查概率是20%,納稅人會選擇逃稅(-60*20%-20),稅收機關(guān)會檢查;如果概率是50%,納稅人會選擇納稅(-60*50%-20),稅收機關(guān)選擇不檢查。40教材第教材第299頁頁B廠商策略廠商策略q1=0.3q2=0.7左右A廠商策略廠商策略p1=0.6上4,69,1p2=0.4下7,32,841 如果:如果:A、B廠商的廠商的混合策略混合策略分別是分別是(0.6,0.4)和()和(0.3,0.7),), 那么:它們的組合可以記做(那么:它們的組合可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論