




已閱讀5頁(yè),還剩155頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
正 大 光 明 公 正 無(wú) 私 1 博 弈 論 the Theory of Games css 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 2 主要內(nèi)容 一、博弈現(xiàn)象及基本概念 二、完全信息靜態(tài)博弈 三、完全信息動(dòng)態(tài)博弈 四、不完全信息靜態(tài)博弈 五、不完全信息動(dòng)態(tài)博弈 六、不完全信息專(zhuān)題 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 3 主要參考書(shū) (1) 姚國(guó)慶: 博弈論 , 高等教育出版社 , 2007. (2) 羅云峰: 博弈論教程 , 清華大學(xué)出版社 、 北京交通大學(xué)出版社 。 (3) 張維迎: 博弈論與信息經(jīng)濟(jì)學(xué) , 上海三聯(lián)書(shū)店 , 上海人民出版社 , 2004。 (4) 施錫銓 , 博弈論 , 上海財(cái)經(jīng)大學(xué)出版社 ,2002。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 4 (5) 張守一 , 現(xiàn)代經(jīng)濟(jì)對(duì)策論 , 高等教育出版社 ,1998。 (6) 錢(qián)頌迪 , 運(yùn)籌學(xué) , 清華大學(xué)出版社 , 1996。 (7) 美 艾里克 .拉斯繆森: 博弈與信息 , 北京大學(xué)出版社 , 2003。 (8) 美 弗登博格: 博弈論 , 中國(guó)人民大學(xué)出版社 , 2002。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 5 第一講 博弈現(xiàn)象與基本概念 1博弈現(xiàn)象 2. 博弈概念 3. 博弈描述 4. 博弈練習(xí) 5. 關(guān)于博弈論 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 6 1博弈現(xiàn)象 田忌賽馬: 正確的策略可以反敗為勝 。 囚徒困境: 認(rèn)罪 不認(rèn)罪 認(rèn)罪 ( -5,-5) ( 0,-10) 不認(rèn)罪 ( -10,0) ( -1,-1) 甲 乙 理性的人是自私自利的; 理性選擇不是全局最優(yōu)。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 7 經(jīng)濟(jì)合作: 合作 欺騙 合作 ( 2,2) ( -2,4) 欺騙 ( 4,-2) ( 0,0) 甲 乙 誠(chéng)信的價(jià)值; 一報(bào)還一報(bào)策略; 人類(lèi)生存環(huán)境啟示。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 8 長(zhǎng)街上的超市 ( 海灘占位模型 ) 0 1/2 3/4 1 1/4 A O 資源浪費(fèi)還是理性的必然? 其它相似情形: 旅行社的熱門(mén)路線;黃金時(shí)間的電視節(jié)目;總統(tǒng)競(jìng)選。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 9 狩獵與投資 狩獵: 兩個(gè)獵人圍住一頭鹿 , 各卡住兩個(gè)關(guān)口中的一個(gè) , 齊心協(xié)力即可成功獲得并平分獵物 。 此時(shí)有一群兔子跑過(guò) , 任何一人去抓兔子必可成功 ,但鹿會(huì)跑掉 。 他們會(huì)堅(jiān)持獵鹿還是去抓兔子 ? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 10 共同投資: 雙方共同投資一個(gè)大項(xiàng)目 , 可期望有較大收益 。 此時(shí)如某方抽出資金去進(jìn)行小項(xiàng)目投資 ,必可成功獲小利 , 但會(huì)使共同項(xiàng)目陷入困境 ,使對(duì)方蒙受損失 。 投資者會(huì)如何選擇 ? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 11 旅行者困境 兩個(gè)旅行者花瓶被摔壞 , 向航空公司索賠 。航空公司知道價(jià)格約為八九十元 , 但不知道確切價(jià)格 。 于是請(qǐng)兩位旅客在 100元以內(nèi)自己寫(xiě)下花瓶的價(jià)格 。 如兩人寫(xiě)的一樣 , 就認(rèn)為他們講真話 , 并按所寫(xiě)數(shù)額賠償;如果兩人寫(xiě)的不一樣 , 就認(rèn)定低者講真話 , 并照此價(jià)格賠償 。 同時(shí) , 對(duì)講真話的旅客獎(jiǎng)勵(lì) 2元錢(qián) , 對(duì)講假話的旅客罰款 2元 。 理性原則下 , 他們會(huì)寫(xiě)多少價(jià)格呢 ? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 12 什么是博弈: 個(gè)人或團(tuán)體間在依存和對(duì)抗、合作和沖突中的決策問(wèn)題。 博弈論研究博弈過(guò)程中的理性行為。 2. 博弈概念 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 13 如何理解理性行為: 自身利益最大; 持續(xù)地有意圖的行動(dòng); 不對(duì)動(dòng)機(jī)妄加猜測(cè); 不考慮道德問(wèn)題; 只研究合法問(wèn)題; 盈利函數(shù)有多重標(biāo)準(zhǔn)。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 14 博弈三要素 局中人 (參與人) players: 決策主體 ; 自然人、團(tuán)體或“虛擬局中人”; 有可供選擇的策略和明確定義的利益函數(shù); 分為兩人和多人 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 15 策略(戰(zhàn)略) strategies: 采取行動(dòng)的規(guī)則; 可以是一次行動(dòng)也可以是一個(gè)行動(dòng)序列; 可以是純策略也可以是混合策略; 分為有限和無(wú)限。 支付(盈利函數(shù)) payoff: 對(duì)應(yīng)于某策略組合的局中人利益或損失; 確定的或是期望的; 分為零和和非零和。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 16 擴(kuò)展術(shù)語(yǔ): 信息: 信息集; 完全信息 ( complete) ; 完美信息 ( perfect) 。 共同知識(shí): 雙方可能獲取的相同信息; 彼此都能算清楚 。 博弈結(jié)果: 均衡策略組合;均衡行動(dòng)組合 。 均衡: 所有局中人最優(yōu)策略的組合 。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 17 博弈的策略型 ( 標(biāo)準(zhǔn)型 、 正則型 ) 表述: 指定 n個(gè)局中人 , 以及他們各自的純策略空間 和這些局中人各自的支付 ( 盈利 ) 函數(shù) 我們將該博弈表示為: niS i ,2,1, niSSSu ni ,2,1),( 21 3. 博弈描述 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 18 例:寡頭競(jìng)爭(zhēng)問(wèn)題 ),(),(;0,0 21221121 qqqqqqG 策略型表述多適用于靜態(tài)博弈 。 另一種表述方式是擴(kuò)展式表述 , 兩種表述形式幾乎是完全等價(jià)的 , 但是擴(kuò)展式表述更適合于討論動(dòng)態(tài)博弈 。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 19 房地產(chǎn)開(kāi)發(fā)實(shí)例 雙方: A, B 策略: 開(kāi)發(fā)投資 1億元;不開(kāi)發(fā) , 投資 0 售價(jià): 高需: 1.4億元 (兩棟 ), 1.8億元 (一棟 ); 低需: 0.7億元 (兩棟 ), 1.1億元 (一棟 )。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 20 結(jié)果: 高需 , (開(kāi) , 不開(kāi) ), (0.8, 0) 高需 , (不開(kāi) , 開(kāi) ), (0, 0.8) 高需 , (開(kāi) , 開(kāi) ), (0.4, 0.4) 高需 , (不開(kāi) , 不開(kāi) ), (0, 0) 低需 , (開(kāi) , 不開(kāi) ), (0.1, 0) 低需 , (不開(kāi) , 開(kāi) ), (0, 0.1) 低需 , (開(kāi) , 開(kāi) ), (-0.3, -0.3) 低需 , (不開(kāi) , 不開(kāi) ), (0, 0) 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 21 策略型表述: ( 兩人有限博弈;矩陣形式) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) ( 0.4,0.4) ( 0.8,0) 不開(kāi)發(fā) ( 0,0.8) ( 0,0) A B 高需求情況 低需求情況? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 22 房地產(chǎn)博弈分析 假設(shè): 同時(shí)決策;市場(chǎng)需求雙方已知 若市場(chǎng)需求大,雙方開(kāi)發(fā),各得 0.4萬(wàn)元。 若市場(chǎng)需求小,依賴于對(duì)方行動(dòng)。 若市場(chǎng)不確定,依賴對(duì)市場(chǎng)的判斷及對(duì)方行動(dòng)。 例: P 0.5,最壞情況期望盈利 500萬(wàn)元,開(kāi)發(fā)。 P 0.3,對(duì)方開(kāi)發(fā)概率 31/40時(shí),開(kāi)發(fā);否則,不開(kāi)發(fā)。(?) 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 23 關(guān)鍵問(wèn)題: 對(duì)自然狀態(tài)的概率估計(jì); 不同時(shí)間決策(決策順序); 對(duì)對(duì)方先驗(yàn)信息的估計(jì)(即估計(jì)對(duì)方對(duì)信息的掌握程度)。 現(xiàn)實(shí)困難: 對(duì)市場(chǎng)了解程度不同; 對(duì)對(duì)方了解程度不同; 如何向?qū)Ψ桨凳咀约旱男袆?dòng)。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 24 4.博弈練習(xí) 游戲一: 心靈感應(yīng) 兩個(gè)人一組 , 獨(dú)立寫(xiě)出 1至 10之間的任意 5個(gè)數(shù) 。 如果不重復(fù)則得獎(jiǎng);否則受罰 。 獲勝的秘訣是什么 ? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 25 游戲二: 海盜逃生 有 5個(gè)海盜,即將被處死刑。法官愿意給他們一個(gè)機(jī)會(huì)。從 100個(gè)黃豆中隨意抓取,最多可以全抓,最少可以不抓,可以和別人抓的一樣多。抓得最多的和最少的要被處死。 如果你第一個(gè)抓,你抓幾個(gè)? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 26 游戲三: 100元怎么分? 你看見(jiàn)兩個(gè)小孩在玩耍,出于好奇,你給他們 100元,讓他們猜拳。猜贏者決定怎么分這 100元,而輸者如果同意贏者的分配比例,那么他們將各有所得,如果不同意,那么這 100元,你將收回。 請(qǐng)你替贏者考慮一下,怎樣分配,贏者既得到最大利益,又能讓輸者也同意呢? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 27 游戲四: 一元錢(qián)競(jìng)拍 給一元錢(qián)鈔票開(kāi)出你的價(jià)錢(qián),使自己獲益最大或損失最少;每次叫價(jià)以 5分錢(qián)為單位;開(kāi)價(jià)最高者得到這一元錢(qián);出價(jià)最高和次高者一并按所開(kāi)的價(jià)錢(qián)支付。 斜坡上的均衡; “ 騎虎難下 ” 的博弈; “ 協(xié)和謬誤 ” 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 28 游戲五: 強(qiáng)盜分贓 有五個(gè)強(qiáng)盜搶得 100枚金幣,在如何分贓問(wèn)題上爭(zhēng)吵不休。于是他們決定: ( 1)抽簽決定自己的號(hào)碼( 1, 2, 3, 4,5); ( 2)由 1號(hào)提出分配方案,然后 5人表決,如果方案超過(guò)半數(shù)同意就通過(guò),否則他將被仍進(jìn)大海喂鯊魚(yú); 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 29 ( 3) 1號(hào)死后,由 2號(hào)提方案, 4人表決,當(dāng)且僅當(dāng)超過(guò)半數(shù)同意方案通過(guò),否則 2號(hào)同樣被仍進(jìn)大; ( 4)依次類(lèi)推,直到找到一個(gè)每個(gè)人都接受的方案(當(dāng)然,如果只剩下 5號(hào),他當(dāng)然接受一個(gè)人獨(dú)吞的結(jié)果)。 如果你是第一個(gè)強(qiáng)盜,你該如何提出分配方案才能使自己的收益最大化呢? 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 30 5. 關(guān)于博弈論 博弈分類(lèi) : 合作、非合作: 是否存在一個(gè)具有約束力的協(xié)議( binding agreement) 前者強(qiáng)調(diào)團(tuán)體理性(效率、公正、公平) 后者強(qiáng)調(diào)個(gè)人理性(最優(yōu)決策,不保證效率) 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 31 完全信息與不完全信息: 每一個(gè)局中人對(duì)自己及其它局中人是否有完全的了解; 包括局中人特征、策略空間、盈利函數(shù)等知識(shí)。 動(dòng)態(tài)與靜態(tài): 行動(dòng)的先后順序 ; 是否同時(shí)(或不同時(shí)但對(duì)方不知)。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 32 發(fā)展歷史: 1944 Von Neumann & Morgenstern “The theory of games and economic behavior” 1950 Nash & 1953 Shapley “討價(jià)還價(jià) ” 模型 1950、 1951 Nash 非合作博弈 1950 Tucker Prisoners dilemma 1953 Gillies & Shapley 合作博弈 1965 Selton 動(dòng)態(tài)分析 ; “精煉納什均衡 ” 1967、 1968 Harsanyi “不完全信息 ” 1994 Nash 、 Selton、 Harsanyi 諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 33 納什的傳奇人生 1928年出生于一個(gè)電子工程師家庭。 17歲進(jìn)入今卡耐基梅隆大學(xué),專(zhuān)攻數(shù)學(xué)。 20歲時(shí)進(jìn)入普林斯頓大學(xué)攻讀博士學(xué)位。 1949年, 21歲的納什寫(xiě)下論文 多人博弈的均衡點(diǎn) 。 1950年以論文 非合作型博弈 獲得數(shù)學(xué)博士學(xué)位。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 34 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 35 畢業(yè)后先后在蘭德研究所、普林斯頓大學(xué)、 MIT工作。 1957年他與 MIT學(xué)生愛(ài)莉西婭結(jié)婚。 在而立之年患上了妄想型精神分裂癥,九十年代逐漸恢復(fù)了正常。 1994年納什博士獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。 2002年來(lái)北京參加 “ 國(guó)際數(shù)學(xué)家大會(huì) ” 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 36 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 37 電影 “美麗心靈” 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 38 靜態(tài) 動(dòng)態(tài) 完全 信息 完全信息靜態(tài)博弈 納什均衡 納什( 1950, 1951) 完全信息動(dòng)態(tài)博弈 子博弈精煉納什均衡 澤爾滕( 1965) 不完全信息 不完全信息靜態(tài)博弈 貝葉斯納什均衡 海薩尼( 1967 1968) 不完全信息動(dòng)態(tài)博弈 精煉貝葉斯納什均衡 澤爾滕( 1975) 博弈論體系 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 39 第二講 完全信息靜態(tài)博弈 1.矩陣博弈 2.累次嚴(yán)優(yōu)均衡 3.納什均衡 4.混合策略納什均衡 5.納什均衡的存在性與多重性 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 40 1. 矩陣博弈 什么是矩陣博弈: 兩人零和有限策略博弈; 可用矩陣形式表述。 矩陣元素為局中人 A的贏得,亦即 B的損失。 例: 用矩陣形式表述田忌賽馬博弈(?) 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 41 有鞍點(diǎn)情形 : 存在最優(yōu)純策略 例: 表中數(shù)據(jù)為 I的贏得 II I 1 2 3 min 1 6 1 8 8 2 3 2 4 2 3 9 1 10 10 4 3 0 6 3 max 9 2 6 2 博弈哲學(xué) : 從最壞處考慮,爭(zhēng)取最好結(jié)果 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 42 無(wú)鞍點(diǎn)情形: 最優(yōu)混合策略 例: II I 1 2 min 1 11 5 5 2 7 9 7 max 11 9 ? )1,(),();1,(),( 2121 yyxx 設(shè)最優(yōu)混合策 略: 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 43 對(duì)局中人 I: 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 44 I的最優(yōu)混合策略為 同理 , II的最優(yōu)混合策略為 G 8 同理可求局中人 II的最優(yōu)混合策略 ( ? ) )21,21(),( 21 )43,41(),( 21 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 45 2.累次嚴(yán)優(yōu)均衡 占優(yōu)策略均衡 (嚴(yán)格 )劣策略: 無(wú)論對(duì)方如何選擇都更差 。 占優(yōu)策略: 無(wú)論對(duì)方如何選擇存在唯一最優(yōu) 。 占優(yōu)策略均衡: 所有局中人占優(yōu)策略的組合 。 特點(diǎn): 只要求每個(gè)人理性 , 并不要求知道其它人是不是理性 。 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 46 例:裁軍問(wèn)題 以巴 武裝 裁軍 武裝 ( 3000, 3000) ( 10000 , ) 裁軍 ( , 10000) ( 0,0) 例: 囚徒困境中的(認(rèn)罪,認(rèn)罪) 例: 房地產(chǎn)投資市場(chǎng)大情況下(開(kāi)發(fā),開(kāi)發(fā)) 博弈論 2009 正大光明 公正無(wú)私 幫助別人 成就自己 47 重復(fù)剔除的占優(yōu)均衡 ( iterated elimination) 也稱為累次嚴(yán)優(yōu)均
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 太湖創(chuàng)意職業(yè)技術(shù)學(xué)院《東方管理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025關(guān)于城鎮(zhèn)醫(yī)療服務(wù)合同范本
- 2025至2031年中國(guó)大空間智能主動(dòng)滅火裝置行業(yè)投資前景及策略咨詢研究報(bào)告
- 山西教育主題館施工方案
- 2025至2031年中國(guó)PS印刷版行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2030年中國(guó)附油封型直線運(yùn)動(dòng)球軸承數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)跳接線數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 春季婚宴預(yù)訂方案范本
- 鋼結(jié)構(gòu)外墻維修施工方案
- 拆除混凝土硬化施工方案
- 反恐防暴器械與戰(zhàn)術(shù)應(yīng)用講解
- 2024年防范電信網(wǎng)絡(luò)詐騙知識(shí)題庫(kù)及答案(共100題)
- 第47 屆世界技能大賽商品展示技術(shù)項(xiàng)目技術(shù)文件
- (中級(jí)技能操作考核)消防設(shè)施操作員考試題庫(kù)(全真題版)
- 南京工業(yè)大學(xué)《民法》2022-2023學(xué)年第一學(xué)期期末試卷
- DB11∕T 1796-2020 文物建筑三維信息采集技術(shù)規(guī)程
- 【工程法規(guī)】王欣 教材精講班課件 38-第6章-6.3-施工單位安全生產(chǎn)責(zé)任制度
- 四年級(jí)數(shù)學(xué)下冊(cè) 第1講 平移、旋轉(zhuǎn)和軸對(duì)稱學(xué)生版(知識(shí)梳理+典例分析+舉一反三+階梯訓(xùn)練)(蘇教版)
- 部編人教版二年級(jí)下學(xué)期語(yǔ)文期中綜合復(fù)習(xí)強(qiáng)化練習(xí)題〔有答案〕
- 2024北京海淀區(qū)初三一模物理試題及參考答案
- 2024年高等教育法學(xué)類(lèi)自考-00229證據(jù)法學(xué)考試近5年真題附答案
評(píng)論
0/150
提交評(píng)論