已閱讀5頁,還剩155頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
正 大 光 明 公 正 無 私 1 博 弈 論 the Theory of Games css 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 2 主要內(nèi)容 一、博弈現(xiàn)象及基本概念 二、完全信息靜態(tài)博弈 三、完全信息動態(tài)博弈 四、不完全信息靜態(tài)博弈 五、不完全信息動態(tài)博弈 六、不完全信息專題 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 3 主要參考書 (1) 姚國慶: 博弈論 , 高等教育出版社 , 2007. (2) 羅云峰: 博弈論教程 , 清華大學(xué)出版社 、 北京交通大學(xué)出版社 。 (3) 張維迎: 博弈論與信息經(jīng)濟(jì)學(xué) , 上海三聯(lián)書店 , 上海人民出版社 , 2004。 (4) 施錫銓 , 博弈論 , 上海財經(jīng)大學(xué)出版社 ,2002。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 4 (5) 張守一 , 現(xiàn)代經(jīng)濟(jì)對策論 , 高等教育出版社 ,1998。 (6) 錢頌迪 , 運(yùn)籌學(xué) , 清華大學(xué)出版社 , 1996。 (7) 美 艾里克 .拉斯繆森: 博弈與信息 , 北京大學(xué)出版社 , 2003。 (8) 美 弗登博格: 博弈論 , 中國人民大學(xué)出版社 , 2002。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 5 第一講 博弈現(xiàn)象與基本概念 1博弈現(xiàn)象 2. 博弈概念 3. 博弈描述 4. 博弈練習(xí) 5. 關(guān)于博弈論 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 6 1博弈現(xiàn)象 田忌賽馬: 正確的策略可以反敗為勝 。 囚徒困境: 認(rèn)罪 不認(rèn)罪 認(rèn)罪 ( -5,-5) ( 0,-10) 不認(rèn)罪 ( -10,0) ( -1,-1) 甲 乙 理性的人是自私自利的; 理性選擇不是全局最優(yōu)。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 7 經(jīng)濟(jì)合作: 合作 欺騙 合作 ( 2,2) ( -2,4) 欺騙 ( 4,-2) ( 0,0) 甲 乙 誠信的價值; 一報還一報策略; 人類生存環(huán)境啟示。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 8 長街上的超市 ( 海灘占位模型 ) 0 1/2 3/4 1 1/4 A O 資源浪費(fèi)還是理性的必然? 其它相似情形: 旅行社的熱門路線;黃金時間的電視節(jié)目;總統(tǒng)競選。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 9 狩獵與投資 狩獵: 兩個獵人圍住一頭鹿 , 各卡住兩個關(guān)口中的一個 , 齊心協(xié)力即可成功獲得并平分獵物 。 此時有一群兔子跑過 , 任何一人去抓兔子必可成功 ,但鹿會跑掉 。 他們會堅(jiān)持獵鹿還是去抓兔子 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 10 共同投資: 雙方共同投資一個大項(xiàng)目 , 可期望有較大收益 。 此時如某方抽出資金去進(jìn)行小項(xiàng)目投資 ,必可成功獲小利 , 但會使共同項(xiàng)目陷入困境 ,使對方蒙受損失 。 投資者會如何選擇 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 11 旅行者困境 兩個旅行者花瓶被摔壞 , 向航空公司索賠 。航空公司知道價格約為八九十元 , 但不知道確切價格 。 于是請兩位旅客在 100元以內(nèi)自己寫下花瓶的價格 。 如兩人寫的一樣 , 就認(rèn)為他們講真話 , 并按所寫數(shù)額賠償;如果兩人寫的不一樣 , 就認(rèn)定低者講真話 , 并照此價格賠償 。 同時 , 對講真話的旅客獎勵 2元錢 , 對講假話的旅客罰款 2元 。 理性原則下 , 他們會寫多少價格呢 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 12 什么是博弈: 個人或團(tuán)體間在依存和對抗、合作和沖突中的決策問題。 博弈論研究博弈過程中的理性行為。 2. 博弈概念 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 13 如何理解理性行為: 自身利益最大; 持續(xù)地有意圖的行動; 不對動機(jī)妄加猜測; 不考慮道德問題; 只研究合法問題; 盈利函數(shù)有多重標(biāo)準(zhǔn)。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 14 博弈三要素 局中人 (參與人) players: 決策主體 ; 自然人、團(tuán)體或“虛擬局中人”; 有可供選擇的策略和明確定義的利益函數(shù); 分為兩人和多人 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 15 策略(戰(zhàn)略) strategies: 采取行動的規(guī)則; 可以是一次行動也可以是一個行動序列; 可以是純策略也可以是混合策略; 分為有限和無限。 支付(盈利函數(shù)) payoff: 對應(yīng)于某策略組合的局中人利益或損失; 確定的或是期望的; 分為零和和非零和。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 16 擴(kuò)展術(shù)語: 信息: 信息集; 完全信息 ( complete) ; 完美信息 ( perfect) 。 共同知識: 雙方可能獲取的相同信息; 彼此都能算清楚 。 博弈結(jié)果: 均衡策略組合;均衡行動組合 。 均衡: 所有局中人最優(yōu)策略的組合 。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 17 博弈的策略型 ( 標(biāo)準(zhǔn)型 、 正則型 ) 表述: 指定 n個局中人 , 以及他們各自的純策略空間 和這些局中人各自的支付 ( 盈利 ) 函數(shù) 我們將該博弈表示為: niS i ,2,1, niSSSu ni ,2,1),( 21 3. 博弈描述 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 18 例:寡頭競爭問題 ),(),(;0,0 21221121 qqqqqqG 策略型表述多適用于靜態(tài)博弈 。 另一種表述方式是擴(kuò)展式表述 , 兩種表述形式幾乎是完全等價的 , 但是擴(kuò)展式表述更適合于討論動態(tài)博弈 。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 19 房地產(chǎn)開發(fā)實(shí)例 雙方: A, B 策略: 開發(fā)投資 1億元;不開發(fā) , 投資 0 售價: 高需: 1.4億元 (兩棟 ), 1.8億元 (一棟 ); 低需: 0.7億元 (兩棟 ), 1.1億元 (一棟 )。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 20 結(jié)果: 高需 , (開 , 不開 ), (0.8, 0) 高需 , (不開 , 開 ), (0, 0.8) 高需 , (開 , 開 ), (0.4, 0.4) 高需 , (不開 , 不開 ), (0, 0) 低需 , (開 , 不開 ), (0.1, 0) 低需 , (不開 , 開 ), (0, 0.1) 低需 , (開 , 開 ), (-0.3, -0.3) 低需 , (不開 , 不開 ), (0, 0) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 21 策略型表述: ( 兩人有限博弈;矩陣形式) 開發(fā) 不開發(fā) 開發(fā) ( 0.4,0.4) ( 0.8,0) 不開發(fā) ( 0,0.8) ( 0,0) A B 高需求情況 低需求情況? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 22 房地產(chǎn)博弈分析 假設(shè): 同時決策;市場需求雙方已知 若市場需求大,雙方開發(fā),各得 0.4萬元。 若市場需求小,依賴于對方行動。 若市場不確定,依賴對市場的判斷及對方行動。 例: P 0.5,最壞情況期望盈利 500萬元,開發(fā)。 P 0.3,對方開發(fā)概率 31/40時,開發(fā);否則,不開發(fā)。(?) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 23 關(guān)鍵問題: 對自然狀態(tài)的概率估計; 不同時間決策(決策順序); 對對方先驗(yàn)信息的估計(即估計對方對信息的掌握程度)。 現(xiàn)實(shí)困難: 對市場了解程度不同; 對對方了解程度不同; 如何向?qū)Ψ桨凳咀约旱男袆印?博弈論 2009 正大光明 公正無私 幫助別人 成就自己 24 4.博弈練習(xí) 游戲一: 心靈感應(yīng) 兩個人一組 , 獨(dú)立寫出 1至 10之間的任意 5個數(shù) 。 如果不重復(fù)則得獎;否則受罰 。 獲勝的秘訣是什么 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 25 游戲二: 海盜逃生 有 5個海盜,即將被處死刑。法官愿意給他們一個機(jī)會。從 100個黃豆中隨意抓取,最多可以全抓,最少可以不抓,可以和別人抓的一樣多。抓得最多的和最少的要被處死。 如果你第一個抓,你抓幾個? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 26 游戲三: 100元怎么分? 你看見兩個小孩在玩耍,出于好奇,你給他們 100元,讓他們猜拳。猜贏者決定怎么分這 100元,而輸者如果同意贏者的分配比例,那么他們將各有所得,如果不同意,那么這 100元,你將收回。 請你替贏者考慮一下,怎樣分配,贏者既得到最大利益,又能讓輸者也同意呢? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 27 游戲四: 一元錢競拍 給一元錢鈔票開出你的價錢,使自己獲益最大或損失最少;每次叫價以 5分錢為單位;開價最高者得到這一元錢;出價最高和次高者一并按所開的價錢支付。 斜坡上的均衡; “ 騎虎難下 ” 的博弈; “ 協(xié)和謬誤 ” 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 28 游戲五: 強(qiáng)盜分贓 有五個強(qiáng)盜搶得 100枚金幣,在如何分贓問題上爭吵不休。于是他們決定: ( 1)抽簽決定自己的號碼( 1, 2, 3, 4,5); ( 2)由 1號提出分配方案,然后 5人表決,如果方案超過半數(shù)同意就通過,否則他將被仍進(jìn)大海喂鯊魚; 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 29 ( 3) 1號死后,由 2號提方案, 4人表決,當(dāng)且僅當(dāng)超過半數(shù)同意方案通過,否則 2號同樣被仍進(jìn)大; ( 4)依次類推,直到找到一個每個人都接受的方案(當(dāng)然,如果只剩下 5號,他當(dāng)然接受一個人獨(dú)吞的結(jié)果)。 如果你是第一個強(qiáng)盜,你該如何提出分配方案才能使自己的收益最大化呢? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 30 5. 關(guān)于博弈論 博弈分類 : 合作、非合作: 是否存在一個具有約束力的協(xié)議( binding agreement) 前者強(qiáng)調(diào)團(tuán)體理性(效率、公正、公平) 后者強(qiáng)調(diào)個人理性(最優(yōu)決策,不保證效率) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 31 完全信息與不完全信息: 每一個局中人對自己及其它局中人是否有完全的了解; 包括局中人特征、策略空間、盈利函數(shù)等知識。 動態(tài)與靜態(tài): 行動的先后順序 ; 是否同時(或不同時但對方不知)。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 32 發(fā)展歷史: 1944 Von Neumann & Morgenstern “The theory of games and economic behavior” 1950 Nash & 1953 Shapley “討價還價 ” 模型 1950、 1951 Nash 非合作博弈 1950 Tucker Prisoners dilemma 1953 Gillies & Shapley 合作博弈 1965 Selton 動態(tài)分析 ; “精煉納什均衡 ” 1967、 1968 Harsanyi “不完全信息 ” 1994 Nash 、 Selton、 Harsanyi 諾貝爾經(jīng)濟(jì)學(xué)獎 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 33 納什的傳奇人生 1928年出生于一個電子工程師家庭。 17歲進(jìn)入今卡耐基梅隆大學(xué),專攻數(shù)學(xué)。 20歲時進(jìn)入普林斯頓大學(xué)攻讀博士學(xué)位。 1949年, 21歲的納什寫下論文 多人博弈的均衡點(diǎn) 。 1950年以論文 非合作型博弈 獲得數(shù)學(xué)博士學(xué)位。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 34 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 35 畢業(yè)后先后在蘭德研究所、普林斯頓大學(xué)、 MIT工作。 1957年他與 MIT學(xué)生愛莉西婭結(jié)婚。 在而立之年患上了妄想型精神分裂癥,九十年代逐漸恢復(fù)了正常。 1994年納什博士獲諾貝爾經(jīng)濟(jì)學(xué)獎。 2002年來北京參加 “ 國際數(shù)學(xué)家大會 ” 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 36 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 37 電影 “美麗心靈” 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 38 靜態(tài) 動態(tài) 完全 信息 完全信息靜態(tài)博弈 納什均衡 納什( 1950, 1951) 完全信息動態(tài)博弈 子博弈精煉納什均衡 澤爾滕( 1965) 不完全信息 不完全信息靜態(tài)博弈 貝葉斯納什均衡 海薩尼( 1967 1968) 不完全信息動態(tài)博弈 精煉貝葉斯納什均衡 澤爾滕( 1975) 博弈論體系 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 39 第二講 完全信息靜態(tài)博弈 1.矩陣博弈 2.累次嚴(yán)優(yōu)均衡 3.納什均衡 4.混合策略納什均衡 5.納什均衡的存在性與多重性 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 40 1. 矩陣博弈 什么是矩陣博弈: 兩人零和有限策略博弈; 可用矩陣形式表述。 矩陣元素為局中人 A的贏得,亦即 B的損失。 例: 用矩陣形式表述田忌賽馬博弈(?) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 41 有鞍點(diǎn)情形 : 存在最優(yōu)純策略 例: 表中數(shù)據(jù)為 I的贏得 II I 1 2 3 min 1 6 1 8 8 2 3 2 4 2 3 9 1 10 10 4 3 0 6 3 max 9 2 6 2 博弈哲學(xué) : 從最壞處考慮,爭取最好結(jié)果 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 42 無鞍點(diǎn)情形: 最優(yōu)混合策略 例: II I 1 2 min 1 11 5 5 2 7 9 7 max 11 9 ? )1,(),();1,(),( 2121 yyxx 設(shè)最優(yōu)混合策 略: 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 43 對局中人 I: 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 44 I的最優(yōu)混合策略為 同理 , II的最優(yōu)混合策略為 G 8 同理可求局中人 II的最優(yōu)混合策略 ( ? ) )21,21(),( 21 )43,41(),( 21 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 45 2.累次嚴(yán)優(yōu)均衡 占優(yōu)策略均衡 (嚴(yán)格 )劣策略: 無論對方如何選擇都更差 。 占優(yōu)策略: 無論對方如何選擇存在唯一最優(yōu) 。 占優(yōu)策略均衡: 所有局中人占優(yōu)策略的組合 。 特點(diǎn): 只要求每個人理性 , 并不要求知道其它人是不是理性 。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 46 例:裁軍問題 以巴 武裝 裁軍 武裝 ( 3000, 3000) ( 10000 , ) 裁軍 ( , 10000) ( 0,0) 例: 囚徒困境中的(認(rèn)罪,認(rèn)罪) 例: 房地產(chǎn)投資市場大情況下(開發(fā),開發(fā)) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 47 重復(fù)剔除的占優(yōu)均衡 ( iterated elimination) 也稱為累次嚴(yán)優(yōu)均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024中國海洋漁業(yè)市場前景及投資研究報告
- 2025年度銷售人員海外市場拓展合同
- 2025年度高科技項(xiàng)目投融資顧問服務(wù)合同3篇
- 2025年建筑用發(fā)泡混凝土合同9篇
- 2025年房屋裝修貸款合同示例2篇
- 2025年施工員勞務(wù)合同范本:古建筑工程施工人員服務(wù)協(xié)議3篇
- 2024年超小型精密CNC車床項(xiàng)目可行性研究報告
- 2025年江蘇無錫市江陰市錦繡江南環(huán)境發(fā)展有限公司招聘筆試參考題庫附帶答案詳解
- 2025年度綠色環(huán)保產(chǎn)業(yè)園區(qū)開發(fā)建設(shè)合同范本2篇
- 2025年廣西梧州商貿(mào)學(xué)校招聘工作人員歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 浙江省安全員C證考試題庫及答案(推薦)
- 《文化苦旅》讀書分享 PPT
- 氧化鋁生產(chǎn)工藝教學(xué)拜耳法
- 2023年十八項(xiàng)醫(yī)療核心制度考試題與答案
- 氣管切開患者氣道濕化的護(hù)理進(jìn)展資料 氣管切開患者氣道濕化
- 管理模板:某跨境電商企業(yè)組織結(jié)構(gòu)及部門職責(zé)
- 底架總組裝工藝指導(dǎo)書
- 簡單臨時工勞動合同模板(3篇)
- 聚酯合成反應(yīng)動力學(xué)
- 上??萍即髮W(xué),面試
- 《五年級奧數(shù)總復(fù)習(xí)》精編課件
評論
0/150
提交評論