版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、管 理 博 弈 論(第一講 導(dǎo)論) 鄒 銳 北京理工大學(xué)管理與經(jīng)濟(jì)學(xué)院參考教材1.一門新興交叉學(xué)科管理博弈論導(dǎo)論,侯光明著, 北京理工大學(xué)出版社, 2001年2.管理博弈論,侯光明、 李存金 著, 北京理工大學(xué)出版社, 2004年10月3.現(xiàn)代管理激勵與約束侯光明、李存金 著,高等教育出版社,2002年4.經(jīng)濟(jì)博弈論(第三版)、謝識予 著,復(fù)旦大學(xué)出版社,2002年1月5.身邊的博弈,董志強 著,機(jī)械工業(yè)出版社,2007年1月6.博弈論的詭計,王春永 編著,中國發(fā)展出版社,2007年1月課程目標(biāo)1.介紹博弈論的基本概念、方法等理論知識。2.側(cè)重從管理應(yīng)用視角,啟發(fā)學(xué)生運用博弈論的基本知識分析現(xiàn)
2、實問題。3.通過大量的案例,幫助學(xué)生對基本理論知識的掌握和理解。4.側(cè)重課程訓(xùn)練,旨在促進(jìn)學(xué)生形成運用課程知識的能力。管理博弈論體系框架廣義管理博弈論狹義博弈論合作博弈論非合作博弈論完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈博弈論(單目標(biāo))非對稱信息博弈論(信息經(jīng)濟(jì)學(xué))(契約設(shè)計理論)管理激勵與約束 機(jī)制設(shè)計理論(多目標(biāo))逆向選擇模型道德風(fēng)險模型隱蔽行動模型隱蔽信息模型進(jìn)化博弈論(進(jìn)化論博弈論有限理性)量子博弈論(量子論博弈論實驗)博弈鏈理論(系統(tǒng)科學(xué)組織理論博弈論)完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈個體管理問題公共道德問題群體管理問
3、題隱蔽違規(guī)問題合作博弈論非合作博弈論合作博弈論非合作博弈論合作博弈論非合作博弈論本講主要內(nèi)容1. 1 什么是博弈論1 .2 博弈結(jié)構(gòu)和博弈的分類1. 3 幾類經(jīng)典博弈模型1. 4 博弈論歷史和發(fā)展的簡要評述1. 5 博弈論在我國的應(yīng)用1. 6 訓(xùn)練題 1.1 什么是博弈論博弈:源于游戲的一種決策思想和方法博弈源于中國的圍棋游戲博弈論從思想到邏輯,從哲學(xué)到科學(xué) 圍棋孫子兵法空城計三國演義 博弈論的概念詮釋博弈論:也叫對策論,是研究利益沖突各方在彼此相互作用下如何做出決策,及有關(guān)這種決策的均衡問題的理論。本質(zhì):一種決策方法。目的:在既定博弈規(guī)則的 約束下求解均衡并 選擇行動。1.1.1 從游戲到博
4、弈博弈就是策略對抗,或策略有關(guān)鍵作用的游戲博弈Game,博弈論Game Theory,Game即游戲、競技游戲和經(jīng)濟(jì)等決策競爭較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用 游戲下棋、猜大小 經(jīng)濟(jì)寡頭產(chǎn)量決策、市場阻入、投標(biāo)拍賣 政治、軍事美國和伊拉克、以色列和巴勒斯坦1.1.2 一個非技術(shù)性定義定義:博弈就是一些個人、隊組或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。四個核心方面 博弈的參加者(Player)博弈方 各博弈方的策略(Strategies)或行動(Acti
5、ons) 博弈的次序(Order) 博弈方的得益(Payoffs)博弈的六要素參與人:博弈中的決策主體收 益:參與人得到的期望效用水平信 息:參與人有關(guān)博弈過程的知識行 動:博弈某個時點的決策變量均 衡:參與人的最優(yōu)策略或行動的組合策 略:參與人可選擇的行動方案分類標(biāo)準(zhǔn)博弈類別參與人單人博弈多人博弈博弈次序靜態(tài)博弈動態(tài)博弈策略空間有限策略博弈無限策略博弈博弈性質(zhì)合作博弈非合作博弈得益情況常和博弈(含零和博弈)變和博弈得益信息完全信息博弈不完全信息博弈進(jìn)程信息完美信息動態(tài)博弈不完美信息動態(tài)博弈博弈的分類生活中的博弈情侶之戰(zhàn)討價還價的勝算大家的事情由誰管?修路糾紛博弈無時不在、無處不在朝核六方會談
6、,博弈中開花結(jié)果1.2 博弈結(jié)構(gòu)和博弈分類1.2.1 博弈中的博弈方1.2.2 博弈中的策略1.2.3 博弈中的得益1.2.4 博弈的過程1.2.5 博弈的信息結(jié)構(gòu)1.2.6 博弈方的能力和理性1.2.7 博弈的分類和博弈理論的結(jié)構(gòu)1.2.1 博弈中的博弈方博弈方:獨立決策、獨立承擔(dān)博弈結(jié)果的個人或組織博弈規(guī)則面前博弈方之間平等,不因博弈方之間權(quán)利、地位的差異而改變博弈方數(shù)量對博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈,單人博弈是退化的博弈一、單人博弈只有一個博弈方的博弈例一:單人迷宮入口AB出口(獎金M)A,1B,1右左右左M00擴(kuò)展形例二:運輸路
7、線-7000-16000-10000-10000好天氣(75%)壞天氣(25%)自 然商人水 路陸 路運輸路線得益矩陣01-7000-10000-16000-10000運輸路線擴(kuò)展形好天氣(75%)壞天氣(25%)單人博弈實質(zhì)個體最優(yōu)化問題二、兩人博弈兩人博弈即有兩個博弈方的博弈兩人博弈最常見,研究最多,是最基本和有用的博弈類型囚徒困境、猜硬幣、齊威王田忌賽馬等都是兩人博弈兩人博弈有多種可能性,博弈方的利益方向可能一致,也可以不一致三、多人博弈三個博弈方之間的博弈可能存在“破壞者”:其策略選擇對自身的利益并沒有影響,但卻會對其他博弈方的利益產(chǎn)生很大的,有時甚至是決定性的影響。申辦奧運會是典型例
8、子。多人博弈的表示有時與兩人博弈不同,需要多個得益矩陣,或者只能用描述法1.2.2 博弈中的策略策略:博弈中各博弈方的選擇內(nèi)容策略有定性定量、簡單復(fù)雜之分不同博弈方之間不僅可選策略不同,而且可選策略數(shù)量也可不同有限博弈:每個博弈方的策略數(shù)都是有限的無限博弈:至少有某些博弈方的策略有無限多個1.2.3 博弈中的得益得益:各博弈方從博弈中所獲得的利益得益對應(yīng)博弈的結(jié)果,也就是各博弈方策略的組合得益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)根據(jù)得益的博弈分類:零和博弈、常和博弈、變和博弈零和博弈:也稱“嚴(yán)格競爭博弈”。博弈方之間利益始終對立,偏好通常不同 猜硬幣,田忌賽馬,石頭-剪刀-布常和博弈
9、:博弈方之間利益的總和為常數(shù)。博弈方之間的利益是對立的且是競爭關(guān)系 分配固定數(shù)額的獎金、利潤,遺產(chǎn)官司變和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率問題的重要性。 囚徒困境、產(chǎn)量博弈等1.2.4 博弈的過程博弈過程:博弈方選擇、行為的次序,包括是否多次重復(fù)選擇、行為。博弈過程對博弈結(jié)果也有重要影響。根據(jù)博弈的過程,博弈可分為靜態(tài)博弈、動態(tài)博弈、重復(fù)博弈。靜態(tài)博弈:所有博弈方同時或可看作同時選擇策略的博弈 田忌賽馬、猜硬幣動態(tài)博弈:各博弈方的選擇和行動又先后次序且后選擇、后行動的博弈方在自己選擇、行動之前可以看到其他博弈方的選擇和行動 弈棋、市場進(jìn)入、領(lǐng)導(dǎo)追隨型市場結(jié)構(gòu)重復(fù)博
10、弈:同一個博弈反復(fù)進(jìn)行所構(gòu)成的博弈,提供了實現(xiàn)更有效略博弈結(jié)果的新可能 長期客戶、長期合同、信譽問題有限次重復(fù)博弈無限次重復(fù)博弈1.2.5 博弈的信息結(jié)構(gòu)完全信息博弈:各博弈方都完全了解所有博弈方各種情況下的得益不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情況的博弈,也稱為“不對稱信息博弈”完美信息博弈:每個輪到行為的博弈方對博弈的進(jìn)程完全了解的博弈不完美信息博弈:至少某些博弈方在輪到行動時不完全了解此前全部博弈的進(jìn)程的博弈1.2.6 博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判斷能力和不會犯選擇行為的錯誤有限理性:博弈方的判斷選擇能力有缺陷個體理性和集體理性個體理
11、性:一個體利益最大為目標(biāo)集體理性:追求集體利益最大化合作博弈:允許存在有約束力協(xié)議的博弈非合作博弈:不允許存在有約束力協(xié)議的博弈1.2.7 博弈的分類和博弈理論的結(jié)構(gòu)非合作博弈和合作博弈非合作博弈范圍內(nèi):完全理性博弈和有限理性博弈(進(jìn)化博弈)靜態(tài)博弈,動態(tài)博弈,重復(fù)博弈完全信息靜態(tài)博弈,不完全信息靜態(tài)博弈,完全且完美信息動態(tài)博弈,完全但不完美信息動態(tài)博弈,不完全信息動態(tài)博弈零和博弈和非零和博弈,單人博弈和多人博弈1.3 幾個經(jīng)典博弈模型1.3.1 囚徒的困境1.3.2 賭勝博弈1.3.3 田忌賽馬1.3.1 囚徒的困境囚徒的困境是圖克(Tucker)1950年提出的該博弈是博弈論最經(jīng)典、著名的
12、博弈該博弈本身講的是一個法律刑偵或犯罪學(xué)方面的問題,但可以擴(kuò)展到許多經(jīng)濟(jì)問題,以及各種社會問題,可以揭示市場經(jīng)濟(jì)的根本缺陷一、基本模型-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白兩個罪犯的得益矩陣囚徒 2囚徒1囚徒1:坦白囚徒2:坦白二、雙寡頭削價競爭100,10020,105150,2070,70高 價低 價高 價低 價寡頭2寡頭1雙寡頭的得益矩陣政府組織協(xié)調(diào)的必要性和重要性寡頭1:低價(70)寡頭2:低價(70)1.3.2 賭勝博弈賭博、競技等構(gòu)成的博弈問題,在經(jīng)濟(jì)中也有許多應(yīng)用,賭勝博弈也是一類重要的博弈問題,對經(jīng)濟(jì)競爭和合作也有很大啟示賭勝博弈的特點是一方得等于
13、另一方失,不可能雙贏,屬于“零和博弈”齊威王田 忌1.3.3 田忌賽馬齊威王田 忌3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田 忌齊威王得益矩陣取勝關(guān)鍵:不讓對方猜到自己策略,盡可能猜出對方策略二、猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方蓋硬幣方正
14、面反 面三、石頭、剪子、布0, 01, -1-1, 1-1, 11, -10, 01, -1-1, 10, 0石 頭剪 子布博弈方2石 頭剪 子布博弈方1房地產(chǎn)價格博弈政府導(dǎo)向:站在以居住需求為主的購房者一方,提高居住需求, 抑制投機(jī)需求,進(jìn)而促進(jìn)房地產(chǎn)市場的健康穩(wěn)定發(fā)展。日期:1944年6月6日 1944年8月25日 地點:法國諾曼底參戰(zhàn)方:盟國(美、英、加、法、波)、納粹德國盟軍目標(biāo):成功實行渡海登陸計劃戰(zhàn)爭博弈-諾曼底登陸1.4 博弈論歷史和發(fā)展簡述1.4.1博弈論的早期研究1.4.2博弈論的形成1.4.3博弈論的成長和發(fā)展1.4.4博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合1.4.1博弈論的早期
15、研究博弈論歷史沒有公認(rèn)答案對具有策略依存特點決策問題的研究可上溯到18世紀(jì)初甚至更早博弈論真正的發(fā)展在本世紀(jì)博弈論總體上仍然是發(fā)展中的學(xué)科 2000年前我國古代的“齊威王田忌賽馬”1500年前巴比倫猶太教法典“婚姻合同問題”等。1838年古諾寡頭模型。1883年伯特蘭德寡頭競爭模型。 1913年齊默羅象棋博弈定理 、“逆推歸納法”1921-1927年波雷爾混合策略的第一個現(xiàn)代表述,有數(shù)種策略兩人博弈的極小化極大解 1928年諾伊曼和摩根斯坦擴(kuò)展形博弈定義,證明有限策略兩人零和博弈有確定結(jié)果 1.4.2博弈論的形成馮.諾伊曼和摩根斯坦博弈論和經(jīng)濟(jì)行為Theory of Games and Eco
16、nomic Behavior 1944引進(jìn)擴(kuò)展形(extensive form)表示和正規(guī)形(normal form)或稱策略形(strategy form)、矩陣形(matrix form)表示提出穩(wěn)定集(stable sets)解概念正式提出創(chuàng)造博弈論一般理論的主意給出博弈論研究的一般框架、概念術(shù)語和表述方法北京理工大學(xué)現(xiàn)代組織管理研究中心馮諾伊曼和博弈論與經(jīng)濟(jì)行為2008-3-301.4.3 博弈論的成長和發(fā)展一、第一個研究高潮,本世紀(jì)40年代末和50年代初1950年納什提出“納什均衡”(Nash equilibrium)概念和證明納什定理,發(fā)展非合作博弈的基礎(chǔ)理論。 1950年Melv
17、in Dresher和Merrill Flood在蘭德公司(美國空軍)“囚徒的困境”(Prisons dilemma)博弈實驗,(Howard Raiffa)獨立進(jìn)行這個博弈實驗;1952-1953年期間(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作為合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奧曼(R. J. Aumann)“40年代末50年代初是博弈論歷史上令人振奮的時期,原理已經(jīng)破繭而出,正在試飛它們的雙翅,活躍著一批巨人。” 第一次榮獲諾貝爾經(jīng)濟(jì)學(xué)獎納什海薩尼1994年諾貝爾經(jīng)濟(jì)學(xué)獎
18、獲得者 (博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用) 澤爾滕二、50年代中后期一直到70年代博弈論發(fā)展的青年期1954-1955年提出了“微分博弈”(Differential games)的概念。奧曼則在1959年提出了“強均衡”(Strong equilibrium)的概念?!爸貜?fù)博弈”(Repeated games)也是在50年代末開始研究的,這自然引出了關(guān)于重復(fù)博弈的“民間定理”(Folk theorem)。1960年(Thomas C. Schelling)引進(jìn)了“焦點”(Focal point)的概念。博弈論在進(jìn)化生物學(xué)(Evolutionary Biology)中的公開應(yīng)用也是在60年代初出現(xiàn)的。
19、塞爾騰(Selten)1965提出“子博弈完美納什均衡”(subgame perfect Nash equilibrium)1975年提出的“顫抖手均衡”(Trembling hand perfect equilibrium)海薩尼(Harsanyi)1967-1968三篇構(gòu)造不完全信息博弈理論的系列論文,“貝葉斯納什均衡”(Bayesian Nash equilibrium)。海薩尼1973年提出關(guān)于“混合策略”的不完全信息解釋,以及“嚴(yán)格納什均衡”(Strict Nash equilibrium)。70年代“進(jìn)化博弈論”(Evolutionary game theory)的重要發(fā)展,(Jo
20、hn Maynard Smith)1972年引進(jìn)“進(jìn)化穩(wěn)定策略”( Evolutionarily stable strategy,ESS)等?!肮餐R”(Common knowledge)的重要性,因為奧曼1976年的文章引起廣泛的重視。 三、40年代末到70年代末是博弈論發(fā)展的重要階段這個時期博弈理論仍然沒有成熟,理論體系還比較亂,概念和分析方法很不統(tǒng)一,在經(jīng)濟(jì)學(xué)中的作用和影響還比較有限,但這個時期博弈論研究的繁榮和進(jìn)展卻是非常顯著的。對這一階段博弈論研究的迅速發(fā)展,除了理論發(fā)展自身規(guī)律的作用以外,全球政治、軍事、經(jīng)濟(jì)特定環(huán)境條件的影響(戰(zhàn)爭和冷戰(zhàn)時期的軍事對抗和威懾策略研究的需要,經(jīng)濟(jì)競
21、爭、國際經(jīng)濟(jì)競爭的加?。?,以及經(jīng)濟(jì)學(xué)理論發(fā)展本身的需要等,都起了重要的作用。正是因為有了這一階段博弈論研究的繁榮發(fā)展,才有80、90年代博弈論的成熟和對經(jīng)濟(jì)學(xué)的博弈論革命。 1.4.4博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合一、80、90年代是博弈論走向成熟的時期 1981(Elon Kohlberg) “順推歸納法”(Forward induction)克瑞潑斯(David M. kreps)和威爾孫(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(John Maynard Smith)出版了進(jìn)化和博弈論()1984年由伯恩海姆(B
22、. D. Bernheim)和皮爾斯(D. G. Pearce)提出“可理性化性”(Rationalizability)海薩尼和塞爾騰1988年提出了在非合作和合作博弈中均衡選擇的一般理論和標(biāo)準(zhǔn),1991年弗得伯格(D. Fudenberg)和泰勒爾(J. Tirole)首先提出了“完美貝葉斯均衡”(Perfext Bayesian equilibrium)的概念二、博弈論和經(jīng)濟(jì)學(xué)諾貝爾獎1994:非合作博弈:納什(Nash)、海薩尼(Harsanyi)、塞爾頓(Selten)1996:不對稱信息激勵理論:莫里斯(Mirrlees)和維克瑞(Vickrey)2001:不完全信息市場博弈:阿克羅夫(Akerlof)(商品市場)、斯潘塞(Spence)(教育市場)、斯蒂格里茲(Stiglitze)(保險市場)2002:實驗經(jīng)濟(jì)學(xué):史密斯(Smith),心理經(jīng)濟(jì)學(xué):卡尼曼(Kahneman)第二次榮獲諾貝爾經(jīng)濟(jì)學(xué)獎1996年諾貝爾經(jīng)濟(jì)學(xué)獲得者(不對稱信息條件下的“經(jīng)濟(jì)激勵理論”)維克里米爾利斯2001年諾貝爾經(jīng)濟(jì)學(xué)獲得者(充滿不對稱信息市場的分析 )阿克爾洛夫斯彭斯斯蒂格利茨第三次榮獲諾貝爾經(jīng)濟(jì)學(xué)獎第四次榮獲諾貝爾經(jīng)濟(jì)學(xué)獎2005年諾貝爾經(jīng)濟(jì)學(xué)獲得者(通過博弈論對沖突和合作領(lǐng)域進(jìn)行分析)羅伯特奧曼托馬斯謝林第五次榮獲諾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度金融資產(chǎn)質(zhì)押合同生效期限及資產(chǎn)處置方式說明
- 二零二五年度證券投資法律合同
- 二零二五年度電梯門套安裝及售后保障服務(wù)合同
- 二零二五年度門面房租賃合同(含裝修補償條款)
- 2025版學(xué)生校外住宿安全責(zé)任與保障協(xié)議3篇
- 2025年度民房屋租賃合同附租賃雙方隱私保護(hù)協(xié)議4篇
- 二零二五年度2025版高端實木板材進(jìn)口貿(mào)易合同4篇
- 2025年度船舶燃料供應(yīng)及價格風(fēng)險管理股份合作協(xié)議3篇
- 二零二五年度臨時工炊事員聘用及廚房消防安全合同3篇
- 二零二五版臨時建筑工地租賃合同范本8篇
- 2024年全國體育專業(yè)單獨招生考試數(shù)學(xué)試卷試題真題(含答案)
- 北師大版小學(xué)三年級上冊數(shù)學(xué)第五單元《周長》測試卷(含答案)
- DB45T 1950-2019 對葉百部生產(chǎn)技術(shù)規(guī)程
- 2025屆河北省衡水市衡水中學(xué)高考仿真模擬英語試卷含解析
- 新修訂《保密法》知識考試題及答案
- 電工基礎(chǔ)知識培訓(xùn)課程
- 住宅樓安全性檢測鑒定方案
- 廣東省潮州市潮安區(qū)2023-2024學(xué)年五年級上學(xué)期期末考試數(shù)學(xué)試題
- 市政道路及設(shè)施零星養(yǎng)護(hù)服務(wù)技術(shù)方案(技術(shù)標(biāo))
- 《論語》學(xué)而篇-第一課件
- 《寫美食有方法》課件
評論
0/150
提交評論