版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
博弈論主講施錫銓2004年3月第一章引論應(yīng)用及例題基本理論博弈論關(guān)注的是互相依存(interdependence)
每一個(gè)體猜測其他個(gè)體的選擇是什么?每個(gè)人將采取什么樣的行動(dòng)?(當(dāng)最優(yōu)的行動(dòng)依賴于其他人的所作所為時(shí),這個(gè)問題尤其令人關(guān)注。)
這些行動(dòng)產(chǎn)生什么樣的結(jié)局?對(duì)于整個(gè)群體,這個(gè)結(jié)局好嗎?如果群體不止一次地互相作用,會(huì)有任何差異嗎?如果每一個(gè)體對(duì)群體內(nèi)其他個(gè)體的特性沒有把握,答案將發(fā)生怎樣的變化?取自經(jīng)濟(jì)學(xué),政治學(xué),財(cái)政金融,法律,甚至日常生活中的若干相互依存性事例
藝術(shù)品拍賣(諸如在克里斯蒂(Christie)或索士比(Sotheby)拍賣行,那里待售出自布拉克(Braque)直至維羅內(nèi)塞(Veronese)的藝術(shù)品)和債券拍賣(美國財(cái)政部為籌措聯(lián)邦預(yù)算支出,以這種方式出售政府公債)。聯(lián)合國的選舉(例如,選舉新的聯(lián)合國秘書長)。動(dòng)物爭斗(爭奪良好的棲息地以及種類中稀少的發(fā)情期雌性動(dòng)物,等等)。自然資源的可持續(xù)使用(像石油那樣的可耗盡資源或像森林那樣的可重建資源的提取形式)。運(yùn)動(dòng)會(huì)和工作場所的隨機(jī)藥物檢測(選取少量運(yùn)動(dòng)員和工作人員進(jìn)行核實(shí)使用違禁藥物的測試)。破產(chǎn)法(詳細(xì)說明在什么時(shí)候和有多少債權(quán)人可以從已破產(chǎn)的公司那兒收賬)?!岸舅帯睏l款(該條款給予管理部門一定的權(quán)限以抵制不受歡迎者試圖接管或兼并他們的公司)
R&D開支(譬如,制藥公司的研究開發(fā)費(fèi)用)
第一次世界大戰(zhàn)的壕溝戰(zhàn)(在法德之間的邊界地區(qū),當(dāng)軍隊(duì)連續(xù)數(shù)月地互相對(duì)峙時(shí),掘進(jìn)到敵方的戰(zhàn)壕里去)
OPEC(石油卡特爾,控制著世界石油產(chǎn)量的一半,因此,在決定人們支付油價(jià)方面擁有重要的發(fā)言權(quán)
群體項(xiàng)目(諸如為你們的博弈論課程準(zhǔn)備案例研究)
博弈論——分析在一群舉止行為頗具策略的理性人之間的相互作用的正規(guī)方法。博弈論是考慮以下每一項(xiàng)條款的正規(guī)方法:群體——在任何博弈中有不止一個(gè)決策者;每一個(gè)決策者稱為局中人相互作用——任何單個(gè)局中人的行為直接影響到群體內(nèi)至少一個(gè)其他的局中人。策略——單個(gè)局中人在決定自己所取的行動(dòng)時(shí),會(huì)考慮到相互依存性。理性——在考慮到這種相互依存性時(shí),每一個(gè)局中人會(huì)選擇自己的最優(yōu)行動(dòng)。
來自日常生活中的例子
致力于一項(xiàng)群體項(xiàng)目,為博弈論課程準(zhǔn)備案例研究:“群體”包括一起做案例的學(xué)生。他們之間的“相互作用”來自于這樣的事實(shí):為了寫一篇論文,需要付出一定的工作量;因此,如果一個(gè)學(xué)生偷懶,另外的某個(gè)人在論文到期前的夜晚不得不投入額外的幾個(gè)小時(shí)。“策略”運(yùn)用包含了估計(jì)群體內(nèi)總想占別人便宜者的可能性,“理性”參與需要對(duì)較好分?jǐn)?shù)的好處與額外工作的成本仔細(xì)地進(jìn)行比較。
(奧林匹克運(yùn)動(dòng)會(huì)中)中隨機(jī)藥物檢測:“群體”由比賽運(yùn)動(dòng)員和國際奧林匹克委員會(huì)(IOC)組成。“相互作用”是兩方面的,一方面是運(yùn)動(dòng)員之間的相互作用——他們做出在訓(xùn)練安排中和不管什么情況下一樣服禁藥的決策;另一方面是在運(yùn)動(dòng)員與IOC之間的相互作用,后者需要維護(hù)運(yùn)動(dòng)的聲譽(yù)?!袄硇圆呗浴钡膽?yīng)用需要運(yùn)動(dòng)員根據(jù)獲勝的機(jī)會(huì)以及如果服用了興奮劑之后被逮到的機(jī)會(huì)之間進(jìn)行比較而作出決策。類似地,它要求IOC根據(jù)檢測成本和清白聲譽(yù)的價(jià)值而制定藥物檢測的程序和相應(yīng)的懲罰措施。
經(jīng)濟(jì)與財(cái)政金融的例子
制藥公司的R&D效果:某些評(píng)估表明,研究與開發(fā)(R&D)經(jīng)費(fèi)支出占美國制藥公司年銷售額的20%之多。以及平均來說,一種新藥的開發(fā)成本大約為3億5千萬美元。公司自然關(guān)心諸如資金投入哪一條生產(chǎn)線,新藥定價(jià)應(yīng)多高,如何縮減與新藥開發(fā)相伴的風(fēng)險(xiǎn),等等問題。在這個(gè)例子中,“群體”是藥物公司全體組成的集合?!跋嗷プ饔谩逼鹨蛴谒幍淖钕乳_發(fā)者將獲得最大的收益(由于專利權(quán)的緣故)。如果R&D經(jīng)費(fèi)的選取大小使得在確知競爭者對(duì)這條新藥生產(chǎn)線進(jìn)行投資的前提下能最大化從新藥開發(fā)中得到收益,那么“R&D”經(jīng)費(fèi)是策略性的和是理性的。
債券拍賣:正常情況下,美國財(cái)政部通過拍賣形式處理政府證券*。主要的投標(biāo)人是投資銀行,如萊曼兄弟(LehmanBrothers)
或摩里爾林奇(MerrillLynch)等(他們轉(zhuǎn)而將證券出售給他們的客戶)。因此,“群體”就是投資銀行組成的集合。(實(shí)際上,從一次拍賣到又一次拍賣,這些投標(biāo)人極少發(fā)生改變。)他們“互相作用和影響”著,因?yàn)槠渌说臉?biāo)價(jià)決定了一個(gè)投標(biāo)人是否分配到任何債券,也可能決定了投標(biāo)人支付的價(jià)錢。如果投標(biāo)基于可能的競爭上和在支付太多與得不到任何債券的風(fēng)險(xiǎn)之間達(dá)到適當(dāng)?shù)钠胶?,那么,“出價(jià)”是“理性的”和“策略的”。
*
這些證券是公債和國庫債券,以及公共部門(或者他們的代理人,例如共同基金信托公司或養(yǎng)老基金等)所擁有的準(zhǔn)金融債券。這些證券承諾在一個(gè)固定的周期(譬如,三個(gè)月,一年,或五年)后支付一筆錢。另外,他們也可能承諾在證券有效期內(nèi)定期地支付固定額的錢款。來自生物學(xué)與法律方面的例子
動(dòng)物習(xí)性:剛過去的25年里,博弈論更吸引人的應(yīng)用之一已經(jīng)深入生物學(xué)領(lǐng)域,特別是關(guān)于動(dòng)物之間爭斗和競爭的分析。通常野生動(dòng)物不得不為了稀少資源(諸如具繁殖能力的雌性動(dòng)物或者動(dòng)物的尸體)而競爭;于是,為了發(fā)現(xiàn)這些資源——或者為了從發(fā)現(xiàn)者那兒奪取資源,它們會(huì)有所付出。問題在于這種做法會(huì)導(dǎo)致代價(jià)昂貴的爭斗。這里,“局中人群體”是眼睛盯著同一獵物的所有動(dòng)物。由于資源的有限性,它們互相影響著。假如它們考慮競爭對(duì)手做出反應(yīng),選擇就是“策略”,如果由于這種“策略”滿足了它們的短期目標(biāo),譬如解決了饑餓,或者滿足了它們的長期目標(biāo),譬如保持了物種的繁衍不絕,這樣的選擇是“理性的”。
破產(chǎn)法:在美國,一旦公司宣告破產(chǎn),它的財(cái)產(chǎn)不再由單獨(dú)的債權(quán)人扣押,而代之以安全保管,直至公司與它的債權(quán)人達(dá)成某種程度的諒解。但是,債權(quán)人可以在破產(chǎn)宣告之前促使法庭去收帳(雖然通過這種做法債權(quán)人可能逼迫公司陷入破產(chǎn))。這里,債權(quán)人“群體”內(nèi)的“相互作用”來自于這樣的事實(shí):個(gè)別債權(quán)人能夠成功地依法占有的錢就不再可能屬于其他任何一個(gè)人。“策略”的選取需要估計(jì)其他債權(quán)人可能有多大耐心,而“理性的”選擇包含了在早收賬與逼迫公司不必要的破產(chǎn)之間的權(quán)衡。
例題
1.拿子游戲(Nim和Marienbad)
這是兩個(gè)室內(nèi)游戲,玩法如下。有兩堆火柴,和兩個(gè)局中人。游戲從局中人1開始,此后局中人輪流行動(dòng)。在每個(gè)局中人的輪次里,他可以從兩堆火柴的任一堆中拿走任何數(shù)量的火柴。只要任何一堆中尚有剩余的火柴,則要求每個(gè)局中人拿走一定數(shù)量且不能空手而返,但每個(gè)輪次只能從一堆中取火柴。在“拿子游戲”Nim中,無論那個(gè)局中人,取走最後火柴者算贏。而在Marienbad,誰拿走最后的火柴,那么這個(gè)局中人就算輸。
2.投票
假設(shè)有兩個(gè)競爭議案,這里表示為A與B,3個(gè)議員,投票人1,2和3,他們投票決定是否通過這些議案。結(jié)局可能會(huì)是兩種中的某一個(gè):要么通過A和B中的一個(gè),要么議員們沒有通過任何一項(xiàng)議案(延緩而以原來法律代替)。投票過程如下:首先,讓議案A與議案B互相競爭;然后,競爭的獲勝方與原來法律互相競爭,為簡便起見,我們將原法律稱為“都不贊成”(或者N)。在兩輪投票中的每一輪,獲多數(shù)票的法案算勝出。三個(gè)議員在可適用的選擇中有如下偏好:
投票人1:投票人2:投票人3:(這里,表示“喜歡議案A甚于喜歡議案B”)
3.囚徒困境
克雷\卡爾文
認(rèn)罪
不認(rèn)罪
認(rèn)罪 5,5 0,15
不認(rèn)罪 15,0 1,1總
結(jié)
博弈論是研究相互依存性的。它研究局中人群體中的互相作用,這些局中人根據(jù)策略地分析群體內(nèi)其他人可能做什么而進(jìn)行理性的選擇。博弈論可以應(yīng)用于諸如自然資源的使用,選取聯(lián)合國秘書長,動(dòng)物習(xí)性,和OPEC的生產(chǎn)策略等廣泛不同的問題。博弈論的創(chuàng)建追溯到150年前。但是,學(xué)科的主要發(fā)展是近代的,大約在最近50年期間,使得博弈論成為經(jīng)濟(jì)學(xué)與數(shù)學(xué)范圍內(nèi)最年輕的學(xué)科之一。如拿子游戲和囚徒困境這種博弈的策略分析可以揭示理性局中人將達(dá)到的結(jié)局。對(duì)于整個(gè)局中人群體來說,這些結(jié)局并不總是稱心的。博弈的規(guī)則:
每個(gè)博弈通過一組規(guī)則進(jìn)行,規(guī)則必須說明四件事:“誰”(Who)在參與——策略地互相作用的局中人群體。
他們以“什么”(What)來參與——每個(gè)局中人可使用的策略供替代的行動(dòng)或選擇。
每個(gè)局中人“何時(shí)”(When)行動(dòng)(以什么順序)從參與博弈所作的選擇中,他們得到(或失去)“多少”(Howmuch)關(guān)于規(guī)則的共同知識(shí)每一個(gè)局中人知道博弈的規(guī)則,并且這一現(xiàn)象是眾所周知的。
“誰”,“什么”,和“何時(shí)”:展開型
展開型規(guī)則的一種圖形表示式。主要的畫圖形式稱為博弈樹,是由一個(gè)根和若干枝依次排列組成。
信息集和策略
在展開型里怎樣表示同時(shí)行動(dòng)
局中人1局中人2cnccnn信息集決策結(jié)的集合,局中人不能區(qū)分這些決策結(jié)策略局中人的策略是指在局中人需要做出選擇的信息集處可采取的行動(dòng)。
策略是行動(dòng)的藍(lán)圖,在每一個(gè)決策結(jié)告訴局中人如何去選擇。由于局中人在任何一個(gè)信息集里不能區(qū)分決策結(jié),策略詳細(xì)說明了在每一個(gè)結(jié)所做的行動(dòng)。
正則(或策略)型
博弈規(guī)則中另一種表示方式稱為正則型或策略型策略型有關(guān)“局中人,他們每一個(gè)人可使用的策略,和每人的得益”的完整的一覽表。
sss
ssb
ssc
bbs … ccb
ccs
cccb N,T N,T N,T T,N N,T N,T N,Tc T,N T,N T,N T,N T,N T,N T,Ns T,N T,N N,T T,N T,N T,N N,T局中人2局中人1馮諾伊曼——摩根斯坦效用函數(shù)
拿子游戲Nim
假設(shè)在一堆中有2根火柴,在另一堆中有1根火柴。記這個(gè)布局為(2,1)。與贏相聯(lián)的盈利數(shù)必定高于對(duì)應(yīng)于輸?shù)挠麛?shù);假設(shè)這些數(shù)分別為1與-1。局中人1局中人11,-11,-1-1,1局中人2(0,0)-1,11,-1(2,1)(0,1)l局中人2(1,0)(0,1)(1,1)(1,0)(2,0)rLuRdm策略型表示式如下:
1/2 lL lR rL rRu 1,-1 1,-1 1,-1 1,-1m -1,1 -1,1 -1,1 -1,1d 1,-1 -1,1 1,-1 -1,1投票博弈
假如一個(gè)投票人所贊成的議案通過,她得到的盈利為1。如果她的第二個(gè)選擇通過,則盈利為0,如果她最不贊同的抉擇通過,此時(shí)她的盈利是-1。
投票人2投票人3投票人1ABBBBBABAAABAA投票人1投票人2投票人3ANNNNNAAAANANA0,-1,11,0,0囚徒困境
局中人1局中人2cnnc-5,-50,-15nc-15,0-1,-1博弈的展開型
策略型
1\2 c
n
c -5,-5 0,-15
n -15,0 -1,-1總
結(jié)
1.博弈規(guī)則必須明確說明局中人是“誰”,每個(gè)局中人可使用的選擇是“什么”,和從局中人群體所作的一組選擇中,每個(gè)局
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版電商數(shù)據(jù)分析與優(yōu)化代運(yùn)營合同3篇
- 2024-2025學(xué)年高中歷史第二單元中國古代文藝長廊第7課漢字與書法課時(shí)作業(yè)含解析岳麓版必修3
- 2024-2025學(xué)年高中歷史第6單元辛亥革命與中華民國的建立第20課北洋軍閥統(tǒng)治時(shí)期的政治經(jīng)濟(jì)與文化經(jīng)典題集錦含解析新人教版必修中外歷史綱要上
- 2024音樂人授權(quán)影視作品使用其音樂合同
- 二零二四年度4S店租賃期內(nèi)合同解除與違約金協(xié)議
- 二零二五版電子支付終端機(jī)租賃與物聯(lián)網(wǎng)技術(shù)應(yīng)用合同3篇
- 2025年度邊緣計(jì)算框架研發(fā)與推廣合同3篇
- 民政局離婚協(xié)議書參考樣本
- 2024陶瓷水杯采購合同范本文檔
- 物聯(lián)網(wǎng)技術(shù)推廣應(yīng)用合同
- 二年級(jí)語文下冊背誦內(nèi)容(全部)
- 繪本《圖書館獅子》原文
- 給水管道施工與安裝技術(shù)要求(課件)
- 警輔 培訓(xùn) 課件
- 安全使用公共WiFi網(wǎng)絡(luò)的方法
- 法拍輔助工作管理制度
- 中控室保密與信息安全政策
- 后端開發(fā)年終總結(jié)
- 2023年管理學(xué)原理考試題庫附答案
- 萬達(dá)廣場營銷活動(dòng)管理及效果考核規(guī)定
- 過敏性皮炎的護(hù)理查房
評(píng)論
0/150
提交評(píng)論