版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、博弈論 主講 施錫銓 2004年3月 第一章 引論 應(yīng)用及例題 基本理論 博弈論關(guān)注的是互相依存(interdependence) 每一個(gè)體猜測(cè)其他個(gè)體的選擇是什么? 每個(gè)人將采取什么樣的行動(dòng)?(當(dāng)最優(yōu)的行動(dòng)依賴于 其他人的所作所為時(shí),這個(gè)問題尤其令人關(guān)注。) 這些行動(dòng)產(chǎn)生什么樣的結(jié)局?對(duì)于整個(gè)群體,這個(gè) 結(jié)局好嗎? 如果群體不止一次地互相作用,會(huì)有任何差異嗎? 如果每一個(gè)體對(duì)群體內(nèi)其他個(gè)體的特性沒有把握, 答案將發(fā)生怎樣的變化? 取自經(jīng)濟(jì)學(xué),政治學(xué),財(cái)政金融,法律,甚至日 常生活中的若干相互依存性事例 藝術(shù)品拍賣 (諸如在克里斯蒂(Christie) 或索士比(Sotheby)拍賣行,那里待
2、售出 自布拉克(Braque)直至維羅內(nèi)塞 (Veronese)的藝術(shù)品)和債券拍賣(美國(guó) 財(cái)政部為籌措聯(lián)邦預(yù)算支出,以這種方式 出售政府公債) 。 聯(lián)合國(guó)的選舉( 例如,選舉新的聯(lián)合國(guó)秘 書長(zhǎng)) 。 動(dòng)物爭(zhēng)斗(爭(zhēng)奪良好的棲息地以及種類中 稀少的發(fā)情期雌性動(dòng)物,等等)。 自然資源的可持續(xù)使用(像石油那樣的可 耗盡資源或像森林那樣的可重建資源的提 取形式) 。 運(yùn)動(dòng)會(huì)和工作場(chǎng)所的隨機(jī)藥物檢測(cè)(選取 少量運(yùn)動(dòng)員和工作人員進(jìn)行核實(shí)使用違禁 藥物的測(cè)試) 。 破產(chǎn)法(詳細(xì)說明在什么時(shí)候和有多少債 權(quán)人可以從已破產(chǎn)的公司那兒收賬) 。 “毒藥”條款(該條款給予管理部門一定的權(quán) 限以抵制不受歡迎者試圖接管
3、或兼并他們的公 司) R&D開支(譬如,制藥公司的研究開發(fā)費(fèi)用) 第一次世界大戰(zhàn)的壕溝戰(zhàn)(在法德之間的邊界 地區(qū),當(dāng)軍隊(duì)連續(xù)數(shù)月地互相對(duì)峙時(shí),掘進(jìn)到 敵方的戰(zhàn)壕里去) OPEC(石油卡特爾,控制著世界石油產(chǎn)量的 一半,因此,在決定人們支付油價(jià)方面擁有重 要的發(fā)言權(quán) 群體項(xiàng)目(諸如為你們的博弈論課程準(zhǔn)備案例 研究) 博弈論博弈論 分析在一群舉止行為頗具 策略的理性人之間的相互 作用的正規(guī)方法。 博弈論博弈論是考慮以下每一項(xiàng)條款的 正規(guī)方法: 群體群體在任何博弈中有不止一個(gè)決策者; 每一個(gè)決策者稱為局中人 相互作用相互作用任何單個(gè)局中人的行為直接 影響到群體內(nèi)至少一個(gè)其他的局中人。 策略策略單個(gè)局
4、中人在決定自己所取的行 動(dòng)時(shí),會(huì)考慮到相互依存性。 理性理性在考慮到這種相互依存性時(shí),每 一個(gè)局中人會(huì)選擇自己的最優(yōu)行動(dòng)。 來自日常生活中的例子來自日常生活中的例子 致力于一項(xiàng)群體項(xiàng)目,為博弈論課程準(zhǔn)備 案例研究:“群體”包括一起做案例的學(xué) 生。他們之間的“相互作用”來自于這樣 的事實(shí):為了寫一篇論文,需要付出一定 的工作量;因此,如果一個(gè)學(xué)生偷懶,另 外的某個(gè)人在論文到期前的夜晚不得不投 入額外的幾個(gè)小時(shí)?!安呗浴边\(yùn)用包含了 估計(jì)群體內(nèi)總想占別人便宜者的可能性, “理性”參與需要對(duì)較好分?jǐn)?shù)的好處與額 外工作的成本仔細(xì)地進(jìn)行比較。 (奧林匹克運(yùn)動(dòng)會(huì)中)中隨機(jī)藥物檢測(cè): “群體”由比賽運(yùn)動(dòng)員和國(guó)
5、際奧林匹克委員 會(huì)(IOC)組成。“相互作用”是兩方面的, 一方面是運(yùn)動(dòng)員之間的相互作用他們做 出在訓(xùn)練安排中和不管什么情況下一樣服禁 藥的決策;另一方面是在運(yùn)動(dòng)員與IOC之間的 相互作用,后者需要維護(hù)運(yùn)動(dòng)的聲譽(yù)?!袄?性策略”的應(yīng)用需要運(yùn)動(dòng)員根據(jù)獲勝的機(jī)會(huì) 以及如果服用了興奮劑之后被逮到的機(jī)會(huì)之 間進(jìn)行比較而作出決策。類似地,它要求IOC 根據(jù)檢測(cè)成本和清白聲譽(yù)的價(jià)值而制定藥物 檢測(cè)的程序和相應(yīng)的懲罰措施。 經(jīng)濟(jì)與財(cái)政金融的例子經(jīng)濟(jì)與財(cái)政金融的例子 制藥公司的R&D效果:某些評(píng)估表明,研究與 開發(fā)(R&D)經(jīng)費(fèi)支出占美國(guó)制藥公司年銷售 額的20%之多。以及平均來說,一種新藥的開 發(fā)成本大約為
6、3億5千萬美元。公司自然關(guān)心諸 如資金投入哪一條生產(chǎn)線,新藥定價(jià)應(yīng)多高, 如何縮減與新藥開發(fā)相伴的風(fēng)險(xiǎn),等等問題。 在這個(gè)例子中,“群體”是藥物公司全體組成 的集合?!跋嗷プ饔谩逼鹨蛴谒幍淖钕乳_發(fā)者 將獲得最大的收益(由于專利權(quán)的緣故)。如 果R&D經(jīng)費(fèi)的選取大小使得在確知競(jìng)爭(zhēng)者對(duì)這 條新藥生產(chǎn)線進(jìn)行投資的前提下能最大化從新 藥開發(fā)中得到收益,那么 “R&D” 經(jīng)費(fèi)是策略 性的和是理性的。 債券拍賣:正常情況下,美國(guó)財(cái)政部通過拍賣形式處 理政府證券*。主要的投標(biāo)人是投資銀行,如萊曼兄 弟(Lehman Brothers) 或摩里爾林奇(Merrill Lynch)等(他們轉(zhuǎn)而將證券出售給他們的
7、客戶)。 因此,“群體”就是投資銀行組成的集合。(實(shí)際上, 從一次拍賣到又一次拍賣,這些投標(biāo)人極少發(fā)生改 變。)他們“互相作用和影響”著,因?yàn)槠渌说臉?biāo) 價(jià)決定了一個(gè)投標(biāo)人是否分配到任何債券,也可能決 定了投標(biāo)人支付的價(jià)錢。如果投標(biāo)基于可能的競(jìng)爭(zhēng)上 和在支付太多與得不到任何債券的風(fēng)險(xiǎn)之間達(dá)到適當(dāng) 的平衡,那么,“出價(jià)”是“理性的”和“策略的”。 * 這些證券是公債和國(guó)庫(kù)債券,以及公共部門(或者他們的代理人,例 如共同基金信托公司或養(yǎng)老基金等)所擁有的準(zhǔn)金融債券。這些證券 承諾在一個(gè)固定的周期(譬如,三個(gè)月,一年,或五年)后支付一筆 錢。另外,他們也可能承諾在證券有效期內(nèi)定期地支付固定額的錢款。
8、 來自生物學(xué)與法律方面的例子來自生物學(xué)與法律方面的例子 動(dòng)物習(xí)性:剛過去的25年里,博弈論更吸引人的應(yīng)用 之一已經(jīng)深入生物學(xué)領(lǐng)域,特別是關(guān)于動(dòng)物之間爭(zhēng)斗 和競(jìng)爭(zhēng)的分析。通常野生動(dòng)物不得不為了稀少資源 (諸如具繁殖能力的雌性動(dòng)物或者動(dòng)物的尸體)而競(jìng) 爭(zhēng);于是,為了發(fā)現(xiàn)這些資源或者為了從發(fā)現(xiàn)者 那兒奪取資源,它們會(huì)有所付出。問題在于這種做法 會(huì)導(dǎo)致代價(jià)昂貴的爭(zhēng)斗。這里,“局中人群體”是眼 睛盯著同一獵物的所有動(dòng)物。由于資源的有限性,它 們互相影響著。假如它們考慮競(jìng)爭(zhēng)對(duì)手做出反應(yīng),選 擇就是“策略”,如果由于這種“策略”滿足了它們 的短期目標(biāo),譬如解決了饑餓,或者滿足了它們的長(zhǎng) 期目標(biāo),譬如保持了物
9、種的繁衍不絕,這樣的選擇是 “理性的”。 破產(chǎn)法:在美國(guó),一旦公司宣告破產(chǎn),它的 財(cái)產(chǎn)不再由單獨(dú)的債權(quán)人扣押,而代之以安 全保管,直至公司與它的債權(quán)人達(dá)成某種程 度的諒解。但是,債權(quán)人可以在破產(chǎn)宣告之 前促使法庭去收帳 (雖然通過這種做法債權(quán)人 可能逼迫公司陷入破產(chǎn))。這里,債權(quán)人“群 體”內(nèi)的“相互作用”來自于這樣的事實(shí): 個(gè)別債權(quán)人能夠成功地依法占有的錢就不再 可能屬于其他任何一個(gè)人?!安呗浴钡倪x取 需要估計(jì)其他債權(quán)人可能有多大耐心,而 “理性的”選擇包含了在早收賬與逼迫公司 不必要的破產(chǎn)之間的權(quán)衡。 例題 1. 1. 拿子游戲拿子游戲 ( (NimNim和和MarienbadMarien
10、bad) ) 這是兩個(gè)室內(nèi)游戲,玩法如下。有兩堆火柴,和兩 個(gè)局中人。游戲從局中人1開始,此后局中人輪 流行動(dòng)。在每個(gè)局中人的輪次里,他可以從兩 堆火柴的任一堆中拿走任何數(shù)量的火柴。只要 任何一堆中尚有剩余的火柴,則要求每個(gè)局中 人拿走一定數(shù)量且不能空手而返,但每個(gè)輪次 只能從一堆中取火柴。 在“拿子游戲”Nim中,無論那個(gè)局中人,取走最 後火柴者算贏。而在Marienbad,誰(shuí)拿走最后 的火柴,那么這個(gè)局中人就算輸。 2. 2. 投票投票 假設(shè)有兩個(gè)競(jìng)爭(zhēng)議案,這里表示為與,3個(gè)議員, 投票人1,2和3,他們投票決定是否通過這些議案。 結(jié)局可能會(huì)是兩種中的某一個(gè):要么通過和中的 一個(gè),要么議員
11、們沒有通過任何一項(xiàng)議案(延緩而以 原來法律代替)。投票過程如下:首先,讓議案A與 議案B互相競(jìng)爭(zhēng);然后,競(jìng)爭(zhēng)的獲勝方與原來法律互 相競(jìng)爭(zhēng),為簡(jiǎn)便起見,我們將原法律稱為“都不贊成” (或者N)。在兩輪投票中的每一輪,獲多數(shù)票的法 案算勝出。三個(gè)議員在可適用的選擇中有如下偏好: 投票人1: 投票人2: 投票人3: (這里, 表示“喜歡議案A甚于喜歡議案B”) BAN NAB BNA BA 3. 3. 囚徒困境囚徒困境 克雷卡爾文 認(rèn)罪 不認(rèn)罪 認(rèn)罪 5,5 0,15 不認(rèn)罪15,0 1,1 總總 結(jié)結(jié) 1.博弈論是研究相互依存性的。它研究局中人群體中 的互相作用,這些局中人根據(jù)策略地分析群體內(nèi)其他
12、 人可能做什么而進(jìn)行理性的選擇。 2.博弈論可以應(yīng)用于諸如自然資源的使用,選取聯(lián)合 國(guó)秘書長(zhǎng),動(dòng)物習(xí)性,和OPEC的生產(chǎn)策略等廣泛不 同的問題。 3.博弈論的創(chuàng)建追溯到150年前。但是,學(xué)科的主要 發(fā)展是近代的,大約在最近50年期間,使得博弈論成 為經(jīng)濟(jì)學(xué)與數(shù)學(xué)范圍內(nèi)最年輕的學(xué)科之一。 4.如拿子游戲和囚徒困境這種博弈的策略分析可以揭 示理性局中人將達(dá)到的結(jié)局。對(duì)于整個(gè)局中人群體來 說,這些結(jié)局并不總是稱心的。 博弈的規(guī)則: 每個(gè)博弈通過一組規(guī)則進(jìn)行,規(guī)則必須說明四件事: “誰(shuí)誰(shuí)”(Who)在參與策略地互相作用的局 中人群體。 他們以“什么什么”(What)來參與每個(gè)局中人 可使用的策略供替代
13、的行動(dòng)或選擇。 每個(gè)局中人“何時(shí)何時(shí)”(When)行動(dòng)(以什么順序) 從參與博弈所作的選擇中,他們得到(或失去) “多少多少”(How much) 關(guān)于規(guī)則的共同知識(shí)關(guān)于規(guī)則的共同知識(shí) 每一個(gè)局中人知道博弈的規(guī)則,并且這一現(xiàn)象是眾所 周知的。 “誰(shuí)”,“什么”,和“何時(shí)”: 展開型 展開型展開型 規(guī)則的一種圖形表示式。主要的畫圖形式稱 為博弈樹,是由一個(gè)根和若干枝依次排列 組成。 b c s b c s R1 R2 A H E L R1= 路線 1 R2= 路線 2 H= 高架路 A= 大街 E= 特快 L= 慢車 信息集和策略 在展開型里怎樣表示同時(shí)行動(dòng) 局中人1 局中人2 c n c c
14、n n 信息集信息集 決策結(jié)的集合,局 中人不能區(qū)分這些 決策結(jié) 策略策略 局中人的策略是指 在局中人需要做出 選擇的信息集處可 采取的行動(dòng)。 策略是行動(dòng)的藍(lán)圖,在每一個(gè)決策結(jié)告訴局中人如何 去選擇。由于局中人在任何一個(gè)信息集里不能區(qū)分決 策結(jié),策略詳細(xì)說明了在每一個(gè)結(jié)所做的行動(dòng)。 正則(或策略)型 博弈規(guī)則中另一種表示方式稱為正則型正則型或策略型策略型 策略型策略型 有關(guān)“局中人,他們每一個(gè)人可使用的策略,和每人 的得益”的完整的一覽表。 sssssbsscbbsccbccsccc bN, TN, TN, TT, NN, TN, TN, T cT, NT, NT, NT, NT, NT, N
15、T, N sT, NT, NN, TT, NT, NT, NN, T 局中人2 局中人1 馮諾伊曼摩根斯坦效用函數(shù) 拿子游戲拿子游戲 Nim 假設(shè)在一堆中有2根火柴,在另一堆中有1根火柴。記這 個(gè)布局為(2,1)。與贏相聯(lián)的盈利數(shù)必定高于對(duì)應(yīng) 于輸?shù)挠麛?shù);假設(shè)這些數(shù)分別為1與-1。 局中人1 局中人1 1,-1 1,-1 -1,1 局中人2 (0,0) -1,1 1,-1 (2,1)(0,1) l 局中人2 (1,0) (0,1) (1,1) (1,0) (2,0) r L u R d m 策略型表示式如下: 1 / 2lLlRrLrR u1, -11, -11,-11, -1 m-1, 1
16、-1, 1-1, 1-1, 1 d1, -1-1, 11, -1-1, 1 投票博弈投票博弈 假如一個(gè)投票人所贊成的議案通過,她得到的盈 利為1。如果她的第二個(gè)選擇通過,則盈利為0, 如果她最不贊同的抉擇通過,此時(shí)她的盈利是-1。 投票人2 投票人3 投票人1 A B B B B B A B A A AB A A 投票人1 投票人2 投票人3 A N N N N N A A A AN A N A 0,-1,1 1,0,0 囚徒困境囚徒困境 局中人1 局中人2 c n n c-5,-5 0,-15 n c-15,0 -1,-1 博弈的展開型 策略型 1 2 c n c-5, -50, -15 n-15, 0-1, -1 總總 結(jié)結(jié) 1博弈規(guī)則必須明確說明局中人是“誰(shuí)”,每個(gè)局中人 可使用的選擇是“什么”,和從局中人群體所作的一組
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 哺乳期解除勞動(dòng)合同協(xié)議范本
- 2024年房屋補(bǔ)漏維修工程合同
- 2024專項(xiàng)資金借款的合同范本
- 員工聘用合同協(xié)議書范文2024年
- 建設(shè)工程內(nèi)部承包合同書2024年
- 2024新款供貨合同協(xié)議書
- 2024【流動(dòng)資金外匯借貸合同】公司流動(dòng)資金合同
- 2024年公司股東之間借款合同實(shí)例
- 專業(yè)房屋買賣合同模板大全
- 2024年事業(yè)單位聘用
- 小兒血液透析的護(hù)理
- 人教版(2024新版)七年級(jí)上冊(cè)數(shù)學(xué)期中模擬檢測(cè)試卷(含答案)
- 2024人工智能技術(shù)在內(nèi)容創(chuàng)作和營(yíng)銷領(lǐng)域的應(yīng)用及影響分析報(bào)告
- 《籃球原地運(yùn)球 行進(jìn)間運(yùn)球》教案(共三篇)
- 2024-2030年中國(guó)裸眼3D行業(yè)市場(chǎng)全景調(diào)研與競(jìng)爭(zhēng)格局分析報(bào)告
- 2025年九省聯(lián)考新高考 政治試卷(含答案解析)
- 2024年統(tǒng)編版小學(xué)六年級(jí)《道德與法治》上冊(cè)第四單元 法律保護(hù)我們健康成長(zhǎng) 9.《知法守法 依法維權(quán)》 第一課時(shí) 課件
- 期中測(cè)試卷-2024-2025學(xué)年語(yǔ)文六年級(jí)上冊(cè)統(tǒng)編版
- 學(xué)校消防系統(tǒng)維保及檢測(cè)總體服務(wù)方案
- 網(wǎng)絡(luò)安全試題題庫(kù)及參考答案
- 終極戰(zhàn)略規(guī)劃指南:深度剖析Cross SWOT分析、市場(chǎng)洞察與內(nèi)部能力優(yōu)化的綜合行動(dòng)方案
評(píng)論
0/150
提交評(píng)論