《博弈論》445頁中英雙語精品全套課件完整版_第1頁
《博弈論》445頁中英雙語精品全套課件完整版_第2頁
《博弈論》445頁中英雙語精品全套課件完整版_第3頁
《博弈論》445頁中英雙語精品全套課件完整版_第4頁
《博弈論》445頁中英雙語精品全套課件完整版_第5頁
已閱讀5頁,還剩440頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博弈論博弈論Game Theory一、博弈一、博弈GameGame 博弈論博弈論Game TheoryGame Theory前言前言PrefacePreface 參與人:兩人及兩人以上;參與人:兩人及兩人以上; 行為:做出決策;行為:做出決策; 行為目標:收益最大化行為目標:收益最大化 環(huán)境條件:目標的實現(xiàn)不僅取決于自己環(huán)境條件:目標的實現(xiàn)不僅取決于自己 的行為,同時還取決于其他的行為,同時還取決于其他 人的行為,個人的最優(yōu)選擇人的行為,個人的最優(yōu)選擇 是其他人選擇的函數(shù)是其他人選擇的函數(shù) 策略性的行為策略性的行為分錢游戲與運輸路線選擇分錢游戲與運輸路線選擇博弈博弈Game: 博弈博弈是指代表

2、不同利益主體的決策者,在一是指代表不同利益主體的決策者,在一 定的環(huán)境條件和規(guī)那么下,同時或先后、一次定的環(huán)境條件和規(guī)那么下,同時或先后、一次 或?qū)掖螐母髯栽试S選擇的行動方案中加以選或?qū)掖螐母髯栽试S選擇的行動方案中加以選 擇并實施,從而取得各自相應結(jié)果的活動。擇并實施,從而取得各自相應結(jié)果的活動。美美Roger B. Myerson一個博弈指的是涉及到一個博弈指的是涉及到 兩個或更多個參與人的某個社會局勢。兩個或更多個參與人的某個社會局勢。英英Adam Smith博弈是個體參與人從各自的博弈是個體參與人從各自的 動機出發(fā)生相互作用的一種狀態(tài)。動機出發(fā)生相互作用的一種狀態(tài)。博弈論博弈論Game

3、Theory,對策論:,對策論:美美Roger B. Myerson博弈論可以被定義博弈論可以被定義 為是智能的理性決策者之間沖突與合作的為是智能的理性決策者之間沖突與合作的 數(shù)學模型的研究。數(shù)學模型的研究。 美美Robert Gibbonsis the study of multi- person decision problems. 張維迎張維迎是研究決策主體的行為發(fā)生直接是研究決策主體的行為發(fā)生直接 相互作用相互作用 時候的決策以及這種決時候的決策以及這種決 策的均衡問題的,也就是說,當策的均衡問題的,也就是說,當 一個主體,好比說一個人或一個主體,好比說一個人或 一個一個 企業(yè)的選擇受

4、到其他人、其他企企業(yè)的選擇受到其他人、其他企 業(yè)選擇的影響,而且反過來影響業(yè)選擇的影響,而且反過來影響 到其他人、其他企業(yè)選擇時的決到其他人、其他企業(yè)選擇時的決 策問題和均衡問題。策問題和均衡問題。 張守一張守一是研究聰明而又理智的決策者在是研究聰明而又理智的決策者在 沖突或合作中的策略選擇理論。沖突或合作中的策略選擇理論。教材教材P5 博弈論就是系統(tǒng)研究各種各博弈論就是系統(tǒng)研究各種各 樣博弈中參與人的合理選擇及其樣博弈中參與人的合理選擇及其 均衡的理論。均衡的理論。關(guān)于關(guān)于“經(jīng)濟博弈論:經(jīng)濟博弈論: 博弈論是研究人們在利益相互影響的格局博弈論是研究人們在利益相互影響的格局中的策略選擇問題、是

5、研究多人決策問題的理中的策略選擇問題、是研究多人決策問題的理論。而策略選擇是人們經(jīng)濟行為的核心內(nèi)容,論。而策略選擇是人們經(jīng)濟行為的核心內(nèi)容,此外,經(jīng)濟學和博弈論的研究模式是一樣的:此外,經(jīng)濟學和博弈論的研究模式是一樣的:即強調(diào)個人理性,也就是在給定的約束條件下即強調(diào)個人理性,也就是在給定的約束條件下追求效用最大化。可見,經(jīng)濟學和博弈論具追求效用最大化??梢?,經(jīng)濟學和博弈論具有內(nèi)在的聯(lián)系。在經(jīng)濟學和博弈論具有的這有內(nèi)在的聯(lián)系。在經(jīng)濟學和博弈論具有的這種天然聯(lián)系的根底上產(chǎn)生了經(jīng)濟博弈論。種天然聯(lián)系的根底上產(chǎn)生了經(jīng)濟博弈論。 將博弈的思想明確地應用于經(jīng)濟領(lǐng)域,始將博弈的思想明確地應用于經(jīng)濟領(lǐng)域,始于

6、古諾于古諾Cournot,1838、伯特蘭德、伯特蘭德Bertrand,1883和艾奇沃斯和艾奇沃斯 Edgeworth,1925等人關(guān)于兩寡頭的產(chǎn)量和等人關(guān)于兩寡頭的產(chǎn)量和價格壟斷、產(chǎn)品交易行為的研究,他們通過對價格壟斷、產(chǎn)品交易行為的研究,他們通過對不同的經(jīng)濟行為方式和案例建立了相應的博弈不同的經(jīng)濟行為方式和案例建立了相應的博弈論模型,為經(jīng)濟博弈論的開展提供了思想雛形論模型,為經(jīng)濟博弈論的開展提供了思想雛形和有益嘗試。近半個多世紀以來,博弈論引起和有益嘗試。近半個多世紀以來,博弈論引起了眾多經(jīng)濟學家的極大興趣,使得博弈論在經(jīng)了眾多經(jīng)濟學家的極大興趣,使得博弈論在經(jīng)濟學中的應用模型越來越多。

7、大約從濟學中的應用模型越來越多。大約從20世紀世紀80年代開始,博弈論逐漸成為主流經(jīng)濟學的一局年代開始,博弈論逐漸成為主流經(jīng)濟學的一局部,甚至可以說成為微觀經(jīng)濟學的根底張維部,甚至可以說成為微觀經(jīng)濟學的根底張維迎,迎,P8。 博弈論究竟是一門什么樣的學科呢?有人博弈論究竟是一門什么樣的學科呢?有人認為是經(jīng)濟學的一個分支,有人認為是數(shù)學的認為是經(jīng)濟學的一個分支,有人認為是數(shù)學的一個分支。我們把它看作是一種方法論,即它一個分支。我們把它看作是一種方法論,即它提供了一個觀察問題的新視角、分析問題的新提供了一個觀察問題的新視角、分析問題的新方法和解決問題的新思路;它的應用范圍不僅方法和解決問題的新思路

8、;它的應用范圍不僅包括經(jīng)濟學,像政治學、軍事、外交、國際關(guān)包括經(jīng)濟學,像政治學、軍事、外交、國際關(guān)系、公共選擇、犯罪心理分析等都涉及博弈論。系、公共選擇、犯罪心理分析等都涉及博弈論。只不過從應用的成果來看,博弈論在經(jīng)濟學領(lǐng)只不過從應用的成果來看,博弈論在經(jīng)濟學領(lǐng)域的應用最廣泛、最成功,經(jīng)濟學家對博弈論域的應用最廣泛、最成功,經(jīng)濟學家對博弈論的奉獻也特別大,使得博弈論在經(jīng)濟學領(lǐng)域的的奉獻也特別大,使得博弈論在經(jīng)濟學領(lǐng)域的應用無處不在:微觀研究領(lǐng)域有交易機制的模應用無處不在:微觀研究領(lǐng)域有交易機制的模型如討價還價模型和拍賣模型;型如討價還價模型和拍賣模型;在中觀經(jīng)濟研究中,勞動力經(jīng)濟學和金融理在中

9、觀經(jīng)濟研究中,勞動力經(jīng)濟學和金融理論都有關(guān)于企業(yè)要素投入品市場的博弈模型,論都有關(guān)于企業(yè)要素投入品市場的博弈模型,即使在一個企業(yè)內(nèi)部也存在博弈問題:工人之即使在一個企業(yè)內(nèi)部也存在博弈問題:工人之間會為同一個升遷時機勾心斗角,不同部門之間會為同一個升遷時機勾心斗角,不同部門之間為爭取公司的資金投入相互競爭;從宏觀角間為爭取公司的資金投入相互競爭;從宏觀角度看,國際經(jīng)濟學中有關(guān)于國家間的相互競爭度看,國際經(jīng)濟學中有關(guān)于國家間的相互競爭或相互串謀、選擇關(guān)稅或其他貿(mào)易政策的模型;或相互串謀、選擇關(guān)稅或其他貿(mào)易政策的模型;至于產(chǎn)業(yè)組織理論更是大量應用博弈論的方法至于產(chǎn)業(yè)組織理論更是大量應用博弈論的方法見

10、見Jean Tirole的的?產(chǎn)業(yè)組織理論產(chǎn)業(yè)組織理論?。二、博弈論的產(chǎn)生和開展二、博弈論的產(chǎn)生和開展 博弈思想的根本特征是參與人在追求自己博弈思想的根本特征是參與人在追求自己目標的過程中,不僅僅只是考慮自己能怎么目標的過程中,不僅僅只是考慮自己能怎么做,還必須要考慮其他參與人會怎么做;針做,還必須要考慮其他參與人會怎么做;針對其他參與人的行為,自己該實施哪個可行對其他參與人的行為,自己該實施哪個可行的行動,才能使自己的目標函數(shù)最大化,也的行動,才能使自己的目標函數(shù)最大化,也就是說,在一個博弈格局中,每個參與人所就是說,在一個博弈格局中,每個參與人所實施的行動都是策略性的行動。實施的行動都是策

11、略性的行動。 知己知彼,百戰(zhàn)不殆知己知彼,百戰(zhàn)不殆產(chǎn)生與開展產(chǎn)生與開展 教材教材P1-3 ?現(xiàn)代經(jīng)濟對策論現(xiàn)代經(jīng)濟對策論?P6-7馮馮諾依曼和摩根斯坦諾依曼和摩根斯坦Von.neumann and morgenstern 馮馮 諾依曼是諾依曼是20世紀偉大的數(shù)學家之一,后者是德國人世紀偉大的數(shù)學家之一,后者是德國人1902年生,美國當代杰出經(jīng)濟學家。年生,美國當代杰出經(jīng)濟學家。 ?The theory of Games and Economic Behaviour?的產(chǎn)的產(chǎn)生:二戰(zhàn)期間,為了有效對抗法西斯,不僅是軍人,連物生:二戰(zhàn)期間,為了有效對抗法西斯,不僅是軍人,連物理學家、數(shù)學家,甚至經(jīng)

12、濟學家都被發(fā)動起來,組成理學家、數(shù)學家,甚至經(jīng)濟學家都被發(fā)動起來,組成“運運籌研究班,共同研究作戰(zhàn)方案,在作戰(zhàn)中數(shù)學的合理性籌研究班,共同研究作戰(zhàn)方案,在作戰(zhàn)中數(shù)學的合理性得到了廣泛運用,產(chǎn)生了種種理論。博弈論便是其中之一。得到了廣泛運用,產(chǎn)生了種種理論。博弈論便是其中之一。二戰(zhàn)結(jié)束后,大局部理論研究都轉(zhuǎn)向其他領(lǐng)域。博弈論那么二戰(zhàn)結(jié)束后,大局部理論研究都轉(zhuǎn)向其他領(lǐng)域。博弈論那么在摩根斯坦的勸說下,與馮合作成就了在摩根斯坦的勸說下,與馮合作成就了?The theory of Games and Economic Behaviour?,即轉(zhuǎn)到了經(jīng)濟領(lǐng)域。冷,即轉(zhuǎn)到了經(jīng)濟領(lǐng)域。冷戰(zhàn)期間得到了政府的大

13、力支持,博弈論不僅在經(jīng)濟領(lǐng)域,戰(zhàn)期間得到了政府的大力支持,博弈論不僅在經(jīng)濟領(lǐng)域,而后在社會學、外交問題軍事問題上都得到了應用。而后在社會學、外交問題軍事問題上都得到了應用。因?qū)Σ┺恼撗芯孔鞒鼋艹龇瞰I而獲諾貝爾經(jīng)濟因?qū)Σ┺恼撗芯孔鞒鼋艹龇瞰I而獲諾貝爾經(jīng)濟學獎的經(jīng)濟學家:學獎的經(jīng)濟學家:納什納什(Nash): Nash-Equilibrium 塞爾藤塞爾藤(Selten):Subgame-Perfect Nash E- 海薩尼海薩尼(Harsanyi) : Bayes-Nash Equilibrium 1994維克利、莫里斯維克利、莫里斯 1996邁克爾邁克爾斯賓斯斯賓斯(Spence): 194

14、8年生于美國的新年生于美國的新澤西,澤西,1972年獲哈佛大學博士頭銜,現(xiàn)兼任美國年獲哈佛大學博士頭銜,現(xiàn)兼任美國 哈佛和斯坦福兩所大學經(jīng)濟學教授。哈佛和斯坦福兩所大學經(jīng)濟學教授。 喬治喬治阿克爾洛夫:阿克爾洛夫:1940年生于美國的紐黑文,年生于美國的紐黑文,1966年獲美國麻省理工學院博士頭銜,現(xiàn)為美國年獲美國麻省理工學院博士頭銜,現(xiàn)為美國加利福尼亞大學經(jīng)濟學教授。加利福尼亞大學經(jīng)濟學教授。 約瑟夫約瑟夫斯蒂格利茨,斯蒂格利茨,1948年生于美國的印年生于美國的印第安納州,第安納州,1967年獲美國麻省理工學院博士年獲美國麻省理工學院博士頭銜,曾任世界銀行的首席經(jīng)濟學家,現(xiàn)任頭銜,曾任世界

15、銀行的首席經(jīng)濟學家,現(xiàn)任美國哥倫比亞大學經(jīng)濟學教授。美國哥倫比亞大學經(jīng)濟學教授。 2001年三人同獲諾貝爾經(jīng)濟學獎,分享年三人同獲諾貝爾經(jīng)濟學獎,分享1000萬瑞典克郎萬瑞典克郎94.3萬美元的獎金。瑞典萬美元的獎金。瑞典皇家科學院之所以把這崇高的榮譽給予這三皇家科學院之所以把這崇高的榮譽給予這三位經(jīng)濟學家,是因為他們在現(xiàn)代信息經(jīng)濟學位經(jīng)濟學家,是因為他們在現(xiàn)代信息經(jīng)濟學研究領(lǐng)域作出了突出的奉獻,他們研究領(lǐng)域作出了突出的奉獻,他們“開展并開展并研究了市場信息不對稱的問題,揭示了當代研究了市場信息不對稱的問題,揭示了當代信息經(jīng)濟的核心。教材信息經(jīng)濟的核心。教材P192 阿克爾洛夫是最早發(fā)現(xiàn)信息不

16、對稱的學者之阿克爾洛夫是最早發(fā)現(xiàn)信息不對稱的學者之一。我們上街購物,幾乎處處都能碰上假貨:一。我們上街購物,幾乎處處都能碰上假貨:花了上千元買的花了上千元買的“進口名牌服裝,原來是國進口名牌服裝,原來是國產(chǎn)的,只值幾十元;產(chǎn)的,只值幾十元;“真皮皮鞋用的是人造真皮皮鞋用的是人造革的料革的料為什么假貨愈為什么假貨愈 演愈烈?為什么假貨演愈烈?為什么假貨在開展中國家特別猖獗?阿克爾洛夫答復說:在開展中國家特別猖獗?阿克爾洛夫答復說:“一家商場,一般是售貨員比顧客更了解產(chǎn)品一家商場,一般是售貨員比顧客更了解產(chǎn)品的質(zhì)量,如果售貨員把這種信息加以壟斷,最的質(zhì)量,如果售貨員把這種信息加以壟斷,最后即使他提

17、供越來越差的產(chǎn)品,顧客也不會知后即使他提供越來越差的產(chǎn)品,顧客也不會知道。顧客的利益因而受到損害。只有買錯,道。顧客的利益因而受到損害。只有買錯,沒有賣錯阿克爾洛夫最大的奉獻是解釋了在沒有賣錯阿克爾洛夫最大的奉獻是解釋了在開展中國家里,信貸市場信息的不對稱導致了開展中國家里,信貸市場信息的不對稱導致了這些國家信這些國家信貸市場的過高利息。此外,阿克爾洛夫還把信貸市場的過高利息。此外,阿克爾洛夫還把信息不對稱運用于解釋各種社會問題,比方因為信息不對稱運用于解釋各種社會問題,比方因為信息不對稱,醫(yī)療保險市場上,老年人、個體勞動息不對稱,醫(yī)療保險市場上,老年人、個體勞動者的醫(yī)療保險利益得不到保障。者

18、的醫(yī)療保險利益得不到保障。三、根本概念三、根本概念 1、參與人、參與人Players:一個博弈中的決策主體,一個博弈中的決策主體,他們各自的目的是通過選擇行動策略以最他們各自的目的是通過選擇行動策略以最大化自己的目標函數(shù)大化自己的目標函數(shù)/效用水平效用水平/支付函數(shù)。他們支付函數(shù)。他們可以是自然人或團體或法人,如企業(yè)、國家、可以是自然人或團體或法人,如企業(yè)、國家、地區(qū)、社團、歐盟、北約等。地區(qū)、社團、歐盟、北約等。 那些不作決策或雖做決策但不直接承擔決那些不作決策或雖做決策但不直接承擔決策后果的被動主體不是參與人,而只能當做環(huán)策后果的被動主體不是參與人,而只能當做環(huán)境參數(shù)來處理。如指手劃腳的看

19、牌人、看棋人,境參數(shù)來處理。如指手劃腳的看牌人、看棋人,企業(yè)的參謀等。企業(yè)的參謀等。 對參與人的決策來說,最重要的是必須有對參與人的決策來說,最重要的是必須有可供選擇的行動集策略集和一個很好定義的可供選擇的行動集策略集和一個很好定義的支付函數(shù)。支付函數(shù)。 虛擬參與人虛擬參與人pseudo-player:指指“自然自然 nature、“上帝上帝 God,也即決定外生的隨機,也即決定外生的隨機變量的概率分布的機制。變量的概率分布的機制?!澳呈略谌?、成事在天某事在人、成事在天的的“天;如出遠門去旅游,可能很開心,也可能天;如出遠門去旅游,可能很開心,也可能很為難生病住醫(yī)院,兩者概率分布很為難生病住醫(yī)

20、院,兩者概率分布90%、10%或或98%與與2%或其他,由上帝決定。或其他,由上帝決定。 在以后的討論中,我們記參與人為在以后的討論中,我們記參與人為i,參與人參與人集合記為集合記為T,即,即T=1,2, , i , ,n ,即該博弈中共有即該博弈中共有n個參與人;為了討論的方便個參與人;為了討論的方便,把某個參與人,把某個參與人i之外的其他參與人稱為的之外的其他參與人稱為的i對手對手記為記為- i ; N代表自然。代表自然。 *注意:注意: 博弈理論家一般對參與人做兩個根本的假設(shè)博弈理論家一般對參與人做兩個根本的假設(shè)參與人都是理性的和智能的參與人都是理性的和智能的理性的理性的rational

21、? 1如果一個決策者在追逐其目標時能如果一個決策者在追逐其目標時能前后一致地做決策,就稱他為前后一致地做決策,就稱他為rational。Roger BMyerson (P2) 2廣義而言指的是一種行為方式,他廣義而言指的是一種行為方式,他同在給定條件或約束下最有效地實現(xiàn)預期目同在給定條件或約束下最有效地實現(xiàn)預期目標相關(guān)。具體地講,理性大致有以下三項標相關(guān)。具體地講,理性大致有以下三項內(nèi)容:內(nèi)容:1存在一組可供選擇的備選或替代方存在一組可供選擇的備選或替代方案;案;2每一種方案均對應著某種特定的預期每一種方案均對應著某種特定的預期凈收益或滿足程度或目標實現(xiàn)程度;凈收益或滿足程度或目標實現(xiàn)程度;3

22、人們?nèi)藗兛偸沁x擇那個能夠帶來最大預期凈收益的方案??偸沁x擇那個能夠帶來最大預期凈收益的方案。西蒙,西蒙,1964智能的智能的intelligent? 當我們像博弈論專家那樣分析一個博弈時,當我們像博弈論專家那樣分析一個博弈時,如果參與人知道我們對此博弈所知道的一切,如果參與人知道我們對此博弈所知道的一切,并能做出我們對此博弈所能做出的一切推斷,并能做出我們對此博弈所能做出的一切推斷,我們就說此博弈的參與人是智能的。我們就說此博弈的參與人是智能的。RogerBMyerson (P3) 2、策略、策略strategies :博弈中有兩種策略概博弈中有兩種策略概念,一種為純策略念,一種為純策略pur

23、e strategy , 簡稱策略,簡稱策略,指參與人在博弈中可以選擇采用的行動指參與人在博弈中可以選擇采用的行動ac- tions or moves方案,是參與人在給定信息結(jié)方案,是參與人在給定信息結(jié)構(gòu)的情況下的行動規(guī)那么,它規(guī)定參與人在什么構(gòu)的情況下的行動規(guī)那么,它規(guī)定參與人在什么時候的什么情況下采取什么行動。因而一個策時候的什么情況下采取什么行動。因而一個策略是參與人的一個略是參與人的一個“相機行動方案相機行動方案contingentAction plan。如。如“人不犯我人不犯我、“按第一套按第一套方方案行動、實施第二套方案案行動、實施第二套方案 ,記參與人,記參與人i的一個策略為的一

24、個策略為si,參與人,參與人i在一個博弈中的全部可在一個博弈中的全部可供選擇的策略記為供選擇的策略記為Si策略集策略集strategy set,即,即si Si , Si =s1 ,s2 , si , sn,表示參與表示參與人人i 在該博弈中共有在該博弈中共有n個可行的策略。個可行的策略。如果如果n個參與人每人從自己的個參與人每人從自己的Si中選擇一個策略中選擇一個策略si,那么向量那么向量s= s1,s2,si, sn是一是一個個策略組合策略組合(strategy profile),參與人參與人i之外的其他參之外的其他參與人的策略組合可記為與人的策略組合可記為s-i= s1,s2,si-1

25、,si+1 , sn。 例如田忌的某個策略例如田忌的某個策略s田忌田忌=上中下,或中下上,上中下,或中下上,等等;等等;S田忌田忌=上中下,上下中,中上下,中下上上中下,上下中,中上下,中下上,下上中,下中上,下上中,下中上 另一種策略概念是在純策略根底上形成的另一種策略概念是在純策略根底上形成的混合策略混合策略mixed strategy概念,參與人概念,參與人i的的混合策略混合策略pi是他的純策略空間是他的純策略空間Si上的一種概率上的一種概率分布,表示參與人實際進行決策時根據(jù)這種分布,表示參與人實際進行決策時根據(jù)這種概率分布在純策略中隨機選擇加以實施。概率分布在純策略中隨機選擇加以實施。

26、Pi(si)表示表示Pi分配給純策略分配給純策略si的的概率。如出門的的概率。如出門要否帶雨傘?天氣預報說有時有雨。猜拳?要否帶雨傘?天氣預報說有時有雨。猜拳?這是一個十分玄乎的概念,讓人不容易理解,這是一個十分玄乎的概念,讓人不容易理解,它是一種不確定,采用這種策略的目的就是它是一種不確定,采用這種策略的目的就是讓對方琢磨不透,實施時似乎由一架隨機機讓對方琢磨不透,實施時似乎由一架隨機機器在操作。隨機策略器在操作。隨機策略randomized strategy 純策略是混合策略的特例?純策略是混合策略的特例?*注意:注意: 1、策略與行動是兩個不同的概念,策略是、策略與行動是兩個不同的概念,

27、策略是行動的規(guī)那么而不是行動本身?;貞浶袆拥囊?guī)那么而不是行動本身。回憶“犯與不犯犯與不犯的問題。在靜態(tài)博弈中,由于參與人同時行動,的問題。在靜態(tài)博弈中,由于參與人同時行動,沒有人能掌握他人的之前行動的信息,故沒有沒有人能掌握他人的之前行動的信息,故沒有可針對的行動,從而策略的選擇就變成了行動可針對的行動,從而策略的選擇就變成了行動的選擇,即策略和行動是同一的。的選擇,即策略和行動是同一的。 行動集行動集Ai ai 2、作為一種行動規(guī)那么,策略必須是完備的,、作為一種行動規(guī)那么,策略必須是完備的,就是說,策略要給出參與人在每一種可能想象就是說,策略要給出參與人在每一種可能想象到的情況下的行動選擇

28、,即使參與人并不預期到的情況下的行動選擇,即使參與人并不預期這種情況會實際發(fā)生。這種情況會實際發(fā)生?!俺笤捳f在前丑話說在前-3、支付、支付payoffs:參與人從各種策略組合中:參與人從各種策略組合中獲得的收益。收益往往采用效用獲得的收益。收益往往采用效用utility概念。概念。它或者是一個特定策略組合下某個參與人得到的它或者是一個特定策略組合下某個參與人得到的確定效用水平,或者是期望效用水平。它是策略確定效用水平,或者是期望效用水平。它是策略組合的函數(shù),所以也稱支付函數(shù)組合的函數(shù),所以也稱支付函數(shù)payoff function,記為,記為ui(s),ui(s)= ui(s1, s2 ,si

29、 , sn-1 , sn). 1:博弈的一個根本特征是一個參與人:博弈的一個根本特征是一個參與人的支付不僅取決于自己的策略選擇,而且取決的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的于所有其他參與人的策略選擇;是策略組合的函數(shù)。函數(shù)。 2:支付是參與人真正關(guān)心的東西,參與:支付是參與人真正關(guān)心的東西,參與人在博弈中的目標就是選擇自己的策略以最大人在博弈中的目標就是選擇自己的策略以最大化自己的支付函數(shù)?;约旱闹Ц逗瘮?shù)。*注意注意 一個博弈中,明確了以上三個概念,該博一個博弈中,明確了以上三個概念,該博弈的根本框架就形成了,故稱為博弈的三個弈的根本框架就形成了,

30、故稱為博弈的三個根本要素。一個具體博弈界定,還須明確行動根本要素。一個具體博弈界定,還須明確行動的順序和有關(guān)的信息。的順序和有關(guān)的信息。 4、行動的順序、行動的順序the order of play:博弈博弈中參與人實施決策活動的順序。同時或有先有中參與人實施決策活動的順序。同時或有先有后。其他因素不變,但順序不同,參與人的最后。其他因素不變,但順序不同,參與人的最優(yōu)選擇就不同,博弈的結(jié)果也不同。事實上,優(yōu)選擇就不同,博弈的結(jié)果也不同。事實上,不同的順序安排意味著不同的博弈。靜態(tài)博弈不同的順序安排意味著不同的博弈。靜態(tài)博弈和動態(tài)博弈。和動態(tài)博弈。 5、信息、信息information:指一個博

31、弈中參:指一個博弈中參與人有關(guān)該博弈的知識,如關(guān)于與人有關(guān)該博弈的知識,如關(guān)于N的選擇、其的選擇、其他參與人的策略集、支付函數(shù)、行動時間等他參與人的策略集、支付函數(shù)、行動時間等.博弈論中關(guān)于信息的具體概念有:博弈論中關(guān)于信息的具體概念有:信息集信息集information set主要出現(xiàn)在主要出現(xiàn)在動態(tài)博弈中,可理解為參與人在特定時刻上對動態(tài)博弈中,可理解為參與人在特定時刻上對有關(guān)變量的值的知識;一個參與人無法準確知有關(guān)變量的值的知識;一個參與人無法準確知道的變量的全體屬于一個信息集。買古董。道的變量的全體屬于一個信息集。買古董。完美信息完美信息perfect information:指一個參

32、與指一個參與人對其他參與人包括人對其他參與人包括N的行動選擇有準確的行動選擇有準確了解的情況,即一個信息集只包含一個值。動了解的情況,即一個信息集只包含一個值。動態(tài)博弈的概念。態(tài)博弈的概念。完全信息完全信息complete information:指:指N不首不首先行動或先行動或N的初始行動被所有的參與人準確觀察的初始行動被所有的參與人準確觀察到的情況,即沒有事前的不確定性。完全信息到的情況,即沒有事前的不確定性。完全信息意味著各個參與人的支付函數(shù)是共同知識。意味著各個參與人的支付函數(shù)是共同知識。 顯然,不完全顯然,不完全incomplete信息意味著不信息意味著不完美完美imperfect信

33、息。信息。共同知識共同知識common knowledge 是與信息是與信息有關(guān)的一個重要概念。如聽過某個老師的課,有關(guān)的一個重要概念。如聽過某個老師的課,學生認識老師,但老師不一定就記住該學生,學生認識老師,但老師不一定就記住該學生,路上碰在一塊了,學生會不會叫老師呢?也許路上碰在一塊了,學生會不會叫老師呢?也許學生會以為老師不認識他,打招呼會把老師弄學生會以為老師不認識他,打招呼會把老師弄得莫名其妙。得莫名其妙。 解釋一:共同知識指解釋一:共同知識指“所有參與人知道,所有參與人知道,所有參與人知道所有參與人知道,所有參與人所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人

34、知道知道所有參與人知道所有參與人知道。 解釋二:如果每個參與人都知道某個事實,解釋二:如果每個參與人都知道某個事實,每個參與人都知道每個參與人都知道它,如此每個參與人都知道每個參與人都知道它,如此等等,從而形如等等,從而形如“每個參與人都知道每個參與人都知道)k每個每個參與人都知道它的語句對參與人都知道它的語句對k=0,1,2,都是都是正確的,那我們就稱這個事實為參與人中間的正確的,那我們就稱這個事實為參與人中間的共同知識。共同知識。 解釋三:這是一個解釋三:這是一個“由己及人,由人及己由己及人,由人及己的無限推理過程,是的無限推理過程,是k時的高階知識時的高階知識(每個人每個人)k-1。一件

35、事一旦在某個群體中成為。一件事一旦在某個群體中成為共同知識,那么從任何一個個體出發(fā),他對這件事共同知識,那么從任何一個個體出發(fā),他對這件事的理解等等都已到達了完全的統(tǒng)一,不再有任何的理解等等都已到達了完全的統(tǒng)一,不再有任何層面的不確定性奧曼,層面的不確定性奧曼,1976。 在博弈論中,一般假定參與人的行動空間在博弈論中,一般假定參與人的行動空間Ai和行動順序是共同知識。和行動順序是共同知識。 *為了說明共同知識的重要性,引用一個寓為了說明共同知識的重要性,引用一個寓言故事。言故事。 故事發(fā)生在一個村莊,村里有故事發(fā)生在一個村莊,村里有100對夫妻,對夫妻,他們都是地道的邏輯學家智能的;村里有他

36、們都是地道的邏輯學家智能的;村里有一些奇特的風俗:每天晚上,村里的男人們都一些奇特的風俗:每天晚上,村里的男人們都將點起篝火,繞圈圍坐舉行會議,議題是談?wù)搶Ⅻc起篝火,繞圈圍坐舉行會議,議題是談?wù)撟约旱钠拮?。在會議開始時,如果一個男人有自己的妻子。在會議開始時,如果一個男人有理由相信他的妻子對他總是守貞的,那么他就理由相信他的妻子對他總是守貞的,那么他就在會議上當眾贊揚她的美德。另一方面,如果在會議上當眾贊揚她的美德。另一方面,如果在會議之前的任何時間,只要他發(fā)現(xiàn)他妻子不在會議之前的任何時間,只要他發(fā)現(xiàn)他妻子不貞的證據(jù),那他就會在會議上悲鳴怯哭,并企貞的證據(jù),那他就會在會議上悲鳴怯哭,并企求神靈

37、嚴厲地懲罰她。再那么,如果一個妻子求神靈嚴厲地懲罰她。再那么,如果一個妻子曾曾有不貞,那她和她的情人會立即告知村里除她有不貞,那她和她的情人會立即告知村里除她丈夫之外所有的已婚男人奇異的傳統(tǒng)風俗。丈夫之外所有的已婚男人奇異的傳統(tǒng)風俗。所有這些傳統(tǒng)和風俗都是村民的共同知識。所有這些傳統(tǒng)和風俗都是村民的共同知識。 事實上,每個妻子都已對丈夫不忠。于是事實上,每個妻子都已對丈夫不忠。于是每個丈夫都知道除自己妻子之外其他人的妻子每個丈夫都知道除自己妻子之外其他人的妻子都是不貞的女子,因而每個晚上的會議上每個都是不貞的女子,因而每個晚上的會議上每個男人都贊美自己的妻子。男人都贊美自己的妻子。 這種狀況持

38、續(xù)了很多年,直到有一天來了這種狀況持續(xù)了很多年,直到有一天來了一位傳教士。傳教士參加了篝火會議,并聽到一位傳教士。傳教士參加了篝火會議,并聽到每個男人都在贊美自己的妻子,他站起來走到每個男人都在贊美自己的妻子,他站起來走到圍坐圓圈的中心,大聲地提醒說:圍坐圓圈的中心,大聲地提醒說:“這個村子這個村子里里有一個妻子已經(jīng)不貞了。在此后的有一個妻子已經(jīng)不貞了。在此后的99個晚上,個晚上,丈夫們繼續(xù)贊美各自的妻子,但在第丈夫們繼續(xù)贊美各自的妻子,但在第100個晚個晚上,他們?nèi)急Q怯哭,并企求神靈嚴懲自己上,他們?nèi)急Q怯哭,并企求神靈嚴懲自己的妻子。的妻子。*怎樣理解這個故事?傳教士究竟告訴了丈夫怎

39、樣理解這個故事?傳教士究竟告訴了丈夫們他們所不知道的什么?們他們所不知道的什么? 首先注意到假設(shè)只有一個妻子不貞,她丈首先注意到假設(shè)只有一個妻子不貞,她丈夫能夠立刻知道這個不貞的女人就是自己的妻夫能夠立刻知道這個不貞的女人就是自己的妻子,因為他丈夫知道沒有另外的不貞女人,假子,因為他丈夫知道沒有另外的不貞女人,假設(shè)有的話他是知道的,所以在傳教士訪問后的設(shè)有的話他是知道的,所以在傳教士訪問后的第一個晚上這個丈夫就會哭;現(xiàn)在他沒有哭,第一個晚上這個丈夫就會哭;現(xiàn)在他沒有哭,那就意味著確實存在一個女子不貞,由此,從那就意味著確實存在一個女子不貞,由此,從“第一個晚上沒有男人哭中可推斷出:有兩第一個晚

40、上沒有男人哭中可推斷出:有兩個女子已經(jīng)不貞。在傳教士走后的第二晚上,個女子已經(jīng)不貞。在傳教士走后的第二晚上,既然已推斷出有兩個女子不貞,而自己只知道既然已推斷出有兩個女子不貞,而自己只知道一個,那另一個就是自己的妻子,那這個丈夫一個,那另一個就是自己的妻子,那這個丈夫應該在應該在“第二個晚上哭。第二個晚上第二個晚上哭。第二個晚上“這個這個丈夫也沒有哭,由此丈夫們推斷出:已有三丈夫也沒有哭,由此丈夫們推斷出:已有三個女子不貞。個女子不貞。由歸納法可以證明,對于由歸納法可以證明,對于1和和100之間的任意正之間的任意正整數(shù)整數(shù)k,如果恰有,如果恰有k個妻子不貞,那么在傳教士個妻子不貞,那么在傳教士

41、走后的連續(xù)走后的連續(xù)k-1個晚上,所有的丈夫照樣各自稱個晚上,所有的丈夫照樣各自稱贊自己的妻子,但在第贊自己的妻子,但在第k個晚上,個晚上,k個不貞妻子個不貞妻子的丈夫會悲鳴怯哭,于是,在的丈夫會悲鳴怯哭,于是,在99個贊揚之夜過個贊揚之夜過后的第后的第100個晚上,每個丈夫都知道一定有個晚上,每個丈夫都知道一定有100個不貞的妻子。不幸的是包括自己的妻子在內(nèi)!個不貞的妻子。不幸的是包括自己的妻子在內(nèi)! 傳教士究竟告訴了丈夫們什么?每個丈夫傳教士究竟告訴了丈夫們什么?每個丈夫都知道有都知道有99個不貞的妻子,故傳教士所說的已個不貞的妻子,故傳教士所說的已經(jīng)有一個女子不貞的話對任何人來說都不是什

42、經(jīng)有一個女子不貞的話對任何人來說都不是什新聞。但新聞。但“傳教士對所有傳教士對所有100個男人做了一個聲個男人做了一個聲明是明是common knowledge,從而這個傳教士所,從而這個傳教士所聲明的內(nèi)容有一個妻子不貞也就成了聲明的內(nèi)容有一個妻子不貞也就成了100個個男人之間的男人之間的common knowledge。在傳教士宣告。在傳教士宣告之前,每個形如之前,每個形如“每個丈夫知道每個丈夫知道)k有一個妻有一個妻子不貞的判斷對于子不貞的判斷對于k99都是正確的,但對于都是正確的,但對于K=100就不正確了。例如,假設(shè)從就不正確了。例如,假設(shè)從1到到100對丈夫?qū)φ煞騻冞M行編號,那么們進

43、行編號,那么1已經(jīng)知道已經(jīng)知道2已經(jīng)知道已經(jīng)知道3已經(jīng)知已經(jīng)知道道99已經(jīng)知道已經(jīng)知道100的妻子是不貞的,但的妻子是不貞的,但1不知道不知道2已經(jīng)知道已經(jīng)知道3已經(jīng)知道已經(jīng)知道99已經(jīng)知道已經(jīng)知道100已經(jīng)知道已經(jīng)知道1的妻子是不貞的。因而從這個的妻子是不貞的。因而從這個寓言中引申出的含義是,從一個共同知識的寓言中引申出的含義是,從一個共同知識的事實推出的結(jié)果與從例如只知道每個人事實推出的結(jié)果與從例如只知道每個人已經(jīng)知道每個人已經(jīng)知道的事實推出的結(jié)果已經(jīng)知道每個人已經(jīng)知道的事實推出的結(jié)果可以非常不同。可以非常不同。私人信息私人信息private information:指任何一:指任何一個他

44、擁有但不是該博弈中所有參與人共同知識的個他擁有但不是該博弈中所有參與人共同知識的信息。信息。 由于存在私人信息,便有了信息不對稱的問由于存在私人信息,便有了信息不對稱的問題。題。四、博弈的分類四、博弈的分類分類是一種深化認識的方法。博弈可以根分類是一種深化認識的方法。博弈可以根據(jù)不同的標志從不同的角度進行多種分類。通據(jù)不同的標志從不同的角度進行多種分類。通過分類我們將對博弈有進一步的了解,同時對過分類我們將對博弈有進一步的了解,同時對博弈理論的結(jié)構(gòu)體系有初步的認識。教才博弈理論的結(jié)構(gòu)體系有初步的認識。教才14、按參與人的多少分:、按參與人的多少分:單人博弈和多人博弈單人博弈和多人博弈、按策略空

45、間是否有限分:、按策略空間是否有限分:有限策略博弈和無限策略博弈有限策略博弈和無限策略博弈、按各策略組合下參與人支付之和情況分:、按各策略組合下參與人支付之和情況分:零和博弈、常和博弈和變和博弈零和博弈、常和博弈和變和博弈、按參與人行動的順序分:、按參與人行動的順序分:靜態(tài)博弈和動態(tài)博弈靜態(tài)博弈和動態(tài)博弈、按信息是否完全分:、按信息是否完全分:完全信息博弈和不完全信息博弈完全信息博弈和不完全信息博弈、按信息是否完美分動態(tài)博弈:、按信息是否完美分動態(tài)博弈:完美信息動態(tài)博弈和不完美信息動態(tài)博弈完美信息動態(tài)博弈和不完美信息動態(tài)博弈博弈理論體系的結(jié)構(gòu)框架按下面博弈類型博弈理論體系的結(jié)構(gòu)框架按下面博弈類

46、型安排:安排:靜態(tài)動態(tài)靜態(tài)動態(tài)完全信息完全信息完全信息完全信息完全信息完全信息靜態(tài)博弈動態(tài)博弈靜態(tài)博弈動態(tài)博弈不完全信息不完全信息不完全信息不完全信息不完全信息不完全信息靜態(tài)博弈動態(tài)博弈靜態(tài)博弈動態(tài)博弈五、本課程安排的特點五、本課程安排的特點目前,博弈論的書籍較多,版本不同,內(nèi)目前,博弈論的書籍較多,版本不同,內(nèi)容結(jié)構(gòu)安排各有千秋,有的詳細,有的簡練;容結(jié)構(gòu)安排各有千秋,有的詳細,有的簡練;有的注重純理論的數(shù)學演繹,有的那么關(guān)注應有的注重純理論的數(shù)學演繹,有的那么關(guān)注應用研究,等等。用研究,等等。 This class is designed to introduce game theory

47、to those who will later construct (or at least consume) game-theoretic models in applied fields within economics.The exposition emphasizes the economic applications of the theory at least as mush the pure theory itself, for three reasons. First, the applications help teach the theory ; formal argume

48、nts about abstract games also appear but play a lesser role . Second,the applications illustrate the process of model building the process of translating an informal description of a multi-person decision situation into a formal game-theoretic problem to be analyzed. Third,the variety of application

49、s shows that similar issues arise in different rent areas of economics, and that the same game- theoretic tools can be applied in each setting .In fact ,people who have not studied pure game theory also can understand the competitive situation just by knowing the applications. Chapter 1 完全信息靜態(tài)博弈完全信息

50、靜態(tài)博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move)

51、games,we restrict attention to games of complete information. That is each players payoff function (the function that determines the players payoff from the combination of actions chosen by the players) is common knowledge among all the players.教材教材P21 一、一、Normal-Form Representation of Games and Nas

52、h Equilibrium (一一)Normal-Form Representation of GamesIn the normal-form representation of a game ,each player simultaneously chooses a strategy, and the combination of strategies chosen by the players determines a payoff for each player. We illustrate the normal-form representation with a classical

53、exampleThe prisoners Dilemma. Two suspects are arrested and charged with a crime. The police lack sufficient evidence to convict the suspects, unless at least one confesses.The police hold the suspects in separate cells and explain the consequences that will follow from the actions they could take.

54、If neither confesses then both will be convicted of a minor offense and sentenced to one year in jail. If both confess then both will be sentenced to jail five years. Finally, if one confesses but the other does not, then the confessor will be released immediately but the other will be sentenced to

55、eight years in jailfive for the crime and a further three for obstructing justice(干擾司法干擾司法)。 囚徒囚徒招認沉默招認沉默招認招認 5, -5 0, -8囚徒囚徒沉默沉默 -8, 0 -1 , -1 囚徒的困境囚徒的困境We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to eac

56、h player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players. Definition: The normal-form representation of an-n-player game specifies the players strategy spaces S1 , , Sn and their payoff functions u1 , un. We denote this game by G=S1, ,Sn;u

57、1, , un.教材教材22理解完全信息靜態(tài)博弈時要本卷須知理解完全信息靜態(tài)博弈時要本卷須知 Although we stated that in a normal-form game the players choose their strategies simultaneously , this does not imply that the parties necessarily act simultaneously :it suffices that each choose his or her action without knowledge of the others choice

58、s, as would be the case “the prisonersdilemma if the prisoners reached decisions at arbitrary times (在任意時間在任意時間)while in their separate cells. 2 Here we may recognize complete information as that each player know the payoff functions of the others.(二二)Dominant-Strategy EquilibriumDefinition In the n

59、ormal-form game G=S1, ,Sn; u1, , un,let si and si be feasible strategies for player i (i.e., si and si are members of Si ).Strategy si is strictly dominated by strategy si if for each feasible combination of the others strategies, is payoff from playing si is strictly less than is payoff from playin

60、g si . i.e.: ui(s1, , si-1, si , si+1 , , sn ) ui(s1, , si-1, si“ , si+1 , , sn ) (DS) for each s-i= (s1, , si-1 , si+1 , , sn ) that can be constructed from the other playersstrategySpaces S1, , Si-1, Si+1, Sn. 囚徒囚徒招認沉默招認沉默招認招認 5, -5 0, -8囚徒囚徒沉默沉默 -8, 0 -1 , -1 囚徒的困境囚徒的困境策略策略“沉默嚴格劣于策略沉默嚴格劣于策略“招認招認

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論