博弈論講解學習

上傳人：L*** IP屬地：江西上傳時間：2024-09-26 格式：PPT 頁數：121 大小：673KB 積分：18 舉報 版權申訴

已閱讀5頁，還剩116頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

從撲克游戲到諾貝爾獎

IntroductiontoGameTheory

博弈論（gametheory)是由美國數學家馮·諾依曼(Von.Neumann)和經濟學家摩根斯坦(Morgenstern)于1944年創(chuàng)立的帶有方法論性質的學科，它被廣泛應用于經濟學、軍事、政治科學、人工智能、生物學、火箭工程技術等。在1994年，三位博弈論專家即數學家納什(Nash，他的故事被好萊塢拍成了電影《美麗心靈》，該影片獲得了2002年奧斯卡金像獎的四項大獎)、經濟學家海薩尼（Harsanyi）和澤爾滕（Selten）因在博弈論及其在經濟學中的應用研究上所作出巨大貢獻而獲得諾貝爾經濟學獎。1996年，兩位將博弈論應用于不對稱信息下機制設計的經濟學家莫里斯(Mirrlees)和維克里(Vickrey)、以及2001年三位經濟學家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運用博弈論研究信息經濟學所取得的成就而成為這兩個年度的諾貝爾經濟學獎得主。專家預計，近幾年還會有更多的博弈論專家可能獲得諾貝爾經濟學獎。為什么博弈論在經濟學領域會產生如此大的影響呢？這是因為博弈論改變了傳統(tǒng)微觀經濟學的某些基本假設，從一個獨特的視角幫助我們更加深刻地理解和把握經濟現象，并指導更加有效的經濟政策制訂。博弈論作為現代經濟學的前沿領域，已成為占據主流的基本分析工具。

博弈論是一門十分有趣但理論上又是十分艱深的學問，本節(jié)介紹一些大家能夠憑直觀或簡單分析就能把握的例子，為大家介紹博弈論的基本概念及應用，以引起大家對這門目前已成為熱門科學的興趣和獲得初步的了解。這些例子也是我們在日常生活中經常所遇到的問題或觀察到的現象，通過博弈論，我們能夠更加深刻地理解它們。一、什么是博弈論：從“囚徒困境”談起1.囚徒困境兩個小偷甲和乙聯(lián)手作案，私入民宅被警方逮住但未獲證據。警方將兩人分別置于兩間房間分開審訊，政策是若一人招供但另一人未招，則招者立即被釋放，未招者判入獄10年；若二人都招則兩人各判刑8年;若兩人都不招則未獲證據但因私入民宅各拘留1年。表1囚徒困境博弈

乙

招不招招甲不招（問題1：甲、乙如何選擇？）-8,-80,-10-10,0-1,-1甲和乙是參與博弈的人，稱為“局中人”。表1中每一個小方格內的數字被稱為局中人的支付，其中左邊的數字代表甲的支付，右邊的是乙的支付。表1中的雙變量矩陣稱為博弈支付矩陣。甲或乙可以作出的選擇被稱為“戰(zhàn)略”，如“招”或“不招”都是戰(zhàn)略。

對甲來說，盡管他不知道乙是選擇了“招”還是“不招”，他發(fā)現他自己選擇“招”都是比選擇“不招”為好的。因此，“不招”是相對于“招”的劣戰(zhàn)略，他不會選擇劣戰(zhàn)略。所以，甲會選擇“招”。同樣，根據對稱性，乙也會選擇“招”，結果是甲乙兩人都“招”。甲和乙都不會選擇劣戰(zhàn)略“不招”，稱為“剔除劣戰(zhàn)略的占優(yōu)戰(zhàn)略均衡”。其中“招”是占優(yōu)于(優(yōu)于)“不招”的占優(yōu)戰(zhàn)略。

囚徒困境博弈雖然簡單，但是卻體現了非合作博弈的基礎，稱（招，招)為“納什均衡”。納什均衡是局中人戰(zhàn)略選擇上構成的一種“僵局”，給定其他局中人的選擇不變，任何一個局中人的選擇是最好的，他也不會改變其戰(zhàn)略選擇。所以，可以預期（招，招）是甲乙最終完成的穩(wěn)定的選擇。囚徒困境反映了個人理性和集體理性的矛盾。對經典經濟學的沖擊“納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論，在市場經濟中，每一個人都從利己的目的出發(fā)，而最終全社會達到利他的效果?！秶徽摗罚骸巴ㄟ^追求(個人的)自身利益，他常常會比其實際上想做的那樣更有效地促進社會利益?！睆摹凹{什均衡”我們引出了“看不見的手”的原理的一個悖論：從利己目的出發(fā)，結果損人不利己，既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說，納什均衡”提出的悖論實際上動搖了西方經濟學的基石。研究囚徒困境問題的目的利用這種困境達到有利于社會的目的政府在經濟活動中的組織協(xié)調工作的必要性避免囚徒困境2.生活中的“囚徒困境”例子

例子1商家價格戰(zhàn)出售同類產品的商家之間本來可以通過共同將價格維持在高位而獲利，但實際上卻是相互殺價，結果都不能獲得超額利潤。當一些商家共謀將價格抬高，消費者實際上不用著急，因為商家聯(lián)合維持高價的壟斷行為一般不會持久，可以等待壟斷的自身崩潰，價格就會掉下來。譬如，生產彩電的大廠商合謀將彩電價格維持高位，他們搞了一個“彩電廠家價格自律聯(lián)盟”，并在深圳舉行了由多家彩電廠商首腦參加的“彩電廠商自律聯(lián)盟高峰會議”。當時，對于這種在發(fā)達國家明顯屬于違法行為的所謂“自律聯(lián)盟”，國家在法律上暫時還是無能為力的。2008年，方便面廠家合謀漲價。

但是，盡管政府當時無力制止這種事情，公眾也不必擔心彩電價格會上漲。這是因為，“彩電廠商自律聯(lián)盟”只不過是一種“囚徒困境”，彩電價格不會上漲。在高峰會議之后不到二周，國內彩電價格不是上漲而是一路下跌。這是因為廠商們都有這樣一種心態(tài)：無論其他廠商是否降價，我自己降價是有利于自己的市場份額擴大的。類似的例子還有：政府要負責修建公共設施，因為私人沒有積極性出資修建公共設施蘇格蘭的草地為什么消失了？公共資源經常被過度利用。渤海中的魚愈來愈少了，工業(yè)化中的大氣及河流污染，森林植被的破壞等。解決公共資源過度利用的出路是政府制訂相應的規(guī)制政策加強管理，如我國政府規(guī)定海洋捕魚中，每年有一段時間的“休漁期”，此時禁止捕魚，讓小魚苗安安靜靜地生長，大魚好好地產卵，并對魚網的網眼大小作出規(guī)定，禁用過小網眼的捕網打魚，保護幼魚的生存。問題：為什么在城市中心道路上禁止汽車鳴喇叭？3.機制設計：如何走出囚徒困境如果恰當進行機制設計，前述囚徒困境還是可以避免的，下面是一個商戰(zhàn)中的真實例子。凍結價格戰(zhàn)的博弈機制美國有兩家銷售音像商品的商店“瘋狂艾迪”（CrazyEddie）和紐馬克與露易斯（Newmark&Lewis），它們之間在市場上存在競爭。當它們進行合謀時，如何保證對方不會背叛而降價的一個前提就是如何能迅速查出對方的背叛行為并給予懲罰。“瘋狂艾迪”已作出了承諾“不可能有人賣得比我們更低，我們的價格最低廉，我們保證價格最低，而且是超級瘋狂的低”。而對手企業(yè)Newmark&Lewis也打出“只要買我們的東西，將得到終生低價保證”。它承諾：假如你能在別處買到更低的價格，我們將加倍退錢。廣告承諾：假如你在本店買了商品之后，在你一生中于任何本地的銷售商（本行銷區(qū)內）那里發(fā)現相同的廣告款式而價格卻較本店低的話（以單據為憑），本店愿支付百分之百的差價，并額外付給差價的百分之二十五（以支票支付）；或是給你差價百分之二百的本店換貨單（除了原差價的百分之一百外，再額外加給百分之百，都是以換貨單方式支付）?！狽ewmark&Lewis公司終身低價保證乍一看，這兩家企業(yè)在玩命競爭，根本不可能形成價格聯(lián)盟，即使形成也難以維持，因而它們之間似乎是在打價格戰(zhàn)。但是，一種潛在的偵察降低價格行為的機制阻止了價格戰(zhàn)的發(fā)生。例如：每臺錄相機的批發(fā)價為150美元，此時兩家企業(yè)正以每臺300美元的價格出售?！隘偪癜稀贝蛩憬禐槊颗_275美元，從而將對手的顧客拉過來，例如那些家住在對手售貨點附近或過去曾買過對手商品的顧客。但是，對手的戰(zhàn)略鎖定了“瘋狂艾迪”的行為，因為“瘋狂艾迪”的這一計劃會有相反的效果。因為顧客會到對手那里先以300美元買下錄相機，然后再獲退款50美元。這樣，對手自然將價格降到更低的價格250美元一臺，顧客反而是從“瘋狂艾迪”那里流向對手而不是相反。如果對手不想以250美元一臺出售錄相機，他也可以將價格降到275美元一臺，只要它發(fā)現有顧客來要求退款，就會發(fā)現對手的背叛行為，從而將價格降到了250美元一臺。既不以太低價出售，又快速發(fā)現對手的背叛從而以降價予以報復，使對手降價也不能增大顧客量，從而蒙受損失。這樣，“瘋狂艾迪”就沒有進行價格戰(zhàn)的意愿了，自然形成價格聯(lián)盟。在美國，明目張膽的價格合盟是違法的，但這兩家企業(yè)卻以不違法的方式形成了價格合盟，顧客成了背叛行為的偵察者，這一戰(zhàn)略是十分巧妙的。國美、工貿——家用電器銷售策略二、智豬博弈：對諸多經濟現象的解釋1.智豬博弈豬圈中有一頭大豬和一頭小豬，在豬圈的一端設有一個按鈕，每按一下，位于豬圈另一端的食槽中就會有10單位的豬食進槽，但每按一下按鈕會耗去相當于2單位豬食的成本。如果大豬先到食槽，則大豬吃到9單位食物，小豬僅能吃到1單位食物；如果兩豬同時到食槽，則大豬吃7單位，小豬吃3單位食物；如果小豬先到，大豬吃6單位而小豬吃4單位食物。表2給出這個博弈的支付矩陣。表2智豬博弈

小豬按等待按大豬等待5,14,49,-10,0

這個博弈大豬沒有劣戰(zhàn)略。但是，小豬有一個劣戰(zhàn)略“按”，因為無論大豬作何選擇，小豬選擇“等待”是比選擇“按”更好一些的戰(zhàn)略。所以，小豬會剔除“按”，而選擇“等待”；大豬知道小豬會選擇“等待”，從而自己選擇“按”，所以，可以預料博弈的結果是(按,等待）。這稱為“重復剔除劣戰(zhàn)略的占優(yōu)戰(zhàn)略均衡”，其中小豬的戰(zhàn)略“等待”占優(yōu)于戰(zhàn)略“按”，而給定小豬剔除了劣戰(zhàn)略“按”后，大豬的戰(zhàn)略“按”又占優(yōu)于戰(zhàn)略“等待”

2.例子在經濟生活中，有許多“智豬博弈”的例子。例子：股市博弈

在股票市場上，大戶是大豬，他們要進行技術分析，收集信息、預測股價走勢，但大量散戶就是小豬。他們不會花成本去進行分析，而是跟著大戶的投資戰(zhàn)略進行股票買賣，即所謂“散戶跟大戶”的現象。問題：為什么中小企業(yè)不會花錢去開發(fā)新產品？三、動態(tài)博弈與承諾行動

如果局中人在進行行動選擇時有先后順序之分，這種博弈就被稱為“動態(tài)博弈”。例子3歐共體在空中客車與波音公司的競爭中對空中客車公司的戰(zhàn)略性補貼。

歐共體為了打破美國波音公司對全球民航業(yè)的壟斷，曾放棄歐洲傳統(tǒng)的自由競爭精神而對與波音公司進行競爭的空中客車公司進行補貼。表3未補貼時的博弈

空中客車開發(fā)不開發(fā)開發(fā)波音不開發(fā)-10,-10100,00,1000,0此時有兩個納什均衡，即一家開發(fā)而另一家不開發(fā)。下面，考慮歐共體對空中客車進行補貼20個單位的情況。此時，當兩家都開發(fā)時，空中客車仍然盈利10單位而不是虧損，博弈矩陣見表4表4有補貼時的博弈

空中客車開發(fā)不開發(fā)開發(fā)波音不開發(fā)-10,10100,00,1200,0這時只有一個納什均衡，即波音公司不開發(fā)和空中客車公司開發(fā)的均衡（不開發(fā),開發(fā)），這有利于空中客車。在這里，歐共體對空中客車的補貼就是使空中客車一定要開發(fā)（無論波音是否開發(fā)）的威脅變得可置信的一種“承諾行動”。例子：為什么大人物、大公司要聘請常年律師

大人物、大公司對聲譽十分看重，因而有一些不良人物或公司通過誹謗大人物、大公司企圖迫使大人物、大公司花錢“私了”而獲利。這是因為，盡管對于一些無端的指控，大人物、大公司可望通過法律手段（打官司）而出清了結，但打官司請律師會增加他們額外的成本。如果能花稍少一些錢“私了”，則既使自己清白又省錢，同時誹謗者也獲得收入。大人物、大公司為了避免這種無端的損失，干脆花錢請常年律師，律師費用已經一次性支付，打官司不會帶來額外的花費。這是一個承諾行動，它告訴潛在的誹謗者，大人物、大公司一旦受到無端誹謗必定會讓他們吃官司。這樣，大人物、大公司因此承諾行動而使自己得到保護，避免了許多無端指控的發(fā)生。我們可以運用“承諾行動”的原理來分析許多經濟及軍事現象。例子項羽的“破釜沉舟”。例子韓信趙國之戰(zhàn)，“置之死地而后生”四、不對稱信息下的博弈博弈論作為經濟學研究的有力工具，真正大行其道是在70年代不對稱信息下經濟行為分析的興起。不對稱信息指一些局中人擁有別的局中人不擁有的“私人信息”，也就是說一些局中人知道別的局中人不知道的某些情況。下面用一些例子說明這種情形下的博弈行為。問題：二手車市場為什么難以建立？在發(fā)達國家，二手車（舊車）的價格往往比新車差一大截，即使舊車本身沒有什么質量問題，一旦舊車進入二手車市場，其價格就會與新車相比差得老遠。在我國許多城市，二手車市場甚至難以建立起來，原因是進入市場的買車人太少。這是為什么呢？二手車市場的博弈理論為我們解答了這個謎。在二手車市場上，賣車人比買車人更多地知道車的質量情況，但賣車人不會將舊車的質量問題老老實實地告訴買車人。買車人也知道這種情形，因此，買車人在開出價格時會考慮到車的質量問題。假定沒有問題的好車價值20萬元，有問題的壞車只值10萬元，并且設買車人認為市場上出現好車和壞車的可能性各占一半。這時，買車人開出的價格不會高于1/2×20+1/2×10=15萬元。這樣，如果賣車人的車果真是好車，他就不會出售，好車退出市場，但當賣車人的車是壞車時，他會十分積極地將只值10萬元的車按15萬元賣給他。

但買車人知道愿意按15萬元賣的車一定是壞車，從而認定市場上全是壞車。所以，除非他愿意買一輛壞車，否則他會退出市場。當他愿買壞車時，他只開出10萬元的價。于是，舊車市場或者建立不起來，沒有買主，或者充斥著壞車，真正的好車退出市場，而壞車在不斷成交，但價格很低。

類似現象廣泛存在如人才市場、信貸市場等。如一個公司往往流走的是能力強的人，因為公司不能正確評價一個能力強的員工的能力，給予的薪水低于其市場價值。維克里拍賣法英式拍賣法：輪流出價，直到開除最高價的買主獲得，并支付所開出的最高價格。公開競價，容易出現圍標問題。一級密封價格拍賣法：密封出價后交給賣主。統(tǒng)一拆開信封后，賣給出價最高的買主，并支付相應價格。不會報出心中的價值。二級密封價格拍賣法（維克里拍賣法）：密封價格交給賣出，統(tǒng)一拆開后，賣給出價最高的人，按照第二高的價格成交。會按照心中的價值出價。70年代美國聯(lián)邦政府采用維克里拍賣法進行公共工程招標。

例子：壟斷廠商的低價銷售：信號傳遞博弈有許多壟斷廠商并未如人們所料想的那樣給商品定出一個很高的價格，而是以較低的價格長期銷售某種產品。譬如，發(fā)達國家的私營鐵路、航空、海運碼頭等的價格都遠低于按照其壟斷定價方法定出的價格。這是什么原因呢？一個電視劇，有一個情節(jié)是一位武林豪杰在交通要道邊開了一個酒館。生意十分興隆，引起另一位武林高手的垂涎。兩強相遇，武林豪杰和武林高手相互之間不知對方底細，于是來一番比試。本來，他們倆可以通過打斗來解決問題，但打斗一場雙方都會有所損傷，不如通過其他方式比較武功高低。豪杰拿來5塊磚，一掌將其擊碎，高手也不示弱，照樣擊碎5塊磚。于是，豪杰又拿來10塊磚，同樣是一掌擊個粉碎，高手見之，心中沒底，于是明白自己武功較豪杰還差一截。于是，這位武林高手甘拜下風，放棄了原來的計劃。這個電視劇情節(jié)在博弈論中被稱為“信號傳遞博弈”。豪杰身懷絕技、天下無敵。但其他人不一定會相信他是武林第一高手，除非親自與之交手并敗于他。交戰(zhàn)雖然可以決出高下，但對雙方都會有損失，打個頭破血流對誰都不是好事。當然，豪杰可以對外宣布他的武功非凡，其他人不是他的對手，但即使豪杰沒有什么本事，也可以如此對外宣布。所以，僅憑口頭宣布是難以令人信服的。俗話說，是騾子是馬，拉出去蹓蹓。豪杰用過人武功劈掉別人難以完成的十塊磚，就向別人發(fā)出一個信號。這個信號向外傳遞的信息是：我的武功高強，你們不可匹敵。這樣，不用打斗就決出高下，避免了打斗帶來的更大損失?，F在，我們用這個“信號傳遞博弈”的原理，來解釋為何一些壟斷廠商長期在低價格水平上經營。如果這個壟斷廠商是一個低生產成本的廠商，當其它較高生產成本廠商也進入這個廠商所經營的行業(yè)與之進行競爭時，原先的那個壟斷廠商可以通過降價將進入者趕出這個行業(yè)，從而繼續(xù)維持壟斷經營。由于壟斷廠商有更低的生產成本，所以，它能夠將產品價格降到比進入廠商的生產成本還要低的水平上，這就造成進入者或者高價格經營導致顧客流失，或者同樣也降價但價格低于成本，兩種情形進入者都會虧損，最后不得不退出行業(yè)。但是，這種“打斗”行為盡管可以擊退進入者，但由于一段時間的降價經營可能對壟斷者帶來較大損失。壟斷者為了避免這種損失，可以向外宣布它是低成本的，別的廠商休想進來與它競爭。但僅憑口頭宣布人家是不會相信的，因為即使壟斷者不是低成本的廠商，它也會如此宣布。一種方法就是，正如電視劇中的故事那樣，壟斷者向外發(fā)送一個信號，向外界傳遞它真是低成本的信息。它可以長期在一個較低價格水平上經營。如果它的價格足夠低，高成本廠商不敢模仿，行內廠商會據此判定它確是低成本的。同時，它的價格也不能太低，以致于較之與進入者進行降價競爭，其損失為小一些。這樣，壟斷者才會采取如此策略。潛在的高成本進入者不敢進入，壟斷者得以保持長期的壟斷地位。

問題：為什么商品廣告既無商品的價格信息又無售貨地點信息，只有大明星的表演？五、混合戰(zhàn)略博弈小孩玩的游戲“石頭，剪子，布”，也是一種博弈。但是，這個博弈有一種有趣的特征，即給定一方的任何選擇，另一方都有制勝對方的戰(zhàn)略，所以，給定一方任何一個戰(zhàn)略，對方都有制勝這個戰(zhàn)略的戰(zhàn)略，因而這個戰(zhàn)略不是最優(yōu)的。任何“純戰(zhàn)略”都不是最優(yōu)的，純戰(zhàn)略是“石頭，剪子，布”中的任何一個但是，我們知道，玩這個游戲是總是以對方不易猜出的隨機方式出招。事實上，可以通過數學證明，當雙方都以每個戰(zhàn)略按1/3的概率出招時，達成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰(zhàn)略納什均衡”，而這種以隨機方式選擇純戰(zhàn)略的博弈被稱為“混合戰(zhàn)略博弈”。以混合戰(zhàn)略博弈的概念，我們來看下面這個例子。例子：如果曹操與諸葛亮一樣聰明——三國演義中的華容道博弈在《三國演義》中，曹操在赤壁大戰(zhàn)中一敗涂地，率殘兵敗將向許都方向逃竄。諸葛亮命關羽率兵在途中阻截曹軍。當時，第一批攔截大軍是趙云率領的，第二批攔截大軍是張飛帶隊的，第三批才是關羽率部伏擊。由于曹軍兵多將廣，前二批伏擊軍不能逮住曹操，只是搶奪一些軍械馬匹之類。待曹軍沖過趙云、張飛兩道關后，進入關羽的伏擊地帶。但是，當時關羽與曹操相遇的地方有兩條道，一條是華容道，除此外還有另一條大道。諸葛亮令關羽伏兵于華容道，并且要求關羽在華容道上點燃樹枝冒出煙霧引曹操到來。當時關羽不解，問諸葛亮，“如果在伏兵之處點火，豈不令曹兵看見而改走另一條道逃脫？”諸葛亮叫關羽不要再問，只如此照辦即可。當曹操沖破趙云、張飛的阻截后，來到華容道前，看見華容道上靜悄悄的，但有煙火縈繞。曹操大笑道：“孔明以為我會上他的當，故意叫人在華容道上點火讓我走另一條道，而他卻伏兵于這條道上好逮住我呢！我偏不上他的當！”于是，曹操令大軍徑直上華容道上而去，結果與關羽大軍撞個正著。

曹操為何進了孔明的圈套呢？這里的道理是這樣的：孔明知道曹操是聰明人，而聰明人見華容道上有煙火會認為華容道上有伏兵，于是會避開華容道而走另一條路。如果孔明令關羽在另一條路等著，曹操就被逮住了。但是，曹操不僅聰明，而且還聰明過人，他也知道孔明的如此盤算來誘他上鉤，他偏不上當，知道點火的華容道上無人，孔明的隊伍在另一條道上呢！于是他選擇走華容道。但是，依《三國演義》中的邏輯，孔明總是比曹操計高一籌，按博弈論的術語來說，就是孔明的理性程度要比曹操高上一階?？酌饕仓啦懿僦揽酌鞯拇蛩?，于是令關羽正好在點火的華容道上等著曹操。《三國演義》中的這個故事很可能是作者編造的，因為在《三國志》中并無這一情節(jié)。這里，假設了曹操在智力上比孔明差一些，才有華容道上被關羽抓住，要不是關羽舊情難忘，曹操就死無葬身之地了但是，如果我們不假定曹操比孔明要笨一些，而是相反假定曹操與孔明一樣聰明，則曹操又知道孔明知道曹操知道孔明的打算，曹操就會知道關羽在華容道上等著他呢？此時曹操就避開華容道走另一條路。但是，這還沒有完，因為若孔明知道曹操知道孔明知道……。顯然，最終的結果是曹操與孔明進行混合戰(zhàn)略博弈，曹操隨機地以1/2的概率選擇走華容道和另一條路，孔明也以1/2的概率令關羽守華容道或另一條路。

于是，《三國演義》中的這一情節(jié)就應作如下改寫：“諸葛亮拋出一枚硬幣，決定關羽是守華容道呢還是另一條道……，而曹操也擲出一枚硬幣，決定是走華容道呢還是走另一條路?！逼骄磥恚懿儆?/2的概率逃脫，而關羽也只有1/2的概率抓住曹操。如果說關羽在華容道上抓住了曹操，則純屬偶然、并非孔明比曹操計高一籌所致！七、機制設計：

如何走出囚徒困境

如果恰當進行機制設計，前述囚徒困境還是可以避免的，下面是一些社會生活中的真實例子。有這樣一個故事，稱為“旅行者困境”，說的是有兩個旅行者甲和乙從一個以出產花瓶的著名旅游勝地回來時，他們都買了同樣的花瓶。提取行查時，發(fā)現花瓶被碰破了。他們向航空公司索賠。航空公司估計花瓶的價格在80或90元的價位左右，但不知道這兩位旅客購買的準確價格。航空公司要求兩位旅客在100元以內自己寫下花瓶價格。若兩人寫的相同，說明他們說了真話，就照他們寫的數額賠償；如果兩人寫的不一樣，那就認定寫得低的旅客講的是真話，按這個低的價格賠償，但是對講真話的旅客獎勵2元錢，對講假話的旅客罰款2元。如果兩人都寫100元，他們都會獲得100元。但是，給定乙寫100元，甲改寫99元，則他會獲得101元。乙又想，若甲寫99元，他自己寫98元，比寫100元好，因為這樣他獲100元，而寫100元當甲寫99元時自己卻只獲97元。而給定乙寫98元，甲又會寫97元，……，這樣，如果不說真話，最后落得每人都只寫1、2元的境地。例子飛機、輪船等設立頭等艙、經濟艙的道理是什么？

無論是買票乘飛機、火車還是輪船，不同的人所愿意支付的價格實際上是不一樣的。有的人收入高一些，或對花錢看得比較松一些，就可以支付較高的價格，相反，收入低的人或對花錢看得比較緊一些的人，就只愿支付較低的價格。但是，如果你問他們愿意支付什么樣的價格，他們都必定說愿支付較低的價格，因為有錢人也愿意以低價購買同樣的服務。飛機或輪船公司為了將這些在經濟學中被稱為具有不同支付意愿的人區(qū)分開來，讓能支付較高價格的人支付較高價格，就設計了一種“信息甄別”的機制，這種機制就是設立頭等艙、二等艙、三等艙，……，等等。這種機制發(fā)揮作用的道理是這樣的，我們可以用著名的“所羅門王斷案”的故事來說明。所羅門王是古代以色列國的一位以智慧著稱的君主。一次，兩個女人為爭奪一個嬰兒爭扯到所羅門王殿前，她們都說嬰兒是自己的，請所羅門王作主。所羅門王稍加思考后作出決定：將嬰兒一刀劈為兩段，兩位婦人各得一半。這時，其中一位婦人立即要求所羅門王將嬰兒判給對方，并說嬰兒不是自己的，應完整歸還給另一位婦人，千萬別將嬰兒劈成兩半。聽罷這位婦人的求訴，所羅門王立即作出最終裁決——嬰兒是這位請求不殺嬰兒的婦人的，應歸于她。這個故事講的道理是，盡管所羅門王不知道兩位婦人中誰是嬰兒的母親，但他知道嬰兒真正的母親是寧愿失去孩子也不會讓孩子被劈成兩半的。所羅門王正是利用這一點，一下就識別出誰是嬰兒的真正的母親了。所羅門王的這種方法在博弈論中被稱為“機制設計”，即設計一套博弈的規(guī)則，令不同類型的人作出不同的選擇，盡管每個人的類型可能是隱藏的，別人觀察不到，但他們所作出的不同選擇卻是可以觀察到的。觀察者可以通過觀察不同人的選擇而反過來推演出他們的真實類型。當飛機的艙位條件和價格完全一樣時，不同支付意愿的人都會以最低價格買票，不會有人愿支付比別人更多的錢去買相同的艙位的票。于是，航空公司將艙位分成頭等艙、二等艙，……，等等，價格不同，當然服務也不同，就將不同支付意愿的顧客區(qū)分開了。類似的還有，酒店的星級分類，五星級、四星級、三星級，……酒店，冰棍的不同品種與價格，影劇院的不同座位價格表等等，都是實現信息甄別的機制設計。七、總結博弈論中涉及到的生活中的各種經濟學道理是十分多而有趣的。有機會可以通過其它的著作了解到博弈論深遂的道理及其在經濟分析中的應用。推薦書目初級:

謝識予,《經濟博弈論》,復旦大學出版社(美)羅伯特.吉本斯《博弈論基礎》,中國社會科學出版社中級:張維迎,《博弈論與信息經濟學》,上海三聯(lián)書店,上海人民出版社高級:(美)朱.弗登博格(法)讓.梯若爾,《博弈論》,中國人民大學出版社博弈論與信息經濟學

（導論）導論0.1博弈論與主流經濟學的新發(fā)展一、經濟學研究的問題

1）傳統(tǒng)教科書：稀缺資源的有效配置

2）現代觀點：①研究人的行為②經濟學假定人是理性的③理性人假設：在面臨給定的約束條件下最大化自己的偏好——可用數學工具研究人的行為，研究經濟學。

理性是利己的，但在多個理性人共同作用時存在沖突，只有合作才能得到潛在的利益，因此，經濟學假設人在解決沖突中的合作，在合作中實現自己的偏好最大化。3）新制度經濟學——價格理論（以價格制度為研究對象）基本假設：①市場參與者的數量足夠使市場是完全競爭的（任何人不能操縱影響價格）②參與人之間不存在信息不對稱參與人數不是無限的，人們之間行為相互影響，一個人在最大化自己的偏好時必須考慮其他參與人的反應，因為其他參與人的反應影響著自己的偏好，這就是博弈論研究的問題。當參與人之間存在不完全信息時，任何一件制度安排（不同參與人之間的契約關系），就必須滿足“激勵相容性”和“個人理性”，這就是信息經濟學研究的問題。不完全信息產生的問題：價格機制不是實現合作和解決沖突最有效的手段。二、博弈論

1）1994年三位諾貝爾獎得主①Nash（納什）②Selten（澤爾騰）③Harsanyi（海薩尼）

2）博弈論研究問題①研究決策主體直接相互作用時的決策及這種決策的均衡。②研究多個互相作用的獨立決策主體時對決策的合理性預期?！褚粋€決策問題對一個決策主體（參與人）的結局不僅依賴于自己的決策，還依賴于其他決策主體（參與人）的決策。●每個參與人在分析互相作用對結局的影響中作出合理預期3）與傳統(tǒng)微觀經濟學的比較①個人決策：給定價格和收入使效用最大化的決策給定價格和成本函數使利潤最大化的決策②問題：<1>只依賴于自己的選擇，不依賴其他人的選擇。<2>這本應是多個人在市場中的作用，但個人選擇沒能看出這種作用，這種相互作用濃縮在一個參數——價格中。③每個人的決策成為非人格化的決策：不考慮自己對別人的影響，也不考慮別人對自己的影響。④博弈論：個人效用依賴于自己的選擇和別人的選擇。在相互外部經濟條件下（一個人的行為影響其他人利益的現象）的個人選擇問題。⑤傳統(tǒng)經濟學中的雙頭壟斷是博弈論的典型例子。4）博弈論研究對象的例子——決策行為相互影響決策人的利益（為本質）①寡頭壟斷②國家之間相互關系③夫妻博弈④中央和地方政府之間的關系5）博弈論的分類：合作與非合作博弈①主要區(qū)別特征：人們的行為相互作用時，所有當事人（參與人）之間是否可達成一個具有約束力的協(xié)議。合作的根本問題：如何分享合作帶來的剩余。②合作博弈：當事人間達成有約束力的協(xié)議——團隊理性（追求合作團隊目標），相當于這些達成協(xié)議的當事人按這種協(xié)議關系構成。

一個決策主體，即按一個合作決策主體的目標去行為，再分配合作帶來的剩余與合作者之間——雙方合作成為完全壟斷。③非合作博弈：沒有任何方能預測另一方接受并遵守協(xié)議，還是按自己的最優(yōu)選擇去行為。雙頭壟斷中如果一方不能接受協(xié)議，則各自選擇行為，最優(yōu)化自己的目標（價格，產量），但他們的選擇相互影響其利潤——這就是非合作博弈。6）博弈論的發(fā)展①1928年，諾伊曼在《Mathmaticche》上發(fā)表了—博弈論數學基礎。②1944年，諾伊曼與摩根斯坦恩的《TheTheoryofGamesandEconomicBehaviour》。③1950-1953,Nash四篇博弈論論文。④合作博弈：Shapley模型，Gillies“核”概念——50年代達到頂峰。⑤著名的實例：Tucker（1950）發(fā)現囚徒困境問題。Tucker與Nash的文章奠定了非合作博弈的基石。⑥Harsanyi將不完全信息列入博弈論（1967－1968）在《ManagementScience》上發(fā)表了三篇重要論文。⑦Selten（1965）將Nash均衡引入動態(tài)相互作分析，推出精練Nash均衡概念，克服Nash均衡過多且不合理現象。⑧Kreps和Wilson：動態(tài)不完全信息博弈。⑨Rubinstein研究討價還價模型。7）博弈論作為一種一般方法論①有人將其作為經濟學分支，有人將其作為數學的一個分支。②博弈論被授予經濟學獎的原因：<1>博弈論的成果廣泛應用于經濟學，博弈論的發(fā)展也借助經濟學的原型。<2>經濟學家對博弈論作出了重要貢獻。<3>博弈論與經濟學有相同的研究模式：個人理性、追求效用最大化、相互關系：博弈論直接，經濟學間接——價格。8）個人理性與信息作用——70年代以后重視①個人理性：效用函數最大化。②信息成為相互作用中的重要問題。③決策順序與信息：決策人不同決策順序有不同信息，他可以根據擁有的信息作出選擇?！@是經濟學中的重要問題，博弈論正好為解決這兩個問題提供了工具。<1>1965年Selten的工作：動態(tài)博弈考慮了博弈時序。<2>1967－1968Harsanyi的工作：考慮不完全信息博弈。<3>1982：克瑞普斯、威爾遜、米爾格羅姆、羅伯茨，關于信譽的模型——相互作用中的信息傳遞。9）《博弈與信息》——ByEricRasmusen40年代末，計量經濟學與博弈論同時發(fā)展，1969年計量經濟學家挪威的費里昂和荷蘭的丁伯根獲得了首屆諾貝爾經濟學獎。計量經濟學代替了經驗經濟學。隨后計量經濟學成為經濟學重要部分，而博弈論被經濟界遺忘。70年代后博弈論開始用于復雜經濟問題（現有經濟學理論無法解決的問題），特別是非對稱信息，動態(tài)行為的經濟問題。80年代博弈論成為主流經濟學的重要部分，幾乎代替了微觀經濟學。10）博弈論在西方經濟學中的地位①薩繆爾森時代，幾乎未用過博弈論。②90年代以前的經濟學著作很少博弈論。③90年代以后的微觀經濟學最暢銷書中，博弈論成為重要部分，用博弈論觀點和方法改寫微觀經濟學，特別是雙頭壟斷問題。④Trilor的《TheoryofIndustryOrganization》（產業(yè)組織理論）是完全在非合作博弈的基礎上寫的，是MIT教材，目前最受歡迎的產業(yè)組織理論教科書。⑤牛津大學的微觀經濟學：<1>90年代以前：消費者、生產者理論/市場與均衡/福利經濟學/企業(yè)理論<2>90年代以后：增加了博弈論/信息與合同理論（信息經濟學）三經濟學的發(fā)展趨勢1）向強調個體發(fā)展（個體理性），放棄了一些沒有微觀基礎的假設：如投資函數，消費函數，銷售最大化。2）向研究人與人之間行為的相互作用發(fā)展。①利益的一致與沖突/合作與競爭。以前人們之間的行為相互作用由價格參數間接影響。②個體理性可以導致團體不理性。③個體與集體間的沖突：不是通過政府干涉解決這種市場失靈導致的無效率現象，而是通過設計激勵機制方法解決這種沖突，使在個人理性下滿足集體理性——即制度安排的重要性。3）重視對信息的研究：信息不對稱時個人選擇和制度安排的影響。0.2非合作博弈論（簡稱博弈論）概述一、基本概念1）參與人（Player）也稱決策人，局中人：

獨立選擇（不受別人的控制）行為，最大化自己效用（偏好）的決策主體。2）行動：參與人決策變量。行動集：決策變量可行集。3）戰(zhàn)略：參與人選擇行動的規(guī)則。在什么條件（時刻或情況）下選擇什么行為。4）信息：參與人在博弈論中作決策（選擇）時擁有的知識，特別是關于對手特征（是什么）和行為（做了什么）知識。5）結局：在給定的環(huán)境下，所有參與人各自采取的行動或戰(zhàn)略構成的局勢（結果）。6）效用函數（支付函數）：參與人在博弈中在不同結局的效用水平。

博弈結局是由所有參與人戰(zhàn)略或行動決定的，即為所有參與人戰(zhàn)略或行動的函數。7）均衡：參與人相互最優(yōu)戰(zhàn)略行動；參與人合理理性預期戰(zhàn)略與行動。8）博弈規(guī)則：對個體行為方式的規(guī)范和結局的規(guī)范（結局對個人理性的描述，個體選擇規(guī)則）——博弈論研究目的：使用博弈規(guī)則決定均衡。二、博弈（非合作）的劃分1）按參與人行動先后順序分：

①靜態(tài)博弈：參與人同時選擇行動（是指信息同時，不是物理時間同時），即每個參與人在選擇行動時，不知道對手做了什么。②動態(tài)博弈：參與人的行動有先后順序（信息意義下和行動意義下，總可歸結為信息意義），后行動者知道先行動者做了什么，甚至自然發(fā)生了什么（在此之前）。2）按了解對手的知識分（知識包括：對手特征，戰(zhàn)略空間和支付函數）①完全信息博弈：每個參與人知道對手的這些信息，對手也是如此。②不完全信息博弈：至少有一個參與人對某個對手的知識缺乏完全了解。3）兩種劃分的結合構成四種博弈：

①完全信息靜態(tài)：Nash均衡②完全信息動態(tài)：精煉Nash均衡③不完全信息靜態(tài)：BayesNash均衡④不完全信息動態(tài)：精煉BayesNash均衡0.2.1完全信息靜態(tài)博弈一、構成與特征1）構成：參與人集N＝{1,…,n}

行動集Ai＝{ai1,…,aim}支付函數Ui(a1,…,an)，ai∈Ai2）特征：同時作出選擇二、Nash的主要貢獻1）合作博弈：協(xié)商理論（1950，1953）2）非合作博弈（最重要的貢獻）：1950－1951兩篇論文

①提出Nash均衡概念并證明Nash均衡的存在性。②奠定博弈論的基礎。③與數理經濟中的瓦爾拉斯均衡一致，從而解決了自斯密與瓦爾拉斯以來未解決的問題。3）Nash均衡①對每個參與人來說，都要選擇在其他參與人行動給定選擇使自己效用最大化的行為。②戰(zhàn)略組合：所有參與人選擇的行為（戰(zhàn)略）按一定順序構成的一組行動或戰(zhàn)略。③本質上講,每個參與人的效用依賴于戰(zhàn)略組合。④Nash均衡：是一種戰(zhàn)略組合，對這組戰(zhàn)略組合，沒有任何意義在其他所有人不改變其戰(zhàn)略的情況下改變自己的戰(zhàn)略——即沒有任何人有積極性打破這種Nash均衡。⑤Nash均衡可理解為：在互相作用，參與人之間自然達成的一種協(xié)議，由此作出人的行為規(guī)則——但這種協(xié)議沒有強制性約束力，是通過個人理性自動實現的。因為假定別人遵守這個協(xié)議，就沒人有積極性改變這個協(xié)議或偏離這個協(xié)議。如果一個戰(zhàn)略（協(xié)議）不是Nash均衡，就不會自動實施，因為有人可以違背這個協(xié)議來改善自己的利益（效用）。4）博弈論實例①囚徒困境：Tucker1950年發(fā)現了囚徒困境問題。1950年Tucker在斯坦福由于辦公室的原因被安排在心理學系，一天有個心理學家找他問他在做什么，Tucker說在研究GameTheory，Tucker應邀在心理學系開了一個討論班，下這個班上他發(fā)現了這個問題。

囚徒B

囚徒A坦白抵賴坦白-8，-80，-10抵賴-10，0-1，-1<1>條件：囚徒A，B不能通信，即靜態(tài)（同時）博弈（信息同時）。<2>囚徒行為：Nash均衡，（坦，坦）。<3>（坦，坦）是Nash均衡，且為最優(yōu)戰(zhàn)略均衡。分析：如A“坦”（或“抵”），那么B的最優(yōu)行為為“坦”；如B“坦”（或“抵”），那么A的最優(yōu)行為為“坦”。即無論對手采取什么行動，這個行動對他都是最好的。<4>問題：個體理性與集體理性的矛盾。個體理性導致集體不理性；如果只有一次博弈，事前的協(xié)議也沒有用，有時序和函數也沒有用。②寡頭壟斷進行產量選擇博弈兩個企業(yè)聯(lián)合起來形成一個卡特爾，可以壟斷利潤，每個企業(yè)可分享壟斷利潤。但這個協(xié)議無法遵守，因為如果一方遵守，另一方會增加產量使利潤最大。因此每個企業(yè)只得到在Nash均衡下的利潤，嚴格小于壟斷下的利潤。③公共產品供給大家出錢興辦公用事業(yè)，所有人的福利都會增加。每個人的行為是不出錢，不出錢是由于公用品的搭便車現象，使每個人考慮的是:我出錢，你不出，我吃虧，你仍能享受福利；我不出錢，你出錢興辦，我可以享受福利。所以每個人的最優(yōu)選擇是不出錢，不僅是Nash均衡，而且是最優(yōu)均衡。④軍備競賽兩個進行軍備競賽國家的行為：{資源用于軍用，資源用于民用}結局：{受威脅，不受威脅}條件：受威脅損失大于資源用于民用增加的社會福利。當別人用于軍事，而我用于民用，受威脅。均衡：兩國進行軍備競賽。——結論：一種制度或協(xié)議的安排與實現，是Nash均衡。⑤智豬博弈<1>問題描述與規(guī)則：兩頭豬：{大，小}，相當于參與人集。豬圈一端為食槽，一端為按鈕，按鈕開時有十個單位食物，但按鈕者要以兩個單位的成本付出。兩頭豬的行動：{按，不按}<2>規(guī)則：若大豬先到：大豬吃9單位，小豬吃1單位。若同時到：大豬吃7單位，小豬吃3單位。若小豬先到：大豬吃6單位，小豬吃4單位。小豬大豬按不按按5，34，4不按9，-10，0<3>均衡分析：小豬的行動：最優(yōu)行動：“不按”（最優(yōu)戰(zhàn)略）。大豬的行動：假設小豬“不按”，大豬的最優(yōu)策略是“按”。這時的均衡：（大豬“按”，小豬“不按”）。<4>結論：①多勞者不多得。②相同條件下，小利益者可以搭便車。ⅰ大股東，小股東對經理監(jiān)督問題類似于智豬博弈（大股東監(jiān)督，小股東不監(jiān)督)為均衡。ⅱ股市：大戶，小戶：搜集信息要相同成本，大戶利益大，小戶利益小。因此在大、小戶以前的博弈中，小戶跟大戶是最優(yōu)選擇。ⅲ同一新產品廣告：大企業(yè)與小企業(yè)之間一定是（大企業(yè)做，小企業(yè)不做）為均衡（成本相同，大企業(yè)利潤大）。ⅳ村里：富戶與貧戶同修一條路，一定是（富戶修，貧戶不出錢）。⑥性別戰(zhàn)（battleofthesexes）<1>一對相戀中的男女安排生產活動中的沖突：{男，女}。<2>行動：{看戲，看足球}。<3>規(guī)則：由如下博弈表

女男看戲看足球看戲2，10，0看足球0，01，2<4>均衡：{看足球，看足球}，{看戲，看戲}。<5>均衡分析：給定男（或女）看足球，對方的最優(yōu)選擇也是看足球。給定男（或女）看戲，對方的最優(yōu)選擇也是看戲。<6>問題：ⅰ多個Nash均衡ⅱ在實際生活中，博弈是反復的，會形成一種默契ⅲ先動優(yōu)勢：如果男的先選擇，一定是選足球，沒辦法，女的也只有選足球。若女的先選，兩人只好一起看戲了。⑦斗雞博弈<1>問題描述：兩個人走向獨木橋中央進行決斗。每個人有兩種行動：{繼續(xù)前進，退下}。規(guī)則：兩人共同前進，兩敗俱傷。若一方前進，另一方退下，前進者勝利，后退者失敗。<2>博弈矩陣：A

B進退進-3，-32，0退0，20，0<3>均衡（A進，B退），（A退，B進）兩人都進或退不是均衡。<4>分析：假設A進，B退是最優(yōu)行動。假設B進，A退是最優(yōu)行動。<5>結論：斗雞博弈一方失去面子，另一方獲勝。⑧市場進入阻止<1>問題：在位企業(yè)想鞏固其壟斷地位阻止?jié)撛谶M入者進入。<2>博弈描述：參與人集：{在位者，進入者}；行動集：在位者行動集{容納，阻止}，進入者行動集{進入，不進}；條件：進入成本為10；進入后雙方壟斷，各得到50；不進，壟斷保持，得到300；未考慮阻止成本。規(guī)則：不同行動組合下，雙方支付情況如下表所示在位者

進入者<3>Nash均衡：（進入，容納），（不進，阻止）<4>均衡分析：ⅰ給定在位者容納，進入者進入為最優(yōu)；同樣，給定進入者進入，在位者容納為最優(yōu)行動。ⅱ給定在位者阻止，進入者不進為最優(yōu)；給定進入者不進，在位者容納和阻止都為最優(yōu)。因此，（進入，容納）為Nash均衡。容納阻止進入40，50-10，0不進0，3000，3000.2.2完全信息動態(tài)博弈：子博弈精煉Nash均衡1）完全靜態(tài)博弈Nash均衡存在的問題：

①有多個Nash均衡。②每個參與人在選擇行動或戰(zhàn)略時，把其他參與人的戰(zhàn)略當作給定的，不考慮自己的選擇如何影響對手的戰(zhàn)略（靜態(tài)博弈，同時行動）。③Nash均衡允許有不可置信威脅戰(zhàn)略。如前例中，（不進入，阻止）是一個不可置信的威脅（但它是Nash均衡），我不進入，你真會斗爭（阻止）嗎？但你不阻止我就進入了。這表明這個威脅均衡不可置信。2）動態(tài)博弈①子博弈精煉Nash均衡概念的目的<1>剔除不可置信威脅的Nash均衡。<2>保證任何參與人在任何時點戰(zhàn)略是最優(yōu)的②動態(tài)博弈的表示形式：擴展型

<1>基本組成要素ⅰ參與人集；ⅱ參與人選擇行動時點（時序）；ⅲ參與人在選擇時點可供選擇行動的集合；ⅳ每個參與人在每次行動時有關對手過去行動選擇的信息；

ⅴ每個結局對應于所有參與人的支付<2>博弈樹—對應于決策論中的決策樹ⅰ用樹狀圖表示博弈過程，用以表示不同參與人的選擇行為先后順序，選擇行為，不同行動組合行動下的支付水平。例子：以市場阻止進入為例合作（40，50）進入者進入在位者在位者不進斗爭（-10，0）合作（0，300）斗爭（0，300）ⅱ歷史：參與人在作行動選擇時的知識，這些知識可能是“共同知識”，也可能不是“共同知識”,這里僅分析其為共同知識的情況。在歷史為“共同知識”時，作選擇的參與人知道自己在博弈過程中正確的位置。

ⅲ子博弈：對任何給定歷史，都會有一個正確作出選擇的參與人（當歷史為共同知識時），以這個歷史為始點參與人按時序作出行為選擇直接博弈結構，這個博弈稱為關于這個博弈的子博弈（歷史是子博弈的開始）——整個博弈也是一個子博弈，只是相應的歷史是“無任何知識”。ⅳ子博弈精煉Nash均衡：一個擴展博弈的子博弈精煉Nash戰(zhàn)略：對任何子博弈構成Nash均衡戰(zhàn)略。即對任何子博弈中任何參與人在任何時點作出的選擇都是最優(yōu)的。

ⅴNash均衡與子博弈精煉Nash均衡：子博弈精煉Nash均衡是Nash均衡，Nash均衡不一定是子博弈精煉Nash均衡。那么不具有不可置信威脅的Nash均衡才是子博弈精煉Nash均衡。<3>承諾行動ⅰ承諾行動是當事人使自己的威脅戰(zhàn)略變成可置信的行動ⅱ承諾行動的特征：當當事人不實施這種威脅時，當事人就就會受到損失，即當事人要為自己的失約付出成本。著名例子：“破釜沉舟”。<4>子博弈精煉Nash均衡與政策動態(tài)一致性及理性預期均衡類似政策動態(tài)一致性：一種政策不僅在制定時是最優(yōu)的，而且在制定后的各階段也應該是最優(yōu)的。0.2.3不完全信息靜態(tài)博弈：BayesNash均衡1）完全信息靜態(tài)博弈的基本假設:

參與人知道自己和所有對手的偏好，行動空間（戰(zhàn)略空間）及條件戰(zhàn)略組合（行動組合）下的利潤——實際中這種情況是很少的更多情況是不知對手怎么樣。2）不完全信息博弈：

博弈中各參與人對其他參與人的偏好或戰(zhàn)略空間或支付函數及其參數信息不完全了解。3）例：市場進入問題

進入博弈中結局對參與人的支付決定于在位者的成本，而進入者不確切地知道在位者的成本。例如，假設在位者可能有兩種成本：高、低。在位者各成本的博弈矩陣為：高成本下：低成本下：在位者在低成本下在相同對策局勢，在位者的支付要高于高成本時的支付。合作斗爭進入40，50-10，0不進0，3000，300合作斗爭進入30，100-10，140不進0，4000，400分析：高成本在位者，選合作。①當進入者選擇進入時低成本在位者，選斗爭（因為成本低，所以使他斗爭獲得的利潤還高于合作時的利潤）。②均衡與在位者的成本類型有關。4）虛擬參與人——Harsanyi的重要貢獻，這個參與人相當于“自然”。①有多種類型的參與人確切知道自己的真實類型。②其他參與人不知道具有多種類型參與人的具體類型，就由這個虛擬參與人選擇這個多類型參與人的類型，它是隨機選擇的，即按一種概率分布選擇參與人類型——這個分布函數可以是所有參與人的“共同知識”。這種虛擬參與人按某種概率分布函數選擇參與人的類型的方法稱為Harsanyi變換。5）Harsanyi變換的作用①將不完全信息問題轉換為完全但不完美的信息問題。②完美信息：參與人在選擇時確切知道歷史，即確定知道過去對手和自己及自然發(fā)生的行動或事件。即每個參與人在作選擇時，確切地知道自己所處的位置。③不完全信息：至少有一個參與人在某個作選擇的時刻，不能確定自己的確切位置。④H變換：將不完全信息問題（對類型的不確定知道），通過H變換后，自然按不同概率選擇了不同類型，但其他參與人不能確切知道，只能知道其為某類型的概率，于是其他參與人作選擇時不能確切知道自己所處的位置。6）BayesNash均衡——解釋①由于參與人同時博弈，又不能觀測其他人的選擇，因此每個人只能是在給定其他人的戰(zhàn)略選擇下，選擇依賴于自己類型的最優(yōu)戰(zhàn)略。②由于每個參與人只知道其他參與人類型的概率而不是真實確定類型，不能準確知道對手的理性行為（在某一種類型下是非理性，而在另一種類型下是理性）。因此，

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論講解學習

文檔簡介

溫馨提示

最新文檔

評論

博弈論講解學習

文檔簡介

溫馨提示

最新文檔

評論

相關文檔