版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
引言博弈論又被稱為對策論(GameTheory),按照2005年因?qū)Σ┺恼摰呢暙I而獲得諾貝爾經(jīng)濟學獎的RobertAumann教授的說法,博弈論就是研究互動決策的理論。所謂互動決策,即各行動方(即局中人[player])的決策是相互影響的,每個人在決策的時候必須將他人的決策納入自己的決策考慮之中,當然也需要把別人對于自己的考慮也要納入考慮之中……在如此迭代考慮情形進行決策,選擇最有利于自己的戰(zhàn)略(strategy)。
當前1頁,總共77頁。博弈論的應用領域十分廣泛,在經(jīng)濟學、政治科學(國內(nèi)的以及國際的)、軍事戰(zhàn)略問題、進化生物學以及當代的計算機科學等領域都已成為重要的研究和分析工具。此外,它還與會計學、統(tǒng)計學、數(shù)學基礎、社會心理學以及諸如認識論與倫理學等哲學分支有重要聯(lián)系。引言當前2頁,總共77頁。按照Aumann所撰寫的《新帕爾格雷夫經(jīng)濟學大辭典》“博弈論”辭條的看法,標準的博弈論分析出發(fā)點是理性的,而不是心理的或社會的角度。不過,近30年來結(jié)合心理學和行為科學、實驗經(jīng)濟學的研究成就而對博弈論進行一定改造的行為博弈論(behavoiralgametheory)也日益興起。引言當前3頁,總共77頁。失火了,你往哪個門跑——這就是博弈論
一天晚上,你參加一個派對,屋里有很多人,你玩得很開心。這時候,屋里突然失火,火勢很大,無法撲滅。此時你想逃生。你的面前有兩個門,左門和右門,你必須在它們之間選擇。但問題是,其他人也要爭搶這兩個門出逃。如果你選擇的門是很多人選擇的,那么你將因人多擁擠、沖不出去而燒死;相反,如果你選擇的是較少人選擇的,那么你將逃生。這里我們不考慮道德因素,你將如何選擇?當前4頁,總共77頁。你的選擇必須考慮其他人的選擇,而其他人的選擇也考慮你的選擇。你的結(jié)果——博弈論稱之為支付,不僅取決于你的行動選擇——博弈論稱之為策略選擇,同時取決于他人的策略選擇。你和這群人構(gòu)成一個博弈(game)。上述博弈是一個叫張翼成的中國人在1997年提出的一個博弈論模型,被稱之為少數(shù)者博弈或少數(shù)派博弈(MinorityGame)。生活中博弈的案例很多,你會見到很多例子。只要涉及到人群的互動,就有博弈。
引言當前5頁,總共77頁。什么叫博弈?博弈的英文為game,我們一般將它翻譯成“游戲”。而在西方,game的意義不同于漢語中的游戲。在英語中,game即是人們遵循一定規(guī)則下的活動,進行活動的人的目的是使自己“贏”。奧林匹克運動會叫OlympicGames。在英文中,game有競賽的意思,進行g(shù)ame的人是很認真的,不同于漢語中游戲的概念。在漢語中,游戲有兒戲的味道。因此將關于game的理論,即gametheory翻譯成博弈論或者對策論,是恰當?shù)摹?/p>
引言當前6頁,總共77頁。博弈論的出現(xiàn)只有60多年的歷史。博弈論的開創(chuàng)者為諾意曼與摩根斯坦,他們1944年出版了《博弈論與經(jīng)濟行為》。博弈論天才納什(JohnNash)的開創(chuàng)性論文《n人博弈的均衡點》(1950)、《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。今天博弈論已發(fā)展成一個較完善的學科。博弈論對于社會科學有著重要的意義,它正成為社會科學研究范式中的一種核心工具,以至于我們可稱博弈論是“社會科學的數(shù)學”,或者說是關于社會的數(shù)學。引言當前7頁,總共77頁。
1994年經(jīng)濟學諾貝爾獎頒發(fā)給三位博弈論專家:納什、塞爾屯(R.Selten)、海薩尼(JohnC.Harsanyi),而像1985年獲得諾貝爾獎的公共選擇學派的領導者布坎南,1995年獲得諾貝爾獎的理性主義學派的領袖盧卡斯(Lukas),其理論與博弈論都有著較深的聯(lián)系。現(xiàn)在博弈論正滲透到各門社會科學,更重要的是它正深刻地改變著人們的思維。引言當前8頁,總共77頁。汪賢裕、肖玉明編著,博弈論及其應用,科學出版社,2008年2月潘天群著,博弈生存(第二版),中央編譯出版社,2004年10月王春永編著,博弈論的詭計,中國發(fā)展出版社,2007年1月參考書當前9頁,總共77頁。博弈論研究的對象:是理性的行動者或參與者如何選擇策略或如何作出行動的決定。理性的人是對現(xiàn)實的人的基本假定,即假定參與者努力用自己的推理能力使自己的目標最大化。“理性的”與“道德的”不是一回事,理性的與道德的有時會發(fā)生沖突,但是理性的人不一定是不道德的?;拘g(shù)語當前10頁,總共77頁。博弈涉及哪些內(nèi)容呢?博弈涉及至少兩個獨立的博弈參與者(player)。博弈涉及行動者存在著策略(strategy)選擇的可能,博弈論用策略空間來表示參與者可以選擇的策略。
參與者在不同策略組合下會得到一定的支付(payoff)。對于博弈參與者來說,存在著一博弈結(jié)果。博弈涉及均衡。重要的均衡——納什均衡。基本術(shù)語當前11頁,總共77頁。根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動,博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。合作性博弈:是指參與者從自己的利益出發(fā)與其他參與者談判達成協(xié)議或形成聯(lián)盟,其結(jié)果對聯(lián)盟方均有利;
非合作性博弈:是指參與者在行動選擇時無法達成約束性的協(xié)議。人們分工與交換的經(jīng)濟活動就是合作性的博弈,而囚徒困境則是非合作性的博弈。博弈的類型當前12頁,總共77頁。博弈又可分靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈:指參與者同時采取行動,或者盡管參與者行動的采取有先后順序,但后行動的人不知道先采取行動的人采取的是什么行動。動態(tài)博弈:指參與者的行動有先后順序,并且后采取行動的人可以知道先采取行動的人所采取的行動。
博弈的類型當前13頁,總共77頁。從知識的擁有程度來看,博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內(nèi)容。完全信息博弈:參與者對所有參與者的策略空間及策略組合下的支付有“完全的了解”,否則是不完全信息博弈。嚴格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識”的博弈。不完全信息博弈:參與者所做的是努力使自己的期望支付或期望效用最大化。
博弈的類型當前14頁,總共77頁。例:豬圈里有兩只豬,一只比較大,一只比較小。豬圈狹長,豬食槽在一頭,豬食按鈕在另一頭,按一下會有10個單位的豬食落進槽里。由于按鈕和食槽距離較遠,按按鈕的體力耗費相當于2個單位的食物。
模型一、智豬博弈/完全信息靜態(tài)博弈
小豬大豬按不按(等待)按(5,1)(5,3)不按(等待)(9,-1)(0,0)大豬和小豬分別該如何選擇。
當前15頁,總共77頁。選擇等待是小豬的占優(yōu)策略。大豬的最佳選擇取決于小豬的行動,如果小豬去按,大豬最好選擇等待;如果小豬不去按,則最佳選擇是大豬親自去按。也就是說,在智豬博弈中,大豬沒有占優(yōu)策略,而小豬有占優(yōu)策略,它的最佳選擇就是耐心等待大豬去按鈕,才能獲得最佳結(jié)果?!靶∝i躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導致的。規(guī)則的核心指標是:每次落下的事物數(shù)量和踏板與投食口之間的距離。模型一、智豬博弈/完全信息靜態(tài)博弈當前16頁,總共77頁。如果改變一下核心指標,豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。改變方案一:減量方案。改變方案二:增量方案。改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。
對于游戲設計者,這是一個最好的方案。成本不高,但收獲最大。模型一、智豬博弈/完全信息靜態(tài)博弈當前17頁,總共77頁。在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。模型二、囚徒困境/非合作博弈當前18頁,總共77頁。假設:有兩個小偷A和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。模型二、囚徒困境/非合作博弈當前19頁,總共77頁。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡。模型二、囚徒困境/非合作博弈乙
甲坦白抵賴坦白(-8,-8)(0,-10)抵賴(-10,0)(-1,-1)當前20頁,總共77頁。對于兩個犯罪嫌疑人總體而言,他們設想的最好的策略可能是都不交代。但任何一個犯罪嫌疑人在選擇不交代的策略時,都要冒很大的風險,一旦自己不交代而另一犯罪嫌疑人交代了,自己就將可能處于非常不利的境地。對于A而言,不管B采取何種策略,他的最佳策略都是交代。對于B而言也是如此。最后兩人都會選擇交代。模型二、囚徒困境/非合作博弈當前21頁,總共77頁。該博弈刻劃了兩大難題:沖突情形下,參與人的目標是什么?是采用(作為個人)他自己的最好策略,還是采用(作為集體的一員)他們共同的最好策略?前者導致均衡策略(坦白,坦白),支付為(-8,-8);后者的最好策略是(抵賴,抵賴),支付為(-1,-1)。這里反映了個體理性行為與集體理性行為之間的矛盾、沖突。此博弈只進行一次還是重復進行?如果博弈只進行一次,參與人似乎只有坦白才是最好的策略,因為沒有理由相信對手會對你有信心,他總認為你自己會坦白;因此,雙方都采取坦白策略。然而,若博弈進行多次,則結(jié)論將會發(fā)生變化。模型二、囚徒困境/非合作博弈當前22頁,總共77頁。囚徒困境可以用來說明許多現(xiàn)象。寡頭定價拍賣出價推銷員的努力政治上的討價還價軍備競賽等(沖突中出現(xiàn)兩敗俱傷的情況,往往要考慮到囚徒困境)
*(純策略)納什均衡模型二、囚徒困境/非合作博弈當前23頁,總共77頁。什么是博弈論?試舉兩個你生活中的例子說明。某年在荷蘭召開了一次“合作及社會兩難困境研討會”,與會者都是博弈論的專家。當大會結(jié)束之后,有兩個學者,麥息克和路特提議大家玩一個游戲。他們將一個大信封拿出來,請在場的43位專家拿出金錢裝到這個信封里。如果到最后這信封里的錢超過250元,麥息克和路特將自己掏腰包,退還每人10元。不過,如果最后信封內(nèi)的錢不足250元,就統(tǒng)統(tǒng)沒收,大家拿不到半毛錢。
仔細想一想,如果你也在場,你會奉獻多少錢呢?問題與思考當前24頁,總共77頁。什么是海薩尼轉(zhuǎn)換?海薩尼提出了一種處理不完全信息博弈的方法,即引入一個虛擬的局中人——“自然”。自然首先行動,它決定每個局中人的特征。每個局中人知道自己的特征,但不知道別的局中人特征。這種方法將不完全信息靜態(tài)博弈變成一個兩階段動態(tài)博弈,第一個階段是自然N的行動選擇,第二階段是除N外的局中人的靜態(tài)博弈。這種轉(zhuǎn)換被稱為“海薩尼轉(zhuǎn)換”,這個轉(zhuǎn)換把“不完全信息”轉(zhuǎn)變成為完全但不完美信息,從而可以用分析完全信息博弈的方法進行分析。模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈當前25頁,總共77頁。海薩尼轉(zhuǎn)換的具體方法一個虛擬的參與人“自然”,自然首先決定參與人的類型,賦予各參與人的類型向量,其中;
自然告知參與者自己的類型,卻不告訴其他參與者的類型;參與者同時選擇行動,每一參與者從可行集中選擇行動方案;各方得到收益。借助于第一步和第二步中虛構(gòu)的參與者“自然”的行動,我們可以把一個不完全信息的博弈表述為一個不完美信息的博弈。模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈當前26頁,總共77頁。海薩尼轉(zhuǎn)換分析海薩尼轉(zhuǎn)換是處理不完全信息博弈的標準方法。一般地,“自然”在博弈開始的時候選擇參與人的類型,參與人的某個類型包括表征類型的各個特征如策略空間、信息集、得益函數(shù)等,這些又稱為該類型參與人所擁有的個人信息。不完全信息意味著博弈各方中至少有一個參與人有多個類型。模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈當前27頁,總共77頁。通過海薩尼轉(zhuǎn)換,博弈開始時,所有參與人有關“自然”的行動有一致的信念,即都知道所有參與人類型的概率分布函數(shù),此即“海薩尼公理”。
模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈當前28頁,總共77頁。經(jīng)典案例解析例:某一市場原來被A企業(yè)所壟斷。現(xiàn)在B企業(yè)考慮是否進入。B企業(yè)知道,A企業(yè)是否允許它進入,取決于A企業(yè)阻撓B企業(yè)進入所花費的成本。如果阻撓的成本低,那么,正如下表后兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是阻撓,博弈有重復剔除的占優(yōu)戰(zhàn)略均衡——A阻撓,B不進入。如果阻撓的成本高,那么,正如下表前兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是默許B進入,博弈有重復剔除的占優(yōu)戰(zhàn)略均衡——A默許,B進入。B企業(yè)所不知道的,是A企業(yè)的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在本例中,阻撓成本就是A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈當前29頁,總共77頁。海薩尼轉(zhuǎn)換后的市場進入博弈:模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈
AB高成本低成本默許阻撓默許阻撓進入(40,50)(-10,0)(30,100)(-10,140)不進入(0,300)(0,300)(0,400)(0,400)顯然,在這里,B所遇到的,是不確定性條件下的選擇問題。因為B不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。當前30頁,總共77頁。
按照海薩尼的方法,所有參與人的真實類型都是給定的。其他參與人雖然不清楚某一參與人的真實類型,但知道這些可能出現(xiàn)的類型的分布概率,而且這種概率是公共知識。用本例來說,公共知識不僅意味著B企業(yè)知道A企業(yè)高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈當前31頁,總共77頁。模型三、獨立私人價值下的一級密封拍賣/不完全信息靜態(tài)博弈N低成本高成本ABB(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)ABB默許默許阻撓阻撓進入不進入進入進入進入不進入不進入不進入*貝葉斯納什均衡
當前32頁,總共77頁。言語博弈中的“威脅”與“承諾”
在現(xiàn)實中,我們經(jīng)常看到聲稱的策略決定,但是這些聲稱的策略可信嗎?聲稱的策略包括“威脅”與“承諾”。在國際核武器問題上,我國及其他一些國家承諾“不首先使用核武器”就是一種言語承諾。博弈論中,經(jīng)常用“可置信”和“不可置信”的“威脅”或“承諾”來區(qū)分行動者說出來的策略,我們在對動態(tài)博弈的分析中會分析什么樣的策略是可置信的,什么樣的策略是不可置信的。而分析“威脅”或“承諾”是可置信的還是不可置信的方法是倒推法。模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前33頁,總共77頁。倒推法(backwardinduction)也叫逆向歸納法。那么什么是倒推法?要理解什么是倒推法,先來看一下商界里經(jīng)常見到的博弈。在某個城市假定只有一家房地產(chǎn)開發(fā)商A,我們知道任何沒有競爭下的壟斷利潤是很高的,假定A此時每年的壟斷利潤是10億元。模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前34頁,總共77頁?,F(xiàn)在假定有另外一個企業(yè)B,準備從事房地產(chǎn)開發(fā)。面對著B要進入其壟斷的行業(yè),A想:一旦B進入,A的利潤將受損很多,B最好不要進入。所以A向B表示,你進入的話,我將阻撓你進入。假定當B進入時A阻撓的話,A的利潤降低到2,B的利潤是-1。而如果A不阻撓的話,A的利潤是4,B的利潤也是4。模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前35頁,總共77頁。這樣一個博弈可用下圖表示:模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
B進入不進入AA:10;B:0阻撓不阻撓A:2;B:-1A:4;B:4當前36頁,總共77頁。
上圖稱之為博弈樹。由上圖可見,這個博弈由兩階段構(gòu)成。我們稱之為動態(tài)博弈,或者兩階段的動態(tài)博弈。博弈樹是表示動態(tài)博弈的一個好方法。
現(xiàn)在讓我們回到房地產(chǎn)開發(fā)商之間的博弈問題。A的最好結(jié)局是“B不進入”,而B的最好結(jié)局是“進入”而A“不阻撓”。這兩個最好的結(jié)局不能構(gòu)成均衡。那么結(jié)果是什么呢?模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前37頁,總共77頁。A向B發(fā)出威脅:如果你進入,我將阻撓。而對B來說,如果進入,A真的阻撓的話,它將受損失-1(假定-1是它的機會成本),當然此時A也有損失。對于B來說,問題是:A的威脅可置信嗎?B通過分析得出:A的威脅是不可置信的。原因是:當B進入的時候,A阻撓的收益是2,而不阻撓的收益是4。4>2,理性人是不會選擇做非理性的事情的。也就是說,一旦B進入,A的最好策略是合作,而不是阻撓。因此,通過分析,B選擇了進入,而A選擇了合作。雙方的收益各為4。模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前38頁,總共77頁。
在這個博弈中,B采用的方法為倒推法,或者說逆向歸納法,即:當參與者作出決策時,他要通過對最后階段的分析,準確預測對方的行為,從而確定自己的行為。在這里,雙方必須都是理性的。如果不滿足這個條件,就無法進行分析了。這個例子只是簡單的兩階段博弈,而三階段或更多階段的博弈,可用同樣方法加以分析。在動態(tài)博弈中,涉及“威脅”與“承諾”是不是可信的問題。靜態(tài)地看,一博弈存在許多均衡。模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前39頁,總共77頁。上述“進入——阻撓”問題的博弈樹可用支付矩陣表示:模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
BA進入阻撓阻撓(2,-1)(10,0)不阻撓(4,4)(10,0)在這個矩陣中,納什均衡點有兩個:(合作,進入)和(阻撓,不進入)。我們可以驗證,在這兩點上誰都不愿意改變策略。然而(阻撓,不進入)這個均衡是達不到的。因為這是動態(tài)博弈,在這個動態(tài)博弈中,存在著先后策略選擇順序。當前40頁,總共77頁。這里分析的是完全且完美信息下的動態(tài)博弈。所謂完全信息是指:博弈的支付函數(shù)是“公共知識”。本書中未涉及不完全信息的博弈問題,如囚徒困境這樣的靜態(tài)博弈也是完全信息博弈。完美信息是針對動態(tài)博弈而言的,指參與者知道博弈的所有歷史。倒推法是動態(tài)博弈中有用的工具,它可以說是理性的人自然的推理方式。然而倒推法面臨著一個困難,這就是蜈蚣博弈的悖論。模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前41頁,總共77頁。前面我們分析了“威脅”是否可信,我們也可用同樣的思路分析一個“承諾”是否可信。——“不首先使用核武器”的承諾可信嗎?
*子博弈完美納什均衡模型四、Stackelberg雙寡頭競爭模型/完全且完美信息動態(tài)博弈
當前42頁,總共77頁。光天化日之下的違法行為為什么總能成功?人類有許多關于猴子的故事,比如朝三暮四,殺雞給猴看。其實猴子是沒有思維的,它們有一定的群體意識,但沒有社會意識,人們關于它們的故事其實是說人自己的。我們這里也講一個猴子的故事……。在現(xiàn)實社會中,竊賊在公共場所比如公共汽車上偷東西時,車上的乘客看到了,但不敢吭聲。沒有被偷的人想,反正被偷的待宰猴群的結(jié)局人不是我,我反抗了,我得不到任何好處,反而遭到傷害;而不反抗雖不得益,但也不受損,我何必要反抗呢?這就是光天化日之下的偷竊行為為什么總能成功的原因。模型五、信號博弈/不完全信息動態(tài)博弈當前43頁,總共77頁。竊賊在偷東西時發(fā)出這樣的信號:如果誰反抗,將毆打誰。乘客想,竊賊的威脅是可信的:因為如果個別乘客反抗,而竊賊不毆打該乘客的話,就會有更多的乘客抓竊賊,竊賊將有可能被抓,因此竊賊必然歐打反抗的乘客。乘客的策略及可能的支付為:反抗,有可能被毆打甚至受傷;不反抗,無所得也無所失。模型五、信號博弈/不完全信息動態(tài)博弈當前44頁,總共77頁。乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客:受傷竊賊:可能被抓,可能逃脫乘客:無所得,無所失竊賊:被抓竊賊毆打不毆打乘客:受傷竊賊:得到贓物乘客:無所得,無所失竊賊:得到贓物當前45頁,總共77頁。
對于乘客來說,竊賊的威脅是可信的,因而乘客的最優(yōu)策略是“不反抗”;而對于竊賊來說,乘客“不反抗”下的“不毆打”策略為最憂。這一博弈的結(jié)果是,竊賊偷東西時“乘客不反抗,竊賊不敢打”,這是一“子精煉納什均衡”。這樣一種群體不反抗的結(jié)果將使社會風氣惡化,偷竊之風盛行。對個體來說,雖然這一次被偷的不是你,但下次你被偷的幾率增加了。這使得我們都如同待宰的猴子,我們不知道什么時候輪到我們自己。這樣,我們每個人的處境比以前更差。模型五、信號博弈/不完全信息動態(tài)博弈當前46頁,總共77頁。如何從這種困境中擺脫出來?我們看到,使乘客采取“反抗”策略,而非“不反抗”策略在于加大采取“反抗”策略的獲益,而減少不反抗的獲益。當“反抗”策略下的獲益大于“不反抗”策略下的獲益時,乘客就會采取“反抗”的策略。加大道德宣傳,培養(yǎng)人的道德感可以解決這個囚徒困境。模型五、信號博弈/不完全信息動態(tài)博弈當前47頁,總共77頁。乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客:受傷,但沒有道德滿足感竊賊:可能被抓,可能逃脫乘客:沒有受傷并有道德滿足感竊賊:被抓竊賊毆打不毆打乘客:受傷,并有道德恥辱感竊賊:得到贓物乘客:道德恥辱感竊賊:得到贓物上述博弈過程為:當前48頁,總共77頁。這樣,當小偷偷東西時,盡管乘客認為竊賊的威脅是可信的,但是如果乘客是道德感強的人,那么博弈結(jié)果是“乘客反抗,小偷毆打”,從而小偷有可能被抓住,這也是一“子精煉納什均衡”。博弈論對不合作的博弈結(jié)果的預測是令人悲哀的。但是,從這個例子我們看到,道德就是由群體實施的對所謂“非道德”的行為進行非強制性的懲罰機制,而法律及實施法律的國家的形成與改進就是建立一個對所謂“違法行為”實施的中心懲罰機制。
*精煉貝葉斯納什均衡;混同均衡;分離均衡模型五、信號博弈/不完全信息動態(tài)博弈當前49頁,總共77頁。哪種策略更能贏?假定我們的社會已經(jīng)形成約束行動者的道德規(guī)范。如果對不道德的行為不能產(chǎn)生即時的懲罰,不道德的行為在社會中往往能給行為者帶來好處。這表現(xiàn)在一次性的非合作的博弈中,行為者理性地選取對自己有利的行動。但是,如果存在重復博弈,參與者之間對不合作行為就會形成懲罰機制。對囚徒困境進行無限次的重復博弈,什么樣的策略會贏?模型六、有效工資率/重復博弈
當前50頁,總共77頁。這里涉及參與者以什么樣的態(tài)度對待對方的不合作策略。在博弈論里,有兩個著名的策略。如果一方采取不合作的策略另一方隨即也采取不合作策略并且永遠采取不合作策略,在博弈論里面稱之為觸發(fā)策略,或稱冷酷策略,英文叫triggerstrategy。模型六、有效工資率/重復博弈
乙甲不合作合作不合作(1,1)(4,0)合作(0,4)(2,2)當前51頁,總共77頁。如果對方知道你的策略是觸發(fā)策略,那么對方將不敢采取不合作策略,因為一旦他采取了不合作策略,雙方便永遠進入不合作的困境。因此,只要有人采取觸發(fā)策略,那么雙方均愿意采取合作策略。但是這個策略面臨著這樣一個問題:如果雙方存在誤解,或者由于一方發(fā)生選擇性的錯誤,這個錯誤是無意的,那么結(jié)果將是雙方均采取不合作的策略。也就是說,這種策略不給對方一個改正錯誤或解釋錯誤的機會。模型六、有效工資率/重復博弈
當前52頁,總共77頁。第二種策略是,若你采取不合作策略,我也采取不合作策略,但是如果你采取了合作策略,我也采取合作策略。這叫“一報還一報”策略,或者稱之為“針鋒相對”,英文叫tit-for-tat。美國密執(zhí)安大學的羅伯特·??怂沽_德(RobertAxerold)主持了一次計算機比賽,看誰寫出來的程序能夠贏。參加者有政治學家、數(shù)學家、經(jīng)濟學家、社會學家,他們都詳細研究過囚徒困境。獲勝者是加拿大多倫多大學的拉波波特寫出的tit-for-tat策略。這個程序非常簡單:第一步采取合作,接著對方采取什么策略,他便跟著做什么。模型六、有效工資率/重復博弈
當前53頁,總共77頁。
當然有多種策略,如對方采取了不合作,但自己永遠采取合作策略,這個策略可以叫做“以德報怨”策略。這個策略對行動者最為不利,因為對方知道你采取這種策略,他會永遠采取不合作的策略,因而理性的人是不會采取這種“以德報怨”策略的。然而,極端道德的人是超越理性的限制的,此時他會采取“以德報怨”策略。佛說:“我不入地獄,誰入地獄?”基督說:“愛你的敵人?!彼麄儛垡磺腥硕粫嬎闼麗鄣男袆訒o他帶來利益或災難,而是希望他的行動感化眾生。模型六、有效工資率/重復博弈
當前54頁,總共77頁。
如果是有限次的囚徒困境,那么情況就不同于上述無限次的囚徒困境的重復博弈。當臨近博弈的終點時,采取不合作策略的可能性加大,如果參與人以前的所有策略均為合作策略,并且被告知下一次博弈是最后一次,那么雙方肯定采取不合作的策略。
這可以解釋許多商業(yè)行為。一次性的買賣往往發(fā)生在雙方以后不再有買賣機會的時候,盡量謀取高利并且?guī)垓_性是其特點。而靠“熟客”、“回頭客”便是通過薄利行為使得雙方能繼續(xù)合作下去。模型六、有效工資率/重復博弈
當前55頁,總共77頁。
非合作博弈理論把存在于如銀行業(yè)經(jīng)營、國際融資選擇、商業(yè)周期出現(xiàn)、社會習俗形成和中介機構(gòu)出現(xiàn)及制度設計等各經(jīng)濟領域的協(xié)調(diào)問題模型化為協(xié)調(diào)博弈,存在多個嚴格納什均衡是這類博弈根本特點,協(xié)調(diào)博弈成為了繼囚徒困境博弈之后又一被廣泛研究的博弈類型。多重均衡是對傳統(tǒng)經(jīng)濟理論的一個挑戰(zhàn),也是非合作博弈理論致命之所在,為尋找解決協(xié)調(diào)問題的方法,學者們從理論上對協(xié)調(diào)博弈進行了廣泛而深入的探討。協(xié)調(diào)博弈理論研究有助于解決非合作博弈的多重均衡問題,在近十幾年成了為學術(shù)界關注的焦點。模型七、價格競爭博弈/協(xié)調(diào)博弈當前56頁,總共77頁。
對稱協(xié)調(diào)博弈是指無角色區(qū)分的參與之間進行的協(xié)調(diào)博弈,它表現(xiàn)在支付函數(shù)的對稱上,策略集是一樣的。從形式上看:對稱協(xié)調(diào)博弈就是博弈支付矩陣主對角線上的元素都是納什均衡的博弈。協(xié)調(diào)博弈的均衡選擇并不涉及到激勵問題而依賴于參與人之間對博弈如何進行有充分相似的信念。正是由于信念形成是一個相對復雜的過程,所以對協(xié)調(diào)博弈均衡問題的研究也就顯得非常復雜,不同的信念形成過程動態(tài)就會產(chǎn)生不同的均衡。模型七、價格競爭博弈/協(xié)調(diào)博弈當前57頁,總共77頁。
對稱協(xié)調(diào)博弈是一類特殊的博弈,均衡選擇不僅要滿足預期的一致性,而且要滿足行動的一致性,因此,博弈結(jié)果必定收斂到純策略而非混合策略納什均衡。更為重要的是,協(xié)調(diào)博弈還有策略互補性及支付外溢性這兩個重要特征,它是分析協(xié)調(diào)博弈多重均衡問題的出發(fā)點。對稱協(xié)調(diào)博弈分成三類:支付占優(yōu)與風險占優(yōu)不一致;支付占優(yōu)與風險占優(yōu)一致(嚴格納什均衡可進行帕累托排序均衡);無占優(yōu)性可比的協(xié)調(diào)博弈。模型七、價格競爭博弈/協(xié)調(diào)博弈當前58頁,總共77頁。支付占優(yōu)與風險占優(yōu)不一致的協(xié)調(diào)博弈這類博弈最典型的例子就是獵鹿博弈。有兩個打獵人,他們可以合作去獵鹿也可以單獨去獵兔,如果合作獵鹿,那么兩個都可以分得4個單位的支付;如果一個人去獵鹿而另一個人去獵兔,那么前者支付為0(因為獵鹿需要兩個人合作可以成功)后者的支付為2;如果兩個人不合作都去獵兔,那么他們都可以得到3單位的支付。模型七、價格競爭博弈/協(xié)調(diào)博弈獵鹿獵兔獵鹿4,40,2獵兔2,03,3當前59頁,總共77頁。
顯然該博弈有兩個純策略嚴格納什均衡,即要么兩個合作獵鹿,要么兩人去獵兔與一個混合策略納什均衡。按HarsayiandSelten(1988)的定義,純策略獵鹿是支付占優(yōu)納什均衡、純策略獵兔是風險占優(yōu)納什均衡。獵兔策略是一個保險策略,而獵鹿博弈則是一個帕累托效率策略,但行動的不確定性使獵鹿策略具有較大的風險。因此,均衡選擇取決于參與人對風險的態(tài)度。模型七、價格競爭博弈/協(xié)調(diào)博弈當前60頁,總共77頁。
由于存在兩個純策略納什均衡,現(xiàn)實中究竟哪個均衡會出現(xiàn)就是一個問題,這是多重納什均衡下的困境。通過比較“獵鹿博弈”,明顯的事實是:兩人一起去獵鹿的好處比各自打兔的好處要大得多。用一個經(jīng)濟學術(shù)語來說,兩人起去人頭獵鹿比各自去打兔更符合帕累托最優(yōu)原則。模型七、價格競爭博弈/協(xié)調(diào)博弈當前61頁,總共77頁。這一案例中有一個隱含的假設:兩個獵人的能力和貢獻差不多,所以雙方均分獵物。但是實際情況顯然不會這么簡單。如果一個獵人的能力強、貢獻大,他就會要求得到較大的一份,這樣分配的結(jié)果就可能是(14,6)或(15,5)。但有一點是肯定的,能力較差的獵人的所得,至少要多于他獨自打獵的所獲,否則他就沒有合作的動機。假設獵人甲在獵鹿過程中幾乎承擔了全部的工作,他據(jù)此要求最后的分配結(jié)果是(17,3)。這時模型七、價格競爭博弈/協(xié)調(diào)博弈當前62頁,總共77頁。相對于分別獵兔的收益(4,4),合作獵鹿就不具有帕累托優(yōu)勢。雖然這樣17比4多,改善了很多,17+3也比4+4大得多,獵人總體收益也改善了很多,但是由于3比4小,獵人乙的境遇不僅沒有改善,反而惡化。也就是說他的收益受到了損害。所以站在乙的立場,(17,3)沒有(4,4)好。如果合作結(jié)果是這樣,那么,乙一定不愿合作。所以,為了實現(xiàn)帕累托最優(yōu),就必須充分照顧到合作者的利益,使他的收益大于不合作時,他才會愿意選擇合作,從而實現(xiàn)雙贏的最佳結(jié)局。模型七、價格競爭博弈/協(xié)調(diào)博弈當前63頁,總共77頁。協(xié)調(diào)、合作與互動
在許多研究中,人們通常把協(xié)調(diào)與合作看作同一個事物,容易引起混淆,但博弈論卻能夠很好地進行區(qū)分,下面以囚徒困境與獵鹿博弈來給予說明,支付矩陣如下表4表5:模型七、價格競爭博弈/協(xié)調(diào)博弈1,13,0欺騙0,32,2合作欺騙合作表4:囚徒困境博弈3,32,0獵兔0,24,4獵鹿獵兔獵鹿表5:獵鹿博弈當前64頁,總共77頁。
協(xié)調(diào)博弈解決的是源于參與人之間策略不確定性以及由此引起的行為預期問題。
獵鹿博弈中,如果一個參與人選擇獵兔,另一個參與人選擇獵鹿,那么前者得到支付2,后者得到支付0,獵兔策略不是占優(yōu)策略。由于不能夠確定其他參與人是否會選擇獵鹿策略,盡管每個參與人都意識到這樣可以帶來更多的支付,但他們不會選擇有較高風險的獵鹿策略,因而系統(tǒng)難以達到帕累托效率均衡,因此,解決協(xié)調(diào)問題就要參與人相信其他人會選擇帕累托效率策略,在這里需要強化參與人之間的相互信任。模型七、價格競爭博弈/協(xié)調(diào)博弈當前65頁,總共77頁。
囚徒困境博弈研究的是處于競爭關系兩參與人之間的合作問題,如果一個參與人選擇欺騙,另一個參與人選擇合作,那么前者得到支付3,后者得到支付0,欺騙策略是占優(yōu)的。求解囚徒困境博弈的困難在于個人激勵與群體目標并不一致,因而,要求參與人把個人目標放到第二位,而把集體目標放在第一位。模型七、價格競爭博弈/協(xié)調(diào)博弈當前66頁,總共77頁。協(xié)調(diào)博弈與囚徒困境博弈存在著兩種不同形式的互動:協(xié)調(diào)互動合作互動協(xié)調(diào)互動是指一個參與人獲得的支付依賴于其他參與人是否選擇了相同行動,如左行右行博弈,如果兩個相對而行的參與人選擇不同的方向行進,那么他們會相碰,而選擇相同方向則可以順利通過。模型七、價格競爭博弈/協(xié)調(diào)博弈合作互動是指既存在協(xié)調(diào)又存在沖突的博弈,協(xié)調(diào)是因為兩個參與同時改變行動可以變得更好,沖突是因為盡管其他參與人承諾行動,也不一定有利于該參與人支付的增加,前者可能引起無效率,后者則意意味著無效率狀態(tài)會成為均衡,當前67頁,總共77頁。獵鹿類型協(xié)調(diào)博弈,由策略不確定性所引起的均衡結(jié)果依賴于參與人之間的行為預期、博弈支付與策略風險;當時也是最小努力類型協(xié)調(diào)博弈支付占優(yōu)與風險占優(yōu)是統(tǒng)一的,均衡結(jié)果依賴于行為預期與博弈支付?,F(xiàn)在進一步分析支付值x的變化對合作與協(xié)調(diào)的影響。囚徒困境博弈中,隨著支付值x的增加,不合作的激勵就會越大,追求個人理性的參與人使系統(tǒng)更易于偏離集體目標。獵鹿類型博弈中,參與人對系統(tǒng)達到支付占優(yōu)均衡的期望值會隨著支付值x的增加而減少,選擇合作的風險就會越來越大;最小努力類型博弈中,盡管結(jié)果(欺騙,欺騙)是一個均衡,但x的下降使欺騙策略會面臨更大的風險。合作欺騙合作2,20,x欺騙x,01,1當時就是囚徒困境博弈,個人理性并不追求集體最大化目標,唯一的均衡是(欺騙,欺騙);當時就是當前68頁,總共77頁。夏普里(Shapley)值與夏普里一蘇比克權(quán)力指數(shù)夏普里一蘇比克權(quán)力指數(shù)是最早提出的一種權(quán)力指數(shù),它是夏普里和蘇比克在1954年的一篇文章“評價委員會中權(quán)力分布的一個方法”中提出的,而該權(quán)力指數(shù)是基于“夏普里值”之上的。如果說納什均衡是非合作博弈中的核心概念的話,那么我們可以說,夏普里值(ShapleyValue)是合作博弈(或聯(lián)盟博弈)中的最重要的概念。模型八、財產(chǎn)分配問題和Shapley值/合作博弈
當前69頁,總共77頁。考慮這樣一個聯(lián)盟博弈。有一個三人財產(chǎn)分配問題:假定財產(chǎn)為100萬元,假定這100萬元在三個人之間進行分配。a擁有50%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度退休藝術(shù)顧問聘用協(xié)議-文化藝術(shù)項目策劃與執(zhí)行
- 二零二五年度酒店租賃保證金及租金調(diào)整協(xié)議
- 二零二五年度銀行卡電子簽名使用管理協(xié)議
- 二零二五年度集體合同簽訂程序與爭議解決協(xié)議
- 二零二五年度高端商務艙旅行套餐預訂收藏協(xié)議3篇
- 二零二四年度幼兒園教育機構(gòu)兼并收購協(xié)議合同范本3篇
- 二零二四年度孕婦離婚協(xié)議書中孕產(chǎn)期權(quán)益保護條款3篇
- 二零二四年度醫(yī)療健康產(chǎn)業(yè)三方貸款及服務質(zhì)量協(xié)議3篇
- 2025年度服裝促銷員新品上市合作協(xié)議4篇
- 二零二四年砂石場員工勞動保護與職業(yè)培訓協(xié)議2篇
- 《社區(qū)康復》課件-第五章 脊髓損傷患者的社區(qū)康復實踐
- 繪本《圖書館獅子》原文
- 安全使用公共WiFi網(wǎng)絡的方法
- 2023年管理學原理考試題庫附答案
- 【可行性報告】2023年電動自行車相關項目可行性研究報告
- 歐洲食品與飲料行業(yè)數(shù)據(jù)與趨勢
- 放療科室規(guī)章制度(二篇)
- 中高職貫通培養(yǎng)三二分段(中職階段)新能源汽車檢測與維修專業(yè)課程體系
- 浙江省安全員C證考試題庫及答案(推薦)
- 目視講義.的知識
- 房地產(chǎn)公司流動資產(chǎn)管理制度
評論
0/150
提交評論