博弈論和信息經(jīng)濟學_第1頁
博弈論和信息經(jīng)濟學_第2頁
博弈論和信息經(jīng)濟學_第3頁
博弈論和信息經(jīng)濟學_第4頁
博弈論和信息經(jīng)濟學_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、主 講 :蔣 文 華博弈論與信息經(jīng)濟學“賣錢” 現(xiàn)將100元錢賣給大家,各位互相競價,以5元為加價單位,直到?jīng)]有人再加價為止。出價最高者將以其所出價格獲得該100元錢,同時,出價第二高者將其所出價格的數(shù)量支付給我。博弈論和信息經(jīng)濟學 上 篇 博弈論 博弈論概述 完全信息靜態(tài)博弈 完全信息動態(tài)博弈 不完全信息靜態(tài)博弈 不完全信息動態(tài)博弈 下 篇 信息經(jīng)濟學信息經(jīng)濟學基本分類 逆向選擇信號傳遞和信息甄別委托代理問題激勵機制兩人同行打獵,忽遇一猛獅。一人卸下身上物品狂奔,同伴不解,問道:“汝能勝獅?”答曰:“非需勝獅,只需勝汝!” -佚名博弈論概述:引言182.5公斤!一個山東姑娘唐功紅只在過去的一

2、次訓練比賽中舉起的重量。場內(nèi)幾乎所有的人都以為唐功紅這次已經(jīng)輸定了,此前不到一分鐘前,剛剛把172.5公斤的重量舉過頭頂?shù)捻n國姑娘張美蘭已經(jīng)激動地跪倒在了舉重臺上,她以為勝利已經(jīng)肯定屬于自己。但驚天逆轉(zhuǎn)總是會在最后時刻誕生?!斑x美大賽”開始了思考題:匿名投票與署名投票(國會議院加薪)企業(yè)的生產(chǎn)決策博弈論概述:基本術語1、參與人(players):理性選擇的主體。i =1,2,n Nature: 自然,虛擬參與人(運氣,遇見什么樣的獅子)2、行動(action):選擇變量。 ai代表參與人i的某一行動選擇,Ai代表參與人i的選擇空間。行動的順序(the order of action)3、信息(

3、information):參與人有關博弈的知識。4、戰(zhàn)略(strategies):參與人的行動規(guī)則(計劃)si代表參與人i的某一戰(zhàn)略,Si代表參與人i的戰(zhàn)略空間5、損益(payoff):參與人的得與失,乃參與人所關心的。參與人i的損益函數(shù)為u i (s1, ,si, sn)6、結(jié)局(outcome):某種行動、戰(zhàn)略或損益的組合7、均衡(equilibrium):行為主體間相互作用的一種結(jié)局,在該結(jié)局中,參與人無法通過改變選擇增加收益(效用)。又稱“僵局”。此乃局外人所關心的。8、博弈(game):參與人的集合+戰(zhàn)略空間的集合+損益函數(shù)的集合。 博弈G=S1 ,,Sn ;u1, ,un 9、作為

4、動詞的博弈是指參與人i在給定的博弈中選擇戰(zhàn)略及行動10、博弈論(game theory):研究在給定的博弈中,各參與人會作出什么樣 的理性選擇。當局者迷、旁觀者清。學習博弈論的收益:當局者清、旁觀者更清博弈論概述:基本術語博弈論概述:基本術語11、博弈的規(guī)則(rules of the game):參與人行動結(jié)局課堂討論題:舉例說明某個博弈(游戲)的規(guī)則規(guī)則是一種人為的限制,對資格(行為主體)的限制,對行動空間(選擇空間)的限制,并建立行動與結(jié)局(損益)之間的聯(lián)系。博弈論概述:基本術語11、博弈的規(guī)則(rules of the game):何謂好的游戲規(guī)則?課后作業(yè)題:請設計某種游戲規(guī)則,確保您

5、一定能拿世界冠軍!博弈論概述:分類討論:對不同類型進行舉例說明!行動順序信息博弈論概述:教材與參考書張維迎:博弈論與信息經(jīng)濟學上海三聯(lián)書店,上海人民出版社,1996年。羅伯特吉本斯;博弈論基礎,中國社會科學出版社,1999年。讓梯若爾、朱弗登博格:博弈論,中國人民大學出版社,2002年。阿維納什K迪克西特、巴里J奈爾伯夫:策略思維,中國人民大學出版社,2002年。 艾里克拉斯繆森:博弈與信息,北京大學出版社,2003年10月第1版。 博弈論概述:分析方法1、最大化分析 求極值(人是理性的)給定約束條件(游戲規(guī)則)和目標(payoff),求最大值。博弈論專家的主要工作是研究約束條件。正確的決策來

6、源于對約束條件的正確判斷課堂練習博弈論概述:分析方法2、均衡分析極值的組合分析均衡是指行為主體間相互作用的一種結(jié)局,在該結(jié)局下,無人能通過改變自身的行為謀取更多利益。鷹鴿博弈( hawk-dove game斗雞博弈)討價還價(alternating offers、offer-counteroffer)及其均衡最后通牒(take it or leave it)監(jiān)督博弈及其均衡 1838年庫諾特(Cournot)寡頭競爭模型 1883年伯川德(Bertrand)寡頭競爭模型 1944年馮諾依曼和摩根斯坦發(fā)表博弈論和經(jīng)濟行為 1950年納什(Nash)提出了納什均衡的概念?!癊quilibrium

7、points in n-person games”, “Non-cooperative games”, “The bargaining problem”. 1965年澤爾騰(Selten)提出了子博弈精煉納什均衡的概念 19671968年海薩尼(Harsanyi)提出了貝葉斯納什均衡的概念博弈論概述:發(fā)展歷程 19751991年澤爾騰(1975)、Kreps和Wilson(1982)、Fudenberg和Tirole(1991)提出了精煉貝葉斯納什均衡的概念 1994年納什、海薩尼和澤爾騰獲諾貝爾經(jīng)濟學獎。 1996年維克里,米爾利斯獲諾貝爾經(jīng)濟學獎。 2001年阿克爾洛夫、斯彭斯、斯蒂格利茨

8、獲諾貝爾經(jīng)濟學獎。博弈論概述:發(fā)展歷程完全信息靜態(tài)博弈1、占優(yōu)戰(zhàn)略均衡(1)定義有n個參與人的戰(zhàn)略式表述為博弈G=S1 ,,Sn ;u1, ,un ,戰(zhàn)略組合s*=(s*1,s*i , ,s*n)是一個占優(yōu)戰(zhàn)略均衡,如果對于每一個i , s*i是給定其他參與人任何選擇si=(s1,si-1 , si+1 ,,sn)的情況下第i個參與人的最優(yōu)戰(zhàn)略,即:ui(s*i , si )ui(si , si ), s-i ,sis*占優(yōu)戰(zhàn)略均衡完全信息靜態(tài)博弈(2)舉例:囚犯困境(Prisoners dilemma) 經(jīng)典的囚犯困境占優(yōu)戰(zhàn)略均衡米蘭達規(guī)則完全信息靜態(tài)博弈 類似的囚犯困境 排隊 闖紅燈 價格

9、戰(zhàn)占優(yōu)戰(zhàn)略均衡商場B 降價不降價 商場A 降價-3 , -3 5, -5 不降價 -5 , 5 3 , 3 課堂討論題:舉例說明現(xiàn)實中的“囚犯困境”完全信息靜態(tài)博弈高尚是高尚者的墓志銘卑鄙是卑鄙者的通行證環(huán)境污染戰(zhàn)爭與軍備競賽給貓拴鈴鐺(出頭鳥)“我也是這么做的”只要人人都獻出一點愛獎學金的分配高尚與卑鄙占優(yōu)戰(zhàn)略均衡完全信息靜態(tài)博弈2、重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略(1)劣戰(zhàn)略和嚴格劣戰(zhàn)略令si 和si是參與人i可選擇的兩個戰(zhàn)略,如果對于其他參與人任何選擇si=(s1,si-1 , si+1 ,,sn),參與人i從si 得到的支付嚴格小于從sI得到的支付,即:ui(s*i , si )

10、ui(si , si ), s-i 我們說戰(zhàn)略si 嚴格劣于戰(zhàn)略si重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略完全信息靜態(tài)博弈(2)重復剔除的占優(yōu)均衡戰(zhàn)略組合s*=(s*1,s*i , ,s*n)稱為重復剔除的占優(yōu)均衡,如果它是重復剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合。重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略完全信息靜態(tài)博弈(3)舉例 智豬博弈:多勞不多得重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略什么條件下,大豬也不愿意去按?完全信息靜態(tài)博弈 智豬博弈:多勞少得 塞翁失馬、安知非福重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略完全信息靜態(tài)博弈 適得其反置之死地而后生(破釜沉舟)重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略完全信息靜

11、態(tài)博弈3、納什均衡(1)定義有n個參與人的戰(zhàn)略式表述為博弈G=S1 ,,Sn ;u1, ,un ,戰(zhàn)略組合s*=(s*1,s*i , ,s*n)是一個納什均衡,如果對于每一個i , s*i是給定其他參與人選擇s*i=(s*1,s*i-1 , s*i+1 ,,s*n)的情況下第i個參與人的最優(yōu)戰(zhàn)略,即:ui(s*i , s*i )ui(si , s*i ), siSi ,i納什均衡完全信息靜態(tài)博弈(2)納什均衡和占優(yōu)戰(zhàn)略均衡及重復剔除的占優(yōu)均衡之間的關系納什均衡(U,L)是占優(yōu)戰(zhàn)略均衡的條件?(U,L)是納什均衡的條件?(U,L)是重復剔除的占優(yōu)均衡的條件?完全信息靜態(tài)博弈(3)應用分析 斗雞博

12、弈 性別戰(zhàn)納什均衡應用分析完全信息靜態(tài)博弈制式(標準)博弈納什均衡應用分析 企業(yè)2企業(yè)1A制式B制式A制式2,10,0B制式0,01,2完全信息靜態(tài)博弈以防萬一納什均衡應用分析參與人B L R U D 8 , 10 -1000 , 97 , 6 6 , 5 參與人A完全信息靜態(tài)博弈 庫諾特寡頭競爭模型(1838年)已知:兩個企業(yè)的成本函數(shù)為C=cq,市場逆需求函數(shù)為 P=a-(q1 +q2)求:企業(yè)的產(chǎn)量和利潤解: p1= Pq1 -C1=(a-(q1 +q2))q1-cq1p2 = Pq2 -C2=(a-(q1 +q2))q2-cq2壟斷市場分析: q1*=q2* =1/4(a-c),p1=

13、 p2=1/8(a-c)2庫諾特寡頭市場分析:q1*=1/2(a-c- q2*),q2*=1/2(a-c- q1*)q1*=q2*=(a-c)/3,p1= p2=1/9(a-c)2納什均衡應用分析完全信息靜態(tài)博弈 伯川德寡頭競爭模型(1883年)如果企業(yè)的競爭戰(zhàn)略是價格而不是產(chǎn)量,伯川德證明,即使只有兩個企業(yè),在均衡情況下,價格等于邊際成本,企業(yè)的利潤為零,與完全競爭市場均衡一樣。這便是所謂的“伯川德悖論”(Bertrand Paradox)。解開這個悖論的辦法之一是引入產(chǎn)品的差異性。如果不同企業(yè)生產(chǎn)的產(chǎn)品是有差異的,替代彈性就不會是無限的,此時消費者對不同企業(yè)的產(chǎn)品有著不同的偏好,價格不是他

14、們感興趣的唯一變量。在存在產(chǎn)品差異的情況下,均衡價格不會等于邊際成本。納什均衡應用分析完全信息靜態(tài)博弈 豪泰林(Hotelling)價格競爭模型(1929年) 產(chǎn)品差異有多種形式。我們現(xiàn)在考慮一種特殊的差異,即空間上的差異(special differentiation),這就是經(jīng)典的豪泰林模型。在豪泰林模型中,產(chǎn)品在物質(zhì)性能上是相同的,但在空間位置上有差異。因為不同位置上的消費者要支付不同的運輸成本,他們關心的是價格與運輸成本之和,而不單是價格。假定有一個長度為1的線性城市,消費者均勻地分布在0,1區(qū)間里,分布密度為1。假定有兩個商店,分別位于城市的兩端,商店1在x0,商店2在x1,出售物質(zhì)

15、性能相同的產(chǎn)品。每個商店提供單位產(chǎn)品的成本為c,消費者購買商品的旅行成本與離商店的距離成比例,單位距離的成本為t。這樣,住在x的消費者如果在商店1采購,要花費tx的旅行成本;如果在商店2采購,要花費t(1x)。納什均衡應用分析完全信息靜態(tài)博弈我們現(xiàn)在考慮兩商店之間價格競爭的納什均衡。假定兩個商店同時選擇自己的銷售價格。令Pi為商店i的價格,Di(pl,p2)為需求函數(shù),i1,2。如果住在x的消費者在兩個商店之間是無差異的,那么,所有住在x左邊的將都在商店1購買,而住在x右邊的將在商店2購買,需求分別為Dlx,D2l一x。這里,x滿足:pl+txp2十t(1一x)解得最優(yōu)解為p1*=p2*=c+

16、t每個企業(yè)的均衡利潤為:p1= p2=t/2納什均衡應用分析沒有差別就沒有利潤完全信息靜態(tài)博弈 對模型的進一步分析 我們將消費者的位置差異解釋為產(chǎn)品差異,這個差異進步可解釋為消費者購買產(chǎn)品的旅行成本。旅行成本越高,產(chǎn)品的差異就越大,均衡價格從而均衡利潤也就越高。原因在于,隨著旅行成本的上升,不同商店出售的產(chǎn)品之間的替代性下降,每個商店對附近的消費者的壟斷力加強,商店之間的競爭越來越弱,消費者對價格的敏感度下降,從而每個商店的最優(yōu)價格更接近于壟斷價格。另一方面,當旅行成本為零時,不同商店的產(chǎn)品之間具有完全的替代性,沒有任何一個商店可以把價格定得高于成本,我們得到伯川德均衡結(jié)果。在以上的分析中,我

17、們假定兩個商店分別位于城市的兩個極端。事實上,均衡結(jié)果對于商店的位置是很敏感的??紤]另一個極端的情況,假定兩個商店位于同一個位置x。,此時,他們出售的是同質(zhì)的產(chǎn)品,消費者關心的只是價格,那么,伯川德均衡是唯一的均衡:P1P2C, 1=2=0納什均衡應用分析課堂討論題:如何避免價格戰(zhàn)?完全信息靜態(tài)博弈人無我有“創(chuàng)新戰(zhàn)略”人有我特“差別化戰(zhàn)略”人特我廉“低成本戰(zhàn)略”人廉我走“多元化戰(zhàn)略”完全信息靜態(tài)博弈完全信息靜態(tài)博弈4、公共物品的私人提供(1)囚犯困境(2)智豬博弈(3)斗雞博弈完全信息靜態(tài)博弈5、混合戰(zhàn)略納什均衡(1)猜謎游戲乙正面反面甲正面1,-1-1,1反面-1,11,-1完全信息靜態(tài)博弈

18、(2)點球射門攻方的策略是:攻左邊,或攻右邊守方的策略是:守左邊,或守右邊(以守方的方向為準)守左邊右邊攻左邊-1,11,-1右邊1,-1-1,1完全信息靜態(tài)博弈(3)石頭、剪子、布完全信息靜態(tài)博弈5、混合戰(zhàn)略納什均衡(4)混合戰(zhàn)略在n個參與人博弈的戰(zhàn)略式表述G=S1 ,,Sn ;u1, ,un 中,假定參與人i 有K個純戰(zhàn)略:SI= si1,,siK,那么,概率分布i=(i1, ,iK)稱為i的一個混合戰(zhàn)略,這里iK=(sik)是i選擇sik的概率,對于所有的k=1, ,K , 0iK1,1KiK=1.(5)混合戰(zhàn)略納什均衡在n個參與人博弈的戰(zhàn)略式表述G=S1 ,,Sn ;u1, ,un 中

19、,混合戰(zhàn)略組合*=(*1, , *n)是一個納什均衡,如果對于所有的i=1, ,n ,下式成立:vi(*i ,*-i)vi(i ,*-i) ,ii在此, vi(i ,-i)= (j( sj)ui (s)完全信息靜態(tài)博弈(6)監(jiān)督博弈稅收機關與納稅人雇主與雇員這里,V是雇員的貢獻,W是雇員的工資,H是雇員的付出,C是檢查的成本。同時,我們假定HWC。在這個假設下,該博弈不存在純戰(zhàn)略納什均衡。求解混合戰(zhàn)略納什均衡得知:雇主檢查的概率*=H/W,雇員偷懶的概率*=C/W。求解雇主支付W為多少時,其期望收益最大。l 如果雇主能夠沒收雇員的抵押金F,前述兩個問題的答案會發(fā)生怎樣變化?如何理解這種變化?l

20、根據(jù)上述分析,雇主是否會收取抵押金,如何收取?雇員是否愿交抵押金?l兩個其它方面完全相同的企業(yè)在相互競爭中,一個收取抵押金,一個不收,說更有競爭優(yōu)勢?l從社會福利最大化角度看,作為政府是否應禁止雇主向雇員收取抵押金?為什么?課堂討論完全信息靜態(tài)博弈6、納什均衡的存在性和多重性(1)存在性定理在n人戰(zhàn)略式博弈中,如果每個參與人的純戰(zhàn)略空間Si 是歐氏空間上一個非空的、閉的、有界的凸集,損益函數(shù)ui (s)是連續(xù)的且對si是擬凹的,那么,至少存在一個純戰(zhàn)略納什均衡。 (Debreu,1952;Glicksberg,1952;Fan,1952) 在n人戰(zhàn)略式博弈中,如果每個參與人的純戰(zhàn)略空間Si 是

21、歐氏空間上一個非空的、閉的、有界的凸集,損益函數(shù)ui (s)是連續(xù)的,那么,至少存在一個混合戰(zhàn)略納什均衡。( Glicksberg,1952 )每一個有限博弈至少存在一個納什均衡(純戰(zhàn)略的或混合戰(zhàn)略的)(納什,1950) 完全信息靜態(tài)博弈6、納什均衡的存在性和多重性(2)多重性 分蛋糕(“最后通牒”) 性別戰(zhàn) “聚點”均衡:文化、歷史(接人)、道德(進門)、法律(右行) “廉價磋商”完全信息動態(tài)博弈1、博弈樹(1)結(jié)(2)枝(3)信息集AABAAAB完全信息動態(tài)博弈2、舉例:房地產(chǎn)開發(fā)()兩個房地產(chǎn)公司A和B一個城市里開發(fā)房產(chǎn),他們可以分別選擇是否開發(fā),首先是A決定是否開發(fā),然后B決定是否開發(fā)

22、,同時,他們可能面臨不同的市場需求狀況(需求大和需求?。2┺倪^程如圖所示。BBNBBAN(4,4)(8,0)(-3,-3)(1,0)(0,0)(0,1)(0,0)(0,8)開發(fā)不開發(fā)需求大需求小開發(fā)不開發(fā)完全信息動態(tài)博弈2、舉例:房地產(chǎn)開發(fā)( )如果B在決策時并不知道自然的選擇,那么其信息集就由原來的四個減少為兩個。博弈過程如圖所示。BBNBBAN(4,4)(8,0)(-3,-3)(1,0)(0,0)(0,1)(0,0)(0,8)開發(fā)不開發(fā)需求大需求小開發(fā)不開發(fā)完全信息動態(tài)博弈2、舉例:房地產(chǎn)開發(fā)( )如果B在決策時知道自然的選擇,但并不知道A的選擇,那么其信息集雖然也是兩個,但卻與前述的不

23、同。博弈過程如圖所示。BBNBBAN(4,4)(8,0)(-3,-3)(1,0)(0,0)(0,1)(0,0)(0,8)開發(fā)不開發(fā)需求大需求小開發(fā)不開發(fā)完全信息動態(tài)博弈2、舉例:房地產(chǎn)開發(fā)():另一種表述在博弈中,自然的信息集總是假定是單結(jié)的。因為自然是隨機行動的,自然在參與人決策之后行動等價于自然在參與人之前行動,但參與人不能觀測到自然的行動。博弈過程也可以如圖所示。BBNBBA(4,4)(8,0)(-3,-3)(1,0)(0,0)(0,1)(0,0)(0,8)開發(fā)不開發(fā)需求大需求小開發(fā)不開發(fā)A完全信息動態(tài)博弈3、舉例:父女之爭(1)承諾(commitment)或威脅(2)承諾或威脅可信嗎?

24、(3)“人質(zhì)”臺灣完全信息動態(tài)博弈4、舉例:斯坦克爾伯格(stackelberg)寡頭競爭模型(1934年)已知 P=a- q1- q2, 企業(yè)的邊際成本MC=AC=c企業(yè)1選擇q1,然后企業(yè)2選擇q2q2=1/2(a-c- q1)q1*=1/2(a-c)q2*=1/4(a-c)p1=1/8(a-c)2 ,p2=1/16(a-c)2在博弈中,擁有信息優(yōu)勢可能會使參與人處于劣勢如果企業(yè)選擇的是價格而不是產(chǎn)量,則為后動優(yōu)勢完全信息動態(tài)博弈5、舉例:市場進入博弈BB(40,50)(-10,0)(0,300)默許斗爭進入不進入A默許斗爭(0,300)A的戰(zhàn)略:進入、不進入B的戰(zhàn)略:(默許、默許)、(斗

25、爭、斗爭) (默許、斗爭)、(斗爭、默許)完全信息動態(tài)博弈5、舉例:市場進入博弈BB(40,50)(-10,0)(0,300)默許斗爭進入不進入A默許斗爭(0,300)A的戰(zhàn)略:進入、不進入B的戰(zhàn)略:(默許、默許)、(斗爭、斗爭) (默許、斗爭)、(斗爭、默許)完全信息動態(tài)博弈5、舉例:市場進入博弈(40,50)(-10,0)(0,300)進入不進入BB默許斗爭A默許斗爭(0,300)納什均衡: (進入、 (默許、默許) (不進入、(斗爭、斗爭) (進入、(默許、斗爭) (不進入、(斗爭、默許)完全信息動態(tài)博弈6、子博弈精煉納什均衡子博弈:原博弈的一部分,它本身可以作為一個獨立的博弈進行分析子

26、博弈精煉納什均衡(“序貫理性”,sequential rationality)房地產(chǎn)開發(fā): (開發(fā)、(不開發(fā)、開發(fā))BB開發(fā)不開發(fā)A開發(fā)不開發(fā)(-3,-3)(0,1)(1,0)(0,0)開發(fā)不開發(fā)擴展式博弈的戰(zhàn)略組合s*=(s*1,s*i , ,s*n)是一個子博弈精煉納什均衡,如果: (1)它是原博弈的納什均衡;(2)它在每一個子博弈上給出納什均衡完全信息動態(tài)博弈6、子博弈精煉納什均衡房地產(chǎn)開發(fā)()子博弈精煉納什均衡:企業(yè)A:開發(fā)企業(yè)B:如果A不開發(fā),則不論需求大小都開發(fā);如果A開發(fā),則需求大時開發(fā),需求小時不開發(fā)。BBNBBAN(4,4)(8,0)(-3,-3)(1,0)(0,0)(0,1

27、)(0,0)(0,8)開發(fā)不開發(fā)需求大需求小開發(fā)不開發(fā)完全信息動態(tài)博弈7、逆向歸納法羅森塞蜈蚣博弈(Rosenthsal,1981)1DA(1,1)2DA(0,3)1DA(98,98)2DA(97,100)1DA(99,99)2DA(98,101)(100,100)重復博弈(repeated games)1、基本特征(1)前一階段的博弈不改變后階段的博弈結(jié)構(gòu)(2)所有參與人都能觀測到博弈過去的歷史(3)參與人的總損益是過去所有階段的損益的貼現(xiàn)值之和重復博弈(repeated games)2、有限次重復博弈(1)連鎖店悖論(chain-store paradox)(2)囚犯困境背叛合作背叛0,0

28、5,-5合作- 5,53,3重復博弈(repeated games)3、無限次重復博弈(以囚犯困境為例)(1)可選擇的戰(zhàn)略 雷鋒戰(zhàn)略 曹操戰(zhàn)略 冷酷戰(zhàn)略(grim strategies),又叫觸發(fā)戰(zhàn)略 心太軟戰(zhàn)略 一報還一報(Tit-for tat) 人鬼戰(zhàn)略 欺軟怕硬(又叫檢驗者戰(zhàn)略,H、TESTER) 鎮(zhèn)定者戰(zhàn)略 精神病患者(醉漢戰(zhàn)略)無限次重復博弈重復博弈(repeated games)(2)何為最優(yōu)戰(zhàn)略?無限次重復博弈123456合計123456合計重復博弈(repeated games)(3)對“一報還一報”的進一步分析 特點它是善良的它是可激怒的它是寬容的它是清晰的(容易被辨識)無

29、限次重復博弈重復博弈(repeated games) 若干建議不要嫉妒不要首先背叛對合作和背叛都要給于回報(as soon as possible)不要耍小聰明無限次重復博弈重復博弈(repeated games) 若干啟示無限次重復博弈為避免“怨怨相報何時了”,一個更好的策略可能是一報還9/10報相愛總是簡單,相處卻是太難合作的基礎不是真正的信任,而是關系的持續(xù)性重復博弈(repeated games)(4)對冷酷戰(zhàn)略的進一步分析 突然選擇不合作的總收益R=5 持續(xù)合作的收益R=3+3+32+-3n = 3/(1-) 在什么條件下雙方會永遠合作?無限次重復博弈重復博弈(repeated ga

30、mes) (5)雙寡頭分析無限次重復博弈在寡頭市場,串謀的產(chǎn)量各是1/4(a-c),利潤各為1/8(a-c)2,一旦一方選擇不合作(產(chǎn)量為3/8 (a-c),則在該期的收益上升為9/64 (a-c)2,并導致今后雙方的不合作(產(chǎn)量為1/3 (a-c),收益永遠下降為1/9 (a-c)2。重復博弈(repeated games) (5)雙寡頭分析無限次重復博弈在雙寡頭市場,貼現(xiàn)率9/17,雙方才會保持持久的合作。如果有N個寡頭企業(yè),則合作均衡的貼現(xiàn)率要求是1/(1+4n/(n+1)2)重復博弈(repeated games) (6)無名氏定理(folk theorem)無限次重復博弈 如果博弈重

31、復無限次,或者每次結(jié)束的概率足夠小,如果充分接近1,任何個人理性可行支付向量都可以作為子博弈精煉納什均衡結(jié)果出現(xiàn)4、信用(trust)為什么要講信用?信用不講信用講信用不講信用0,05,-5講信用-5,53,3一次博弈時的策略選擇重復博弈中的策略選擇 據(jù)江蘇經(jīng)濟報2002年3月26日報道,中國企業(yè)聯(lián)合會理事長張彥寧透露,中國每年因為逃廢債務造成的直接損失約為1800億,由于合同欺詐造成的直接損失約為55億,產(chǎn)品質(zhì)量低劣和制假售假造成的直接損失至少為2000億,由于“三角債”和現(xiàn)款交易增加的財務費用約為2000億。重復博弈(repeated games)如何讓人們講信用?信用不講信用講信用不講信

32、用0,05,-5講信用- 5,53,3 突然選擇不講信用的總收益R=5 一直講信用的收益R=3+3+3 2+-3n = 3/(1-) 在什么條件下會選擇不講信用?冷酷戰(zhàn)略重復博弈(repeated games)如何讓人們講信用?信用不講信用講信用不講信用0,0-5,5講信用5,-53,3第三方強制(法律)信譽機制重復博弈(repeated games)如何讓人們講信用?傳統(tǒng)社會的信譽機制轉(zhuǎn)型時期的信用缺失現(xiàn)代社會的信譽機制信用信譽就是人們?yōu)榱双@得長遠利益而犧牲眼前利益重復博弈(repeated games)如何讓人們講信用?第一個是產(chǎn)權(quán)制度?!盁o恒產(chǎn)者無恒心,無恒心者無信用”要規(guī)范市場一定要規(guī)

33、范政府行為,盡量減少政府部門的交易行為要求一個很好的信息傳輸體制。強調(diào)法律的作用提高個人的組織化程度信用信譽就是人們?yōu)榱双@得長遠利益而犧牲眼前利益那些騙人的人是被誰打垮的?是被那些講信譽的人打垮的,而不是被政府打垮的。重復博弈(repeated games)美國財富雜志12日公布了全球500家最大公司最新排名,美國零售商沃爾瑪公司連續(xù)第3年名列榜首。年,財富雜志開始給巨型企業(yè)排座次時,沃爾瑪還根本不存在。年,沃爾瑪全年銷售額才首次達到億美元,可到年,一周的銷售額就達到這個數(shù),年更是一天就予以完成。沃爾瑪財政年度(截至年月日)的銷售額為億美元。到年月,沃爾瑪在美國的店鋪數(shù)是家,在美國以外的店鋪數(shù)

34、是家 。年感恩節(jié)期間,沃爾瑪日銷售額為億美元,超過個國家的之和;是美國個州的最大雇主,雇員數(shù)目超過了美國軍隊的人數(shù);如果用沃爾瑪每年因失竊而損失的大約億美元成立一家公司,那么這家公司可以在財富全球強中名列第位。 沃爾瑪不完全信息靜態(tài)博弈1、市場進入博弈1、進入者是否進入取決于對在位者類型的判斷。2、若高成本的概率大于1/5,進入者選擇進入,在位者如果是高成本則選擇默許,反之選擇斗爭。3、若高成本的概率小于1/5,進入者選擇不進入,在位者選擇斗爭。不完全信息靜態(tài)博弈2、求愛博弈1、被求者是否接受取決于對求愛者類型的判斷。2、若求愛者是優(yōu)的概率大于1/2,被求者選擇接受,求愛者選擇求。3、若求愛者

35、是優(yōu)的概率小于1/2,被求者選擇不接受,求愛者選擇不求。不完全信息動態(tài)博弈張同學、李同學都具有足夠的推理能力。某天,他們正在接受推理面試。他們知道桌子的抽屜里有如下16張撲克牌:紅桃 A、Q、4黑桃 J、8、4、2、7、3草花 K、Q、5、4、6 方塊 A、5蔣教授從這16張牌中挑出一張牌來,并把這張牌的點數(shù)告訴張同學,把這張牌的花色告訴李同學。這時,蔣教授問兩位同學:你們能從已知的點數(shù)或花色中推知這張牌是什么牌嗎?張同學:“我不知道這張牌?!崩钔瑢W:“我就知道你不知道這張牌?!睆埻瑢W:“現(xiàn)在我知道這張牌了?!崩钔瑢W:“我也知道了?!闭垎?這張牌是什么牌? 不完全信息動態(tài)博弈1、基本思路(1)

36、自然選擇參與人的類型。(2)后行動者能夠觀測到先行動者的行動,但不能觀測其類型。(3)由于行動是類型依賴的,行動傳遞著類型的某種信息,所以后行動者可以通過行動觀測來推斷其類型或修正對其類型的先驗信念(概率分布),然后選擇自己的最優(yōu)行動。(4)先行動者預測到這一點,就會設法選擇對自己有利的信息,避免傳遞對自己不利的信息。博弈不僅是參與人選擇行動的過程,而且是不斷修正信念的過程。不完全信息動態(tài)博弈2、貝葉斯法則(1)類型:好人(GP)、壞人(BP)(2)行動:好事(GT)、壞事(BT)(3)一個人做好事的概率Prob(GT)=P(GT/GP)P(GP)+P(GT/BP)P(BP)(4)一個人做了好

37、事是好人的概率Prob(GP/GT)=P(GT/GP)P(GP)/ Prob(GT)不完全信息動態(tài)博弈3、舉例:市場進入博弈不完全信息動態(tài)博弈(1)進入者是否進入取決于對在位者類型的判斷(2)進入者將依據(jù)在位者的價格選擇而修正對在位者類型的判斷(3)在位者需要考慮價格選擇的信息效應,所以,在位者選擇什么價格不僅與自身的成本函數(shù)有關,而且與進入者的先驗概率及條件概率有關。(4)若高成本的先驗概率小于1/5,則出現(xiàn)混同均衡:在位者不論成本高低,都選擇中等價格,進入者只有在觀測到高價格時才選擇進入(5)若高成本的先驗概率大于1/5,則出現(xiàn)分離均衡:在位者在低成本時,選擇低價格,在高成本時,選擇高價格

38、,進入者觀測到低價格時選擇不進入,觀測到中價格或高價格時才選擇進入。(低成本在位者通過低價格顯示自己是低成本,此乃“認證費”)不完全信息動態(tài)博弈4、信號傳遞博弈壟斷限價銀行的樓科舉制度文憑廣告孔雀開屏信息經(jīng)濟學的基本分類 不對稱信息的 內(nèi)容不對稱發(fā)生的時間隱藏行動(hidden action)隱藏信息(hidden information)事前(ex ante)1、逆向選擇模型2、信號傳遞模型3、信息甄別模型事后(ex post)4、隱藏行動的道德風險模型5、隱藏信息的道德風險模型逆向選擇信息經(jīng)濟學 1、舊車市場 (Akerlof,1970)2、保險市場(Rothschild and Stig

39、litz,1976)3、“劣幣驅(qū)逐良幣”(格雷欣法則)4、假貨市場如果小流氓都留光頭,一個正派的人就不會留光頭,即使他本來也喜歡留光頭,小流氓把正派人驅(qū)逐出光頭市場。阿克爾洛夫現(xiàn)年61歲,供職于加州大學伯克利分校。斯彭斯現(xiàn)年58歲,供職于斯坦福大學。斯蒂格利茨現(xiàn)年58歲,曾任美國前總統(tǒng)克林頓的經(jīng)濟顧問委員會主席,世界銀行副行長兼首席經(jīng)濟學家,現(xiàn)供職于哥倫比亞大學。逆向選擇Stiglitz and Weiss(1981)證明:即使沒有政府干預,由于借款人方面存在的逆向選擇和道德風險行為,信貸配給可以作為一種長期均衡現(xiàn)象存在。5、逆向選擇與信貸市場的配給制信貸市場的配給制: (1)在所有貸款申請人

40、中,只有一部分人得到貸款,被拒絕的申請人即使愿意付更高的利息也不行;(2)一個給定申請人的貸款要求只能被部分滿足。信號傳遞:勞動力市場 在勞動力市場上存在著有關雇員能力的信息不對稱,雇員知道自己的能力,雇主不知道,但雇員的受教育程度向雇主傳遞有關雇員能力的信息。因為:接受教育的成本與能力成反比,不同能力的人的最優(yōu)教育程度是不同的。信號傳遞:勞動力市場 只有在分離均衡中,教育水平才會成為傳遞雇員能力的信號。關鍵在于:只有高能力的人才愿意(能夠)接受更高的教育。反之,如果接受教育的成本與能力無關(如很容易通過考試、論文答辯),低能力的人就會模仿高能力的人,選擇同樣的受教育水平。與此同時,人們被迫接

41、受過多的教育,以顯示自身的能力。(“鯉魚跳龍門”)信息甄別:勞動力市場 雇主首先行動,在雇員接受教育之前就提出一個合同菜單(w,s),雇員選擇其中一個與雇主簽約,如然后根據(jù)合同約定接受教育s,在完成教育后得到合同規(guī)定的工資w。信息甄別:鐵路客運 早在1849年,Dupuit就指出,鐵路客運三等車廂的環(huán)境如此惡劣(甚至沒有頂棚),并不是因為改善環(huán)境要化多大的錢,而是因為鐵路公司想阻止買得起二等票的旅客坐三等車廂?!八垢F人受苦,并不是因為它想傷害窮人,而是因為它想嚇唬富人”。(頭等艙和經(jīng)濟艙)皇帝為什么要殺功臣? 對任何一個皇帝來說,確保江山萬代是至關重要的。因此,功臣們造不造反就順理成章地成為

42、皇帝們絞盡腦汁來解決的問題。解決功臣們造不造反的問題的關鍵在于識別到底誰會造反,但這是一個信息不對稱的格局:大臣們自己知道自己造不造反,皇帝卻不知道誰是奸臣,誰是忠臣。宋太宗有一段名言,大意是國家要么有外患,要么有內(nèi)憂。外患是有形的,而內(nèi)憂則無法察覺(原文是奸邪無狀)。一個奸邪無狀的自白道出了皇帝們的無奈:他必須有什么方法可以鑒別出誰是奸臣,誰是忠臣。 信息甄別:“飛鳥盡,良弓藏”,皇帝為什么要殺功臣? 毛澤東在廬山會議時曾對秘書林克說朱德是個右派,但他組織不起人馬。真是一語道破千古玄機!或許我們可以明白為何朱德能安然過文革,彭德懷卻受盡折磨而死。 1949年以后,尤其是文革開始以后,十大元帥

43、中,除羅榮桓早逝,林彪之外,八位元帥受到不同程度的沖擊和迫害。 十位大將,除去世的外,全部遭到?jīng)_擊和迫害。 57位上將,87%受到?jīng)_擊和迫害。177位中將,78%受到?jīng)_擊和迫害。(轉(zhuǎn)引自華樂軍事論壇)信息甄別:“飛鳥盡,良弓藏”,激勵機制:團隊工作“團隊”(Team)是指一組代理人,他們獨立地選擇努力水平,但創(chuàng)造一個共同的產(chǎn)出,每個代理人對產(chǎn)出的邊際貢獻依賴于其他代理人的努力,不可獨立觀測。Alchian和Demsetz(1972)指出:團隊工作將導致個人的偷懶行為;為解決偷懶委托,應該引入一個監(jiān)督者(monitor,或稱為委托人);為了使監(jiān)督者有積極性努力監(jiān)督,監(jiān)督者應該成為剩余索取者(re

44、sidual claimant)。激勵機制:最優(yōu)的委托權(quán)安排激勵機制的一個更基本的問題是:在一個組織中,誰應該是委托人?誰應該是代理人?即委托權(quán)應該如何在組織的不同成員之間進行分配?在信息對稱的條件下,委托權(quán)的安排完全由參與人的風險態(tài)度決定:如果一方風險規(guī)避、一方風險中性,委托權(quán)應歸風險中性方;如果雙方都是風險規(guī)避的,委托權(quán)應共享(合伙制);如果雙方都是風險中性的,委托權(quán)的分配是無所謂的。激勵機制:最優(yōu)的委托權(quán)安排張維迎(1994、1995)證明:企業(yè)成員在團隊生產(chǎn)中的相對重要性和監(jiān)督上的相對有效性是決定最優(yōu)委托權(quán)安排的重要決定因素(分配給重要的和難以監(jiān)督的成員)。如果企業(yè)成員同等重要,又同樣

45、難以被監(jiān)督,合伙制是最優(yōu)的。如果企業(yè)成員同等重要,但都非常容易被監(jiān)督,此時,重要的是讓一方擁有委托權(quán),而誰擁有本身并不重要( Alchian-Demsetz企業(yè) )。激勵機制:最優(yōu)的委托權(quán)安排在不確定的市場環(huán)境中,決定企業(yè)生存和發(fā)展的關鍵因素是經(jīng)營者的決策。同時,經(jīng)營者的行為又是最難監(jiān)督(相對工人而言)。因此,讓經(jīng)營者擁有委托權(quán)(剩余索取權(quán)和控制權(quán))是最優(yōu)的。工人拿固定工資,他們會偷懶,但偷懶的損失可以由經(jīng)營者的監(jiān)督的積極性彌補。反之,讓工人擁有委托權(quán),由于他們無法有效監(jiān)督經(jīng)營者,結(jié)果是,不但經(jīng)營者沒有積極性,工人也沒有積極性(給定經(jīng)營者工作不努力,工人的努力工作并沒有多大用處)。祝同學們在最

46、后的考試中取得優(yōu)異成績!感謝同學們在本課程THANK YOU謝 謝討價還價(alternating offers、offer-counteroffer)參與人1獲得的份額X*=(1-2)/(1-12)。其中,1、2分別為參與人1和2的貼現(xiàn)因子。 課堂討論題:一個人的貼現(xiàn)因子由什么因素決定?(貪和貧) 討價還價(alternating offers、offer-counteroffer) 討價還價(alternating offers、offer-counteroffer)全世界五分之一的人生活在高收入國家,占全世界國內(nèi)生產(chǎn)總值的86。還有五分之一人口生活在最貧窮的國家,這部分人口制占有全世界G

47、DP的1多一點。在世界最富和最窮的五分之一人口之間,人均國民收入的差距由1960年的30:1擴大到1997年的74:1。人類發(fā)展報告(1997)制度結(jié)構(gòu)的選擇對經(jīng)濟效率和經(jīng)濟增長有直接影響。民主、法治、私有制、資源市場配置的社會,與那些獨裁、公有制、計劃經(jīng)濟的社會相比,其增長率是后者的三倍(19601980年,115個國家的統(tǒng)計資料,2.73%比0.91%),其效率是后者的2.5倍?!爱嬶灣漯嚒?諸位來到這里,有兩個問題需要好好回答:一個是你到這里來干什么?另一個是將來你將到哪里去?竺可楨浙江大學校訓立 志 詩毛澤東孩兒立志出鄉(xiāng)關,學不成名誓不還;埋骨何須桑梓地,人生無處不青山。 給人一條魚,

48、只能讓人吃一頓;給人以釣魚的方法,則可以讓人終生受益。老子 “磨刀不誤砍柴功”,誤與不誤,取決于你想要砍多少柴!蔣文華老鷹鴿子博弈(斗雞博弈) 參與人B 老鷹 鴿子 參與人A 老鷹 a-c , a-c 2a, 0 鴿子 0 , 2a a , a 當ac時,老鷹老鷹是純戰(zhàn)略納什均衡。當ac時,老鷹戰(zhàn)略的概率P*=a/c。A=B=a(1-P*) g=A+B=2a(1-P*)問題:1、C增加后,對雙方有好處嗎? 2、a增加后,對雙方有好處嗎?監(jiān)督博弈及其均衡納稅人 逃 稅 不逃稅 稅收機關 檢查 A-C+F, -A-F A-C, -A 不檢查 0, 0 A, -A 通過求解,其均衡結(jié)果是:*=A/(

49、A+F),*=C/(A+F)問題:1、稅收機關檢查的概率 2、納稅人逃稅的概率最后通牒: take it or leave it游戲規(guī)則:1、參與人:AB2、行動空間A:出價B:拒絕或接受(take it or leave it)3、結(jié)局(payoff) AB出價X接受拒絕(1-X,X)(0,0)條件拒絕比例均值標準誤差觀察值平分比例45-55比例匿名334.271.171893150有限交流64.700.46493982無限交流44.850.73497583三種條件下最后通牒的比較1966年,美國聯(lián)邦最高法院最終確定了米蘭達規(guī)則,其內(nèi)容如下: “憲法要求我告知你以下權(quán)利: 1、“你有權(quán)保持沉

50、默,你對任何一個警察所說的一切都將可能被作為法庭對你不利的證據(jù)。 2、“你有權(quán)利在接受警察詢問之前委托律師,他(她)可以陪伴你受詢問的全過程。 3、“如果你付不起律師費,只要你愿意,在所有詢問之前將免費為你提供一名律師。 4、如果你愿意回答問題,你在任何時間都可以終止談話。 如果你希望跟你的律師談話,你可以在任何時間停止回答問題,并且你可以讓律師一直伴隨你詢問的全過程?!?米蘭達規(guī)則市場的本質(zhì)是競爭!競爭的本質(zhì)是平均化!平均化的對立面是差別化!差別化的根本是人的差別化!人的差別化的根本是大腦的差別化!大腦的差別化的根本在于觀念的差別化!沒有差別就沒有利潤名稱差異化品質(zhì)差異化(三個“多”一點)容量多一點,將目前較流行的500ml包裝調(diào)整為600ml;濃度多一點,將市面流行的10%果汁含量調(diào)整為30%;內(nèi)容多一點,將三種水果混合在一起。價格差異化傳播差異化將推辭型改為推薦型;搖一搖的潛臺詞;倡導一種新喝法。 農(nóng)夫果園有點“新”在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論