第二講 完全信息_第1頁
第二講 完全信息_第2頁
第二講 完全信息_第3頁
第二講 完全信息_第4頁
第二講 完全信息_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二講完全信息靜態(tài)博弈1博弈的標準式或策略式2占優(yōu)策略均衡3重復剔除劣策略4納什均衡1博弈的標準式或策略式

博弈的要素包括博弈方、策略空間、博弈的次序、博弈方的支付、博弈方的信息掌握程度和理性基礎。其中博弈的次序、信息和理性基礎是構成博弈前提,而要表示一個博弈,只要表出各博弈方及其策略空間和得益就可以了。即:(1)博弈參與者集合:A={1,2,…,n}(2)策略空間:Si,i=1,2,…,n.(3)支付函數(shù):ui(s1,s2,…,sn)定義1:如果一個博弈有n個博弈方,其策略空間分別為S1,S2,…,Sn,支付函數(shù)分別為:u1,u2,…,un,則此博弈的標準式表示為:G={S1,S2,…,Sn,;u1,u2,…,un}標準式主要用來表示靜態(tài)博弈。這種博弈中,參與者是同時選擇策略的,但只要每一參與者在行動時不知道其他參與者的選擇就可以了。2占優(yōu)策略均衡參與者選擇策略的過程。選擇方法無非兩種:選優(yōu)和去劣。一般說來,每個參與者的收益都是所有參與者所選戰(zhàn)略的函數(shù),因此,每個參與者選擇最優(yōu)策略時必須考慮其他參與者的選擇。但有些特殊的博弈中,某些參與者可能不需要考慮其他參與者的選擇,因為無論其他參與者如何選擇,他有唯一的最優(yōu)策略,稱為占優(yōu)策略。對于任一向量s=s(s1,…,sn),將向量(s1,…,si-1,si+1,…,sn)記作s-i,即s中與參與人i無關的部分。參與人i之外所有其他參與人的策略組合參與人i對于其他參與人所選擇的策略s-i的最佳應對是使其獲得最大支付的策略si即ui(si*,s-i)≥ui(si′,s-i)對于任何si′≠si*如果沒有其他策略是同樣好的,那么這一最佳應對就是強最佳應對。

第一個重要的均衡概念就是優(yōu)勢策略均衡(dominantstrategyequilibrium)。如果無論其他參與人選擇什么策略,策略si*都是參與人i的強最佳應對,那么si*就稱為優(yōu)勢策略。這意味著無論別人選擇什么策略,si*都使參與人i的支付最大化。從數(shù)學上講ui(si*,s-i)≥ui(si′,s-i)對于任何si′≠si*對于參與人i而言較差的策略稱為劣式策略(dominantedstrategy)。優(yōu)勢策略均衡是由每個參與人優(yōu)勢策略所組成的策略組合(s1*,s2*,…,sn*)。優(yōu)勢策略只要求每個參與者是理性的,而不要求每個參與者知道其他參與者是理性的(即不要求“理性”是共同知識)囚徒困境舉例囚徒困境列抵賴坦白抵賴(-1,-1)(-10,0)列坦白(0,-10)(-8,-8)每一個參與人都有一個優(yōu)勢策略。以行先生為例,他并不知道列先生選擇的是什么行動。但不管列先生選擇什么,行先生的優(yōu)勢策略都是坦白。由于支付矩陣是對稱的,列先生也是如此。所以優(yōu)勢策略均衡為(坦白,坦白),均衡支付為(-8,-8)囚徒困境看起來既荒謬又不現(xiàn)實(雖然這是對付犯罪的標準工具之一)。如果你實在不能理解,應該意識到,模型的主要用處通常是導出荒謬的結果,引致困惑。困惑是你的模型與你設想的有所不同的標志(你遺漏了對于所期望但卻未得到的結果來說必不可少的東西)。此時要么是你的最初想法有問題,要么是你的模型有錯誤發(fā)現(xiàn)此類錯誤是建模過程中的收獲。這種收獲雖然痛苦,但卻是真實的有益的。拒絕接受出乎意料的結論就是拒絕邏輯。3重復剔除劣策略——“俾斯麥海戰(zhàn)”日本海軍上將木村要將日本陸軍運往新幾內亞,有兩條航線:較短的北線和較長的南線。美國海軍上將肯尼則必須決定將其飛機派往南線還是北線進行搜索轟炸。俾斯麥海戰(zhàn)木村北南北(2,-2)(2,-2)肯尼南(1,-1)(3,-3)兩個參與人都沒有優(yōu)勢策略。但使用弱優(yōu)勢的概念,可以找到一個較為合理的均衡。對參與人i的策略si′來說,如果存在有可能比si′好而絕不會比si′差的另一策略si‘’,即在某些策略組合下si‘’可帶來更高支付而絕不會產生更低的支付,那么我們說si′弱劣于si‘’。從數(shù)學上講,若存在這樣的si‘’,對于任何s-iui(si‘’,s-i)≥ui(si′,s-i),對于某一s-i,則說si′弱劣于si‘’。弱優(yōu)勢策略均衡(weakdomimantstrategyequilibrium)定義為在剔除了每個參與人的全部弱劣勢策略后得到的一個策略組合。但是肯尼沒有任一策略是弱劣的。于是要求定義一個重復剔除優(yōu)勢均衡。我們首先從某一個參與人的策略集里剔除一個弱劣策略,再重新考察各個參與人剩下的策略中哪些是弱劣的并剔除其中之一,繼續(xù)這一過程直到每一個參與人都僅剩下一個策略。這樣得到的策略組合就稱為這重復剔除優(yōu)勢均衡(iterateddominanceequilibrium)將這一均衡概念應用于俾斯麥海戰(zhàn),則意味著肯尼斷定木村會選擇策略北,因為它是弱優(yōu)勢的。木村北北(2,-2)肯尼南(1,-1)去掉了一列的情況下,肯尼就有一個強優(yōu)勢策略:選擇北。(北,北)就是一個重復剔除優(yōu)勢均衡,這也是1943年真實發(fā)生的情況。優(yōu)勢策略均衡和重復剔除策略均衡對參與者的理性要求是不同的。前者只要每個參與者自己是理性的就可以了,而后者要求理性是參與者的共同知識,即,參與者不僅自己是理性的,還需要其他參與者也是理性的,并且還假定所有參與者都知道其他參與者是理性的。重復剔除策略均衡是建立在理性參與者不會選擇嚴格劣策略這一合情推理之上的,但這一方法和嚴格占優(yōu)策略均衡一樣,有時候找不到嚴格劣策略。所以,這兩種解法雖然簡單,但有時不奏效。4納什均衡對于大多數(shù)的博弈而言,重復剔除優(yōu)勢均衡也是不存在的,于是引入納什均衡(NashEquilibrium)。在一個策略組合si*,在其他參與人都不會改變已有策略的條件下,如果沒有參與人有激勵去改變自身的策略,則稱策略組合si*為納什均衡,數(shù)學表達為,ui(si*,s-i*)≥ui(si′,s-i*)對于任何si′≠si*智豬博弈(boxedpigs)小豬按鍵等待按鍵(5,1)→(4,4)大豬↓↑等待(9,-1)→(0,0)策略組合為(按鍵,等待)是一個納什均衡。理解納什均衡就是構造一個策略組合,然后看看每個參與人的策略是否是對其他參與人策略的最好應對。如果大豬選擇了按鍵,那么小豬會選擇等待。反過來,如果小豬選擇了等待,那么大豬選擇按鍵,這就是印證了(按鍵,等待)確實是一個納什均衡。乙左中右上甲中下0,44,05,34,03,50,43,56,65,3性別大戰(zhàn)妻子韓劇球賽韓劇2,10,0丈夫球賽0,01,2不存在重復剔除優(yōu)勢均衡??辞蛸惡涂错n劇都是納什均衡,但分別是針對不同均衡而言。若這對戀人事先不通氣,則可能出現(xiàn)誤會。性別戰(zhàn)中,任一納什均衡都是帕累托有效的,其他任一策略都不可能在不降低其他參與人支付的條件下提高另一參與人的支付,即不存在帕累托改進。但囚徒困境博弈中納什均衡并不是帕累托最優(yōu)的。斗雞博弈妻子進退進-3,-32,0丈夫退0,20,0市場進入阻撓在位者默許斗爭進入40,50-10,0進入者不進入0,3000,300恩愛夫妻博弈妻子活著死了活著2,2-6,0丈夫死了0,-60,0仇恨夫妻博弈妻子活著死了活著0,06,0丈夫死了0,60,0同優(yōu)勢策略均衡一樣,納什均衡也有強弱之分,要定義一個強納什均衡,只要不等式成立嚴格成立。也就是說,沒有參與人會對是選擇均衡策略還是選擇其他策略持兩可的態(tài)度。每一個優(yōu)勢策略均衡都是納什均衡,但并非每一個納什均衡都是優(yōu)勢策略均衡。如果某一策略是優(yōu)勢的,那么它對于其他參與人選擇的任何策略都是最佳應對從數(shù)學上講(ui(si*,s-i)≥ui(si′,s-i)對于任何si′≠si*),這自然也包括其他參與人的均衡策略。如果某一策略是納什均衡的組成部分,那么它只需要對其他參與人的均衡策略而言是最佳應對即可。(ui(si*,s-i*)≥ui(si′,s-i*)對于任何si′≠si*)為了說明納什均衡的這一特點,構造囚徒困境的變形。變形的囚徒困境列抵賴坦白抵賴(0,0)(-10,0)列坦白(0,-10)(-8,-8)變形的囚徒困境沒有強優(yōu)勢策略均衡,它僅有一個弱優(yōu)勢策略均衡,坦白仍是一個弱優(yōu)勢策略。(坦白,坦白)是一個重復剔除均衡策略,也是一個強納什均衡。但是還存在另一個納什均衡:(抵賴,抵賴)。這是一個弱納什均衡。雖然這一均衡是弱的而另一均衡是強的,但(抵賴,抵賴)仍然有其自身的優(yōu)勢:它的結果具有帕累托優(yōu)勢,因為(0,0)中二者的支付均大于(-8,-8)。納什均衡的應用古諾(Cournot)的雙寡頭壟斷模型設q1,q2分別表示企業(yè)1,2生產的同樣產品的產量,市場中該產品的總供給Q=q1+q2,令P(Q)=a-Q表示市場出清價格(當Q>a時P(Q)=0),設企業(yè)i生產qi總成本為cqi,即不考慮固定成本,邊際成本為常數(shù)c,并且兩個企業(yè)同時進行產量決策。首先把問題轉化為標準式博弈。博弈參與者:企業(yè)1、2;博弈參與者的策略空間:設產量是連續(xù)變化的,則S1=S2=[0,+∞)。(其實不會產生qi>a的情況)把各自的收益表示成自己和對方所選策略的函數(shù):U1(q1,q2)=q1[P(q1+q2)-c]=q1[a-(q1+q2)-c]U2(q1,q2)=q2[P(q1+q2)-c]=q2[a-(q1+q2)-c]設(q1*,q2*)是納什均衡,則由(NE)得:u1(q1*,q2*)≥u1(q1,q2*)u2(q1*,q2*)≥u2(q1*

,q2)對所有qi∈Si=[0,+∞)都成立。分別求導得出如果(q1*,q2*)是納什均衡則必須解得這一均衡在直觀上很好理解。每一企業(yè)都想成為壟斷者,它會選擇qi使ui(qi,0)最大化假設a=8,c=2.惟一一組解為q1*=q2*=2,策略組合(2,2)是惟一納什均衡。市場總產量為4,市場價格為4,雙方支付(利潤)均為2×(8-4)-2×2=4,利潤總和為8。如果從兩廠商總利潤最大化角度來看,U=Q(8-Q)-2Q=6Q-Q×Q,最大產量為3,最大總利潤為9。古諾模型的簡單模型:兩寡頭間的囚徒困境博弈。寡頭2不突破突破不突破4.5,4.53.75,5寡頭1突破5,3.754,4團隊中的道德風險模型假設一個團隊中有兩個工人,每個人可以工作(si=1)或偷懶(si=0),團隊總產出是4(s1+s2),并在兩個工人中平均分配。每個人工作要承擔私人成本3,偷懶時私人成本為0。工人2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論