不完全信息靜態(tài)博弈_第1頁
不完全信息靜態(tài)博弈_第2頁
不完全信息靜態(tài)博弈_第3頁
不完全信息靜態(tài)博弈_第4頁
不完全信息靜態(tài)博弈_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章不完全信息靜態(tài)博弈這一章里我們討論不完全信息靜態(tài)博弈,也稱為貝葉斯博弈(Bayes).不完全信息博弈中,至少有一個參與者不能確定另一參與者的收益函數(shù)。非完全信息靜態(tài)博的一個常見例子是密封報價拍賣(sealed-bidauction):每一報價方知道自己對所售商品的估價,但不知道任何其他報價方對商品的估價;各方的報價放在密封的信封里上交,從而參與者的行動可以被看作是同時的。靜態(tài)貝葉斯博弈問題的主要來源也是現(xiàn)實(shí)經(jīng)濟(jì)活動,許多靜態(tài)博弈關(guān)系都有不完全信息的特征,研究貝葉斯博弈不僅是完善博弈理論的需要,也是解決實(shí)際問題的需要。靜態(tài)貝葉斯博弈和貝葉斯納什均衡為了更好的說明不完全信息與完全信息之間的差異,我們用一個典型靜態(tài)貝葉斯博弈作為例子,自然的引進(jìn)靜態(tài)貝葉斯博弈概念。不完全信息古諾模型考慮如下兩寡頭進(jìn)行同時決策的產(chǎn)量競爭模型。其中市場反需求函數(shù)由P(Q)=〃-Q給出,這里Q=q+q為市場中的總產(chǎn)量.企業(yè)1的成本函數(shù)為C(q)=cq,不過企業(yè)2121111的成本函數(shù)以9的概率為C(q)=cq,以1-9的概率為C(q)=cq,這里c<c。22H222L2LH并且信息是不對稱的:企業(yè)2知道自己的成本函數(shù)和企業(yè)1的成本函數(shù),企業(yè)1知道自己的成本函數(shù),但卻只知道企業(yè)2邊際成本為高的概率是9,邊際成本為低的概率是1-9(企業(yè)2可能是新進(jìn)入這一行業(yè)的企業(yè),也可能剛剛發(fā)明一項(xiàng)新的生產(chǎn)技術(shù))。上述一切都是共同知識:企業(yè)1知道企業(yè)2享有信息優(yōu)勢,企業(yè)2知道企業(yè)1知道自己的信息優(yōu)勢,如此等等.現(xiàn)在我們來分析這個靜態(tài)貝葉斯博弈。一般情況下,企業(yè)2的邊際成本較高時選擇較低的產(chǎn)量,邊際成本較低時,選擇較高的產(chǎn)量。企業(yè)1從自己的角度,會預(yù)測到企業(yè)2根據(jù)其成本情況將選擇不同的產(chǎn)量.設(shè)企業(yè)1的最佳產(chǎn)量選擇為q*,企業(yè)2邊際成本為c時的1HTOC\o"1-5"\h\z最佳產(chǎn)量選擇為q*(c),企業(yè)2邊際成本為c時的最佳產(chǎn)量選擇為q*(c),如果企業(yè)2的2HL2L成本較高,它會選擇q*(c)滿足:2Hmax[(a-q*-q)-c]q2H2類似地,如果企業(yè)2的成本較低,%(c)應(yīng)滿足:2Lmax[(a-q*-q)-c]q2L2從而,企業(yè)l為了使利潤最大化,選擇q*應(yīng)滿足:max{9[(a-q-q*(c)-c]q+(1-9)[(a-q-q*(c)-c]q}12H1112L11三個最優(yōu)化問題的一階條件為:a-a-q*-cq*(c)=——H,2H2a-q*-cq*(c)=1g2L21q*=—{9[(a-q*(c)-c]+(1-9)[(a-q*(c)-c]}2H12L1三個一階條件構(gòu)成的方程組的解為:TOC\o"1-5"\h\za—2c+c1—0*(c)=H1+〃(c—c)2H36HLa—2c+cq*(c)=li2、L3q*a—2c+0c+(1—0)q*HL3把這里的q*、q*(c)和q*(c)與成本分別為c和c的完全信息古諾均衡相比較,假12H2L12定c和c的取值可使得兩個企業(yè)的均衡產(chǎn)量都為正,在完全信息的條件下,企業(yè)的產(chǎn)出為12q*=(a—2c+c)/3。與之不同的,在不完全信息條件下,q*(c)>q*,當(dāng)c=c,iij2H22Hq*(c)<q*,當(dāng)c=c。之所以會出現(xiàn)這種情況,是因?yàn)槠髽I(yè)2不僅根據(jù)自己的成本調(diào)2L22L整其產(chǎn)出,同時還將考慮到企業(yè)l的情況選擇最優(yōu)反應(yīng)。如果企業(yè)2的成本較高,它就會因成本較高而減少產(chǎn)量,但同時又會生產(chǎn)稍多一些,因?yàn)樗榔髽I(yè)1將根據(jù)期望利潤最大化的原則決定產(chǎn)出,從而要低于企業(yè)1確知企業(yè)2成本較高時的產(chǎn)量。8.1.2靜態(tài)貝葉斯博弈現(xiàn)在,我們要建立非完全信息同時行動博弈的標(biāo)準(zhǔn)式表述,也稱為靜態(tài)貝葉斯博弈。首先要表示出非完全信息的關(guān)鍵因素,即每一參與者知道他自己的收益函數(shù),但也許不能確知其他參與者的收益函數(shù).令參與者i可能的收益函數(shù)表示為u(a,…,a;t),其中t稱為參TOC\o"1-5"\h\zi1nii與者i的類型-ype),它屬于一個可能的類型集(亦稱為類型空間(typepace))T,每一類型tii都對應(yīng)著參與者i不同的收益函數(shù)的可能情況。作為具體的例子,考慮前面的的古諾博弈.企業(yè)的行動是它們的產(chǎn)量選擇q和q。企業(yè)122有兩種可能的成本函數(shù),從而有兩種可能的利潤或收益函數(shù):他(如,以;也}=[(0-qi-q外一丸】92叱(打,久;ch)=[(日一的一g之)一叨]<?”企業(yè)1只有一種可能的收益函數(shù):我們說企業(yè)2的類型空間為了T={c,c},企業(yè)1的類型空間為了T={c}.2LH11在這樣定義參與者的類型之后,說參與者i知道自己的收益函數(shù)也就等同于說參與者i知道自己的類型,類似地,說參與者i可能不確定其他參與者的收益函數(shù),也就等同于說參與者i不能確定其他參與者的類型,我們用t={t,…,t,t,…,t}表示其他參與者的類—i1i—1i+1n型。并用T表示t所有可能的值的集合,用概率P(tt))表示參與者在知道自己的類型—i—ii—ii是(的前提下,對其他參與者類型t_,的推斷,即在自己的類型是(的前提下,對其他參與者類型t出現(xiàn)的條件概率。在完全信息靜態(tài)博弈的標(biāo)準(zhǔn)式的基礎(chǔ)上,增加類型和推斷兩個概念,-i得到靜態(tài)貝葉斯博弈的標(biāo)準(zhǔn)式概念。定義9。1一個n人靜態(tài)貝葉斯博弈的標(biāo)準(zhǔn)式表述包括:參與者的行動空間A,…,A1nTOC\o"1-5"\h\z和它們的類型空間T,…,T他們的推斷p,…,p,以及他們的收益函數(shù)u,…,u.參與者1n1n1ni的類型作為參與者i的私人信息,決定了參與者i的收益函數(shù)u(a,…,a;t)。參與者ii1ni的推斷P(tt)描述了i在給定自己的類型t時,對其他n—1個參與者可能的類型t的不i-iii-i確定性。我們用G={A,…,A;T,…T;p,…p;u,…,u}表示這一博弈。n1n1n1n靜態(tài)貝葉斯博弈的一般表示法,對于由現(xiàn)實(shí)問題抽象和建立靜態(tài)貝葉斯博弈模型,提供了思路和幫助,我們根據(jù)靜態(tài)貝葉斯博弈表達(dá)式中的幾個方面,來確定模型的主要內(nèi)容。不過最重要的問題是如何來分析問題,那么用什么樣的方法來分析這類博弈呢?8。1.3海薩尼轉(zhuǎn)換信息的不完全使得博弈分析變的復(fù)雜,1967年以前,博弈論專家認(rèn)為這樣的不完全信息博弈是無法分析的,因?yàn)楫?dāng)一個參與人不知道在與誰博弈時,博弈的規(guī)則是無效的。海薩尼(Harsanyi,1967—1968)提出了處理不完全信息博弈的方法,巧妙地引入一個“第三者”--——自然,將復(fù)雜問題的不完全信息博弈轉(zhuǎn)換為完全但不完美信息博弈,稱之為“海薩尼轉(zhuǎn)換”。海薩尼轉(zhuǎn)換的具體方法是:一個虛擬的參與人“自然”,自然首先決定參與人的類型,賦予各參與人的類型向量t=(t,…,t),其中,teT,i=1,…,n;nii(2)自然告知參與者i自己的類型,卻不告訴其他參與者的類型;(3)參與者同時選擇行動,每一參與者i從可行集A中選擇行動方案a;ii(4)各方得到收益u(a,…,a;t)。i1ni借助于第一步和第二步中虛構(gòu)的參與者“自然”的行動,我們可以把一個不完全信息的博弈表述為一個不完美信息的博弈.海薩尼轉(zhuǎn)換是處理不完全信息博弈的標(biāo)準(zhǔn)方法。8。1.4貝葉斯納什均衡靜態(tài)貝葉斯博弈轉(zhuǎn)化的都是兩階段有同時選擇的、特殊類型的不完美信息動態(tài)博弈,對于這類博弈有專門的分析方法和均衡概念。為了定義貝葉斯納什均衡概念,首先定義此類博弈中參與者的戰(zhàn)略空間。動態(tài)博弈中參與者的一個戰(zhàn)略是關(guān)于行動的一個完整計劃,包括了參與者在可能會遇到的每一種情況下將選擇的可行行動.在給定的靜態(tài)貝葉斯博弈的時間順序中,自然首先行動,賦予每一參與者各自的類型,參與者i的一個(純)戰(zhàn)略必須包括參與者i在每一可行的類型下選擇的一個可行行動。定義如下:定義9.2在靜態(tài)貝葉斯博弈G={A,…,A;T,…T;p,…p;u,…,u}中,參與者1n1n1n1nTOC\o"1-5"\h\zi的一個戰(zhàn)略是一個函數(shù)s(t),其中對T中的每一類型t,s(t)包含了自然賦予i的類型iiiiii為t時,i將從可行集中A中選擇的行動a。iii我們用不完全信息古諾模型來闡述戰(zhàn)略定義,從前面分析知道博弈的解由三個產(chǎn)量選擇組成:q*、q*(c)和q*(c)。用剛剛給出的關(guān)于戰(zhàn)略的定義,(q*(c),q*(c))就是

12H2L2H2L企業(yè)2的戰(zhàn)略,q*是企業(yè)1的戰(zhàn)略,很容易想到企業(yè)2根據(jù)自己的成本情況會選擇不同的1產(chǎn)量,但是還應(yīng)注意到的同樣重要的一點(diǎn),是企業(yè)l在選擇產(chǎn)量時也應(yīng)同樣考慮企業(yè)2將根據(jù)不同的成本選擇不同的產(chǎn)量。從而,如果我們的均衡概念要求企業(yè)l的戰(zhàn)略是企業(yè)2戰(zhàn)略的最優(yōu)反應(yīng),則2的戰(zhàn)略必須是一對產(chǎn)量,分別對應(yīng)于兩種可能的成本類型,否則企業(yè)1就無法計算它的戰(zhàn)略是否確實(shí)是企業(yè)2戰(zhàn)略的最優(yōu)反應(yīng),無法進(jìn)行博弈分析。給出貝葉斯博弈中關(guān)于戰(zhàn)略的定義之后,我們就可以定義貝葉斯納什均衡了。盡管定義中的符號十分復(fù)雜,但中心思路卻既簡單又熟悉:每一參與者的戰(zhàn)略必須是其他參與者戰(zhàn)略的最優(yōu)反應(yīng),亦即貝葉斯納什均衡實(shí)際上就是在貝葉斯博弈中的納什均衡.定義9.3在靜態(tài)貝葉斯博弈G={A,…,A;T,…T;p,…p;u,…,u}中,戰(zhàn)略組1n1n1n1n合s*=((}…,s;)是一個純戰(zhàn)略貝葉斯納什均衡,如果對每一參與者i及對i的類型集丁的每一t,s*(t)滿足iiimaxZ{u[(s*(t),…,s*(t),a,s*(t)?…,s*(t);t]p(tt)}.i11i-1i-1ii+1i+1nnii一iiaeAiit-i定義中求最大值的和是對t求和,即對其他參與人的各種可能的類型組合求和,“純策-i略”的意義與完全信息博弈相同。當(dāng)靜態(tài)貝葉斯博弈中參與人的一個戰(zhàn)略組合是貝葉斯納什均衡時,沒有參與者愿意改變自己的戰(zhàn)略,即使這種改變只涉及一種類型下的一個行動。貝葉斯納什均衡是分析靜態(tài)貝葉斯博弈的核心概念,一個有限的靜態(tài)貝葉斯博弈(即博弈中n是有限的,并且(A,…,A)和(T,…,T)都是有限集)理論上存在貝葉斯納什均1n1n衡,包括采用混合戰(zhàn)略的情況.8。2應(yīng)用舉例海薩尼(1973)提出這樣的一個結(jié)論:完全信息靜態(tài)博弈的混合戰(zhàn)略納什均衡,幾乎總是可以解釋為與之密切相關(guān)、存在少量不完全信息的博弈中的純戰(zhàn)略貝葉斯納什均衡。混合戰(zhàn)略納什均衡的重要特征,不是參與者以隨機(jī)地方法選擇一個戰(zhàn)略,而是參與者不能確定其他參與人的選擇,這種不確定性既可產(chǎn)生于隨機(jī)因素,又可能(更為合理地)因?yàn)樯倭坎煌耆畔?,如下面的例子?.2o1混合策略和不完全信息前面所講的性別戰(zhàn)博弈,存在兩個純戰(zhàn)略納什均衡(歌劇,歌劇)和(拳擊,拳擊)及一個混合戰(zhàn)略納什均衡,其中妻子以2/3的概率選擇歌劇,丈夫以2/3的概率選擇拳擊。歌劇拳擊240,0必o1,2圖9—1性別戰(zhàn)現(xiàn)在假設(shè)盡管兩人已經(jīng)認(rèn)識了相當(dāng)一段時間,但不能完全肯定地把握對方的想法。假定如果雙方都選擇歌劇妻子的收益為2+/,其中/的值是妻子的私人信息,雙方都去觀看拳WW擊時丈夫的收益為2+/,其中/的值為丈夫的私人信息;t和/相互獨(dú)立,并服從[0,

hhwhx\區(qū)間上的均勻分布,()和)的值是指原博弈收益的隨機(jī)擾動項(xiàng),我們可以認(rèn)為%是一個很小的正數(shù)).所有其他情況下的收益不變.表述為標(biāo)準(zhǔn)式則為:靜態(tài)貝葉斯博弈G={A,A;T,T;p,p-u}中,行動空間為A=A={歌劇,拳擊},類型空間為whwhwhwhwhT=T=[0,x],關(guān)于類型的推斷為對所有的/和/,pQ)=pQ)=l/x,收益情況whwhwhAw如圖9—2o圖9-2非完全信息性別戰(zhàn)我們構(gòu)建這個性別戰(zhàn)博弈的純戰(zhàn)略貝葉斯(Bayes)納什均衡。其中t超過某臨界值ww時妻子選擇歌劇,否則選擇拳擊;丈夫在th超過某臨界值h時選擇拳擊,否則選擇歌劇.在這一均衡中,妻子以(%-W)/%的概率選擇歌劇,丈夫則以(%-h)/%的概率選擇拳擊.假設(shè)妻子和丈夫都采用上面所給出的戰(zhàn)略,對一個給定的%,我們計算相應(yīng)的w和h,以使雙方的戰(zhàn)略符合貝葉斯納什均衡的條件.給定丈夫的戰(zhàn)略,妻子選擇歌劇和選擇拳擊的期望收益分別為h%一h八h、(2+1)+,0—(2+1)%w%%w和

hex-h,x一h?0+-1二xxxx從而,當(dāng)且僅當(dāng)t>--3=攻,選擇歌劇是最優(yōu)的。同樣,假定妻子采用了臨界值w戰(zhàn)略,wh丈夫選擇拳擊和選擇歌劇的期望收益分別為TOC\o"1-5"\h\zx-www?0+(2+1)=(2+1)xxhxh和x-wwx-w?1+?0二xxx-3=h,選擇拳擊是最優(yōu)的。x所以,-3=h,選擇拳擊是最優(yōu)的。xo廠3=w解聯(lián)立方程組《解聯(lián)立方程組x-3=h、wh2+3h-x=0解二次方程得當(dāng)x趨于0時,該式的值趨于2/3。也就是說,隨著不完全信息的消失,參與者在此不完全信息博弈純戰(zhàn)略貝葉斯納什均衡下的行動趨于其在原完全信息博弈混合戰(zhàn)略納什均衡下的行動。8.2.2暗標(biāo)拍賣我們用貝葉斯納什均衡的思想,來討論暗標(biāo)拍賣問題。基本的暗標(biāo)拍賣規(guī)則是各投標(biāo)人密封標(biāo)書投標(biāo),統(tǒng)一時間開標(biāo),標(biāo)價最高者中標(biāo).如果出現(xiàn)標(biāo)價相同的情況,用拋硬幣或類似方法決定中標(biāo)者。假設(shè)有兩個投標(biāo)人,分別為1、2,投標(biāo)人i對商品的估價為v——即如果i投標(biāo)人i付出價格p得到商品,則i的收益為v-p。兩個投標(biāo)人的估價相互獨(dú)立,并服從[0,1]i區(qū)間上的均勻分布。投標(biāo)價格不能為負(fù),且雙方同時給出各自的投標(biāo)價。出價較高的一方得到商品,并支付他報的價格;另一方的收益和支付都為0。投標(biāo)方是風(fēng)險中性的,所有以上都是共同信息.為把這一問題化為標(biāo)準(zhǔn)式的靜態(tài)貝葉斯博弈,我們必須確定行動空間、類型空間、推斷及收益函數(shù)。參與者i的行動是給出一個非負(fù)的投標(biāo)價b,其類型即他的估價v(在抽象ii博弈G={A,A;T,T;p,p;u,u}中表示為,行動空間A=[0產(chǎn)),類型空間12121212iT=[0,1])。由于估價是相互獨(dú)立的,參與者i推斷v服從[0,1]區(qū)間上的均勻分布,而不ij依賴于v的值。最后,參與者i的收益函數(shù)為iu(b,u(b,b;v,v)=<

i1212v一bii(v一b)/2ii0當(dāng)b>bij當(dāng)〃=bi當(dāng)b<bi為推導(dǎo)這一博弈的貝葉斯納什均衡,我們首先建立參與者的戰(zhàn)略空間。在靜態(tài)貝葉斯博弈中,一個戰(zhàn)略是由類型到行動的函數(shù).參與者i的一個戰(zhàn)略為函數(shù)b(v),據(jù)此可以決定i在每ii種類型(即對商品的估價)下選擇的投標(biāo)價格.在貝葉斯納什均衡下,參與者1的戰(zhàn)略b1(v1)與參與者2的戰(zhàn)略b(v)互相是對方的最優(yōu)反應(yīng)。若戰(zhàn)略組合[b(v),b(v)]是貝葉斯納什221122均衡,那么每個類型vg[0,1],b(v)滿足iii1max[(v一b)P{b>b}+(v一b)P{b=b}]biiij2iiiji我們尋找該問題的一組線性均衡解,即假設(shè)b(v)和b(v)都是線性函數(shù)。1122b(v)=a+cv及b(v)=a+cv,并據(jù)此對上式進(jìn)行簡化.但應(yīng)注意我們不是限制了1111122222參與者的戰(zhàn)略空間,使之只包含了線性戰(zhàn)略;而是允許參與者任意地選擇戰(zhàn)略,而只看是否存在線性的均衡解。我們會發(fā)現(xiàn)由于參與者的估價是均勻分布的,這樣的線性均衡解不僅存在。而且是惟一的。其結(jié)果為b(v)=v/2,也就是說,每一參與者以其對商品估價的iii1/2作為投標(biāo)價。這樣,一個投標(biāo)價格反映出投標(biāo)方在拍賣中遇到的最基本的得失權(quán)衡:投標(biāo)價格越高,中標(biāo)的可能性越大;投標(biāo)價格越低,一旦中標(biāo)所得的收益就越大。假設(shè)參與者j采取戰(zhàn)略b(v)=a+cv,對一個給定的v值,參與者i的最優(yōu)反應(yīng)為jjjjji下式的解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論