![第9講合作博弈論_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/20/398758a3-0082-4b99-8a87-b899414ea0c8/398758a3-0082-4b99-8a87-b899414ea0c81.gif)
![第9講合作博弈論_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/20/398758a3-0082-4b99-8a87-b899414ea0c8/398758a3-0082-4b99-8a87-b899414ea0c82.gif)
![第9講合作博弈論_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/20/398758a3-0082-4b99-8a87-b899414ea0c8/398758a3-0082-4b99-8a87-b899414ea0c83.gif)
![第9講合作博弈論_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/20/398758a3-0082-4b99-8a87-b899414ea0c8/398758a3-0082-4b99-8a87-b899414ea0c84.gif)
![第9講合作博弈論_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/20/398758a3-0082-4b99-8a87-b899414ea0c8/398758a3-0082-4b99-8a87-b899414ea0c85.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第第9講講 合作博弈合作博弈 一般來說,博弈論可以分為合作博弈(cooperative games)與非合作博弈(non-cooperative games),現(xiàn)代大多經(jīng)濟(jì)學(xué)家談到的博弈論往往指的是非合作博弈論,很少提到合作博弈論,甚至很多博弈論教材也未曾提到合作博弈。實(shí)際上,合作博弈的出現(xiàn)和研究比非合作博弈要早,早在1881年,Edgeworth在他的數(shù)學(xué)心理學(xué)一書中就已經(jīng)體現(xiàn)了合作博弈的思想。 合作博弈的運(yùn)用研究主要涉及企業(yè)、城市、區(qū)域經(jīng)濟(jì)以及國家之間的合作等多個(gè)方面問題。 參考教材參考教材: 范如國:范如國:博弈論博弈論,武漢大學(xué)出版社,武漢大學(xué)出版社,2011 雖然這些分析所針對(duì)的合作
2、問題類型不同,研究重點(diǎn)或在于闡明合作的內(nèi)在邏輯,或在于揭示合作的動(dòng)因,但是研究結(jié)果則有助于加強(qiáng)企業(yè)的相互聯(lián)系、完善城市的合作模式、推動(dòng)區(qū)域經(jīng)濟(jì)合作實(shí)踐、促進(jìn)國家之間的經(jīng)濟(jì)交往。這里,我們首先介紹靜態(tài)合作的基本概念,然后再介紹各種靜態(tài)合作博弈的不同解法,包括核心(core)與穩(wěn)定集(stable sets)、夏普利值(Shapley value)、談判集(negotiation sets)、內(nèi)核(kernel)與核仁(nucleolus),最后再舉出靜態(tài)合作在現(xiàn)實(shí)的經(jīng)濟(jì)方面的各種解法的應(yīng)用例子。導(dǎo)論導(dǎo)論先回憶一下囚徒困境的例子: 在囚徒困境中,還有另外一個(gè)策略組合,該組合為參與人帶來的支付是。由
3、到,每個(gè)參與人的支付都增加了,即得到一個(gè)帕累托改進(jìn)。 坦白抵抗坦白-8,-80,-10抵抗-10,0-1,-1 構(gòu)不成一個(gè)均衡是基于參與人的個(gè)人理性。在參與人選擇抵抗的情況下,每個(gè)參與人都有動(dòng)機(jī)偏離這個(gè)組合,通過投機(jī)行為謀取超額收益1。如果兩個(gè)參與人在博弈之前,簽署了一個(gè)協(xié)議:兩個(gè)人都承諾選擇抵抗,為保證承諾的實(shí)現(xiàn),參與人雙方向第三方支付價(jià)值大于1的保證金;如果誰違背了這個(gè)協(xié)議,則放棄保證金。有了這樣一個(gè)協(xié)議,就稱為一個(gè)均衡,每個(gè)人的收益都得到改善。 上述分析表明,通過一個(gè)有約束力的協(xié)議,原來不能實(shí)現(xiàn)通過一個(gè)有約束力的協(xié)議,原來不能實(shí)現(xiàn)的合作方案現(xiàn)在可以實(shí)現(xiàn)。這就是合作博弈與非合作博弈的區(qū)的合
4、作方案現(xiàn)在可以實(shí)現(xiàn)。這就是合作博弈與非合作博弈的區(qū)別。別。二者的主要區(qū)別在于人們的行為相互作用時(shí),當(dāng)事人是否達(dá)成一個(gè)具有約束力的協(xié)議。如果有,就是合作博弈;反之,則是非合作博弈。 因此,博弈可以劃分為合作博弈與非合作博弈。 第一節(jié)第一節(jié) 合作博弈的基本概念合作博弈的基本概念 合作博弈是指參與者能夠聯(lián)合達(dá)成一個(gè)具有約束力且可強(qiáng)制執(zhí)行的協(xié)議的博弈類型。合作博弈強(qiáng)調(diào)的是集體理性,強(qiáng)調(diào)效率、公正、公平。 合作博弈最重要的兩個(gè)概念是聯(lián)盟和分配聯(lián)盟和分配。每個(gè)參與者從聯(lián)盟中分配的收益正好是各種聯(lián)盟形式的最大總收益。每個(gè)參與者從聯(lián)盟中分配到的收益不小于單獨(dú)經(jīng)營所得收益。 合作博弈的基本形式是聯(lián)盟博弈聯(lián)盟博弈
5、,它隱含的假設(shè)是存在一個(gè)在參與者之間可以自由流動(dòng)的交換媒介(如貨幣),每個(gè)參與者的效用與它是線性相關(guān)的。這些博弈被稱為“單邊支付”博弈,或可轉(zhuǎn)移效用(Transferable Utility ,TU)博弈。 合作博弈的結(jié)果必須是一個(gè)帕累托改進(jìn),博弈雙方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受損害。合作博弈研究人們達(dá)成合作時(shí)如何分配合作得到的收益,即收益分配問題。合作博弈采取的是一種合作的方式,合作之所以能夠增進(jìn)雙方的利益,就是因?yàn)楹献鞑┺哪軌虍a(chǎn)生一種合作剩余。至于合作剩余在博弈各方之間如何分配,取決于博弈各方的力量對(duì)比和制度設(shè)計(jì)。因此,合作剩余的分配既是合作的結(jié)果,又是達(dá)
6、成合作的條件。 合作博弈的核心問題是參與人如何結(jié)盟以及核心問題是參與人如何結(jié)盟以及如何重新分配結(jié)盟的得益如何重新分配結(jié)盟的得益。 下面首先分析聯(lián)盟的概念,與聯(lián)盟相關(guān)聯(lián)的是特征函數(shù)。 在1950年到1953年間,納什發(fā)表了四篇有關(guān)博弈論的重要文獻(xiàn)(納什,1950a,1950b,1951,1953),文獻(xiàn)中很清楚地對(duì)合作博弈與非合作博弈進(jìn)行了界定,他所用的界定條件就是博弈者之間是否具有約束力的協(xié)議。他認(rèn)為如果一個(gè)博弈當(dāng)中的博弈者能夠作出具有約束力的協(xié)議,那么此博弈便是一個(gè)合作博弈,反之,則稱為一個(gè)非合作博弈。 根據(jù)納什的這一界定條件,由于合作博弈中存在具有約束力的協(xié)議,因此,每位博弈者都能夠按自己
7、的利益與其他部分的博弈者組成一個(gè)小集團(tuán),彼此合作以謀求更大的總支付。我們稱這些小集團(tuán)為聯(lián)盟(coalition),而由所有博弈者組成的聯(lián)盟則稱為總聯(lián)盟總聯(lián)盟(grand coalition)。因此,對(duì)有n個(gè)局中人參與的博弈,即 ,我們稱集合 N 的任何一個(gè)子集 S 為一個(gè)聯(lián)盟。, 2 , 1 nN定義定義1.1 設(shè)博弈的局中人集合為 ,則對(duì)于任意 ,我們稱 為 的一個(gè)聯(lián)盟(coalition)。這里,允許取 和 兩種特殊情況,我們把 稱為一個(gè)大聯(lián)盟。若 ,則 中聯(lián)盟個(gè)數(shù)為 。正式的合作博弈的定義是以特征函數(shù)特征函數(shù)(characteristic function form) 的 形式給出的,簡
8、稱博弈的特征性,也稱聯(lián)盟型。NNS , 2 , 1 nNSNSnN nnnnnCCC221vN,SNSN定義定義1.2 給定一個(gè)有限的參與人集合 ,合作博弈的特征型是有序數(shù)對(duì) ,其中特征函數(shù) 是從 到實(shí)數(shù)集 的映射,即 ,且 。 是 中的聯(lián)盟 和 博弈時(shí)S的最大效用,稱為聯(lián)盟S的特征函數(shù)特征函數(shù)(characteristic function), 表示聯(lián)盟中參與人相互合作所能獲得的得益(支付)。 之所以稱為特征函數(shù),是因?yàn)檫@個(gè)合作博弈的性質(zhì)基本由之所以稱為特征函數(shù),是因?yàn)檫@個(gè)合作博弈的性質(zhì)基本由 決定。由此可見決定。由此可見 對(duì)合作博弈的重要性對(duì)合作博弈的重要性。 特征函數(shù)是研究聯(lián)盟博弈的基礎(chǔ)
9、,確定特征函數(shù)的過程實(shí)際上就是一個(gè)建立合作博弈的過程。NvN,v|2NSSNNRNNRvN2:,0)(vNS)(Sv,|SiNiiSN)(Sv)(Sv)(Sv 在合作博弈中,支付可能是收益,也可能是成本(負(fù)效應(yīng))。如果這總得益是可以被瓜分的,我們則稱它為可轉(zhuǎn)移的(transferable);反之,則稱為不可轉(zhuǎn)移的(non-transferable)。 合作對(duì)策的分類主要是根據(jù)特征函數(shù)的性質(zhì)。合作對(duì)策的分類主要是根據(jù)特征函數(shù)的性質(zhì)。下面根據(jù)特征函數(shù)的性質(zhì)介紹幾類特殊的合作對(duì)策。1.如果 僅與 的個(gè)數(shù)有關(guān),則 稱作對(duì)稱博弈。2如果 ,則 稱作常和博弈。3如果 , 則 稱作簡單博弈。例如在投票博弈中
10、,每個(gè)參與人的權(quán)重 , 如果 ,則 稱作凸博弈。 )(SvS),(vN),(vN),(vN),(vN( )()()v Sv NSv N0( )1Siv SSN(),1iiw wQin 0( )1ii Sii SwQv SwQ( )( )()()v Sv Tv STv ST 定義定義1.3 一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈是由一個(gè)有限的博弈者集合 和一個(gè)定義在集合 的函數(shù) 所組成的,而這函數(shù) 對(duì)集合 當(dāng)中的每一個(gè)可能的非空子集 都會(huì)進(jìn)行賦值,其值為一個(gè)實(shí)數(shù),我們用 來表示合作博弈,而函數(shù)為每一個(gè)集合所賦的值則稱為S的聯(lián)盟值。vNSvN,NNv 函數(shù) 對(duì)集合 當(dāng)中的每一個(gè)可能的非空子集 都會(huì)進(jìn)行賦值,其
11、值為一個(gè)實(shí)數(shù),我們用 來表示一個(gè)合作博弈,而函數(shù)為每一個(gè)集合所賦的值則稱為S的聯(lián)盟值。為了確保每位博弈者都愿意組成總聯(lián)盟,合作博弈論一般要求支付可轉(zhuǎn)移的聯(lián)盟型博弈為有結(jié)合力的有結(jié)合力的:定義定義1.4 一個(gè)支付可以轉(zhuǎn)移的聯(lián)盟型博弈 是有結(jié)合力的,當(dāng)且僅當(dāng),對(duì)于集合 的每個(gè)分割物,即 ,且 ,以下的關(guān)系式都成立: 根據(jù)上述定義,我們可以得知,在一個(gè)具有結(jié)合力的vNSvN,vN,N,21mSSSjmjS1mjjSvNv1)()( 支付可轉(zhuǎn)移的聯(lián)盟型博弈中,如果我們把總聯(lián)盟 分成 個(gè)不相交的小聯(lián)盟,那么,這 個(gè)小聯(lián)盟的得益的總數(shù)是絕不會(huì)大于總聯(lián)盟的得益。由于這些博弈中的支付都是可轉(zhuǎn)移的,因此,總聯(lián)盟
12、型的情況必定是帕累托最優(yōu)的。在很多情況下,為了使得每位博弈者有更大的意欲組成總聯(lián)盟,合作博弈論更會(huì)要求博弈具有可超加性或是超可加的: 定義定義1.5 在一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈 中,如果對(duì)于任意的 ,且 ,有 ,那么,我們稱該合作博弈 是超可加的超可加的;如果對(duì)于任意的 ,且 ,有 ,那么,我們稱該合作博弈 是次可加的次可加的;如果對(duì)于任意的 ,且 , 有 ,NmmvN,NTS2,TS)()()(TSvTvSvvN,NTS2,TS)()()(TSvTvSvvN,)()()(TSvTvSvNTS2,TS 那么,我們稱該合作博弈 是可加的可加的。 定義定義1.6 在合作博弈 中,若對(duì)于任意的 ,
13、滿足以下條件: 則稱特征函數(shù) 具有凸性,相對(duì)應(yīng)的博弈稱為凸博弈凸博弈。 從上述定義中可以看出,參與人對(duì)某個(gè)聯(lián)盟的邊際貢參與人對(duì)某個(gè)聯(lián)盟的邊際貢獻(xiàn)隨著聯(lián)盟規(guī)模的擴(kuò)大而增加獻(xiàn)隨著聯(lián)盟規(guī)模的擴(kuò)大而增加。也就是說,在凸博弈中,合作是規(guī)模報(bào)酬遞增的。顯然,特征函數(shù)滿足凸性的一定滿足超可加性。特征函數(shù)的凸性表示聯(lián)盟越大,新成員的實(shí)際貢獻(xiàn)就越大。vN,vN,NTS2,)()()()(TSvTSvTvSvv 上式說明,特征函數(shù)只有滿足超可加性,才有形成新聯(lián)盟的必要性。否則,如果一個(gè)合作博弈的特征函數(shù)不滿足超可加性,那么,其成員沒有動(dòng)機(jī)形成聯(lián)盟,已經(jīng)形成的聯(lián)盟將面臨解散的威脅。 上式定義的逆命題也是正確的,即:
14、 是一個(gè)集合, 是定義在 上的一個(gè)非負(fù)實(shí)值函數(shù)。 滿足: ,如果 則存在一個(gè) 上的合作博弈,使 成為該合作博弈的特征函數(shù)。Nvv2N()0v )()()(2121SvSvSSv21SS Nv 對(duì)于合作博弈 ,特征函數(shù) 滿足超加性,自然有: 根據(jù)上述不等式,特征函數(shù) 分成兩種類型: , 滿足 。即大聯(lián)盟的效用是每個(gè)參與人的效用之和。這說明通過聯(lián)盟并沒有創(chuàng)造新的合作剩余,聯(lián)盟沒有價(jià)值,這種聯(lián)盟也不可能維持。這種對(duì)策稱為非實(shí)質(zhì)性對(duì)策,沒有研究價(jià)值,不是本章研究的范疇。 對(duì)于非實(shí)質(zhì)性對(duì)策,有 ,如果。(, ),1,2,N v Nnvvv ( )( 1 )( 2,)( 1 )( 2 )( 3,)v Nv
15、vnvvvn1()niv i 1()nivi( )v N1212()( )( )v SSv Sv S21SS , 滿足 。即大聯(lián)盟的效用大于每個(gè)參與人的效用之和。這說明通過聯(lián)盟創(chuàng)造了新的合作剩余,聯(lián)盟有意義,這種聯(lián)盟能否維持,取決于如何分配合作剩余,使每個(gè)參與人的支付都有改善。這種對(duì)策稱為實(shí)質(zhì)性對(duì)策。 v( )v N1()niv i定義定義1.7 一個(gè)合作博弈 ,若特征函數(shù)滿足下面的兩個(gè)條件: 則稱該博弈為 標(biāo)準(zhǔn)化博弈。 標(biāo)準(zhǔn)化博弈主要是為了簡化證明過程而假設(shè)的,他們要求單個(gè)參與人不會(huì)產(chǎn)生任何得益,而大聯(lián)盟所產(chǎn)生的得益標(biāo)準(zhǔn)化為1。vN,niiv,2 , 1, 0)(1)(Nv)1 ,0()1
16、,0( 例例. 假設(shè)有五個(gè)人A、B、C、D、E,決定合資建廠。每個(gè)人或是以人力資本投資,或是以資金投資。經(jīng)過認(rèn)真的可行性研究,建成后的合資公司年利潤為100單位(單位:10000美元)?,F(xiàn)在的問題是如何將這100單位的利潤在五個(gè)人中合理地分?jǐn)偅?對(duì)于這個(gè)問題,從表面上來看將總利潤進(jìn)行平均分配(即每人20單位)似乎是一個(gè)合理的分配方案。但通過進(jìn)一步的分析表明,如果D和和E單獨(dú)單獨(dú)組建聯(lián)盟進(jìn)行合作建廠,其年利潤為45單位,大于D和E在大聯(lián)盟(即五個(gè)人合作建廠)所分配到的40單位。同樣,A、B、C發(fā)現(xiàn)發(fā)現(xiàn),如果他們?nèi)藛为?dú)建廠,只能實(shí)現(xiàn)年利潤25單位。這樣,A、B、C自然希望D和E留在大聯(lián)盟中。因此
17、,他們決定分給D和E 46單位,而把剩下的54單位在A、B、C三人中平衡。顯然,這樣還是不行,因?yàn)镃、D、E發(fā)現(xiàn)他們?nèi)藛为?dú)建廠的年利潤為70單位,大于在大聯(lián)盟中得到的64單位(46+18),而A、B沒有足夠的資金自行建廠。因此,A和B不得不分給C、D、E 71單位,而把剩下的29單位在A和B中平分。如果C、D、E將71單位利潤平分的話,又會(huì)產(chǎn)生另一個(gè)問題。由于B、D、E三人合作建廠的年利潤為65單位,就使得剛才那個(gè)分配又變得不可行。那么,它們?cè)撛趺崔k呢?為了簡單起見,我們將此博弈的特征函數(shù)形式列在表1中。該表列出了每個(gè)可能的聯(lián)盟可能獲得的總利潤。S)(SVSS101,5201,2,4353,
18、4,570202,3151,2,5401,2,3,460302,4251,3,4401,2,3,565452,5301,3,5451,2,4,5755103,4301,4,5551,3,4,5801,203,5352,3,4502,3,4,5901,354,5452,3,5551,2,3,4,51001,4151,2,3252,4,5650表表1 : 各合作方案下聯(lián)盟獲得的總利潤各合作方案下聯(lián)盟獲得的總利潤 通過觀察表1,我們就會(huì)發(fā)現(xiàn),當(dāng)任意兩個(gè)聯(lián)盟的交集為空集的時(shí)候,這兩個(gè)聯(lián)盟中的所有參與人組成的新聯(lián)盟的總利潤總是不小于原先的兩個(gè)聯(lián)盟的利潤之和。因此,這種博弈就是前面我們所討論的超可加博弈。
19、 第二節(jié)第二節(jié) 核心與穩(wěn)定集核心與穩(wěn)定集 下面,我們將首先介紹個(gè)體理性和整體理性,然后再分別介紹合作博弈的兩個(gè)解法概念-核心和穩(wěn)定集核心和穩(wěn)定集。 一、個(gè)體理性和整體理性一、個(gè)體理性和整體理性 當(dāng)一個(gè)博弈具有超可加性,那么便只有組成總聯(lián)盟才能最優(yōu)化所有博弈者的總得益。在一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈中,我們可以用一個(gè)支付向量 來代表瓜分這總得益的方案,而這向量當(dāng)中的 則是博弈者 組成聯(lián)盟后所分得的支付(分配)。我們用 表示在這個(gè)支付向量中,每位博弈者所能獲得的支付的總和。),(21nixxxxx)(Nxixi 由于每位博弈者都是理性的,所以一個(gè)能為所有博弈 者接受的支付向量必定既符合聯(lián)盟的整體理性
20、,又符合每位參與聯(lián)盟的博弈者的個(gè)體理性,而一個(gè)同時(shí)符合整體理性和個(gè)體理性的支付向量則稱為一個(gè)分配分配或有效的分配有效的分配。下面我們對(duì)整體理性和個(gè)體理想給出如下定義: 定義定義2.1 在一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈中,支付向量是 符合整體理性的,當(dāng)且僅當(dāng),每位博弈者所分得的支付的總和等于總聯(lián)盟的價(jià)值,即: 由于所有博弈者的總支付實(shí)現(xiàn)了最優(yōu)化,因此,我們稱之為整體理性或整體最優(yōu)整體理性或整體最優(yōu)。),(21nxxxxniiNiiNvxxNx1)()( 定義定義2.2 在一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈 中,支付向量 是符合個(gè)體理性的,當(dāng)且僅當(dāng),每位博弈者所分得的支付都比各自為政時(shí)高,即在一個(gè)支付可轉(zhuǎn)移的
21、聯(lián)盟型博弈 中,支付向量 稱為一個(gè)分配或有效的分配,當(dāng)且僅當(dāng),它是符合個(gè)體理性和整體理性的。 定義定義2.3 一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈的分配集 定義為: 且對(duì)于 ,都有 。),(21nixxxxxvN,Niivxi),(),(21nixxxxx( )I v( )()()nI vxR x Nv NiN )( ivxivN, 二、核心二、核心 (Core)與穩(wěn)定集)與穩(wěn)定集 1. 核心的概念核心的概念 定義定義2.4 一個(gè)支付可轉(zhuǎn)移聯(lián)盟型博弈的核心 是一個(gè)集合,當(dāng)中包含所有能滿足以下兩個(gè)條件的支付向量:(1)(2)根據(jù)上述定義,核心不僅要滿足整體理性,還要滿足集合N中每個(gè)小聯(lián)盟S的“理性”。否則
22、,聯(lián)盟S的成員的整體支付便沒有進(jìn)行最優(yōu)化。也就是說,只要通過脫離總聯(lián)盟,然后成立新的聯(lián)盟S,那么新聯(lián)盟S的成員便能夠瓜分一個(gè)比他們的分配的總和大的聯(lián)盟價(jià)值。因此,核心是核心是一個(gè)不僅能滿足個(gè)體和整體理性,而且能滿足每個(gè)聯(lián)盟的一個(gè)不僅能滿足個(gè)體和整體理性,而且能滿足每個(gè)聯(lián)盟的“理性理性”的集合。的集合。)(vC)()(NvNxNSSvSx),()(2. 核心的應(yīng)用核心的應(yīng)用核心作為合作博弈其中一個(gè)最基本的解法,其應(yīng)用范圍也非常廣泛,以下是一個(gè)在現(xiàn)實(shí)經(jīng)濟(jì)方面的應(yīng)用例子。例子:三人社會(huì)合作我們用 代表這三人的集合,如果三人同心協(xié)力地合作,并組成一個(gè)單一聯(lián)盟,那么,他們便能把這個(gè)社會(huì)的總利益最優(yōu)化,并
23、通過協(xié)同效應(yīng)創(chuàng)造出30個(gè)單位的總得益。而如果只有其中二人合作并組成聯(lián)盟,而剩下的一人獨(dú)自為政,那么這二人也能創(chuàng)造出 個(gè)單位的利益。但 個(gè)單位的利益只供那二人分享,而3 , 2 , 1N)30,12(, 剩下的一位在獨(dú)自為政的情況下只能創(chuàng)造出6個(gè)單位的得益?,F(xiàn)在把以上的三人社會(huì)轉(zhuǎn)換為一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈: ;當(dāng) 其中, 則代表聯(lián)盟S的成員數(shù)目。由于這個(gè)博弈中共有三位博弈者,因而核心是一個(gè)由非負(fù)的支付向量 所組成的集合。在博弈中,核核心心要滿足整體理性,故此 ,同時(shí),核心又要滿足由一位或兩位博弈者所組成的小聯(lián)盟S的“理性”,故此: , 當(dāng) ;以及 ,當(dāng) 。)(2;, 6)(; 0)(SvSN
24、iivv時(shí),當(dāng)30)(,3NvS時(shí)S),(321xxx30)(Nx)(Sx2S6)(Sx1S當(dāng) ,核心便是由無數(shù)個(gè)支付向量所組成,即 也就是說,每位博弈者至少也可以獲得獨(dú)自為政時(shí)的支付,但最多只可以得到整體合作下和其中二人合作下的利益的差。當(dāng) ,核心便只包含一個(gè)支付向量(10,10,10),就是三人平分整體合作下的利益。 當(dāng) ,核心便是空的,也就是說,這個(gè)社會(huì)并不存在屬于核心的合作方案。20NiiiaNiaaaa12,24, 0),6 ,6 ,6(3212020 3、穩(wěn)定集、穩(wěn)定集(Stable Sets)的定義)的定義在一個(gè) 人博弈中,聯(lián)盟 對(duì)于一個(gè)任意的分配 是有效果的,當(dāng)且僅當(dāng),這個(gè)聯(lián)盟
25、的價(jià)值高于他們?cè)?分配下的支付的總和,即 。也就是說,如果聯(lián)盟 對(duì)于 分配是有效果的,那么分配 便是不穩(wěn)定的。有了 “ 有效果有效果”的概念,我們便可以介紹分配的占優(yōu),以下是它們的定義:定義定義2.5 在一個(gè)支付可轉(zhuǎn)移的聯(lián)盟性合作博弈中,分配x通過聯(lián)盟S 占優(yōu)分配y,當(dāng)且僅當(dāng): 且 , 當(dāng)嚴(yán)格不等式成立時(shí)稱分配x通過聯(lián)盟S嚴(yán)格占優(yōu)于分配y。 nNS xxSiixSv)(Sxx()()x Nv Niixv 定義定義2.6 支付可轉(zhuǎn)移的聯(lián)盟性合作博弈的解集符合內(nèi)內(nèi)部穩(wěn)定性部穩(wěn)定性,如果該集合內(nèi)的任何分配都不會(huì)通過聯(lián)盟S 占優(yōu)于該集合內(nèi)的其他分配。也就是說內(nèi)部穩(wěn)定性要求聯(lián)盟內(nèi)部的任意兩個(gè)分配不存在占
26、優(yōu)關(guān)系。 定義定義2.7 支付可轉(zhuǎn)移的聯(lián)盟性合作博弈的解集符合外外部穩(wěn)定性部穩(wěn)定性,如果對(duì)于集合外的任意分配,聯(lián)盟S都存在某配置占優(yōu)于該集合外的分配。 定義定義2.8 在支付可轉(zhuǎn)移的聯(lián)盟性合作博弈中,集合X稱為穩(wěn)定集穩(wěn)定集,當(dāng)且僅當(dāng)該集合既符合內(nèi)部穩(wěn)定性內(nèi)部穩(wěn)定性,也符合外部穩(wěn)定性外部穩(wěn)定性。 第三節(jié)第三節(jié) 夏普利值及其應(yīng)用夏普利值及其應(yīng)用 分配是合作博弈最重要的概念,但遺憾的是在一個(gè)博弈中,分配有無限個(gè),且許多根本就得不到執(zhí)行。 合作博弈最困難也最有挑戰(zhàn)性之處在于建立一個(gè)統(tǒng)一的“解”的概念,即從各種各樣不具有良好性質(zhì)的解中挑選唯一的分配或成本分配方案。不難看出,這幾乎是不可能也沒有必要的事情
27、。合作博弈與非合作博弈很大的不同合作博弈與非合作博弈很大的不同之處在于合作博弈沒有一個(gè)統(tǒng)一的解的概念,因?yàn)闆]有哪之處在于合作博弈沒有一個(gè)統(tǒng)一的解的概念,因?yàn)闆]有哪個(gè)解能夠符合所有人對(duì)個(gè)解能夠符合所有人對(duì)“公平公平”的理解。的理解。 根據(jù)前面的分析,我們知道博弈的核可能是空集,而且如果不是空集,核分配也很可能不唯一。隨著合作博弈論的發(fā)展,現(xiàn)在已經(jīng)有很多具有唯一解的概念,稱為值稱為值(Values),其中最重要的就是夏(沙)普利值。合作博弈在理論上的重要突破及其以后的發(fā)展在很大程度起源于夏普利(Shapley)提出的夏普利值的解的概念及其公理化刻畫。 Shapley值是一個(gè)很直觀的解解的概念,參與
28、人按照Shapley值進(jìn)行分配。 一、夏普利值一、夏普利值(Shapley Values)夏普利值是由夏普利提出的,最初只是應(yīng)用在支付可轉(zhuǎn)移的情況下,其后由夏普利擴(kuò)展到支付不可轉(zhuǎn)移的情況,這里我們只介紹支付可轉(zhuǎn)移的沙普利值。由于夏普利是建立在幾個(gè)公理上,因此,在介紹夏普利值之前,我們需要介紹一些定義。在夏普利的設(shè)定中,存在著一個(gè)包含所有博弈者的宇集U,而每個(gè)博弈中的所有博弈者集合N,都是宇集的子集,并稱為一個(gè)載形,以下是載形的定義: 定義定義3.1 在一個(gè)支付可轉(zhuǎn)移的聯(lián)盟型博弈,聯(lián)盟 稱為一個(gè)載形載形,當(dāng)且僅當(dāng),對(duì)于任何一個(gè)聯(lián)盟 ,都存在著以下的關(guān)系:根據(jù)定義3.1,一個(gè)載形包含了所有會(huì)對(duì)至少
29、一個(gè)聯(lián)盟作出貢獻(xiàn)的博弈者,也就是說,任何不屬于載形的博弈者都不會(huì)對(duì)任何聯(lián)盟作出貢獻(xiàn)。 定義定義3.2 博弈者i和j在博弈中是可互換的,當(dāng)對(duì)于所有包括博弈者 I 但不包含博弈者j的聯(lián)盟S,都存在著以下的關(guān)系: 根據(jù)定義3.2,博弈者i和j對(duì)于聯(lián)盟S的用處和貢獻(xiàn)都是完全一樣的。UN US )()(SNvSv )()(SvjiSv根據(jù)以上的定義,我們稱n維向量 為一個(gè)值值,這個(gè)值包含了n個(gè)實(shí)數(shù),分別代表著在博弈 中的n位博弈者所分得的支付。這個(gè)值可以理解為每位博弈者在博弈開始之前對(duì)自己所分得的支付的合理期望,而這個(gè)值必須滿足以下的三個(gè)公理: 公理公理1 如果集合N是一個(gè)載形,那么此公理又稱為效率公理
30、,要求的是整體理性。 公理公理2 如果博弈者i和j是可互換的,那么此公理又稱對(duì)稱公理,要求的是博弈者的名稱并不會(huì)對(duì)影響博弈起任何作用。 公理公理3 如果 和 是兩個(gè)博弈,那么),(21vvvvnvN,NiiNvv)(vvjiuN,vN,uvvuiii 此公理又稱集成定律,要求的是任何兩個(gè)獨(dú)立的博弈聯(lián)合在一起,那么所組成的新博弈的值是原來的兩個(gè)博弈的值的直接相加。根據(jù)上述的定理和公理,可以得到一個(gè)能滿足夏普利公理的函數(shù): 定理定理1(夏普利定理)函數(shù) 是唯一能夠滿足以上三個(gè)公理的函數(shù),這函數(shù)可以表達(dá)為: (2) 其中, (3) 則為聯(lián)盟S的成員數(shù)目,我們稱 為夏普利值。NSniiSvSvSv),
31、()()(Ni!)!()!1()(nSnSSnSv 在定理1中, 可以理解為博弈者 對(duì)聯(lián)盟S的邊際貢獻(xiàn),而 則是每個(gè)聯(lián)盟S的加權(quán)因子。)()(iSvSvNi)(Sn 對(duì)于 也可以作出這樣解釋: 加入 ,其貢獻(xiàn)是 。 ,加入 的概率是多少?如果 個(gè)局中人依次參加博弈,當(dāng) 加入該博弈時(shí),其前面已有一些參與人 , 加入后,后繼的參與人集合 。 和 中參與人的順序與 無關(guān)。 加入 的概率是 , 的數(shù)學(xué)期望(或者平均值)就是Shapley值。 注:Shapley值不一定是個(gè)分配,即理性約束 可能不滿足。 !(1)!SnSniiiiSSSS ()()v Siv Sin NSiS NSi ()( )v Si
32、v S!(1)!SnSn()( )v Siv S( )ivvi 二、夏普利值的應(yīng)用二、夏普利值的應(yīng)用夏普利值的用途廣泛,尤其常用于經(jīng)貿(mào)合作和政治科學(xué)。早在20世紀(jì)50年代,夏普利與蘇比克便利用夏普利值來計(jì)算聯(lián)合國安全理事會(huì)成員國的權(quán)力值,這亦是博弈論對(duì)于社會(huì)科學(xué)的一項(xiàng)最早應(yīng)用。在60年代,蘇比克把夏普利值應(yīng)用在會(huì)計(jì)學(xué)上,并指出夏普利值適用于計(jì)算一間公司的內(nèi)部成本調(diào)配,而博克亦把夏普利值應(yīng)用在保險(xiǎn)學(xué)上,并指出夏普利值能合理地計(jì)算所有類別的風(fēng)險(xiǎn)。 例例1 我國石油公司間競合利益分配我國石油公司間競合利益分配 近幾年來,我國石油對(duì)外依存度已超過50%的警戒線,經(jīng)濟(jì)發(fā)展對(duì)石油的依賴性明顯增強(qiáng)。我國石油
33、公司如何為我國經(jīng)濟(jì)發(fā)展保駕護(hù)航,針對(duì)石油行業(yè)是資金與風(fēng)險(xiǎn)密集型行業(yè)的特性,走與國內(nèi)石油公司、國外石油公司競合之路是石油公司戰(zhàn)略的必然選擇。從近幾年中石油、中石化、中海油的經(jīng)營策略看,也明顯呈現(xiàn)出這樣的特性。僅2009年,中海油與中石化已經(jīng)達(dá)成了華東、華南市場異地油源置換的協(xié)議;中石油與中石化將在塔里木盆地展開廣泛的合作;中石油與中海油聯(lián)手提出了收購其阿根廷子公司YPF的收購提議,都能說明我國各大石油公司間的關(guān) 系由原來單純的競爭走向競合。石油公司間要形成良好的合作關(guān)系,并能使該合作關(guān)系持續(xù)發(fā)展下去的基礎(chǔ)就是有一個(gè)良好的利益分配機(jī)制。博弈論中的合作博弈為這種利益分配提供了理論基礎(chǔ)。 設(shè)有三家石油
34、企業(yè)合作開發(fā)某油田區(qū)塊,如果單獨(dú)開發(fā)必然需要消耗大量的資金、技術(shù)、工具等有形或無形成本,相反,如果每家公司都能利用自己的優(yōu)勢(shì)進(jìn)行合作,則進(jìn)度更快、質(zhì)量更高而且取得的效益更大。針對(duì)石油項(xiàng)目開發(fā),利用我國西部某油田的基礎(chǔ)數(shù)據(jù),對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行簡化得出下列模擬數(shù)據(jù)。數(shù)據(jù)主要反映三家公司單獨(dú)開發(fā)、兩家合作開發(fā)或三家共同開發(fā)的收益,即三人合作博弈的特征函數(shù)值如下:,20)2(,15)1(, 0)(vvv 。試計(jì)算三家油田企業(yè)合作的利益分配。顯然,以上的博弈具有超可加性,因此,我們可以求取這博弈的夏普利值 。根據(jù)上述對(duì)沙普利值方法的介紹,我們可以首先計(jì)算出第1家石油企業(yè)對(duì)每個(gè)可能聯(lián)盟的平均邊際貢獻(xiàn)值:80)(,60)3 , 2(,50)3 , 1(,40)2 , 1(,25)3(Nvvvvvv 17.193/206/253/105)3 , 2()3 , 2 , 1(! 3)!33 ()!13 ()3 ()3 , 1(! 3)!23 ()!12()2()2 , 1(! 3)!23 ()!12()()1(! 3)!13 (
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/TS 15143-4:2025 EN Earth-moving machinery and mobile road construction machinery - Worksite data exchange - Part 4: Worksite topographical data
- 寒假安全教育主題班會(huì)方案8篇
- 形勢(shì)任務(wù)教育心得體會(huì)
- 開學(xué)典禮副校長講話稿15篇
- 招商引資差旅費(fèi)管理辦法
- 中國分布式光纖傳感器行業(yè)發(fā)展現(xiàn)狀及市場前景分析預(yù)測(cè)報(bào)告
- 湖南省溆浦一中普通高中學(xué)業(yè)水平考試模擬試卷語文試題(含答案)
- Massive MIMO系統(tǒng)低復(fù)雜度混合預(yù)編碼方法研究
- 2025版銷售經(jīng)理多元化市場拓展聘用合同模板3篇
- 志愿培訓(xùn)教材
- 《openEuler操作系統(tǒng)》考試復(fù)習(xí)題庫(含答案)
- 北師大版五年級(jí)上冊(cè)數(shù)學(xué)期末測(cè)試卷及答案共5套
- 2024-2025學(xué)年人教版生物八年級(jí)上冊(cè)期末綜合測(cè)試卷
- 2025年九省聯(lián)考新高考 語文試卷(含答案解析)
- 全過程工程咨詢投標(biāo)方案(技術(shù)方案)
- 心理健康教育學(xué)情分析報(bào)告
- 安宮牛黃丸的培訓(xùn)
- 婦科腫瘤護(hù)理新進(jìn)展Ppt
- 高三(10)班下學(xué)期家長會(huì)
- 中國酒文化 酒文化介紹 酒的禮俗 中國風(fēng)PPT模板
- 山西省原平市高鋁土實(shí)業(yè)有限公司鋁土礦資源開發(fā)利用、地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
評(píng)論
0/150
提交評(píng)論