進化博弈基本動態(tài)理論_第1頁
進化博弈基本動態(tài)理論_第2頁
進化博弈基本動態(tài)理論_第3頁
進化博弈基本動態(tài)理論_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、進化博弈基本動態(tài)理論         內(nèi)容包括 進化穩(wěn)定策略 模仿者動態(tài) 隨機穩(wěn)定均衡 進化 進化博弈 博弈        摘要;本文主要介紹進化博弈理論的基本動態(tài)模型:對稱博弈模仿者動態(tài)模型和非對稱博弈模仿者動態(tài)模型及其相關(guān)結(jié)論。為了便于理解,在文中引用了一些簡單的例子說明它們之間的區(qū)別與聯(lián)系。在此基礎(chǔ)上文中還介紹了理論家們對隨機動態(tài)所進行的相關(guān)研究及其所取得的理論成果。最后本文比較了經(jīng)典博弈理論 與進化博弈理論在動態(tài)概念上的差別。關(guān)

2、鍵詞:進化穩(wěn)定策略;模仿者動態(tài);隨機穩(wěn)定均衡;進化博弈理論至少自Lewontin(1960)用于解釋生態(tài)現(xiàn)象就已經(jīng)產(chǎn)生了,并被廣泛應(yīng)用于生態(tài)學、學及學等領(lǐng)域來研究群體行為的演化過程及其結(jié)果。進化博弈理論從有限理性的個體出發(fā),以群體為研究對象,認為現(xiàn)實中個體并不是行為最優(yōu)化者,個體的決策是通過個體之間模仿、學習和突變等動態(tài)過程來實現(xiàn)的。進化博弈理論強調(diào)系統(tǒng)達到均衡的動態(tài)調(diào)整過程,認為系統(tǒng)的均衡是達到均衡過程的函數(shù),也就說均衡依賴于達到均衡的路徑。動態(tài)概念在進化博弈理論中占有相當重要的地位,許多博弈理論家對群體行為調(diào)整過程進行了廣泛而深入的研究,根據(jù)他們考慮問題的角度不同而提出了不同的動態(tài)模型,如

3、Weibull(1995) 提出的模仿動態(tài)(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的強化動態(tài) (Reinforcement Dynamics)模型等等。但到目前為止,在進化博弈理論中應(yīng)用最多的還是由Taylor and Jonker(1978)提出的模仿者動態(tài)(Replicator Dynamics)模型。模仿者動態(tài)是進化博弈理論的基本動態(tài),它能較好地描繪出有限理性個體的群體行為變化趨勢,由之得出的結(jié)論能夠比較準確地預(yù)測個體的群體行為,因而倍受博弈論理論家們的重視。本文集中介紹確定性模仿者動態(tài)概念、模型及其與經(jīng)典博弈

4、動態(tài)概念的區(qū)別。一、確定性模仿者動態(tài);一般的進化過程都包括兩個可能的行為演化機制:選擇機制(Selection Mechanism)和突變機制(Mutation mechanism)。選擇機制是指本期中能夠獲得較高支付的策略,在下期被更多參與者選擇;突變是指參與者以隨機(無目的性)的方式選擇策略,因此突變策略可能獲得較高支付也可能獲得較低支付,突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇,并且只有獲得較高支付的策略才能生存(Survive)下來。按所研究的群體數(shù)目不同,進化博弈動態(tài)模型可分為兩大類:單群體(Monomorphic Population)動態(tài)模型與多群體(Polymorphic Po

5、pulations)動態(tài)模型。單群體動態(tài)模型是指所考察的對象只含有一個群體,并且群體中個體都有相同的純策略集,個體與虛擬的參與人 進行對稱博弈。多群體動態(tài)模型 是指所考察的對象中含有多個群體,不同群體個體可能有不同的純策略集,不同群體個體之間進行的是非對稱博弈。博弈中個體選擇純策略所得的支付不僅隨其所在群體的狀態(tài)變化而變化,而且也隨其他群體狀態(tài)的變化而變化。下面重點介紹單群體與多群體動態(tài)模仿者動態(tài)模型。;1.1、單群體確定性模仿者動態(tài)模型;單群體模仿者動態(tài)模型是由Taylor and Jonker (1978)在考察生態(tài)演化現(xiàn)象時首次提出的。他們把一個生態(tài)中所有的種群看作為一個大群體,而把群體

6、中每個種群都想象或程式化為一個特定的純策略。群體在不同時刻所處的狀態(tài)一般用混合策略來表示。所謂模仿者動態(tài)是指使用某一純策略的人數(shù)所占比例的增長率等于使用該策略時所得支付 與群體平均支付之差,或者與平均支付成正比例。為了說明的方便,本文首先給出一些符號,然后給出Taylor and Jonker (1978)模仿者動態(tài)公式的推導(dǎo)過程。;假定群體中每一個個體在任何時候只選擇一個純策略,比如,第j個個體在某時刻選擇純策略(當然由于突變或策略轉(zhuǎn)移,同一個體在不同時刻可以選擇不同的純策略)。表示群體中各個體可供選擇的純策略集;N表示群體中個體總數(shù);表示在時刻t選擇純策略i的個體數(shù)。表示群體在時刻t所處的

7、狀態(tài),其中表示在該時刻選擇純策略i的人數(shù)在群體中所占的比例,即。表示群體中個體進行隨機配對匿名博弈時,群體中選擇純策略的個體所得的期望支付。表示群體平均期望支付。;下面給出連續(xù)時間模仿者動態(tài)公式,此時動態(tài)系統(tǒng)的演化過程可以用微分方程來表示。在對稱博弈中每一個個體都認為其對手來自于狀態(tài)為x 的群體。事實上,每個個體所面的對手是代表群體狀態(tài)的虛擬個體 。假定選擇純策略的個體數(shù)的增長率等于,那么可以得到如下的等式:由定義可知,兩邊對t微分可以 :兩邊同時除以N得到: ;上式就是對稱博弈模型中模仿者動態(tài)公式的微分形式??梢钥闯?,如果一個選擇純策略的個體得到的支付少于群體平均支付,那么選擇純策略的個體在

8、群體中所占比例將會隨著時間的演化而不斷減少;如果一個選擇策略的個體得到的支付多于群體平均支付,那么選擇策略的個體在群體中所占比例將會隨著時間的演化而不斷地增加;如果個體選擇純策略所得的支付恰好等群體平均支付,則選擇該純策略的個體在群體中所占比例不變。;從上面的公式推導(dǎo)過程可以看出,Taylor and Jonker提出的模仿者動態(tài)僅僅考慮到純策略的繼承性,而沒有考慮到混合策略的可繼承性。Bomze(1986)證明了如果允許混合策略也可以被繼承,那么在模仿者動態(tài)下,進化穩(wěn)定策略 等價于漸近穩(wěn)定性。另外,下面不加證明 地給出Hofbauer et al. (1979); Zeeman (1980)

9、提出并證明的一個命題,“在模仿者動態(tài)下,對稱博弈中每一個ESS都是漸近穩(wěn)定的”。這個命題的逆命題并不成立,下面用Fudenberg(1995)的一個反例來給予說明,考察表矩陣所示的對稱博弈:;該博弈有唯一對稱的納什均衡 (),且均衡時的期望支付為。這個均衡并不是進化穩(wěn)定均衡,因為它能夠被策略侵入;又因為在平衡點處雅可比行列式的特征根是和,該均衡狀態(tài)是動態(tài)系統(tǒng)的匯 (Sink),因此均衡是漸近穩(wěn)定的,所以對稱博弈的漸近穩(wěn)定均衡并不一定是進化穩(wěn)定均衡。;從模擬者動態(tài)方程可以看出,支付函數(shù)的正向變換或者位移變換只改變?nèi)后w演化速度而不影響群體演化路徑。因而,在進行分析時,可以對支付矩陣進行必要的簡化處

10、理。;另外,由此還可以求出的兩個種群相對增長率:;上式說明:個體博弈時,獲得相對較多支付的群體則具有更高的增長率。;1.2、多群體模仿者動態(tài)模型;Selten(1980)引入角色限制行為(Role Conditioned Behavior)而把群體分為單群體與多群體,不同群體根據(jù)個體可供選擇的純策略集不同來劃分。多群體時,不同群體中的個體有不同純策略集、不同群體平均支付及不同群體演化速度。因而,多群體模仿者動態(tài)公式推導(dǎo)比較復(fù)雜,下面給出多群體模仿者動態(tài)方程(參閱文獻24):;其中,上標j表示第j個群體,其中K表示有K個群體;表示第j個群體中選擇第個純策略的個體數(shù)占該群體總數(shù)的百分比;表示群體j在某時刻所處的狀態(tài),表示第j個群體以外的其他群體在t時刻所處的狀態(tài);表示群體j中個體行為集中的第i個純策略;x表示混合群體的混合策略組合,表示混合群體狀態(tài)為x時群體j中個體選擇純策略時所能得到的期望支付;表示混合群體的平均支付。;多群體模型并不是對單群體模型的簡單改進,由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進化穩(wěn)定均衡都是嚴格納

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論