博弈論知識(shí)考點(diǎn)_第1頁(yè)
博弈論知識(shí)考點(diǎn)_第2頁(yè)
博弈論知識(shí)考點(diǎn)_第3頁(yè)
博弈論知識(shí)考點(diǎn)_第4頁(yè)
博弈論知識(shí)考點(diǎn)_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈是人們的行為之間的交互作用 博弈論的含義博弈論是研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動(dòng)的科學(xué)。策略性環(huán)境是指,每一個(gè)人進(jìn)行的決策和采取的行動(dòng)都會(huì)對(duì)其他人產(chǎn)生影響;策略性決策和策略性行動(dòng)是指,每個(gè)人要根據(jù)其他人的可能反應(yīng)來(lái)決定自己的決策和行動(dòng)。在所有社會(huì),人們經(jīng)?;?dòng)。有時(shí),互動(dòng)是合作,其他的時(shí)候,互動(dòng)是競(jìng)爭(zhēng)。在這兩種情況下,都可以用一個(gè)術(shù)語(yǔ),即相互依賴性來(lái)表示一個(gè)人的行為對(duì)另外一個(gè)人的福利造成的影響。 相互依賴的情形可稱為策略環(huán)境。因?yàn)槿藗優(yōu)榱舜_定所采取的最優(yōu)行動(dòng),必須考慮他周圍的其他人會(huì)怎樣 選擇行動(dòng)。策略對(duì)于社會(huì)的運(yùn)行來(lái)說(shuō),是非?;镜?。我們要學(xué)會(huì)了解在策略環(huán)境下,人們實(shí)

2、際上是如何采取行動(dòng)的,以及他們應(yīng)該怎樣采取行動(dòng)。這種系統(tǒng)的研究形成了策略互動(dòng)的理論。博弈論三要素:博弈的三個(gè)基本要素三個(gè)基本要素,即參與人、參與人的策略和參與人的支付。所謂參與人(或稱局中人),就是在博弈中進(jìn)行決策的個(gè)體;所謂參與人的策略,指的是一項(xiàng)規(guī)則,根據(jù)該規(guī)則,參與人在博弈的每一時(shí)點(diǎn)上選擇如何行動(dòng);所謂參與人的支付是指,在所有參與人都選擇了各自的策略且博弈已經(jīng)完成之后,參與人獲得的效用(或期望效用)。3.博弈的簡(jiǎn)單分類根據(jù)參與人的數(shù)量,可以分為二人博弈和多人博弈;根據(jù)參與人的支付情況,可分為零和博弈和非零 和博弈;根據(jù)參與人擁有的策略的數(shù)量多少,可分為有限博弈和無(wú)限博弈;根據(jù)參與人在實(shí)施

3、策略上是否 有時(shí)間的先后,可分為同時(shí)博弈和序貫博弈。一些概念:局中人或參與者(Players )規(guī)則(rules ):規(guī)定博弈各方的行動(dòng)順序、方式、以及最終的結(jié)果等。策略(Strategy ):一整套的行動(dòng)方案, 規(guī)定了各種情況下的行動(dòng)。比如:敵進(jìn)我退,敵退我追,敵駐我擾,敵疲我打。相機(jī)策略(contingent strategy):僅在不確定事件發(fā)生時(shí)才會(huì)采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。行動(dòng):局中人在特定條件下的行為支付(Pay-off ):博弈結(jié)束時(shí),各方得到的收益。策略均衡:參與者之間穩(wěn)定的、可預(yù)測(cè)的互動(dòng)行為模式,就是策略均衡。上策均衡與納什均衡上策均衡:我所做的

4、是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的所謂上策,是指這樣一種策略,即不管對(duì)手采取什么策略,這種策略都是最優(yōu)的。而當(dāng)對(duì)局者選擇的都是上策的時(shí)候,這種均衡叫做上策均衡。NAS陽(yáng)衡:我所做的是給定你所做的我所能做的最好的你所做的是給定我所做的你所能做的最好的納什均衡是指在對(duì)手策略既定的情況下,各自對(duì)局者所選擇的策略都是最好的。在一個(gè)納什均衡里,任何一個(gè)參與者都不會(huì)改變自己的策略,如果其他參與者不改變策略。上策均衡與納什均衡的區(qū)別:(1)上策均衡是指不管你選擇什么策略,我所選擇的是最好的;不管我選擇什么策略,你所選擇的是最好 的。 納什均衡是指給定你的策略,我所選擇的是最

5、好的;給定我的策略,你所選擇的是最好的。上策均衡是納什均衡的一種特殊情況,但納什均衡卻不一定是上策均衡。求純策略博弈的納什均衡街解的方法混合策略均衡的情侶博弈,根據(jù)支付矩陣計(jì)算出博弈雙方的期望得益分析該博弈的納什均衡的概率分布尋找混合策略納什均衡的思路令各博弈方隨機(jī)選擇純策略的概率分布,滿足使其他博弈方采用不同策略的期望得益相同,從而計(jì)算出各個(gè)博弈方隨機(jī)選擇各純策略的概率。在猜硬幣博弈中,設(shè)蓋硬幣方出正面的概率為 p,出反面的概率為1-p。則猜硬幣方猜正面的期望得益為p -1+(1-p) (-1)=2p-1 ,猜反面的期望得益是 p - (-1)+(1-p)- 1=1-2p,令二者相等,得p=

6、1/2。蓋硬幣方的混合策略是以(1/2,1/2 )的概率隨機(jī)選擇正面和反面。類似的,可以計(jì)算出猜硬幣方的混合策略。 ,期望支付運(yùn)用兩個(gè)參與人的混合策略組合,可以分別表示出兩個(gè)參與人得到的支付。Ea = p1q1A1 + p 1(1 - q1)A12 + (1 - p)qA1 + (1 - p1)(1 -q1)A22-p1q1(A1 -A21)(1 - q1)(A2一A22)q1(A21-A22)A=p A q3 - %)A>2其中,M =q/A1 A1) +(1 qJ(A2 A2)是A勺判別式Eb = pfliE + p1(1 - q002 + (1 - R) q' + (1 -

7、 p)(1-4)民2=plq - B21) (1 -q)( B2 - 一媒艮1 - 民2)B.2= pB q<B21 -B22)%其中,;b = 8B1 -&)(1 -q)(B12 - %)是B勺判別式博弈樹1 .博弈樹的起點(diǎn)“起點(diǎn)”又叫做“初始決策點(diǎn)”,通常只有一個(gè)。起點(diǎn)是博弈樹的“根”,是序貫博弈開始的地方, 是博弈的最先行動(dòng)者進(jìn)行決策的地方。2 .博弈樹的線段從初始決策點(diǎn)出發(fā),向右伸展兩條線段,分別表示競(jìng)爭(zhēng)者可以采取的兩個(gè)行動(dòng)或策略。3 .博弈樹的中間點(diǎn)中間點(diǎn)又叫做“中間決策點(diǎn)”,通常至少應(yīng)有兩個(gè)。通常在這些中間決策點(diǎn)的旁邊標(biāo)上另一參與人,表示中間點(diǎn)是另一參與人做決策的地方

8、。博弈樹的終點(diǎn)第一,終點(diǎn)不是決策點(diǎn)終點(diǎn)是博弈結(jié)束的地方。與起點(diǎn)和中間點(diǎn)不同,終點(diǎn)不是決策點(diǎn):既不是初始決策點(diǎn),也不是中間決策點(diǎn)。因此,終點(diǎn)不屬于任何的參與人,終點(diǎn)的旁邊沒(méi)有標(biāo)注任何的參與人。第二,終點(diǎn)的兩層含義一是代表博弈的一個(gè)策略組合一一從起點(diǎn)開始導(dǎo)向某個(gè)終點(diǎn)的所有線段按先后秩序排列的一個(gè)組二是代表與某一個(gè)策略組合相對(duì)應(yīng)的一個(gè)支付組合一一在每一個(gè)終點(diǎn)的旁邊,有一對(duì)用圓括號(hào)圍 住的數(shù)字,其中的第一個(gè)數(shù)字是先行動(dòng)者的支付,第二個(gè)數(shù)字是后行動(dòng)者的支付。逆向歸納法求解子博弈的精煉納什均衡解逆向歸納法的兩個(gè)步驟第一步,先從博弈的最后階段的每一個(gè)決策點(diǎn)開始,確定相應(yīng)參與人此時(shí)所選擇的策略,并把參與人 所

9、放棄的其他策略刪除,從而得到原博弈的一個(gè)簡(jiǎn)化博弈;第二步,再對(duì)簡(jiǎn)化博弈重復(fù)步驟一的程序,直到最后,得到原博弈的一個(gè)最簡(jiǎn)博弈。這個(gè)最簡(jiǎn)博弈, 就是原博弈的解。簡(jiǎn)化之后舉例情侶博弈足身足球女足球足球世普芭蕾 (0,0)足球足理 ( 1+芭蓿女方的選擇完全由男方的選擇所決定:男(足)-女(足);男(芭)-女(芭)男方的最優(yōu)策略是選足球,女也選足球,即最優(yōu)策略組合為(足球,足球) 逆向歸納策略總是納什均衡,納什均衡不一定是逆向歸納均衡。先動(dòng)優(yōu)勢(shì)從情侶博弈的例子中可以看到所謂的“先動(dòng)優(yōu)勢(shì)”一一先行動(dòng)者的得益大于后行動(dòng)者的得益。如男方先動(dòng),逆向歸納的結(jié)果就是對(duì)男方更有利的納什均衡(足球,足球);如改為女方

10、先動(dòng),則逆 向歸納的結(jié)果就是對(duì)女方更有利的納什均衡(芭蕾,芭蕾)。足球芭蕾足球(0. 0)足球也簫(2,1) 該混合策略納什均衡給麗娟帶來(lái)的期望得益是:帶斷者睿匕一dI h 4 J血競(jìng)爭(zhēng)者 網(wǎng)gJ-CO. 5)/壟斷者抵抗co, n裝斷背容忍一一d進(jìn)入b抵抗y.2)競(jìng)爭(zhēng)并“不進(jìn)入、c容想.一一If %5抵疣一to*3 )(1-p)?0 ?1+p?0 ?0+(1-p) ? (1-0 ) ? (-1) +p?(1- 0 ) ?2=0.5 給大海帶來(lái)的期望得益是:(1-p)?0 ?2+p?0 ?0+(1-p) ? (1-0 ) ? (-1) +p?(1- 0 ) ?1=0.5麗娟 p為麗娟選擇芭蕾的

11、概率足芭蕾2, 10, 0-1,-11,2逆向遞歸法邏輯基礎(chǔ):動(dòng)態(tài)博弈中先行動(dòng)的博弈方,在前面階段選擇行為時(shí)必然會(huì)考慮后行為博弈方在后面階段的選 擇,只有在博弈最后一個(gè)階段選擇的博弈方才能直接作出明確選擇。而當(dāng)后面階段博弈方的選擇確定后, 前一階段博弈方的行為也就容易確定了。一般方法:從動(dòng)態(tài)博弈的最后一個(gè)階段開始分析,每一次確定出所分析階段博弈方的選擇和路徑,然后再 確定前一個(gè)階段博弈方的選擇和路徑,逐步向前逆推以求解出動(dòng)態(tài)博弈均衡。子博弈定義:由一個(gè)單結(jié)信息集開始的與所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成的能自成一個(gè)博弈的原博弈 的一部分。仿冒 不制止X不住冒:(0,10)仿冒心不仿&quo

12、t;仿冒與反仿冒博弈B受:x5:制方/ 不制因他切子博弈精煉納什均衡定義:如果在一個(gè)完全信息動(dòng)態(tài)博弈中,各博弈方的策略構(gòu)成的一個(gè)策略組合滿足,在整個(gè)博弈及它的所 有子博弈中都構(gòu)成納什均衡,那么這個(gè)策略組合稱為該動(dòng)態(tài)博弈的一個(gè)子博弈精煉納什均衡?;脽羝?6以法律保障不足的開金礦博弈為例策略組合“乙在第一階段選擇借,第三階段選擇打;甲在第二階段選擇分",即(借, 打),(分),雖然是整個(gè)博弈的一個(gè)納什均衡,但這個(gè)策略組合中乙的策略要求乙在第三階段的 子博弈中選擇的“打”,不是該子博弈的一個(gè)納什均衡,因此這個(gè)策略組合不是子博弈精煉納什均衡。 而策略組合(不借,不打),(不分)則是該博弈的子

13、博弈精煉納什均衡。因?yàn)樵摬呗越M合的雙 方策略不僅在整個(gè)博弈中構(gòu)成納什均衡,而且在兩級(jí)子博弈中也都構(gòu)成納什均衡(從而不存在任何不 可信的威脅或承諾)。注意:當(dāng)博弈方按上述子博弈精煉納什均衡策略組合行動(dòng)時(shí),實(shí)際上不會(huì)進(jìn)行到博弈的第二、三階段,兩博弈方在第二、三階段的行為實(shí)際上不會(huì)發(fā)生。但作為完整策略的表達(dá),在描述子博弈精煉納什均 衡的策略選擇時(shí),必須將其給出。幻燈片28三、子博弈精煉納什均衡求解方法逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)便方法。完全信息動(dòng)態(tài)博弈的每一個(gè)決策結(jié)都是一個(gè)單獨(dú)的信息集,每一個(gè)決策結(jié)都開始一個(gè)子博弈。這樣, 可以從最后一個(gè)子博弈開始(即從最后一個(gè)決策結(jié)開始)逆推上去,求解子博弈精煉納什均衡。幻燈片30四、承諾行動(dòng)與子博弈精煉納什均衡前面已知,有些納什均衡之所以不是精煉均衡,是因?yàn)樗鼈儼瞬豢尚磐{。這也意味著,如果參 與人能在博弈之前采取某種措施改變自己的行動(dòng)空間或支付函數(shù),原來(lái)不可信的威脅就可能變得可 信,博弈的均衡就會(huì)相應(yīng)改變。將這些為改變博弈結(jié)果而采取的措施稱為“承諾行動(dòng)”。在許多情況下,承諾行動(dòng)對(duì)當(dāng)事人是很有價(jià)值的。特別的,有時(shí)一個(gè)參與人通過(guò)減少自己的選擇機(jī)會(huì) 使自己受益,原因在于保證自己不選

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論