第1講:博弈論基礎(chǔ)_第1頁
第1講:博弈論基礎(chǔ)_第2頁
第1講:博弈論基礎(chǔ)_第3頁
第1講:博弈論基礎(chǔ)_第4頁
第1講:博弈論基礎(chǔ)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第1講:博弈論基礎(chǔ)1博弈論強調(diào)經(jīng)濟主體之間的直接相互聯(lián)系和影響。 博弈論(Game Theory)是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題,因此也被稱為“對策論(Theory of Interactive Decision)”。這一理論最重要的特點是強調(diào)了經(jīng)濟主體之間的直接相互聯(lián)系和影響。(董保民等,(董保民等,2008,第第1頁)頁)2博弈?博弈? 博弈指的是一些人、團隊或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。3這個概念包含的意義非常豐富 博弈指的是博弈指的是一些

2、人、團隊或其他組織一些人、團隊或其他組織,面對,面對一定的環(huán)境條件,在一定的規(guī)則下,一定的環(huán)境條件,在一定的規(guī)則下,同時或同時或先后,一次或多次先后,一次或多次,從各自,從各自允許選擇的行為允許選擇的行為或策略中進行選擇或策略中進行選擇并加以實施,各自取得并加以實施,各自取得相相應(yīng)結(jié)果應(yīng)結(jié)果的過程。的過程。(謝識予,(謝識予,2008) 博弈發(fā)生在相互影響、相互作用的“一些人、團隊一些人、團隊或其他組織或其他組織”中間。 看到“相互影響、相互作用”,可以想到“系統(tǒng)”概念。4系統(tǒng)系統(tǒng)是由相互聯(lián)系、相互作用著的一些事物組成的總體。也可以概括地說,系統(tǒng)是由部分組成的總體。(王浣塵王浣塵,1986)5

3、博弈系統(tǒng)? 博弈發(fā)生在相互影響、相互作用的“一些人、一些人、團隊或其他組織團隊或其他組織”中間。 這些相互影響、相互作用的“一些人、團隊一些人、團隊或其他組織或其他組織”可以構(gòu)成一個系統(tǒng)。6Multiagent Systems Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations, by Yoav Shoham and Kevin Leyton-Brown; Cambridge University Press, 2009.7系統(tǒng)系統(tǒng)是由相互聯(lián)系、相互作用著的一些事物組成的總體。也可以概括地說,系統(tǒng)是由

4、關(guān)聯(lián)部分組成的總體。 顯然,構(gòu)成一般系統(tǒng)的要素就只有兩種:“部分”(parts)和“關(guān)聯(lián)”(interaction)。89系統(tǒng)環(huán)境部分關(guān)聯(lián)系統(tǒng)邊界系統(tǒng)的環(huán)境系統(tǒng)的“組成性”系統(tǒng)不是單一的一個質(zhì)點,也不是鐵板一塊的一個“整體”事物,而是由一些關(guān)聯(lián)的“部分”組成的一個總體。例如,把一個小組不看作為一個混同不可分的“事物”,而看作為一個系統(tǒng)時,就應(yīng)該看到組成這個小組的各個成員和他們各自的特點、能力、脾氣和愛好。總之,如果不看它們的組成部分,那么它們也就不成為系統(tǒng)。10博弈系統(tǒng)的組成性 博弈發(fā)生在相互影響、相互作用的“一些人、一些人、團隊或其他組織團隊或其他組織”中間。 這些相互影響、相互作用的“一些

5、人、團隊一些人、團隊或其他組織或其他組織”可以構(gòu)成一個系統(tǒng)。 也就是說,博弈系統(tǒng)的組成部分的集合就是“一些人、團隊或其他組織一些人、團隊或其他組織”。11系統(tǒng)的邊界 討論系統(tǒng)的“組成性”,必須弄清楚系統(tǒng)的“邊界”。 但是,明確系統(tǒng)的邊界不是一件容易的事情。 在博弈系統(tǒng)中,更是如此。12Classical Examples of Games (1)Prisoners Dilemma(囚徒困境囚徒困境) (2)Battle of the sexes(性別之爭博弈)(性別之爭博弈) (3)HawkDove game(鷹鴿博弈)(鷹鴿博弈) (4)Matching pennies(猜硬幣博弈)(猜硬幣

6、博弈) (5)Stag Hunt game(獵鹿博弈)(獵鹿博弈)13Prisoners Dilemma(囚徒困境) 警察抓住了兩個合伙犯罪的罪犯,但缺乏足夠的證據(jù)警察抓住了兩個合伙犯罪的罪犯,但缺乏足夠的證據(jù)指證他們所犯的罪行。如果其中至少有一個人供認犯指證他們所犯的罪行。如果其中至少有一個人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察罪,就能確認罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押以防止他們串供或結(jié)成攻守同將這兩名罪犯分別關(guān)押以防止他們串供或結(jié)成攻守同盟,并給他們同樣的選擇機會:盟,并給他們同樣的選擇機會:如果他們兩人都拒不認罪,則他們會被以較輕的妨礙公如果他們兩

7、人都拒不認罪,則他們會被以較輕的妨礙公務(wù)罪各判務(wù)罪各判1 1年徒刑;年徒刑;如果兩人中有一人坦白認罪,則坦白者從輕處理,立即如果兩人中有一人坦白認罪,則坦白者從輕處理,立即釋放,而另一人則將重判釋放,而另一人則將重判8 8年徒刑;年徒刑;如果兩人同時坦白認罪,則他們將被各判如果兩人同時坦白認罪,則他們將被各判5 5年監(jiān)禁。年監(jiān)禁。14Prisoners Dilemma(囚徒困境) 如果他們兩人都拒不認罪,則他們會被以較輕的妨礙公務(wù)罪如果他們兩人都拒不認罪,則他們會被以較輕的妨礙公務(wù)罪各判各判1 1年徒刑;年徒刑; 如果兩人中有一人坦白認罪,則坦白者從輕處理,立即釋放,如果兩人中有一人坦白認罪,

8、則坦白者從輕處理,立即釋放,而另一人則將重判而另一人則將重判8 8年徒刑;年徒刑; 如果兩人同時坦白認罪,則他們將被各判如果兩人同時坦白認罪,則他們將被各判5 5年監(jiān)禁。年監(jiān)禁。15囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1)戰(zhàn)略式表述(strategic form representation)擴展式表述(extensive form representation) 在博弈論里,一個博弈可以用兩種不同的方式來表達,一種是戰(zhàn)略式表述(strategic form representation),另一種是擴

9、展式表述(或譯為“展開式表述”)(extensive form representation)。盡管從理論上講,這兩種表述形式幾乎是完全等價的,但從分析的方便性的角度看,戰(zhàn)略式表述更適合于靜態(tài)博弈,而擴展式表述更適合于動態(tài)博弈。(張維迎,(張維迎,2012,第,第31頁)頁)16Agent/Player(博弈方博弈方) 明確博弈系統(tǒng)的邊界,界定博弈的參與人。17Agent/Player(博弈方博弈方) 博弈中獨立決策、獨立承擔博弈結(jié)果的個人或組織。博弈中獨立決策、獨立承擔博弈結(jié)果的個人或組織。為簡單計,將博弈中的每個獨立決策參加者稱為為簡單計,將博弈中的每個獨立決策參加者稱為“博弈方博弈方”。

10、 例:例:“囚徒困境囚徒困境”中的兩個犯罪嫌疑人是中的兩個犯罪嫌疑人是“博弈博弈方方”,但制定規(guī)則、自身不參與決策活動的警察不,但制定規(guī)則、自身不參與決策活動的警察不是是“博弈方博弈方”。18囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1) Agents involved in games are referred to as players. If all agents have optimal actions regardless of what the others do, as in purely p

11、arametric situations or conditions of monopoly or perfect, we can model this without appeal to game theory; otherwise, we need it.19囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1)Basic Elements of Games (1)Agent/Player(博弈方博弈方) (2)Strategies/ Actions (3) Orders(次序)(次序) (4)Utility/

12、Payoffs(效用(效用/得益)得益)20(1)Agent/Player(博弈方博弈方) 博弈中獨立決策、獨立承擔博弈結(jié)果的個人或組織。博弈中獨立決策、獨立承擔博弈結(jié)果的個人或組織。為簡單計,將博弈中的每個獨立決策參加者稱為為簡單計,將博弈中的每個獨立決策參加者稱為“博博弈方弈方”。 例:例:“囚徒困境囚徒困境”中的兩個犯罪嫌疑人是中的兩個犯罪嫌疑人是“博弈方博弈方”,但制定規(guī),但制定規(guī)則、自身不參與決策活動的警察不是則、自身不參與決策活動的警察不是“博弈方博弈方”。21囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1

13、1,1 1)(2)Strategies/ Actions 各博弈方的可選策略(各博弈方的可選策略(StrategiesStrategies)或行為()或行為(ActionsActions)的集合。的集合。 每個博弈方在進行決策時,可以選擇的方法、做法或經(jīng)濟活動每個博弈方在進行決策時,可以選擇的方法、做法或經(jīng)濟活動的水平、量值等。的水平、量值等。 “囚徒困境囚徒困境”問題中的每個博弈方(犯罪嫌疑人)的可選策略問題中的每個博弈方(犯罪嫌疑人)的可選策略集合均為坦白,抵賴。集合均為坦白,抵賴。22囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8

14、8,0 0)(1 1,1 1)(2)Strategies/ Actions Each player in a game faces a choice among two or more possible strategies. A strategy is a predetermined “programme of play” that tells her what actions to take in response to every possible strategy other players might use. 23囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5

15、5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1) 在博弈論中,給出各博弈方可以選擇的全部策略或策略選擇的范圍(也稱“策略空策略空間間”),是定義一個博弈時需要確定的最重要的基本方面之一。24 根據(jù)所研究問題的內(nèi)容和性質(zhì),不同博弈中各博弈方可選策略的數(shù)量有多有少,差異還可能會非常大。25囚徒困境(囚徒困境(The Prisoners Dilemma)26囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1)Matching pennies(猜硬幣博弈猜硬幣博弈)DifferentHeadTailSa

16、meHead(1,-1)(-1,1)Tail(-1,1)(1,-1)27(2)Strategies/ Actions Each player in a game faces a choice among two or more possible strategies. A strategy is a predetermined “programme of play” that tells her what actions to take in response to every possible strategy other players might use. 28囚徒囚徒2 2坦白坦白抵賴

17、抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1)古諾模型古諾模型(The Cournot model)當市場出清價格是投放到市場上產(chǎn)品數(shù)量的減當市場出清價格是投放到市場上產(chǎn)品數(shù)量的減函數(shù)時,假設(shè)銷售相同產(chǎn)品的函數(shù)時,假設(shè)銷售相同產(chǎn)品的 n 個廠商(寡個廠商(寡頭)可自由選擇自己有能力生產(chǎn)的任何產(chǎn)量,頭)可自由選擇自己有能力生產(chǎn)的任何產(chǎn)量,廠商之間既不存在相互的協(xié)商,也不受相互的廠商之間既不存在相互的協(xié)商,也不受相互的制約,并且他們是在同一時間決定生產(chǎn)的產(chǎn)量。制約,并且他們是在同一時間決定生產(chǎn)的產(chǎn)量。那么,這那么,這 n 個廠商(寡頭)

18、該如何選擇自己個廠商(寡頭)該如何選擇自己的產(chǎn)量決策呢?的產(chǎn)量決策呢?29“純策略”vs.“混合策略”純策略(純策略(pure strategypure strategy)“囚徒困境囚徒困境”問題中的每個博弈方(犯罪嫌疑人)的可選問題中的每個博弈方(犯罪嫌疑人)的可選策略集合均為坦白,抵賴。策略集合均為坦白,抵賴。混合策略(混合策略(mixed strategymixed strategy)在在“囚徒困境囚徒困境”問題中,假設(shè)每個博弈方(犯罪嫌疑人)問題中,假設(shè)每個博弈方(犯罪嫌疑人)選擇策略選擇策略“坦白坦白”的概率為的概率為 p p,選擇策略,選擇策略“抵賴抵賴”的概率的概率為為q q。那

19、么,我們可以將每個博弈方(犯罪嫌疑人)的策略表示那么,我們可以將每個博弈方(犯罪嫌疑人)的策略表示為(為(p p,q q)。)。(p p,q q)表示博弈方以一定的概率分布在可選策略集合中)表示博弈方以一定的概率分布在可選策略集合中隨機選擇隨機選擇。30“純策略”vs.“混合策略”純策略(純策略(pure strategypure strategy)在在“囚徒困境囚徒困境”問題中,每個博弈方(犯罪嫌疑人)問題中,每個博弈方(犯罪嫌疑人)的可選的可選純策略純策略為為 “ “坦白坦白”或者或者“抵賴抵賴”?;旌喜呗裕ɑ旌喜呗裕╩ixed strategymixed strategy)在在“囚徒困境

20、囚徒困境”問題中,假設(shè)每個博弈方(犯罪嫌問題中,假設(shè)每個博弈方(犯罪嫌疑人)的疑人)的混合策略混合策略為(為(p p,q q)。)。31“純策略”vs.“混合策略” 純策略是混合策略的特例。 混合策略是純策略的擴展。 在在“囚徒困境囚徒困境”問題中,純策略問題中,純策略 “ “坦白坦白”可表示可表示為(為(1,01,0),純策略),純策略 “ “抵賴抵賴”可表示為(可表示為(0,10,1)。)。32“純策略”vs.“混合策略” 如果給一個博弈的每個博弈方的純策略空間賦予不同的概率分布,就形成了不同的混合策略。 構(gòu)成各個博弈方混合策略的概率分布是連續(xù)的,可以取無限多組值,因此混合策略的數(shù)量肯定是

21、無限多的。 所有這些混合策略構(gòu)成了一個混合策略的空間。33“純策略”vs.“混合策略” 把博弈方的策略從純策略擴展到混合策略,把策略空間從純策略空間擴展到混合策略空間,對于博弈的分析具有重要的意義。34 博弈指的是博弈指的是一些人、團隊或其他組織一些人、團隊或其他組織,面對,面對一定的環(huán)境條件,在一定的規(guī)則下,一定的環(huán)境條件,在一定的規(guī)則下,同時或同時或先后,一次或多次先后,一次或多次,從各自,從各自允許選擇的行為允許選擇的行為或策略中進行選擇或策略中進行選擇并加以實施,各自取得并加以實施,各自取得相相應(yīng)結(jié)果應(yīng)結(jié)果的過程。的過程。 博弈方有“允許選擇的行為或策略中進行選擇允許選擇的行為或策略中

22、進行選擇”。 博弈方將會“取得取得相應(yīng)結(jié)果相應(yīng)結(jié)果”。35Basic Elements of a Game (1)Agent/Player(博弈方博弈方) (2)Strategies/ Actions (3) Orders(次序)(次序) (4)Utility/Payoffs(效用(效用/得益)得益)36(4)UTILITY/PAYOFFS(效用(效用/得益得益) 博弈方的效用博弈方的效用/得益(得益(Utility/Payoffs)。)。 各博弈方從博弈中所獲得的利益,它是各博各博弈方從博弈中所獲得的利益,它是各博弈方追求的根本目標,也是各博弈方行為和弈方追求的根本目標,也是各博弈方行為和判

23、斷的主要依據(jù)。判斷的主要依據(jù)。37“囚徒困境囚徒困境”問題中的得益矩陣問題中的得益矩陣38囚徒囚徒2 2坦白坦白抵賴抵賴囚徒囚徒1 1坦白坦白 (5 5,5 5)(0 0,8 8)抵賴抵賴(8 8,0 0)(1 1,1 1)Basic Elements of a Game (1)Agent/Player(博弈方博弈方) (2)Strategies/ Actions (3) Orders(次序)(次序) (4)Utility/Payoffs(效用(效用/得益)得益)39 博弈論的基本概念包括參與人、行動、信息、戰(zhàn)略、支付(效用)、結(jié)果和均衡,其中,參與人、戰(zhàn)略和支付是描述一個博弈所需要的最少的要素,而行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論