博弈論精要+(童話版)_第1頁
博弈論精要+(童話版)_第2頁
博弈論精要+(童話版)_第3頁
博弈論精要+(童話版)_第4頁
博弈論精要+(童話版)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博弈論精要 (童話版) 這篇寓言的作者把博弈論的一些基本的理論要素表現(xiàn)在這篇精悍的德文章中 寫得的確非常精妙,大家不妨耐心品位以下, 那螞蟻一直在旁邊袖手微笑,待到此時,方才向狐貍說道:“狐兄豪氣干云,小弟十分 敬佩,倒想領(lǐng)略一番。” 狐貍笑道:“不知蟻兄是要下里巴人還是要陽春白雪?” 螞蟻奇道:“下里巴人又如何?陽春白雪又如何?” 狐貍緩緩說道:“下里巴人,至俗也,便是那鄉(xiāng)間七旬老母,猶能聽得手舞足蹈,擊節(jié) 而歌。卻可惜譬如那山溪之水,來勢洶洶,去也匆匆,入骨不過三分矣。” “那陽春白雪,又當(dāng)如何?” 狐貍道:“夫陽春白雪也,一望無垠,恰似大海潮生,初時廣袤沉靜,星光點點,不覺 有異。然細心

2、聽處,遠方隱隱似有天籟之音,像那悶雷滾過,卻又悠揚有如長笛嗚咽。 待到聽得更是真切之時,又有冰河破碎,清泉下流,入小河,匯大江,浩浩蕩蕩,終歸 大海,成了萬丈濤聲,千年不絕?!?螞蟻嘆道:“怎信世間能有如此神奇之學(xué)問。你且先讓我們聽聽那下里巴人罷!” 狐貍道:“博弈便是賭博。” 絳仙不滿道:“我說不準(zhǔn)賭博的!” 螞蟻搖手道:“姑娘莫惱,剛才既是我說要下里巴人,才有賭博這些鄙陋之事,須不要 怪狐兄?!?狐貍宛爾笑道:“姑娘也可把它看作打架。博弈之要義,先要知你是誰,要看你出手, 然后我的還手必要是最有利自己。此為最基本也。” “然高手過招,贏在料敵機先??v然彼先出手,但既知我是誰,故出手后,必要

3、想以我 之能,當(dāng)如何還手。彼出招與我還招,構(gòu)成一個局面,非但可定我之生死,亦可以定彼 之生死。彼必要選擇對其最有利的局面為先著。是故彼未出手,我已知其意矣?!?“那也未必!”絳仙插嘴道,“我可以用對方從來沒有見過的天山折梅手,對方防不勝 防,便無從計算得失了?!?“姑娘莫急,”狐貍道,“博弈論中,什么樣的人用哪些招數(shù),都是事先假定好的,也 是大家各方都知道的,而且大家都知道大家知道的,卻不允許你弄些稀奇古怪的旁門左 道來搗亂?!?“狐兄之意我已知之,”螞蟻沉吟道,“于我方,最想知道的是對方如何出手,只要確 定對方的招數(shù),我便可以在此前提下選擇于自己最有利的應(yīng)對措施,得到一個我的盈利 函數(shù)。然而

4、對方也能想象到我盈利函數(shù)最大化下的出招,并因此計算他自己的所得。對 方所出招必定是能使他盈利最大的招數(shù)?!?“所以我便可知對方如何出招,對方也知我會如何應(yīng)對。我若不如此應(yīng)對,必定吃虧; 對方若不如此出招,必定不能使其利益最大?!?“Nod,”狐貍點頭,“這些招數(shù)的組合,便成為了一條均衡路徑?!?“但凡事總要未雨綢繆,難保中途哪個出錯,出了一個對他自己不利的臭招,你下一招 也得針對新情況,解決新問題?!?“所以,對于局中人任何招數(shù),無論香臭也罷,如果真的發(fā)生了,我們就要根據(jù)前面蟻 兄說的原則重新計算出招和應(yīng)招。但是我們只朝前看,不算舊帳?!?“如果每一個回合的每一招(無論這一招的出現(xiàn)如何愚蠢)我

5、們都想好了其后的最佳出 招和應(yīng)招,即任何招數(shù)的出現(xiàn),其后都有均衡路徑;而最長的那條均衡路徑,為整個博 弈的均衡路徑。那么,我們就算完事大吉,高枕無憂了?!?但文書還是不服氣:“你這個總是分了出招的先后順序,所以別人出后你可以悠然地選 擇自己最優(yōu)的。倘若你們都是同時出招,你看到對手出招時,你的劍也已經(jīng)刺出,變不 了招,豈非全都亂了套?” 狐貍笑道:“文書想的周到。不過這個雖原理與前無異,倒也不好用話來說,且先等它 一等?!?“狐兄總是這么剛愎自用,”絳仙幽幽地嘆口氣,“俗話說,畫虎畫皮難畫骨、知人知 面不知心。你怎么就一定知道對方是什么人?” 狐貍的心不覺顫了一下,因為很久以前自己也曾這般嘆過,

6、故而聽來分外熟悉。 不過這好比微風(fēng)吹起的一絲漣漪,很快就從水面的這邊,掠過水面的那邊,然后就消失 了。 狐貍道:“按博弈論的要求,我們即便不知道對方一定是什么人,但卻知道他屬于哪一 類人的概率。譬如是好人的概率是2/3,壞人的概率是1/3。能夠知道這個,我們也可以 作出選擇了?!?“但是.”絳仙欲言又止,因為她想到了1/3的那種可能,所以她并不滿意狐貍的這 個回答。但是她知道這已經(jīng)是最好的回答。所以也不再問。 狐貍笑著把眼睛從她身上掃過。 “先前我們知道博弈中每個人是什么類型,然后我們可以算出每個人的盈利函數(shù),每個 人的決策,便是根據(jù)這盈利函數(shù)來的?,F(xiàn)在我們只知道每個人屬于哪個類型的概率,也

7、還是一樣按照剛才的步驟進行,只不過盈利函數(shù)成為數(shù)學(xué)期望值罷了。無論先出招還是 后出招,都是一樣希望自己的盈利期望最大。” 文書嚅囁道:“這個數(shù)學(xué)期望.” 狐貍樂了:“大二數(shù)學(xué)便有這些東東,文書緣何記不得了?譬如你有1/3的可能得到9元 錢,有2/3的可能得到18元錢,那你可能得到錢的數(shù)學(xué)期望便是9*1/3+18*2/3=15元。一 個量乘以自身的概率,便是數(shù)學(xué)期望?!?說到這里,狐貍不覺朝螞蟻望了一下:“現(xiàn)在所說,雖力圖下里巴人,但.” 螞蟻已知其意,揮手道:“下里巴人也不應(yīng)是文書這樣的幼兒園水平,概率的起碼意義 要懂!” “換言之,”螞蟻笑道,“即便國人素質(zhì)低,狐兄要說的,也至多是陽春白雪,

8、未可算 是艷陽高照。在下還聽的懂,盡管放心的說下去。” 狐貍搖頭道:“我要說的,就要說完了?,F(xiàn)在我們在每個局中人的類型、每種類型局中 人的各個招數(shù)上,都各假設(shè)一個概率,這些概率假設(shè)可全用符號來表示未知量,它們可 以代表小數(shù),也可以代表0,也可以代表1?!?“但是引入這些符號之時,便要這些符號之間滿足概率上的約束,譬如歸一化約束。作 為代數(shù)式,這種約束是可以滿足的?!?“此時,局中人選擇策略,實質(zhì)上便是計算概率。概率為0,便不選此策略;概率為1, 便一定選此策略,概率若為小數(shù),則為混合策略。” “令a,b,c.為A,B,C.決策順序中局中人所屬類型的概率向量(各 個 決策順序的局中人可同可不同,

9、但我們只把順序作為區(qū)分標(biāo)準(zhǔn)),a,b,c. 為分布在相應(yīng)局中人各招數(shù)上的概率向量。注意,這兒a,a等都是向量,譬如a=( a1,a2,.an)?!?“由此可以列出依照A,B,C.的先后次序決策時,各人的盈利代數(shù)式: Ua=fa(a,b,c.;a,b,c.n) Ub=fb(a,b,c.;a,b,c.n) . Un=fn(a,b,c.;a,b,c.n)” “現(xiàn)在先不考慮出招較早的那些人,首先考慮最后一個決策者,他當(dāng)取n*使得 Un*=maxfn(a,b,c.;a,b,c.n)的n*策略。此時,n* n 可以表示為a,b,c.;a,b,c.n-1的函數(shù)式。因此可得 (n-1)個決策者的盈利式為: U

10、n-1*=maxfb1(a,b,c.;a,b,c.n-1) n-1 同樣又確定n-1*,并消掉n-1變量,依次類推。最后確定a*后,把a*的數(shù)值代入 其它所有人的策略代數(shù)式,即可求得依先后順序計算的所有局中人均衡策略。此時,各 人的盈利函數(shù)為代數(shù)方程,自變量概率向量在01區(qū)間又是連續(xù)的,因此完全可用解方 程的辦法來求極值?!?“博弈論的全部內(nèi)容,我便已說完了?!?文書呆了一呆,并不相信自己的耳朵,急忙從包里抱出本5、600頁厚的博弈論,嘴 里嚷嚷道:“打死我都不信,那博弈論里面有什么完全信息、不完全信息、靜態(tài)動態(tài)、 占優(yōu)弱劣、多重性、貝葉斯、有限、無限、顫抖手、序貫.那么多花樣,你卻拿這 幾句

11、話來打發(fā)我,而且還是夾雜在童話故事中間!” “文書說得有一定道理,”螞蟻也接口道,“倘若有如此簡單,這些經(jīng)濟學(xué)家也不成其 為經(jīng)濟學(xué)家了。狐兄終究是年少,須知武學(xué)一道,總是要循序漸進,不好來半點浮躁的 ?!?“我也如此說過他好多次了,他總是不聽?!苯{仙看了狐貍一眼,眼神中倒有一大半是 怨色。 不過狐貍最受不了這種溫柔的責(zé)備,因為這個時候還招也罷,不還招也罷,大約都是顯 得自己愚蠢。 “當(dāng)真是沒有這么簡單,”狐貍暗自思忖,“譬如此時我便計算不出最優(yōu)策略。” 但是文書看到大家都支持他,狐貍又沒有作聲,頓時感到自己把天底下最充分的理由都 占全了。于是打開書本,按書上的條目一條一條的問狐貍問題: “譬如

12、你就沒有說什么是完全信息!” “這個區(qū)分重要么?” “不重要么?” 狐貍火了:“本公子不知道什么是完全信息一樣可以搞定!” “哈哈哈哈,”文書大樂,“狐兄開什么玩笑?什么是完全信息這種最基本的東東都不 懂,還要搞定?”它便笑著邊轉(zhuǎn)動腦袋望著螞蟻和絳仙。 不過螞蟻和絳仙都沒有笑。絳仙有點擔(dān)心的望著狐貍。這使得文書很掃興。 螞蟻鎮(zhèn)靜地道:“不妨等狐兄說完搞定的辦法。” 狐貍朝螞蟻投去感激的一眼,轉(zhuǎn)向文書:“你說說什么是完全信息,看我能否搞定?” 文書便照著書本念了:“完全信息是指自然不首先行動或自然的初始行動被所有參與人 準(zhǔn)確觀察到的情況,即沒有事前的不確定性.” “Too simple!too

13、naive!”狐貍不等文書說完就打斷了,“你所說的完全信息便是我 以上方程中a,b,c.均事先確定為0或1的情況!” 文書不料被如此打斷,臉上一紅,急忙又翻過一頁:“那完美信息呢?” “擺脫!”狐貍微笑中夾雜一絲嘲諷,“每次你說一個東東,請隨即念它的書本定義, 好節(jié)省大家的時間!” 文書有點惱羞成怒,但是它克制住了自己:“完美信息,便是指你對別人究竟是什么人 和他曾經(jīng)采取了什么具體行動都一清二楚,沒有半點含糊!” 狐貍兩眼朝天,懶懶地說:“就是a,b.a,b.都是0或者1?!?“納什均衡:給定別人不動,沒有人有興趣動?” “每個人盈利函數(shù)對于自己策略的偏導(dǎo)小等于0。注意啊,這兒是偏導(dǎo),可不是全

14、導(dǎo)! 全導(dǎo)可是要好多人都可能調(diào)整策略了。” 狐貍答得太快了,文書決定把剛才螞蟻的那個重磅炸彈扔出來: “怎么解決靜態(tài)均衡的問題,你還一直沒有說過呢!” “Sigh!”狐貍啐了一聲。 “你一樣列出各人盈利函數(shù)多項式;然后對個人贏利函數(shù)取對自己策略的偏導(dǎo)為零得出 方程式,每個人都有自己的方程式。把這些方程式聯(lián)解的解,就是靜態(tài)博弈之均衡?!?文書急忙去翻下頁,嘴里嘰里咕噥的,想是十分的不滿意。 它頭也不抬:“子博弈精煉納什均衡?”不過狐貍也不含糊: “a,b.a,b.都是0或者1時得出的均衡就是子博弈精煉納什均衡! ” “不完全信息博弈?” “a,b.都是小數(shù)!” “貝葉斯納什均衡?” “只要我那代

15、數(shù)式成立便是貝葉斯納什均衡!” “海薩尼轉(zhuǎn)換?” “這是廢話,不需要!你把換成便是,符號變一變,計算上沒有什么大不了的改進 ,畫蛇添足!” “不完全信息靜態(tài).” “什么靜態(tài)都跟我剛才說的方法一樣!” “精煉貝葉斯均衡.” “停停!怎么個精煉法?” “哼哼,”文書感覺大是欣喜。它驕傲地說:“聽好了!精煉貝葉斯均衡就是.修 改后驗概率?!?它念了十分鐘。螞蟻和絳仙都糊涂了。 “Robbish!”狐貍不耐煩地道,“莫不是知道某已經(jīng)發(fā)生,來確定某是否合理?” “你按我那式子計算出來的均衡策略解集中,倘若沒有某,豈不就出了矛盾?當(dāng)然 是要修改,此時便需要進一步精煉;倘若解集中就有某,則此均衡就沒有問題,

16、就 是那精煉貝葉斯均衡吧?說起來不過就是以前已知,求;變?yōu)橐阎?,求而已?何必再安些名詞出來?” “那,不完美信息博弈的精煉貝葉斯均衡.” “同上!” 文書的臉色有些難看:“序貫均衡?” “呵呵,你那序貫均衡無非是不想讓人們在非均衡路徑上亂來,所以想著任何零概率事 件都賦予正的小概率,好利用條件概率的性質(zhì)到所有決策上是么?我那代數(shù)表達式在所 有策略上都有概率符號,不管它是零概率也好還是其它什么也好,保證在哪兒都不會亂 來!豈非不就是序貫均衡?” “顫抖手均衡呢?” “只要第一步用代數(shù)式來表達,就也是顫抖手均衡!絕對沒有那些亂七八糟的怪現(xiàn)象出 現(xiàn)!” 文書語氣開始有些軟了。 “你能說說顯示原理么

17、?” “不就是所謂的納什均衡么?給定每個人的性質(zhì),可以設(shè)計出一個納什均衡。要是其中 有一個人謊報自己的情況,便是單獨偏離了此均衡,故結(jié)果定然對他不利。所以他的唯 一選擇就是說實話?!?“我便不信!”絳仙叫道,“你根本不了解別人的情況,居然就能讓別人說實話!” “是啊,這個顯示原理也有個前提,就是其它所有人都說的是實話的前提下,單個人不 會偏離均衡而說謊。倘若其它多數(shù)人都是說謊,便不是單個人偏離均衡,而是多數(shù)人偏 離均衡了,此時誰能保證偏離不會得到更大的利益呢?所以社會環(huán)境的確是重要??!” “無名氏定理又是怎么回事?” “這個是無限次重復(fù)博弈中的東東。一般說來,博弈中雙方合作時得益最大,但若一方 不遵守合作約定,必定是另一方老好人吃虧。所以便引入懲罰機制:誰TMD違約,以后就 要處罰他,使他不敢違約。這便是無名氏定理的要義?!?“處罰的方式有很多,譬如既然已經(jīng)違約,這個人是不值得相信的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論