《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知

上傳人：獨(dú)*** IP屬地：江蘇上傳時(shí)間：2022-11-30 格式：PPTX 頁數(shù)：56 大?。?19.08KB 積分：15 舉報(bào) 版權(quán)申訴

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知_第2頁

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知_第3頁

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知_第4頁

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知_第5頁

已閱讀5頁，還剩51頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第7章

有限認(rèn)知

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》配套課件——引言從本章開始，我們將放松個(gè)體在給定條件下決策的假定，轉(zhuǎn)而探討人與人之間的互動(dòng)問題，因此我們需要涉及一定的博弈論知識(shí)。在標(biāo)準(zhǔn)經(jīng)濟(jì)學(xué)下，分析個(gè)體間博弈過程的基本理論是解析博弈論。它構(gòu)建于三個(gè)基本假定之上：①個(gè)體具有無限的認(rèn)知能力；②博弈的均衡是瞬間達(dá)到的；③博弈中的個(gè)體只受利己動(dòng)機(jī)驅(qū)使。行為經(jīng)濟(jì)學(xué)對(duì)這三條基本假定分別作了相應(yīng)的修正與拓展，所形成的新的理論體系被稱作行為博弈論。本章主要關(guān)注上述第一條假定及其修正，以及由此發(fā)展出的兩類理論。第一類理論以質(zhì)反應(yīng)均衡模型為代表；第二類理論以認(rèn)知層級(jí)模型為代表。目錄7.1標(biāo)準(zhǔn)經(jīng)濟(jì)學(xué)模型7.2行為經(jīng)濟(jì)學(xué)的修正I：有限計(jì)算7.3行為經(jīng)濟(jì)學(xué)的修正II：有限推理7.4案例分析進(jìn)一步閱讀7.1標(biāo)準(zhǔn)經(jīng)濟(jì)學(xué)模型7.1.1博弈的要素標(biāo)準(zhǔn)式表述在評(píng)介博弈的要素之前，我們先介紹一個(gè)較具代表性的博弈形式——囚徒困境博弈，它有助于我們對(duì)博弈的理解。在一個(gè)典型的囚徒困境博弈中，共涉及兩名囚徒，他們被關(guān)押在不同的審訊室，并被指控犯下了某項(xiàng)罪行。他們要么坦白，相當(dāng)于背叛對(duì)方，要么不坦白，相當(dāng)于與對(duì)方合作。然而，他們之間不能交流，因此他們無法獲知對(duì)方會(huì)采取什么策略。圖7-1展示了該博弈中每個(gè)人的可能策略及相應(yīng)收益，其中收益單位以監(jiān)禁年數(shù)的相反數(shù)表示，囚徒A的收益以左邊的數(shù)值表示，囚徒B的收益以右邊的數(shù)值表示。有時(shí)，圖7-1被稱作一個(gè)博弈的標(biāo)準(zhǔn)式表述，其中每個(gè)參與者被假定是同時(shí)行動(dòng)的，因此所有的行動(dòng)結(jié)果都可在一張表格中展示出來，這被稱為收益矩陣。標(biāo)準(zhǔn)式博弈一般共享如下核心要素，它們是：參與者：他們是彼此關(guān)聯(lián)的決策個(gè)體，其效用也是相互依賴的?，F(xiàn)實(shí)中，無論是個(gè)人、廠商、團(tuán)體、社會(huì)組織、政黨還是政府，均可看作博弈的參與者。策略：這一概念涉及兩種定義。第一種定義是指參與博弈的一整套行動(dòng)計(jì)劃，它明確了在參與者可能遇到的每種情況下對(duì)可行行動(dòng)的選擇；而第二種定義僅指對(duì)某一行動(dòng)的選擇，比如在囚徒困境博弈中選擇“坦白”。一般來說，我們可把一套完整的行動(dòng)計(jì)劃命名為“規(guī)則”，而“策略”一詞被限定于表示某一特定的選擇或行動(dòng)。收益（或稱支付）：這一概念是指在博弈結(jié)束時(shí)參與者的福利或得到的效用，它是由每個(gè)參與者的策略選擇所決定的。一般的假定認(rèn)為，每個(gè)參與者以最大化自身的效用或期望效用為目標(biāo)。擴(kuò)展式表述在很多情形下，參與者不是同時(shí)行動(dòng)的，并且行動(dòng)的順序?qū)Σ┺牡慕Y(jié)果很重要，這就需要使用所謂的擴(kuò)展式表述。擴(kuò)展式表述通常會(huì)涉及一個(gè)博弈樹，見圖7-2。該圖展示的是一個(gè)最后通牒博弈。與許多博弈一樣，最后通牒博弈也是由兩名參與者完成的，一名為提議者，另一名為回應(yīng)者。其中，提議者對(duì)一定資源提出一個(gè)分配方案，比如在10美元中出讓x美元給回應(yīng)者，自己留下10-x美元。而回應(yīng)者可以接受這一提議，也可以拒絕這一提議從而使雙方都一無所獲。在圖7-2所展示的博弈中，我們假定如果提議者A決定平分10美元，則博弈將結(jié)束，而唯一的非平分方式是(8,2)，即提議者A得8美元，回應(yīng)者得2美元。博弈的擴(kuò)展式表述主要涉及四個(gè)要素：它包含各節(jié)點(diǎn)和各分支的完整結(jié)構(gòu)，其中不存在任何封閉性循環(huán)，而是從一個(gè)單一節(jié)點(diǎn)出發(fā)直至最終節(jié)點(diǎn)。節(jié)點(diǎn)分為決策節(jié)和終點(diǎn)節(jié)兩類。每個(gè)決策節(jié)都屬于某個(gè)參與者，而關(guān)于某一參與者的若干決策節(jié)的集合被稱為信息集。在每個(gè)終點(diǎn)節(jié)上都給出了各參與者的收益值。有時(shí)，在博弈中會(huì)存在一個(gè)外部的權(quán)威力量，被稱作“自然”，它會(huì)按一定的概率來隨機(jī)選擇某個(gè)分支。一個(gè)關(guān)于“自然”的直觀例子是，它需要決定是否降雨。7.1.2博弈的類型零和博弈與非零和博弈零和博弈是指，某一（些）參與者的收益恰好是另一（些）參與者的損失，因此所有參與者的收益或損失之和就為零。衍生品市場交易就屬于這類博弈情形，其中某一投機(jī)者之所得即為另一投資者之所失。但在現(xiàn)實(shí)中，大部分博弈情形屬于非零和博弈，即各方參與者的收益或損失之和不為零。完美信息與非完美信息在前文展示的囚徒困境博弈中，我們假定所有參與者都確切知道每種策略組合的收益結(jié)果，這被稱為完美信息情形。但在實(shí)際情形中卻經(jīng)常不是這樣，這必然會(huì)影響到策略的選擇。在某些情形中，參與者可能對(duì)他自己的收益是不確定的；在另一些情形中，他們也許知道自己的收益，但卻不確定其他參與者的收益是多少，這被稱為非完美信息。離散型策略與連續(xù)型策略離散型策略是指每個(gè)行動(dòng)都是從有限數(shù)目的備擇策略中選出的。在囚徒困境博弈中，每個(gè)參與者只有“坦白”或“不坦白”兩種策略，因此屬于離散型策略情形。與之相對(duì)的是連續(xù)型策略，比如寡頭市場中的廠商，它們幾乎有無數(shù)個(gè)可以索取的價(jià)格。單擊博弈與重復(fù)博弈在商業(yè)行為中，大部分短期決策都屬于重復(fù)博弈，比如定價(jià)或廣告，在這些情形中，競爭者之間的互動(dòng)是連續(xù)性的，它們可定期改變決策。對(duì)于這類博弈來說，有些也許只涉及有限的輪次，因此博弈的結(jié)束點(diǎn)是能夠預(yù)見的，而另一些博弈似乎會(huì)無限重復(fù)下去。另一方面，長期決策（比如投資）卻類似于單擊博弈或稱一次性博弈。雖然這種決策在未來也會(huì)再次進(jìn)行，但在兩次決策之間可能會(huì)相隔很久，并且下一次決策時(shí)所面臨的收益情況也許會(huì)發(fā)生迥然的變化，因此可將這類決策看作單擊博弈。7.1.3博弈的均衡基于前述關(guān)于博弈基本要素及類型的介紹，我們現(xiàn)在可來探討當(dāng)參與者具備無限的認(rèn)知能力時(shí)，會(huì)出現(xiàn)怎樣的博弈結(jié)果。占優(yōu)策略均衡如果給定其他參與者的可選策略的任何集合，選擇策略s1都會(huì)比選擇策略s2帶來嚴(yán)格更高的收益，則稱策略s1嚴(yán)格占優(yōu)于策略s2。換言之，如果參與者A在某種情形下?lián)碛幸粋€(gè)嚴(yán)格占優(yōu)策略，那么無論參與者B如何選擇，該策略給A帶來的收益都不少于其他策略帶來的收益。顯然，如果存在占優(yōu)策略，那么一位能進(jìn)行無限思考的參與者就總會(huì)選取它。因此，在任何涉及離散型策略的靜態(tài)博弈中，我們應(yīng)當(dāng)以尋找占優(yōu)策略作為分析的起點(diǎn)。對(duì)此，我們基于前文的囚徒困境博弈來介紹如何尋找占優(yōu)策略?，F(xiàn)在請(qǐng)回顧圖7-1，對(duì)于囚徒A來說，如果囚徒B坦白，那么囚徒A選擇坦白可使他的結(jié)局更好一些，因?yàn)樗麄冎粫?huì)被判5年監(jiān)禁而不是10年；而如果囚徒B不坦白，那么囚徒A選擇坦白也可帶來更好的結(jié)局。因此，無論囚徒B選擇什么，囚徒A的最優(yōu)選擇都是坦白。這一分析邏輯對(duì)于囚徒B仍然適用。因此我們可認(rèn)為，對(duì)每個(gè)參與者而言，選擇坦白就是一個(gè)占優(yōu)策略。而當(dāng)存在多種可能的策略時(shí)，我們需要通過不斷剔除劣策略來尋找占優(yōu)策略。在上述的囚徒困境博弈中，不坦白對(duì)于每名參與者來說都是劣策略，因?yàn)樗麄冞x擇該策略在任何情形下（即無論對(duì)方選擇坦白還是不坦白）都只會(huì)帶來一個(gè)較低的或不變的收益。因此，在圖7-1所示的收益矩陣下，兩名囚徒都會(huì)選擇坦白，我們把這一策略組合稱為占優(yōu)策略均衡，因?yàn)樵谠摼馍?，每個(gè)參與者都選擇了他的占優(yōu)策略。重復(fù)占優(yōu)策略均衡如果一名參與者沒有占優(yōu)策略，那么他將怎樣選擇？我們可在圖7-3的收益矩陣中對(duì)這一問題進(jìn)行分析，其形式與圖7-1相類似，只是修改了其中某個(gè)收益值，使得收益矩陣不再是對(duì)稱的，因?yàn)楫?dāng)A坦白而B不坦白時(shí)A會(huì)被判2年監(jiān)禁。此時(shí)，雖然B的占優(yōu)策略并未改變，但A的占優(yōu)策略卻消失了。如果B坦白，A與前面一樣可通過坦白來改善處境；但如果B不坦白，A卻需要通過不坦白來改善處境。在這一情形下，如果A對(duì)B的策略持有正確的推斷，那么他就可剔除B的不坦白策略（因?yàn)檫@對(duì)于B來說是劣策略），并推斷B一定會(huì)選擇坦白，而A通過這種重復(fù)剔除方法就可選出一個(gè)占優(yōu)策略，即坦白。此時(shí)，所達(dá)到的均衡雖然與圖7-1所示的情形仍然一樣，但這時(shí)的均衡卻應(yīng)稱作一個(gè)重復(fù)占優(yōu)策略均衡。納什均衡現(xiàn)在，讓我們進(jìn)一步考慮，當(dāng)每個(gè)參與者都沒有占優(yōu)策略時(shí)會(huì)出現(xiàn)怎樣的結(jié)果。我們對(duì)圖7-1的囚徒困境博弈作進(jìn)一步修改，如圖7-4所示。其中，收益矩陣又變成對(duì)稱形式，但如果一名參與者坦白而另一名不坦白，則坦白者將被判處2年的監(jiān)禁。此時(shí)，均衡不再是唯一的，亦即對(duì)每名參與者來說不存在選擇某個(gè)策略的唯一趨勢。對(duì)此，我們需要涉及納什均衡的概念(Nash,1950;1951)，其含義是，每名參與者都根據(jù)其他參與者的最優(yōu)反應(yīng)策略來選擇自身的最優(yōu)策略。這是一個(gè)比前述兩種均衡更具一般性的均衡概念，它不但囊括了占優(yōu)策略均衡和重復(fù)占優(yōu)策略均衡，而且還涉及那些無法應(yīng)用這兩種均衡的情形。根據(jù)圖7-4，我們可找出兩個(gè)納什均衡：如果B坦白，A通過坦白可改善自己的處境；并且給定這一最優(yōu)反應(yīng)，B的最優(yōu)反應(yīng)也是坦白。如果B不坦白，A選擇不坦白也可改善自己的處境；并且給定這一最優(yōu)反應(yīng)，B的最優(yōu)反應(yīng)也是不坦白。從B的角度出發(fā)，也可得到相同的均衡：如果A坦白，B通過坦白可改善自己的處境；并且給定這一最優(yōu)反應(yīng)，A的最優(yōu)反應(yīng)也是坦白。如果A不坦白，B選擇不坦白也可改善自己的處境；并且給定這一最優(yōu)反應(yīng)，A的最優(yōu)反應(yīng)也是不坦白。綜上，兩個(gè)納什均衡分別為(坦白,坦白)和(不坦白,不坦白)?；旌喜呗跃獾侥壳盀橹?，我們所討論的均衡都只涉及純策略，其含義是，在給定情形下參與者總是以相同的方式作出反應(yīng)，換言之，在每個(gè)決策節(jié)上只選出某個(gè)單一的行動(dòng)。然而，在許多博弈中并不存在純策略的納什均衡，而是含有一個(gè)混合策略納什均衡，簡稱混合策略均衡。其中，混合策略是指對(duì)各種策略的選擇滿足某一概率分布，這也被稱為對(duì)可選策略的隨機(jī)化。一個(gè)涉及混合策略均衡的博弈可見圖7-6所示的網(wǎng)球賽例子(DixitandNalebuff,1991)。在該圖所示的收益矩陣中，參與者的收益用成功的概率來表示，即發(fā)球者擊敗接球者的概率以及接球者成功回球的概率。需指出的是，此處的收益矩陣不是對(duì)稱的，因?yàn)榻忧蛘咴谡治灰仍诜词治桓菀壮晒厍?，這符合現(xiàn)實(shí)情況。因此，在圖7-6中假設(shè)，如果接球者正確預(yù)測到球會(huì)發(fā)向他的正手位，那么他成功回球的概率為90%；而如果他正確預(yù)測到球會(huì)發(fā)向他的反手位，那么他回球的成功率只有60%。顯然，在該博弈中，發(fā)球者的目標(biāo)是最大化贏得發(fā)球的概率，而接球者的目標(biāo)是最大化回球的成功率。那么，我們應(yīng)當(dāng)如何推算每名參與者的最優(yōu)策略呢？假設(shè)發(fā)球者將球發(fā)到對(duì)方正手位的概率是p，發(fā)到對(duì)方反手位的概率是1-p；類似地，假設(shè)接球者移到正手位的概率是q，移到反手位的概率是1-q。于是，發(fā)球者將球發(fā)往對(duì)方正手位的期望收益為q×10%+(1-q)×70%=-q×60%+70%，發(fā)往反手位的期望收益為q×80%+(1-q)×40%=q×40%+40%?？梢?，當(dāng)前者大于后者時(shí)，即q<30%時(shí)，發(fā)球者發(fā)往對(duì)方正手位就是最優(yōu)策略；而當(dāng)前者小于后者時(shí)，即q>30%時(shí)，發(fā)往對(duì)方反手位就是最優(yōu)策略；而當(dāng)q=30%時(shí)，發(fā)往任何方向就是無差異的。我們?cè)趫D7-7中將這些情形繪制了出來，標(biāo)識(shí)為p(q)，它表示隨q的變化發(fā)球者應(yīng)當(dāng)如何決定p，因此可看作發(fā)球者的最優(yōu)反應(yīng)函數(shù)。同樣的推導(dǎo)過程也適用于對(duì)接球者的分析：接球者移到正手位接球的期望收益是p×90%+(1-p)×20%=p×70%+20%，移到反手位接球的期望收益是p×30%+(1-p)×60%=-p×30%+60%。于是，當(dāng)前者大于后者時(shí)，即p>40%時(shí)，接球者移到正手位接球就是最優(yōu)策略；而當(dāng)前者小于后者時(shí)，即p<40%時(shí)，接球者移到反手位接球就是最優(yōu)策略；而當(dāng)p=40%時(shí)，移到任何方向接球是無差異的。這些情形也可在圖7-7中畫出，標(biāo)識(shí)為q(p)，表示隨p的變化接球者應(yīng)當(dāng)如何決定自己的q，因此它是接球者的最優(yōu)反應(yīng)函數(shù)。可見，當(dāng)p(q)與q(p)相交時(shí)，即當(dāng)發(fā)球者在40%的時(shí)間里將球發(fā)往對(duì)方的正手位、接球者在30%的時(shí)間里移到正手位接球時(shí)，發(fā)球者與接球者都達(dá)到了最優(yōu)反應(yīng)點(diǎn)，此時(shí)任何一方都不再有進(jìn)一步調(diào)整策略的動(dòng)機(jī)，于是雙方達(dá)到了一個(gè)均衡狀態(tài)，此即所謂的混合策略均衡，可表示為{(40%,60%),(30%,70%)}。子博弈完美納什均衡上述均衡概念都涉及的是靜態(tài)博弈情形。而在動(dòng)態(tài)博弈中，我們將會(huì)面臨子博弈完美納什均衡。為了說明這一均衡的內(nèi)涵，我們利用圖7-2中的最后通牒博弈作為示例。首先我們需要了解一個(gè)新的概念即子博弈，它是指從某個(gè)單一決策節(jié)（該決策節(jié)所處的信息集中不包含其他決策節(jié)）出發(fā)的直至終點(diǎn)節(jié)的后延博弈部分。回顧圖7-2可知，從B的決策點(diǎn)出發(fā)存在一個(gè)子博弈。子博弈完美意味著如果博弈進(jìn)行到子博弈，那么參與者將選擇他們的均衡策略。子博弈完美納什均衡是針對(duì)整個(gè)博弈一種均衡，其中參與者在每個(gè)子博弈中都選擇他們的均衡策略。為了確定某個(gè)博弈的子博弈完美納什均衡，我們必須使用逆向歸納法。這意味著需要從博弈的最后一步思考并逆向推理。以圖7-2的最后通牒博弈為例，為了確定A的最優(yōu)或均衡策略，我們必須首先考慮B的情形。如果A選擇不平分，那么B就必須作出一項(xiàng)選擇。因?yàn)锽是追求利益最大化的，故而他會(huì)接受這個(gè)不平分的結(jié)果，因?yàn)榈玫?單位收益總是要好于選擇拒絕而一無所獲。通過逆向推理，我們就可預(yù)料，A會(huì)由此決定選擇不平分，因?yàn)楂@得8單位收益要優(yōu)于選擇平分而獲得5單位收益。于是，該博弈的子博弈完美納什均衡就是(不平分,接受|不平分)。子博弈完美納什均衡是一個(gè)比納什均衡更為嚴(yán)格的概念。在上述最后通牒博弈中，實(shí)際上存在兩個(gè)納什均衡，但只有前面所說的那個(gè)均衡是子博弈完美的。另一個(gè)納什均衡是(平分,拒絕|不平分)，但卻不是子博弈完美的，因?yàn)楦鶕?jù)解析博弈論的假定，B不會(huì)拒絕不平分的提議。7.2行為經(jīng)濟(jì)學(xué)的修正I：有限計(jì)算7.2.1異象截至目前，已有不少經(jīng)驗(yàn)研究對(duì)博弈參與者達(dá)到混合策略均衡的成功率作了考察。根據(jù)已有的實(shí)驗(yàn)研究可發(fā)現(xiàn)，雖然在每種研究的結(jié)論中得到的結(jié)果各異，但所存在的一般規(guī)律是，博弈中的個(gè)體總是偏離混合策略均衡，雖然這種偏離并不大，但在統(tǒng)計(jì)學(xué)意義上通常是顯著的，對(duì)此可見圖7-8。圖7-8顯示，在若干實(shí)驗(yàn)中，基于納什均衡推斷的各策略選擇概率（橫軸）與每次實(shí)驗(yàn)中實(shí)際選擇各策略的相對(duì)頻率（縱軸）之間的對(duì)應(yīng)關(guān)系。我們發(fā)現(xiàn)，在實(shí)際選擇與納什均衡預(yù)測之間有顯著的偏離，并且還存在這樣一個(gè)輕微的趨勢，即納什均衡中本應(yīng)以較低概率被選擇的策略卻被選擇得更多，而本應(yīng)以較高概率被選擇的策略卻沒有得到足夠的選擇。7.2.2質(zhì)反應(yīng)均衡模型基本描述上文已述，混合策略均衡雖然是對(duì)每個(gè)策略分配一個(gè)概率，但在本質(zhì)上仍是一種納什均衡，因?yàn)槊棵麉⑴c者都是在給定其他參與者的最優(yōu)概率分布下決定自己的最優(yōu)概率分布?？梢姡@一均衡是基于如下假定而得到的，即個(gè)體具有無限的認(rèn)知能力?，F(xiàn)在，為了能夠解釋上述異象，我們將對(duì)這一假定進(jìn)行放松，即個(gè)體在進(jìn)行最優(yōu)選擇時(shí)會(huì)出現(xiàn)計(jì)算錯(cuò)誤?；谶@一假定而發(fā)展起來的一個(gè)替代性的均衡理論被稱為質(zhì)反應(yīng)均衡模型。麥凱爾維和帕爾弗雷(MckelveyandPalfrey,1995)在前人理論的基礎(chǔ)上，于研究中首次提出，參與者在博弈中會(huì)根據(jù)各策略的相對(duì)期望效用來進(jìn)行選擇，但在有限認(rèn)知的約束下，他無法確定性地計(jì)算各策略的期望效用，而是受到某種隨機(jī)誤差的干擾。他們進(jìn)一步假定，每名參與者都知道自己的選擇會(huì)受到誤差干擾，并且知道其他參與者的選擇也是在誤差干擾下進(jìn)行的，但參與者仍能達(dá)到一個(gè)他們認(rèn)為的彼此“最優(yōu)反應(yīng)”點(diǎn)，這是一個(gè)區(qū)別于納什均衡的“有限計(jì)算下的均衡”。此時(shí)，較好的反應(yīng)要比較差的反應(yīng)更容易被觀測到，但最好的反應(yīng)并不以概率1出現(xiàn)。麥凱爾維和帕爾弗雷發(fā)現(xiàn)，基于這一思想而得到的參與者的“最優(yōu)反應(yīng)函數(shù)”與解析博弈論下的最優(yōu)反應(yīng)函數(shù)是不一樣的，而是更類似于生物學(xué)或藥理學(xué)中的一個(gè)常見統(tǒng)計(jì)模型，即質(zhì)反應(yīng)函數(shù)（詳見后文），因此他們將這種均衡命名為質(zhì)反應(yīng)均衡（根據(jù)其英文簡稱為QRE均衡）。QRE的參數(shù)化形式對(duì)于如何表達(dá)QRE，麥凱爾維和帕爾弗雷從盧斯(Luce,1959)和麥克法登(Mcfadden,1976)那里獲得啟發(fā)，提出了所謂的LogitQRE。這種形式不但便于求解，而且還便于統(tǒng)計(jì)學(xué)上的處理，從而可直接用于分析和解釋實(shí)驗(yàn)數(shù)據(jù)。為此，我們首先給出LogitQRE的定義，并利用它展示QRE的求解過程。具體地，在一個(gè)n人標(biāo)準(zhǔn)式博弈中，假設(shè)參與者i的可選策略有Ji個(gè)，那么他選擇第j個(gè)策略的概率滿足一個(gè)Logit形式的反應(yīng)函數(shù)，可表達(dá)為：參數(shù)λ>0衡量了計(jì)算誤差的程度，在附錄中我們將說明，該值越小，計(jì)算誤差越大。進(jìn)一步地，根據(jù)(7.1)式，如果每個(gè)參與者都依據(jù)Logit反應(yīng)函數(shù)來決定選擇各策略的概率，那么相應(yīng)的QRE均衡就可表達(dá)為：兩人博弈下的LogitQRE為了直觀展示LogitQRE的求解過程，我們?cè)O(shè)計(jì)了一個(gè)兩人標(biāo)準(zhǔn)式博弈，其收益矩陣見圖7-9。這是一個(gè)具有唯一混合策略納什均衡的博弈。經(jīng)計(jì)算，該博弈的混合策略均衡為{(0.5,0.5),(0.2,0.8)}。根據(jù)LogitQRE的定義，參與者選擇的均衡點(diǎn)又應(yīng)該在什么位置呢？我們先看參與者A的情況。根據(jù)計(jì)算，參與者A選擇“上”的Logit反應(yīng)函數(shù)為：同樣地，我們可以寫出參與者B的Logit反應(yīng)函數(shù)為：這兩條新的反應(yīng)函數(shù)的交點(diǎn)就是LogitQRE所在的位置。這個(gè)基于有限計(jì)算的均衡點(diǎn)與納什均衡是偏離的。7.2.3對(duì)實(shí)驗(yàn)數(shù)據(jù)的擬合請(qǐng)觀察如下博弈與相關(guān)預(yù)測結(jié)果?？梢钥吹?，QRE通過把參與者的計(jì)算誤差引入模型之中，提高了對(duì)參與者實(shí)際選擇的解釋和預(yù)測能力。而Logit均衡作為QRE的一種參數(shù)化形式，它的單參數(shù)性質(zhì)很便于在實(shí)際分析中應(yīng)用。7.2.3心理學(xué)基礎(chǔ)QRE模型的合理之處及其心理學(xué)基礎(chǔ)是什么？對(duì)此，拉波波特和布代斯庫(RapoportandBudescu,1997)提出了兩個(gè)可能的原因：一是工作記憶的有限性，二是代表性直覺推斷法。工作記憶是指一個(gè)容量有限的用來暫時(shí)保持和存儲(chǔ)信息的系統(tǒng)，有時(shí)又被稱作短時(shí)記憶。關(guān)于代表性直覺推斷法的相關(guān)原理可回顧第5章內(nèi)容，它探討了當(dāng)個(gè)體面對(duì)難以計(jì)算客觀概率的復(fù)雜情形時(shí)，會(huì)怎樣對(duì)風(fēng)險(xiǎn)事件進(jìn)行主觀概率賦值。由于工作記憶有限，個(gè)體用來計(jì)算策略期望效用的信息很難充分，因此會(huì)導(dǎo)致他使用代表性直覺推斷法來估測對(duì)手選取不同策略的概率分布，最終只能做出較優(yōu)的反應(yīng)，這反映了一種節(jié)省認(rèn)知資源的傾向。7.3行為經(jīng)濟(jì)學(xué)的修正II：有限推理7.3.1異象在7.1節(jié)我們就已提到，具有占優(yōu)策略均衡的博弈常常是很容易求解的，尤其是那些只涉及兩種策略的兩人博弈。而在更復(fù)雜的博弈情形下，我們有時(shí)需要通過重復(fù)推理來剔除劣策略，從而達(dá)到一個(gè)占優(yōu)均衡。我們將看到，在某些情形下需要進(jìn)行多步的推理，甚至是無限步數(shù)。那么，現(xiàn)實(shí)中的個(gè)體究竟是怎樣進(jìn)行這些重復(fù)推理呢？他們?cè)谀切┬问捷^為復(fù)雜的博弈下會(huì)推理多少步驟？在解析博弈論的強(qiáng)式假定下，個(gè)體會(huì)進(jìn)行無限次的推理，但現(xiàn)實(shí)情形仍需借助博弈實(shí)驗(yàn)來考察。簡單的兩步推理博弈為了便于后文的講述，我們從一個(gè)簡單的兩步推理博弈開始(BeardandBeil,1994)。該博弈是一個(gè)兩人動(dòng)態(tài)博弈，我們?cè)趫D7-14中給出了該博弈的基本形式。其中，參與者A首先行動(dòng)，如果他選左，則博弈結(jié)束，他將獲得9.75美元，參與者B獲得3美元。另一方面，如果參與者A選右，則參與者B可繼續(xù)行動(dòng)。如果參與者B是完全利己的，他也會(huì)選右，于是獲得5美元而不是選左獲得4.75美元。參與者B選右還可使參與者A獲得10美元，這要稍高于參與者A最初選左可獲得的9.75美元。因此，重復(fù)占優(yōu)均衡是(右,右)。然而，參與者A選右具有一定的風(fēng)險(xiǎn)，因?yàn)槿绻麉⑴c者B并未選擇占優(yōu)策略，那么參與者A將只能獲得3美元。在所進(jìn)行的基準(zhǔn)實(shí)驗(yàn)中，有66%的參與者A選擇了左，這表明他們普遍懷疑參與者B不會(huì)選擇占優(yōu)策略。這種懷疑最終被證明是正當(dāng)?shù)?，因?yàn)楫?dāng)參與者A選右時(shí)，參與者B只在83%的時(shí)間下選擇了右。這個(gè)百分比意味著參與者A選右的期望收益僅有3×0.17+10×0.83=8.81美元，這要低于選左可得到的收益。上述的簡單實(shí)驗(yàn)與許多其他后續(xù)實(shí)驗(yàn)都得到了一個(gè)基本結(jié)論，即參與者傾向于認(rèn)為其他參與者不會(huì)如想象中那樣服從占優(yōu)均衡，換言之，許多參與者會(huì)懷疑對(duì)手的推理能力。但這一博弈無法反映參與者自己的推理能力，即他的實(shí)際推理步數(shù)，因?yàn)闊o論參與者A是否相信對(duì)手會(huì)服從占優(yōu)均衡，他其實(shí)都已作了兩步推理。選美競猜博弈選美競猜博弈是一個(gè)富含啟發(fā)性的博弈，它的名稱最初來自于凱恩斯在1936年出版的《就業(yè)、利息與貨幣通論》。在書中，凱恩斯創(chuàng)造性地把股票市場投資比喻為一種報(bào)紙上的選美競猜活動(dòng)，其中參與者需要在眾多照片中選出最漂亮的人臉肖像，如果哪位參與者的選擇最接近于整體參與者的平均偏好，那么獎(jiǎng)金就將頒授給他。凱恩斯是如此描述這種情形的：“每一個(gè)參與者所要挑選的并不是他自己認(rèn)為是最漂亮的人，而是他設(shè)想的其他參與者所要挑選的人。全部參與者都以與此相同的辦法看待這個(gè)問題。這里挑選的并不是根據(jù)個(gè)人判斷力來選出的最漂亮的人，甚至也不是根據(jù)真正的平均的判斷力來選出的最漂亮的人，而是運(yùn)用智力來推測一般人所推測的一般人的意見為何。在這里，我們已經(jīng)到達(dá)了推測的第三個(gè)層次?！鄙鲜銮樾慰梢杂靡环N簡單的博弈形式進(jìn)行再現(xiàn)，并可用于實(shí)驗(yàn)。這種博弈的標(biāo)準(zhǔn)形式是，要求一組參與者從1到100中選擇一個(gè)數(shù)字。哪位參與者選擇的數(shù)字最接近所有參與者選擇數(shù)字的平均數(shù)的某個(gè)比例P（比如P=2/3），那么誰就是勝出者。實(shí)驗(yàn)的目的在于考察參與者會(huì)重復(fù)推理多少次。如果參與者的選擇是隨機(jī)的或均勻分布的，那么平均數(shù)將為50，該數(shù)字的2/3就是33，因此如果你選擇了33，說明你進(jìn)行了一步推理；第二步的推理是，如果其他參與者都使用一步推理而選擇了33，那么你的最優(yōu)選擇應(yīng)當(dāng)是33的2/3，即22；而第三步推理是，如果其他參與者都使用了兩步推理，那么你的最優(yōu)選擇應(yīng)當(dāng)是15……如此往復(fù)。我們可以看到，在上述博弈中，推理步數(shù)是可以進(jìn)行無限次的，并且每多作一次推理，最優(yōu)數(shù)字就應(yīng)當(dāng)更小，因此最終的重復(fù)占優(yōu)均衡應(yīng)為0。然而，內(nèi)格爾(Nagel,1995)在其實(shí)驗(yàn)中發(fā)現(xiàn)，參與者的平均選擇大約為35，并且在33和22存在兩個(gè)較高的選擇頻率。更全面的實(shí)驗(yàn)是由何、凱莫勒和魏格爾特(Ho,CamererandWeigelt,1998)進(jìn)行的，他們得到的一般性結(jié)論是，參與者只會(huì)表現(xiàn)出一到兩步的推理。凱莫勒(1997)針對(duì)不同身份的受試者群體得到了類似的實(shí)驗(yàn)結(jié)果，這些受試者包括：心理學(xué)本科生、經(jīng)濟(jì)學(xué)博士、證券經(jīng)理和CEO。在針對(duì)財(cái)經(jīng)雜志的讀者所展開的競猜式的現(xiàn)場實(shí)驗(yàn)中使用了真實(shí)的獎(jiǎng)金發(fā)放，而實(shí)驗(yàn)結(jié)果也仍然類似，即在33和22處存在兩個(gè)頻率峰值，但參與者平均選擇的數(shù)字稍低一些，見圖7-15。根據(jù)這些實(shí)驗(yàn)，我們得到兩種可能的結(jié)論：其一，人們的推理通常無法超過兩步；其二，他們也不相信其他人能做到這一點(diǎn)。但這兩點(diǎn)結(jié)論是否具有穩(wěn)健性，我們還需考察其他博弈的實(shí)驗(yàn)結(jié)果。蜈蚣博弈

略，可作課后閱讀臟臉博弈

略，可作課后閱讀7.3.2認(rèn)知層級(jí)模型上文已述，人們通常是不進(jìn)行多次推理的，這不僅在于他們懷疑其他人如此行為的能力，而且在于他們常常只有有限的認(rèn)知能力。據(jù)此，研究者提出了所謂的認(rèn)知層級(jí)模型(Camerer,HoandChong,2004)，以便于預(yù)測重復(fù)推理博弈中的選擇行為，并為學(xué)習(xí)模型提供初始條件。請(qǐng)考慮一個(gè)僅有兩人參加的博弈，分別為參與者A和參與者B。每名參與者均有兩個(gè)可選策略，分別標(biāo)識(shí)為sA1、sA2和sB1、sB2?，F(xiàn)在，我們假設(shè)A可作三步推理，并且他認(rèn)為B最多只能作兩步推理，這意味著A的認(rèn)知層級(jí)要比B高一層級(jí)?，F(xiàn)進(jìn)一步假設(shè)，A猜測B是c步推理者（c=0,1,2）的概率為P(c)，而B在不同推理步驟下選擇策略sBi的概率又可假設(shè)為P(sBi|c)，其中i=1,2。于是，A對(duì)于選擇策略sA1的期望收益為：基于(7.5)式，認(rèn)知層級(jí)模型進(jìn)一步假定，參與者A形成對(duì)策略sA1的期望收益之后，即可通過一個(gè)Logit反應(yīng)函數(shù)將這一收益映射為選擇策略sA1的概率，表示為：其中λ代表反應(yīng)敏感度。于是選擇策略sA2的概率自然為1-PA(sA1)。關(guān)于參與者B對(duì)各策略的選擇概率也可按上述的分析方法求出，當(dāng)然需預(yù)先假設(shè)他可實(shí)施的推理步數(shù)，即認(rèn)知層級(jí)水平。可見，在該理論下，認(rèn)知層級(jí)是影響參與者策略選擇的重要因素。7.3.3對(duì)實(shí)驗(yàn)數(shù)據(jù)的擬合上文僅是對(duì)認(rèn)知層級(jí)模型的簡單說明。在該模型的原始版本中，一般基于泊松分布來描述使用不同推理步數(shù)的參與者的概率（實(shí)際數(shù)據(jù)可用相應(yīng)的受試者占比來表示），具體形式可見7.6節(jié)的附錄，在那里，我們將泊松分布的密度函數(shù)表達(dá)為f(c|τ)，其中τ表示該分布的均值和方差?？梢?，這種分布只涉及單一的參數(shù)τ，因此認(rèn)知層級(jí)模型形式簡單且便于應(yīng)用。為了展示這一模型的預(yù)測與擬合結(jié)果，我們?cè)诒?-2中給出了何、凱莫勒和魏格爾特(1998)所進(jìn)行的兩次選美競猜博弈實(shí)驗(yàn)（比例值分別設(shè)為P=0.9和P=0.7兩種情形），其中納什均衡預(yù)測均為數(shù)字0。在表中，我們分別給出了實(shí)驗(yàn)結(jié)果

人人文庫> 全部分類> 行業(yè)資料 > 醫(yī)學(xué)制藥

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知

文檔簡介

溫馨提示

最新文檔

評(píng)論

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

《行為經(jīng)濟(jì)學(xué)：選擇、互動(dòng)與宏觀行為》第7章有限認(rèn)知