博弈論與競爭策略課件3_第1頁
博弈論與競爭策略課件3_第2頁
博弈論與競爭策略課件3_第3頁
博弈論與競爭策略課件3_第4頁
博弈論與競爭策略課件3_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

博弈論與競爭策略

博弈論與競爭策略課堂游戲(一)“幸存者”策略:移旗

在兩個(gè)部落之間的地面插著21支旗,兩個(gè)部落輪流移走這些旗。每個(gè)部落在輪到自己時(shí),可以選擇移走1支、2支或3支旗。(這里,0支旗代表放棄移走旗的機(jī)會(huì),是不允許的;也不允許一次移走4支或4支以上的旗。)拿走最后1支旗的一組獲勝,無論這支旗是最后1支,還是2支或3支旗中的一支。如果你先拿,你該如何做呢?博弈論與競爭策略課堂游戲(二)紙幣拍賣

我這有1塊錢,下面請大家競拍。出價(jià)最高的競拍者可以自己所出價(jià)格獲得這1塊錢,但出價(jià)次高的競拍者也要交出自己所報(bào)的數(shù)目,且什么都不會(huì)獲得。你會(huì)為這1塊錢出價(jià)多少呢?如果是100塊呢?1萬塊呢?博弈論與競爭策略

“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對博弈論有一個(gè)大致了解”

——保羅·薩繆爾森博弈論與競爭策略

“博弈論”的英語原文是GameTheory,直譯過來就是游戲論、運(yùn)動(dòng)論或競賽論。什么叫博弈?博弈的英文為game,即“游戲”。而在西方,game的意義不同于漢語中的游戲。在英語中,game即是人們遵循一定規(guī)則下的活動(dòng),進(jìn)行活動(dòng)的人的目的是使自己“贏”。奧林匹克運(yùn)動(dòng)會(huì)叫OlympicGames。在英文中,game有競賽的意思,進(jìn)行g(shù)ame的人是很認(rèn)真的,不同于漢語中游戲的概念。在漢語中,游戲有兒戲的味道。博弈論與競爭策略博弈論導(dǎo)論——博弈與我們的生活周末了,帶女朋友看球賽還是跟女朋友去聽音樂會(huì)?

母女博弈囚徒困境與價(jià)格戰(zhàn)博弈論與競爭策略囚徒困境案情描述兩犯罪嫌疑人囚徒A與囚徒B因犯非法持有槍械罪和被懷疑可能犯有一級謀殺罪被逮捕,檢察官將他們分別關(guān)在兩間牢房里進(jìn)行審訊。檢察官對囚徒A說,“我們的政策是‘坦白從寬,抗拒從嚴(yán)’;如果你坦白而他不坦白,那么你將被無罪釋放,他將會(huì)因一級謀殺罪被判死刑;如果他坦白而你不坦白,他將被無罪釋放,而你將會(huì)因一級謀殺罪被判死刑;如果你們都坦白,你們都將會(huì)被輕判?!碑?dāng)然檢察官對B說的話也是完全一樣。但實(shí)際上,如果兩個(gè)人都坦白,卻會(huì)因涉及更多的罪案而都被判無期。而兩人都不坦白,只能按非法持有槍械罪被分別判一年。若你是囚徒A或B,你將如何選擇呢?個(gè)體理性與集體理性的沖突囚徒B囚徒A

坦白拒不交待

坦白拒不交待無期,無期死刑,釋放釋放,死刑一年,一年囚徒1:坦白囚徒2:坦白博弈論與競爭策略博弈論導(dǎo)論—現(xiàn)代博弈論簡單發(fā)展史起源可以追溯到1944年數(shù)學(xué)家馮諾伊曼與經(jīng)濟(jì)學(xué)家摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》田忌賽馬博弈論與競爭策略博弈論導(dǎo)論——博弈論的五大要素(以情侶博弈為例)行動(dòng)、策略、策略空間支付、得益次序博弈均衡決策主體:參與人、博弈方博弈論與競爭策略博弈論導(dǎo)論——博弈的分類合作博弈、非合作博弈單人博弈、兩人博弈、多人博弈

有限博弈、無限博弈零和博弈、常和博弈、變和博弈靜態(tài)博弈、動(dòng)態(tài)博弈、重復(fù)博弈(有限次-無限次)完全信息博弈、不完全信息博弈完美信息博弈、不完美信息博弈博弈論與競爭策略博弈論導(dǎo)論——博弈的表示方法如果博弈參與人和策略有限,則可有如下兩種形式表示一個(gè)博弈:-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面乙甲(0,4)(2,2)(1,0)不借借分不分開金礦博弈博弈論與競爭策略博弈論導(dǎo)論每一個(gè)博弈都是一個(gè)你中有我,我中有你的情形,不同的博弈參與者可以選擇不同的行動(dòng),但由于相互作用,一個(gè)博弈參與者的得益不僅取決于自己采取的行動(dòng),也取決于其他博弈參與者所采取的行動(dòng)。博弈論的精髓在于基于系統(tǒng)思維基礎(chǔ)上的理性換位思考,即在選擇你的行動(dòng)時(shí)還是考慮你的得益,但是你應(yīng)當(dāng)用他人的得益去推測他人的行動(dòng),從而選擇最有利于自己的行動(dòng)。博弈論與競爭策略靜態(tài)博弈求解:均衡分析-納什均衡相對優(yōu)勢策略(relativelydominant-strategy):一種策略-在對手選定某個(gè)策略條件下博弈參與人的優(yōu)勢策略。求解方法:相對優(yōu)勢策略標(biāo)記法。假設(shè)參與者1認(rèn)為參與者2選擇“A”,則他應(yīng)選?參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5博弈論與競爭策略參與者1應(yīng)該選擇“a”參與者1對“A”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5假設(shè)參與者2認(rèn)為參與者1選擇“a”,則參與者2應(yīng)該選擇“C”參與者2對“a”的最優(yōu)反應(yīng)是“C”.博弈論與競爭策略假設(shè)參與者1認(rèn)為參與者2選擇“B”,則參與者1應(yīng)該選擇“a”參與者1對“B”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5假設(shè)參與者2認(rèn)為參與者1選擇“b”,則參與者2應(yīng)該選擇“C”參與者2對“b”的最優(yōu)反應(yīng)是“C”.博弈論與競爭策略假設(shè)參與者1認(rèn)為參與者2選擇“C”,則參與者1應(yīng)該選擇“a”參與者1對“C”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5假設(shè)參與者2認(rèn)為參與者1選擇“c”,則參與者2應(yīng)該選擇“A”參與者2對“c”的最優(yōu)反應(yīng)是“A”.博弈論與競爭策略結(jié)果“a”是參與者1對“C”的最優(yōu)反應(yīng).“C”是參與者2對“a”的最優(yōu)反應(yīng).此結(jié)果被稱為納什均衡:

在給定其他參與者策略情況下,沒有一個(gè)參與者能通過單方面改變自己的策略而使自己的得益提高,從而沒有人有積極性打破這種均衡。參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5博弈論與競爭策略關(guān)鍵點(diǎn):納什均衡

我所做的是:給定你所做的,我所做的是最好的;你所做的是:給定我所做的,你所做的是最好的博弈論與競爭策略靜態(tài),一次博弈的應(yīng)用公司的廣告(或價(jià)格)博弈策略不做廣告做廣告不做廣告10,105,13做廣告13,57,7默克肯德基納什均衡博弈論與競爭策略彩電價(jià)格大戰(zhàn)策略低價(jià)高價(jià)低價(jià)0,03,-1高價(jià)-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價(jià)格競爭)海信長虹納什均衡博弈論與競爭策略智豬博弈

豬圈中有一頭大豬一頭小豬,豬圈一端有個(gè)按鈕,每按一下豬圈另一端食槽中會(huì)有10個(gè)單位豬食進(jìn)槽,但按一下會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,大豬吃到9單位食物,小豬只能吃到1單位;如小豬先到,小豬吃4單位而大豬吃6單位;如果同時(shí)按并同時(shí)到食槽,則大豬吃7單位而小豬吃3單位食物。按等待按5,14,4等待9,-10,0小豬大豬納什均衡博弈論與競爭策略性別之戰(zhàn)-情侶博弈-協(xié)調(diào)博弈策略足球音樂會(huì)足球2,10,0音樂會(huì)0,01,2女男納什均衡一對戀人準(zhǔn)備在周末晚上一起出去玩,男的喜歡看球賽,但女的比較喜歡聽音樂會(huì)。當(dāng)然,兩個(gè)人都不愿意分開活動(dòng),不同的選擇給他們帶來的滿足由下表:納什均衡博弈論與競爭策略協(xié)調(diào)博弈策略220伏110伏220伏$100,$1000,0110伏0,0$100,$100企業(yè)B企業(yè)A此協(xié)調(diào)博弈有兩個(gè)納什均衡產(chǎn)業(yè)標(biāo)準(zhǔn)(軟盤、CD的大小等)國家標(biāo)準(zhǔn)(電壓、交通法等)博弈論與競爭策略回到囚徒困境是否有方法脫離這種困境,從而使博弈方(寡頭壟斷企業(yè))協(xié)調(diào)和合作成功呢?若囚徒困境博弈重復(fù)進(jìn)行下去?在重復(fù)博弈中,囚徒的困境可以有合作的結(jié)果。囚徒B囚徒A

坦白拒不交待

坦白拒不交待無期,無期死刑,釋放釋放,死刑一年,一年囚徒1:坦白囚徒2:坦白重復(fù)博弈博弈論與競爭策略生活中的重復(fù)博弈如果你去菜場買菜,當(dāng)你對菜的質(zhì)量、重量等有疑慮時(shí),賣菜的阿姨常會(huì)講:“你放心,我一直在這兒賣呢!”在車站和旅游點(diǎn)等人群流動(dòng)性大的地方,不但商品和服務(wù)質(zhì)量差,而且假貨橫行,因?yàn)樯碳液皖櫩烷g“沒有下一次”。在公共汽車上,兩個(gè)陌生人會(huì)為一個(gè)座位爭吵,可如果他們相互認(rèn)識(shí),就會(huì)相互謙讓。在社會(huì)聯(lián)系緊密的人際關(guān)系中,人們普遍比較注意禮節(jié)和道德,因?yàn)樗麄冃枰L期交往,并且對未來的交往存在預(yù)期。博弈論與競爭策略重復(fù)博弈—廣告博弈兩個(gè)企業(yè)(Kellogg’s&GeneralMills)的經(jīng)理想最大化利潤策略是廣告活動(dòng)靜態(tài)、一次博弈無限重復(fù)博弈有限重復(fù)博弈博弈論與競爭策略靜態(tài)、一次廣告博弈通用面粉凱洛格策略無廣告中等強(qiáng)度高強(qiáng)度無廣告12,121,20-1,15中等強(qiáng)度20,16,60,9高強(qiáng)度15,-19,02,2博弈論與競爭策略一次廣告博弈的均衡納什均衡通用面粉凱洛格策略無廣告中等強(qiáng)度高強(qiáng)度無廣告12,121,20-1,15中等強(qiáng)度20,16,60,9高強(qiáng)度15,-19,02,2劣策略:不管其他參與人采取什么策略,都能導(dǎo)致最低收益的策略理性參與人永遠(yuǎn)不會(huì)選擇劣策略許多博弈中參與者都沒有占優(yōu)策略,但仍可能通過劣策略的重復(fù)剔除進(jìn)行分析,這種方法稱劣策略重復(fù)剔除法博弈論與競爭策略如果企業(yè)每年都進(jìn)行這種一次博弈,并且永遠(yuǎn)進(jìn)行下去,這時(shí)參與人可以對對手的“欺騙”行為進(jìn)行懲罰或報(bào)復(fù)。在這種情況下,共謀起作用嗎?觸發(fā)策略“如果對手在過去沒有做過廣告,我就不做;一旦對手作廣告,自此以后,我就用高強(qiáng)度的廣告活動(dòng)來懲罰他”事實(shí)上,只要對手在過去沒有過“欺騙”行為,各個(gè)企業(yè)都會(huì)同意“合作”。因?yàn)槠垓_行為會(huì)引發(fā)以后所有時(shí)期的懲罰。無限重復(fù)博弈博弈論與競爭策略假設(shè)GeneralMills采用了這種觸發(fā)策略,Kellogg’s的利潤是多少呢?合作

=12+12/(1+i)+12/(1+i)2+12/(1+i)3+… =12+12/i相當(dāng)于每年年底得到¥12的永久年金欺騙

=20+2/(1+i)+2/(1+i)2+2/(1+i)3+=20+2/i通用面粉凱洛格策略無廣告中等強(qiáng)度高強(qiáng)度無廣告12,121,20-1,15中等強(qiáng)度20,16,60,9高強(qiáng)度15,-19,02,2博弈論與競爭策略Kellogg從欺騙行為中獲得的好處:欺騙

-合作

=20+2/i-(12+12/i)=8-10/i假設(shè)i=.05欺騙

-合作

=8-10/.05=8-200=-192欺騙沒有好處.在無限次重復(fù)博弈中共謀是納什均衡!通用面粉凱洛格策略無廣告中等強(qiáng)度高強(qiáng)度無廣告12,121,20-1,15中等強(qiáng)度20,16,60,9高強(qiáng)度15,-19,02,2博弈論與競爭策略關(guān)鍵點(diǎn)當(dāng)博弈無限重復(fù)沒有確定的“終結(jié)之日”時(shí),共謀作為納什均衡就能夠維持下去這需要:有能力監(jiān)督對手的行動(dòng)有懲罰叛徒的能力和名聲低利率在未來進(jìn)行博弈的機(jī)會(huì)多

市場條件:廠商數(shù)目很少穩(wěn)定的需求穩(wěn)定的成本博弈論與競爭策略如果博弈有限重復(fù)進(jìn)行,共謀起作用嗎?有限重復(fù)博弈假設(shè)廣告博弈被重復(fù)兩次通用面粉凱洛格策略無廣告中等強(qiáng)度高強(qiáng)度無廣告12,121,20-1,15中等強(qiáng)度20,16,60,9高強(qiáng)度15,-19,02,2納什均衡博弈論與競爭策略用逆向歸納法,結(jié)論是:不。在第二階段,博弈是一次博弈,因此在這最后階段,均衡是高強(qiáng)度的廣告活動(dòng).由于每個(gè)人都知道第二階段的結(jié)果,因此,第一階段就變成了最后階段.兩個(gè)企業(yè)在兩個(gè)時(shí)期的均衡策略都是高強(qiáng)度的廣告活動(dòng).如果博弈重復(fù)已知的有限次數(shù),同樣的結(jié)果依然成立動(dòng)態(tài)博弈求解:倒推法倒退法的邏輯基礎(chǔ):先行動(dòng)的居中人在前面階段選擇行動(dòng)時(shí),必然會(huì)考慮后面行動(dòng)局中人的會(huì)如何行動(dòng),因此,只有在博弈最后一個(gè)階段的博弈方才不會(huì)受到后續(xù)階段的牽制,才能做出明確的選擇;但后面階段博弈方的選擇確定后,前一階段博弈方的行動(dòng)也就容易確定了。動(dòng)態(tài)博弈納什:倒推法男女球賽球賽球賽音樂音樂音樂(2,1)(0,0)(-1,-1)(1,2)先動(dòng)優(yōu)勢-后動(dòng)優(yōu)勢動(dòng)態(tài)博弈中,博弈方行動(dòng)有先有后,若博弈方先行動(dòng)得益大于其后行動(dòng)得益的情況,稱為先動(dòng)優(yōu)勢;后行動(dòng)得益比先行動(dòng)得益大的情況叫做后動(dòng)優(yōu)勢先動(dòng)優(yōu)勢:“先下手為強(qiáng)”,動(dòng)態(tài)情侶博弈等后動(dòng)優(yōu)勢:“謙讓是?!?、猜拳博弈、切蛋糕等先動(dòng)優(yōu)勢并非先行動(dòng)者得益大于后行動(dòng)者得益,后動(dòng)優(yōu)勢也并非后行動(dòng)者得益大于先行動(dòng)者得益。策略性行動(dòng)回到之前的進(jìn)入博弈:盡管在A猶豫是否要進(jìn)入的階段,B威脅說只要A進(jìn)入,它就選擇商戰(zhàn),但最終A選擇進(jìn)入時(shí),B卻會(huì)選擇容忍,因此,其之前的威脅是不可信的。博弈研究局中人互動(dòng)行為,博弈的結(jié)果取決于博弈各方的行動(dòng),因此,在博弈過程中,一些局中人為達(dá)到某種目的,往往采取策略性行動(dòng),即某些能影響對手行動(dòng)的行為(誘使對手采取有利于自己的行動(dòng)或阻止對手采取不利于自己的行動(dòng))。策略性行動(dòng)要求:可觀察性;不可逆性,否則無效。策略性行動(dòng)策略性行動(dòng):承諾(commitment)、威脅(threat)和允諾(promise)

承諾是一種無條件的策略性行動(dòng),如在B行動(dòng)的階段,A卻對B說“在下階段我將采取行動(dòng)X”,這意味著未來階段無論B如何行動(dòng),A都將采取行動(dòng)X,A的行動(dòng)是無條件的

威脅和允諾是條件依存的策略性行動(dòng),若A對B說,“除非你的行動(dòng)符合我的條件,否則我將采取行動(dòng)報(bào)復(fù)你”,這是威脅;若說,“如果你的行動(dòng)符合我的條件,我將采取對你有利的行動(dòng)”,則是允諾。策略性行動(dòng)要求:可觀察性;不可逆性,否則無效。策略性行動(dòng)的例子承諾:(靜態(tài))情侶博弈中,男方可以先買好球賽的門票,然后再打給女方;當(dāng)然,女方也可以采取策略性行動(dòng),比如女方故意不接男方(使男方的策略性行動(dòng)不具可觀察性),到最后約會(huì)時(shí)才出現(xiàn)。威脅:父母管教挑食的孩子,“若不吃青菜,就不許吃糖”允諾:為讓孩子努力學(xué)習(xí),“若考第一名,則獎(jiǎng)勵(lì)臺(tái)電腦”每個(gè)威脅都會(huì)與一個(gè)隱含的允諾相關(guān)聯(lián),反之亦然。若好好復(fù)習(xí),就能通過考試-(隱含,即言外之意)若不好好復(fù)習(xí),則可能通不過威脅與允諾的區(qū)別在于,若威脅成功,則無需實(shí)施威脅的內(nèi)容,因此是無成本的,而允諾是有成本的。策略性行動(dòng)的可信性問題策略性行動(dòng)是否可信,取決于此行動(dòng)對博弈支付/得益的改變程度。為了使策略性行動(dòng)可信,可以采取一些輔助行動(dòng),如:書面合作;聲譽(yù),等等如進(jìn)入博弈中,為了使自己的威脅可信,可以建造、維護(hù)和運(yùn)行一個(gè)額外的生產(chǎn)能力。博弈論與競爭策略動(dòng)態(tài)博弈與倒推法舉例:海盜分贓有五個(gè)海盜,劫掠了100兩金子,需要分贓,盜亦有道,他們分贓的辦法是抓鬮。抓到鬮的人,可以先提出一個(gè)分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否則,他就要被殺掉。余下的人也照此辦理。請問:如果你是第一個(gè)抓到鬮的人,你會(huì)提出怎樣的分配方案?(請仔細(xì)思考,否則有生命危險(xiǎn))博弈論與競爭策略海盜分贓我希望你們的答案是:“100兩金子全歸我”。當(dāng)然,分析此問題有一個(gè)可以接受的假定:每個(gè)人都是理性的追求自己利益極大化的人??赡苣銜?huì)提出平均分配,每人20兩,或者自己干脆不要,等等。但你利他行為就一定會(huì)有好報(bào)嗎?不盡然,不管第一個(gè)人提出什么分配方案,即使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論