貝氏決策理論

上傳人：b*** IP屬地：遼寧上傳時(shí)間：2024-01-02 格式：DOC 頁(yè)數(shù)：19 大小：917.50KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩14頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章貝氏決策理論Sec.2.1簡(jiǎn)介1.決策問(wèn)題的基本結(jié)構(gòu)行動(dòng)→本性狀況→結(jié)果行動(dòng)：決策時(shí)可採(cǎi)取的策略，通常以a表之，令為行動(dòng)空間(actionspace)。本性狀況：決策時(shí)可能面臨的情況，通常以參數(shù)表之。令為參數(shù)空間(parameterspace)。結(jié)果：決策在所面臨的實(shí)際情況下，所產(chǎn)生的後果，常以支付(收益、損失、成本)或悔惜表之。2.決策時(shí)可引用的資訊(1)行動(dòng)所導(dǎo)致的結(jié)果指相關(guān)的支付(收益、損失、成本)與悔惜，本章將以損失函數(shù)為主。(2)本性狀況的資訊指各種本性狀況的發(fā)生率，這常會(huì)涉及某些參數(shù)。如果參數(shù)有未知的情況時(shí)，我們可能須利用樣本，以取得相關(guān)訊息。(3)樣本的訊息為增加決策的客觀性，我們會(huì)透過(guò)抽樣(或?qū)嶒?yàn))取得樣本，再利用樣本的資訊來(lái)形成決策。(4)決策者的經(jīng)驗(yàn)指決策者對(duì)參數(shù)的看法。引用決策者對(duì)參數(shù)的看法的決策方法，稱之為貝氏方法(Bayesapproach)。在貝氏決策模式中，通常把相關(guān)參數(shù)視為隨機(jī)變數(shù)，亦即決策者對(duì)參數(shù)的分布有一定的看法。也就是說(shuō)，認(rèn)為參數(shù)的分布是已知的，而參數(shù)的分布稱之為事前分布(priordistribution)。例1：藥商欲決定新藥是否要上市？有兩個(gè)量數(shù)是重要考量：(1)藥的效能，及(2)市場(chǎng)接受度。(1)行動(dòng)空間，其中表上市；表不上市。(2)參數(shù)空間。(3)根據(jù)及之值，可算出行動(dòng)及之支付(或悔惜)值。(4)由於二量數(shù)及是未知的，我們必須取得相關(guān)樣本資訊。(a)透過(guò)臨床實(shí)驗(yàn)→取得樣本→猜測(cè)之值。(b)透過(guò)市場(chǎng)調(diào)查→取得樣本→猜測(cè)之值。(5)根據(jù)藥商多年經(jīng)營(yíng)的經(jīng)驗(yàn)，或許對(duì)及有相關(guān)的看法，而可提供決策參考?！鶄鹘y(tǒng)統(tǒng)計(jì)決策理論：引用樣本資訊及行動(dòng)之結(jié)果的資訊作決策?！愂蠜Q策理論：除了引用樣本資訊及行動(dòng)之結(jié)果的資訊外，尚引用決策者的經(jīng)驗(yàn)(指對(duì)參數(shù)的看法)作決策。3.損失函數(shù)(1)當(dāng)實(shí)際狀況為時(shí)，而採(cǎi)取行動(dòng)a所受的處罰，記為，即為損失函數(shù)(lossfunction)。(2)通常規(guī)定。例1：(續(xù))藥商欲依市場(chǎng)接受度決定新藥是否要上市？(1)行動(dòng)空間，其中表上市；表不上市。(2)參數(shù)空間。(3)損失函數(shù)(4)抽樣：實(shí)際隨機(jī)抽出n個(gè)人，設(shè)其中有X個(gè)人表示認(rèn)同，則。(5)藥商根據(jù)過(guò)往的經(jīng)驗(yàn)，新藥推出的市場(chǎng)接受度不會(huì)太高，而其事前分布應(yīng)為布於[0.10.2]上之均勻分布(uniformdistribution)，i.e.。Sec.2.2期望損失、決策規(guī)則及風(fēng)險(xiǎn)1.期望損失定義1.設(shè)參數(shù)之事前分布為，則行動(dòng)a之貝氏期望損失(Bayesianexpectedloss)為。例1：(續(xù))損失函數(shù)之事前分布為，(i.e.均勻分布)，則貝氏期望損失為例2：投資者有兩種投資選擇：為投資具風(fēng)險(xiǎn)債券；為投資無(wú)風(fēng)險(xiǎn)債券。其面臨兩種可能狀況：表”nodefaultoccurs”；表”adefaultoccurs”。相關(guān)損失函數(shù)為-5001,000-300-300又之prior為。試求貝氏期望損失？Sol：2.FrequentistRisk未引用貝氏方法之統(tǒng)計(jì)決策理論稱之為frequentistschool(或classicalschool)。定義2.設(shè)表樣本空間，表行動(dòng)空間。一決策規(guī)則(decisionrule)乃由映至之函數(shù)。當(dāng)樣本觀測(cè)值為x時(shí)，即為所採(cǎi)取之行動(dòng)。對(duì)二決策規(guī)則與而言，若，則稱與為等價(jià)(equivalent)。例3：一公司當(dāng)其訂貨(如零件)送達(dá)時(shí)，其須驗(yàn)貨以決定是否接受該批貨物？今隨機(jī)抽驗(yàn)n件貨品，設(shè)X表n件貨品中不良品的個(gè)數(shù)，則，其中為不良率。樣本空間。參數(shù)空間。行動(dòng)空間，其中表接受該貨物；表退回該貨物。決策規(guī)則我們常以來(lái)估計(jì)之值，故可定義如下：定義3.決策規(guī)則之風(fēng)險(xiǎn)函數(shù)(riskfunction)為?！?dāng)樣本資料時(shí)，。定義4.(1)當(dāng)，則稱isR-betterthan。(2)當(dāng)，則稱與為R-equivalent。定義5.(1)對(duì)決策規(guī)則而言，若不存在任何R-better之決策規(guī)則，則稱為可取的(admissible)。(2)對(duì)決策規(guī)則而言，若存在使得，且與並非R-equivalent，則稱為不可取的(inadmissible)。例4：設(shè)，現(xiàn)以a估計(jì)，其損失函數(shù)為。令決策規(guī)則為，試求風(fēng)險(xiǎn)函數(shù)？Sol：Case1：c>1故isR-betterthan所以是不可取的。Case2：時(shí)，與難分高下。例5：一決策問(wèn)題相關(guān)之損失矩陣如下：134-1550-1-1在無(wú)樣本資料之情況下，試比較三個(gè)行動(dòng)之優(yōu)劣？Sol：因無(wú)樣本資料，故。(1)因，且，故為inadmissible。(2)與均為admissible。定義6.設(shè)之prior為，則決策規(guī)則之貝氏風(fēng)險(xiǎn)(Bayesrisk)為。例4：(續(xù))設(shè)之prior為，試求之貝氏風(fēng)險(xiǎn)？Sol：由前例，已知。Sec.2.3隨機(jī)化決策規(guī)則1.當(dāng)一決策問(wèn)題會(huì)遭遇聰明的對(duì)手，引用隨機(jī)化決策規(guī)則(randomizeddecisionrule)是有其必要的。2.使用隨機(jī)化決策規(guī)則旨在降低風(fēng)險(xiǎn)，提高決策之效力(power)。3.在Sec.2.2中所介紹的策規(guī)則稱之為非隨機(jī)化決策規(guī)則(nonrandomizeddecisionrule)。例6：(Matchingpennies)一遊戲是這樣的：當(dāng)你和你的對(duì)手同時(shí)打開(kāi)兩個(gè)銅板，若二者相同，則你贏1元；又若二者不同，則你輸1元。(1)本性狀況：表對(duì)手出正面；表對(duì)手出反面。(2)行動(dòng)：表對(duì)手出正面；表對(duì)手出反面。(3)損失矩陣：-111-1(4)明顯的，與均為admissible。如果你一直採(cǎi)用(或)，則聰明的對(duì)手很快就會(huì)發(fā)覺(jué)，而改採(cǎi)(或)。(5)為了解決這種困境，你可以在出牌前，先投擲一的銅板。當(dāng)銅板出現(xiàn)正面時(shí)，則出正面；反之，出反面。換言之，有p的機(jī)會(huì)出正面；有1-p的機(jī)會(huì)出反面(p是該銅板出現(xiàn)正面的機(jī)率)。定義7.隨機(jī)化決策規(guī)則是定義於行動(dòng)空間A上之一機(jī)率分布，以說(shuō)明各行動(dòng)a被採(cǎi)用之發(fā)生率?！碛^測(cè)到x時(shí)，採(cǎi)行動(dòng)a之機(jī)率。※表觀測(cè)到x時(shí)，採(cǎi)行動(dòng)落在中之機(jī)率。※非隨機(jī)化決策規(guī)則可視為一種特別的隨機(jī)化決策規(guī)則?！请S機(jī)化決策規(guī)則可表為如今型式之隨機(jī)化決策規(guī)則：例6：(續(xù))隨機(jī)化決策規(guī)則可訂為。對(duì)傳統(tǒng)統(tǒng)計(jì)推論而言，所謂最佳檢定規(guī)則乃在固定的顯著水準(zhǔn)下，其檢定效力為最大者。在這種情況下，通常最佳檢定規(guī)則其犯第一型錯(cuò)誤的機(jī)率(即-risk)會(huì)與相同。但當(dāng)變數(shù)為間斷型時(shí)，最佳檢定規(guī)則其犯第一型錯(cuò)誤的機(jī)率通常會(huì)低於。換言之，此檢定真正的顯著水準(zhǔn)應(yīng)小於。為增加檢定的效力可引用隨機(jī)化決策規(guī)則。例7：投擲一銅板n次，設(shè)X表n次中正面出現(xiàn)的次數(shù)，則，其中為不良率，而樣本空間為。今欲在顯著水準(zhǔn)準(zhǔn)為之情況下，檢定，棄卻域的型式為。行動(dòng)空間，其中表接受；表?xiàng)墔s。，通常等號(hào)不會(huì)成立。定義8.設(shè)為一隨機(jī)化決策規(guī)則，則其損失函數(shù)為上述期望值是針對(duì)a做的。又之風(fēng)險(xiǎn)函數(shù)為。例6：(續(xù)Matchingpennies)因?yàn)闊o(wú)樣本資料。故當(dāng)時(shí)，。例7：(續(xù))(1)樣本空間為(2)統(tǒng)計(jì)假設(shè)(3)行動(dòng)空間，其中表接受；表?xiàng)墔s。(4)隨機(jī)化決策規(guī)則為而。(5)損失函數(shù)為(6)風(fēng)險(xiǎn)函數(shù)為定義9.對(duì)隨機(jī)化決策規(guī)則而言，我們?nèi)砸燥L(fēng)險(xiǎn)函數(shù)來(lái)衡量?jī)?yōu)劣，故先前定義之R-better及admissible一體適用。例7：(續(xù))當(dāng)統(tǒng)計(jì)假設(shè)，在顯著水準(zhǔn)為0.05下，試求最佳隨機(jī)化檢定規(guī)則？(提示：即決定p及j之值)Sec.2.4決策原則1.TheconditionalBayesdecisionprinciple設(shè)一決策問(wèn)題之行動(dòng)空間為，參數(shù)空間為，而參數(shù)之prior為，行動(dòng)a之貝氏期望損失為。若，則稱為貝氏行動(dòng)(Bayesaction)。貝氏行動(dòng)即在TheconditionalBayesdecisionprinciple下之最佳行動(dòng)。TheconditionalBayesdecisionprinciple適用在無(wú)樣本資料之情況。例1：(續(xù))由前例已算得貝氏期望損失為當(dāng)。當(dāng)。當(dāng)。由(1),(2)及(3)，故貝氏行動(dòng)為。例3：(續(xù))由前例已算得貝氏期望損失為，，故貝氏行動(dòng)為。2.Frequentistdecisionprinciple(1)以風(fēng)險(xiǎn)函數(shù)來(lái)衡量決策規(guī)則之優(yōu)劣，固然有R-better,admissible等性質(zhì)，但滿足admissilbe的決策規(guī)則可能不只一個(gè)(往往不勝枚舉)，那要如何比較它們的優(yōu)劣？(這種困難源自風(fēng)險(xiǎn)函數(shù)含有未知參數(shù))應(yīng)引進(jìn)新的概念！(2)在傳統(tǒng)統(tǒng)計(jì)推論中引進(jìn)了以下概念：(a)maximumlikelihood(b)unbiasedness(c)minimumvariance(d)leastsquare(3)在決策理論中引進(jìn)了以下概念：(a)theBayesriskprinciple(b)theminimaxprinciple(c)theinverseprinciple2.1TheBayesriskprinciple(1)重要的概念：引進(jìn)專家的經(jīng)驗(yàn)，認(rèn)為參數(shù)應(yīng)為隨機(jī)變數(shù)，而有其服從的機(jī)率分布。在這樣概念下，可以求得貝氏風(fēng)險(xiǎn)。※貝氏風(fēng)險(xiǎn)之值與無(wú)關(guān)。(2)原則(a)若，則稱優(yōu)於(i.e.偏好)。(b)若，則為適當(dāng)?shù)?optimal)，而稱為貝氏規(guī)則(Bayesrule)。令，稱之為相對(duì)於之貝氏風(fēng)險(xiǎn)(即最小貝氏風(fēng)險(xiǎn))。例4：(續(xù))，prior：，lossfunction：，decisionrule：，求得之Bayesrisk為。試求貝氏決策規(guī)則及相對(duì)prior之貝氏風(fēng)險(xiǎn)？(1)，其中。(2)貝氏決策規(guī)則。2.2Theminimaxprinciple(1)概念：最小最大原則乃在最壞的情況下，求最好的結(jié)果。(2)原則(a)若，則稱優(yōu)於(i.e.偏好)。(b)若，則稱為最小最大決策規(guī)則(minimaxdecisionrule)。例4：(續(xù))，lossfunction：，decisionrule：，求得之riskfunction為。Case1：當(dāng)，。Case2：當(dāng)。由Case1及2，故minimaxdecisionrule為。例3：(續(xù)riskyinvestment)損失矩陣為-5001,000-300-300試求minimaxdecisionrule？故minimaxdecisionrule為。例6：(續(xù)matchingpennies)隨機(jī)化決策規(guī)則為。同理，故minimaxdecisionrule為。2.3Theinverseprinciple(1)概念：當(dāng)兩個(gè)決策問(wèn)題有相同結(jié)構(gòu)時(shí)，在相同之決策準(zhǔn)則下，所求得之(最佳)決策規(guī)則應(yīng)對(duì)應(yīng)相等。(2)inverseprinciple主要用於決策問(wèn)題的轉(zhuǎn)換上。Sec.2.5Foundations1.傳統(tǒng)統(tǒng)計(jì)推論之誤用(1)未考量：(a)prior：指經(jīng)驗(yàn)。(b)損失的資訊：指估計(jì)誤差的大小所造成損失的差異。(2)過(guò)於強(qiáng)調(diào)統(tǒng)計(jì)顯著性，而忽略實(shí)際的應(yīng)用價(jià)值。2.Thefrequentistperspective(1)以global的眼光來(lái)看問(wèn)題。(2)以長(zhǎng)期執(zhí)行情形之平均結(jié)果來(lái)衡量?jī)?yōu)劣。例10：設(shè)是取自，其中為未知，。之信賴區(qū)間為令損失函數(shù)為例11：設(shè)是取自，其中為已知，?，F(xiàn)欲檢定之值？(1)(2)(3)Under(4)Decisionrule：在決策問(wèn)題中：(1)行動(dòng)：表接受；表?xiàng)墔s。(2)損失函數(shù)為(3)決策規(guī)則為(4)風(fēng)險(xiǎn)函數(shù)為(i)(ii)同理，。3.Theconditionalperspective(1)會(huì)參酌局部的資料，做進(jìn)一步的判斷。(2)決策時(shí)，會(huì)加上決策者的經(jīng)驗(yàn)(與prior不同)。例12：設(shè)為取自pdf為之二獨(dú)立隨機(jī)樣本。而?，F(xiàn)欲估計(jì)之值？(1)因?yàn)?，傳統(tǒng)上我們以估計(jì)。其猜對(duì)的機(jī)率為0.5。結(jié)果×ＯＯ×(2)引用，定義如下。其猜對(duì)的機(jī)率為0.75。結(jié)果×ＯＯＯ例13：設(shè)隨機(jī)變數(shù)X之分布如下，欲檢定參數(shù)之值？x1230.0050.0050.990.00510.98490.01(1)(2)(3)Decisionrule為(4)討論：(i)當(dāng)。但，二者幾無(wú)差別，故上述結(jié)論有可議之處。(ii)當(dāng)。但，二者差異甚大，故上述結(jié)論合理。4.Thelikelihoodprinciple定義11.設(shè)是取自pdf為之n個(gè)獨(dú)立隨機(jī)樣本，其中為參數(shù)。設(shè)樣本觀測(cè)值為。定義，則稱為相對(duì)於觀測(cè)值之概似函數(shù)(likelihoodfunction)。※看起來(lái)概似函數(shù)與聯(lián)合機(jī)率密度函數(shù)是一樣的，但實(shí)際上卻不相同。因?yàn)楦潘坪瘮?shù)是參數(shù)之函數(shù)(樣本觀測(cè)值為是已知的)；而聯(lián)合機(jī)率密度函數(shù)是樣本觀測(cè)值為的函數(shù)(參數(shù)為常數(shù))。Thelikelihoodprinciple：(1)當(dāng)觀測(cè)到x之後，在推論參數(shù)之值時(shí)，其所有相關(guān)的實(shí)驗(yàn)資訊(experimentalinformation)全在概似函數(shù)中。(2)若二概似函數(shù)成比例(常數(shù)倍)，則二者所涵蓋的實(shí)驗(yàn)資訊是相同的。例15：欲檢定一銅板是否公正？即檢定。(設(shè))(1)實(shí)驗(yàn)一：將此銅板投擲12次，設(shè)X表正面出現(xiàn)的次數(shù)。當(dāng)x=9。(2)實(shí)驗(yàn)二：將此銅板反覆投擲，設(shè)X表第9次出現(xiàn)正面時(shí)，反面出現(xiàn)的次數(shù)。當(dāng)x=9。由(1)及(2)為常數(shù)。根據(jù)Thelikelihoodprinciple與擁有相同相關(guān)於參數(shù)之實(shí)驗(yàn)資訊。(1)。(2)。※既然說(shuō)與有相同的實(shí)驗(yàn)資訊，為何檢定的結(jié)果卻大不相同？(i)likelihoodfunction僅包含實(shí)驗(yàn)資訊，而非全部的資訊。(ii)對(duì)與而言，其相關(guān)的參數(shù)必須是相同的(如同一銅板)。例16：二實(shí)驗(yàn)與有相同之樣本空間及相同的參數(shù)空間。兩者之pdf及，說(shuō)明如下：(1)實(shí)驗(yàn)1230.900.050.050.090.0550.855(2)實(shí)驗(yàn)1230.260.730.010.0260.8030.171因?yàn)?，，二者相等，根?jù)Thelikelihoodprinciple當(dāng)時(shí)，與具有相同之實(shí)驗(yàn)資訊。假設(shè)與之觀測(cè)值都是1，而欲據(jù)以檢定()。其檢定結(jié)果如下：(1)對(duì)而言，檢定的結(jié)果為reject。(2)對(duì)而言，檢定的結(jié)果為accept。如此矛盾的結(jié)果，再次說(shuō)明實(shí)驗(yàn)資訊，而非全部的資訊。Sec.2.6充分統(tǒng)計(jì)量【問(wèn)題】設(shè)是取自pdf為之n個(gè)獨(dú)立隨機(jī)樣本，我們想利用樣本觀測(cè)值來(lái)推論參數(shù)的值？1.全依觀測(cè)值來(lái)估計(jì)，亦即以來(lái)估計(jì)?！@樣做好像太麻煩！2.是否可由粹取出之所有資訊t，亦即中所有有關(guān)之所有資訊，全部濃縮在t中。如此，便可以t來(lái)估計(jì)，亦即以來(lái)估計(jì)?！绱藢⒋蟠蠛?jiǎn)化推論的工作！定義12.設(shè)之jpdf為，其中為參數(shù)，而。若給定時(shí)，之條件機(jī)率密度函數(shù)與無(wú)關(guān)，則稱T為之充分統(tǒng)計(jì)量?！纸舛ɡ?FactorizationTheorem).設(shè)是取自pdf為之n個(gè)獨(dú)立隨機(jī)樣本，。若，則T為之充分統(tǒng)計(jì)量。定義13.設(shè)為取自某母體之n個(gè)樣本，，而為一統(tǒng)計(jì)量，且T之值域?yàn)椋渲袨闃颖究臻g。則透過(guò)T可得到樣本空間之一分割。定義14.根據(jù)充分統(tǒng)計(jì)量，可將樣本空間分成一個(gè)充分分割(sufficientpartition)。定理1.設(shè)為取自某母體之n個(gè)獨(dú)立隨機(jī)樣本，，為相關(guān)參數(shù)。為之充分統(tǒng)計(jì)量。設(shè)為一隨機(jī)化決策規(guī)則，則存在一隨機(jī)化決策規(guī)則使得。Sec.2.7Convexity定義15.設(shè)，若，則稱為凸集合(convexset)。定義16.設(shè)為中之點(diǎn)所成的序列(sequence)。設(shè)，，且，則稱為之凸組合(convexcombination)。定義17.設(shè)為凸集合，為定義於上之一實(shí)數(shù)值函數(shù)。(1)若，可推得，則稱為凸函數(shù)(convexfunction)。(2)若上述(1)中不等式之等號(hào)不

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

貝氏決策理論

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

貝氏決策理論

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔