版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
貝葉斯(Bayes)估計(jì)
統(tǒng)計(jì)學(xué)中有兩大學(xué)派頻率學(xué)派(又稱(chēng)經(jīng)典學(xué)派)和貝葉斯學(xué)派,它們的理論與方法都建立在概率論基礎(chǔ)上,應(yīng)用都相當(dāng)廣泛。前幾講主要介紹經(jīng)典統(tǒng)計(jì)學(xué)的基本內(nèi)容,這一講以貝葉斯估計(jì)為題對(duì)貝葉斯統(tǒng)計(jì)作一些介紹。
1.統(tǒng)計(jì)推斷中的三種信息
我們?cè)谇懊娴慕y(tǒng)計(jì)推斷(點(diǎn)估計(jì)、區(qū)間估計(jì)等)中用到了兩種信息:
(1)總體信息,即總體分布給我們的信息。譬如,“總體是正態(tài)分布”這一句話(huà)就給我們帶來(lái)很多信息:它的密度函數(shù)是一條鐘形曲線(xiàn);它的一切矩存在;有許多成熟的統(tǒng)計(jì)推斷方法可供我們選用等??傮w信息是很重要的信息,為了獲取此種信息往往耗資巨大。我國(guó)為確認(rèn)國(guó)產(chǎn)軸承壽命分布為威布爾分布前后花了五年時(shí)間,處理了幾千個(gè)數(shù)據(jù)后才定下的。這是最“新鮮”的信息,并且越多越好,希望通過(guò)樣本對(duì)總體或總體的某些特征作出較精確的統(tǒng)計(jì)推斷.沒(méi)有樣本就沒(méi)有統(tǒng)計(jì)學(xué)可言.
(2)樣本信息,即樣本提供給我們的信息,
基于以上兩種信息進(jìn)行統(tǒng)計(jì)推斷的統(tǒng)計(jì)學(xué)就稱(chēng)為經(jīng)典統(tǒng)計(jì)學(xué).然而在我們周?chē)€存在著第三種信息―先驗(yàn)信息,它也可用于統(tǒng)計(jì)推斷.
(3)先驗(yàn)信息,即在抽樣之前有關(guān)統(tǒng)計(jì)問(wèn)題的一些信息。一般說(shuō)來(lái),先驗(yàn)信息來(lái)源于經(jīng)驗(yàn)和歷史資料。先驗(yàn)信息在日常生活和工作中是很重要的。
例1.英國(guó)統(tǒng)計(jì)學(xué)家Savage,L.J曾考察了如下兩個(gè)統(tǒng)計(jì)試驗(yàn):(l)一位常飲牛奶加茶的婦女聲稱(chēng),她能辨別先倒進(jìn)杯子里的是茶還是牛奶.對(duì)此做了十次試驗(yàn),她都正確地說(shuō)出了答案(2)一位音樂(lè)家聲稱(chēng),他能從一頁(yè)樂(lè)譜辨別出是海頓(Haydn)還是莫扎特(Mozart)的作品,在十次這樣的試驗(yàn)中.他都辨別正確。
在這兩個(gè)統(tǒng)計(jì)試驗(yàn)中,假如認(rèn)為被試驗(yàn)者是在猜測(cè),每次成功概率為0.5,那么十次都猜中的概率為210=0.0009766。這是很小的概率,是幾乎不可能發(fā)生的。所以認(rèn)為“每次成功概率為0.5”應(yīng)被拒絕,認(rèn)為試驗(yàn)者每次成功概率要比0.5大得多,這就不是猜測(cè),而是他們的經(jīng)驗(yàn)幫了他們的忙??梢?jiàn)經(jīng)驗(yàn)(先驗(yàn)信息的一種)在推斷中不可忽視.
例2.“免檢產(chǎn)品”是怎樣決定的?某工廠的產(chǎn)品每天要抽檢n件,獲得不合格品率的估計(jì).經(jīng)過(guò)一段時(shí)間后,就可根據(jù)歷史資料(先驗(yàn)信息的一種)對(duì)過(guò)去產(chǎn)品的不合格品率構(gòu)造一個(gè)分布
這種對(duì)先驗(yàn)信息進(jìn)行加工獲得的分布稱(chēng)為先驗(yàn)分布。有了先驗(yàn)分布,就得到對(duì)該廠過(guò)去產(chǎn)品的不合格品率的一個(gè)全面看法。如果的取值以大概率集中在=0附近,那么認(rèn)為該產(chǎn)品是“信得過(guò)產(chǎn)品”。
假如以后的多次抽檢結(jié)果與歷史資料提供的先驗(yàn)分布是一致的,那就可以對(duì)它出“免檢產(chǎn)品”的決定,或者每月抽檢一次就足夠了,這就省去了大量的人與物力.可見(jiàn),歷史資料在統(tǒng)計(jì)推斷中應(yīng)該加以應(yīng)用。
基于上述三種信息進(jìn)行統(tǒng)計(jì)推斷的統(tǒng)計(jì)學(xué)稱(chēng)為貝葉斯統(tǒng)計(jì)學(xué)。它與經(jīng)典統(tǒng)計(jì)學(xué)的差別就在于是否利用先驗(yàn)信息。貝葉斯統(tǒng)計(jì)在重視使用總體信息和樣本信息的同時(shí),還注意先驗(yàn)信息的收集、挖掘和加工,使它數(shù)量化,形成先驗(yàn)分布,參加到統(tǒng)計(jì)推斷中來(lái),以提高統(tǒng)計(jì)推斷的質(zhì)量。忽視先驗(yàn)信息的利用,有時(shí)是一種浪費(fèi),有時(shí)還會(huì)導(dǎo)出不合理的結(jié)論。
貝葉斯統(tǒng)計(jì)起源于英國(guó)學(xué)者貝葉斯(Bayes.T.R,1702(?)一1761)死后發(fā)表的一篇論文“論有關(guān)機(jī)遇問(wèn)題的求解”,在此文中提出了著名的貝葉斯公式和一種歸納推理的方法。之后,一些統(tǒng)計(jì)學(xué)家將其發(fā)展成一種系統(tǒng)的統(tǒng)計(jì)推斷方法。到上世紀(jì)30年代已形成貝葉斯學(xué)派,到50~60年代已發(fā)展成一個(gè)有影響的統(tǒng)計(jì)學(xué)派,其影響還在日益擴(kuò)大。
貝葉斯學(xué)派的最基本的觀點(diǎn)是:參數(shù)
可看作隨機(jī)變量,可用一個(gè)概率分布去描述,這個(gè)分布稱(chēng)為先驗(yàn)分布。因?yàn)椋瑓?shù)
具有不確定性,而在表述不確定性的程度時(shí),概率與概率分布是最好的語(yǔ)言。例2中產(chǎn)品的不合格品率
是未知的,但每天都在變化,把它看成隨機(jī)變量是合理的,用一個(gè)概率分布去描述它是恰當(dāng)?shù)摹?/p>
例3.
某地區(qū)煤的儲(chǔ)存量
在幾百年內(nèi)不會(huì)有多大變化,可看作是一個(gè)常量,但對(duì)人們來(lái)說(shuō),它是未知的、不確定的量。有位專(zhuān)家研究了有關(guān)資料、結(jié)合他的經(jīng)驗(yàn)認(rèn)為:該地區(qū)煤的儲(chǔ)存量
“大概有5億噸左右”。若把“左右”理解為4到6億噸之內(nèi),把“大概”理解為80%的把握,還有20%的可能性在此區(qū)間之外。這無(wú)形中就是用一個(gè)概率分布去描述未知量
,而具有概率分布的量當(dāng)然是隨機(jī)變量。
14610
關(guān)于參數(shù)是否可看作隨機(jī)變量在經(jīng)典學(xué)派與貝葉斯學(xué)派間爭(zhēng)論了很長(zhǎng)時(shí)間。如今經(jīng)典學(xué)派已不反對(duì)這一觀點(diǎn)。著名的美國(guó)經(jīng)典統(tǒng)計(jì)學(xué)家Lehmann,E.J.在他的《點(diǎn)估計(jì)理論》一書(shū)中寫(xiě)道:“把統(tǒng)計(jì)問(wèn)題中的參數(shù)看作隨機(jī)變量的實(shí)現(xiàn)要比看作未知參數(shù)更合理一些”。如今兩派的爭(zhēng)論焦點(diǎn)是:如何利用各種先驗(yàn)信息合理地確定先驗(yàn)分布。這在有些場(chǎng)合是容易解決的,但在很多場(chǎng)合是相當(dāng)困難的。這時(shí)應(yīng)加強(qiáng)研究,發(fā)展貝葉斯統(tǒng)計(jì),而不宜簡(jiǎn)單處置,引起非難。
2.貝葉斯公式的密度函數(shù)形式若B1,…Bn是一完備事件組,則對(duì)任意的事件A(P(A)>0),均有
(1)貝葉斯公式的事件形式:(2)貝葉斯公式的密度函數(shù)形式(介紹貝葉斯學(xué)派的一些具體想法)
(a)X的密度函數(shù)(依賴(lài)于參數(shù)
)在經(jīng)典統(tǒng)計(jì)中記為f(x;),它表示參數(shù)空間中不同的
對(duì)應(yīng)不同的分布。在貝葉斯統(tǒng)計(jì)中應(yīng)將其記為f(x|),它表示在隨機(jī)變量給定某個(gè)值時(shí),X的條件密度函數(shù)。
(b)根據(jù)參數(shù)的先驗(yàn)信息確定先驗(yàn)分布(
)。
(c)從貝葉斯觀點(diǎn)看,樣本X1,X2,…Xn
的產(chǎn)生要分兩步進(jìn)行:這個(gè)聯(lián)合分布綜合了總體信息和樣本信息,又稱(chēng)為似然函數(shù)。
首先設(shè)想從先驗(yàn)分布(
)中產(chǎn)生一個(gè)樣本*。這一步是“老天爺”做的,人們是看不到的,故用“設(shè)想”二字.第二步從f(x|*)
中產(chǎn)生樣本X1,X2,…Xn
。這時(shí)樣本的聯(lián)合條件密度函數(shù)為(d)由于*是設(shè)想出來(lái)的,仍然是未知的,它是按先驗(yàn)分布(
)產(chǎn)生的.為把先驗(yàn)信息綜合進(jìn)去,不能只考慮*,也要考慮的其它值發(fā)生的可能性,故要用(
)進(jìn)行綜合。這個(gè)聯(lián)合分布把三種可用信息都綜合進(jìn)去了。這樣一來(lái),樣本和參數(shù)的聯(lián)合分布為
(e)我們的任務(wù)是要對(duì)未知參數(shù)
作統(tǒng)計(jì)推斷。在沒(méi)有樣本信息時(shí),我們只能依據(jù)先驗(yàn)分布(
)對(duì)作出推斷.在有了樣本觀察值x1,…,xn
之后,我們應(yīng)依據(jù)h(x1,…,xn,)
對(duì)作出推斷。若把h作如下分解其中m(x1,…,xn)
為樣本X1,…,Xn
的邊緣密度函數(shù)它與無(wú)關(guān),或者說(shuō)m(x1,…,xn)
中不含的任何信息。因此能用來(lái)對(duì)作出推斷的僅是條件分布(|x1,…,xn
)
條件分布(|x1,…,xn
)
的計(jì)算公式為
這就是貝葉斯公式的密度函數(shù)形式。這個(gè)條件分布稱(chēng)為的后驗(yàn)分布,它集中了總體、樣本和先驗(yàn)中有關(guān)的一切信息.后驗(yàn)分布也是用總體和樣本對(duì)先驗(yàn)分布(
)作調(diào)整的結(jié)果,它要比(
)
更接近的實(shí)際情況,從而使基于(|x1,…,xn
)
對(duì)的推斷可以得到改進(jìn)。
(1)式是在X
和都是連續(xù)隨機(jī)變量場(chǎng)合下的貝葉斯公式。其它場(chǎng)合下的貝葉斯公式容易寫(xiě)出。譬如在X
是離散型隨機(jī)變量、是連續(xù)隨機(jī)變量時(shí),只要把(1)中的密度函數(shù)f(x|)改為條件概率P(X=x|)
即可;而當(dāng)為離散隨機(jī)變量時(shí),只要把(1)中先驗(yàn)密度函數(shù)(
)改為先驗(yàn)分布列(i
),i=1,2,…,把積分改為求和即可.
例4.設(shè)事件A
發(fā)生的概率為
,即P(A)=。為了估計(jì),進(jìn)行了n次獨(dú)立觀察,其中事件A
出現(xiàn)次數(shù)為X。顯然X~B(n,
),即
這就是似然函數(shù).取(0,1)區(qū)間上的均勻分布U(0,l)作為的先驗(yàn)分布.此時(shí),的先驗(yàn)分布為此時(shí),的先驗(yàn)分布為為了綜合試驗(yàn)信息和先驗(yàn)信息,可利用貝葉斯公式。為此先計(jì)算樣本X與參數(shù)
的聯(lián)合分布
:
的先驗(yàn)分布為U(0,l)從形式上看,此聯(lián)合分布與X
的條件分布沒(méi)有差別,可在定義域上有差別。再計(jì)算
X
的邊緣分布二者相除,即得的后驗(yàn)分布為這就是參數(shù)為x+1與n-x+1的貝塔分布Be(x+1,n-x+1).
拉普拉斯在1786年研究了巴黎男嬰誕生的比率是否大于0.5。為此他收集了1745年到1770年在巴黎誕生的嬰兒數(shù)據(jù),其中男嬰為251527個(gè),女?huà)霝?41945個(gè)。他選用U(0,l)作為的先驗(yàn)分布,于是得的后驗(yàn)分布為Be(x+1,n-x+1),其中n=251527+241945=493472,x=251527。利用這一后驗(yàn)分布,拉普拉斯計(jì)算了“0.5”的后驗(yàn)概率由于這一概率很小,故他以很大的把握斷言男嬰誕生的概率大于0.5。這一結(jié)果在當(dāng)時(shí)是很有影響的。
3.先驗(yàn)分布----
(1)共軛先驗(yàn)分布從例4看到一個(gè)有趣的現(xiàn)象:二項(xiàng)分布B(n,)中的成功概率
的先驗(yàn)分布若取U(0,1),即為貝塔分布Be(1,1),則其后驗(yàn)分布也是貝塔分布Be(x+1,n-x+1)。先驗(yàn)分布與后驗(yàn)分布同屬一個(gè)貝塔分布族,只不過(guò)參數(shù)不同。這一現(xiàn)象不是偶然的,如把
的先驗(yàn)分布換成一般的貝塔分布Be(a,b)
,其中a>0,b>0,則經(jīng)過(guò)類(lèi)似的計(jì)算可以看出
的后驗(yàn)分布仍是貝塔分布Be(a+x,b+n-x).此種先驗(yàn)分布稱(chēng)為
的共扼先驗(yàn)分布.
定義設(shè)
是某分布中的一個(gè)參數(shù),(
)是其先驗(yàn)分布。假如由抽樣信息算得的后驗(yàn)分布(
|
x)與(
)同屬于一個(gè)分布族,則稱(chēng)(
)是
的共軛先驗(yàn)分布。
從這個(gè)定義可以看出,共扼先驗(yàn)分布是對(duì)某一分布中的參數(shù)而言的,離開(kāi)指定參數(shù)及其所在的分布,談?wù)摴捕笙闰?yàn)分布是沒(méi)有意義。常用的共軛先驗(yàn)分布總體分布參數(shù)
共軛先驗(yàn)分布二項(xiàng)分布成功概率
貝塔分布泊松分布
均值
伽瑪分布指數(shù)分布
均值倒數(shù)
伽瑪分布正態(tài)分布(方差已知)均值
正態(tài)分布正態(tài)分布(均值已知)方差
正態(tài)分布注:若則1/X的分布稱(chēng)為倒伽瑪分布
從Bayes分析誕生之日起,就伴隨一個(gè)問(wèn)題:沒(méi)有先驗(yàn)信息場(chǎng)合如何確定先驗(yàn)信息,此時(shí)的先驗(yàn)分布稱(chēng)為無(wú)信息先驗(yàn)分布。(2)使用貝葉斯假設(shè)確定先驗(yàn)分布
貝葉斯假設(shè)表述為:參數(shù)
的先驗(yàn)分布()應(yīng)在
的取值范圍“均勻”分布。用數(shù)學(xué)公式表示為:
()=c,其中c是常數(shù)。
沒(méi)有的任何信息可理解為:對(duì)任何可能值既無(wú)偏愛(ài),又同等無(wú)知,因此很自然的把的取值范圍內(nèi)的均勻分布取作的先的驗(yàn)分布。即為貝葉斯假設(shè)。若僅在有限區(qū)間[a,b]上取值,=[a,b],則使用貝葉斯假設(shè)是合理的。即選用U(a,b)作為先驗(yàn)分布。若為無(wú)限區(qū)間時(shí),(
)=c,并不是正常的密度函數(shù),但如果由此確定的后驗(yàn)密度(|x1,…,xn
)仍然是正常的密度函數(shù),則稱(chēng)(
)為的廣義先驗(yàn)密度。例5.設(shè)X1,X2,…,Xn
是來(lái)自N(,
2)的樣本,
2已知.假如的先驗(yàn)分布為()=c,R,求
的后驗(yàn)密度。解:X1,X2,…,Xn
的聯(lián)合密度為又的先驗(yàn)分布為于是的后驗(yàn)密度為即的后驗(yàn)密度為(3)使用杰弗萊(Jeffreys)原則確定先驗(yàn)分布
貝葉斯假設(shè)中的一個(gè)矛盾是:如果對(duì)參數(shù)
選用先驗(yàn)分布,那么當(dāng)
的函數(shù)g()作為參數(shù)時(shí),也應(yīng)該選用均勻分布作為先驗(yàn)分布。然而由
遵從均勻分布這一前提,往往導(dǎo)出g()的分布不是均勻分布,反之也一樣。杰弗萊為了克服這一矛盾,提出選取先驗(yàn)的不變?cè)恚Q(chēng)為杰弗萊原則或杰弗萊準(zhǔn)則
杰弗萊原則有兩個(gè)部分:10對(duì)無(wú)信息先驗(yàn)分布有一合理的要求;20給出一個(gè)具體的方法去求得符合要求的先驗(yàn)分布。現(xiàn)設(shè)按照同一準(zhǔn)則決定的
的先驗(yàn)分布為(
),=g()的先驗(yàn)分布為g(),則應(yīng)有關(guān)系
杰弗萊巧妙應(yīng)用Fisher信息陣的一個(gè)不變性質(zhì),找到滿(mǎn)足上述要求的先驗(yàn)分布(
):的無(wú)信息先驗(yàn)分布應(yīng)滿(mǎn)足其中可以是向量,此時(shí)定理:設(shè)g()是的函數(shù),
=g()與具有相同的維數(shù),則有例6:設(shè)總體X~N(,
2),X1,…,Xn為獨(dú)立同分布樣本,則X1,…,Xn的聯(lián)合密度函數(shù)為可以求得Fisher信息陣為于是(,)的先驗(yàn)分布為例7:設(shè)n次獨(dú)立試驗(yàn)中事件A發(fā)生的次數(shù)X服從二項(xiàng)分布
因此于是
所以的先驗(yàn)分布為
即為Be(1/2,1/2)。一般說(shuō)來(lái),無(wú)信息先驗(yàn)不是唯一的,但是它們對(duì)Bayes統(tǒng)計(jì)推斷的結(jié)果的影響都是很小的,很少對(duì)結(jié)果產(chǎn)生重大影響,所以任何無(wú)信息先驗(yàn)分布都可以采用。4.貝葉斯點(diǎn)估計(jì)
后驗(yàn)分布(
|
x)
綜合了總體f(x|)
,樣本x1,…,xn和先驗(yàn)分布()中的有關(guān)
的信息,如今要尋找參數(shù)的估計(jì),當(dāng)然要從后驗(yàn)分布(
|
x)
中提取信息.從(
|
x)
中提取關(guān)于的信息有三種常用的方法:(a)使后驗(yàn)密度達(dá)到最大的;(b)后驗(yàn)分布的中位數(shù);(c)后驗(yàn)分布的均值.用得最多的是后驗(yàn)分布的均值.定義.
的后驗(yàn)分布的期望值稱(chēng)為的后驗(yàn)期望估計(jì).也簡(jiǎn)稱(chēng)貝葉斯估計(jì),常記為定理.設(shè)的后驗(yàn)密度為(
|
x)
,則后驗(yàn)期望估計(jì)使均方誤差達(dá)到最小證明:的均方誤差為下面在(
|
x)
下進(jìn)行計(jì)算:這是的二次三項(xiàng)式,其二次項(xiàng)系數(shù)為正,必有最小值,其最小值點(diǎn)為例8.設(shè)X1,X2,…,Xn
是來(lái)自N(,
2)的一個(gè)樣本,其中
2已知,為未知參數(shù).假如的先驗(yàn)分布為N(,
2),其中和
2
已知。試求的貝葉斯估計(jì)。
解:X1,X2,…,Xn
的聯(lián)合密度為又的先驗(yàn)分布為于是樣本X1,X2,…,Xn
與的聯(lián)合密度為其中合并項(xiàng),有令由此,配方得,由此容易算得樣本的邊緣分布為將上述兩式相除,得到的后驗(yàn)分布這是一個(gè)正態(tài)分布,均值為B/A,方差為1/A。于是的后驗(yàn)分布的期望,即的貝葉斯估計(jì)為若令02=2/n,則貝葉斯估計(jì)可表達(dá)為其中是樣本均值,是的先驗(yàn)均值,權(quán)rn由樣本均值得方差02和先驗(yàn)方差2
算得。當(dāng)02>2
時(shí),rn<1/2,1-rn>1/2,此時(shí)在貝葉斯估計(jì)中先驗(yàn)均值占得比重大一些。這從直觀上也容易理解,因?yàn)樵?2>2
時(shí),樣本量不夠大,樣本均值的方差較大,更應(yīng)重視先驗(yàn)方差。
反之,當(dāng)02<2
時(shí),rn>1/2,1-rn<1/2,于是在貝葉斯估計(jì)中樣本均值占得比重大一些。也就是說(shuō),當(dāng)樣本量樣本量足夠大時(shí),更應(yīng)受到重視的信息。符合人們的直觀認(rèn)識(shí):方差小的信息更應(yīng)受到重視.特別地,rn=0時(shí),這時(shí)02=,表示沒(méi)有樣本信息,故而貝葉斯估計(jì)只能用先驗(yàn)均值了。而當(dāng)rn=1時(shí),這時(shí)2
=,這表示沒(méi)有任何先驗(yàn)信息,此時(shí)貝葉斯估計(jì)就取經(jīng)典估計(jì)的貝葉斯估計(jì)是十分合理的。
從上述特性,我們看出,形如
作為一個(gè)數(shù)值例子,我們考慮對(duì)一個(gè)兒童做智力測(cè)驗(yàn)。設(shè)測(cè)驗(yàn)結(jié)果X~N(,100),其中為這個(gè)兒童的智商的真值.若又設(shè)~N(100,225)應(yīng)用上述方法,在n=l時(shí),可得在給定X=x條件下,該兒童智商的后驗(yàn)分布是正態(tài)分布N(1,1),其中假如這個(gè)兒童測(cè)驗(yàn)得分為115分,則他的智商的貝葉斯估計(jì)為
例9.
為估計(jì)不合格率,今從一批產(chǎn)品中隨機(jī)抽取n件,其中不合格品數(shù)為x,又設(shè)
的先驗(yàn)分布為貝塔分布Be(a,b)。求的貝葉斯估計(jì)。這一估計(jì)也可改寫(xiě)為解:由共軛先驗(yàn)分布可知,此時(shí)
的后驗(yàn)分布(
|
x)
為Be(a+x,b+n-x)。此后驗(yàn)分布的均值即為的貝葉斯估計(jì),故其中為先驗(yàn)分布Be(a,b)的均值,它可看作僅用先驗(yàn)分布對(duì)所作的估計(jì)。是僅用抽樣信息對(duì)所作的極大似然估計(jì)。是權(quán),它的大小取決于樣本量n的大小。當(dāng)n很大時(shí),rn接近于1,貝葉斯估計(jì)接近極大似然估計(jì),即抽樣信息在估計(jì)中占主要成分;當(dāng)n較小時(shí),rn接近于0,貝葉斯估計(jì)接近先驗(yàn)均值,即先驗(yàn)信息在估計(jì)中占主要成分。
上述現(xiàn)象表明,各種信息在貝葉斯估計(jì)中所占的地位是很恰當(dāng)?shù)摹?/p>
作為一個(gè)數(shù)值例子,我們選用貝葉斯假設(shè),即
的先驗(yàn)分布選為均勻分布U(0,1),它就是a=b=1的貝塔分布。假如其它條件不變,那么的貝葉斯估計(jì)為
它與極大似然估計(jì)略有不同,它相當(dāng)于在n次檢查中再追加二次檢查,并且不合格品也增加一個(gè)這里2與1正是均勻先驗(yàn)分布能提供的信息.
下表列出兩個(gè)試驗(yàn)結(jié)果。在試驗(yàn)l與試驗(yàn)2中,“抽檢3個(gè)產(chǎn)品全合格”與“抽檢10個(gè)產(chǎn)品全合格”在人們心目中留下的印象是不同的,后批的質(zhì)量要比前批的質(zhì)量更信得過(guò),這一點(diǎn)用反映不出來(lái),而用貝葉斯估計(jì)會(huì)有所反映。
試驗(yàn)號(hào)nx13000.2210000.083類(lèi)似地,在下述試驗(yàn)3和試驗(yàn)4中,“抽檢3個(gè)產(chǎn)品全不合格”與“抽檢10個(gè)產(chǎn)品也全不合格”在人們心目中也是有差別的二個(gè)事件,可用極大似然估計(jì)看不出此種差別,而貝葉斯估計(jì)能反映一些.在這些極端場(chǎng)合,貝葉斯估計(jì)更具有吸引力。
試驗(yàn)號(hào)nx33310.84101010.9175.貝葉斯區(qū)間估計(jì)
對(duì)于區(qū)間估計(jì)問(wèn)題,貝葉斯方法比經(jīng)典方法更容易處理。因?yàn)樵谪惾~斯估計(jì)中參數(shù)
是一個(gè)隨機(jī)變量,且有后驗(yàn)分布(
|x1,x2,...,xn),因此
落在某一區(qū)間的概率是容易計(jì)算的,譬如給定區(qū)間[a,b],用后驗(yàn)分布(
|x1,x2,...,xn)可算得其概率,譬如為1,即P(a
b|x1,x2,...,xn)=1
反之,若給定概率1,要求一個(gè)區(qū)間[a,b],使上式成立,這樣求得的區(qū)間[a,b]就是
的貝葉斯區(qū)間估計(jì)。這是在
為連續(xù)隨機(jī)變量場(chǎng)合。P(a
b|x1,x2,...,xn)=1(3.8)
假如
是離散型隨機(jī)變量,對(duì)給定的概率1,滿(mǎn)足等式(3.8)的a與b不一定存在,這時(shí)只有略微放大(3.8)左端的概率,才能找到a與b,這樣的區(qū)間也是
的貝葉斯區(qū)間估計(jì)。它的一般定義如下:
定義.設(shè)參數(shù)
的后驗(yàn)分布為(
|x1,x2,...,xn),對(duì)給定的概率1,若存在這樣的兩個(gè)統(tǒng)計(jì)量L=L(x1,x
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版土地使用權(quán)出讓居間合同規(guī)范文本-城市綜合體開(kāi)發(fā)3篇
- 二零二五版住宅小區(qū)車(chē)位產(chǎn)權(quán)轉(zhuǎn)移及使用權(quán)購(gòu)買(mǎi)合同3篇
- 2025版住宅小區(qū)消防設(shè)備設(shè)施定期檢查與維護(hù)合同范本2篇
- 2025年度木門(mén)行業(yè)環(huán)保認(rèn)證與推廣合同3篇
- 2025年度國(guó)際物流合作解約及責(zé)任分擔(dān)協(xié)議書(shū)
- 二零二五年度美容店轉(zhuǎn)讓合同包括美容院品牌授權(quán)及區(qū)域代理權(quán)
- 2025年度二零二五年度大型活動(dòng)臨時(shí)工人搬運(yùn)服務(wù)承包協(xié)議
- 2025年度私人承包廠房租賃合同安全責(zé)任追究協(xié)議
- 二零二五板材行業(yè)數(shù)據(jù)分析與市場(chǎng)預(yù)測(cè)合同3篇
- 二零二五年度鏟車(chē)清雪作業(yè)安全責(zé)任保險(xiǎn)合同
- 中考模擬考試化學(xué)試卷與答案解析(共三套)
- 新人教版五年級(jí)小學(xué)數(shù)學(xué)全冊(cè)奧數(shù)(含答案)
- 風(fēng)電場(chǎng)升壓站培訓(xùn)課件
- 收納盒注塑模具設(shè)計(jì)(論文-任務(wù)書(shū)-開(kāi)題報(bào)告-圖紙)
- 博弈論全套課件
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 腦電信號(hào)處理與特征提取
- 高中數(shù)學(xué)知識(shí)點(diǎn)全總結(jié)(電子版)
- GB/T 10322.7-2004鐵礦石粒度分布的篩分測(cè)定
- 2023新譯林版新教材高中英語(yǔ)必修一重點(diǎn)詞組歸納總結(jié)
- 蘇教版四年級(jí)數(shù)學(xué)下冊(cè)第3單元第2課時(shí)“常見(jiàn)的數(shù)量關(guān)系”教案
評(píng)論
0/150
提交評(píng)論