版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)理統(tǒng)計(jì)與隨機(jī)過程第七章主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院數(shù)理統(tǒng)計(jì)與隨機(jī)過程主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院1第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):
●總體分布類型的判斷;
●總體分布中未知參數(shù)的推斷(參數(shù)估計(jì)與
假設(shè)檢驗(yàn))。第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):2參數(shù)估計(jì)問題的一般提法設(shè)總體
X
的分布函數(shù)為
F(x,θ),其中θ為未知參數(shù)或參數(shù)向量,現(xiàn)從該總體中抽樣,得到樣本X1,X2,…,Xn.
依樣本對參數(shù)θ做出估計(jì),或估計(jì)參數(shù)θ的某個(gè)已知函數(shù)g(θ)。
這類問題稱為參數(shù)估計(jì)。參數(shù)估計(jì)包括:點(diǎn)估計(jì)和區(qū)間估計(jì)。參數(shù)估計(jì)問題的一般提法設(shè)總體X的分布函數(shù)為F(3稱該計(jì)算值為
μ
的一個(gè)點(diǎn)估計(jì)。為估計(jì)參數(shù)μ,需要構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量
T(
X1,X2,…,Xn),一旦當(dāng)有了樣本,就將樣本值代入到該統(tǒng)計(jì)量中,算出一個(gè)值作為
μ
的估計(jì),
4尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘法4.貝葉斯方法
…我們僅介紹前面的兩種參數(shù)估計(jì)法。尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘5其思想是:用同階、同類的樣本矩來估計(jì)總體矩。矩估計(jì)是基于“替換”思想建立起來的一種參數(shù)估計(jì)方法。最早由英國統(tǒng)計(jì)學(xué)家K.
皮爾遜
提出?!?.1矩估計(jì)其思想是:用同階、同類矩估計(jì)是基于“替換”6矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。7設(shè)總體
X
的分布函數(shù)中含
k
個(gè)未知參數(shù)步驟一:記總體
X
的
m
階原點(diǎn)矩
E(Xm)為
am
,
m
=
1,2,…,k.am(1,2,…,k),
m=1,2,…,k.
一般地,am(m
=
1,2,
…,K)是總體分布中參數(shù)或參數(shù)向量(1,
2,
…,
k)
的函數(shù)。
故,am(m=1,
2,…,k)應(yīng)記成:設(shè)總體X的分布函數(shù)中含k個(gè)未知參數(shù)步驟一:記總體8步驟二:算出樣本的
m
階原點(diǎn)矩步驟三:令得到關(guān)于
1,2,…,k
的方程組(L≥k)。一般要求方程組(1)中有
k
個(gè)獨(dú)立方程。步驟二:算出樣本的m階原點(diǎn)矩步驟三:令得到關(guān)于9步驟四:解方程組(1),并記其解為這種參數(shù)估計(jì)法稱為參數(shù)的矩估計(jì)法,簡稱矩法。步驟四:解方程組(1),并記其解為這種參數(shù)10解:先求總體的期望例1:設(shè)總體
X
的概率密度為解:先求總體的期望例1:設(shè)總體X的概率密度為11由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊加上“^”,表示參數(shù)的估計(jì)。它是統(tǒng)計(jì)量。由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊12解:
先求總體的均值和
2
階原點(diǎn)矩。例2:設(shè)
X1,X2,…Xn是取自總體
X
的簡單樣本,X有概率密度函數(shù)解:先求總體的均值和2階原點(diǎn)矩。例2:設(shè)X1,X213數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件14用樣本矩估計(jì)總體矩得用樣本矩得15列出方程組:例3:設(shè)總體X的均值為,方差為2,求
和2的矩估計(jì)。解:由
列出方程組:例3:設(shè)總體X的均值為,方差為2,求和16故,均值,方差2的矩估計(jì)為求解,得故,均值,方差2的矩估計(jì)為求解,得17如:正態(tài)總體N(
,2)中
和2的矩估計(jì)為如:正態(tài)總體N(,2)中和2的矩估計(jì)為18又如:若總體X~U(a,b),求a,b的矩估計(jì)。解:列出方程組因
又如:若總體X~U(a,b),求a,b的矩估計(jì)。解19解上述方程組,得到
a,b
的矩估計(jì):解上述方程組,得到a,b的矩估計(jì):20
矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體是什么分布。
缺點(diǎn)是:當(dāng)總體的分布類型已知時(shí),未充分利用分布所提供的信息;此外,一般情形下,矩估計(jì)不具有唯一性。矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體21§7.2極大似然估計(jì)極大似然估計(jì)法是在總體的分布類型已知前提下,使用的一種參數(shù)估計(jì)法。該方法首先由德國數(shù)學(xué)家高斯于1821年提出,其后英國統(tǒng)計(jì)學(xué)家費(fèi)歇于1922年發(fā)現(xiàn)了這一方法,研究了方法的一些性質(zhì),并給出了求參數(shù)極大似然估計(jì)一般方法——極大似然估計(jì)原理?!?.2極大似然估計(jì)極大似然估計(jì)法是在22I.極大似然估計(jì)原理設(shè)總體
X
的分布
(連續(xù)型時(shí)為概率密度,離散型時(shí)為概率分布)
為f(x,
θ)
,X1,
X2,
…,Xn是抽自總體
X
的簡單樣本。于是,樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布)為被看作固定,但未知的參數(shù)視為變量I.極大似然估計(jì)原理設(shè)總體X的分布23將上式簡記為
L(θ),即稱L(θ)為θ的似然函數(shù)。視為變量視為固定值將上式簡記為L(θ),即稱L(θ)為θ的似然函數(shù)。視為變24假定我們觀測到一組樣本X1,X2,…,
Xn,要去估計(jì)未知參數(shù)θ
。稱為θ的極大似然估計(jì)(MLE)。一種直觀的想法是:哪個(gè)參數(shù)(多個(gè)參數(shù)時(shí)是哪組參數(shù))使得這組樣本出現(xiàn)的可能性(概率)最大,就用那個(gè)參數(shù)(或哪組參數(shù))作為參數(shù)的估計(jì)。這就是極大似然估計(jì)原理。即,如果θ可能變化空間,稱為參數(shù)空間。假定我們觀測到一組樣本X1,X2,…,25(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,就得參數(shù)θ的極大似然估計(jì)。II.求極大似然估計(jì)(MLE)的一般步驟.由總體分布導(dǎo)出樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布);(2).把樣本的聯(lián)合概率函數(shù)中的自變量看成已知常數(shù),參數(shù)θ看成自變量,得到似然函數(shù)L(θ);(3).求似然函數(shù)L(θ
)的最大值點(diǎn)(常常轉(zhuǎn)化為求lnL(θ)的最大值點(diǎn)),即θ的MLE;(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,II.26兩點(diǎn)說明:●求似然函數(shù)
L(θ)
的最大值點(diǎn),可應(yīng)用微積分中的技巧。由于
ln(x)
是
x
的增函數(shù),所以
lnL(θ)
與
L(θ)
在θ的同一點(diǎn)處達(dá)到各自的最大值。假定θ是一實(shí)數(shù),lnL(θ)是θ的一個(gè)可微函數(shù)。通過求解似然方程可以得到θ的MLE。兩點(diǎn)說明:●求似然函數(shù)L(θ)的最大值點(diǎn),可應(yīng)用微積27●用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大似然原理來求。若θ是向量,上述似然方程需用似然方程組代替。●用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大28III.下面舉例說明如何求參數(shù)的MLE例1:
設(shè)X1,X2,…,Xn是取自總體X~B(1,p)的一個(gè)樣本,求參數(shù)p
的極大似然估計(jì)。解:似然函數(shù)為III.下面舉例說明如何求參數(shù)的MLE例1:設(shè)X1,X29對數(shù)似然函數(shù)為:對
p
求導(dǎo),并令其等于零,得上式等價(jià)于對數(shù)似然函數(shù)為:對p求導(dǎo),并令其等于零,得上式等價(jià)于30解上述方程,得換成換成解上述方程,得換成換成31例2:求正態(tài)總體
N(,2)參數(shù)
和
2
的極大似然估計(jì)(注:我們把
2
看作一個(gè)參數(shù))。解:似然函數(shù)為對數(shù)似然函數(shù)為例2:求正態(tài)總體N(,2)參數(shù)和2的32似然方程組為由第一個(gè)方程,得到代入第二方程,得到似然方程組為由第一個(gè)方程,得到代入第二方程,得到33是L(,2)的最大值點(diǎn),即
和
2
的極大似然估計(jì)。下面驗(yàn)證:似然方程組的唯一解是似然函數(shù)的最大值點(diǎn)。是L(,34例3:設(shè)總體
X
服從泊松分布P(
),求參數(shù)的極大似然估計(jì)。解:由
X
的概率分布函數(shù)為得的似然函數(shù)例3:設(shè)總體X服從泊松分布P(),求參數(shù)的極大35似然方程為對數(shù)似然函數(shù)為其解為似然方程為對數(shù)似然函數(shù)為其解為36換成換成得的極大似然估計(jì)換成換成得的極大似然估計(jì)37例4:設(shè)
X
~U(a,b),求a,b的極大似然估計(jì)。
解:因所以例4:設(shè)X~U(a,b),求a,b的極大似然估38數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件39由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)的,所以我們不能用似然方程組來求極大似然估計(jì),而必須從極大似然估計(jì)的定義出發(fā),求L(a,b)的最大值。由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)40為使
L(a,b)
達(dá)到最大,b-a
應(yīng)該盡量地小。但
b不能小于max{x1,x2,…,xn}。否則,L(a,b)=0。類似地,a
不能大于min{x1,x2,…,xn}。因此,a
和
b
的極大似然估計(jì)為為使L(a,b)達(dá)到最大,b-a應(yīng)該盡量地小41解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體
X
的一個(gè)樣本,X
有如下概率密度函數(shù)其中θ
>0為未知常數(shù)。求θ的極大似然估計(jì)。也可寫成解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體42求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得43
從前面兩節(jié)的討論中可以看到:●同一參數(shù)可以有幾種不同的估計(jì),這時(shí)就需要判斷采用哪一種估計(jì)為好的問題?!窳硪环矫妫瑢τ谕粋€(gè)參數(shù),用矩法和極大似然法即使得到的是同一個(gè)估計(jì),也存在衡量這個(gè)估計(jì)優(yōu)劣的問題。估計(jì)量的優(yōu)良性準(zhǔn)則就是:評價(jià)一個(gè)估計(jì)量“好”與“壞”的標(biāo)準(zhǔn)?!?.3估計(jì)量的優(yōu)良性準(zhǔn)則從前面兩節(jié)的討論中可以看到:§7.3估計(jì)量的優(yōu)良性準(zhǔn)44
設(shè)總體的分布參數(shù)為θ
,對一切可能的θ成立,則稱為的無偏估計(jì)。7.3.1無偏性對于樣本X1,X2,,Xn的不同取值,取不同的值
)。如果的均值等于θ,即簡記為是θ
的一個(gè)估計(jì)(注意!它是一個(gè)統(tǒng)計(jì)量,是隨機(jī)變量。設(shè)總體的分布參數(shù)為θ,對一切可能的θ成立,則稱為45參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于?!耙磺锌赡艿?/p>
”是指:在參數(shù)估計(jì)問題中,參數(shù)
一切可能的取值。我們之所以要求對一切可能的
都成立,是因?yàn)樵趨?shù)估計(jì)問題中,我們并不知道參數(shù)的真實(shí)取值。自然要求它在參數(shù)的一切可能取值的范圍內(nèi)都成立說明:無偏性的意義是:用估計(jì)量估計(jì)參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于46例1:設(shè)
X1,X2,…,Xn為抽自均值為的總體X的隨機(jī)樣本,考慮
的如下幾個(gè)估計(jì)量:例如:若指的是正態(tài)總體N(
,2)的均值,則其一切可能取值范圍是(-∞,∞)。若指的是方差2,則其一切可能取值范圍是(0,∞)。例1:設(shè)X1,X2,…,Xn為抽自均值為的總47數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件48
定理1:設(shè)總體
X
的均值為,方差為2,X1,X2,…,Xn
為來自總體
X的隨機(jī)樣本,記與分別為樣本均值與樣本方差,即
即樣本均值和樣本方差分別是
總體均值
和總體方差
的無偏估計(jì)。定理1:設(shè)總體X的均值為,方差為2,49證明:因?yàn)?/p>
X1,X2,…,Xn獨(dú)立同分布,且E(Xi
)=μ,所以另一方面,因證明:因?yàn)閄1,X2,…,Xn獨(dú)立同分布,且另一方50于是,有注意到于是,有注意到51前面兩節(jié)中,我們曾用矩法和極大似然法分別求得了正態(tài)總體N(μ
,σ2)中參數(shù)
σ2的估計(jì),均為很顯然,它不是
σ2
的無偏估計(jì)。這正是我們?yōu)槭裁匆獙⑵浞帜感拚秊閚-1,獲得樣本方差S2來估計(jì)
σ2
的理由。前面兩節(jié)中,我們曾用矩法和極大似然法分別求得52例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。證明:因
E(S2)=2,所以,D(S)+[E(S)]2=
2,由
D(S)>0,知
[E(S)]2=
2-D(S)<
2.所以,E(S)<.故,S
不是
的無偏估計(jì)。例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。53例3:設(shè)總體
X的
k階原點(diǎn)距為
ak=E(Xk),X1,X2,…,Xn是X的隨機(jī)樣本,樣本
k
階原點(diǎn)距為Ak,則Ak是ak的無偏估計(jì),k=1,2,…。證明:因X1,X2,…,Xn獨(dú)立,且與
X
同分布,故即,Ak是
ak的無偏估計(jì)。這就是人們?yōu)槭裁闯S脴颖?/p>
k
階矩估計(jì)總體
k
階矩的主要原因之一。例3:設(shè)總體X的k階原點(diǎn)距為ak=E(Xk),X1,54例4:設(shè)總體
X
服從參數(shù)為θ
的指數(shù)分布,即其概率密度函數(shù)為證明:設(shè)Z的分布函數(shù)為
FZ(z,θ),先求分布函數(shù),然后導(dǎo)出
Z
的概率密度函數(shù)及
E(nZ)。若
X1,X2,…,Xn是
X
的隨機(jī)樣本,記則
nZ
為θ
的無偏估計(jì)。
例4:設(shè)總體X服從參數(shù)為θ的指數(shù)分布,即其概率密度函數(shù)55因X1,X2,…,Xn獨(dú)立,且與
X
同分布,所以,對任意給定的
Z>0,有于是,E(Z)=θ/n,E(nZ)=θ,即
nZ
為θ
的無偏估計(jì)。
因X1,X2,…,Xn獨(dú)立,且與X同分布,所以,對任56
用估計(jì)量估計(jì),估計(jì)誤差7.3.2均方誤差準(zhǔn)則
是隨機(jī)變量,通常用其均值衡量估計(jì)誤差的大小。要注意:為了防止求均值時(shí)正、負(fù)誤差相互抵消,我們先將其平方后再求均值,并稱其為均方誤差,記成,即用估計(jì)量57
哪個(gè)估計(jì)的均方誤差小,就稱哪個(gè)估計(jì)比較優(yōu),這種判定估計(jì)優(yōu)劣的準(zhǔn)則為“均方誤差準(zhǔn)則”。注意:均方誤差可分解成兩部分:證明:哪個(gè)估計(jì)58上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方差,第二部分是估計(jì)量的偏差的平方和。
注意:如果一個(gè)估計(jì)量是無偏的,則第二部分是零,則有:
如果兩個(gè)估計(jì)都是無偏估計(jì),這時(shí)哪個(gè)估計(jì)的方差小,哪個(gè)估計(jì)就較優(yōu)。這種判定估計(jì)量優(yōu)劣的準(zhǔn)則稱為方差準(zhǔn)則。上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方59例5:設(shè)
X1,X2,…,Xn為抽自均值為
的總體,考慮
的如下兩個(gè)估計(jì)的優(yōu)劣:
我們看到:顯然兩個(gè)估計(jì)都是的無偏估計(jì)。計(jì)算二者的方差:例5:設(shè)X1,X2,…,Xn為抽自均值為的總60這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全樣本要好。
這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全61前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)算出的值
(即實(shí)軸上點(diǎn))來估計(jì)未知參數(shù)?!?.4區(qū)間估計(jì)其優(yōu)點(diǎn)是:可直地告訴人們“未知參數(shù)大致是多少”;缺點(diǎn)是:并未反映出估計(jì)的誤差范圍(精度)。故,在使用上還有不盡如人意之處。而區(qū)間估計(jì)正好彌補(bǔ)了點(diǎn)估計(jì)的這一不足之處。前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)62
例如:在估計(jì)正態(tài)總體均值
μ
的問題中,若根據(jù)一組實(shí)際樣本,得到
μ
的極大似然估計(jì)為
10.12。一個(gè)可以想到的估計(jì)辦法是:給出一個(gè)區(qū)間,并告訴人們該區(qū)間包含未知參數(shù)
μ
的可靠度(也稱置信系數(shù))。實(shí)際上,μ的真值可能大于10.12,也可能小于10.12。例如:在估計(jì)正態(tài)總體均值μ的問題中,63也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠度相信區(qū)間包含參數(shù)μ
。這里的“可靠度”是用概率來度量的,稱為置信系數(shù),常用表示也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠64置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0.95或0.99,即
根據(jù)實(shí)際樣本,由給定的置信系數(shù),可求出一個(gè)盡可能短的區(qū)間,使置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取065
為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量的上α分位點(diǎn)的概念。為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量66數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件67數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件68書末附有χ2分布、t分布、F分布的上側(cè)分位數(shù)表可供使用。需要注意的地方在教材上均有說明?,F(xiàn)在回到尋找置信區(qū)間問題上來。書末附有χ2分布、t分布、F分布的上側(cè)分位69區(qū)間估計(jì)的定義定義1:區(qū)間估計(jì)的定義定義1:70實(shí)際應(yīng)用上,一般取
α=0.05或
0.01。實(shí)際應(yīng)用上,一般取α=0.05或0.01。71§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理(見定理6.4.1),知7.5.1單正態(tài)總體參數(shù)的區(qū)間估計(jì)§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理72數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件73也可簡記為于是,μ的置信區(qū)間為也可簡記為于是,μ的置信區(qū)間為74例1:
某廠生產(chǎn)的零件長度
X
服從
N(
,0.04),現(xiàn)從該廠生產(chǎn)的零件中隨機(jī)抽取6個(gè),長度測量值如下(單位:毫米):
14.6,15.l,14.9,14.8,15.2,15.1.求:μ的置信系數(shù)為0.95的區(qū)間估計(jì)。解:n=6,=0.05,z/2=z0.025=1.96,2=0.22
.所求置信區(qū)間為例1:某廠生產(chǎn)的零件長度X服從N(,0.0475當(dāng)方差未知時(shí),取●
μ
的區(qū)間估計(jì)當(dāng)方差未知時(shí),取●μ的區(qū)間估計(jì)76于是,μ的置信系數(shù)為1-α
的區(qū)間估計(jì)為也可簡記為于是,μ的置信系數(shù)為1-α的區(qū)間估計(jì)為也可簡記為77●
σ2
的區(qū)間估計(jì)●σ2的區(qū)間估計(jì)78例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值(單位:千克)如下:10.l,10.0,9.8,10.5,9.7,l0.l,9.9,10.2,10.3,9.9.設(shè)它們服從正態(tài)分布
N(,2)。求的置信系數(shù)為0.95的置信區(qū)間。例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值79解:
n=10,=0.05,t9(0.025)=2.2622,解:n=10,=0.05,t9(0.080例3(續(xù)例2):
求2的置信系數(shù)為0.95的置信區(qū)間。解:n=10,
=0.05,S2=0.0583,查附表得,
于是,例3(續(xù)例2):求2的置信系數(shù)為0.95的置信區(qū)間。解:817.5.2兩個(gè)正態(tài)總體的情況
在實(shí)際應(yīng)用中,我們經(jīng)常會遇到兩個(gè)正態(tài)總體均值差和方差之比的區(qū)間估計(jì)問題。于是,評價(jià)新技術(shù)的效果問題,就歸結(jié)為研究兩個(gè)正態(tài)總體均值之差
1-2
與與方差之比12/22的問題。例如:考察一項(xiàng)新技術(shù)對提高產(chǎn)品某項(xiàng)質(zhì)量指標(biāo)的作用,將實(shí)施新技術(shù)前產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體
N(1,
12),實(shí)施新技術(shù)后產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體
N(2,22)。7.5.2兩個(gè)正態(tài)總體的情況在實(shí)際應(yīng)用中,我們經(jīng)82
定理1:設(shè)
X1,X2,···,Xm是抽自正態(tài)總體X
的簡單樣本,X~N(1,12),樣本均值與樣本方差分別為Y1,Y2,···,
Yn是抽自正態(tài)總體
Y
的簡單樣本,Y
~N(2,22),樣本均值與樣本方差分別為I.兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì)定理1:設(shè)X1,X2,···,Xm是83當(dāng)兩樣本相互獨(dú)立時(shí),有當(dāng)兩樣本相互獨(dú)立時(shí),有84證明:1).由基本定理(見定理6.4.1),知
故,(4)式成立;且二者相互獨(dú)立。證明:1).由基本定理(見定理6.4.1),知85且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t分布的定義,有且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t86N(0,1)χ
2m+n-2換形式~t
m+n-2
.
分母互換N(0,1)χ2m+n-2換形式~tm+n-2.87利用該定理,我們可以得到μ1-μ2
的置信系數(shù)為
1-α的置信區(qū)間。利用該定理,我們可以得到μ1-μ2的置信88例4
(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗強(qiáng)度分別為
X~N(1,2.182)和Y~N(2,1.762)。試驗(yàn)者從這兩種棉紗中分別抽取樣本X1,X2,…,X200和Y1,Y2,…,Y100,樣本均值分別為:求1-2的置信系數(shù)為
0.95
的區(qū)間估計(jì)。
解:
1=2.18,2=1.76,m=200,n=100,=0.05,由(8)式,得
1-
2
的置信系數(shù)為
1-的置信區(qū)間為例4(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗89例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所裝礦泉水的體積(單位:毫升)X~N(1,2)和
Y~N(2,2)?,F(xiàn)從生產(chǎn)線上分別抽取
X1,X2,…,X12
和
Y1,Y2,…,
Y17,樣本均值與樣本方差分別為:求
1-
2的置信系數(shù)為0.95的區(qū)間估計(jì)。解:m=12,n=17,=0.05,再由其他已知條件及(10)式,可算出例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所90查
t
分布表,得tm+n-2(α/2)=
t27(0.025)=2.05.再由(9)式,得
1-
2
的置信系數(shù)為
1-的置信區(qū)間
在這兩個(gè)例子中,
1-
2
的置信區(qū)間都包含了零,也就是說:
1可能大于
2,也可能小于
2。這時(shí)我們認(rèn)為二者沒有顯著差異。
查t分布表,得tm+n-2(α/2)=t2791II.兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)
定理2:設(shè)
X1,X2,···,Xm是抽自正態(tài)總體X
的簡單樣本,X~N(1,12),樣本均值與樣本方差分別為Y1,Y2,···,
Yn是抽自正態(tài)總體
Y
的簡單樣本,Y
~N(2,22),樣本均值與樣本方差為II.兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)定理2:92由定理2,易得到兩個(gè)正態(tài)總體方差之比的置信系數(shù)為1-α置信區(qū)間為:由定理2,易得到兩個(gè)正態(tài)總體方差之比93例5:研究機(jī)器A和機(jī)器B生產(chǎn)的鋼管的內(nèi)徑,隨機(jī)抽取A生產(chǎn)的鋼管18根,測得樣本方差0.34
(mm2);隨機(jī)抽取B生產(chǎn)的鋼管13根,測得樣本方差為0.29(mm2)。設(shè)兩樣本相互獨(dú)立,且機(jī)器A和機(jī)器B生產(chǎn)的鋼管的內(nèi)徑分別服從正態(tài)分布N(1,2)與
N(2,2)。求的置信水平為0.90的置信區(qū)間。
解:
由m=18,n=13,S12=0.34,S22=0.29,
=0.10及(11)式,得
的置信系數(shù)為
0.90
的置信區(qū)間為例5:研究機(jī)器A和機(jī)器B生產(chǎn)的鋼管的內(nèi)徑,隨機(jī)抽取A生產(chǎn)的94§7.6非正態(tài)總體的區(qū)間估計(jì)
前面兩節(jié)討論了正態(tài)總體分布參數(shù)的區(qū)間估計(jì)。但是在實(shí)際應(yīng)用中,我們有時(shí)不能判斷手中的數(shù)據(jù)是否服從正態(tài)分布,或者有足夠理由認(rèn)為它們不服從正態(tài)分布。這時(shí),只要樣本大小
n
比較大,總體均值
μ
的置信區(qū)間仍可用正態(tài)總體情形的公式或σ2已知時(shí)σ2未知時(shí)§7.6非正態(tài)總體的區(qū)間估計(jì)前面兩節(jié)討95所不同的是:這時(shí)的置信區(qū)間是近似的。
這是求一般總體均值的一種簡單有效的方法,其理論依據(jù)是中心極限定理,它要求樣本大小
n
比較大。因此,這個(gè)方法稱為大樣本方法。設(shè)總體均值為μ,方差為σ2,
X1,X2,…,Xn為來自總體的樣本。因?yàn)檫@些樣本獨(dú)立同分布的,根據(jù)中心極限定理,對充分大的n,下式近似成立所不同的是:這時(shí)的置信區(qū)間是近似的。這是求96因而,近似地有
于是,μ
的置信系數(shù)約為1-α的置信區(qū)間為當(dāng)σ2未知時(shí),用σ2的某個(gè)估計(jì),如
S2來代替,得到因而,近似地有于是,μ的置信系數(shù)約為1-α的置信區(qū)間97只要
n
很大,(2)式所提供的置信區(qū)間在應(yīng)用上是令人滿意的。
那么,n
究竟多大才算很大呢?
顯然,對于相同的
n
,(2)式所給出的置信區(qū)間的近似程度隨總體分布與正態(tài)分布的接近程度而變化,因此,理論上很難給出n很大的一個(gè)界限。但許多應(yīng)用實(shí)踐表明:當(dāng)n≥30時(shí),近似程度是可以接受的;當(dāng)n≥50時(shí),近似程度是很好的。只要n很大,(2)式所提供的置信區(qū)間在應(yīng)用上是令人滿意的98例1:某公司欲估計(jì)自己生產(chǎn)的電池壽命?,F(xiàn)從其產(chǎn)品中隨機(jī)抽取
50
只電池做壽命試驗(yàn)。這些電池壽命的平均值為
2.261
(單位:100小時(shí)),標(biāo)準(zhǔn)差
S=1.935。求該公司生產(chǎn)的電池平均壽命的置信系數(shù)為
95%
的置信區(qū)間。
解:查正態(tài)分布表,得zα/2=z0.025=1.96,由公式(2),得電池平均壽命的置信系數(shù)為
95%
的置信區(qū)間為例1:某公司欲估計(jì)自己生產(chǎn)的電池壽命?,F(xiàn)從其產(chǎn)品中隨機(jī)抽取99設(shè)事件
A
在一次試驗(yàn)中發(fā)生的概率為
p,現(xiàn)在做
n
次試驗(yàn),以Yn記事件
A
發(fā)生的次數(shù),則
Yn~B(n,p)。依中心極限定理,對充分大的
n,近似地有
7.6.1二項(xiàng)分布
(3)式是(1)式的特殊情形。設(shè)事件A在一次試驗(yàn)中發(fā)生的概率為p,100
(4)式就是二項(xiàng)分布參數(shù)
p
的置信系數(shù)約為1-α
的置信區(qū)間。例2:商品檢驗(yàn)部門隨機(jī)抽查了某公司生產(chǎn)的產(chǎn)品100件,發(fā)現(xiàn)其中合格產(chǎn)品為84件,試求該產(chǎn)品合格率的置信系數(shù)為0.95的置信區(qū)間。解:n=100,Yn=84,α
=0.05,zα/2=1.96,將這些結(jié)果代入到(4)式,得p的置信系數(shù)為0.95的近似置信區(qū)間為[0.77,0.91]。(4)式就是二項(xiàng)分布參數(shù)p的置信系數(shù)約為101例3:在環(huán)境保護(hù)問題中,飲水質(zhì)量研究占有重要地位,其中一項(xiàng)工作是檢查飲用水中是否存在某種類型的微生物。假設(shè)在隨機(jī)抽取的100份一定容積的水樣品中有20份含有這種類型的微生物。試求同樣容積的這種水含有這種微生物的概率
p
的置信系數(shù)為0.90的置信區(qū)間。解:n=100,Yn=20,α=0.10,zα/2=1.645,將這些結(jié)果代入到(4)式,得
p
的置信系數(shù)為0.90的近似置信區(qū)間為[0.134,0.226]。例3:在環(huán)境保護(hù)問題中,飲水質(zhì)量研究占有重要地位,其中1027.6.2泊松分布
設(shè)X1,X2,…,Xn為抽自具有泊松分布P(λ
)的總體的樣本,因?yàn)?/p>
E(X)=D(X)=
λ
,應(yīng)用(2)式,并用7.6.2泊松分布設(shè)X1,X2103例4:公共汽車站在一單位時(shí)間內(nèi)(如半小時(shí),或1小時(shí),或一天等)到達(dá)的乘客數(shù)服從泊松分布P(
λ
),對不同的車站,不同的僅是參數(shù)
λ
的取值不同。現(xiàn)對某城市某公共汽車站進(jìn)行100個(gè)單位時(shí)間的調(diào)查。這里單位時(shí)間是20分鐘。計(jì)算得到每
20
分鐘內(nèi)來到該車站的乘客數(shù)平均值為
15.2
人。試求參數(shù)
λ
的置信系數(shù)為95%的置信區(qū)間。
解:
n=100,α=0.05,zα
/2=1.96,將這些結(jié)果代入到(5)式,得λ
的置信系數(shù)為0.95的近似置信區(qū)間為[14.44,15.96]。例4:公共汽車站在一單位時(shí)間內(nèi)(如半小時(shí),或1小時(shí),或一104數(shù)理統(tǒng)計(jì)與隨機(jī)過程第七章主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院數(shù)理統(tǒng)計(jì)與隨機(jī)過程主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院105第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):
●總體分布類型的判斷;
●總體分布中未知參數(shù)的推斷(參數(shù)估計(jì)與
假設(shè)檢驗(yàn))。第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):106參數(shù)估計(jì)問題的一般提法設(shè)總體
X
的分布函數(shù)為
F(x,θ),其中θ為未知參數(shù)或參數(shù)向量,現(xiàn)從該總體中抽樣,得到樣本X1,X2,…,Xn.
依樣本對參數(shù)θ做出估計(jì),或估計(jì)參數(shù)θ的某個(gè)已知函數(shù)g(θ)。
這類問題稱為參數(shù)估計(jì)。參數(shù)估計(jì)包括:點(diǎn)估計(jì)和區(qū)間估計(jì)。參數(shù)估計(jì)問題的一般提法設(shè)總體X的分布函數(shù)為F(107稱該計(jì)算值為
μ
的一個(gè)點(diǎn)估計(jì)。為估計(jì)參數(shù)μ,需要構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量
T(
X1,X2,…,Xn),一旦當(dāng)有了樣本,就將樣本值代入到該統(tǒng)計(jì)量中,算出一個(gè)值作為
μ
的估計(jì),
108尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘法4.貝葉斯方法
…我們僅介紹前面的兩種參數(shù)估計(jì)法。尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘109其思想是:用同階、同類的樣本矩來估計(jì)總體矩。矩估計(jì)是基于“替換”思想建立起來的一種參數(shù)估計(jì)方法。最早由英國統(tǒng)計(jì)學(xué)家K.
皮爾遜
提出?!?.1矩估計(jì)其思想是:用同階、同類矩估計(jì)是基于“替換”110矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。111設(shè)總體
X
的分布函數(shù)中含
k
個(gè)未知參數(shù)步驟一:記總體
X
的
m
階原點(diǎn)矩
E(Xm)為
am
,
m
=
1,2,…,k.am(1,2,…,k),
m=1,2,…,k.
一般地,am(m
=
1,2,
…,K)是總體分布中參數(shù)或參數(shù)向量(1,
2,
…,
k)
的函數(shù)。
故,am(m=1,
2,…,k)應(yīng)記成:設(shè)總體X的分布函數(shù)中含k個(gè)未知參數(shù)步驟一:記總體112步驟二:算出樣本的
m
階原點(diǎn)矩步驟三:令得到關(guān)于
1,2,…,k
的方程組(L≥k)。一般要求方程組(1)中有
k
個(gè)獨(dú)立方程。步驟二:算出樣本的m階原點(diǎn)矩步驟三:令得到關(guān)于113步驟四:解方程組(1),并記其解為這種參數(shù)估計(jì)法稱為參數(shù)的矩估計(jì)法,簡稱矩法。步驟四:解方程組(1),并記其解為這種參數(shù)114解:先求總體的期望例1:設(shè)總體
X
的概率密度為解:先求總體的期望例1:設(shè)總體X的概率密度為115由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊加上“^”,表示參數(shù)的估計(jì)。它是統(tǒng)計(jì)量。由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊116解:
先求總體的均值和
2
階原點(diǎn)矩。例2:設(shè)
X1,X2,…Xn是取自總體
X
的簡單樣本,X有概率密度函數(shù)解:先求總體的均值和2階原點(diǎn)矩。例2:設(shè)X1,X2117數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件118用樣本矩估計(jì)總體矩得用樣本矩得119列出方程組:例3:設(shè)總體X的均值為,方差為2,求
和2的矩估計(jì)。解:由
列出方程組:例3:設(shè)總體X的均值為,方差為2,求和120故,均值,方差2的矩估計(jì)為求解,得故,均值,方差2的矩估計(jì)為求解,得121如:正態(tài)總體N(
,2)中
和2的矩估計(jì)為如:正態(tài)總體N(,2)中和2的矩估計(jì)為122又如:若總體X~U(a,b),求a,b的矩估計(jì)。解:列出方程組因
又如:若總體X~U(a,b),求a,b的矩估計(jì)。解123解上述方程組,得到
a,b
的矩估計(jì):解上述方程組,得到a,b的矩估計(jì):124
矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體是什么分布。
缺點(diǎn)是:當(dāng)總體的分布類型已知時(shí),未充分利用分布所提供的信息;此外,一般情形下,矩估計(jì)不具有唯一性。矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體125§7.2極大似然估計(jì)極大似然估計(jì)法是在總體的分布類型已知前提下,使用的一種參數(shù)估計(jì)法。該方法首先由德國數(shù)學(xué)家高斯于1821年提出,其后英國統(tǒng)計(jì)學(xué)家費(fèi)歇于1922年發(fā)現(xiàn)了這一方法,研究了方法的一些性質(zhì),并給出了求參數(shù)極大似然估計(jì)一般方法——極大似然估計(jì)原理?!?.2極大似然估計(jì)極大似然估計(jì)法是在126I.極大似然估計(jì)原理設(shè)總體
X
的分布
(連續(xù)型時(shí)為概率密度,離散型時(shí)為概率分布)
為f(x,
θ)
,X1,
X2,
…,Xn是抽自總體
X
的簡單樣本。于是,樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布)為被看作固定,但未知的參數(shù)視為變量I.極大似然估計(jì)原理設(shè)總體X的分布127將上式簡記為
L(θ),即稱L(θ)為θ的似然函數(shù)。視為變量視為固定值將上式簡記為L(θ),即稱L(θ)為θ的似然函數(shù)。視為變128假定我們觀測到一組樣本X1,X2,…,
Xn,要去估計(jì)未知參數(shù)θ
。稱為θ的極大似然估計(jì)(MLE)。一種直觀的想法是:哪個(gè)參數(shù)(多個(gè)參數(shù)時(shí)是哪組參數(shù))使得這組樣本出現(xiàn)的可能性(概率)最大,就用那個(gè)參數(shù)(或哪組參數(shù))作為參數(shù)的估計(jì)。這就是極大似然估計(jì)原理。即,如果θ可能變化空間,稱為參數(shù)空間。假定我們觀測到一組樣本X1,X2,…,129(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,就得參數(shù)θ的極大似然估計(jì)。II.求極大似然估計(jì)(MLE)的一般步驟.由總體分布導(dǎo)出樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布);(2).把樣本的聯(lián)合概率函數(shù)中的自變量看成已知常數(shù),參數(shù)θ看成自變量,得到似然函數(shù)L(θ);(3).求似然函數(shù)L(θ
)的最大值點(diǎn)(常常轉(zhuǎn)化為求lnL(θ)的最大值點(diǎn)),即θ的MLE;(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,II.130兩點(diǎn)說明:●求似然函數(shù)
L(θ)
的最大值點(diǎn),可應(yīng)用微積分中的技巧。由于
ln(x)
是
x
的增函數(shù),所以
lnL(θ)
與
L(θ)
在θ的同一點(diǎn)處達(dá)到各自的最大值。假定θ是一實(shí)數(shù),lnL(θ)是θ的一個(gè)可微函數(shù)。通過求解似然方程可以得到θ的MLE。兩點(diǎn)說明:●求似然函數(shù)L(θ)的最大值點(diǎn),可應(yīng)用微積131●用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大似然原理來求。若θ是向量,上述似然方程需用似然方程組代替?!裼蒙鲜龇椒ㄇ髤?shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大132III.下面舉例說明如何求參數(shù)的MLE例1:
設(shè)X1,X2,…,Xn是取自總體X~B(1,p)的一個(gè)樣本,求參數(shù)p
的極大似然估計(jì)。解:似然函數(shù)為III.下面舉例說明如何求參數(shù)的MLE例1:設(shè)X1,X133對數(shù)似然函數(shù)為:對
p
求導(dǎo),并令其等于零,得上式等價(jià)于對數(shù)似然函數(shù)為:對p求導(dǎo),并令其等于零,得上式等價(jià)于134解上述方程,得換成換成解上述方程,得換成換成135例2:求正態(tài)總體
N(,2)參數(shù)
和
2
的極大似然估計(jì)(注:我們把
2
看作一個(gè)參數(shù))。解:似然函數(shù)為對數(shù)似然函數(shù)為例2:求正態(tài)總體N(,2)參數(shù)和2的136似然方程組為由第一個(gè)方程,得到代入第二方程,得到似然方程組為由第一個(gè)方程,得到代入第二方程,得到137是L(,2)的最大值點(diǎn),即
和
2
的極大似然估計(jì)。下面驗(yàn)證:似然方程組的唯一解是似然函數(shù)的最大值點(diǎn)。是L(,138例3:設(shè)總體
X
服從泊松分布P(
),求參數(shù)的極大似然估計(jì)。解:由
X
的概率分布函數(shù)為得的似然函數(shù)例3:設(shè)總體X服從泊松分布P(),求參數(shù)的極大139似然方程為對數(shù)似然函數(shù)為其解為似然方程為對數(shù)似然函數(shù)為其解為140換成換成得的極大似然估計(jì)換成換成得的極大似然估計(jì)141例4:設(shè)
X
~U(a,b),求a,b的極大似然估計(jì)。
解:因所以例4:設(shè)X~U(a,b),求a,b的極大似然估142數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件143由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)的,所以我們不能用似然方程組來求極大似然估計(jì),而必須從極大似然估計(jì)的定義出發(fā),求L(a,b)的最大值。由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)144為使
L(a,b)
達(dá)到最大,b-a
應(yīng)該盡量地小。但
b不能小于max{x1,x2,…,xn}。否則,L(a,b)=0。類似地,a
不能大于min{x1,x2,…,xn}。因此,a
和
b
的極大似然估計(jì)為為使L(a,b)達(dá)到最大,b-a應(yīng)該盡量地小145解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體
X
的一個(gè)樣本,X
有如下概率密度函數(shù)其中θ
>0為未知常數(shù)。求θ的極大似然估計(jì)。也可寫成解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體146求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得147
從前面兩節(jié)的討論中可以看到:●同一參數(shù)可以有幾種不同的估計(jì),這時(shí)就需要判斷采用哪一種估計(jì)為好的問題?!窳硪环矫妫瑢τ谕粋€(gè)參數(shù),用矩法和極大似然法即使得到的是同一個(gè)估計(jì),也存在衡量這個(gè)估計(jì)優(yōu)劣的問題。估計(jì)量的優(yōu)良性準(zhǔn)則就是:評價(jià)一個(gè)估計(jì)量“好”與“壞”的標(biāo)準(zhǔn)?!?.3估計(jì)量的優(yōu)良性準(zhǔn)則從前面兩節(jié)的討論中可以看到:§7.3估計(jì)量的優(yōu)良性準(zhǔn)148
設(shè)總體的分布參數(shù)為θ
,對一切可能的θ成立,則稱為的無偏估計(jì)。7.3.1無偏性對于樣本X1,X2,,Xn的不同取值,取不同的值
)。如果的均值等于θ,即簡記為是θ
的一個(gè)估計(jì)(注意!它是一個(gè)統(tǒng)計(jì)量,是隨機(jī)變量。設(shè)總體的分布參數(shù)為θ,對一切可能的θ成立,則稱為149參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于?!耙磺锌赡艿?/p>
”是指:在參數(shù)估計(jì)問題中,參數(shù)
一切可能的取值。我們之所以要求對一切可能的
都成立,是因?yàn)樵趨?shù)估計(jì)問題中,我們并不知道參數(shù)的真實(shí)取值。自然要求它在參數(shù)的一切可能取值的范圍內(nèi)都成立說明:無偏性的意義是:用估計(jì)量估計(jì)參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于150例1:設(shè)
X1,X2,…,Xn為抽自均值為的總體X的隨機(jī)樣本,考慮
的如下幾個(gè)估計(jì)量:例如:若指的是正態(tài)總體N(
,2)的均值,則其一切可能取值范圍是(-∞,∞)。若指的是方差2,則其一切可能取值范圍是(0,∞)。例1:設(shè)X1,X2,…,Xn為抽自均值為的總151數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件152
定理1:設(shè)總體
X
的均值為,方差為2,X1,X2,…,Xn
為來自總體
X的隨機(jī)樣本,記與分別為樣本均值與樣本方差,即
即樣本均值和樣本方差分別是
總體均值
和總體方差
的無偏估計(jì)。定理1:設(shè)總體X的均值為,方差為2,153證明:因?yàn)?/p>
X1,X2,…,Xn獨(dú)立同分布,且E(Xi
)=μ,所以另一方面,因證明:因?yàn)閄1,X2,…,Xn獨(dú)立同分布,且另一方154于是,有注意到于是,有注意到155前面兩節(jié)中,我們曾用矩法和極大似然法分別求得了正態(tài)總體N(μ
,σ2)中參數(shù)
σ2的估計(jì),均為很顯然,它不是
σ2
的無偏估計(jì)。這正是我們?yōu)槭裁匆獙⑵浞帜感拚秊閚-1,獲得樣本方差S2來估計(jì)
σ2
的理由。前面兩節(jié)中,我們曾用矩法和極大似然法分別求得156例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。證明:因
E(S2)=2,所以,D(S)+[E(S)]2=
2,由
D(S)>0,知
[E(S)]2=
2-D(S)<
2.所以,E(S)<.故,S
不是
的無偏估計(jì)。例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。157例3:設(shè)總體
X的
k階原點(diǎn)距為
ak=E(Xk),X1,X2,…,Xn是X的隨機(jī)樣本,樣本
k
階原點(diǎn)距為Ak,則Ak是ak的無偏估計(jì),k=1,2,…。證明:因X1,X2,…,Xn獨(dú)立,且與
X
同分布,故即,Ak是
ak的無偏估計(jì)。這就是人們?yōu)槭裁闯S脴颖?/p>
k
階矩估計(jì)總體
k
階矩的主要原因之一。例3:設(shè)總體X的k階原點(diǎn)距為ak=E(Xk),X1,158例4:設(shè)總體
X
服從參數(shù)為θ
的指數(shù)分布,即其概率密度函數(shù)為證明:設(shè)Z的分布函數(shù)為
FZ(z,θ),先求分布函數(shù),然后導(dǎo)出
Z
的概率密度函數(shù)及
E(nZ)。若
X1,X2,…,Xn是
X
的隨機(jī)樣本,記則
nZ
為θ
的無偏估計(jì)。
例4:設(shè)總體X服從參數(shù)為θ的指數(shù)分布,即其概率密度函數(shù)159因X1,X2,…,Xn獨(dú)立,且與
X
同分布,所以,對任意給定的
Z>0,有于是,E(Z)=θ/n,E(nZ)=θ,即
nZ
為θ
的無偏估計(jì)。
因X1,X2,…,Xn獨(dú)立,且與X同分布,所以,對任160
用估計(jì)量估計(jì),估計(jì)誤差7.3.2均方誤差準(zhǔn)則
是隨機(jī)變量,通常用其均值衡量估計(jì)誤差的大小。要注意:為了防止求均值時(shí)正、負(fù)誤差相互抵消,我們先將其平方后再求均值,并稱其為均方誤差,記成,即用估計(jì)量161
哪個(gè)估計(jì)的均方誤差小,就稱哪個(gè)估計(jì)比較優(yōu),這種判定估計(jì)優(yōu)劣的準(zhǔn)則為“均方誤差準(zhǔn)則”。注意:均方誤差可分解成兩部分:證明:哪個(gè)估計(jì)162上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方差,第二部分是估計(jì)量的偏差的平方和。
注意:如果一個(gè)估計(jì)量是無偏的,則第二部分是零,則有:
如果兩個(gè)估計(jì)都是無偏估計(jì),這時(shí)哪個(gè)估計(jì)的方差小,哪個(gè)估計(jì)就較優(yōu)。這種判定估計(jì)量優(yōu)劣的準(zhǔn)則稱為方差準(zhǔn)則。上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方163例5:設(shè)
X1,X2,…,Xn為抽自均值為
的總體,考慮
的如下兩個(gè)估計(jì)的優(yōu)劣:
我們看到:顯然兩個(gè)估計(jì)都是的無偏估計(jì)。計(jì)算二者的方差:例5:設(shè)X1,X2,…,Xn為抽自均值為的總164這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全樣本要好。
這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全165前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)算出的值
(即實(shí)軸上點(diǎn))來估計(jì)未知參數(shù)。§7.4區(qū)間估計(jì)其優(yōu)點(diǎn)是:可直地告訴人們“未知參數(shù)大致是多少”;缺點(diǎn)是:并未反映出估計(jì)的誤差范圍(精度)。故,在使用上還有不盡如人意之處。而區(qū)間估計(jì)正好彌補(bǔ)了點(diǎn)估計(jì)的這一不足之處。前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)166
例如:在估計(jì)正態(tài)總體均值
μ
的問題中,若根據(jù)一組實(shí)際樣本,得到
μ
的極大似然估計(jì)為
10.12。一個(gè)可以想到的估計(jì)辦法是:給出一個(gè)區(qū)間,并告訴人們該區(qū)間包含未知參數(shù)
μ
的可靠度(也稱置信系數(shù))。實(shí)際上,μ的真值可能大于10.12,也可能小于10.12。例如:在估計(jì)正態(tài)總體均值μ的問題中,167也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠度相信區(qū)間包含參數(shù)μ
。這里的“可靠度”是用概率來度量的,稱為置信系數(shù),常用表示也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠168置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0.95或0.99,即
根據(jù)實(shí)際樣本,由給定的置信系數(shù),可求出一個(gè)盡可能短的區(qū)間,使置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0169
為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量的上α分位點(diǎn)的概念。為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量170數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件171數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件172書末附有χ2分布、t分布、F分布的上側(cè)分位數(shù)表可供使用。需要注意的地方在教材上均有說明?,F(xiàn)在回到尋找置信區(qū)間問題上來。書末附有χ2分布、t分布、F分布的上側(cè)分位173區(qū)間估計(jì)的定義定義1:區(qū)間估計(jì)的定義定義1:174實(shí)際應(yīng)用上,一般取
α=0.05或
0.01。實(shí)際應(yīng)用上,一般取α=0.05或0.01。175§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理(見定理6.4.1),知7.5.1單正態(tài)總體參數(shù)的區(qū)間估計(jì)§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理176數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件177也可簡記為于是,μ的置信區(qū)間為也可簡記為于是,μ的置信區(qū)間為178例1:
某廠生產(chǎn)的零件長度
X
服從
N(
,0.04),現(xiàn)從該廠生產(chǎn)的零件中隨機(jī)抽取6個(gè),長度測量值如下(單位:毫米):
14.6,15.l,14.9,14.8,15.2,15.1.求:μ的置信系數(shù)為0.95的區(qū)間估計(jì)。解:n=6,=0.05,z/2=z0.025=1.96,2=0.22
.所求置信區(qū)間為例1:某廠生產(chǎn)的零件長度X服從N(,0.04179當(dāng)方差未知時(shí),取●
μ
的區(qū)間估計(jì)當(dāng)方差未知時(shí),取●μ的區(qū)間估計(jì)180于是,μ的置信系數(shù)為1-α
的區(qū)間估計(jì)為也可簡記為于是,μ的置信系數(shù)為1-α的區(qū)間估計(jì)為也可簡記為181●
σ2
的區(qū)間估計(jì)●σ2的區(qū)間估計(jì)182例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值(單位:千克)如下:10.l,10.0,9.8,10.5,9.7,l0.l,9.9,10.2,10.3,9.9.設(shè)它們服從正態(tài)分布
N(,2)。求的置信系數(shù)為0.95的置信區(qū)間。例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值183解:
n=10,=0.05,t9(0.025)=2.2622,解:n=10,=0.05,t9(0.0184例3(續(xù)例2):
求2的置信系數(shù)為0.95的置信區(qū)間。解:n=10,
=0.05,S2=0.0583,查附表得,
于是,例3(續(xù)例2):求2的置信系數(shù)為0.95的置信區(qū)間。解:1857.5.2兩個(gè)正態(tài)總體的情況
在實(shí)際應(yīng)用中,我們經(jīng)常會遇到兩個(gè)正態(tài)總體均值差和方差之比的區(qū)間估計(jì)問題。于是,評價(jià)新技術(shù)的效果問題,就歸結(jié)為研究兩個(gè)正態(tài)總體均值之差
1-2
與與方差之比12/22的問題。例如:考察一項(xiàng)新技術(shù)對提高產(chǎn)品某項(xiàng)質(zhì)量指標(biāo)的作用,將實(shí)施新技術(shù)前產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體
N(1,
12),實(shí)施新技術(shù)后產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體
N(2,22)。7.5.2兩個(gè)正態(tài)總體的情況在實(shí)際應(yīng)用中,我們經(jīng)186
定理1:設(shè)
X1,X2,···,Xm是抽自正態(tài)總體X
的簡單樣本,X~N(1,12),樣本均值與樣本方差分別為Y1,Y2,···,
Yn是抽自正態(tài)總體
Y
的簡單樣本,Y
~N(2,22),樣本均值與樣本方差分別為I.兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì)定理1:設(shè)X1,X2,···,Xm是187當(dāng)兩樣本相互獨(dú)立時(shí),有當(dāng)兩樣本相互獨(dú)立時(shí),有188證明:1).由基本定理(見定理6.4.1),知
故,(4)式成立;且二者相互獨(dú)立。證明:1).由基本定理(見定理6.4.1),知189且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t分布的定義,有且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t190N(0,1)χ
2m+n-2換形式~t
m+n-2
.
分母互換N(0,1)χ2m+n-2換形式~tm+n-2.191利用該定理,我們可以得到μ1-μ2
的置信系數(shù)為
1-α的置信區(qū)間。利用該定理,我們可以得到μ1-μ2的置信192例4
(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗強(qiáng)度分別為
X~N(1,2.182)和Y~N(2,1.762)。試驗(yàn)者從這兩種棉紗中分別抽取樣本X1,X2,…,X200和Y1,Y2,…,Y100,樣本均值分別為:求1-2的置信系數(shù)為
0.95
的區(qū)間估計(jì)。
解:
1=2.18,2=1.76,m=200,n=100,=0.05,由(8)式,得
1-
2
的置信系數(shù)為
1-的置信區(qū)間為例4(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗193例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所裝礦泉水的體積(單位:毫升)X~N(1,2)和
Y~N(2,2)。現(xiàn)從生產(chǎn)線上分別抽取
X1,X2,…,X12
和
Y1,Y2,…,
Y17,樣本均值與樣本方差分別為:求
1-
2的置信系數(shù)為0.95的區(qū)間估計(jì)。解:m=12,n=17,=0.05,再由其他已知條件及(10)式,可算出例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所194查
t
分布表,得tm+n-2(α/2)=
t27(0.025
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年藝術(shù)品私人展覽策劃與運(yùn)營合同3篇
- 2025年度個(gè)人門面房出租合同(含家具贈送及經(jīng)營指導(dǎo)服務(wù)協(xié)議)3篇
- 2025年旅游服務(wù)售后保障及投訴處理協(xié)議3篇
- 二零二五年度集資房購房合同解除及終止協(xié)議3篇
- 2025年度個(gè)人股權(quán)激勵(lì)方案設(shè)計(jì)與轉(zhuǎn)讓合同3篇
- 2025年校車租賃與駕駛員健康管理合同3篇
- 陽臺土豆打頂施工方案
- 2025年度個(gè)人教育培訓(xùn)貸款合同及課程安排4篇
- 鉆井工程課程設(shè)計(jì)英文
- 2024年學(xué)校人事檔案管理制度
- 割接方案的要點(diǎn)、難點(diǎn)及采取的相應(yīng)措施
- 2025年副護(hù)士長競聘演講稿(3篇)
- 2025至2031年中國臺式燃?xì)庠钚袠I(yè)投資前景及策略咨詢研究報(bào)告
- 原發(fā)性腎病綜合征護(hù)理
- (一模)株洲市2025屆高三教學(xué)質(zhì)量統(tǒng)一檢測 英語試卷
- 第三章第一節(jié)《多變的天氣》說課稿2023-2024學(xué)年人教版地理七年級上冊
- 2025年中國電科集團(tuán)春季招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年度建筑施工現(xiàn)場安全管理合同2篇
- 建筑垃圾回收利用標(biāo)準(zhǔn)方案
- 2024年考研英語一閱讀理解80篇解析
- 樣板間合作協(xié)議
評論
0/150
提交評論