高數(shù)經(jīng)管類概率論與數(shù)理統(tǒng)計課堂筆記(自考2)_第1頁
高數(shù)經(jīng)管類概率論與數(shù)理統(tǒng)計課堂筆記(自考2)_第2頁
高數(shù)經(jīng)管類概率論與數(shù)理統(tǒng)計課堂筆記(自考2)_第3頁
高數(shù)經(jīng)管類概率論與數(shù)理統(tǒng)計課堂筆記(自考2)_第4頁
高數(shù)經(jīng)管類概率論與數(shù)理統(tǒng)計課堂筆記(自考2)_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、自考高數(shù)經(jīng)管類概率論與數(shù)理統(tǒng)計課堂筆記2兩個獨立連續(xù)型隨機變量X,Y的和函數(shù)Z=X+Y的概率密度的計算公式為:若X,Y獨立,XfX(X),YfY(Y)則有 (不證)上面公式叫獨立隨機變量和的卷積公式例3-24設(shè)X,Y獨立,且XN(0,1),YN(0,1),求Z=X+Y的概率密度。解:已知所以令 ZN(0,2)相似地,可以證明下面的結(jié)果:定理:若X,Y獨立,(不證)【答疑編號:10030403針對該知識點提問】例如在上例中,XN(0,1),YN(0,1),X,Y獨立,則 X+YN(0,2)X-YN(0,2)2X+3YN(0,13)又例如 XN(3,4), YN(1,1),X,Y獨立則 2X-YN

2、(23-1,44+(-1)21)=N(5,17)本章內(nèi)容小結(jié)(一)知道二維隨機變量的分布函數(shù)的概念和性質(zhì)。(1)(X,Y)F(X,Y)=P(XX,YY) =P(-XX, -YY)(2)F(X,Y)的性質(zhì)()F(+,+)=1()F(-,Y)=0,F(xiàn)(X,-)=0 F(-,-)=0(3)XFX(X)=F(X,+ ) YFY(Y)=F(+,Y)【答疑編號:10030404針對分布函數(shù)提問】(二)離散型二維隨機變量(1)(X,Y)的分布律性質(zhì)(2)X的邊緣分布證明P1=P11+P12+P1N, P2=P21+P22+P2N, pm=pm1+pm2+pmn(3)Y的分布律證P1=P11+P21+pm1,

3、 P2=P21+P22+pm2, PN= P1N+P2N+pmn【答疑編號:10030405針對邊緣分布提問】(4)X,Y獨立的充要條件是:X,Y獨立P(X=xi,Y=yj)=P(X=xi)P(Y=yj) (i=1,2,M;j=1,2,N)判斷離散性隨機變量X,Y是否獨立?!敬鹨删幪枺?0030406針對判斷變量是否獨立提問】(5)會求 Z=X+Y的分布律(三)二維連續(xù)型隨機變量(1)若已知 f(X,Y)時,會用上式求F(X,Y)性質(zhì)(2)已知F(X,Y)時,會用上式求f(X,Y)(3)會用公式求(X,Y)在區(qū)域D上取值的概率。(4)會用公式分別求X,Y的概率密度(邊緣密度)(5)會根據(jù)X,Y

4、獨立判斷連續(xù)型隨機變量X,Y的獨立性。(6)知道兩個重要的二維連續(xù)隨機變量(X,Y)在D上服從均勻分布 S是D的面積則X,Y獨立(7)若X,Y獨立,且本章作業(yè)教材72頁 習(xí)題3.11、2、3、4、5、6、7、8、10教材79頁 習(xí)題3.2 1、2、3 提示4教材83頁 習(xí)題3.31、2、3、484頁 自測題隨機變量的數(shù)字特征隨機變量的概率分布完整地描述了隨機變量統(tǒng)計規(guī)律,但是在實際問題中求得隨機變量的概率分布并不容易,而且對某些問題來說,只需知道它的某些特征,我們把刻畫隨機變量某些方面特征的數(shù)值稱為隨機變量的數(shù)字特征。本章主要研究隨機變量的期望、方差、協(xié)方差、相關(guān)系數(shù)等數(shù)字特征。4.1 隨機變

5、量的期望4.1.1 離散型隨機變量的期望引例 10人參加考試,1人得100分,6人得80分,3人得60分,求10人考度的平均分?!敬鹨删幪枺?0040101針對該題提問】解:平均分為:從本例看:平均分并不等于60、80、100的平均值80。這是由于60分出現(xiàn)的機會多于100分,上面方法出現(xiàn)了60分出現(xiàn)的頻率多。100分的頻率小,能正確計算平均值。定義若X的分布律為 P(X=xi)=pi,i=1,2當(dāng)級數(shù)絕對收斂時(即收斂)就說是離散型隨機變量X的期望。記作EX,即說明:(1)若X取值為有限個x1,x2,xn則(2)若X取值為可列無限多個x1,x2,xn則這時才要求無窮級數(shù)絕對收斂。很明顯,X的

6、期望EX體現(xiàn)隨機變量X取值的平均概念,所以EX也叫X的均值。【例4-1】設(shè)隨機變量X的分布律為求E(X)解 E(X)=(-1)0.3+00.2+10.5=0.2【例4-2】甲乙兩人進(jìn)行打靶,所得分?jǐn)?shù)分別記為X,Y,它們的分布律分別為試比較他們成績的好壞?!敬鹨删幪枺?0040102針對該題提問】解 我們分別計算X和Y的數(shù)學(xué)期望: EX=00+10.2+20.8=1.8(分)。 EY=00.1+10.8+20.1=1(分)。這意味著,如果進(jìn)行多次射擊,甲所得分?jǐn)?shù)的平均值接近于1.8分,而乙得分的平均值接近1分。很明顯乙的成績遠(yuǎn)不如甲。4.1.2 下面介紹幾種重要離散型隨機變量的數(shù)學(xué)期望。1.兩點

7、分布隨機變量X的分布律為其中0p1,有EX=0(1-p)+1p=p。2.二項分布設(shè)XB(n,p),即可以證明它的期望EX=np二項分布的數(shù)學(xué)期望np,有著明顯的概率意義。比如擲硬幣試驗,設(shè)出現(xiàn)正面概率若進(jìn)行100次試驗,則可以“期望”出現(xiàn)次正面,這正是期望這一名稱的來由。3.泊松分布設(shè)其分布律為則X數(shù)學(xué)期望為EX=小結(jié)上面的結(jié)果,有下面公式分布EXX(0,1)XB(n,p)XP()pnp今后在上面三種情形下,期望EX不必用定義計算,可以直接套用公式。例如 若 XB(10,0.8),則EX=100.8=8 若 XP(3),則EX=3。4.1.3下面介紹離散型隨機變量函數(shù)的數(shù)學(xué)期望。定理4-1 設(shè)

8、離散型隨機變量X的分布律為PX=xk=pk,k=1,2,。令Y=g(X),若級數(shù)絕對收斂,則隨機變量Y的數(shù)學(xué)期望為特別情形【例4-5】設(shè)隨機變量X的分布律為令Y=2X+1,求E(Y)?!敬鹨删幪枺?0040103針對該題提問】解EY=(2(-1)+1)0.3+(20+1)0.2+(21+1)0.4+(22+1)0.1 =(-1)0.3+10.2+30.4+50.1=1.6。【例4-6】設(shè)隨機變量X的分布律為且Y=X2,求EY?!敬鹨删幪枺?0040104針對該題提問】解 =(-1)20.3+020.2+0.520.1+120.1+220.3=0.3+0.025+0.1+1.2=1.625。4.

9、1.4 連續(xù)型隨機變量的期望對于連續(xù)型隨機變量的期望,形式上可類似于離散型隨機變量的期望給予定義,只需將和式中的xi改變x,pi改變?yōu)閒(x)dx(其中f(x)為連續(xù)型隨機變量的概率密度函數(shù))以及和號“”演變?yōu)榉e分號“”即可。定義4-2 設(shè)連續(xù)型隨機變量X的概率密度為f(x),若廣義積分絕對收斂,則稱該積分為隨機變量X的數(shù)學(xué)期望(簡稱期望或均值),記為EX,即【例4-7】設(shè)隨機變量X的概率密度為 求E(X)?!敬鹨删幪枺?0040105針對該題提問】解 【例4-8】設(shè)隨機變量X的概率密度函數(shù)為 求E(X)?!敬鹨删幪枺?0040106針對該題提問】解 因為f(x)只在有限區(qū)間上不為零,且在該區(qū)

10、間上為連續(xù)函數(shù),所以E(X)存在,且根據(jù)奇函數(shù)的性質(zhì)知道E(X)=0。下面介紹幾種重要連續(xù)型隨機變量的期望。1.均勻分布設(shè)隨機變量X在a,b上服從均勻分布,其概率密度為則 在區(qū)間a,b上服從均勻分布的隨機變量的期望是該區(qū)間中點。2.指數(shù)分布設(shè)隨機變量X服從參數(shù)為0的指數(shù)分布,其概率密度為解:在微積分中有 即指數(shù)分布的數(shù)學(xué)期望為參數(shù)的倒數(shù)。3.正態(tài)分布設(shè)其概率密度為則X的期望E(X)=。(不證)上面三種情況列表如下(可以作為公式使用)分布EXXU(a,b)XE()XN(,2)例如 XU(0,10) 則 XE(2) 則下面介紹連續(xù)型隨機變量函數(shù)的數(shù)學(xué)期望。定理4-2 設(shè)X為連續(xù)型隨機變量,其概率密

11、度為fX(x),又隨機變量Y=g(X),則當(dāng)收斂時,有證明略。這一公式的好處是不必求出隨機變量Y 的概率密度fY(x),而可由隨機變量X的概率密度fX(x)直接計算E(Y),應(yīng)用起來比較方便。特別情形例4-9 求EX2【答疑編號:10040107針對該題提問】解4.1.5二維隨機變量函數(shù)的期望定理4-3 (1)若(X,Y)為離散型隨機變量,若其分布律為pijPX=xi,Y=yi,邊緣分布律為則(2)其(X,Y)為二維連續(xù)型隨機變量,f(x,y),fx(x),fY(y)分別為(X,Y)的概率密度與邊緣概率密度,則證明略。定理4-4 設(shè)g(X,Y)為連續(xù)函數(shù),對于二維隨機變量(X,Y)的函數(shù)g(X

12、,Y),(1)若(X,Y)為離散型隨機變量,級數(shù)收斂,則(2)若(X,Y)為連續(xù)型隨機變量,且積分收斂,則證明略?!纠?-10】已知(X,Y)的分布律為求:(1)E(2X+3Y);(2)E(XY)?!敬鹨删幪枺?0040108針對該題提問】解 (1)由數(shù)學(xué)期望定義知【例4-11】設(shè)二維隨機變量(X,Y)的概率密度為求:(1)E(X+Y);(2)E(XY);(3)P X+Y1?!敬鹨删幪枺?0040109針對該題提問】解:4.1.6期望的性質(zhì)期望有許多重要性質(zhì),利用這些性質(zhì)可以進(jìn)行期望的運算。下面列舉的這些性質(zhì)對離散型隨機變量和連續(xù)型隨機變量而言,都可以利用隨機變量函數(shù)的期望與二維隨機變量函數(shù)的

13、期望公式加以證明。性質(zhì)4-1 常數(shù)的期望等于這個常數(shù),即E(C)=C,其中C為常數(shù)。證明 常數(shù)C作為隨機變量,它只可能取一個值C,即PX=C=1,所以E(C)=C1=C性質(zhì)4-2 常數(shù)與隨機變量X乘積的期望等于該常數(shù)與隨機變量X的期望的乘積,即E(CX)=CE(X)。證明 設(shè)X是連續(xù)型隨機變量,其概率密度為f(x),則有當(dāng)X為離散型隨機變量時,請讀者自證。有E(CX+b)=CEX+b性質(zhì)4-3隨機變量和的期望等于隨機變量期望之和,即E(X+Y)=E(X)+E(Y)。證明 不妨設(shè)(X,Y)為二維隨機變量,其概率密度為f(x,y),Z=X+Y是(X,Y)的函數(shù),有=E(X)+E(Y)。這一性質(zhì)可作

14、如下推廣:E(C1X+C2Y)=C1E(X)+C2E(Y),其中C1,C2為常數(shù)。結(jié)合性質(zhì)4-2與性質(zhì)4-3可證此性質(zhì)。一般地,設(shè)X1,X2,,Xn為n個隨機變量,則有E(X1+X2+Xn)= EX1+ EX2+ EXnE(C1X1+C2X2+CnXn)=C1EX1+C2EX2+ CnEXn性質(zhì)4-4兩個相互獨立的隨機變量乘積的期望等于期望的乘積,即若X,Y是相互獨立的隨機變量,則E(XY)=E(X)E(Y)。證明 僅證連續(xù)型情況,因為X,Y相互獨立,所以f(x,y)=fX(x)fY(y),=E(X)E(Y)由數(shù)學(xué)歸納法可證得:當(dāng)X1,X2,Xn相互獨立時有E(X1X2Xn)=E(X1)E(X

15、2)E(Xn)?!纠?-12】設(shè)Xi(i=1,2,)服從0-1分布其中0p0,有: 或:例5-1設(shè)X是拋擲一枚骰子所出現(xiàn)的點數(shù),若給定=2,2.5,實際計算P|X-E(X)|,并驗證切比雪夫不等式成立。【答疑編號:10050101針對該題提問】解 X的分布律為所以當(dāng)=2時,當(dāng)=2.5時,可見,切比雪夫不等式成立。例5-2設(shè)電站供電網(wǎng)有10 000盞燈,夜晚每一盞燈開燈的概率都是0.7,而假定所有電燈開或關(guān)是彼此獨立的。試用切比雪夫不等式估計夜晚同時開著的燈數(shù)在6 8007 200的概率。【答疑編號:10050102針對該題提問】解:設(shè)X表示在夜晚同時開著的電燈的數(shù)目,它服從參數(shù)n=10 000

16、,p=0.7的二項分布。于是有E(X)=np=10 0000.7=7 000,D(X)=npq=10 0000.70.3=2100,P6 800X7 200=P|X-7000|1,X1,X2,Xn是相互獨立的。此時,若所有的Xi又具有相同的分布,則稱X1,X2,Xn,是獨立同分布隨機變量序列。定理5-3設(shè)X1,X2,Xn,是獨立同分布隨機變量序列E(Xi)=,D(Xi)=2(i=1,2)均存在,則對于任意0有(不證) 這一定理說明:經(jīng)過算術(shù)平均后得到的隨機變量在統(tǒng)計上具有一種穩(wěn)定性,它的取值將比較緊密聚集在它的期望附近。這正是大數(shù)定律的含義。在概率論中,大數(shù)定律是隨機現(xiàn)象的統(tǒng)計穩(wěn)定性的深刻描述

17、;同時,也是數(shù)理統(tǒng)計的重要理論基礎(chǔ)。5.3 中心極限定理 5.3.1獨立同分布序列的中心極限定理定理5-4 設(shè)X1,X2,Xn,是獨立同分布的隨機變量序列,且具有相同數(shù)學(xué)期望和方差E(Xi)=,D(Xi)=2(i=1,2,)。記隨機變量的分布函數(shù)為Fn(x),則對于任意實數(shù)x,有 (不證) 其中(x)為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。由這一定理知道下列結(jié)論:(1)當(dāng)n充分大時,獨立同分布的隨機變量之和的分布近似于正態(tài)分布N(n,n2)。我們知道,n個獨立同分布的正態(tài)隨機變量之和服從正態(tài)分布。中心極限定理進(jìn)一步告訴我們。 不論X1,X2,Xn,獨立同服從什么分布,當(dāng)n充分大時,其和Zn近似服從正態(tài)分布。(2)

18、考慮X1,X2,Xn,的平均值,有它的標(biāo)準(zhǔn)化隨機變量為,即為上述Yn。因此的分布函數(shù)即是上述的Fn(x),因而有由此可見, 當(dāng)n充分大時,獨立同分布隨機變量的平均值的分布近似于正態(tài)分布 例5-3對敵人的防御地段進(jìn)行100次射擊,每次射擊時命中目標(biāo)的炮彈數(shù)是一個隨機變量,其數(shù)學(xué)期望為2,均方差為1.5,求在100次射擊中有180顆到220顆炮彈命中目標(biāo)的概率。【答疑編號:10050104針對該題提問】解 設(shè)Xi為第i次射擊時命中目標(biāo)的炮彈數(shù)(i=1,2,100),則為100次射擊中命中目標(biāo)的炮彈總數(shù),而且X1,X2,X100同分布且相互獨立。由定理5-4可知,隨機變量近似服從標(biāo)準(zhǔn)正態(tài)分布,故有例

19、5-4某種電器元件的壽命服從均值為100(單位:小時)的指數(shù)分布?,F(xiàn)隨機抽出16只,設(shè)它們的壽命是相互獨立的,求這16只元件的壽命的總和大于1 920小時的概率。【答疑編號:10050105針對該題提問】解 設(shè)第i只電器元件的壽命為Xi=(i=1,2,16),E(Xi)=100,D(Xi)=1002=10 000,則是這16只元件的壽命的總和。E(Y)=10016=1 600,D(Y)= 160 000,則所求概率為: 5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心極限定理下面介紹另一個中心極限定理,它是定理5-4的特殊情況。定理5-5(棣莫弗拉普拉斯中心極限定理)設(shè)

20、隨機變量Zn是n次獨立重復(fù)試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,則對于任意實數(shù)x其中q=1-p,(x)為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。 由棣莫弗-拉普拉斯中心極限定理得到下列結(jié)論:(1)在貝努利試驗中,若事件A發(fā)生的概率為p。又設(shè)Zn為n次獨立重復(fù)試驗中事件A發(fā)生的頻數(shù),則當(dāng)n充分大時,Zn近似服從正態(tài)分布N(np,npq)。(2)在貝努利試驗中,若事件中A發(fā)生的概率為p,為n次獨立重復(fù)試驗中事件A發(fā)生的頻率,則當(dāng)n充分大時,近似服從正態(tài)分布【例5-5】用中心極限定理得到求解5.1例5-2的概率。【答疑編號:10050106針對該題提問】解 設(shè)同時開著的燈數(shù)為X,則X-B(1000,0.7),np

21、=10000.7=7000,【例5-6】設(shè)某單位內(nèi)部有1000臺電話分機,每臺分機有5%的時間使用外線通話,假定各個分機是否使用外線是相互獨立的,該單位總機至少需要安裝多少條外線,才能以95%以上的概率保證每臺分機需要使用外線時不被占用?【答疑編號:10050107針對該題提問】解:把觀察每一臺分機是否使用外線作為一次試驗,則各次試驗相互獨立,設(shè)X為1000臺分機中同時使用外線的分機數(shù),則XB(1000,0.05),np=10000.05=50,根據(jù)題意,設(shè)N為滿足條件的最小正整數(shù)由于(-7.255)0,故有 查標(biāo)準(zhǔn)正態(tài)分布表得(1.65)=0.9505,故有 由此 N61.37 即該單位總機

22、至少需要62條外線,才能以95%以上的概率保證每臺分機在使用外線時不被占用。小結(jié)本章考核要求(一)知道切比雪夫不等式或 并且會用切比雪夫不等式估計事件|X-EX|或|X-EX|的概率。(二)知道貝努利大數(shù)定律其中n是試驗次數(shù),m是A發(fā)生次數(shù),p是A的概率,它說明試驗次數(shù)很多時,頻率近似于概率。(三)知道切比雪夫不等式大數(shù)定律它說明在大量試驗中,隨機變量取值穩(wěn)定在期望附近。(四)知道獨立同分布中心極限定理若記YnFn(x),則有它說明當(dāng)n很大時,獨立同分布的隨機變量之和近似服從正態(tài)N(n,n2)所以,無論n個獨立同分布的X1,X2,Xn服從何種分布,n很大時,X1+X2+Xn卻近似正態(tài)N(n,n

23、2).(五)知道棣莫弗拉普拉斯中心極限定理若Zn表示n次獨立重復(fù)事件發(fā)生次數(shù),即ZnB(n,p),則有即Zn近似正態(tài)N(np,np(1-p)2)。并會用中心極限定理計算簡單應(yīng)用問題。本章作業(yè)習(xí)題5.1:1,2,3,4習(xí)題5.3:1,2,3,4,5,7教材124頁,自測題5一、1,2,3二、填空題1,2,3,4,5統(tǒng)計量及其抽樣分布6.1總體與樣本6.1.1總體與個體在一個統(tǒng)計問題中,我們把研究對象的全體稱為總體,構(gòu)成總體的每個成員稱為個體。對多數(shù)實際問題。總體中的個體是一些實在的人或物。比如,我們要研究某大學(xué)的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問題的總體,而每一個學(xué)生即是一個個體。事實上,每

24、個學(xué)生有許多特征:性別、年齡、身高、體重、民族、籍貫等。而在該問題中,我們關(guān)心的只是該校學(xué)生的身高如何,對其他的特征暫不予以考慮。這樣,每個學(xué)生(個體)所具有的數(shù)量指標(biāo)值身高就是個體,而將所有身高全體看成總體。這樣一來,若拋開實際背景,總體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的機會多,有的出現(xiàn)的機會少,因此用一個概率分布去描述和歸納總體是恰當(dāng)?shù)摹倪@個意義上看,總體就是一個分布,而其數(shù)量指標(biāo)就是服從這個分布的隨機變量。以后說“從總體中抽樣”與“從某分布中抽樣”是同一個意思。例6-1考察某廠的產(chǎn)品質(zhì)量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體該廠生產(chǎn)的全部合格品與

25、不合格品由0或1組成的一堆數(shù)。若以p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個二點分布表示:不同的p反映了總體間的差異。例如,兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為:我們可以看到,第一個工廠的產(chǎn)品質(zhì)量優(yōu)于第二個工廠。實際中,分布中的不合格品率是未知的,如何對之進(jìn)行估計是統(tǒng)計學(xué)要研究的問題。6.1.2樣本為了了解總體的分布,我們從總體中隨機地抽取n個個體,記其指標(biāo)值為x1,x2,xn,則x1,x2,xn稱為總體的一個樣本,n稱為樣本容量,或簡稱樣本量,樣本中的個體稱為樣品。我們首先指出,樣本具有所謂的二重性:一方面,由于樣本是從總體中隨機抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨

26、機變量,用大寫字母X1,X2,Xn表示;另一方面,樣本在抽取以后經(jīng)觀測就有確定的觀測值,因此,樣本又是一組數(shù)值。此時用小寫字母x1,x2,xn表示是恰當(dāng)?shù)?。簡單起見,無論是樣本還是其觀測值,本書中樣本一般均用x1,x2,xn表示,讀者應(yīng)能從上下文中加以區(qū)別。例6-2啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,由于隨機性,事實上不可能使得所有的啤酒凈含量均為640g ,現(xiàn)從某廠生產(chǎn)的啤酒中隨機抽取10瓶測定其凈含量,得到如下結(jié)果: 641635640637642638645643639640這是一個容量為10的樣本的觀測值。對應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量?!敬鹨删幪枺?0060101針對該

27、題提問】從總體中抽取樣本時,為使樣本具有代表性,抽樣必須是隨機抽樣。通??梢杂秒S機數(shù)表來實現(xiàn)隨機抽樣。還要求抽樣必須是獨立的,即每次的結(jié)果互不影響。在概率論中,在有限總體(只有有限個個體的總體)中進(jìn)行有放回抽樣,是獨立的隨機抽樣;然而,若為不放回抽樣,則是不獨立的抽樣。但 當(dāng)總體容量N很大但樣本容量n較小時,不放回抽樣可以近似地看做放回抽樣,即可近似看做獨立隨機抽樣。下面,我們假定抽樣方式總滿足獨立隨機抽樣的條件。從總體中抽取樣本可以有不同的抽法,為了能由樣本對總體做出較可靠的推斷,就希望樣本能很好地代表總體。這就需要對抽樣方法提出一些要求,最常用的 “簡單隨機抽樣”有如下兩個要求:(1)樣本

28、具有隨機性,即要求總體中每一個個體都有同等機會被選入樣本,這便意味著每一樣品xi與總體X有相同的分布。(2)樣本要有獨立性,即要求樣本中每一樣品的取值不影響其他樣品的取值,這意味著x1,x2,xn相互獨立。用簡單隨機抽樣方法得到的樣本稱為簡單隨機樣本,也簡稱樣本。除非特別指明,本書中的樣本皆為簡單隨機樣本。于是,樣本x1,x2,xn可以看成是相互獨立的具有同一分布的隨機變量,其共同分布即為總體分布。 設(shè)總體X具有分布函數(shù)F(x), x1,x2,xn為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為:若總體具有密度函數(shù)f(x),則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機變量,則樣本的(聯(lián)合)概率

29、函數(shù)為顯然,通常說的樣本分布是指多維隨機變量(x1,x2,xn)的聯(lián)合分布。例6-3為估計一物件的重量,用一架天平重復(fù)測量n次,得樣本x1,x2,xn,由于是獨立重復(fù)測量,x1,x2,xn是簡單隨機樣本??傮w的分布即x1的分布(x1,x2,xn分布相同)。由于稱量誤差是均值(期望)為零的正態(tài)變量,所以x1可認(rèn)為服從正態(tài)分布N(,2)(X1等于物件重量)加上稱量誤差,即x1的概率密度為這樣,樣本分布密度為。 【答疑編號:10060102針對該題提問】例6-4設(shè)某種電燈泡的壽命X服從指數(shù)分布E(),其概率密度為:則來自這一總體的簡單隨機樣本x1,x2,xn的樣本分布密度為【答疑編號:1006010

30、3針對該題提問】例6-5考慮電話交換臺一小時內(nèi)的呼喚次數(shù)X。求來自這一總體的簡單隨機樣本x1,x2,xn的樣本分布。【答疑編號:10060104針對該題提問】解由概率論知識,X服從泊松分布P(),其概率函數(shù),(其中x是非負(fù)整數(shù)0,1,2,k,中的一個)。從而,簡單隨機樣本x1,x2,xn的樣本分布為:6.2統(tǒng)計量及其分布6.2.1 統(tǒng)計量與抽樣分布樣本來自總體,樣本的觀測值中含有總體各方面的信息,但這些信息較為分散,有時顯得雜亂無章。為將這些分散在樣本中有關(guān)總體的信息集中起來以反映總體的各種特征,需要對樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。 定義6-1

31、設(shè)x1,x2,xn為取自某總體的樣本,若樣本函數(shù)TT(x1,x2,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計量。統(tǒng)計量的分布稱為抽樣分布。按照這一定義,若x1,x2,xn為樣本,則,都是統(tǒng)計量,而當(dāng),2未知時, 等均不是統(tǒng)計量。6.2.2樣本均值及其抽樣分布 定義6-2 設(shè)x1,x2,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即。例6-6 某單位收集到20名青年人某月的娛樂支出費用數(shù)據(jù):7984 8488 92 93 94 97 98 99100 101101102102 108110113118125 則該月這20名青年的平均娛樂支出為【答疑編號:10060105針對該題提

32、問】對于樣本均值的抽樣分布,我們有下面的定理。 定理6-1設(shè)x1,x2,xn是來自某個總體X的樣本, 為樣本均值。(1)若總體分布為N(2),則的精確分布為;(2)若總體X分布未知(或不是正態(tài)分布),且E(X)=,D(X)=2,則當(dāng)樣本容量n較大時,的漸近分布為,這里的漸近分布是指n較大時的近似分布。證明(1)由于為獨立正態(tài)變量線性組合,故仍服從正態(tài)分布。另外, 故 (2)易知為獨立、同分布的隨機變量之和,且 。由中心極限定理, ,其中(x)為標(biāo)準(zhǔn)正態(tài)分布。這表明n較大時的漸近分布為。6.2.3樣本方差與樣本標(biāo)準(zhǔn)差 定義6-3設(shè)x1,x2,xn為取自某總體的樣本,則它關(guān)于樣本均值的平均偏差平方

33、和 稱為樣本方差,其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對樣本方差而言,樣本標(biāo)準(zhǔn)差通常更有實際意義,因為它與樣本均值具有相同的度量單位。在上面定義中,n為樣本容量,稱為偏差平方和,它有3個不同的表達(dá)式:事實上,偏差平方和的這3個表達(dá)式都可用來計算樣本方差。例6-7在例6-6中,我們已經(jīng)算得,其樣本方差與樣本標(biāo)準(zhǔn)差為,。方法二s=11.57 31【答疑編號:10060201針對該題提問】通常用第二種方法計算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望,它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。 定理6-2設(shè)總體X具有二階矩,即E(x)=,D(X)=2+x1,x2

34、,xn為從該總體得到的樣本,和s2分別是樣本均值和樣本方差,則 此定理表明,樣本均值的均值與總體均值相同,而樣本均值的方差是總體方差的。證明由于(1)(2)故(6.3.3)式成立。下證(6.3.4),注意到 ,而 ,于是 ,兩邊各除以n-1,即得(6.3.4)式。值得讀者注意的是:本定理的結(jié)論與總體服從什么分布無關(guān)。6.2.4樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計量。 定義6-4設(shè)x1,x2,xn是樣本,則統(tǒng)計量(6.3.5)稱為樣本k階原點矩,特別地,樣本一階原點矩就是樣本均值。統(tǒng)計量 (6.3.6) 稱為樣本k階中心矩。常見的是k=2的場合,此時稱為二階

35、樣本中心矩。本書中我們將其記為sn2,以區(qū)別樣本方差S2。 6.2.5極大順序統(tǒng)計量和極小順序統(tǒng)計量 定義6-5設(shè)總體X具有分布函數(shù)F(x),分布密度f(x), x1,x2,xn為其樣本,我們分別稱X(1)=minx1,x2,xn,x(n)=maxx1,x2,xn為極小順序統(tǒng)計量和極大順序統(tǒng)計量。定理6-3若x(1),x(n)分別為極小、極大順序統(tǒng)計量,則(1)x(1)的分布函數(shù)F1(x)=1-(1-F(x)n,x(1)的分布密度f1(x)=n-(1-F(x)n-1f(x) (2)x(n)的分布函數(shù)Fn(x)=F(x)n,x(n)的分布密度fn(x)=nF(x)n-1f(x) 證明 先求出x(

36、1)及x(n)的分布函數(shù)F1(x)及Fn(x):,分別對F1(x),F(xiàn)n(x)求導(dǎo)即得6.2.6正態(tài)總體的抽樣分布有很多統(tǒng)計推斷是基于正態(tài)總體的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個著名統(tǒng)計量(其抽樣分布分別為x2分布,t分布和F分布)在實踐中有著廣泛的應(yīng)用。這是因為這三個統(tǒng)計量不僅有明確背景,而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”,它們被稱為統(tǒng)計中的“三大抽樣分布”。1. x2分布(卡方分布) 定義6-6設(shè)X1,X2,Xn獨立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則x2=x12+xn2的分布稱為自由度為n的x2分布,記為x2 x2(n)。x2(n)分布的密度函數(shù)見圖6-4當(dāng)隨機變量x2 x

37、2(n)時,對給定的(0 x2(n)= 的x2(n)是自由度為n的開方分布的分位數(shù)。分位數(shù)x2(n)可以從附表4中查到。例如n=10,=0.05,那么從附表4中查得x2(10)=18.307p(x)2x20.05(10)=px218.307=0.05注:請讀者注意x2x2(n)時,n是自由度,不是容量。2.F分布 定義6-7 設(shè)x1x2(m),x2x2(n)X1與X2獨立,則稱的分布是自由度為m與n的F分布,記為FF(m,n),其中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個只取非負(fù)值的偏態(tài)分布(見圖6-5)。當(dāng)隨機變量FF(m,n)時,對給定的(0F(m,

38、n)=的數(shù)F(m,n)是自由度為m與n的F分布的分位數(shù)。當(dāng)FF(m,n)時,有下面性質(zhì)(不證),這說明(6.3.8)對小的,分位為F(m,n)可以從附表5中查到,而分位數(shù)F1-(m,n)則可通過(6.3.8)式得到?!纠?-8】若取m=10,則n=5,=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用(6.3.8 )式可得到【答疑編號:10060202針對該題提問】3.t分布 定義6-8 設(shè)隨機變量與X1與X2獨立且X1N(0,1),X2X2(n),則稱的分布為自由度為n的t的分布,記為tt(n).t分布密度函數(shù)的圖像是一個關(guān)于縱軸對稱的分布(圖6-6),

39、與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些,尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。圖6-6 t分布與N(0,1)的密度函數(shù)當(dāng)隨機變量tt(n)時,稱滿足Ptt(n)=的t(n)是自由度為n的t分布的分位數(shù),分位數(shù)t(n)可以從附表3中查到,例如當(dāng)n=10, =0.05時,從附表3上查得t0.05(10)=1.8125由于t分布的密度函數(shù)關(guān)于0對稱,故其分位數(shù)有如下關(guān)系:t1-(n)=- t(n)例如,t0.95(10)=-t0.05(10)=-1.8125當(dāng)n很大時,(n30),t分布可以用N(0,1)近似P(t-t)=1-,p(tt1-)=1-,t1-=-t4.一些重要結(jié)論來自

40、一般正態(tài)總體的樣本均值 和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布,下面我們加以介紹。 定理6-4 設(shè)X1,X2,Xn是來自正態(tài)總體N(,2)的樣本,其樣本均值和樣本方差分別為:則有(1)與s2相互獨立;(2)特別,若(不證)推論:設(shè),21=22=2并記則(不證)本章小結(jié)本章的基本要求是(一)知道總體、樣本、簡單樣本和統(tǒng)計量的概念(二)知道統(tǒng)計量和s2的下列性質(zhì)。E(s2)=2(三)若x的分布函數(shù)為F(x),分布函數(shù)為f(x),則樣本(x1,x2,xn)的聯(lián)合分布函數(shù)為F(x1)F(x2)F(xn)樣本(x1,x2,xn)的聯(lián)合分布密度為f(x1) f(x2)f(xn),樣本(x1,x2,x

41、n)的概率函數(shù),p(x1,x 2 ,xn)=p(X=x1)p(X=x2)p(X=xn)因而順序統(tǒng)計量x(1),x (n)中X(1)的分布函數(shù)為1-(1-F(x)nX(n)的分布函數(shù)為F(x)n(四)掌握正態(tài)總體的抽樣分布若XN(,2)則有(1)(2)(3)(4)若=當(dāng)時,。(五)知道樣本原點矩與樣本中心矩的概念本章作業(yè)教材142頁,習(xí)題6.3自測題6參數(shù)估計從本章開始我們介紹統(tǒng)計推斷,所謂統(tǒng)計推斷就是由樣本推斷總體,統(tǒng)計推斷包括參數(shù)估計和假設(shè)檢驗兩部分,它們是統(tǒng)計推斷最基本而且是互相有聯(lián)系的兩部分,本章介紹統(tǒng)計推斷的第一部分參數(shù)估計。參數(shù)通常指總體分布中的特征值和和各種分布中的參數(shù),例如二點分

42、布B(1,P)中的p,泊松分布P()中的,正態(tài)分布N(、)的、等,習(xí)慣用表示參數(shù),通常參數(shù)是未知的。參數(shù)估計的形式有兩類,設(shè)x1,x2,xn是來自總體的樣本。我們用一個統(tǒng)計量的取值作為參數(shù)的估計值,則稱為的點估計(量),就是參數(shù)的點估計,如果對參數(shù)的估計需要對估計作出可靠性判斷,就需要對這一可靠性給出可靠性區(qū)間或置信區(qū)間,叫區(qū)間估計。下面首先介紹點估計7.1點估計的幾種方法直接用來估計未知參數(shù)的統(tǒng)計量稱為參數(shù)的點估計量,簡稱為點估計,人們可以運用各種方法構(gòu)造出很多的估計,本節(jié)介紹兩種最常用的點估計方法。它們是:矩法和極大似然法。7.1.1替換原理和矩法估計用下面公式表示的方法叫矩法例71對某型

43、號的20輛汽車記錄每5L汽油的行駛里程(km),觀測數(shù)據(jù)如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個容量為20的樣本觀測值,對應(yīng)總體是該型號汽車每5L汽油的行駛里程,其分布形式尚不清楚,可用矩法估計其均值,方差,本例中經(jīng)計算有28.695,0.9185由此給出總體均值,方差的估計分別為即【答疑編號:10070101針對該題提問】矩法估計的統(tǒng)計思想(替換原理)十分簡單明確,眾人都能接受,使用場合甚廣。例72設(shè)總體為指數(shù)分布,其密度函數(shù)為x1,xn是樣本,由于,亦即,故

44、的矩法估計為例73設(shè)x1,xn是來自服從區(qū)間(0,)上的均勻分布的樣本,0為未知參數(shù)。求的矩估計。【答疑編號:10070102針對該題提問】解:易知總體X的均值為由矩法的矩估計為比如,若樣本值為0.1,0.7,0.2,1,1.9,1.3,1.8,則的估計值2(0.1+0.7+0.2+1+1.9+1.3+1.8)2例74在一批產(chǎn)品取樣n件,發(fā)現(xiàn)其中有m件次品,試用此樣本求該批產(chǎn)品的次品率p的矩估計?!敬鹨删幪枺?0070103針對該題提問】解:因為例如抽樣總數(shù)n=100,其中次品m=5.則例75電話總機在一分鐘間隔內(nèi)接到呼喚次數(shù)XP()。觀察一分種接到呼喚次數(shù)共觀察40次,結(jié)果如下接到呼喚次數(shù)0

45、12345觀察次數(shù)51012832求未知參數(shù)的矩估計【答疑編號:10070104針對該題提問】解:(1)XP()EX=由矩法(2)計算(05+110+212+38+43+52)227.1.2極大似然估計為了敘述極大似然原理的直觀想法,先看例76例76設(shè)有外表完全相同的兩個箱子,甲箱中有99個白球和1個黑球,乙箱中有99個黑球和1個白球,現(xiàn)隨機地抽取一箱,并從中隨機抽取一球,結(jié)果取得白球,問這球是從哪一個箱子中取出的?【答疑編號:10070105針對該題提問】解:不管是哪一個箱子,從箱子中任取一球都有兩個可能的結(jié)果:A表示取出白球,B表示取出黑球,如果我們?nèi)〕龅氖羌紫?,則A發(fā)生的概率為0.99,

46、而如果取出的是乙箱,則A發(fā)生的概率為0.01,現(xiàn)在一次試驗中結(jié)果A發(fā)生了,人們的第一印象就是:“此白球(A)最像從甲箱取出的”,或者是說,應(yīng)該認(rèn)為試驗條件對事件A出現(xiàn)有利,從而可以推斷這球是從甲箱中取出的,這個推斷很符合人們的經(jīng)驗事實,這里“最像”就是“極大似然”之意。本例中假設(shè)的數(shù)據(jù)很極端,一般地,我們可以這樣設(shè)想,在兩個箱子中各有100個球,甲箱中白球的比例是P1,乙箱中白球的比例是P2,已知P1 P2,現(xiàn)隨機地抽取一個箱子并從中抽取一球,假定取到的是白球,如果我們要在兩個箱子中進(jìn)行選擇,由于甲箱中白球的比例高于乙箱,根據(jù)極大似然原理,我們應(yīng)該推斷該球來自甲箱。下面分別給出離散型隨機變量和

47、連續(xù)型隨機變量的極大似然估計求未知參數(shù) 的估計 的步驟(一)離散型隨機變量第一步,從總體X取出樣本x1,x2,xn第二步,構(gòu)造似然函數(shù)L(x1,x2,xn,)P(Xx1)P(Xx2)P(Xxn)第三步,計算ln L(x1,x2,xn,)并化簡第四步,當(dāng)時ln L(x1,x2,xn,)取最大值則取常用方法是微積分求最值的方法。(二)連續(xù)型隨機變量若Xf(x,)第一步從總體X取出樣本x1,x2,xn第二步構(gòu)造似然函數(shù)L(x1,x2,xn,)f(x1,)f(x2,)f(xn,)第三步計算ln L(x1,x2,xn,)并化簡第四步當(dāng)時ln L(x1,x2,xn,)取最大值則取常用方法是微積分求最值的方

48、法例77設(shè)總體XB(1,P)即設(shè)P(A),從總體X中抽樣x1,x2,xn,問最大似然法求【答疑編號:10070106針對該題提問】解:當(dāng)XB(1,P)時,應(yīng)有P(X1)P,P(X0)=1P第一步構(gòu)造似然函數(shù)L(x1,x2,xn,P)P(Xx1)P(Xx2)P(Xxn)第二步計算ln L(x1,x2,xn,P)并化簡(x1+xn)lnp+(n-(x1+xn)ln(1-p)第三步求駐點為化簡為(x1+xn)(1-p)=pn-(x1+xn)(x1+xn)=np駐點因為只有一個駐點是最大點取例抽樣n次A發(fā)生m次,則在x1,x2xn中有m個1,其余為0,例78(1)設(shè)總體X服從泊松分布p(),求的極大似

49、然估計;(2)設(shè)總體X服從指數(shù)分布E(),求的極大似然估計【答疑編號:10070107針對該題提問】解:(1)XP()p(X=k)=從總體X中取樣本x1 ,x2xn。駐點解得的極大似然估計易知的矩估計亦為(2)XE()第一步,從中取樣本值x1 ,x2xn,應(yīng)有x10,x20 xn0似然函數(shù)L(x1 ,x2xn)f(x1)f(x2)f(xn)=第二步計算第三步求駐點是最大點取在例72中用矩法估計也是同樣結(jié)果。例79設(shè),即從中取樣x1 ,x2xn,試用最大似然法求【答疑編號:10070108針對該題提問】解:因為樣本x1 ,x2xn已經(jīng)取出。所以應(yīng)有0 x1,0 x2,0 xn所以的取值范圍為第一

50、步構(gòu)造似然函數(shù)0,很明顯,似然函數(shù)是的單調(diào)減函數(shù),因此當(dāng)最小時,似然函數(shù) 最大,由條件知的最小值為所以時最大。取這一結(jié)果與用矩法估計(例73)的結(jié)果不同。例710若,從中抽樣x1,x2xn,試用最大似然估計法求:,【答疑編號:10070109針對該題提問】解:X的似然函數(shù)將分別關(guān)于兩個分量求偏導(dǎo)并令其為0即得到似然方程組,(1),(2)解此方程組,由(1)可得駐點,的極大似然估計為,將之代入(2)給出的極大似然估計7.2點估計的評價標(biāo)準(zhǔn)我們已經(jīng)看到,點估計有各種不同的求法,為了在不同的點估計間進(jìn)行比較選擇,就必須對各種點估計的好壞給出評價標(biāo)準(zhǔn)。數(shù)理統(tǒng)計中給出了眾多的估計量評價標(biāo)準(zhǔn),對同一估計量

51、使用不同的評價標(biāo)準(zhǔn)可能會得到完全不同的結(jié)論,因此,在評價某一個估計好壞時首先要說明是在哪一個標(biāo)準(zhǔn)下,否則所論好壞毫無意義。但在諸多標(biāo)準(zhǔn)中,有一個基本標(biāo)準(zhǔn)是所有的估計都應(yīng)該滿足的,它是衡量一個估計是否可行的必要條件,這就是估計的相合性,我們就從相合性開始介紹。7.2.1相合性我們知道,點估計是一個統(tǒng)計量,因此它是一個隨機變量,在樣本量一定的條件下,我們不可能要求完全等同于參數(shù)的真實取值,但如果我們有足夠的觀測值,根據(jù)格里紋科定理,隨著樣本量的不斷增大,經(jīng)驗分布函數(shù)逼近真實分布函數(shù),因此完全可以要求估計量隨著樣本量的不斷增大而逼近參數(shù)真值,這就是相合性,嚴(yán)格定義如下, 定義72設(shè)為未知參數(shù),是的一

52、個估計量,n是樣本容量, 若對任何一個,有(7.2.1) 則稱為參數(shù)的相合估計相合性被認(rèn)為是對估計的一個最基本要求,如果一個估計量,在樣本量不斷增大時,它都不能把被估參數(shù)估計到任意指定的精度,那么這個估計是很值得懷疑的,通常,不滿足相合性要求的估計一般不予考慮,證明估計的相合性一般可應(yīng)用大數(shù)定律或直接由定義來證。例11用大數(shù)定律證明是的相合估計【答疑編號:10070110針對該題提問】證:由切比雪夫大數(shù)定律即是的相合估計為了避免用定義判斷相合性的困難,下面介紹一個判斷相合性很有用的定理: 定量:設(shè)是的估計量若(1)(2)則是的相合估計。例12證明是的相合估計【答疑編號:10070111針對該題

53、提問】證:在前面我們已經(jīng)證明(1)(2)是的相合估計7.2.2無偏性相合性是大樣本下估計量的評價標(biāo)準(zhǔn),對小樣本而言,需要一些其他的評價標(biāo)準(zhǔn),無偏性便是一個常用的評價標(biāo)準(zhǔn)。 設(shè)是的一個估計,的參數(shù)空間為,若對任意的,有 則稱是的無偏估計,否則稱為有偏估計。例713對任一總體而言,樣本均值是總體均值的無偏估計,當(dāng)總體k階矩存在時,樣本k階原點矩是總體k階原點矩的無偏估計,但對k階中心矩則不一樣,例如,二階樣本中心矩就不是總體方差的無偏估計,事實上,【答疑編號:10070112針對該題提問】對此,有如下兩點說明 (1)當(dāng)樣本量趨于無究時,有,我們稱為的漸近無偏估計,這表明 當(dāng)樣本量較大時,可近似看作

54、的無偏估計 (2)若對作如下修正:(7.2.4) 則是總體方差的無偏估計,這種簡章的修正方法在一些場合常被采用,它比更常用,這是因為在n2時,因此用估計有偏小的傾向,特別在小樣本場合要使用估計。 無偏性不具有不變性。即若是的無偏估計,一般而言,g()不是g()的無 偏估計,除非g()是的線性函數(shù),例如,是的無偏估計,但s不是的無偏估計例14證明是的無偏估計。其中是X的樣本【答疑編號:10070113針對該題提問】證:特別情形是的無偏估計例15證明是的無偏估計【答疑編號:10070114針對該題提問】證7.2.3有效性參數(shù)的無偏估計可以有很多,那么如何在無偏估計中進(jìn)行選擇?直觀的想法是希望該估計

55、圍繞參數(shù)真值的波動越小越好,波動的大小可以用方差來衡量,因此人們常用無偏估計的方差的大小作為度量無偏估計優(yōu)劣的標(biāo)準(zhǔn),這就是有效性。 定義74設(shè),是的兩個無偏估計,如果對任意的有則稱比 有效例16設(shè)x1,xn是取自某總體的樣本,記總體均值為,總體方差為,則都是的無偏估計,但顯然,只要n1,比有效,這表明,用全部數(shù)據(jù)的平均估計總體均值要比只使用部分?jǐn)?shù)據(jù)更有效?!敬鹨删幪枺?0070115針對該題提問】例17比較與誰有效【答疑編號:10070116針對該題提問】解:(1)與都是的無偏估計(2) 比有效例18設(shè),從總體中取樣【答疑編號:10070117針對該題提問】證明是的無偏估計和相合估計解:(1)

56、是的無偏估計是的相合估計7.3參數(shù)的區(qū)間估計用點估計去估計總體的參數(shù),即使是無偏且有效的,也會由于樣本的隨機性,使得從一個樣本x1,x2,x3,xn算得的估計值不一定是被估計的參數(shù)的真實值,而且估計值的可靠性并不知道,這是一個重大的問題,因此,必須解決根據(jù)估計量的分布,在一定可靠性的程度下指出被估計的總體參數(shù)的取值范圍,這正是本節(jié)要介紹的參數(shù)的區(qū)間估計問題。7.3.1置信區(qū)間概念為了引入置信區(qū)間的概念,請看下面的引例。引例設(shè)某種絕緣子抗扭強度X服從正態(tài)分布 ,其中 未知, 已知(=45公斤米),試對總體均值作區(qū)間估計?!敬鹨删幪枺?0070201針對該題提問】對于區(qū)間估計,要選擇一個合適的統(tǒng)計

57、量,若在該總體取一個容量為n的樣本x1,x2,x3,xn,樣本均值為的點估計即,然而我們要給出的一個區(qū)間估計,以體現(xiàn)出估計的誤差,我們知道。在區(qū)間估計問題中,要選取一個合適的估計函數(shù)。這時,可取,它是的標(biāo)準(zhǔn)化隨機變量,且具備下面兩個特點:(1)u中包含所要估計的未知參數(shù)(其中已知);(2)u的分布為 N(0,1),它與未知參數(shù)無關(guān)。 因為uN(0,1),因而有,根據(jù)uN(0,1)的概率密度的對稱性(見下圖)可得。 當(dāng)=0.05時,1-=0.095,=1.96,將不等式轉(zhuǎn)化為,亦即,因此有。當(dāng)=0.05時,。 。說明未知參數(shù)包含在區(qū)間中的概率是95%,這里,不僅給出了的區(qū)間估計,還給出了這一區(qū)間

58、估計的置信度(或置信概率)。事實上,當(dāng)置信度為1-時,區(qū)間估計為在引例中,若=160,=40,n=16。則有 說明該絕緣子抗扭強度X的期望在(140.4,179.6)內(nèi)的可靠度為0.95。下面,引出置信區(qū)間的概念。定義7-5 設(shè)為總體的未知參數(shù)是由樣本定出的兩個統(tǒng)計量,若對于給定的概率1-(01),有,則隨機區(qū)間稱為參數(shù)的置信度為1-的置信區(qū)間,稱為置信下限,稱為置信上限。置信區(qū)間的意義可作如下解釋:包含在隨機區(qū)間中的概率為100(1-)%;或者說,隨機區(qū)間以100(1-)%的概率包含。粗略地說,當(dāng)=0.05時,在100次的抽樣中,大致有95次包含在中,而其余5次可能不在該區(qū)間中。常取的數(shù)值為

59、0.05,0.01,此時置信度1-分別為0.95,0.99。置信區(qū)間的長度可視為區(qū)間估計的精度,下面分析置信度與精度的關(guān)系。(1)當(dāng)置信度1-增大,又樣本容量n固定時,置信區(qū)間長度增大,即區(qū)間估計精度減低;當(dāng)置信度1-減小,又樣本容量n固定,置信區(qū)間長度減小,即區(qū)間估計精度提高。(2)設(shè)置信度1-固定。當(dāng)樣本容量n增大時,置信區(qū)間減?。ㄈ缫?,置信區(qū)間長度為),區(qū)間估計精度提高。7.3.2單個正態(tài)總體參數(shù)的置信區(qū)間正態(tài)總體是最常見的分布,本小節(jié)中我們討論它的兩個參數(shù)的置信區(qū)間。1.已知時的置信區(qū)間設(shè)總體X服從正態(tài)分布,其中已知,而未知,求的置信度1-的置信區(qū)間。這一問題實際上已在引例中的討論

60、中解決,得到。所以的置信度1-的置信區(qū)間為。當(dāng)=0.05,=1.96;當(dāng)=0.01,=2.576。 例1某車間生產(chǎn)滾珠,從長期實踐知道,滾珠直徑X服從正態(tài)分布。從某天產(chǎn)品里隨機抽取6個,測得直徑為(單位:毫米):14.6,15.1,14.9,14.8,15.2,15.1。若總體方差=0.06,求總體均值的置信區(qū)間(=0.05,=0.01)。【答疑編號:10070202針對該題提問】解,=0.05時,置信度為95%的置信區(qū)間為=0.01時,置信度為99%的置信區(qū)間為。從此例知,在樣本容量n固定時,當(dāng)置信度1-較大時,置信區(qū)間長度較大;當(dāng)置信度1-較小時,置信區(qū)間較小。例2 用天平稱量某物體的質(zhì)量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論