版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章 數(shù)理統(tǒng)計的基礎(chǔ)知識在前四章的概率論部分中,我們討論了概率論的基本概念、思想和方法。知道隨機(jī)變量的統(tǒng)計規(guī)律性是通過隨機(jī)變量的概率分布來全面描述的。在概率論的許多問題中,概率分布通常是已知的或假設(shè)為已知的,在這一前提下我們?nèi)パ芯克男再|(zhì)、特點(diǎn)和規(guī)律性,即討論我們關(guān)心的某些概率、數(shù)字特征的計算以及對某些問題的判斷、推理等。但在許多實際問題中,所涉及到的某個隨機(jī)變量服從什么分布我們可能完全不知道,或有時我們能夠根據(jù)某些事實推斷出分布的類型,但卻不知道其分布函數(shù)中的某些參數(shù)。例如: 1 、某種電子元件的壽命服從什么分布是完全不知道的。2、 檢測一批燈泡是否合格,則每個燈泡可能合格,也可能不合格,
2、則服從 ( 0-1)分布,但其中的參數(shù)p 未知。對這類問題要深入研究,就必須知道與之相應(yīng)的分布或分布中的參數(shù)。數(shù)理統(tǒng)計要解決的首要問題就是:確定一個隨機(jī)變量的分布或分布中的參數(shù)。數(shù)理統(tǒng)計學(xué)是研究隨機(jī)現(xiàn)象規(guī)律性的一門學(xué)科,它以概率論為理論基礎(chǔ),研究如何以有效的方式收集、整理和分析受到隨機(jī)因素影響的數(shù)據(jù),并對所考察的問題作出推理和預(yù)測,直至為采取某種決策提供依據(jù)和建議。數(shù)理統(tǒng)計研究的內(nèi)容非常廣泛,可分為兩大類:一是:怎樣有效地收集、整理有限的數(shù)據(jù)資料。二是: 怎樣對所得的數(shù)據(jù)資料進(jìn)行分析和研究,從而對所考察對象的某些性質(zhì)作出盡可能精確可靠的判斷 本書中參數(shù)估計和假設(shè)檢驗。第一節(jié)數(shù)理統(tǒng)計的基本概念一
3、、總體與總體的分布在數(shù)理統(tǒng)計中,我們將研究對象的全體稱為總體 或 母體 , 而把組成總體的每個元素稱為個體 。 總體中所包含的個體的個數(shù)稱為總體的容量. 容量為有限的總體稱為有限總體; 容量為無限的總體稱為無限總體. 總體和個體之間的關(guān)系就是集合與元素之間的關(guān)系.在實際問題中,研究對象往往是很具體的事物或現(xiàn)象,而我們所關(guān)心的不是每一個個體的種種具體的特征,而是其中某項或某幾項數(shù)量指標(biāo),記為X 。例如:研究一批燈泡的平均壽命時,該批燈泡的全體構(gòu)成了研究的總體,其中每個燈泡就是個體。但在實際問題中,我們僅僅關(guān)心燈泡的使用壽命(記 X 表示該批燈泡的壽命)。 則 X 就是我們研究的總體(所有燈泡壽命
4、的集合),每一個燈泡的壽命就是一個個體。再如:考查某一群體的身高和體重,則全體人員的(身高、體重)是總體,每個人的身高和體重是個體。由此給出定義:總體: 對所研究對象的某些指標(biāo)進(jìn)行試驗,將試驗的全部可能的觀測值稱為總體記為X。個體:每一個可能的觀測值稱為個體。對不同的個體,X 的取值一般是不同的。例如在試驗中觀察若干個個體就會得到X 的一種數(shù)值,但在試驗或觀察之前,無法確定會得到一組什么樣的數(shù)值,所以X 是一個隨機(jī)變量或隨機(jī)向量,而X 的分布也就完全描述了我們所關(guān)心的指標(biāo),即總體的分布。為方便起見,以后我們將X 的可能取值的全體組成的集合稱為總體,或直接稱隨機(jī)變量 X 為總體 , X 的分布也
5、就是總體的分布。例如:正態(tài)總體:是指表示總體某個數(shù)量指標(biāo)的隨機(jī)變量服從正態(tài)分布。1 】 總體的分布一般情況下是未知的,這就需要利用總體中部分個體的數(shù)據(jù)資料來對總體服從的分布進(jìn)行檢驗這是分布擬合檢驗(非參數(shù)檢驗)問題;有時即使知道總體所服從的分布,但分布中的參數(shù)未知,這也需利用利用總體中部分個體的數(shù)據(jù)資料來對總體服從的分布中的未知參數(shù)進(jìn)行統(tǒng)計推斷(參數(shù)估計)。而這就需要從總體中抽取若干個體進(jìn)行觀察,從中獲得研究總體的一些觀察數(shù)據(jù),然后通過這些數(shù)據(jù)的統(tǒng)計分析,對總體的分布進(jìn)行判斷或?qū)傮w的參數(shù)做出合理的估計。而一般的方法是按照一定的原則從總體中抽取若干個體進(jìn)行觀察,這個過程稱為隨機(jī)抽樣。二、樣本與
6、樣本的分布由于每個個體的觀察結(jié)果具有隨機(jī)性,因此可以將第i次抽取的個體記為 Xi,則為隨機(jī)變量,為此引入以下概念。1、 樣本: 從一個總體X 中, 隨機(jī)的抽出n 個個體X1,X2,L , Xn , 通常記為(X1 , X2, , Xn)這樣取得的X1 ,X2 ,L , X n 稱為總體X 的一個樣本。樣本所含的個體數(shù)目稱為樣本容量.【注2】:(1)由于每個Xi都是從總體X中隨機(jī)抽出的,因此是一個隨機(jī)變量,而樣本(Xi,X2, ,Xn)就是n維的隨機(jī)向量。(2)在依次取n個個體Xi,X2,L ,Xn觀測完畢后,得到n個具體的數(shù)據(jù)(為必,4),稱為樣本(X1, X2, ,Xn) 的觀測值樣本值 。
7、因此樣本本身是隨機(jī)向量,而一經(jīng)抽取就是一組確定的數(shù)值,這就是所謂的樣本兩重性。2、簡單隨機(jī)樣本我們的目的是根據(jù)從總體中抽取的一個樣本值(x1, x2, ,xn )對總體X 的分布或某些特征進(jìn)行各種分析推斷,所以要求抽取的樣本能很好地反映總體的特性,為此我們要求隨機(jī)抽取的樣本(X1, X2, , Xn) 滿足:( 1) 具有代表性。即樣本的每個分量Xi 與總體X 有相同的分布;( 2) 具有獨(dú)立性。即X1, X2,L ,Xn 是相互獨(dú)立的隨機(jī)變量,也就是說,n 次觀察值之間是互相獨(dú)立的;滿足上述兩條的樣本稱為簡單隨機(jī)樣本, 今后如無特別說明,所說的樣本均指簡單隨機(jī)樣本。在實際問題中,抽取簡單隨機(jī)
8、樣本的方法很簡單:(1)放回抽樣;(2)不放回抽樣:有限總體,當(dāng)樣本容量遠(yuǎn)小于總體容量時,不放回近似代替放回;無限總體,總是用不放回抽樣.綜合上述,給出明確的數(shù)學(xué)概念:定義一:一個隨機(jī)變量X或其相應(yīng)的分布函數(shù)(分布律、密度函數(shù))稱為一個總體。定義二:若隨機(jī)向量 X1,X2,L ,Xn是相互獨(dú)立的隨機(jī)變量且每個分量Xi與總體X有相同的分布,則稱X1 , X2 ,L , X n 是來自總體的容量為n 的簡單隨機(jī)樣本。簡單隨機(jī)樣本的分布有如下性質(zhì):設(shè)總體 X 的分布函數(shù)為F(x) (稱為總體分布函數(shù)), 或密度函數(shù)f (x) 或分布律 (稱為總體概率密度),則來自總體的樣本(X1, X2, , Xn
9、) 的n聯(lián)合分布函數(shù):F (x1, x2.xn)F(xi) ,稱為樣本分布函數(shù)i1n聯(lián)合密度函數(shù):f(x1,x2.xn)f (xi) ,稱為連續(xù)樣本密度函數(shù)i1n聯(lián)合分布律:P(Xi,X2,L Xn) P(Xi Xi,X2 X2Xn ) P(X %),稱為離散 i1樣本密度【例1】 總體 X 服從參數(shù)為p 的( 0-1 )分布,PX 1 p, PX 0 1 p ,求(Xi,X2, ,Xn)的分布?!窘狻坑深}意 X的分布律為PX x pX(1 p)1 x,(x 0,1),設(shè) (X1, X2,L , Xn) 為來自X 的簡單隨機(jī)樣本值,則(X1, X2, , Xn) 的聯(lián)合概率分布為nnnXin
10、Xip(X1,X2,LXn)P(X1X1, X2X2.XnXn)pXi(1 p)1Xipi1 (1 p) i1i1【例2】總體X服從N( , 2),求樣本(Xi,X2, ,Xn)的聯(lián)合密度函數(shù).【解】設(shè)(Xi,X2,L ,Xn)為來自X的簡單隨機(jī)樣本值,則(Xi,X2, ,Xn)的聯(lián)合概率分布為11 Xi21n12f(Xi,X2,L ,Xn)-exp () () exp (x) i 1 22, 22 i 1三、統(tǒng)計推斷問題簡述總體和樣本是數(shù)理統(tǒng)計中的兩個基本概念.樣本來自總體,自然帶有總體的信息,從而可以從這些信息出發(fā)去研究總體的某些特征(分布或分布中的參數(shù)).另一方面,由樣本研究總體可以省時
11、省力(特別是針對破壞性的抽樣試驗而言).我們稱通過總體X的一個樣本”,X2, ,Xn對總體X的分布進(jìn)行推斷的問題為 統(tǒng)計推斷問題.總體、樣本、樣本值的關(guān)系:總體/ 、推斷(個體)樣本一樣本值抽樣在實際應(yīng)用中,總體的分布一般是未知的,或雖然知道總體分布所屬的類型,但其中包含著未知參數(shù).統(tǒng)計推斷就是利用樣本值對總體的分布類型、未知參數(shù)進(jìn)行估計和推斷.通過觀察或試驗得到的樣本值,一般是雜亂無章的,例如:例1樣本的一些例子與觀察值的表示方法:(1)某食品廠用自動裝罐機(jī)生產(chǎn)凈重為345克的午餐肉罐頭,由于隨機(jī)性,每個罐頭的凈重都有差別.現(xiàn)在從生產(chǎn)線上隨機(jī)抽取10個罐頭,秤其凈重,得如下結(jié)果:344 33
12、6 345 342 340 338 344 343 344 343這是一個容量為10的樣本的觀察值,它是來自該生產(chǎn)線罐頭凈重這一總體的一個樣本的觀察值.(2)對363個零售商店調(diào)查周售額(單位:元)的結(jié)果如下:零售額 1000 (1000,5000 (5000,10000 (10000,20000 (20000,30000商店數(shù) 611351W42?5-這是一個容量為363的樣本的觀察值,對應(yīng)的總體是所有零售店的周零售額.不過這里沒有給出每一個樣本的具體的觀察值,而是給出了樣本觀察值所在的區(qū)間,稱為分組樣本的觀察值.這樣一來當(dāng)然會損失一些信息,但是在樣本量較大時,這種經(jīng)過整理的數(shù)據(jù)更能使人們對
13、總體有一個大致的印象.通過該例可以看出,以上的兩種樣本值的表示方法,雖然能夠反應(yīng)出總體的一些大致 的信息,但不夠直觀,判斷不出總體服從什么分布。為了對總體的分布有一個大致的判斷, 就需要對所獲得的樣本值進(jìn)行整理,而分組數(shù)據(jù)統(tǒng)計表或頻率直方圖是兩種常用整理方法四、分組數(shù)據(jù)統(tǒng)計表和頻率直方圖1 .分組數(shù)據(jù)表:若樣本值較多時,可將其分成若干組,分組的區(qū)間長度一般取成相等 稱區(qū)間的長度為組距.分組的組數(shù)應(yīng)與樣本容量相適應(yīng).分組太少,則難以反映出分布的特 征,若分組太多,則由于樣本取值的隨機(jī)性而使分布顯得雜亂.因此,分組時,確定分組數(shù)(或組距)應(yīng)以突出分布的特征并沖淡樣本的隨機(jī)波動性為原則.區(qū)間所含的樣
14、本值個數(shù)稱為該區(qū)間的 組頻數(shù).組頻數(shù)與總的樣本容量之比稱為組頻率.2 .頻數(shù)直方圖:設(shè)X1, X 2, ,X n是總體X的一個樣本,又設(shè)總體具有概率密度f ,如何用樣本來推斷f ?注意到現(xiàn)在的樣本是一組實數(shù),因此,一個直觀的辦法是將實軸劃分為若干小區(qū)間,記下諸觀察值 Xi落在每個小區(qū)間中的個數(shù),根據(jù)大數(shù)定律中頻率近似概率的原理,從這些 個數(shù)來推斷總體在每一小區(qū)間上的密度。具體做法如下:設(shè)X1, X2, ,Xn是樣本的n個觀察值.(i)求出X1,X2, ,Xn中的最小者X和最大者X(n);(ii)選取常數(shù)a (略小于x)和b (略大于x(n),并將區(qū)間a,b等分成m個小區(qū)間( 般取m使m在1左右
15、):n 10ti,tit),i1,2, ,m, t般情況下,小區(qū)間不包括右端點(diǎn)(iii)求出組頻數(shù)n ,組頻率色 nhi(iv)在ti,tit)上以h為高,fi ,以及fip(i 1,2, ,n)t為寬作小矩形,其面積恰為fi ,所有小矩形合在一起就構(gòu)成了頻率直方圖頻率直方圖能夠大體刻畫總體的分布情況。實際上,我們就是用直方圖對應(yīng)的分段函數(shù),、fjn(x) ,x (tj i,tj, j 1,2,L ,mti來近似總體的密度函數(shù) f (x).這樣做為什么合理?我們引進(jìn)“隨機(jī)變量”,對每個小區(qū)間 (tj 1,tj,定義YiIE 了卜 WE0,右 Xi (tj 1,tj則Y是獨(dú)立同分布于兩點(diǎn)分布:P
16、Y x px(1 p)1x,x 0或 1其中p PXi (tj 1,tj),由大數(shù)定律,我們有nj1 ntjfjj Xi EXi P PX (tj 1,tjf(x)dxL(n )nn j 1tj1以概率為1成立,于是當(dāng)n充分大時,就可用fj來近似代替上式右邊以f(x)(x (tj 1,tj)為曲邊的曲邊梯形的面積,而且若m充分大,tj較小時,我們就可用小矩形的高度n(x) fj / tj 來近似取代 f(x),x (tj 1,tj.課本例4 :根據(jù)頻率直方圖可見,該零件的質(zhì)量服從正態(tài)分布,其數(shù)學(xué)期望大約為 209,這可通過 第七章的分布擬合進(jìn)行檢驗?!咀?】樣本的頻率直方圖可以形象地描述總體的
17、概率密度的大致形態(tài)。五、經(jīng)驗分布函數(shù)對于總體X的分布函數(shù)F (未知),設(shè)有它的樣本X1,X2, ,Xn ,我們同樣可以從樣本出發(fā),找到一個已知量來近似它,這就是經(jīng)驗分布函數(shù)Fn(x).定義 設(shè)總體X的一個容量為n的樣本的樣本值x1,x2, ,xn可按大小次序排列成x(1) x(2)x(n).k 若x(k) x x(ki),則不大于x的樣本值的頻率為 .因而函數(shù)n0, 若x x,F(xiàn)n(x)-,若 x(k) x x(ki),n1,若 x x(n).與事件X x在n次獨(dú)立重復(fù)試驗中的頻率是相同的,我們稱Fn(x)為經(jīng)驗分布函數(shù)?!咀?】Fn(x)是一個階梯狀的函數(shù),在x X3, k 1,2, ,n處
18、有躍度為%的間斷點(diǎn),若有l(wèi)個觀察值相同,則Fn(x)在此觀察值處的躍度為對于固定的x, Fn(x)1 即表本事件 Xx在n次試驗中出現(xiàn)的頻率,即Fn(x) 落在(,x)中Xi的個數(shù)。n用與直方圖分析相同的方法可以論證Fn(x)F(x), n,以概率為1成立。經(jīng)驗分布函數(shù)的圖形如圖.對于經(jīng)驗分布函數(shù) Fn(x),格里汶科(Glivenko)在1933年證明了以下的結(jié)果:對于任一 實數(shù)x,當(dāng)n 時Fn(x)以概率1 一致收斂于分布函數(shù) F(x),即Plim sup |Fn(x) F(x)| 0 1. n x因此,對于任一實數(shù)x當(dāng)n充分大時,經(jīng)驗分布函數(shù)的任一個觀察值Fn(x)與總體分布函數(shù)F(x)
19、只有微小的差別,從而在實際中可當(dāng)作F(x)來使用.課本例5【注4】由圖可以看出,經(jīng)驗分布函數(shù)是一個階梯狀的曲線,我們可以想象,當(dāng)樣本容 量增大時,相鄰兩階梯的躍度將降低,階梯的寬度將變窄,這樣階梯狀的折線幾乎能變成一 條曲線,則經(jīng)驗分布函數(shù)非常接近總體的分布函數(shù)。這就是由樣本推斷總體其可行性的最基本的理論依據(jù).分布擬合檢驗的理論依據(jù) 六統(tǒng)計量樣本是總體的代表和反映,但在抽取樣本后,由于樣本只是呈現(xiàn)為一堆“雜亂無章”的數(shù)據(jù),雖然通過頻率直方圖或經(jīng)驗分布函數(shù)能夠大致了解總體的分布曲線,但無從知道總體到底服從什么分布,因此需要對樣本的觀測值進(jìn)行加工和提煉課本例6試對該該工廠的工人周工資的水平和收入懸
20、殊程度做個大致分析。顯然,如果不進(jìn)行加工,面對這大堆大小參差不齊的數(shù)據(jù),你很難得出什么印象。 但是只要對這些數(shù)據(jù)稍事加工,便能作出大致分析:如記各工人的周工資數(shù)為X1,X2,L ,X30,則考慮(30_1xxi 153.530 i i它反映了該廠工人周工資的一般水平;收入的差別程度可以考慮i 302s(xi x)2 13.51 30 i i i這說明收入的差別不大,當(dāng)然這需要一定的參照資料。由此可見對樣本的加工是十分必要的。對樣本加工,主要就是構(gòu)造統(tǒng)計量。T T(Xi,X2 Xn)為一個 n 元T(Xi,X2L Xn)為一個統(tǒng)計量。定義:設(shè)Xi,X2, ,Xn為來自總體X的一個樣本,連續(xù)函數(shù),
21、若T(Xi,XzL Xn)中不含任何未知參數(shù),則稱例:設(shè)總體X服從正態(tài)分布N( , 2),其中 ,2未知。Xi, X2, ,Xn是從正態(tài)總體X中抽取的一個樣本,則1nn 2 父A、一 Xi,Xi2 ,均是樣本的統(tǒng)計量,n i ii i1 n而一xin i i1n 2 3、-2xi2 ,都不是統(tǒng)計量.i 1【注4】:統(tǒng)計量常用大寫字母表示,若樣本取得一組具體的數(shù)字,統(tǒng)計量用小寫字母表示。七、常用的統(tǒng)計量 一樣本矩-樣本的數(shù)字特征復(fù)習(xí):隨機(jī)變量矩的定義設(shè)X與Y是隨機(jī)變量。若 E(Xk)(k 1,2,)存在,則稱它為 X的k階原點(diǎn)矩.若EX E(X)k(k 1,2,)存在,則稱它為X的k階中心矩.常
22、見的統(tǒng)計量設(shè)Xi, X2, , Xn為總體X的樣本,則下列各量均是統(tǒng)計量,它們今后要經(jīng)常被用到。(1) XXi , X稱為樣本均值-一階樣本原點(diǎn)矩。(反映總體均值的信息)(2)S2n(Xii 1nX)2 占i1Xi2一2 八2 , 一,、0nX ), S2稱為樣本方差。(反映總體方差的信息)(3)S vS2, S稱為樣本標(biāo)準(zhǔn)差。1 n k 一,、(4) Ak Xi , Ak稱為樣本k階原點(diǎn)矩)。(反映總體k階矩的信息) n i 1/ l、1 nk,,“,八人,、(5) Bk (Xi X) , Bk稱為樣本k階中心矩。(反映總體k階中心矩的信息) n i 1如果取得樣本(X1,X2, ,Xn)的
23、觀測值(X1,X2, ,Xn),則由上述的公式可得到相應(yīng)的樣本矩的觀測值, 中心矩。分別被稱為樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本k階矩、樣本k階(6)順序統(tǒng)計量將樣本中的各分量按由小到大的次序排列成X(1) X(2)X(n),則稱X,X,X(n)為樣本的一組 順序統(tǒng)計量,X(i)稱為樣本的第i個順序統(tǒng)計量特別地,稱X(1)min X1, X2,L , Xn稱為最小順序統(tǒng)計量,也稱為樣本極小值;稱X(n) maxX1,X2,L , Xn稱為最大順序統(tǒng)計量,也稱為樣本極大值 稱X(n)X(1)為樣本的極差.X n 1 , n為奇數(shù) ()*2稱M 1為樣本中位數(shù)1X nX n , n為偶數(shù)2(2)
24、(2 1)注意,對于簡單隨機(jī)樣本 體X同分布的隨機(jī)變量,然而實際上,最小順序統(tǒng)計量X1,X2, ,Xn ,各個觀測值X1,X2, ,Xn是獨(dú)立并且與總 X(1) ,X,,X(n)既不獨(dú)立也不同分布.X的分布就是最小分布,最小順序統(tǒng)計量 X (n)的分布就是最大分布.【例7】 設(shè)電子元件的壽命 X服從參數(shù)0.0015的指數(shù)分布,今獨(dú)立測試n 6個元件,記錄它們的失效時間。求(1)沒有元件在800小時之間失效的概率;(2)沒有元件最后超過 3000小時的概率。【解】由題意,F(xiàn)(x)(0.0015X1 e ,x 00, other設(shè)Xi,X2,L ,X6分別表示6個元件的壽命,則 Xi,X2,L ,
25、X6獨(dú)立同分布于 X,由題意知,“沒有元件在800小時之間失效”等價于 X minXi,X2,L ,X6 800;“沒有元件最后超過 3000小時”等價于 X maxX1,X2,L ,X6 3000。所以(1) PX(i) minXi,X2,L ,X68006PXi 800 1 PX 8006 e7.2 i 1 PX(n) maxXi,X2,L ,Xg 30006 _ 6_4 5_ 6PXi 3000 F (3000)1 e .i 1我們關(guān)心的問題是如何用以上統(tǒng)計量的觀測值去推斷總體的分布,即總體的數(shù)字特征。 一、相關(guān)的理論依據(jù)1、樣本的k階原點(diǎn)矩依概率收斂于總體的k階原點(diǎn)矩1 n定理:如果總
26、體X的k階原點(diǎn)矩EXk Uk存在,則有l(wèi)im P| - Xk uk| 1 nn k 1證明:因為XX2.Xn相互獨(dú)立且與X同分布,所以因而X1kM.Xnk相互獨(dú)立且與Xk同分布,所以EX; . EX: EXk Uk 1nl.一n從而由羊欽大數(shù)定律有l(wèi)im P| - Xkuk | 1, 即:AkpUknn k 12、樣本矩的函數(shù)以概率收斂于總體矩的函數(shù)g(A”.,Ak)p g(u”.,Uk)以上兩條是:下一章矩估計法的理論依據(jù)。,即可用樣本觀測值的k階原點(diǎn)矩去估計總體白k階原點(diǎn)矩(特別的,可用樣本(觀測值)的均值去估計總體的均值(數(shù)學(xué)期望);參數(shù)估計的理論依據(jù)。3、當(dāng)n充分大時,可用樣本觀測值的
27、經(jīng)驗分布函數(shù)來近似代替總體分布函數(shù)。第二節(jié)常用統(tǒng)計分布統(tǒng)計量是我們對總體的分布規(guī)律或數(shù)字特征進(jìn)行推斷的基礎(chǔ)。在使用統(tǒng)計量進(jìn)行推斷時必須要知道它的分布。在數(shù)理統(tǒng)計中,統(tǒng)計量的分布稱為抽樣分布,因而確定統(tǒng)計量的分布是數(shù)理統(tǒng)計的基本問題之一。下面我們介紹三類重要的分布一分位數(shù)設(shè)隨機(jī)變量X的分布函數(shù)為F(x),對給定的實數(shù) (01),若實數(shù)F滿足不等式PX F , 則稱F為隨機(jī)變量X的分布的水平 若實數(shù)T滿足不等式的上側(cè)分位數(shù).的雙側(cè)分位數(shù).0.05的上側(cè)分位數(shù)和雙側(cè)分位數(shù)定義:Xi,X2,.Xn來自總體 X N(u,22),則隨機(jī)變量C1X1C2X2. CnXn服從正態(tài)分布U N(Gu,nCi2 2
28、), i 1P| X | T , 則稱T為隨機(jī)變量X的分布的水平 例1設(shè) 0.05,求標(biāo)準(zhǔn)正態(tài)分布的水平 復(fù)習(xí)正態(tài)分布2 N(,),n1、定義:設(shè)X1, X2, Xn相互獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布,即 Xi N(0,1),i1,2, ,n,則隨機(jī)變量2Xi2X2Xn2Xi2服從自由度為1n的2分布,記22,、(n)。這里自由度n是指獨(dú)立變量的個數(shù)。特別的2、2分布的密度函數(shù)f(y)1n22ny2,y 0,y 01 x .e dx0其中函數(shù),其定義為3、圖形:給出n =1,4, 10, 20 時的2分布的密度函數(shù)的曲線。4、性質(zhì)(1)數(shù)學(xué)期望和方差:_2_2_E( (n) n,D( (n) 2n1
29、證明:因為 Xi N(0,1),所以 EXi 0,DXi 1 EXilEXi4 -j=x、dx 3X N(0,1) / . n特別地若:X1,X2,.Xn 來自總體 X N(0,1),則 X N(0,1) , VnX N(0,1) n2、密度函數(shù)3、圖形 4、性質(zhì) 5、上 分位數(shù):雙側(cè)分位數(shù)(二)2分布所以E(2(n)E(X12 X2X:)EX:1_. _2而DXiEX;_2 2-(EXi )3所以D(2(n)D(X12X;Xn)DX2EXi4_2 2_(EXi ) 2n(2)可加性若X1 2(n),X22(%),且Xi與X2相互獨(dú)立X1 X2 2(n1 1)該結(jié)論可推廣到n個獨(dú)立服從卡方分布
30、隨機(jī)變量圖6-2分布的上分位3、上側(cè)分位數(shù)定義:統(tǒng)計量2 2(n),則稱P 22(n)2(n)f(X)dX的點(diǎn)2(n)為 2(n)分布的上側(cè)分位數(shù)。(0< <1)用法是:已知和n,求出 2(n);已知 2 k中的k和n。查表求查表求上分位點(diǎn)443頁表中給出了不同的自由度和確定的概率值對應(yīng)的上分位點(diǎn) 2( n)的值。幾點(diǎn)說明:2 2 一-如.查 0.995(10), 0.05 (20)等等。(1) P 22(n)2f(x)dx中上 分位點(diǎn)2(n)的意義是:我們需要求的2(n)是當(dāng)隨機(jī)變量在2(n) , + 取值時,其概率為給定的(2)表中只列出自由度為1-45的分布值。當(dāng)自由度 n&
31、gt;45時,用以下近似計算公式:2(n) 2(z27)2其中z為標(biāo)準(zhǔn)正態(tài)分布的上 分位點(diǎn)1如:0.025 (61)” 后1)2 83.9808,(其中查表得 z 1.96,n 61)例2設(shè)X1, ,X6是來自總體N (0,1)的樣本,又設(shè)Y (X1X2 X3)2 C(X4 X5 X6)2試求常數(shù)C,使CY服從2分布.(三)t分布(學(xué)生分布)2 .1、定義:設(shè)X N(0,1),Y (n),且X與Y相互獨(dú)立,則稱隨機(jī)變量2 n 1L)h n服從自由度為n的t分布,記為t t(n)。f,、(To2、密度函數(shù):f(t) 2(1n、,n23、密度函數(shù)圖形特點(diǎn):(1) f(t)是偶函數(shù),圖形關(guān)于縱軸對稱
32、(2) lim f (x) .e與,因此當(dāng)n充分大時,其圖形近似為標(biāo)準(zhǔn)正態(tài)分布的密 n2度函數(shù)圖形。隨著 n的增大,t(n)的密度曲線與N(0,1)的密度曲線越來越接近,一般若n 45,就可認(rèn)為它基本與 N(0,1)相差無幾了。4、分位數(shù)(1)上側(cè)分位數(shù)定義:統(tǒng)計量t t(n),則稱Pt t (n) t(n)h«)dt 的點(diǎn) t(n)為t(n)分布的上側(cè)分位數(shù)。(0< <1),顯然有ti(n)t (n)查表求.(2)雙側(cè)分位數(shù)P|T| t /2(n)t /2(n)f (x)dx""MW由密度函數(shù)的對稱性有PT t /2(n)/2;PTt /2(n)/2
33、例;課本 132 頁 t t(8),0.05 ,則查表可知,t0.05(8) 1.8595,t0.025 (8)2.3060所以有 PT 1.8595 PT 1.8595 P| T |2.3060 0.05【注】(1)當(dāng)n>45時可用正態(tài)近似t (n) ut /2(n) u /2 ,查正態(tài)分布表可得;(2) t (n)為t(n)分布的上側(cè)分位數(shù),則PT t (n) 1 ;PT t (n); P| T | t (n) 2【例3】(四)F分布2分布,則隨機(jī)變量1、定義:設(shè)X ,Y相互獨(dú)立,分別服從自由度為ni, n2的服從自由度為(必,1)的F分布,記為n1 n222、密度函數(shù)(y)ni3、
34、圖形4、性質(zhì):如果F F(n,n2). 1、(1) F (n2, n1).如果X t(n),則X2F(1,n):ni”2X n2Y n1n12上1y2n2 yn2n1 n2-2-5、上分位數(shù)(1 )定義:滿足PF (n,m)(n'm)f(y)dy的點(diǎn) F (n,m)為F (n,m)分布的上側(cè)分?jǐn)?shù)(2)性質(zhì):F1(n,m)F (m,n)證明:事實上,設(shè) F F(n, m),1P -P F F (n,m) PF F (n,m)F F (n,m)于是Pl由 分位點(diǎn)的定義,顯然F (n,m)Fi (m,n)一1成立。F (n,m)(3)查表:例如:課本133課本例4第三節(jié)抽樣分布抽樣分布,實際
35、上就是隨機(jī)變量函數(shù)的分布,只是強(qiáng)調(diào)這一分布是由統(tǒng)計量所產(chǎn)生的。統(tǒng)計量是我們對總體的分布規(guī)律或數(shù)字特征進(jìn)行推斷的基礎(chǔ)。在使用統(tǒng)計量進(jìn)行推斷時必須要知道它的分布。當(dāng)總體的分布已知時, 統(tǒng)計量的分布是確定的, 能夠求出來,如前面所講 的樣本矩,但是要精確求出統(tǒng)計量的分布,一般來說是比較困難的。在數(shù)理統(tǒng)計中,統(tǒng)計量的分布稱為抽樣分布,因而確定統(tǒng)計量的分布是數(shù)理統(tǒng)計的基本問題之一。本節(jié)我們重點(diǎn)討論正態(tài)總體的抽樣分布,即由從正態(tài)總體中抽取的樣本構(gòu)造成的統(tǒng)計 量服從何種分布,這是屬于小樣本統(tǒng)計范疇。下面我們介紹來自正態(tài)總體的四類重要的分布。一、來自單個正態(tài)總體的抽樣分布定理1:設(shè)XN(u, 2),X1,X2
36、,Xn是來自總體X的容量為n的樣本,X為樣本均值,S2為樣本方差,則有以下結(jié)論2Xu(1)樣本均值:X : N(u,)或U : N(0,1)。板書證明n、.n樣本方差:2 " n( 一 )2:2(n 1)1 1n n _ _2 12122s(Xi X) XinX n 1 i 1n 1 i 1記住結(jié)論,不用證明,注意與(4)比較(3)樣本均值 X和樣本方差s2獨(dú)立n n(4)2 T (Xi )2(X)2 2(n)i 1i 1板書證明,記住結(jié)論,注意與(2)比較Xu(5)T -r=t(n 1)板書證明 S2例題講解課本例1、設(shè)Xi,X2.,X25為來自總體XN(21,4)的樣本,求:(1
37、)樣本均值的數(shù)學(xué)期望與方差;(2) P| X 21| 0.24例2、(課后習(xí)題1)已知離散型總體 X的分布律為X246P1/31/31/3取容量為n=54的樣本,求(1)樣本均值 X落在4.1到4.4之間的概率;(2)樣本均值 X超過4.5的概率解:由題意 EX 4, DX 8/3, EX 4, DX °X ,VdX 2/9 n 814.1 4 X 4Pi 2/92/91 PX 4.5 1(1)P4.1 X 4.4(2) PX 4.5例3、例4.4.4 4(1.8)(0.45) 0.9645 0.6736 0.2905 2/9 'X 4 4.5 4P 1(2.25) 0.01222/92/9、來自兩個正態(tài)總體的抽樣分布定理:設(shè)X1,X2.,Xn與Y1,Y2.,Ym分別為來自正態(tài)總體N( 1, 12)和N(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年福州市勞動協(xié)議格式
- 安保崗位聘用協(xié)議范本2024年限定
- 2024事業(yè)單位勞動協(xié)議定制樣本
- 2024年不變單價服務(wù)協(xié)議格式
- 2024年債務(wù)以資抵債協(xié)議樣本
- 2024房產(chǎn)中介服務(wù)協(xié)議模板
- DB11∕T 1671-2019 戶用并網(wǎng)光伏發(fā)電系統(tǒng)電氣安全設(shè)計技術(shù)要求
- 2024高效貨車駕駛員專屬聘請協(xié)議
- 二手電動摩托車交易協(xié)議2024年
- 2024年借款融資居間協(xié)議格式
- 教學(xué)課件《變革與突破-19世紀(jì)西方美術(shù)》
- 全國職業(yè)院校技能大賽中職組(養(yǎng)老照護(hù)賽項)選拔賽考試題庫500題(含答案)
- 2024中國石化齊魯石化畢業(yè)生招聘11人高頻考題難、易錯點(diǎn)模擬試題(共500題)附帶答案詳解
- 部編版六年級上冊《第4單元 口語交際:請你支持我》課件
- 2024-2030年中國井蓋行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 校長外出考察報告10篇
- 2024廣西繼續(xù)教育公需科目(高質(zhì)量共建“一帶一路”)
- DB34∕T 3174-2018 舊水泥混凝土路面微裂均質(zhì)化再生技術(shù)規(guī)程
- 2024四川雅安市公安局特警支隊招聘筆試參考題庫含答案解析
- (高清版)WST 408-2024 定量檢驗程序分析性能驗證指南
- 中公教育考研協(xié)議班合同模板
評論
0/150
提交評論