




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第五章 數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)在前四章的概率論部分中, 我們討論了概率論的基本概念、 思想和方法。 知道隨機(jī)變量 的統(tǒng)計(jì)規(guī)律性是通過隨機(jī)變量的概率分布來全面描述的。 在概率論的許多問題中, 概率分布 通常是已知的或假設(shè)為已知的, 在這一前提下我們?nèi)パ芯克男再|(zhì)、 特點(diǎn)和規(guī)律性, 即討論 我們關(guān)心的某些概率、數(shù)字特征的計(jì)算以及對(duì)某些問題的判斷、推理等。但在許多實(shí)際問題中, 所涉及到的某個(gè)隨機(jī)變量服從什么分布我們可能完全不知道, 或 有時(shí)我們能夠根據(jù)某些事實(shí)推斷出分布的類型,但卻不知道其分布函數(shù)中的某些參數(shù)。例如: 1、某種電子元件的壽命服從什么分布是完全不知道的。2、檢測(cè)一批燈泡是否合格, 則每個(gè)燈
2、泡可能合格, 也可能不合格, 則服從 ( 0-1) 分布,但其中的參數(shù) p 未知。對(duì)這類問題要深入研究, 就必須知道與之相應(yīng)的分布或分布中的參數(shù)。 數(shù)理統(tǒng)計(jì)要解決 的首要問題就是:確定一個(gè)隨機(jī)變量的分布或分布中的參數(shù)。數(shù)理統(tǒng)計(jì)學(xué)是研究隨機(jī)現(xiàn)象規(guī)律性的一門學(xué)科, 它以概率論為理論基礎(chǔ), 研究如何以有 效的方式收集、整理和分析受到隨機(jī)因素影響的數(shù)據(jù),并對(duì)所考察的問題作出推理和預(yù)測(cè), 直至為采取某種決策提供依據(jù)和建議。數(shù)理統(tǒng)計(jì)研究的內(nèi)容非常廣泛,可分為兩大類: 一是:怎樣有效地收集、整理有限的數(shù)據(jù)資料。 二是: 怎樣對(duì)所得的數(shù)據(jù)資料進(jìn)行分析和研究, 從而對(duì)所考察對(duì)象的某些性質(zhì)作出盡可 能精確可靠的判
3、斷 本書中參數(shù)估計(jì)和假設(shè)檢驗(yàn)。第一節(jié) 數(shù)理統(tǒng)計(jì)的基本概念一、總體與總體的分布在數(shù)理統(tǒng)計(jì)中, 我們將研究對(duì)象的全體稱為 總體或母體 ,而把組成總體的每個(gè)元素稱為 個(gè)體 ??傮w中所包含的個(gè)體的個(gè)數(shù)稱為 總體的容量 . 容量為有限的總體稱為 有限總體 ;容量 為無限的總體稱為 無限總體 . 總體和個(gè)體之間的關(guān)系就是集合與元素之間的關(guān)系 .在實(shí)際問題中, 研究對(duì)象往往是很具體的事物或現(xiàn)象, 而我們所關(guān)心的不是每一個(gè)個(gè)體 的種種具體的特征,而是其中某項(xiàng)或某幾項(xiàng)數(shù)量指標(biāo),記為 X 。例如:研究一批燈泡的平均壽命 時(shí),該批燈泡的全體構(gòu)成了研究的總體,其中每個(gè)燈 泡就是個(gè)體。但在實(shí)際問題中, 我們僅僅關(guān)心燈泡
4、的使用壽命 (記 X 表示該批燈泡的壽命) 。則 X 就 是我們研究的總體(所有燈泡壽命的集合) ,每一個(gè)燈泡的壽命就是一個(gè)個(gè)體。再如:考查某一群體的身高和體重 ,則全體人員的(身高、體重)是總體,每個(gè)人的 身高和體重是個(gè)體。由此給出定義:總體 :對(duì)所研究對(duì)象的某些指標(biāo)進(jìn)行試驗(yàn), 將試驗(yàn)的全部可能的觀測(cè)值稱為總體記為X。個(gè)體 :每一個(gè)可能的觀測(cè)值稱為個(gè)體。對(duì)不同的個(gè)體, X 的取值一般是不同的。例如在試驗(yàn)中觀察若干個(gè)個(gè)體就會(huì)得到 X 的 一種數(shù)值,但在試驗(yàn)或觀察之前,無法確定會(huì)得到一組什么樣的數(shù)值,所以 X 是一個(gè)隨機(jī) 變量或隨機(jī)向量,而 X 的分布也就完全描述了我們所關(guān)心的指標(biāo),即總體的分布
5、 。為方便起見,以后我們將 X 的可能取值的全體組成的集合稱為總體,或直接稱 隨機(jī)變 量 X 為總體 , X 的分布也就是總體的分布。例如:正態(tài)總體:是指表示總體某個(gè)數(shù)量指標(biāo)的隨機(jī)變量服從正態(tài)分布。注 1 】總體的分布一般情況下是未知的,這就需要利用總體中部分個(gè)體的數(shù)據(jù)資料來 對(duì)總體服從的分布進(jìn)行檢驗(yàn)這是分布擬合檢驗(yàn)(非參數(shù)檢驗(yàn))問題;有時(shí)即使知道總體 所服從的分布, 但分布中的參數(shù)未知, 這也需利用利用總體中部分個(gè)體的數(shù)據(jù)資料來對(duì)總體 服從的分布中的未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷(參數(shù)估計(jì)) 。而這就需要從總體中抽取若干個(gè)體進(jìn) 行觀察, 從中獲得研究總體的一些觀察數(shù)據(jù), 然后通過這些數(shù)據(jù)的統(tǒng)計(jì)分析,
6、對(duì)總體的分布 進(jìn)行判斷或?qū)傮w的參數(shù)做出合理的估計(jì)。 而一般的方法是按照一定的原則從總體中抽取若 干個(gè)體進(jìn)行觀察,這個(gè)過程稱為 隨機(jī)抽樣 。二、樣本與樣本的分布由于每個(gè)個(gè)體的觀察結(jié)果具有隨機(jī)性,因此可以將第 i 次抽取的個(gè)體記為 Xi ,則為隨機(jī)變量,為此引入以下概念。1、樣本:從一個(gè)總體 X 中,隨機(jī)的抽出 n 個(gè)個(gè)體 X1,X2,L , X n ,通常記為 (X1,X2, ,Xn)這樣取得的Xi,X2,L ,Xn稱為總體X的一個(gè)樣本。樣本所含的個(gè)體數(shù)目稱為樣本容量【注 2】:(1)由于每個(gè) Xi 都是從總體 X 中隨機(jī)抽出的,因此是一個(gè)隨機(jī)變量,而樣本(Xi,X2, ,Xn)就是n維的隨機(jī)
7、向量。(2)在依次取n個(gè)個(gè)體Xi,X2,L ,Xn觀測(cè)完畢后,得到n個(gè)具體的數(shù)據(jù)(x-x?, , xn),稱為樣本(Xi, X 2, ,Xn)的觀測(cè)值一樣本值。因此樣本本身是隨機(jī)向量,而一經(jīng)抽取就是一組確定的數(shù)值,這就是所謂的樣本兩重性。2、簡(jiǎn)單隨機(jī)樣本我們的目的是根據(jù)從總體中抽取的一個(gè)樣本值(x1,x2, ,xn)對(duì)總體X的分布或某些特征進(jìn)行各種分析推斷, 所以要求抽取的樣本能很好地反映總體的特性, 為此我們要求隨機(jī)抽取的樣本(Xi,X2, ,Xn)滿足:(1) 具有代表性。即樣本的每個(gè)分量 Xi與總體X有相同的分布;(2) 具有獨(dú)立性。即Xi,X2,L ,Xn是相互獨(dú)立的隨機(jī)變量,也就是說
8、,n次觀察值之間是互相獨(dú)立的;滿足上述兩條的樣本稱為 簡(jiǎn)單隨機(jī)樣本 ,今后如無特別說明, 所說的樣本均指簡(jiǎn)單隨機(jī) 樣本。在實(shí)際問題中,抽取簡(jiǎn)單隨機(jī)樣本的方法很簡(jiǎn)單:( 1)放回抽樣;( 2)不放回抽樣: 有限總體 ,當(dāng)樣本容量遠(yuǎn)小于總體容量時(shí),不放回近似代替放回; 無限總體 ,總是用不放回抽樣 .綜合上述,給出明確的數(shù)學(xué)概念:定義一 :一個(gè)隨機(jī)變量 X 或其相應(yīng)的分布函數(shù)(分布律、密度函數(shù))稱為一個(gè)總體。定義二:若隨機(jī)向量 X1,X2,L ,Xn是相互獨(dú)立的隨機(jī)變量且每個(gè)分量Xi與總體X有相同的分布,則稱 X1,X2,L ,Xn 是來自總體的容量為 n 的簡(jiǎn)單隨機(jī)樣本。簡(jiǎn)單隨機(jī)樣本的分布有如下
9、性質(zhì) :設(shè)總體X的分布函數(shù)為F(x)(稱為總體分布函數(shù)),或密度函數(shù)f(x)或分布律(稱為總體概率密度),則來自總體的樣本(XX2,, Xn)的n聯(lián)合分布函數(shù):F(X1,X2.Xn)F (X),稱為樣本分布函數(shù)i1聯(lián)合密度函數(shù):f(X1,X2.Xn)nf (Xi ) ,稱為連續(xù)樣本密度函數(shù)i1聯(lián)合分布律:p(X1,X2,LXn)P(X1X1, X2X2 .X nXn)nP(X Xi),i1稱為離散樣本密度【例 1】總體 X 服從參數(shù)為 p 的( 0-1)分布, PX 1p,P X 01 p ,求(Xi,X2, ,Xn)的分布?!窘狻坑深}意 X 的分布律為 PX x px(1 p)1 x,( x
10、 0,1),設(shè)(Xi,X2丄,Xn)為來自X的簡(jiǎn)單隨機(jī)樣本值,則(Xi,X2, ,Xn)的聯(lián)合概率分布為nn nxin xip(x1,x2,L xn) P(X1 x1,X2 x2 .X n xn)pxi(1 p)1 xi pi1 (1 p) i1i1【例2】總體X服從N( , 2),求樣本(Xi,X2, ,Xn)的聯(lián)合密度函數(shù)【解】設(shè)(Xi,X2丄,Xn)為來自X的簡(jiǎn)單隨機(jī)樣本值,則(Xi,X2, ,Xn)的聯(lián)合概率分布為f(X1,X2 丄,Xn)i1r 1 Xi1n_1廠 exp 2() G ) exp蘆n(Xi)2i 1三、統(tǒng)計(jì)推斷問題簡(jiǎn)述總體和樣本是數(shù)理統(tǒng)計(jì)中的兩個(gè)基本概念樣本來自總體,
11、自然帶有總體的信息,從而可以從這些信息出發(fā)去研究總體的某些特征(分布或分布中的參數(shù))另一方面,由樣本研究總體可以省時(shí)省力(特別是針對(duì)破壞性的抽樣試驗(yàn)而言)我們稱通過總體X的一個(gè)樣本XX2, ,Xn對(duì)總體X的分布進(jìn)行推斷的問題為 統(tǒng)計(jì)推斷問題總體、樣本、樣本值的關(guān)系:總體/推斷(個(gè)體)樣本 T 樣本值 抽樣在實(shí)際應(yīng)用中,總體的分布一般是未知的,或雖然知道總體分布所屬的類型,但其中包含著未知參數(shù)統(tǒng)計(jì)推斷就是利用樣本值對(duì)總體的分布類型、未知參數(shù)進(jìn)行估計(jì)和推斷通過觀察或試驗(yàn)得到的樣本值,一般是雜亂無章的,例如:例1樣本的一些例子與觀察值的表示方法:(1) 某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重為345克的午餐肉
12、罐頭,由于隨機(jī)性,每個(gè)罐頭的凈重都有差別.現(xiàn)在從生產(chǎn)線上隨機(jī)抽取10個(gè)罐頭,秤其凈重,得如下結(jié)果:344 336345342340338344343344343這是一個(gè)容量為10的樣本的觀察值,它是來自該生產(chǎn)線罐頭凈重這一總體的一個(gè)樣本的觀察值(2) 對(duì)363個(gè)零售商店調(diào)查周售額(單位:元)的結(jié)果如下:零售額1000(1000,5000(5000,10000(10000,20000(20000,30000商店數(shù)611351104215這是一個(gè)容量為363的樣本的觀察值,對(duì)應(yīng)的總體是所有零售店的周零售額不過這里沒有給出每一個(gè)樣本的具體的觀察值,而是給出了樣本觀察值所在的區(qū)間,稱為分組樣本的觀察值
13、這樣一來當(dāng)然會(huì)損失一些信息,但是在樣本量較大時(shí),這種經(jīng)過整理的數(shù)據(jù)更能使人們對(duì)總體有一個(gè)大致的印象通過該例可以看出,以上的兩種樣本值的表示方法,雖然能夠反應(yīng)出總體的一些大致 的信息,但不夠直觀,判斷不出總體服從什么分布。為了對(duì)總體的分布有一個(gè)大致的判斷, 就需要對(duì)所獲得的樣本值進(jìn)行整理,而分組數(shù)據(jù)統(tǒng)計(jì)表或頻率直方圖是兩種常用整理方法四、分組數(shù)據(jù)統(tǒng)計(jì)表和頻率直方圖1. 分組數(shù)據(jù)表:若樣本值較多時(shí),可將其分成若干組,分組的區(qū)間長(zhǎng)度一般取成相等稱區(qū)間的長(zhǎng)度為組距分組的組數(shù)應(yīng)與樣本容量相適應(yīng)分組太少,則難以反映出分布的特征,若分組太多,則由于樣本取值的隨機(jī)性而使分布顯得雜亂因此,分組時(shí),確定分組數(shù)(或
14、組距)應(yīng)以突出分布的特征并沖淡樣本的隨機(jī)波動(dòng)性為原則區(qū)間所含的樣本值個(gè)數(shù)稱為該區(qū)間的 組頻數(shù)組頻數(shù)與總的樣本容量之比稱為組頻率2. 頻數(shù)直方圖:設(shè)X1, X 2, ,Xn是總體X的一個(gè)樣本,又設(shè)總體具有概率密度f,如何用樣本來推斷f ?注意到現(xiàn)在的樣本是一組實(shí)數(shù),因此,一個(gè)直觀的辦法是將實(shí)軸劃分為若干小區(qū)間,記下諸觀察值 Xi落在每個(gè)小區(qū)間中的個(gè)數(shù),根據(jù)大數(shù)定律中頻率近似概率的原理,從這些 個(gè)數(shù)來推斷總體在每一小區(qū)間上的密度。具體做法如下:設(shè)X1, X2, ,Xn是樣本的n個(gè)觀察值(i)求出X1,X2, ,Xn中的最小者X(1)和最大者X(n);(ii)選取常數(shù)a (略小于x(i)和b (略大
15、于x(n),并將區(qū)間a,b等分成m個(gè)小區(qū)間( 般取m使m在左右):n 10ti ,tit),i1,2,m, t -,m般情況下,小區(qū)間不包括右端點(diǎn)(iii)求出組頻數(shù)ni,組頻率比nfi ,以及hifiJ tU 1,2,n)(iv)在ti,tit)上以h為高,t為寬作小矩形,其面積恰為fi,所有小矩形合在一起就構(gòu)成了頻率直方圖頻率直方圖能夠大體刻畫總體的分布情況。實(shí)際上,我們就是用直方圖對(duì)應(yīng)的分段函數(shù)fjn(x) ,x (tj i,tj, j 1,2,L ,mti來近似總體的密度函數(shù) f(X)這樣做為什么合理?我們引進(jìn)“隨機(jī)變量”,對(duì)每個(gè)小區(qū)間 (tj 1,tj,定義Yi若乂打1,2丄,n0,
16、右 Xi(tj 1,tj則Y是獨(dú)立同分布于兩點(diǎn)分布:PYxx彳p (1P)1 x,x 0或 1其中 p PXi (tj 1,tj),nj1 nfjXinn j 1由大數(shù)疋律,我們有tjEXiPPX(tj 1,tjf (x)dxL (n)tj 1以概率為1成立,于是當(dāng)n充分大時(shí),就可用fj來近似代替上式右邊以f(x)(x (tj 1,tj)為曲邊的曲邊梯形的面積,而且若m充分大,tj較小時(shí),我們就可用小矩形的高度n(x) fj / tj 來近似取代 f (x),x (tj 1,tj .課本例4 :根據(jù)頻率直方圖可見,該零件的質(zhì)量服從正態(tài)分布,其數(shù)學(xué)期望大約為 209,這可通過 第七章的分布擬合進(jìn)
17、行檢驗(yàn)?!咀?】樣本的頻率直方圖可以形象地描述總體的概率密度的大致形態(tài)。五、經(jīng)驗(yàn)分布函數(shù)對(duì)于總體X的分布函數(shù)F (未知),設(shè)有它的樣本X1,X2, ,Xn,我們同樣可以從樣本出發(fā),找到一個(gè)已知量來近似它,這就是經(jīng)驗(yàn)分布函數(shù)Fn(x).定義 設(shè)總體X的一個(gè)容量為n的樣本的樣本值x1;x2, ,xn可按大小次序排列成X(1) X(2)x(n).k若x(k) x x(k 1),則不大于x的樣本值的頻率為 -.因而函數(shù)n0, 若x x,F(xiàn) n (x),右 x(k) x x(k 1),n1,若 x x(n).與事件X x在n次獨(dú)立重復(fù)試驗(yàn)中的頻率是相同的,我們稱Fn(x)為經(jīng)驗(yàn)分布函數(shù)?!咀?】Fn(x
18、)是一個(gè)階梯狀的函數(shù),在x X(k) , k 1,2, ,n處有躍度為 %的間斷點(diǎn),若有I個(gè)觀察值相同,則Fn(x)在此觀察值處的躍度為眾對(duì)于固定的x , Fn(x)_ 1即表示事件 X x 在n次試驗(yàn)中出現(xiàn)的頻率,即Fn(x)落在(,x)中Xi的個(gè)數(shù)。n用與直方圖分析相同的方法可以論證Fn(x) F (x), n,以概率為1成立。經(jīng)驗(yàn)分布函數(shù)的圖形如圖.對(duì)于經(jīng)驗(yàn)分布函數(shù)Fn(x),格里汶科(Glivenko)在1933年證明了以下的結(jié)果:對(duì)于任實(shí)數(shù)x,當(dāng)n時(shí)Fn(x)以概率1 一致收斂于分布函數(shù)F(x),即P lim sup |Fn(x) F(x)| 0 1.nx因此,對(duì)于任一實(shí)數(shù)x當(dāng)n充分
19、大時(shí),經(jīng)驗(yàn)分布函數(shù)的任一個(gè)觀察值Fn(x)與總體分布函數(shù)F(x)只有微小的差別,從而在實(shí)際中可當(dāng)作 F(x)來使用.課本例5【注4】由圖可以看出,經(jīng)驗(yàn)分布函數(shù)是一個(gè)階梯狀的曲線,我們可以想象,當(dāng)樣本容量增大時(shí),相鄰兩階梯的躍度將降低,階梯的寬度將變窄,這樣階梯狀的折線幾乎能變成一 條曲線,則經(jīng)驗(yàn)分布函數(shù)非常接近總體的分布函數(shù)。 這就是由樣本推斷總體其可行性的最基本的理論依據(jù)分布擬合檢驗(yàn)的理論依據(jù) 六統(tǒng)計(jì)量樣本是總體的代表和反映,但在抽取樣本后,由于樣本只是呈現(xiàn)為一堆“雜亂無章”的 數(shù)據(jù),雖然通過頻率直方圖或經(jīng)驗(yàn)分布函數(shù)能夠大致了解總體的分布曲線,但無從知道總體到底服從什么分布,因此需要對(duì)樣本的
20、觀測(cè)值進(jìn)行加工和提煉課本例6試對(duì)該該工廠的工人周工資的水平和收入懸殊程度做個(gè)大致分析。顯然,如果不進(jìn)行加工,面對(duì)這大堆大小參差不齊的數(shù)據(jù),你很難得出什么印象。 但是只要對(duì)這些數(shù)據(jù)稍事加工,便能作出大致分析:如記各工人的周工資數(shù)為X1,X2,L ,X30,則考慮I 3030iiX 153.5它反映了該廠工人周工資的一般水平; 收入的差別程度可以考慮13030 x)213.5T T(Xi,X2 Xn)為一個(gè) n 元T(Xi,X2L Xn)為一個(gè)統(tǒng)計(jì)量。例:設(shè)總體X服從正態(tài)分布N(,2),其中22未知。X1,X2, ,Xn是從正這說明收入的差別不大, 當(dāng)然這需要一定的參照資料。由此可見對(duì)樣本的加工是
21、十分必要的。對(duì)樣本加工,主要就是構(gòu)造統(tǒng)計(jì)量。定義:設(shè)Xi,X2, ,Xn為來自總體X的一個(gè)樣本,連續(xù)函數(shù),右T ( Xi, X2L X n)中不含任何未知參數(shù),則稱態(tài)總體X中抽取的一個(gè)樣本,則Xi ,2Xi ,均是樣本的統(tǒng)計(jì)量,nXin x2,都不是統(tǒng)計(jì)量i 1【注4】 統(tǒng)計(jì)量常用大寫字母表示,若樣本取得一組具體的數(shù)字,統(tǒng)計(jì)量用小寫字母表示。七、常用的統(tǒng)計(jì)量 一樣本矩-樣本的數(shù)字特征復(fù)習(xí):隨機(jī)變量矩的定義設(shè)X與Y是隨機(jī)變量。若 E(Xk)(k 1,2,)存在,則稱它為 X的k階原點(diǎn)矩.若EX E(X)k(k 1,2,)存在,則稱它為X的k階中心矩.常見的統(tǒng)計(jì)量設(shè)Xi, X2, Xn為總體X的樣
22、本,則下列各量均是統(tǒng)計(jì)量,它們今后要經(jīng)常被用到。(1) XnXi , X稱為樣本均值-一階樣本原點(diǎn)矩。(反映總體均值的信息)(2) S2n 1X)2*(i1Xi22nX )S2稱為樣本方差。(反映總體方差的信息)(3) SS2, S稱為樣本標(biāo)準(zhǔn)差。1 n k(4) AkXi , Ak稱為樣本k階原點(diǎn)矩)。(反映總體k階矩的信息)n i 1(5) Bk1 (Xi X)k , Bk稱為樣本k階中心矩。(反映總體k階中心矩的信息) n i 1如果取得樣本(XX2, ,Xn)的觀測(cè)值(XX2, ,Xn),則由上述的公式可得到相應(yīng)k階矩、樣本k階的樣本矩的觀測(cè)值,分別被稱為樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差
23、、樣本 中心矩。(6)順序統(tǒng)計(jì)量 將樣本中的各分量按由小到大的次序排列成X(1) X(2)X(n),則稱X(1),X(2), ,X(n)為樣本的一組順序統(tǒng)計(jì)量,X(i)稱為樣本的第i個(gè)順序統(tǒng)計(jì)量特別地,稱X(1) min X1, X2, L , Xn稱為最小順序統(tǒng)計(jì)量,也稱為樣本極小值;稱X(n) max X1, X2,L , Xn稱為最大順序統(tǒng)計(jì)量,也稱為樣本極大值稱X(n) X為樣本的極差.X n 1 , n為奇數(shù)()2寸叫)X(”,n為偶數(shù)為樣本中位數(shù)注意,對(duì)于簡(jiǎn)單隨機(jī)樣本X1,X2, ,Xn,各個(gè)觀測(cè)值 X1,X2,X n是獨(dú)立并且與總體X同分布的隨機(jī)變量,然而X(1),X(2) ,X
24、(n)既不獨(dú)立也不同分布.實(shí)際上,最小順序統(tǒng)計(jì)量X(1)的分布就是最小分布,最小順序統(tǒng)計(jì)量X(n)的分布就是最大分布【例7】 設(shè)電子元件的壽命 X服從參數(shù)0.0015的指數(shù)分布,今獨(dú)立測(cè)試 n 6個(gè)元件,記錄它們的失效時(shí)間。求(1)沒有元件在800小時(shí)之間失效的概率;(2)沒有元件最后超過 3000小時(shí)的概率。【解】由題意,F(xiàn)(x)0.0015X1 e ,x 00,other設(shè)Xi,X2,L ,X6分別表示6個(gè)元件的壽命,則 Xi,X2丄,X6獨(dú)立同分布于 X , 由題意知,“沒有元件在800小時(shí)之間失效”等價(jià)于 X(1) minXi,X2,L ,X6 800 ;“沒有元件最后超過 3000小
25、時(shí)”等價(jià)于 X(n) maxX1,X2,L ,X6 3000。所以(1)PX(i) minXi,X2,L ,Xe8006PXj 8001 PX 8006 e7.2i 1(2)PX(n) maxXi,X2丄,Xe30006645 6PXi 3000 F (3000)1 e . i 1我們關(guān)心的問題是如何用以上統(tǒng)計(jì)量的觀測(cè)值去推斷總體的分布,即總體的數(shù)字特征。-、相關(guān)的理論依據(jù)1、樣本的k階原點(diǎn)矩依概率收斂于總體的k階原點(diǎn)矩1 n定理:如果總體X的k階原點(diǎn)矩EXk Uk存在,則有l(wèi)im P| - Xk uk|1n n k 1證明:因?yàn)閄“2Xn相互獨(dú)立且與X同分布,所以因而相互獨(dú)立且與Xk同分布,
26、所以EX;EX: EXk Uk1 n從而由辛欽大數(shù)定律有l(wèi)im P| Xk uk | 1, 即: Ar p uk n n k 12、樣本矩的函數(shù)以概率收斂于總體矩的函數(shù)g(A1,.,AQ p g(5,,uQ以上兩條是:下一章矩估計(jì)法的理論依據(jù)。,即可用樣本觀測(cè)值的 k階原點(diǎn)矩去估計(jì)總體的k階原點(diǎn)矩(特別的,可用樣本(觀測(cè)值)的均值去估計(jì)總體的均值(數(shù)學(xué)期望);參數(shù)估計(jì)的理論依據(jù)。3、當(dāng)n充分大時(shí),可用樣本觀測(cè)值的經(jīng)驗(yàn)分布函數(shù)來近似代替總體分布函數(shù)。第二節(jié)常用統(tǒng)計(jì)分布統(tǒng)計(jì)量是我們對(duì)總體的分布規(guī)律或數(shù)字特征進(jìn)行推斷的基礎(chǔ)。在使用統(tǒng)計(jì)量進(jìn)行推斷時(shí)必須要知道它的分布。在數(shù)理統(tǒng)計(jì)中,統(tǒng)計(jì)量的分布稱為抽樣
27、分布, 因而確定統(tǒng)計(jì)量的分布 是數(shù)理統(tǒng)計(jì)的基本問題之一。下面我們介紹三類重要的分布一分位數(shù)設(shè)隨機(jī)變量X的分布函數(shù)為F(x),對(duì)給定的實(shí)數(shù) (01),若實(shí)數(shù)F滿足不等式PX F ,則稱F為隨機(jī)變量X的分布的水平 若實(shí)數(shù)T滿足不等式的上側(cè)分位數(shù)的雙側(cè)分位數(shù).0.05的上側(cè)分位數(shù)和雙側(cè)分位數(shù)1、定義:X1,X2,.Xn來自總體 X N(u,22),則隨機(jī)變量U C1X1C2X2. CnXn服從正態(tài)分布U N(in2 2CiU, Ci ),i 12X N(,),nxN(0,1)/ _nP| X | T , 則稱T為隨機(jī)變量X的分布的水平 例1設(shè) 0.05,求標(biāo)準(zhǔn)正態(tài)分布的水平 復(fù)習(xí)正態(tài)分布特別地若:X
28、1,X2,.Xn 來自總體 X N(0,1),則 X N(0,丄),"X N(0,1)n2、密度函數(shù)3、圖形4、性質(zhì) 5、上分位數(shù):雙側(cè)分位數(shù)(二) 1 2分布1、定義:設(shè)X1, X2, Xn相互獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布,即 Xi N(0,1),i1,2,n,則隨機(jī)變量2X12 X;XnXi2服從自由度為1n的2分布,記22(n)。這里自由度n是指獨(dú)立變量的個(gè)數(shù)。特別的(1)2、2分布的密度函數(shù)f(y)1n22ny22分布圖6-13、圖形(為:給出n =1,其中函數(shù),其定義為4,10,20 時(shí)的1e xdx2分布的密度函數(shù)的曲線。4、性質(zhì)(1)數(shù)學(xué)期望和方差:2 2E( (n) n,
29、D( (n) 2n2X1 X2 g n2)定義:統(tǒng)計(jì)量2 2(n),則稱P 22(n)2川(如的點(diǎn)2(n)為2(n)所以E(2(n)E(X12 X;.X:)EX1i 12而DXiEX;2 2(EXi )312所以D(2(n)2 2D(X1 X2.X:)nnDX2EXi4ni 1i 12 2(EXi ) 2n(2)可加性若Xj 2(n),X22(n 2),且X!與X2相互獨(dú)立,則該結(jié)論可推廣到n個(gè)獨(dú)立服從卡方分布隨機(jī)變量3、上側(cè)分位數(shù)61)分布的上側(cè)分位數(shù)。(0< <1)用法是:已知和n,求出 2(n);2已知 k中的k和n。查表求對(duì)應(yīng)的上分位點(diǎn) 2(n)的值。查表求上分位點(diǎn)443頁(yè)
30、表中給出了不同的自由度和確定的概率值2 2如:查 0.995)等等。幾點(diǎn)說明:(1) P 22(n)2(n)f(x)dx 中上 分位點(diǎn) 2(n)的意義是:我們需要求的2(n)是當(dāng)隨機(jī)變量在2(n),+取值時(shí),其概率為給定的(2) 表中只列出自由度為1-45的分布值。當(dāng)自由度 n>45時(shí),用以下近似計(jì)算公式:2(n) 2(z. 2n 1)2其中z為標(biāo)準(zhǔn)正態(tài)分布的上分位點(diǎn)1 t女口:0 025 (61) 一(zV2n 1)2 83.9808,(其中查表得 z 1.96,n2例2設(shè)X1, ,X6是來自總體N(0,1)的樣本,又設(shè)Y (X1 X2 X3)2 C(X4 X5 X6)2試求常數(shù)C,使
31、CY服從2分布.(三) t分布(學(xué)生分布)21、定義:設(shè)X N(0,1),Y (n),且X與丫相互獨(dú)立,則稱隨機(jī)變量(2)t (n)為t(n)分布的上側(cè)分位數(shù),則服從自由度為n的t分布,記為t t (n)。2、密度函數(shù):f (t)3、密度函數(shù)圖形特點(diǎn):(1) f (t)是偶函數(shù),圖形關(guān)于縱軸對(duì)稱(2) lim f(x) le與,因此當(dāng)n充分大時(shí),其圖形近似為標(biāo)準(zhǔn)正態(tài)分布的密 n 2度函數(shù)圖形。隨著n的增大,t(n)的密度曲線與N(0,1)的密度曲線越來越接近,一般若般若n 45,就可認(rèn)為它基本與 N (0,1)相差無幾了。分位數(shù)(1)上側(cè)分位數(shù)定義:統(tǒng)計(jì)量t t( n),則稱Pt t (n)*
32、(艸的點(diǎn)t (n)為t(n)分布的上側(cè)分位數(shù)。(0<<1),顯然有ti(n)t (n)查表求.(2)雙側(cè)分位數(shù)P|T| t /2(n)t /2(n)f(x)dxt/2(n)f(X)dx由密度函數(shù)的對(duì)稱性有PT t /2(n)/2;PTt /2(n)/2例;課本 132 頁(yè) t t(8),0.05,2.3060則查表可知,t°.05(8) 1.8595, t0.025 (8)2.30600.05所以有 PT 1.8595 PT 1.8595P| T |【注】(1)當(dāng)n>45時(shí)可用正態(tài)近似t (n) u ,t /2(n) u 促,查正態(tài)分布表可得;PT t (n)1 ;
33、PT t (n); P| T | t (n)2【例3】(四) F分布2分布,則隨機(jī)變量1、定義:設(shè)X ,Y相互獨(dú)立,分別服從自由度為 門仆屯的服從自由度為(ni,n2)的F分布,記為n1n222、密度函數(shù)(y)nin23、圖形4、性質(zhì):如果F F(m,n2).1(1) F (n2, n 1).(2)如果 X t(n),則 X2F(1,n):nin2ni,n2X n2Y n1n1空匕1y2n1 n2215、上分位數(shù)(1)定義:滿足P FF (n,m)(n,m)f(y)dy的點(diǎn) F (n,m)為F(n ,m)分布的上側(cè) 分?jǐn)?shù)(2)性質(zhì):F1 (n,m)F (m,n)證明:事實(shí)上,設(shè) F F(n,m
34、),則右F (m, n),P F F (n,m) P丄 1 F F (n,m)P -1 -F F (n,m)于是Pl1F (n,m)由 分位點(diǎn)的定義,顯然Fi (m,n)成立。F (n,m)(3)查表:例如:課本133課本例4第三節(jié)抽樣分布抽樣分布,實(shí)際上就是隨機(jī)變量函數(shù)的分布,只是強(qiáng)調(diào)這一分布是由統(tǒng)計(jì)量所產(chǎn)生的。統(tǒng)計(jì)量是我們對(duì)總體的分布規(guī)律或數(shù)字特征進(jìn)行推斷的基礎(chǔ)。在使用統(tǒng)計(jì)量進(jìn)行推斷時(shí)必須要知道它的分布。當(dāng)總體的分布已知時(shí), 統(tǒng)計(jì)量的分布是確定的, 能夠求出來,如前面所講 的樣本矩,但是要精確求出統(tǒng)計(jì)量的分布,一般來說是比較困難的。在數(shù)理統(tǒng)計(jì)中,統(tǒng)計(jì)量的分布稱為抽樣分布,因而確定統(tǒng)計(jì)量的分
35、布是數(shù)理統(tǒng)計(jì)的基本問題之一。本節(jié)我們重點(diǎn)討論正態(tài)總體的抽樣分布,即由從正態(tài)總體中抽取的樣本構(gòu)造成的統(tǒng)計(jì)量服從何種分布,這是屬于小樣本統(tǒng)計(jì)范疇。下面我們介紹來自正態(tài)總體的四類重要的分布。一、來自單個(gè)正態(tài)總體的抽樣分布定理1:設(shè)X N(u, 2),Xi,X2,Xn是來自總體X的容量為n的樣本,X為樣本均值,S2為樣本方差,則有以下結(jié)論X u(1)樣本均值::N(0,1)。板書證明/n(2)樣本方差:2(n 1)S2(j:2(n 1)(3)n4 (Xin 1 i 1記住結(jié)論,不用證明,其中s22X)1 n 2呼Xii 14)比較2nX 樣本均值X和樣本方差s2獨(dú)立)2 2(n)1 n2 I (Xi)
36、2i 1板書證明,記住結(jié)論,注意與(2)比較X u=t(n 1) 板書證明 s2例題講解課本例1、設(shè)Xi,X2.,X25為來自總體XN(21,4)的樣本,求:(1 )樣本均值的數(shù)學(xué)期望與方差;(2) P| X 21| 0.24例2、(課后習(xí)題1 )已知離散型總體 X的分布律為x246P1/31/31/3取容量為n=54的樣本,求(1 )樣本均值 X落在4.1到4.4之間的概率;(2)樣本均值 X超過4.5的概率解:由題意ex4, DX8/3,EX4, DXDXnDX 2/981(1)4.1 4 X 44.4 4P4.1 X4.4P 2/92/92/9 (1.8)(0.45)0.9645 0.6736 0.2905X 44.5 4(2) PX4.51 PX4.5 1P-1(2.25)0.01222/92/9例3、例4.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度服裝設(shè)計(jì)行業(yè)學(xué)徒合同協(xié)議
- 二零二五年度社區(qū)小超市全職銷售員服務(wù)合同
- 二零二五年度電子商務(wù)合同糾紛律師專業(yè)代理合同
- 二零二五年度高新技術(shù)產(chǎn)業(yè)園區(qū)土地租賃轉(zhuǎn)讓協(xié)議
- 2025年度足療店員工工資保底與員工績(jī)效獎(jiǎng)金分配協(xié)議
- 二零二五年度數(shù)字媒體廣告創(chuàng)意策劃與執(zhí)行合同
- 2025年度精裝修房屋退房合同范本
- 2025年度鋼結(jié)構(gòu)安裝勞務(wù)分包安全保證書
- 二零二五年度國(guó)際技術(shù)交流框架合作協(xié)議
- 二零二五年度個(gè)體工商戶門面經(jīng)營(yíng)權(quán)轉(zhuǎn)讓合同
- 工業(yè)地產(chǎn)營(yíng)銷推廣方案
- 2024年貴州能源集團(tuán)電力投資有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 華南師范大學(xué)附屬小學(xué)招聘教師筆試真題2022
- 中冶集團(tuán)《工程總承包項(xiàng)目管理手冊(cè)》-
- 鐵路軌道與修理
- 職場(chǎng)角色認(rèn)知與自我定位
- 化工設(shè)備機(jī)械基礎(chǔ)復(fù)習(xí)及答案匯總
- 心肌梗死后心衰病例分享
- 四年級(jí)全冊(cè)《勞動(dòng)》課程知識(shí)點(diǎn)匯總精排
- 人本位醫(yī)療培訓(xùn)課件
- 第3課 中古時(shí)期的歐洲
評(píng)論
0/150
提交評(píng)論