數(shù)理統(tǒng)計(jì)講義.doc_第1頁
數(shù)理統(tǒng)計(jì)講義.doc_第2頁
數(shù)理統(tǒng)計(jì)講義.doc_第3頁
數(shù)理統(tǒng)計(jì)講義.doc_第4頁
數(shù)理統(tǒng)計(jì)講義.doc_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考數(shù)理統(tǒng)計(jì)教 案學(xué)習(xí)資料第一章 統(tǒng)計(jì)量及其抽樣分布第一節(jié)總體與樣本教學(xué)目的:要求學(xué)生理解數(shù)理統(tǒng)計(jì)的兩個基本概念:總體和樣本,以及與這兩個基本概念相關(guān)的統(tǒng)計(jì)基本思想和樣本分布。教學(xué)重點(diǎn): 掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想.教學(xué)難點(diǎn):掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想.一、總體與個體在一個統(tǒng)計(jì)問題中,我們把研究對象的全體稱為總體,構(gòu)成總體的每個成員稱為個體。對多數(shù)實(shí)際問題??傮w中的個體是一些實(shí)在的人或物。比如,我們要研究某大學(xué)的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問題的總體,而每一個學(xué)生即是一個個體。事實(shí)上,每個學(xué)生有許多特征:性別、年齡、身高、體重、民族、籍貫等。而在該問題中,我們關(guān)心的只是該校學(xué)生的身高如何,對其他的特征暫不予以考慮。這樣,每個學(xué)生(個體)所具有的數(shù)量指標(biāo)值身高就是個體,而將所有身高全體看成總體。這樣一來,若拋開實(shí)際背景,總體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的機(jī)會多,有的出現(xiàn)的機(jī)會少,因此用一個概率分布去描述和歸納總體是恰當(dāng)?shù)?。從這個意義上看,總體就是一個分布,而其數(shù)量指標(biāo)就是服從這個分布的隨機(jī)變量。以后說“從總體中抽樣”與“從某分布中抽樣”是同一個意思。例1.考察某廠的產(chǎn)品質(zhì)量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體該廠生產(chǎn)的全部合格品與不合格品由0或1組成的一堆數(shù)。若以p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個二點(diǎn)分布表示:不同的p反映了總體間的差異。例如,兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為:我們可以看到,第一個工廠的產(chǎn)品質(zhì)量優(yōu)于第二個工廠。實(shí)際中,分布中的不合格品率是未知的,如何對之進(jìn)行估計(jì)是統(tǒng)計(jì)學(xué)要研究的問題。二、樣本為了了解總體的分布,我們從總體中隨機(jī)地抽取n個個體,記其指標(biāo)值為x1,x2,xn,則x1,x2,xn稱為總體的一個樣本,n稱為樣本容量,或簡稱樣本量,樣本中的個體稱為樣品。我們首先指出,樣本具有所謂的二重性:一方面,由于樣本是從總體中隨機(jī)抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī)變量,用大寫字母X1,X2,Xn表示;另一方面,樣本在抽取以后經(jīng)觀測就有確定的觀測值,因此,樣本又是一組數(shù)值。此時用小寫字母x1,x2,xn表示是恰當(dāng)?shù)?。簡單起見,無論是樣本還是其觀測值,本書中樣本一般均用x1,x2,xn表示,讀者應(yīng)能從上下文中加以區(qū)別。例2.啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640g ,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測定其凈含量,得到如下結(jié)果: 641635640637642638645643639640這是一個容量為10的樣本的觀測值。對應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。從總體中抽取樣本時,為使樣本具有代表性,抽樣必須是隨機(jī)抽樣。通??梢杂秒S機(jī)數(shù)表來實(shí)現(xiàn)隨機(jī)抽樣。還要求抽樣必須是獨(dú)立的,即每次的結(jié)果互不影響。在概率論中,在有限總體(只有有限個個體的總體)中進(jìn)行有放回抽樣,是獨(dú)立的隨機(jī)抽樣;然而,若為不放回抽樣,則是不獨(dú)立的抽樣。但 當(dāng)總體容量N很大但樣本容量n較小時,不放回抽樣可以近似地看做放回抽樣,即可近似看做獨(dú)立隨機(jī)抽樣。下面,我們假定抽樣方式總滿足獨(dú)立隨機(jī)抽樣的條件。從總體中抽取樣本可以有不同的抽法,為了能由樣本對總體做出較可靠的推斷,就希望樣本能很好地代表總體。這就需要對抽樣方法提出一些要求,最常用的 “簡單隨機(jī)抽樣”有如下兩個要求:(1)樣本具有隨機(jī)性,即要求總體中每一個個體都有同等機(jī)會被選入樣本,這便意味著每一樣品xi與總體X有相同的分布。(2)樣本要有獨(dú)立性,即要求樣本中每一樣品的取值不影響其他樣品的取值,這意味著x1,x2,xn相互獨(dú)立。用簡單隨機(jī)抽樣方法得到的樣本稱為簡單隨機(jī)樣本,也簡稱樣本。除非特別指明,本書中的樣本皆為簡單隨機(jī)樣本。于是,樣本x1,x2,xn可以看成是相互獨(dú)立的具有同一分布的隨機(jī)變量,其共同分布即為總體分布。 設(shè)總體X具有分布函數(shù)F(x), x1,x2,xn為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為:若總體具有密度函數(shù)f(x),則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機(jī)變量,則樣本的(聯(lián)合)概率函數(shù)為顯然,通常說的樣本分布是指多維隨機(jī)變量(x1,x2,xn)的聯(lián)合分布。例3.為估計(jì)一物件的重量,用一架天平重復(fù)測量n次,得樣本x1,x2,xn,由于是獨(dú)立重復(fù)測量,x1,x2,xn是簡單隨機(jī)樣本??傮w的分布即x1的分布(x1,x2,xn分布相同)。由于稱量誤差是均值(期望)為零的正態(tài)變量,所以x1可認(rèn)為服從正態(tài)分布N(,2)(X1等于物件重量)加上稱量誤差,即x1的概率密度為這樣,樣本分布密度為。 例4.設(shè)某種電燈泡的壽命X服從指數(shù)分布E(),其概率密度為:則來自這一總體的簡單隨機(jī)樣本x1,x2,xn的樣本分布密度為例5.考慮電話交換臺一小時內(nèi)的呼喚次數(shù)X。求來自這一總體的簡單隨機(jī)樣本x1,x2,xn的樣本分布。解由概率論知識,X服從泊松分布P(),其概率函數(shù),(其中x是非負(fù)整數(shù)0,1,2,k,中的一個)。從而,簡單隨機(jī)樣本x1,x2,xn的樣本分布為:第二節(jié) 統(tǒng)計(jì)量及其分布教學(xué)目的:要求學(xué)生理解數(shù)理統(tǒng)計(jì)的基本概念:統(tǒng)計(jì)量,熟練掌握樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的計(jì)算公式,掌握次序統(tǒng)計(jì)量及其抽樣分布。能用R軟件來計(jì)算這些常用統(tǒng)計(jì)量,能用R軟件來產(chǎn)生分布的隨機(jī)數(shù)以進(jìn)行隨機(jī)模擬。教學(xué)重點(diǎn):樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的求法;次序統(tǒng)計(jì)量的抽樣分布。教學(xué)難點(diǎn):次序統(tǒng)計(jì)量的抽樣分布。一、統(tǒng)計(jì)量與抽樣分布樣本來自總體,樣本的觀測值中含有總體各方面的信息,但這些信息較為分散,有時顯得雜亂無章。為將這些分散在樣本中有關(guān)總體的信息集中起來以反映總體的各種特征,需要對樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。 定義1.設(shè)x1,x2,xn為取自某總體的樣本,若樣本函數(shù)TT(x1,x2,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。按照這一定義,若x1,x2,xn為樣本,則,都是統(tǒng)計(jì)量,而當(dāng),2未知時, 等均不是統(tǒng)計(jì)量。二、樣本均值及其抽樣分布 定義2.設(shè)x1,x2,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即。例6.某單位收集到20名青年人某月的娛樂支出費(fèi)用數(shù)據(jù):7984 8488 92 93 94 97 98 99100 101101102102 108110113118125 則該月這20名青年的平均娛樂支出為對于樣本均值的抽樣分布,我們有下面的定理。 定理1.設(shè)x1,x2,xn是來自某個總體X的樣本, 為樣本均值。(1)若總體分布為N(,2),則的精確分布為;(2)若總體X分布未知(或不是正態(tài)分布),且E(X)=,D(X)=2,則當(dāng)樣本容量n較大時,的漸近分布為,這里的漸近分布是指n較大時的近似分布。證明(1)由于為獨(dú)立正態(tài)變量線性組合,故仍服從正態(tài)分布。另外, 故 (2)易知為獨(dú)立、同分布的隨機(jī)變量之和,且 。由中心極限定理, ,其中(x)為標(biāo)準(zhǔn)正態(tài)分布。這表明n較大時的漸近分布為。三、樣本方差與樣本標(biāo)準(zhǔn)差 定義3.設(shè)x1,x2,xn為取自某總體的樣本,則它關(guān)于樣本均值的平均偏差平方和 稱為樣本方差,其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對樣本方差而言,樣本標(biāo)準(zhǔn)差通常更有實(shí)際意義,因?yàn)樗c樣本均值具有相同的度量單位。在上面定義中,n為樣本容量,稱為偏差平方和,它有3個不同的表達(dá)式:事實(shí)上,偏差平方和的這3個表達(dá)式都可用來計(jì)算樣本方差。例7.在例6中,我們已經(jīng)算得,其樣本方差與樣本標(biāo)準(zhǔn)差為,。方法二 s=11.57 31通常用第二種方法計(jì)算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望,它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。 定理2.設(shè)總體X具有二階矩,即E(x)=,D(X)=2+x1,x2,xn為從該總體得到的樣本,和s2分別是樣本均值和樣本方差,則 此定理表明,樣本均值的均值與總體均值相同,而樣本均值的方差是總體方差的。證明由于(1)(2)且有: ,而 ,于是 ,兩邊各除以n-1,即得證。值得讀者注意的是:本定理的結(jié)論與總體服從什么分布無關(guān)。四、樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計(jì)量。 定義4.設(shè)x1,x2,xn是樣本,則統(tǒng)計(jì)量稱為樣本k階原點(diǎn)矩,特別地,樣本一階原點(diǎn)矩就是樣本均值。統(tǒng)計(jì)量 稱為樣本k階中心矩。常見的是k=2的場合,此時稱為二階樣本中心矩。本書中我們將其記為sn2,以區(qū)別樣本方差S2。 五、極大順序統(tǒng)計(jì)量和極小順序統(tǒng)計(jì)量 定義5.設(shè)總體X具有分布函數(shù)F(x),分布密度f(x), x1,x2,xn為其樣本,我們分別稱X(1)=minx1,x2,xn,x(n)=maxx1,x2,xn為極小順序統(tǒng)計(jì)量和極大順序統(tǒng)計(jì)量。定理3.若x(1),x(n)分別為極小、極大順序統(tǒng)計(jì)量,則(1)x(1)的分布函數(shù)F1(x)=1-(1-F(x)n,x(1)的分布密度f1(x)=n-(1-F(x)n-1f(x) (2)x(n)的分布函數(shù)Fn(x)=F(x)n,x(n)的分布密度fn(x)=nF(x)n-1f(x) 證明 先求出x(1)及x(n)的分布函數(shù)F1(x)及Fn(x):,分別對F1(x),F(xiàn)n(x)求導(dǎo)即得六、正態(tài)總體的抽樣分布有很多統(tǒng)計(jì)推斷是基于正態(tài)總體的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個著名統(tǒng)計(jì)量(其抽樣分布分別為x2分布,t分布和F分布)在實(shí)踐中有著廣泛的應(yīng)用。這是因?yàn)檫@三個統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。1. x2分布(卡方分布) 定義6.設(shè)X1,X2,Xn獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則x2=x12+xn2的分布稱為自由度為n的x2分布,記為x2x2(n)。x2(n)分布的密度函數(shù)見圖1-4當(dāng)隨機(jī)變量x2 x2(n)時,對給定的(0x2(n)= 的x2(n)是自由度為n的開方分布的分位數(shù)。分位數(shù)x2(n)可以從附表4中查到。例如n=10,=0.05,那么從附表4中查得x2(10)=18.307p(x)2x20.05(10)=px218.307=0.05注:請讀者注意x2x2(n)時,n是自由度,不是容量。2.F分布定義7.設(shè)x1x2(m),x2x2(n)X1與X2獨(dú)立,則稱的分布是自由度為m與n的F分布,記為FF(m,n),其中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個只取非負(fù)值的偏態(tài)分布(見圖6-5)。當(dāng)隨機(jī)變量FF(m,n)時,對給定的(0F(m,n)=的數(shù)F(m,n)是自由度為m與n的F分布的分位數(shù)。當(dāng)FF(m,n)時,有下面性質(zhì)(不證),這說明對小的,分位為F(m,n)可以從附表5中查到,而分位數(shù)F1-(m,n)則可通過上式得到。例8.若取m=10,則n=5,=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用(6.3.8 )式可得到3.t分布 定義8.設(shè)隨機(jī)變量與X1與X2獨(dú)立且X1N(0,1),X2X2(n),則稱的分布為自由度為n的t的分布,記為tt(n).t分布密度函數(shù)的圖像是一個關(guān)于縱軸對稱的分布(如下圖),與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些,尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。t分布與N(0,1)的密度函數(shù)當(dāng)隨機(jī)變量tt(n)時,稱滿足Ptt(n)=的t(n)是自由度為n的t分布的分位數(shù),分位數(shù)t(n)可以從附表3中查到,例如當(dāng)n=10, =0.05時,從附表3上查得t0.05(10)=1.8125由于t分布的密度函數(shù)關(guān)于0對稱,故其分位數(shù)有如下關(guān)系:t1-(n)=- t(n)例如,t0.95(10)=-t0.05(10)=-1.8125當(dāng)n很大時,(n30),t分布可以用N(0,1)近似P(t-t)=1-,p(tt1-)=1-,t1-=-t4.一些重要結(jié)論來自一般正態(tài)總體的樣本均值 和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布,下面我們加以介紹。 定理4.設(shè)X1,X2,Xn是來自正態(tài)總體N(,2)的樣本,其樣本均值和樣本方差分別為:則有(1)與s2相互獨(dú)立;(2)特別,若(不證)推論:設(shè),21=22=2并記則(不證)本章小結(jié)本章的基本要求:(一)知道總體、樣本、簡單樣本和統(tǒng)計(jì)量的概念(二)知道統(tǒng)計(jì)量和s2的下列性質(zhì):E(s2)=2(三)若x的分布函數(shù)為F(x),分布函數(shù)為f(x),則樣本(x1,x2,xn)的聯(lián)合分布函數(shù)為F(x1)F(x2)F(xn)樣本(x1,x2,xn)的聯(lián)合分布密度為f(x1) f(x2)f(xn),樣本(x1,x2,xn)的概率函數(shù),p(x1,x 2 ,xn)=p(X=x1)p(X=x2)p(X=xn)因而順序統(tǒng)計(jì)量x(1),x (n)中X(1)的分布函數(shù)為1-(1-F(x)nX(n)的分布函數(shù)為F(x)n(四)掌握正態(tài)總體的抽樣分布若XN(,2)則有(1)(2)(3)(4)若=當(dāng)時,。(五)知道樣本原點(diǎn)矩與樣本中心矩的概念第二章 參數(shù)估計(jì)從本章開始我們介紹統(tǒng)計(jì)推斷,所謂統(tǒng)計(jì)推斷就是由樣本推斷總體,統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分,它們是統(tǒng)計(jì)推斷最基本而且是互相有聯(lián)系的兩部分,本章介紹統(tǒng)計(jì)推斷的第一部分參數(shù)估計(jì)。參數(shù)通常指總體分布中的特征值和和各種分布中的參數(shù),例如二點(diǎn)分布B(1,P)中的p,泊松分布P()中的,正態(tài)分布N(、)的、等,習(xí)慣用表示參數(shù),通常參數(shù)是未知的。參數(shù)估計(jì)的形式有兩類,設(shè)x1,x2,xn是來自總體的樣本。我們用一個統(tǒng)計(jì)量的取值作為參數(shù)的估計(jì)值,則稱為的點(diǎn)估計(jì)(量),就是參數(shù)的點(diǎn)估計(jì),如果對參數(shù)的估計(jì)需要對估計(jì)作出可靠性判斷,就需要對這一可靠性給出可靠性區(qū)間或置信區(qū)間,叫區(qū)間估計(jì)。下面首先介紹點(diǎn)估計(jì) 第一節(jié) 點(diǎn)估計(jì)教學(xué)目的:要求學(xué)生了解參數(shù)點(diǎn)估計(jì)的基本思想,理解參數(shù)點(diǎn)估計(jì)的基本概念,熟練運(yùn)用替換原理、矩法估計(jì)和最大似然估計(jì)對參數(shù)進(jìn)行估計(jì)。教學(xué)重點(diǎn):矩法估計(jì)、最大似然估計(jì).教學(xué)難點(diǎn):運(yùn)用矩法估計(jì)、最大似然估計(jì)對參數(shù)進(jìn)行估計(jì).直接用來估計(jì)未知參數(shù)的統(tǒng)計(jì)量稱為參數(shù)的點(diǎn)估計(jì)量,簡稱為點(diǎn)估計(jì),人們可以運(yùn)用各種方法構(gòu)造出很多的估計(jì),本節(jié)介紹兩種最常用的點(diǎn)估計(jì)方法。它們是:矩法和極大似然法。一、替換原理和矩法估計(jì)用下面公式表示的方法叫矩法例1.對某型號的20輛汽車記錄每5L汽油的行駛里程(km),觀測數(shù)據(jù)如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個容量為20的樣本觀測值,對應(yīng)總體是該型號汽車每5L汽油的行駛里程,其分布形式尚不清楚,可用矩法估計(jì)其均值,方差,本例中經(jīng)計(jì)算有28.695,0.9185由此給出總體均值,方差的估計(jì)分別為即矩法估計(jì)的統(tǒng)計(jì)思想(替換原理)十分簡單明確,眾人都能接受,使用場合甚廣。例2.設(shè)總體為指數(shù)分布,其密度函數(shù)為x1,xn是樣本,由于,亦即,故的矩法估計(jì)為例3.設(shè)x1,xn是來自服從區(qū)間(0,)上的均勻分布的樣本,0為未知參數(shù)。求的矩估計(jì)。解:易知總體X的均值為由矩法的矩估計(jì)為比如,若樣本值為0.1,0.7,0.2,1,1.9,1.3,1.8,則的估計(jì)值2(0.1+0.7+0.2+1+1.9+1.3+1.8)2例4.在一批產(chǎn)品取樣n件,發(fā)現(xiàn)其中有m件次品,試用此樣本求該批產(chǎn)品的次品率p的矩估計(jì)。解:因?yàn)槔绯闃涌倲?shù)n=100,其中次品m=5.則例5.電話總機(jī)在一分鐘間隔內(nèi)接到呼喚次數(shù)XP()。觀察一分種接到呼喚次數(shù)共觀察40次,結(jié)果如下接到呼喚次數(shù)012345觀察次數(shù)51012832求未知參數(shù)的矩估計(jì)解:(1)XP()EX=由矩法(2)計(jì)算(05+110+212+38+43+52)22二、極大似然估計(jì)為了敘述極大似然原理的直觀想法,先看例6例6.設(shè)有外表完全相同的兩個箱子,甲箱中有99個白球和1個黑球,乙箱中有99個黑球和1個白球,現(xiàn)隨機(jī)地抽取一箱,并從中隨機(jī)抽取一球,結(jié)果取得白球,問這球是從哪一個箱子中取出的? 解:不管是哪一個箱子,從箱子中任取一球都有兩個可能的結(jié)果:A表示取出白球,B表示取出黑球,如果我們?nèi)〕龅氖羌紫?,則A發(fā)生的概率為0.99,而如果取出的是乙箱,則A發(fā)生的概率為0.01,現(xiàn)在一次試驗(yàn)中結(jié)果A發(fā)生了,人們的第一印象就是:“此白球(A)最像從甲箱取出的”,或者是說,應(yīng)該認(rèn)為試驗(yàn)條件對事件A出現(xiàn)有利,從而可以推斷這球是從甲箱中取出的,這個推斷很符合人們的經(jīng)驗(yàn)事實(shí),這里“最像”就是“極大似然”之意。本例中假設(shè)的數(shù)據(jù)很極端,一般地,我們可以這樣設(shè)想,在兩個箱子中各有100個球,甲箱中白球的比例是P1,乙箱中白球的比例是P2,已知P1 P2,現(xiàn)隨機(jī)地抽取一個箱子并從中抽取一球,假定取到的是白球,如果我們要在兩個箱子中進(jìn)行選擇,由于甲箱中白球的比例高于乙箱,根據(jù)極大似然原理,我們應(yīng)該推斷該球來自甲箱。下面分別給出離散型隨機(jī)變量和連續(xù)型隨機(jī)變量的極大似然估計(jì)求未知參數(shù) 的估計(jì) 的步驟(一) 離散型隨機(jī)變量第一步,從總體X取出樣本x1,x2,xn第二步,構(gòu)造似然函數(shù) L(x1,x2,xn,)P(Xx1)P(Xx2)P(Xxn)第三步,計(jì)算ln L(x1,x2,xn,)并化簡第四步,當(dāng)時ln L(x1,x2,xn,)取最大值則取常用方法是微積分求最值的方法。(二)連續(xù)型隨機(jī)變量若Xf(x,)第一步從總體X取出樣本x1,x2,xn第二步構(gòu)造似然函數(shù)L(x1,x2,xn,)f(x1,)f(x2,)f(xn,)第三步計(jì)算ln L(x1,x2,xn,)并化簡第四步當(dāng)時ln L(x1,x2,xn,)取最大值則取常用方法是微積分求最值的方法例7.設(shè)總體XB(1,P)即設(shè)P(A),從總體X中抽樣x1,x2,xn,問最大似然法求解:當(dāng)XB(1,P)時,應(yīng)有P(X1)P,P(X0)=1P第一步構(gòu)造似然函數(shù)L(x1,x2,xn,P)P(Xx1)P(Xx2)P(Xxn)第二步計(jì)算ln L(x1,x2,xn,P)并化簡(x1+xn)lnp+(n-(x1+xn)ln(1-p)第三步求駐點(diǎn)為化簡為(x1+xn)(1-p)=pn-(x1+xn)(x1+xn)=np駐點(diǎn)因?yàn)橹挥幸粋€駐點(diǎn)是最大點(diǎn)取例抽樣n次A發(fā)生m次,則在x1,x2xn中有m個1,其余為0,例8.(1)設(shè)總體X服從泊松分布p(),求的極大似然估計(jì);(2)設(shè)總體X服從指數(shù)分布E(),求的極大似然估計(jì)解:(1)XP()p(X=k)=從總體X中取樣本x1 ,x2xn。駐點(diǎn)解得的極大似然估計(jì)易知的矩估計(jì)亦為(2)XE()第一步,從中取樣本值x1 ,x2xn,應(yīng)有x10,x20xn0似然函數(shù)L(x1 ,x2xn)f(x1)f(x2)f(xn)=第二步計(jì)算第三步求駐點(diǎn)是最大點(diǎn)取在例2中用矩法估計(jì)也是同樣結(jié)果。例9.設(shè),即從中取樣x1 ,x2xn,試用最大似然法求解:因?yàn)闃颖緓1 ,x2xn已經(jīng)取出。所以應(yīng)有0x1,0x2,0xn所以的取值范圍為第一步構(gòu)造似然函數(shù)0,很明顯,似然函數(shù)是的單調(diào)減函數(shù),因此當(dāng)最小時,似然函數(shù) 最大,由條件知的最小值為所以時最大。取這一結(jié)果與用矩法估計(jì)(例73)的結(jié)果不同。例10.若,從中抽樣x1,x2xn,試用最大似然估計(jì)法求:,解:X的似然函數(shù)將分別關(guān)于兩個分量求偏導(dǎo)并令其為0即得到似然方程組,(1),(2)解此方程組,由(1)可得駐點(diǎn),的極大似然估計(jì)為,將之代入(2)給出的極大似然估計(jì)第二節(jié) 點(diǎn)估計(jì)的評價(jià)標(biāo)準(zhǔn)教學(xué)目的:要求學(xué)生了解相合性、無偏性、有效性和均方誤差的基本思想,理解相合性、無偏性、有效性和均方誤差的基本概念,熟練掌握相合性、無偏性和有效性的判別方法。教學(xué)重點(diǎn):相合估計(jì)、無偏估計(jì)和有效性。教學(xué)難點(diǎn):如何確定相合估計(jì)、無偏估計(jì)和有效性。我們已經(jīng)看到,點(diǎn)估計(jì)有各種不同的求法,為了在不同的點(diǎn)估計(jì)間進(jìn)行比較選擇,就必須對各種點(diǎn)估計(jì)的好壞給出評價(jià)標(biāo)準(zhǔn)。數(shù)理統(tǒng)計(jì)中給出了眾多的估計(jì)量評價(jià)標(biāo)準(zhǔn),對同一估計(jì)量使用不同的評價(jià)標(biāo)準(zhǔn)可能會得到完全不同的結(jié)論,因此,在評價(jià)某一個估計(jì)好壞時首先要說明是在哪一個標(biāo)準(zhǔn)下,否則所論好壞毫無意義。但在諸多標(biāo)準(zhǔn)中,有一個基本標(biāo)準(zhǔn)是所有的估計(jì)都應(yīng)該滿足的,它是衡量一個估計(jì)是否可行的必要條件,這就是估計(jì)的相合性,我們就從相合性開始介紹。一、相合性我們知道,點(diǎn)估計(jì)是一個統(tǒng)計(jì)量,因此它是一個隨機(jī)變量,在樣本量一定的條件下,我們不可能要求完全等同于參數(shù)的真實(shí)取值,但如果我們有足夠的觀測值,根據(jù)格里紋科定理,隨著樣本量的不斷增大,經(jīng)驗(yàn)分布函數(shù)逼近真實(shí)分布函數(shù),因此完全可以要求估計(jì)量隨著樣本量的不斷增大而逼近參數(shù)真值,這就是相合性,嚴(yán)格定義如下, 定義2.設(shè)為未知參數(shù),是的一個估計(jì)量,n是樣本容量, 若對任何一個,有則稱為參數(shù)的相合估計(jì)相合性被認(rèn)為是對估計(jì)的一個最基本要求,如果一個估計(jì)量,在樣本量不斷增大時,它都不能把被估參數(shù)估計(jì)到任意指定的精度,那么這個估計(jì)是很值得懷疑的,通常,不滿足相合性要求的估計(jì)一般不予考慮,證明估計(jì)的相合性一般可應(yīng)用大數(shù)定律或直接由定義來證。例11.用大數(shù)定律證明是的相合估計(jì)證:由切比雪夫大數(shù)定律即是的相合估計(jì)為了避免用定義判斷相合性的困難,下面介紹一個判斷相合性很有用的定理: 定量:設(shè)是的估計(jì)量若(1)(2)則是的相合估計(jì)。例12.證明是的相合估計(jì)證:在前面我們已經(jīng)證明(1)(2)是的相合估計(jì)二、無偏性相合性是大樣本下估計(jì)量的評價(jià)標(biāo)準(zhǔn),對小樣本而言,需要一些其他的評價(jià)標(biāo)準(zhǔn),無偏性便是一個常用的評價(jià)標(biāo)準(zhǔn)。 設(shè)是的一個估計(jì),的參數(shù)空間為,若對任意的,有 則稱是的無偏估計(jì),否則稱為有偏估計(jì)。例13.對任一總體而言,樣本均值是總體均值的無偏估計(jì),當(dāng)總體k階矩存在時,樣本k階原點(diǎn)矩是總體k階原點(diǎn)矩的無偏估計(jì),但對k階中心矩則不一樣,例如,二階樣本中心矩就不是總體方差的無偏估計(jì),事實(shí)上,對此,有如下兩點(diǎn)說明 (1)當(dāng)樣本量趨于無究時,有,我們稱為的漸近無偏估計(jì),這表明 當(dāng)樣本量較大時,可近似看作的無偏估計(jì) (2)若對作如下修正: 則是總體方差的無偏估計(jì),這種簡章的修正方法在一些場合常被采用,它比更常用,這是因?yàn)樵趎2時,因此用估計(jì)有偏小的傾向,特別在小樣本場合要使用估計(jì)。 無偏性不具有不變性。即若是的無偏估計(jì),一般而言,g()不是g()的無 偏估計(jì),除非g()是的線性函數(shù),例如,是的無偏估計(jì),但s不是的無偏估計(jì)例14.證明是的無偏估計(jì)。其中是X的樣本證:特別情形是的無偏估計(jì)例15.證明是的無偏估計(jì)證三、有效性參數(shù)的無偏估計(jì)可以有很多,那么如何在無偏估計(jì)中進(jìn)行選擇?直觀的想法是希望該估計(jì)圍繞參數(shù)真值的波動越小越好,波動的大小可以用方差來衡量,因此人們常用無偏估計(jì)的方差的大小作為度量無偏估計(jì)優(yōu)劣的標(biāo)準(zhǔn),這就是有效性。 定義4.設(shè),是的兩個無偏估計(jì),如果對任意的有則稱比 有效例16.設(shè)x1,xn是取自某總體的樣本,記總體均值為,總體方差為,則都是的無偏估計(jì),但顯然,只要n1,比有效,這表明,用全部數(shù)據(jù)的平均估計(jì)總體均值要比只使用部分?jǐn)?shù)據(jù)更有效。例17.比較與誰有效解:(1)與都是的無偏估計(jì)(2) 比有效例18.設(shè),從總體中取樣證明是的無偏估計(jì)和相合估計(jì)解:(1)是的無偏估計(jì)是的相合估計(jì)第三節(jié) 參數(shù)的區(qū)間估計(jì)教學(xué)目的:要求學(xué)生了解置信區(qū)間的基本思想,理解置信區(qū)間的基本概念,掌握求置信區(qū)間的樞軸量法方法,熟練掌握正態(tài)總體參數(shù)置信區(qū)間的計(jì)算公式和大樣本置信區(qū)間。能用R軟件計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)重點(diǎn):置信區(qū)間的思想、概念和樞軸量法方法,計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)難點(diǎn):計(jì)算單個正態(tài)總體的置信區(qū)間以及兩個正態(tài)總體下的置信區(qū)間。用點(diǎn)估計(jì)去估計(jì)總體的參數(shù),即使是無偏且有效的,也會由于樣本的隨機(jī)性,使得從一個樣本x1,x2,x3,xn算得的估計(jì)值不一定是被估計(jì)的參數(shù)的真實(shí)值,而且估計(jì)值的可靠性并不知道,這是一個重大的問題,因此,必須解決根據(jù)估計(jì)量的分布,在一定可靠性的程度下指出被估計(jì)的總體參數(shù)的取值范圍,這正是本節(jié)要介紹的參數(shù)的區(qū)間估計(jì)問題。一、置信區(qū)間概念為了引入置信區(qū)間的概念,請看下面的引例。引例設(shè)某種絕緣子抗扭強(qiáng)度X服從正態(tài)分布 ,其中 未知, 已知(=45公斤米),試對總體均值作區(qū)間估計(jì)。對于區(qū)間估計(jì),要選擇一個合適的統(tǒng)計(jì)量,若在該總體取一個容量為n的樣本x1,x2,x3,xn,樣本均值為的點(diǎn)估計(jì)即,然而我們要給出的一個區(qū)間估計(jì),以體現(xiàn)出估計(jì)的誤差,我們知道。在區(qū)間估計(jì)問題中,要選取一個合適的估計(jì)函數(shù)。這時,可取,它是的標(biāo)準(zhǔn)化隨機(jī)變量,且具備下面兩個特點(diǎn):(1)u中包含所要估計(jì)的未知參數(shù)(其中已知);(2)u的分布為 N(0,1),它與未知參數(shù)無關(guān)。 因?yàn)閡N(0,1),因而有,根據(jù)uN(0,1)的概率密度的對稱性(見下圖)可得。當(dāng)=0.05時,1-=0.095,=1.96,將不等式轉(zhuǎn)化為,亦即,因此有。當(dāng)=0.05時,。 。說明未知參數(shù)包含在區(qū)間中的概率是95%,這里,不僅給出了的區(qū)間估計(jì),還給出了這一區(qū)間估計(jì)的置信度(或置信概率)。事實(shí)上,當(dāng)置信度為1-時,區(qū)間估計(jì)為在引例中,若=160,=40,n=16。則有 說明該絕緣子抗扭強(qiáng)度X的期望在(140.4,179.6)內(nèi)的可靠度為0.95。下面,引出置信區(qū)間的概念。定義5.設(shè)為總體的未知參數(shù)是由樣本定出的兩個統(tǒng)計(jì)量,若對于給定的概率1-(01),有,則隨機(jī)區(qū)間稱為參數(shù)的置信度為1-的置信區(qū)間,稱為置信下限,稱為置信上限。置信區(qū)間的意義可作如下解釋:包含在隨機(jī)區(qū)間中的概率為100(1-)%;或者說,隨機(jī)區(qū)間以100(1-)%的概率包含。粗略地說,當(dāng)=0.05時,在100次的抽樣中,大致有95次包含在中,而其余5次可能不在該區(qū)間中。常取的數(shù)值為0.05,0.01,此時置信度1-分別為0.95,0.99。置信區(qū)間的長度可視為區(qū)間估計(jì)的精度,下面分析置信度與精度的關(guān)系。(1)當(dāng)置信度1-增大,又樣本容量n固定時,置信區(qū)間長度增大,即區(qū)間估計(jì)精度減低;當(dāng)置信度1-減小,又樣本容量n固定,置信區(qū)間長度減小,即區(qū)間估計(jì)精度提高。(2)設(shè)置信度1-固定。當(dāng)樣本容量n增大時,置信區(qū)間減小(如引例中,置信區(qū)間長度為),區(qū)間估計(jì)精度提高。二、單個正態(tài)總體參數(shù)的置信區(qū)間正態(tài)總體是最常見的分布,本小節(jié)中我們討論它的兩個參數(shù)的置信區(qū)間。1.已知時的置信區(qū)間設(shè)總體X服從正態(tài)分布,其中已知,而未知,求的置信度1-的置信區(qū)間。這一問題實(shí)際上已在引例中的討論中解決,得到。所以的置信度1-的置信區(qū)間為。當(dāng)=0.05,=1.96;當(dāng)=0.01,=2.576。 例1.某車間生產(chǎn)滾珠,從長期實(shí)踐知道,滾珠直徑X服從正態(tài)分布。從某天產(chǎn)品里隨機(jī)抽取6個,測得直徑為(單位:毫米):14.6,15.1,14.9,14.8,15.2,15.1。若總體方差=0.06,求總體均值的置信區(qū)間(=0.05,=0.01)。解,=0.05時,置信度為95%的置信區(qū)間為=0.01時,置信度為99%的置信區(qū)間為。從此例知,在樣本容量n固定時,當(dāng)置信度1-較大時,置信區(qū)間長度較大;當(dāng)置信度1-較小時,置信區(qū)間較小。例2.用天平稱量某物體的質(zhì)量9次,得平均值為=15.4(g),已知天平稱量結(jié)果為正態(tài)分布,其標(biāo)準(zhǔn)差為0.1g,試求該物體質(zhì)量的0.95置信區(qū)間。解 此處1-=0.95,=0.05,查表知u0.025=1.96, 于是該物體質(zhì)量的0.95的置信區(qū)間為,從而該物體質(zhì)量的0.95置信區(qū)間為15.3347,15.4653。例3.設(shè)總體為正態(tài)分布,為得到的置信水平為0.95的置信區(qū)間長度不超過1.2,樣本容量應(yīng)為多大? 解 由題設(shè)條件知的0.95置信區(qū)間為,其區(qū)間長度為,它僅依賴于樣本容量n而與樣本具體取值無關(guān)?,F(xiàn)要求,即有。現(xiàn)1-=0.95,故=1.96,從而。即樣本容量至少為11時才能使得的置信水平為0.95的置信區(qū)間長度不超過1.2。2.未知時的置信區(qū)間這時可用t統(tǒng)計(jì)量,因?yàn)?,完全類似于上一小?jié)由于t(n-1)分布的概率密度f(x)的對稱性有(見下圖)解得 其中是的無偏估計(jì)。例4.假設(shè)輪胎的壽命服從正態(tài)分布。為估計(jì)某種輪胎的平均壽命,現(xiàn)隨機(jī)地抽12只輪胎試用,測得它們的壽命(單位:萬千米)如下:4.684.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70試求平均壽命的0.95置信區(qū)間。解 此處正態(tài)總體標(biāo)準(zhǔn)差未知,可使用t分布求均值的置信區(qū)間。本例中經(jīng)計(jì)算有=4.7092,s2=0.0615。取=0.05,查表知t0.025(11)=2.2010,于是平均壽命的0.95置信區(qū)間為(單位:萬千米)。3.的置信區(qū)間此時雖然也可以就是否已知分兩種情況討論的置信區(qū)間,但在實(shí)際問題中未知時已知的情況是極為罕見的,所以我們只在未知的條件下討論的置信區(qū)間。設(shè)x1,x2,x3,xn為來自總體X的樣本,樣本方差s2可作為的點(diǎn)估計(jì)。由,中包含未知參數(shù),又它的分布與無關(guān),以作為估計(jì)函數(shù),可用于的區(qū)間估計(jì)。由于分布是偏態(tài)分布,尋找平均長度最短區(qū)間很難實(shí)現(xiàn),一般都改為尋找等尾置信區(qū)間:把平分為兩部分,在分布兩側(cè)各截面積為的部分,即采用的的兩個分位數(shù)它們滿足。(見下圖)將上式開方即可得標(biāo)準(zhǔn)差的置信區(qū)間。例5.某廠生產(chǎn)的零件質(zhì)量X服從正態(tài)分布?,F(xiàn)從該廠生產(chǎn)的零件中抽取9個,測得其質(zhì)量為(單位:g)45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6試求總體標(biāo)準(zhǔn)差的0.95置信區(qū)間。解 由數(shù)據(jù)可算得s2=0.0325,(n-1)s2=80.0325=0.26,這里=0.95,查表知代入公式可得的0.95置信區(qū)間為。從而的0.95置信區(qū)間為0.1218,0.3454。以上關(guān)于正態(tài)總體參數(shù)的區(qū)間估計(jì)的討論列表如下表所示。 本章小結(jié)本章考核要求:(一)點(diǎn)估計(jì)(1)知道點(diǎn)估計(jì)的概念(2)會用矩法求總體參數(shù)的矩估計(jì)值,主要依據(jù)是(3)會用最大似然估計(jì)法求總體參數(shù)的估計(jì)值?;痉椒ㄊ怯蓸颖緓1,x2,x3,xn構(gòu)造一個似然函數(shù)或似然函數(shù)的對數(shù)L(x1,x2,x3,xn,)=P(X=x1)P(X=x2)P(X=xn)L(x1,x2,x3,xn,)=f(x1)f(x2)f(xn)然后由ln L(x1,x2,x3,xn,)取最大的值時的值為的值,即 。是L的最大值點(diǎn)。(二)點(diǎn)估計(jì)量的評價(jià)標(biāo)準(zhǔn)(1)若,則是的無偏估計(jì)。(2)若都是的無偏估計(jì),且就說有效。(3)若。就說是的相合估計(jì)以上三條標(biāo)準(zhǔn)中主要掌握無偏估計(jì)和有效估計(jì)(三)區(qū)間估計(jì)(1)知道區(qū)間估計(jì)的概念(2)會求一個正態(tài)總體的參數(shù)的置信區(qū)間。公式見表7-1第三章 假設(shè)檢驗(yàn)本章主要介紹統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想和概念以及參數(shù)的假設(shè)檢驗(yàn)方法。第一節(jié) 假設(shè)檢驗(yàn)的基本思想和概念教學(xué)目的:要求學(xué)生了解假設(shè)檢驗(yàn)的基本思想,理解假設(shè)檢驗(yàn)的基本概念,認(rèn)識假設(shè)檢驗(yàn)問題,熟悉假設(shè)檢驗(yàn)的基本步驟。教學(xué)重點(diǎn):基本概念,假設(shè)檢驗(yàn)的基本步驟.教學(xué)難點(diǎn):基本概念的理解.一、統(tǒng)計(jì)假設(shè)的概念為了引入統(tǒng)計(jì)假設(shè)的概念,先請看例8-1。例1.味精廠用一臺包裝機(jī)自動包裝味精,已知袋裝味精的重量,機(jī)器正常時,其均值=0.5(0.5,0.015的單位都是公斤)。某日開工后隨機(jī)抽取9袋袋裝味精,其凈重(公斤)為:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512問這臺包裝機(jī)是否正常? 此例隨機(jī)抽樣取得的9袋味精的重量都不正好是0.5公斤,這種實(shí)際重量和標(biāo)準(zhǔn)重量不完全一致的現(xiàn)象,在實(shí)際中是經(jīng)常出現(xiàn)的。造成這種差異不外乎有兩種原因:一是偶然因素的影響, 二由于偶然因素而發(fā)生的(例如電網(wǎng)電壓的波動、金屬部件的不時伸縮、衡量儀器的誤差而引起的)差異稱為隨機(jī)誤差;由于條件因素(生產(chǎn)設(shè)備的缺陷、機(jī)械部件的過度損耗)而產(chǎn)生的差異稱為條件誤差。若只存在隨機(jī)誤差,我們就沒有理由懷疑標(biāo)準(zhǔn)重量不是0.5公斤;如果我們有十足的理由斷定標(biāo)準(zhǔn)重量已不是0.5公斤,那么造成這種現(xiàn)象的主要原因是條件誤差,即包裝機(jī)工作不正常,那么,怎樣判斷包裝機(jī)工作是否正常呢?我們通過解例1 來找出解假設(shè)檢驗(yàn)問題的思想方法。解 已知袋裝味精重,假設(shè)現(xiàn)在包裝機(jī)工作正常,即提出如下假設(shè):,這是兩個對立的假設(shè),我們的任務(wù)就是要依據(jù)樣本對這樣的假設(shè)之一作出是否拒絕的判斷。由于樣本均值是的一個很好的估計(jì),故當(dāng)為真時,應(yīng)很小。當(dāng)過分大時,我們就應(yīng)當(dāng)懷疑不正確而拒絕。怎樣給出的具體界限值呢? 當(dāng)為真時,由于,對于給定的很小的數(shù)01,例如取=0.05,考慮,其中是標(biāo)準(zhǔn)正態(tài)分布上側(cè)分位數(shù),而事件 是一個小概率事件,小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。我們查附表1得,又n=9,=0.015,由樣本算得,又由上式得:小概率事件居然發(fā)生了,這與實(shí)際推斷原理相矛盾,于是拒絕,而認(rèn)為這臺包裝機(jī)工作不正常。從上面的例1中,我們看出為了對總體的某一參數(shù)進(jìn)行檢驗(yàn),通常提出兩個假設(shè):。然后引入一個與被檢參數(shù)有關(guān)的服從某種分布的統(tǒng)計(jì)量,根據(jù)事先給出的一概率標(biāo)準(zhǔn)(叫顯著水平)用反證法進(jìn)行判斷,由于小概率事件一般是不會發(fā)生的,如果引進(jìn)的樣本是一個小概率事件,因?yàn)樗拇_出現(xiàn)了,則可認(rèn)為假設(shè)不能接受,否則便接受。(二)假設(shè)檢驗(yàn)的程序根據(jù)以上的討論與分析,可將假設(shè)檢驗(yàn)的基本步驟概括如下:(1)根據(jù)實(shí)際問題提出原假設(shè)及備擇假設(shè)。這里要求與有且僅有一個為真。(2)選取合適的統(tǒng)計(jì)量,即要求所選的統(tǒng)計(jì)量與假設(shè)無關(guān)且服從某種分布,常見的有標(biāo)準(zhǔn)正態(tài)分布t(n-1)分布,(n-1)分布及F(m,n)公布。(3)規(guī)定小概率標(biāo)準(zhǔn)的大小,也叫顯著水平,通常可取=0.01,=0.05或=0.1。(4)在顯著水平下,根據(jù)統(tǒng)計(jì)量的分布將樣本空間劃分為兩部分,其一是接受的叫接受域,另一個是拒絕的叫拒絕域,記為W。(5)根據(jù)樣本值計(jì)算統(tǒng)計(jì)量的大小。(6)作出判斷:若統(tǒng)計(jì)量的觀測值落在拒絕域W內(nèi)。則知小概率事件發(fā)生了,拒絕,接受。若統(tǒng)計(jì)量的觀測值落在接受域則認(rèn)為小概率事件沒有發(fā)生,可以接受拒絕。第二節(jié) 總體均值的假設(shè)檢驗(yàn)教學(xué)目的:理解和掌握單個以及兩個正態(tài)總體均值的假設(shè)檢驗(yàn)的方法與思想,掌握正態(tài)總體方差檢驗(yàn)的方法,能用R軟件來完成這些檢驗(yàn)。教學(xué)重點(diǎn):檢驗(yàn)方法的掌握,檢驗(yàn)方法思想的理解。教學(xué)難點(diǎn):檢驗(yàn)方法的掌握。本節(jié)討論的總體均值的假設(shè)檢驗(yàn),多數(shù)是在正態(tài)總體下進(jìn)行的。一、 u檢驗(yàn)1. 方差已知時,單個正態(tài)總體均值檢驗(yàn)設(shè)x1,xn是從正態(tài)總體中抽取的一個樣本,是已知常數(shù),欲檢驗(yàn)假設(shè):,其中為已知數(shù),它的程序:(1)提出假設(shè)(2)引入統(tǒng)計(jì)量(3)規(guī)定顯著水平,查標(biāo)準(zhǔn)正態(tài)分布表求的上側(cè)分位數(shù)為臨界值,寫出相應(yīng)的拒絕域其中常用的有=0.1時,=0.05時,=0.01時,(4)根據(jù)樣本值x1,x2,xn計(jì)算統(tǒng)計(jì)量u。(5)判斷:若u落入拒絕域W內(nèi)時,則拒絕接受, 若u落入接受域內(nèi)時,則接受,拒絕。例2.某產(chǎn)品的重量XN(12,1)(單位:克),更新設(shè)備后,從新生產(chǎn)的產(chǎn)品中抽樣100件,測試樣本均值(克),如果產(chǎn)品的方差沒有改變,請問更新設(shè)備后,產(chǎn)品的平均重量是否有明顯變化?(=0.01)解 (1)設(shè)(2)引入(3)根據(jù)=0.01,查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,得的上側(cè)分位數(shù)拒絕域?yàn)椋?,-2.58),(2.58,+)(4)計(jì)算(5)u落入拒絕域W中,故拒絕,即有明顯差別。 2.方差已知時,兩個正態(tài)總體值差的檢驗(yàn)設(shè),其中為已知常數(shù)。x1,xm和y1,yn分別是取自X和Y的樣本且相互獨(dú)立。欲檢驗(yàn)假設(shè):檢驗(yàn)假設(shè),等價(jià)于檢驗(yàn)假設(shè)。而是的一個好估計(jì)量,且當(dāng)為真時,有(8.2.1)于是對給定的水平,查附表1,可得臨界值,使, (8.2.2)從而得拒絕域,若uW,則拒絕;否則接受。由上述討論可知,由服從標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量作檢驗(yàn)的方法稱為u檢驗(yàn)法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論