




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 第二節(jié) 假設(shè)檢驗(yàn)與參數(shù)估計(jì)方法本節(jié)將討論如何通過樣本去推斷總體,由樣本推斷總體是以各種統(tǒng)計(jì)量的抽樣分布為基礎(chǔ)的。對(duì)總體的推斷,可以通過兩個(gè)途徑來實(shí)現(xiàn)。一是首先對(duì)所估計(jì)的總體提出一個(gè)假設(shè),例如假設(shè)這個(gè)總體的均值等于某個(gè)定值,然后以樣本為依據(jù),以統(tǒng)計(jì)量為工具去推斷這個(gè)假設(shè)是否可以接受。如果可以接受,說明總體均值;否則,說明。二是通過統(tǒng)計(jì)量去估計(jì)總體參數(shù)。前者稱為統(tǒng)計(jì)假設(shè)檢驗(yàn),后者稱為總體參數(shù)估計(jì)。1 假設(shè)檢驗(yàn)原理和方法在生物學(xué)試驗(yàn)研究中,要檢驗(yàn)?zāi)撤N試驗(yàn)方法的效果、某個(gè)品種的優(yōu)劣、某種藥品的療效等,所得試驗(yàn)數(shù)據(jù)往往存在著一定的差異,這種差異是由隨機(jī)誤差引起的,還是由試驗(yàn)處理的效應(yīng)造成的?這個(gè)問題必
2、須經(jīng)過一番分析才能給出答案,因?yàn)樵谠囼?yàn)結(jié)果中往往是處理效應(yīng)和隨機(jī)效應(yīng)誤差混在一起,從表面上看,不易區(qū)分開,因此必須通過概率計(jì)算,采用假設(shè)檢驗(yàn)的方法,才能作出正確的推斷。11 假設(shè)檢驗(yàn)的基本原理例:用某種動(dòng)物作試驗(yàn)材料,要求動(dòng)物的平均體重,若需要再飼養(yǎng);若則應(yīng)淘汰。又知?jiǎng)游矬w重服從正態(tài)分布,且由以往經(jīng)驗(yàn)知?,F(xiàn)從一批試驗(yàn)的動(dòng)物中,隨機(jī)抽取10只,稱得體重(g):為問這批動(dòng)物能否供試驗(yàn)用?解:若用X表示這批動(dòng)物的體重,顯然,其中未知。 針對(duì)樣本觀測值如何推斷還是,我們做如下分析;(1) 對(duì)所研究的總體提出一個(gè)假設(shè) 為了得到對(duì)總體均值的推斷,可以假設(shè)總體均值等于給定的值,即原假設(shè): H0: 或 H0:
3、與原假設(shè)相對(duì)立的假設(shè)稱為備擇假設(shè),備擇假設(shè)就是當(dāng)H0被拒絕后,可供選擇的假設(shè);H1: ; 或 H1:; 或 H1: 備擇假設(shè)的提出要視具體問題而定。(2) 在上述假設(shè)下,選擇一個(gè)樣本統(tǒng)計(jì)量又稱檢驗(yàn)統(tǒng)計(jì)量,用以作為檢驗(yàn)H0的工具,并考查該統(tǒng)計(jì)量的分布。我們選擇統(tǒng)計(jì)量 這里 稱為樣品的標(biāo)準(zhǔn)誤,這里,而且g,n=10,由樣本觀測值可以算出該檢驗(yàn)統(tǒng)計(jì)量的值(3)確定原假設(shè)H0的拒絕域前面算出的U=0.6325,是在承認(rèn)H0成立的前提下得到的,但是,現(xiàn)在我們還不知道實(shí)驗(yàn)動(dòng)物體重這個(gè)總體是否真的符合該假設(shè)。如果上面算出的U值是不合理的,就表明我們所做的原假設(shè)H0是不合適的,這時(shí)我們就應(yīng)該拒絕或否定原假設(shè)。
4、使得我們拒絕或否定原假設(shè)H0的U值的全體叫做原假設(shè)H0的拒絕域。拒絕域的確定關(guān)鍵在于分清哪些U值是“合理”的,而那些是“不合理”的。它們的依據(jù)是人們?cè)趯?shí)踐中廣泛采用的“小概率原則”。所謂“小概率原則”是指小概率事件在一次觀測或試驗(yàn)中一般是不會(huì)發(fā)生的,如果發(fā)生,就認(rèn)為這個(gè)現(xiàn)象是不合適的。由前面分析我們知道,給定對(duì)于標(biāo)準(zhǔn)正態(tài)分布,我們總可以找到這樣的臨界值,使得 如果把取得相當(dāng)小,如,通過查標(biāo)準(zhǔn)正態(tài)分布的臨界值表,得到,即如果在一次觀測中,上述時(shí)間發(fā)生了,即滿足條件按小概率原則,就應(yīng)該拒絕否定原假設(shè)H0,也就是得到了H0的拒絕域; 或 由于拒絕域分布在的左右兩側(cè),所以稱這類檢驗(yàn)為雙側(cè)檢驗(yàn),又稱U檢
5、驗(yàn)。在實(shí)際問題中,還經(jīng)常需要檢驗(yàn)是否成立,此時(shí)在顯著性水平下,檢驗(yàn)假設(shè) H0: H1: 是否相容,選統(tǒng)計(jì)量對(duì)于給定的水平,查標(biāo)準(zhǔn)正態(tài)分布的上側(cè)臨界值,使得從而得到H0的拒絕域?yàn)?;這時(shí)H0的拒絕域在的一側(cè),稱為單側(cè)檢驗(yàn)。(4) 對(duì)原假設(shè)進(jìn)行推斷 在以上例題中,由樣本觀測值算得U=0.6325,它沒有落入拒絕域:,因此,我們可以認(rèn)為H0是相容的,即故這批動(dòng)物可供實(shí)驗(yàn)用。 否則,若算得U值落入拒絕域,就有理由懷疑H0的真實(shí)性,而接受備擇假設(shè)。需要說明的是,對(duì)原假設(shè)進(jìn)行推斷與的選取有關(guān),在的水平下否定原假設(shè),稱差異性是顯著的;而在的水平下否定原假設(shè),稱差異性是極顯著的,以上檢驗(yàn)稱為顯著性檢驗(yàn)。12 假
6、設(shè)檢驗(yàn)的方法、步驟 從以上的討論中,可歸納出假設(shè)檢驗(yàn)的方法、步驟如下:(1) 提出假設(shè):根據(jù)問題的實(shí)際意義,或重點(diǎn)考察的內(nèi)容,提出原假設(shè)H0和備擇假設(shè),寫明其具體內(nèi)容。如等等; 原假設(shè)是假設(shè)檢驗(yàn)的基礎(chǔ),它可能有以下幾個(gè)來源(a)依據(jù)以往的經(jīng)驗(yàn)或某些實(shí)驗(yàn)的結(jié)果;(b)依據(jù)某種理論或某種模型;(c)根據(jù)事先所做的某種規(guī)定提出的。 與原假設(shè)對(duì)立的備擇假設(shè),是總體參量中除去原假設(shè)參量取值之外的某個(gè)值或某些值,其可能來源是:(a)除原假設(shè)外的可能值;(b)希望出現(xiàn)的值;(c)擔(dān)心會(huì)出現(xiàn)的值;(d)有重要經(jīng)濟(jì)意義或其它意義的值。 (2)選擇檢驗(yàn)H0的統(tǒng)計(jì)量,并確定其分布(依據(jù)所要檢驗(yàn)的參數(shù)等,選擇合適的統(tǒng)
7、計(jì)量); (3)確定拒絕域:在給定的水平下,查所選統(tǒng)計(jì)量服從的分布表,求出臨界值,并根據(jù)小概率原則確定H0的拒絕域; 關(guān)于顯著性水平的選擇,要根據(jù)實(shí)際問題而定。 (4)作出判斷: 由樣本觀測值計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的觀測值,若其值落入拒絕域,就拒絕H0;否則,就認(rèn)為H0是相容的。 當(dāng)H0相容時(shí),對(duì)于原假設(shè)可以有以下幾種解釋:(a)原假設(shè)是真實(shí)的,并抽出一個(gè)我們所見到的樣本;(b)可能非常接近;(c)抽樣結(jié)果符合原假設(shè)的值,檢驗(yàn)統(tǒng)計(jì)量的值與的差異是由偶然因素造成的。 若拒絕H0,可有如下解釋: (a)不可能接近; (b)若原假設(shè)是真實(shí)的,抽到一個(gè)我們所見到的樣本可能性很?。?(c)抽樣結(jié)果不符合原假設(shè)
8、的值,檢驗(yàn)統(tǒng)計(jì)量與間的差異(在水平上),不能用偶然因素解釋,表明該差異還有處理效應(yīng)的作用。2 正態(tài)總體參數(shù)的假設(shè)檢驗(yàn) 21 單個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)211 方差已知,總體均值的檢驗(yàn)U檢驗(yàn) 現(xiàn)在給出檢驗(yàn)的基本步驟:1)從方差已知的正態(tài)總體中,抽取容量為n的樣本;2)提出原假設(shè) H0: 備擇假設(shè)可區(qū)分為以下三種類型:(1) (已知不可能小于)(2) (已知不可能大于)(3) (包括3)確定檢驗(yàn)統(tǒng)計(jì)量4)對(duì)于給定的顯著性水平,求出的拒絕域(分三種類型)(1)(2)(3)5)把檢驗(yàn)的統(tǒng)計(jì)量的觀測值計(jì)算出來,視其是否落入拒絕域,作出拒絕或接受的結(jié)論。例: 已知豌豆籽粒重量X服從正態(tài)分布N(37.72,
9、 0.332)(單位:g);在改善栽培條件后,隨機(jī)抽取9粒,測得平均重量。若標(biāo)準(zhǔn)差仍為0.33,問改善栽培條件是否顯著提高豌豆籽粒重量。解:按以上解題過程;(1) 已知豌豆籽粒重量N(37.72, 0.332),且已知(2)假設(shè) (由于改善栽培條件,只會(huì)使籽粒重量提高)(3) 由于方差已知,故可使用U檢驗(yàn)法,選統(tǒng)計(jì)量經(jīng)計(jì)算得U=1.82(4) 對(duì),確定的拒絕域?yàn)椋?) 判斷: 由于 ,即U落入拒絕域,則認(rèn)為栽培條件可以顯著提高豌豆籽粒重量。212方差未知時(shí)總體均值的檢驗(yàn)t檢驗(yàn) 設(shè)樣本來自正態(tài)總體,要檢驗(yàn)假設(shè)H0:, 由于未知,故已不再是統(tǒng)計(jì)量,當(dāng)然不能用來檢驗(yàn)H0,可以考慮用樣本方差代替總體方
10、差,從而得到統(tǒng)計(jì)量T統(tǒng)計(jì)量服從自由度為n-1的t分布。 對(duì)于給定的水平,查t分布表可得,使得從而得到的拒絕域?yàn)槿魴z驗(yàn)統(tǒng)計(jì)量的觀測值滿足: ,則拒絕;否則接納,這種情況屬于雙側(cè)檢驗(yàn)問題。為了方便起見,我們把單個(gè)正態(tài)總體均值假設(shè)檢驗(yàn)的拒絕域總結(jié)在如下表內(nèi):正態(tài)總體均值的假設(shè)檢驗(yàn)表在顯著水平下拒絕域檢驗(yàn)類型方差已知方差未知雙側(cè)單側(cè)單側(cè)例:正常人的脈搏平均每分鐘72次,某醫(yī)生測得10例四乙基鉛中毒患者的脈搏數(shù)(次/分)如下:54 67 68 78 70 66 67 70 65 69已知人的脈搏次數(shù)服從正態(tài)分布,試問四乙基鉛中毒患者和正常人的脈搏有無明顯差異?(解:用X表示人的脈搏次數(shù)服從正態(tài)分布,由題
11、意設(shè),未知,要檢驗(yàn), 選T統(tǒng)計(jì)量:這里n=10,計(jì)算得到;對(duì)于,查自由度n-1=9的t分布表,得經(jīng)計(jì)算的T的觀測值為此,拒絕,即在水平下,認(rèn)為四乙基鉛中毒患者脈搏與正常人有顯著差異。22 單個(gè)正態(tài)總體方差的假設(shè)檢驗(yàn)檢驗(yàn) 檢驗(yàn)是建立在分布的基礎(chǔ)上的,設(shè)隨機(jī)變量,從中抽得容量為n的隨機(jī)樣本,計(jì)算出樣本方差,則服從自由度為n-1的分布。 檢驗(yàn)的方法步驟與U檢驗(yàn)相同,我們討論均值未知,方差的假設(shè)檢驗(yàn),分三種類型來討論,檢驗(yàn)結(jié)果如下表所示:未知時(shí),正態(tài)總體方差的假設(shè)檢驗(yàn)表在顯著水平下的拒絕域 或例: 一個(gè)混雜的小麥品種,株高標(biāo)準(zhǔn)差,經(jīng)提純后隨機(jī)抽取10株,株高分別為;90, 105, 101, 95,
12、100, 100, 101, 105, 93, 97(單位:cm),考察提純后的群體是否比原來群體整齊?解:已知小麥株高服從正態(tài)分布,現(xiàn)在要檢驗(yàn)假設(shè), 它表示小麥經(jīng)過提純后株高更整齊,不會(huì)變得更離散?,F(xiàn)取,檢驗(yàn)統(tǒng)計(jì)量選為本例屬于單側(cè)檢驗(yàn)問題,經(jīng)查分布表得故拒絕域?yàn)橛?n-1=9, ,代入計(jì)算得的觀測值2.088判斷: 檢驗(yàn)統(tǒng)計(jì)量的觀測值落入拒絕域,說明提純后的株高高度更整齊。23 兩個(gè)正態(tài)總體參數(shù)和的差異顯著性檢驗(yàn) 上面討論了單個(gè)正態(tài)總體參數(shù)的顯著性檢驗(yàn),它是把樣本統(tǒng)計(jì)量的觀測值與原假設(shè)所提出供的總體參數(shù)做比較,這種檢驗(yàn)要求我們事先能提出合理的參數(shù)假設(shè)值,并對(duì)參數(shù)有某種意義的備擇值,但在實(shí)際工
13、作中很難做到,因而限制了這種方法在實(shí)際工作中的應(yīng)用。 為了解決這個(gè)問題,在實(shí)際應(yīng)用時(shí),常常選擇兩個(gè)樣本,一個(gè)作為處理,一個(gè)作為對(duì)照,在兩個(gè)樣本間進(jìn)行比較。下面分別對(duì)不同情況進(jìn)行研究和討論。231 兩個(gè)總體方差相等(齊性)的假設(shè)檢驗(yàn)F檢驗(yàn) 因?yàn)閷?duì)兩個(gè)正態(tài)總體均值的差異性做檢驗(yàn)時(shí),與和是否相等有關(guān);但在對(duì)方差的差異性檢驗(yàn)時(shí)與無關(guān)。因此,先講關(guān)于方差相等的檢驗(yàn)。為了比較和的差異是否顯著,我們比較樣本方差和的差異,若和的差異顯著,則可推斷和間存在顯著差異。 現(xiàn)在我們考察和的比,注意到當(dāng)=時(shí),既有其檢驗(yàn)步驟如下:1)假定從兩個(gè)正態(tài)總體中,獨(dú)立地抽取容量分別為和兩個(gè)樣本,和,計(jì)算出和,總體平均數(shù)可以相等,
14、也可以不等;2)假設(shè)檢驗(yàn)為: 備擇檢驗(yàn)有三種不同情況:(1)(2)(3)3)選擇檢驗(yàn)統(tǒng)計(jì)量4)對(duì)于給定的顯著性水平,查F表確定拒絕域5)進(jìn)行推斷以上步驟及結(jié)果可用下表表示;兩個(gè)正態(tài)總體方差相等的假設(shè)檢驗(yàn)表未知時(shí),在水平下的拒絕域或例: 測定20位青年男子和20為老年男子的血壓值數(shù)據(jù),經(jīng)計(jì)算得,而,取,問老年人血壓個(gè)體間波動(dòng)是否顯著高于青年人?解:人類的血壓值是服從正態(tài)分布的隨機(jī)變量,用表示青年人的血壓值, 表示老年人的血壓值,對(duì)于給定的時(shí);假設(shè)檢驗(yàn): 備擇檢驗(yàn): 統(tǒng)計(jì)量為:對(duì)于,查F分布表得:落入拒絕域,即認(rèn)為老年人的血壓值在個(gè)體間的波動(dòng)顯著高于青年人。232 方差已知時(shí),兩個(gè)正態(tài)總體均值間差
15、異顯著性的檢驗(yàn)U檢驗(yàn) 設(shè)是來自正態(tài)總體的樣本,是來自正態(tài)總體的樣本,且兩個(gè)樣本相互獨(dú)立,又為兩個(gè)樣本的均值;則分別是兩個(gè)樣本的方差。 現(xiàn)在已知,要檢驗(yàn)假設(shè);備擇假設(shè)有三種情況:(1) (2)(3)因?yàn)閮蓚€(gè)樣本是從兩個(gè)正態(tài)總體中獨(dú)立抽取的,故所以,當(dāng)成立的條件下故選U為檢驗(yàn)統(tǒng)計(jì)量,其中分子為兩個(gè)樣本的均值差,而分母為兩個(gè)總體的均值差的標(biāo)準(zhǔn)誤,記作;故有對(duì)于給定的值,可以推出上述的備擇假設(shè)的拒絕域分別為(1)(2)(3)例:根據(jù)歷史資料知道某種小麥的每平方米的產(chǎn)量服從正態(tài)分布,且,今從該品種的兩塊地上抽樣調(diào)查,甲塊地取容量12的樣本,得產(chǎn)量平均數(shù),乙塊地取容量8的樣本,得產(chǎn)量平均數(shù)。試比較甲乙兩塊
16、地的平均產(chǎn)量是否有明顯差異?解:根據(jù)題意,甲乙兩塊地的每平方米的產(chǎn)量X,Y服從正態(tài)分布和現(xiàn)為已知,我們要檢驗(yàn)選擇檢驗(yàn)統(tǒng)計(jì)量:對(duì)于給定的,查標(biāo)準(zhǔn)正態(tài)分布表,得經(jīng)計(jì)算得:推斷: 沒有落入拒絕域,接受,即兩塊地的平均產(chǎn)量沒有明顯差異。233方差未知時(shí),但時(shí),兩均值間差異顯著性的檢驗(yàn)成組數(shù)據(jù)t檢驗(yàn) 成組數(shù)據(jù)t檢驗(yàn),在兩均值檢驗(yàn)中應(yīng)用得最廣泛,它的檢驗(yàn)程序與前邊所講的U檢驗(yàn)基本相同,只是二者所使用的檢驗(yàn)統(tǒng)計(jì)量不同,成組數(shù)據(jù)t檢驗(yàn)所使用的統(tǒng)計(jì)量為其中在下變成這里是和分別以各自的自由度為權(quán)的加權(quán)平均數(shù),稱之為合并的方差,用它來估計(jì),恰好是樣本均值差的標(biāo)準(zhǔn)誤,既所以,檢驗(yàn)統(tǒng)計(jì)量成組數(shù)據(jù)t檢驗(yàn)的,備擇假設(shè)及其相
17、應(yīng)的拒絕域分別為:(1)時(shí),拒絕;(2)時(shí),拒絕;(3)時(shí),拒絕。例:用兩種不同的配方生產(chǎn)同一種材料,對(duì)第一種配方生產(chǎn)的材料進(jìn)行7次實(shí)驗(yàn),測得材料的平均強(qiáng)度,標(biāo)準(zhǔn)差;對(duì)第二種配方生產(chǎn)的材料進(jìn)行8次實(shí)驗(yàn),測得材料的平均強(qiáng)度,標(biāo)準(zhǔn)差;已知兩種工藝生產(chǎn)的材料強(qiáng)度均服從正態(tài)分布,在的水平下,能否認(rèn)為第一種配方生產(chǎn)的材料強(qiáng)度低于第二種配方生產(chǎn)的材料強(qiáng)度?解:第一步進(jìn)行方差齊性檢驗(yàn):在為真的條件下,檢驗(yàn)統(tǒng)計(jì)量對(duì)于,查F分布表得:而統(tǒng)計(jì)量的值,所以有故在水平下,接受,即可以認(rèn)為兩種配方生產(chǎn)的材料強(qiáng)度的方差相等。也就是說,可以認(rèn)為兩個(gè)正態(tài)總體方差齊性:。第二步,進(jìn)行兩個(gè)正態(tài)總體均值差異性的檢驗(yàn),也就是要在方差
18、未知但相等條件下來檢驗(yàn)假設(shè):故選檢驗(yàn)統(tǒng)計(jì)量:對(duì)于給定,查自由度的臨界值,又合并方差而故得到檢驗(yàn)統(tǒng)計(jì)量的觀測值由于落入拒絕域,即可以認(rèn)為第一種配方生產(chǎn)的材料強(qiáng)度低于第二種配方生產(chǎn)的材料強(qiáng)度。3 樣本頻率的假設(shè)檢驗(yàn) 許多生物和其它試驗(yàn)的結(jié)果是用頻率(或百分?jǐn)?shù)、成數(shù))表示的,這種頻率是由計(jì)算某一屬性的個(gè)體數(shù)目求出的,屬間斷性的統(tǒng)計(jì)資料,它與連續(xù)性的測量資料是不同的。理論上,這類頻率的假設(shè)檢驗(yàn)應(yīng)按二項(xiàng)分布進(jìn)行,但是,如果樣本容量n較大,p不太小,np和nq又均不小于5時(shí),二項(xiàng)分布趣于正態(tài)分布,從而可將頻率資料作正態(tài)分布處理,并用U統(tǒng)計(jì)量作出近似的檢驗(yàn)。31 單個(gè)樣本頻率的假設(shè)檢驗(yàn) 在科學(xué)研究中,有時(shí)需
19、要檢驗(yàn)一個(gè)樣本頻率與已知二項(xiàng)總體頻率差異是否顯著,即檢驗(yàn)該樣本是否來自某二項(xiàng)總體。這類問題就是樣本頻率與總體頻率顯著性檢驗(yàn)問題,其一般提法是: 設(shè)有一樣本頻率,n為樣本容量,x為n次觀測中某事件發(fā)生的次數(shù)。設(shè)樣本頻率所在二項(xiàng)總體的頻率為p,p0為已知的二項(xiàng)總體頻率。我們的任務(wù)是通過差值p-p0來推斷p與p0是否相同,此時(shí)原假設(shè) 備擇假設(shè) 顯然應(yīng)該進(jìn)行雙側(cè)檢驗(yàn); 當(dāng)和大于30時(shí),選作為檢驗(yàn)的統(tǒng)計(jì)量,其中為樣本頻率的標(biāo)準(zhǔn)誤。當(dāng)和均大于5,而又小于30時(shí),選擇統(tǒng)計(jì)量(成立下)來檢驗(yàn),其中32 兩個(gè)樣本頻率的假設(shè)檢驗(yàn) 這類問題的一般提法是: 設(shè)有兩個(gè)樣本頻率這里為第個(gè)樣本的容量,為次觀測或試驗(yàn)中某事件
20、出現(xiàn)的次數(shù)(i=1,2),又是第個(gè)樣本頻率所在二項(xiàng)總體的頻率(i=1,2),現(xiàn)在的任務(wù)是通過來推斷和是否相同。此時(shí),兩個(gè)樣本的總體方差相等,即原假設(shè) , 備擇假設(shè) 屬于雙側(cè)檢驗(yàn)。當(dāng)均小于30時(shí),需要進(jìn)行連續(xù)性矯正,取作為檢驗(yàn)統(tǒng)計(jì)量(當(dāng)均小于30時(shí),可用代替作t檢驗(yàn)),其中是兩個(gè)總體頻率已知時(shí),兩個(gè)樣本頻率差數(shù)的標(biāo)準(zhǔn)誤。 當(dāng)兩個(gè)總體的頻率未知,而的條件下,可用兩個(gè)樣本頻率的加權(quán)平均值作為和的估計(jì),這時(shí), 因而兩個(gè)樣本頻率差數(shù)的標(biāo)準(zhǔn)誤為:在成立的條件下作為檢驗(yàn)的統(tǒng)計(jì)量,近似服從N(0,1)分布。當(dāng)均大于30時(shí),可不進(jìn)行連續(xù)性矯正,這時(shí)檢驗(yàn)的統(tǒng)計(jì)量為兩者均屬于U檢驗(yàn)。例1:調(diào)查低洼地小麥378株,其
21、中有銹病的342株,銹病率90.50%;調(diào)查高坡地小麥396株(),其中有銹病的313株(,銹病率79%()。試檢驗(yàn)兩塊麥地的銹病率有無顯著差異?解:假設(shè); 備擇:對(duì)水平,作雙側(cè)檢驗(yàn),查標(biāo)準(zhǔn)正態(tài)分布表得,又均大于30,不作連續(xù)性矯正,經(jīng)計(jì)算;, 統(tǒng)計(jì)量的觀測值由于, 故拒絕,即兩塊麥田的銹病率有極顯著差異。4 參數(shù)估計(jì) 參數(shù)估計(jì)是統(tǒng)計(jì)推斷的主要內(nèi)容之一,在許多實(shí)際工作中,我們往往知道總體的分布類型,但不知道其參數(shù)值(如均值,方差等),參數(shù)估計(jì)就是根據(jù)樣本觀測值來估計(jì)總體的未知參數(shù)。 參數(shù)估計(jì)通常分為兩類:一是點(diǎn)估計(jì),就是以某個(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量的觀測值作為未知參數(shù)的估計(jì)值;二是區(qū)間估計(jì),就是用兩個(gè)統(tǒng)
22、計(jì)量的觀測值所確定的區(qū)間來估計(jì)未知參數(shù)的大致范圍。41 點(diǎn)估計(jì)用來估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量是很多的,例如可用樣本均值,也可用樣本的某些加權(quán)平均值 (為的權(quán)值),來估計(jì)總體均值。同樣,可用樣本方差,也可用來估計(jì)總體方差。411 點(diǎn)估計(jì)量的求法 求點(diǎn)估計(jì)量的方法,常用的有矩估計(jì)法和最大似然估計(jì)法兩種。(1)矩估計(jì)法 矩估計(jì)法就是估計(jì)量的最古老的方法,其具體做法是:以樣本矩去估計(jì)總體響應(yīng)的矩,以樣本矩的函數(shù)去估計(jì)總體矩的函數(shù)。 設(shè)總體X的分布函數(shù)為,其中為未知參數(shù),而為抽自總體X的樣本。由大數(shù)定律可知,對(duì)任給定,總有,故當(dāng)n較大時(shí),有近似式注意到,總體X的各階原點(diǎn)矩與X的分布有關(guān),是參數(shù)的函數(shù)。如X
23、服從正態(tài)分布,則,而,因此上式實(shí)際上是關(guān)于的r元聯(lián)立方程組,設(shè)其解為,顯然,這些解是樣本的函數(shù)。 若用作為的估計(jì)量,這種估計(jì)量稱為矩估計(jì)量,這種求估計(jì)量的方法叫矩估計(jì)法。矩估計(jì)法的優(yōu)點(diǎn)在于并不需要知道總體的分布形式,適用范圍廣,然而,當(dāng)總體的分布類型已知時(shí),如果我們?nèi)杂镁毓烙?jì)法,那將浪費(fèi)很多已知的信息,顯然是不可取的。例1:設(shè)總體X服從參數(shù)為的指數(shù)分布,其分布密度為其中,樣本為,試求的矩估計(jì)量。解:因?yàn)?,由矩估?jì)法,令解得的矩估計(jì)量例2: 設(shè)總體X服從正態(tài)分布,為抽自總體X的樣本,試求未知參數(shù)和的矩估計(jì)量。解:對(duì)于正態(tài)總體,而由矩估計(jì)法有解上述方程組得到和的矩估計(jì)量為(2)最大似然估計(jì)法 最大
24、似然估計(jì)法的優(yōu)點(diǎn)是充分利用了分布類型已知的條件,所得估計(jì)量一般都具有較優(yōu)良的性質(zhì)。1 總體X為離散型隨機(jī)變量 設(shè)總體X為離散型隨機(jī)變量,其分布律已知,其中為未知參數(shù),為來自總體X的一組樣本觀測值。 由于樣本可以看作是n個(gè)相互獨(dú)立且與總體X同分布的隨機(jī)變量,而就是n維隨機(jī)變量在一次觀測或試驗(yàn)中所得到的觀測值,這表明事件在一次事件中發(fā)生了,說明該事件是大概率事件,其概率 = 應(yīng)該很大。又因?yàn)樵摳怕适菂?shù)的函數(shù),其值大小依賴于,若存在一個(gè),使該概率值達(dá)到最大值,我們就以作為的估計(jì)量。由于離散型總體X的分布律形式已知,為未知參數(shù),為樣本觀測值,故僅是的函數(shù),記作,即=通常稱為似然函數(shù)。若=時(shí),似然函數(shù)
25、達(dá)到最大值,即則稱為參數(shù)的最大似然估計(jì)值;稱為的最大似然估計(jì)量。設(shè)是的可微函數(shù),要使為最大值,應(yīng)為方程的解。又由于是的單調(diào)函數(shù),它們有相同的最大值點(diǎn),故一般由方程解出。例: 設(shè)某車間生產(chǎn)一披產(chǎn)品,其次品率為p,今從中抽取n件,發(fā)現(xiàn)其中有m件次品,試用最大似然估計(jì)估計(jì)法估計(jì)其次品率p。解:用表示第i次抽取到的次品數(shù),顯然有服從01分布,且概率分布于是似然函數(shù)兩邊取對(duì)數(shù),得兩邊對(duì)p求導(dǎo),并令其導(dǎo)數(shù)為零,得似然方程解之,得到參數(shù)p的最大似然估計(jì)值為而為參數(shù)p的最大似然估計(jì)量。2 總體X為連續(xù)型隨機(jī)變量設(shè)總體X為連續(xù)型隨機(jī)變量,其分布密度函數(shù)形式已知,而為未知參數(shù),為樣本觀測值,稱為似然函數(shù),當(dāng)時(shí),若
26、似然函數(shù)取最大值,即則稱為參數(shù)的最大似然估計(jì)值;稱為的最大似然估計(jì)量。由似然方程 或 解出。例: 設(shè)總體X服從參數(shù)為的指數(shù)分布,其分布密度樣本觀測值,求的最大似然估計(jì)量。解:似然函數(shù)取對(duì)數(shù)得對(duì)求導(dǎo),并令其為零,得似然方程解得的最大似然估計(jì)值為 的最大似然估計(jì)量為 與矩估計(jì)量一致。 當(dāng)總體X的分布密度中含有s個(gè)未知參數(shù)時(shí),其似然函數(shù)仍為它是參數(shù)的多元函數(shù)。當(dāng)或偏導(dǎo)數(shù)都存在時(shí),可由方程組或 解出的最大似然函數(shù)。例: 設(shè)是來自正態(tài)總體的樣本,求未知參數(shù)和的最大似然估計(jì)量。解:設(shè)為正態(tài)總體的一組樣本觀測值,由于X的分布密度故似然函數(shù)取對(duì)數(shù)對(duì)和求偏導(dǎo),得似然方程解得和最大似然估計(jì)值為其最大似然估計(jì)量為4
27、12 估計(jì)量優(yōu)劣的評(píng)判標(biāo)準(zhǔn) 既然,總體參數(shù)可以有各種不同的估計(jì)量,那么,哪一種是最好的估計(jì)是問題的關(guān)鍵,一般來說,一個(gè)好的估計(jì)量應(yīng)具備無偏差性,有效性和一致性三個(gè)條件。(1)無偏差 若一個(gè)統(tǒng)計(jì)量的理論平均值,即其數(shù)學(xué)期望等于總體的參數(shù),則稱這個(gè)統(tǒng)計(jì)量為無偏估計(jì)量,樣本均值的數(shù)學(xué)期望等于總體均值,即,故樣本均值是總體均值的無偏估計(jì)量,記作樣本方差的理論平均值等于總體方差,即,所以樣本方差是總體方差的無偏估計(jì)量,記作(2)有效性 一個(gè)未知參數(shù)的無偏估計(jì)量往往不止一個(gè),對(duì)于數(shù)學(xué)期望,樣本均值是它的無偏估計(jì)量,樣本的第一個(gè)觀測值也是的無偏差估計(jì)量(因?yàn)榈凇H绻傮w的方差存在,我們還可以進(jìn)一步計(jì)算兩個(gè)估
28、計(jì)量的方法來評(píng)價(jià)它們的優(yōu)劣,當(dāng)然方差小的更好。事實(shí)上, 故有; 以上結(jié)果說明,用作為的估計(jì)量比更有效。一般的,若都是參數(shù)的無偏估計(jì)量,且,則稱比更有效。(3)一致性 在樣本容量n一定的條件下,我們討論了估計(jì)量的無偏差性,有效性。當(dāng)容量n無限增大時(shí),估計(jì)量接近待估計(jì)參數(shù)的可能性會(huì)更大,估計(jì)也越精確,這就是估計(jì)量的一致性??梢员硎救缦拢涸O(shè)是參數(shù)的估計(jì)量,如果對(duì)于任意給定的,均有則稱是參數(shù)的一致估計(jì)量。42 正態(tài)總體均值的區(qū)間估計(jì) 對(duì)參數(shù)進(jìn)行估計(jì)的另一種方式的區(qū)間估計(jì),一般做法是,確定一個(gè)區(qū)間,并給出該區(qū)間包含總體參數(shù)的概率。的區(qū)間估計(jì)依已知和未知有所不同。421 已知 從正態(tài)總體中,抽取容量為n的
29、樣本,樣本的均值,標(biāo)準(zhǔn)化的樣本均值,U值落入任一區(qū)間的概率可通過標(biāo)準(zhǔn)正態(tài)分布函數(shù)值查表得出,如U落入?yún)^(qū)間(-1.96, 1.96)的概率為P(-1.96 U 1.96)=0.95或422 未知未知時(shí),可用其無偏估計(jì)量代替,變量服從自由度為n-1的t分布,由可以得到的的置信區(qū)間為43 兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì)這是在一定的置信水平下,估計(jì)兩總體均值與相差多少,估計(jì)方法依兩總體方差是否相等而不同。431 在兩個(gè)正態(tài)總體方差是否已知或方差未知的大樣本時(shí) 設(shè)兩個(gè)正態(tài)總體方差分別是和,這時(shí)兩總體的樣本均值和(容量分別為)將分別服從(或近似服從)均值為,方差為的正態(tài)分布,從而兩樣本均值之差于是不難得出的
30、置信水平為的置信區(qū)間為其中是正態(tài)分布的臨界值,而若兩個(gè)總體的方差未知,但樣本容量和充分大時(shí),由中心極限定理可知, 將近似服從正態(tài)分布,若記則的置信水平為的置信區(qū)間仍然為例: 測得100頭某品種牛的體高,得到;而另一品種120頭牛的體高均值,問該兩種牛的體高至少能差多少,至多能差多少?解:由于兩個(gè)樣本的容量都很大,故可看成大樣本的情形,這時(shí)對(duì)于查標(biāo)準(zhǔn)正態(tài)分布臨界值表,得到,于是的0.95的置信區(qū)間=即在置信水平95%下,兩個(gè)品種牛的體高至少差1.046cm,至多差2.953cm。432 兩個(gè)總體方差未知但相等時(shí) 設(shè)兩個(gè)樣本的容量分別為,為它們的樣本均值,若記可以用t分布函數(shù)表示對(duì)于給定的置信水平,查分布表可得,使得從而得出的置信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人外包接單合同范本
- 催收公司加盟合同范本
- 借貸押金合同范本
- 2025吉林省建筑安全員B證(項(xiàng)目經(jīng)理)考試題庫
- 2025年河南省安全員-C證考試(專職安全員)題庫附答案
- 勞務(wù)派遣居間合同范本
- 買房中介賣房合同范例
- 臨時(shí)合伙合同范本
- 蘭州山區(qū)路燈合同范本
- 廠房抵押借款合同范本
- 祖國版圖知識(shí)主題班會(huì)
- 2025年高考地理二輪復(fù)習(xí):地球運(yùn)動(dòng)(講義)解析版
- 第二十一章會(huì)陰部美容手術(shù)講解
- 2024年金華金開招商招才服務(wù)集團(tuán)有限公司招聘筆試真題
- 2025年度iPhone手機(jī)租賃與虛擬現(xiàn)實(shí)體驗(yàn)合同3篇
- 《國別和區(qū)域研究專題》教學(xué)大綱
- 2025年度消防工程安全防護(hù)措施設(shè)計(jì)固定總價(jià)合同范本3篇
- 蘇北四市(徐州、宿遷、淮安、連云港)2025屆高三第一次調(diào)研考試(一模)語文試卷(含答案)
- 福建省部分地市2025屆高中畢業(yè)班第一次質(zhì)量檢測 英語試卷(含答案)
- 食品企業(yè)危機(jī)管理應(yīng)對(duì)方案
- 《無創(chuàng)呼吸機(jī)護(hù)理》課件
評(píng)論
0/150
提交評(píng)論