顯著性檢驗的原理_第1頁
顯著性檢驗的原理_第2頁
顯著性檢驗的原理_第3頁
顯著性檢驗的原理_第4頁
顯著性檢驗的原理_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本資料來源第三章第三章 顯著性檢驗顯著性檢驗n第一節(jié)第一節(jié) 顯著性測驗的原理顯著性測驗的原理n第二節(jié)第二節(jié) 測驗兩樣本均數(shù)差異測驗兩樣本均數(shù)差異n (含兩樣本觀察值配對和非配對的數(shù)據(jù))(含兩樣本觀察值配對和非配對的數(shù)據(jù))n第三節(jié)第三節(jié) 測驗二項資料的百分?jǐn)?shù)測驗二項資料的百分?jǐn)?shù)n (針對單個樣本百分?jǐn)?shù)和兩樣本百分?jǐn)?shù))(針對單個樣本百分?jǐn)?shù)和兩樣本百分?jǐn)?shù))n第四節(jié)第四節(jié) 測驗次數(shù)資料的卡方值測驗次數(shù)資料的卡方值n (包括適合性測驗和獨立性測驗兩類)(包括適合性測驗和獨立性測驗兩類)第三章要點提示第三章要點提示 顯著性檢驗反映了調(diào)查或試驗研究與上一章抽樣分析的不同點,又是學(xué)習(xí)統(tǒng)計分顯著性檢驗反映了調(diào)查

2、或試驗研究與上一章抽樣分析的不同點,又是學(xué)習(xí)統(tǒng)計分析方法的基礎(chǔ),學(xué)習(xí)時應(yīng)充分理解檢驗的原理和特點,熟悉兩尾檢驗與一尾檢驗的析方法的基礎(chǔ),學(xué)習(xí)時應(yīng)充分理解檢驗的原理和特點,熟悉兩尾檢驗與一尾檢驗的異同;重點掌握檢驗異同;重點掌握檢驗和和12時依據(jù)的抽樣分布類型及標(biāo)準(zhǔn)誤時依據(jù)的抽樣分布類型及標(biāo)準(zhǔn)誤、S和差數(shù)標(biāo)準(zhǔn)和差數(shù)標(biāo)準(zhǔn)誤誤1- 2、S1- 2的計算公式,并與檢驗的計算公式,并與檢驗時依據(jù)的差數(shù)的抽樣分布和計算差數(shù)平均數(shù)時依據(jù)的差數(shù)的抽樣分布和計算差數(shù)平均數(shù)的標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)誤 、S的公式相區(qū)別;對于百分?jǐn)?shù)的檢驗,要注意應(yīng)用的公式相區(qū)別;對于百分?jǐn)?shù)的檢驗,要注意應(yīng)用u-test的條件和不的條件和不符合

3、這些條件時進(jìn)行連續(xù)性矯正的必要性;掌握依據(jù)符合這些條件時進(jìn)行連續(xù)性矯正的必要性;掌握依據(jù)2變量變量SS/2 服從的理論分布服從的理論分布進(jìn)行適合性檢驗和獨立性檢驗時計算進(jìn)行適合性檢驗和獨立性檢驗時計算2值的方法。值的方法。 涉及教材內(nèi)容:第五章前三節(jié),第七章前四節(jié)。涉及教材內(nèi)容:第五章前三節(jié),第七章前四節(jié)。 作業(yè)布置:作業(yè)布置:教材教材第五章第四節(jié)內(nèi)容自習(xí)第五章第四節(jié)內(nèi)容自習(xí); 教材教材P97P97T2、 T3、 T4、 T7、 T11; P144P144T4、 T6、 T7、 T8。第一節(jié)第一節(jié) 顯著性檢驗的原理顯著性檢驗的原理一、什么是顯著性檢驗?一、什么是顯著性檢驗? 在由樣本研究總體時

4、,先提出關(guān)于在由樣本研究總體時,先提出關(guān)于總體的統(tǒng)計假設(shè)總體的統(tǒng)計假設(shè) ( Ho ) ,然后利用樣本,然后利用樣本提供的信息去反證它是否成立。提供的信息去反證它是否成立。 這種證明這種證明 Ho 是否成立的過程就叫是否成立的過程就叫統(tǒng)計假設(shè)測驗,簡稱假設(shè)測(檢)驗。統(tǒng)計假設(shè)測驗,簡稱假設(shè)測(檢)驗。 如果假設(shè)測驗只針對一個如果假設(shè)測驗只針對一個 Ho , 并不并不同時研究其它假設(shè)同時研究其它假設(shè), 則稱為顯著性檢驗。則稱為顯著性檢驗。 還有一些假設(shè)測驗問題,需要研究還有一些假設(shè)測驗問題,需要研究兩個或更多的統(tǒng)計假設(shè)兩個或更多的統(tǒng)計假設(shè), 必須采取包括必須采取包括多重比較在內(nèi)的方差分析法才能解決

5、,多重比較在內(nèi)的方差分析法才能解決,因而不再一般化地稱之為假設(shè)測驗因而不再一般化地稱之為假設(shè)測驗, 所所以假設(shè)測驗大多局限于顯著性測驗。以假設(shè)測驗大多局限于顯著性測驗。 例例3.1 某地小麥畝產(chǎn)一般某地小麥畝產(chǎn)一般o= 300kg,并從多年種植的經(jīng)驗知并從多年種植的經(jīng)驗知= 75kg,今引,今引進(jìn)一新品種得進(jìn)一新品種得 n = 25個畝產(chǎn)量觀察值,個畝產(chǎn)量觀察值,算得算得=327kg ,如何評價其表面效應(yīng)?,如何評價其表面效應(yīng)?解解 本例表面效應(yīng)本例表面效應(yīng) “27kg產(chǎn)量差異產(chǎn)量差異”,要區(qū)要區(qū)分它是本質(zhì)差別還是抽樣誤差分它是本質(zhì)差別還是抽樣誤差1. 先假定表面效應(yīng)是抽樣誤差;先假定表面效應(yīng)

6、是抽樣誤差; Ho: = o或或 = 300kg2.按誤差理論計算獲此抽樣誤差的概率;按誤差理論計算獲此抽樣誤差的概率; P( | | 27 ) = P( | o| 27 ) = P( |u|2775/25 ) = 2 P(u -9/5) = 2 (- 1.8)= 2 0.036 = 0.0723.根據(jù)小概率原理推斷根據(jù)小概率原理推斷Ho是否成立;是否成立; 按慣例按慣例= 0.05,故,故Ho成立。成立。 第一節(jié)第一節(jié) 顯著性檢驗的原理顯著性檢驗的原理 = 0.05也叫顯著水平,是一個概率也叫顯著水平,是一個概率臨界值,它是根據(jù)臨界值,它是根據(jù)“小概率事件在當(dāng)前小概率事件在當(dāng)前這次試驗這次試

7、驗(觀察觀察) 中實際不可能發(fā)生中實際不可能發(fā)生”這這種種“道德確定性道德確定性”、基于農(nóng)業(yè)和生物學(xué)領(lǐng)、基于農(nóng)業(yè)和生物學(xué)領(lǐng)域的行業(yè)要求而規(guī)定的小概率標(biāo)準(zhǔn)。域的行業(yè)要求而規(guī)定的小概率標(biāo)準(zhǔn)。 = 0.05只能理解為否定只能理解為否定 Ho時容許犯時容許犯錯誤的概率錯誤的概率, 本例獲得本例獲得27kg抽樣誤差的抽樣誤差的概率雖然很小概率雖然很小, 但尚未小到否定但尚未小到否定Ho時規(guī)時規(guī)定的顯著水平定的顯著水平, 反過來講就是沒有反過來講就是沒有95%以上的把握來認(rèn)定其表面效應(yīng)是以上的把握來認(rèn)定其表面效應(yīng)是“本質(zhì)本質(zhì)差別差別”而不是抽樣誤差而不是抽樣誤差; 或者說表面效應(yīng)或者說表面效應(yīng)雖然較大雖然

8、較大, 但還沒有大到有但還沒有大到有95%以上的以上的把握來排除它是抽樣誤差的可能性。把握來排除它是抽樣誤差的可能性。 上述通過計算兩尾概率評價其表面效上述通過計算兩尾概率評價其表面效應(yīng)的做法通常針對的提問方式是:應(yīng)的做法通常針對的提問方式是:“新品新品種的單產(chǎn)與當(dāng)?shù)仄贩N種的單產(chǎn)與當(dāng)?shù)仄贩N有無顯著差異有無顯著差異?” 實際上評價表面效應(yīng)還有一種問法:實際上評價表面效應(yīng)還有一種問法:“新品種的單產(chǎn)新品種的單產(chǎn)是否高于是否高于當(dāng)?shù)仄贩N?當(dāng)?shù)仄贩N?”解解 這樣提問往往是根據(jù)專業(yè)方面的信息這樣提問往往是根據(jù)專業(yè)方面的信息已明知新品種的單產(chǎn)不可能低于當(dāng)?shù)仄贩N,已明知新品種的單產(chǎn)不可能低于當(dāng)?shù)仄贩N,于是檢

9、驗方法由兩尾測驗變成一尾測驗。于是檢驗方法由兩尾測驗變成一尾測驗。1. 仍假定表面效應(yīng)是抽樣誤差;仍假定表面效應(yīng)是抽樣誤差; Ho: o或或 300kg2.計算獲此抽樣誤差的一尾概率;計算獲此抽樣誤差的一尾概率; P( 27 ) = P( o 27 ) = P( u9/5) = (- 1.8) = 0.036 3.根據(jù)小概率原理推斷:根據(jù)小概率原理推斷:Ho不成立。不成立。 第一節(jié)第一節(jié) 顯著性檢驗的原理顯著性檢驗的原理 二、顯著性檢驗的特點二、顯著性檢驗的特點1. 是一種概率反證法;是一種概率反證法; 先假定先假定 (單向單向) 成立,再計算標(biāo)準(zhǔn)誤,成立,再計算標(biāo)準(zhǔn)誤,然后將表面效應(yīng)轉(zhuǎn)換成標(biāo)

10、準(zhǔn)化變量后查然后將表面效應(yīng)轉(zhuǎn)換成標(biāo)準(zhǔn)化變量后查算其屬于抽樣誤差的概率是否為小概率算其屬于抽樣誤差的概率是否為小概率,是則接受是則接受Ho; 否則拒絕否則拒絕Ho。2. 用了小概率原理;用了小概率原理; 否定否定Ho有有95%以上的把握,但不可能以上的把握,但不可能為為100%,即表面效應(yīng)只要大到視其為抽,即表面效應(yīng)只要大到視其為抽樣誤差時的兩尾或一尾概率小到顯著水樣誤差時的兩尾或一尾概率小到顯著水平就能否定平就能否定Ho,不然就暫且接受,不然就暫且接受Ho ,決決不意味著接受不意味著接受Ho時有時有95%以上的把握。以上的把握。3. 不同的場合依據(jù)不同的抽樣分布。不同的場合依據(jù)不同的抽樣分布。

11、三、關(guān)于三、關(guān)于 t 分布分布 1.定義:定義:t = ( ) S 2. 其中其中S = S /n 叫樣本標(biāo)準(zhǔn)誤叫樣本標(biāo)準(zhǔn)誤2.參數(shù)參數(shù): t = 0, t = / (-2 )3.曲線特性曲線特性:4. 以以t = 0 處的縱軸對稱處的縱軸對稱,并以之為并以之為曲曲5.線最高點位置線最高點位置, 而后往兩側(cè)遞降而后往兩側(cè)遞降;不不同的同的6.決定一條特異的決定一條特異的 t 分布曲線分布曲線; 曲線曲線形形7.狀隨著狀隨著的增加的增加, 峰頂峰頂由下往上由下往上朝標(biāo)朝標(biāo)準(zhǔn)準(zhǔn) 8.曲線的峰頂逼近曲線的峰頂逼近, 兩尾兩尾由上往下由上往下朝朝標(biāo)準(zhǔn)標(biāo)準(zhǔn) 9.曲線的兩尾收攏曲線的兩尾收攏; 而當(dāng)而當(dāng)

12、(120)10.時時, t 分布曲線與標(biāo)準(zhǔn)曲線分布曲線與標(biāo)準(zhǔn)曲線N(0, 1)重重合。合。11.4. 附表附表 4 與與 t 分布的關(guān)系。分布的關(guān)系。 第一節(jié)第一節(jié) 顯著性檢驗的原理顯著性檢驗的原理 附表附表4所列為所列為9種兩尾概率對應(yīng)的種兩尾概率對應(yīng)的| t | , 如右圖所示如右圖所示, 當(dāng)當(dāng) n 1= 7時時, 0.05和和0.10欄目下的欄目下的2.365和和1.895就表明就表明所得標(biāo)準(zhǔn)化變量所得標(biāo)準(zhǔn)化變量 t 在在 n = 8時絕對值時絕對值超過超過2.365的概率的概率(兩尾面積兩尾面積)為為0.05, 超過超過1.895的概率的概率(兩尾面積兩尾面積)為為0.10。 按照顯著

13、性檢驗原理,計算獲按照顯著性檢驗原理,計算獲得某抽樣誤差的概率只是為了確認(rèn)得某抽樣誤差的概率只是為了確認(rèn)它是否為小概率,那反過來也就可它是否為小概率,那反過來也就可以以根據(jù)根據(jù)0.05的顯著水平確定標(biāo)準(zhǔn)化的顯著水平確定標(biāo)準(zhǔn)化變量變量 u 或或 t 的的“臨界值臨界值”,再和抽樣,再和抽樣誤差標(biāo)準(zhǔn)化的結(jié)果相比較誤差標(biāo)準(zhǔn)化的結(jié)果相比較就是了,就是了,由此而來的顯著性檢驗步驟見下例。由此而來的顯著性檢驗步驟見下例。0 00.050.050.10.10.150.150.20.20.250.250.30.30.350.350.40.40.450.45-3.9-3.9-2.7-2.7-1.5-1.5-0.

14、3-0.30.90.92.12.13.33.30.900.050.0250.0251.8952.365tf ( t )= 7第一節(jié)第一節(jié) 顯著性檢驗的原理顯著性檢驗的原理0 00.050.050.10.10.150.150.20.20.250.250.30.30.350.350.40.40.450.45-3.9-3.9-2.7-2.7-1.5-1.5-0.3-0.30.90.92.12.13.33.3f ( t )t= 2= 7 = 4 N(0, 1)第一節(jié)第一節(jié) 顯著性檢驗的原理顯著性檢驗的原理四、顯著性檢驗的步驟四、顯著性檢驗的步驟 例例3.2 某地春小麥良種的千粒重某地春小麥良種的千粒重

15、0 0 = 34克,現(xiàn)自外地引進(jìn)一高產(chǎn)品種,克,現(xiàn)自外地引進(jìn)一高產(chǎn)品種,8個小區(qū)種植得平均千粒重為個小區(qū)種植得平均千粒重為 = 35.2克,克,S = 1.64克,則測驗克,則測驗該品種的千粒重是該品種的千粒重是否顯著高于當(dāng)?shù)亓挤N否顯著高于當(dāng)?shù)亓挤N的步驟為:的步驟為:(1) H0: o或或 34g ;(2) S = S/n = 1.648 = 0.58 (3) t = ( )S =1.20.58 = 2.07(3)按自由度按自由度 = 7 查得:查得:(4) 一尾一尾 t0.05 = 兩尾兩尾 t0.10 = 1.895(4) 推斷:推斷:t t0.05 H0 不成立。不成立。 本次測驗的顯著

16、水平:本次測驗的顯著水平: = 0.05 本例是按照題目要求進(jìn)行一尾測驗,本例是按照題目要求進(jìn)行一尾測驗,實際應(yīng)用中這種提問方式必須有所謂的實際應(yīng)用中這種提問方式必須有所謂的“附加知識附加知識”為依據(jù),即為依據(jù),即有來自專業(yè)方面有來自專業(yè)方面的信息表明外地品種的千粒重不可能低的信息表明外地品種的千粒重不可能低于當(dāng)?shù)亓挤N于當(dāng)?shù)亓挤N,否則就只能用兩尾測驗。,否則就只能用兩尾測驗。(1) H0: = o或或 = 34g ;(2) S = S/n = 1.648 = 0.58 (3) t = ( )S =1.20.58 = 2.07(3) 按自由度按自由度 = 7 查得兩尾查得兩尾 t0.05 = 2

17、.365(4) 推斷:推斷:tt0.05 H0 成立。意即外地品成立。意即外地品種的千粒重與當(dāng)?shù)亓挤N無顯著差異。種的千粒重與當(dāng)?shù)亓挤N無顯著差異。 本例兩尾測驗對本例兩尾測驗對 H0 的態(tài)度與一尾測的態(tài)度與一尾測驗截然不同,但實際研究中有相同的。驗截然不同,但實際研究中有相同的。第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù)一、測驗一、測驗1- 2 例例3.3 根據(jù)以往資料,某小麥品種每根據(jù)以往資料,某小麥品種每m2產(chǎn)量的產(chǎn)量的2= 0.4(kg2 )。今在該地的一塊。今在該地的一塊地上以地上以A、B兩法取樣,兩法取樣,A法取法取12個樣點,個樣點,得每得每m2產(chǎn)量產(chǎn)量1=1.2kg;B法取法取8個

18、樣點個樣點, 得得2 = 1.4kg。試問兩法差異是否顯著?。試問兩法差異是否顯著?解解 題意指兩種取方法得到的單產(chǎn)有無本題意指兩種取方法得到的單產(chǎn)有無本質(zhì)差別,即表面效應(yīng)能否視為抽樣誤差。質(zhì)差別,即表面效應(yīng)能否視為抽樣誤差。(1)H0: 1 =2 或或 1-2 = 0(2)12 =22 = 2 = 0.4(kg2 )1-2=(0.4/12+0.4/8)(0.4/12+0.4/8)= =0.2887kg0.2887kg u=u=(1.21.4)(1.21.4)0.28870.2887= = -0.69-0.69(3)查得兩尾)查得兩尾u0.05 = 1.96(4)推斷)推斷: |u| u0.0

19、5 , H0成立成立 表明兩種取樣方法無本質(zhì)差別。表明兩種取樣方法無本質(zhì)差別。 關(guān)于關(guān)于原始數(shù)據(jù)用不同的單位對顯著原始數(shù)據(jù)用不同的單位對顯著性檢驗過程的影響問題性檢驗過程的影響問題, 要具體步驟具要具體步驟具體分析體分析,本例若以,本例若以“斤斤”或或500g為單位,為單位,則則2 = 40.4(斤斤2 ), 1-2 = 2 20.2887(0.2887(斤斤),),而而u u= -0.69-0.69不變不變. .第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù) 例例3.4 調(diào)查某地每畝調(diào)查某地每畝30萬苗和萬苗和35萬苗萬苗的稻田各的稻田各5塊塊, 得到得到1= 428 kg, SS1=1930k

20、g2;2 = 440kg,SS2 = 550kg2。測驗兩。測驗兩種種密度單產(chǎn)差異顯著性的步驟為:密度單產(chǎn)差異顯著性的步驟為:(1) H0:1=2或或 1-2 = 0(2) F= S大大2 / S小小2 =1930/4550/4= 3.57ns 查得右尾查得右尾F0.05,4,4 = 6.39,于是有:,于是有: Se2 = (SS1 + SS2) / (1+2) =2480 8 = (1S12 +2S22)/(1+2) = 310 S 1-2 = Se2 (1/n1 + 1/n2) = 11.14 t =( 1- 2 ) 1- 2 S1- 2 =( 1- 2 ) (1-2) S1- 2 =

21、(428 440)/ 11.14 = -1.08(3)按)按 = 4+4 = 8查得兩尾查得兩尾t0.05 = 2.306(4)推斷:)推斷: | t | t0.05 H0成立成立 本例屬于實際應(yīng)用中普遍遇到的參本例屬于實際應(yīng)用中普遍遇到的參數(shù)數(shù)12 及及22 未知的情形,不可能用未知的情形,不可能用 u-test而只能用而只能用 t-test,由于由于S S1- 通通過過合并均方合并均方 Se2 計算時必須以兩樣本均計算時必須以兩樣本均方經(jīng)方經(jīng)F-test證實無顯著差異證實無顯著差異(齊性檢驗齊性檢驗)為先決條件為先決條件, 故要在用加權(quán)法合并兩故要在用加權(quán)法合并兩個樣本方差前插入一個個樣本

22、方差前插入一個 F-test 過程。過程。 倘若經(jīng)倘若經(jīng) F-test 證實有顯著差異證實有顯著差異, 表表明明12 22 , 那就不能計算那就不能計算Se2而只而只能仿照中心極限定理有關(guān)結(jié)論計算能仿照中心極限定理有關(guān)結(jié)論計算: S 1-2 = (S12 /n1 + S22 /n2), 只是以只是以它為標(biāo)準(zhǔn)誤轉(zhuǎn)換出來的標(biāo)準(zhǔn)化變量已它為標(biāo)準(zhǔn)誤轉(zhuǎn)換出來的標(biāo)準(zhǔn)化變量已不再是嚴(yán)格意義上的不再是嚴(yán)格意義上的 “t” 變量變量 還是先了解一下還是先了解一下F分布。分布。第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù) 關(guān)于關(guān)于F的定義及其分布的定義及其分布 從一個母總體從一個母總體 N (, 2) 中隨機抽取兩

23、個中隨機抽取兩個獨立樣本獨立樣本, 算得兩個樣本均方依次為算得兩個樣本均方依次為S12、S22,則定義:則定義:F= S12 / S22 。 抽樣研究的結(jié)果證明抽樣研究的結(jié)果證明, F是一個連續(xù)性隨機是一個連續(xù)性隨機變量變量, 理論上存在著抽樣分布,這就是理論上存在著抽樣分布,這就是F分布。分布。它具有平均數(shù)為:它具有平均數(shù)為:F = 2 / (2 -2) F分布是由自由度分布是由自由度1、2 決定的曲線系決定的曲線系統(tǒng)統(tǒng), 因為受因為受F 0的限制的限制, 任一條限于縱坐標(biāo)右側(cè);任一條限于縱坐標(biāo)右側(cè); F分布曲線不對稱往左傾斜,左傾程度隨分布曲線不對稱往左傾斜,左傾程度隨著著1、2的一齊增加

24、而減小,的一齊增加而減小, 2 時,時, F的取值從大于的取值從大于 1 的那邊由右往左的那邊由右往左1,曲線峰頂,曲線峰頂 向上、向右往向上、向右往 F 1 的垂線逼近;的垂線逼近; 附表附表5 (右尾右尾F臨界值表臨界值表)與與F分布的關(guān)系。分布的關(guān)系。 N(,2)1,S122,S22n n1 1n nn n2 2總體總體樣本樣本1樣本樣本2第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù)0 00.20.20.40.40.60.60.80.81 11.21.21.41.41.61.61.81.82 20.010.010.090.090.250.250.490.490.810.811.211.21

25、1.691.692.252.252.892.893.613.614.414.4110102020Ff (F)1= 1,2 = 71= 1,2= 4 1= 1,2= 25.59 7.71 18.51 這里只顯示這里只顯示1 = 1的反的反 J 型型曲線,曲線, 1 = 2 時也是如此;時也是如此; 當(dāng)當(dāng)13 時,時,F(xiàn)分布曲線就分布曲線就轉(zhuǎn)為偏態(tài),呈現(xiàn)反轉(zhuǎn)為偏態(tài),呈現(xiàn)反 S 型。型。第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù) 例例3.5 在抽穗期間測定噴矮壯素玉米在抽穗期間測定噴矮壯素玉米8株株, 得到株高得到株高1= 176.3cm, SS1=3787.5cm2,對照區(qū)玉米,對照區(qū)玉米9株,得

26、株高株,得株高2=233.3 cm,SS2 = 18400cm2,試,試測驗矮化效果測驗矮化效果。(1) H0:12 或或1 1-2 2 0 0 F = S大大2 / S小小2 = 2300541.1= 4.25* 查得查得F0.05,8,7 = 3.73(2)S 1-2 = (S12/n1 + S22 /n2) = (67.64 +255.56 ) = 18 “ t ” ( 1- 2 ) S1- 2 = (176.3 233.3)18 = -3.17(3)k = S2 1/(S2 1 + S2 2) 1- k = 0.79 = 67.64 323.2 = 0.21 故故 = 1 k2/1+(

27、1-k)2/212 = 1 (0.21(0.212/ 7+ 0.79 2/ 8) = 11.85按按查得一尾查得一尾t0.05 = 兩尾兩尾t0.10 = 1.782(4)推斷:)推斷: | t | t0.05 H0不不成立成立 本例經(jīng)本例經(jīng)F-test知兩個樣本所屬的總知兩個樣本所屬的總體方差體方差12 22 , 因此因此不能計算合并不能計算合并Se2而只能模仿中心極限定理計算而只能模仿中心極限定理計算S 1-2,由于以它為標(biāo)準(zhǔn)誤轉(zhuǎn)換出來的標(biāo)準(zhǔn)化變由于以它為標(biāo)準(zhǔn)誤轉(zhuǎn)換出來的標(biāo)準(zhǔn)化變量已不再是嚴(yán)格意義上的量已不再是嚴(yán)格意義上的“ t ” , 所以查所以查表時表時不能簡單地根據(jù)合并自由度不能簡單

28、地根據(jù)合并自由度15即即1+2,而必須予以修正,而必須予以修正, 這就是:這就是:Aspin-Welch檢驗檢驗。 第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù) 例例3.6 一個容量為一個容量為6的樣本來自一個的樣本來自一個正態(tài)總體,得平均數(shù)為正態(tài)總體,得平均數(shù)為1 = 30,均方,均方S12 = 40,另一個容量為,另一個容量為11的樣本來自的樣本來自一個正態(tài)總體,其平均數(shù)為一個正態(tài)總體,其平均數(shù)為 2 = 22 ,均方為均方為S22 = 45,測驗,測驗H0:1 1-2 244 (1)F = S大大2 / S小小2 = 4540 = 1.125ns 查得右尾查得右尾F0.05,10,5 =

29、4.74(2)Se2 = (1S12 +2S22)/(1+2) = 650 15 = 43.33 S 1-2 = Se2 (1/n1 + 1/n2) = (43.3317 66 ) =3.34 t = |1- 2| (1-2) S1- 2 =(30 22)43.34 = 1.2(3)按)按 = 15, 查得一尾查得一尾t0.05 = 1.753(4)推斷:)推斷: | t | t0.05 H0成立成立 本例有一個特別之處本例有一個特別之處, 即不是測驗兩即不是測驗兩個樣本所屬的總體平均數(shù)個樣本所屬的總體平均數(shù)1與與2 是否是否相等相等, 而是測驗其相差是否超過而是測驗其相差是否超過(小于小于)

30、某某一常數(shù)一常數(shù), 我們把這一類我們把這一類H0稱為稱為“非零假設(shè)非零假設(shè)”, 相應(yīng)地稱前者為相應(yīng)地稱前者為“零假設(shè)零假設(shè)” 。 用非零假設(shè)往往能使用非零假設(shè)往往能使 H0 更有實用性,更有實用性,因為針對它進(jìn)行檢驗后獲得信息更充分,因為針對它進(jìn)行檢驗后獲得信息更充分,如本例只檢驗零假設(shè)如本例只檢驗零假設(shè): t = 83.34 = 2.4顯然超過一尾顯然超過一尾 t0.05 而否定而否定H0。 用非零假設(shè)時常數(shù)則是根據(jù)實際應(yīng)用用非零假設(shè)時常數(shù)則是根據(jù)實際應(yīng)用的要求而設(shè)定,并且的要求而設(shè)定,并且多為一尾測驗多為一尾測驗。如。如1- 2為產(chǎn)量差異為產(chǎn)量差異, 常數(shù)就可按高產(chǎn)者多常數(shù)就可按高產(chǎn)者多投

31、入的成本換算出所屬的總體平均數(shù)必投入的成本換算出所屬的總體平均數(shù)必須超過低產(chǎn)方多大的幅度須超過低產(chǎn)方多大的幅度 (才有效益才有效益)來來確定確定值得普遍推行值得普遍推行。 第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù) 二、測驗二、測驗 例例3.7 選生長期、發(fā)育進(jìn)度等方面一致選生長期、發(fā)育進(jìn)度等方面一致的的番茄配對,共得番茄配對,共得7組,每組中隨機安排一株組,每組中隨機安排一株接接種種A病毒,另一株接種病毒,另一株接種B病毒,試驗結(jié)果得每病毒,試驗結(jié)果得每組中組中B處理產(chǎn)生的病痕數(shù)分別比處理產(chǎn)生的病痕數(shù)分別比A處理處理15、-1、6、12、7、7、12個,故測驗個,故測驗B法產(chǎn)生的病法產(chǎn)生的病

32、痕數(shù)顯著高于痕數(shù)顯著高于A法的步驟為:法的步驟為: (1) H0: d 0 0 (di為抽樣引起的誤差為抽樣引起的誤差) (2) = d /n = 58 / 7= 8.3(3) SSd = (d - ) 2 = 167.43 (4) S = Sd/n =(SSd / n(n-1)= 2 (5) t =( d)/ S = 8.3 / 2 = 4.15(3)按自由度按自由度 = 7 1,查得一尾查得一尾t0.05 = 1.943(4) 推斷:推斷:t t0.05 H0不成立。不成立。 . 將性質(zhì)相同也就是試驗條件非常接將性質(zhì)相同也就是試驗條件非常接近的兩個試驗單元(小區(qū))配成一對,近的兩個試驗單元

33、(小區(qū))配成一對,然后在每一對中隨機安排兩種處理,如然后在每一對中隨機安排兩種處理,如此配對設(shè)計有幾個重復(fù)就可以得到幾組此配對設(shè)計有幾個重復(fù)就可以得到幾組成對的觀察值,若各對觀察值總是固定成對的觀察值,若各對觀察值總是固定其中一個處理的觀察值為減數(shù),另一個其中一個處理的觀察值為減數(shù),另一個為處理的為被減數(shù)為處理的為被減數(shù), 則所得差數(shù)則所得差數(shù)d1、d2di 、dn的算術(shù)平均數(shù)就是的算術(shù)平均數(shù)就是。 如果兩個處理無本質(zhì)差別,則配對如果兩個處理無本質(zhì)差別,則配對觀察值的差數(shù)觀察值的差數(shù)d 必然服從正態(tài)分布,于必然服從正態(tài)分布,于是是測驗測驗 的顯著性也就相當(dāng)于把的顯著性也就相當(dāng)于把d 視為視為變

34、量變量y 的單個樣本平均數(shù)的差異的單個樣本平均數(shù)的差異顯著性檢驗顯著性檢驗, 計算計算S 的公式形式和計算的公式形式和計算S 的公式是一樣的,這就是測驗的公式是一樣的,這就是測驗 的的實質(zhì)(也可以是兩尾測驗)。實質(zhì)(也可以是兩尾測驗)。第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù)- 1 51- 6- 1 2- 7- 7- 1 2d = Y a - Y b1 5- 161 2771 2d = Y b - Y a配對觀察值差數(shù)A 法得數(shù)Y aB 法得數(shù)Y b1 02 51 31 281 431 551 22 02 761 8原始數(shù)據(jù)(番茄病痕數(shù)目)病毒用病毒用A、B兩法鈍化后經(jīng)配對設(shè)計在番茄上產(chǎn)生成

35、對數(shù)據(jù)的過程兩法鈍化后經(jīng)配對設(shè)計在番茄上產(chǎn)生成對數(shù)據(jù)的過程第二節(jié)第二節(jié) 兩個樣本平均數(shù)兩個樣本平均數(shù)-6.8-6.2-3.5-4.2-9.1-2.4-4.8-7.6-5.9d= Y a-Y b6.86.23.54.29.12.44.87.65.9d= Y b-Y a配 對 觀 察 值差 數(shù)原 肥 料 Y a新 肥 料 Y b60.667.466.672.864.968.461.866.061.770.867.269.662.467.261.368.956.762.6原 始 數(shù) 據(jù)( 小 區(qū) 皮 棉 產(chǎn) 量 ) 例例3.8 研究某新肥料研究某新肥料能否比原肥料增產(chǎn)能否比原肥料增產(chǎn)5kg以上皮棉,

36、采用配對設(shè)計,重復(fù)以上皮棉,采用配對設(shè)計,重復(fù)9次,次,根據(jù)各重復(fù)新肥料施用,后比原肥料多收根據(jù)各重復(fù)新肥料施用,后比原肥料多收皮棉皮棉kg數(shù)算得數(shù)算得 = 5.61kg, SSd = 35.28kg2, 故顯著性測驗步驟為:故顯著性測驗步驟為:(1) H0: d5 kg5 kg(一尾檢驗,反意假設(shè)一尾檢驗,反意假設(shè)) (2) = d /n = 50.5/ 9 = 5.61(3) SSd = (d - ) 2 =d2 C=35.28(4) S = Sd/n =SSd/n(n-1)=0.7 (5) t = (| d) / S = (5.61 5) /0.7= 0.87(3)按自由度按自由度= 9

37、 1,查得一尾查得一尾t0.05 =1.860(4)推斷:推斷:t t0.05 H0成立。成立。 .(5) 本例若檢驗本例若檢驗H0: d 0 0 則會有則會有: :(6) t = ( d) / S = (5.61 0) / 0.7 = 8 第三節(jié)第三節(jié) 二項資料的百分?jǐn)?shù)二項資料的百分?jǐn)?shù) 所謂二項資料的百分?jǐn)?shù),指數(shù)據(jù)資料所謂二項資料的百分?jǐn)?shù),指數(shù)據(jù)資料可以看成是從二項總體中抽得樣本后,可以看成是從二項總體中抽得樣本后,通過計數(shù)某一屬性的個體數(shù)目算出來的通過計數(shù)某一屬性的個體數(shù)目算出來的樣本百分?jǐn)?shù),其樣本百分?jǐn)?shù),其實質(zhì)是樣本平均數(shù)實質(zhì)是樣本平均數(shù)。正。正因為經(jīng)計數(shù)獲得,所以因為經(jīng)計數(shù)獲得,所以是

38、間斷性變量是間斷性變量。 從理論上講,這類百分?jǐn)?shù)的顯著性檢從理論上講,這類百分?jǐn)?shù)的顯著性檢驗應(yīng)按二項分布進(jìn)行,即用驗應(yīng)按二項分布進(jìn)行,即用( p + q ) n 的的二項展開式求出某項屬性的個體數(shù)達(dá)到二項展開式求出某項屬性的個體數(shù)達(dá)到某個百分?jǐn)?shù)某個百分?jǐn)?shù) p 的概率。但的概率。但 n 稍大時,直稍大時,直接用接用( p + q ) n 來計算區(qū)間概率很不方便,來計算區(qū)間概率很不方便,除非制成類似附表除非制成類似附表9那樣的統(tǒng)計表來查。那樣的統(tǒng)計表來查。 而樣本容量足夠大而樣本容量足夠大 (n50) 時,若時,若 p、q 不過于小不過于小 (np或或nq 5), 則則( p + q ) n 的的

39、分布趨近于正態(tài)分布趨近于正態(tài), p可轉(zhuǎn)換為可轉(zhuǎn)換為 u 查算概率。查算概率。 適合適合 u-test 的的 p 和和 n p 值表值表 n p n p 50 0.4 0.6 2030 80 0.3 0.7 2456 200 0.2 0.8 40160 600 0.1 0.9 605401400 0.05-0.95 70-1325第三節(jié)第三節(jié) 二項資料的百分?jǐn)?shù)二項資料的百分?jǐn)?shù)一、單個樣本百分?jǐn)?shù)一、單個樣本百分?jǐn)?shù)p 例例3.9 以紫花和白花的大豆品種雜交,以紫花和白花的大豆品種雜交,F(xiàn)2代共代共289株中紫花株中紫花208株,白花株,白花81株;如株;如果花柱頭色受一對等位基因控制,則紫花果花柱頭

40、色受一對等位基因控制,則紫花的理論百分?jǐn)?shù)的理論百分?jǐn)?shù)po= 0.75,白花的,白花的qo= 0.25,試測驗該結(jié)果是否符合試測驗該結(jié)果是否符合3 1的分離規(guī)律?的分離規(guī)律?解解 本例本例n = 289, p = 208/289 = 0.72 n200, p(0.2, 0.8 ) 用用u-test H0:p = p0 或或 p = 0.75p=(pq/n) =(0.750.25289) =0.0255 u = (p p)/p= (0.720.75) / 0.0255 = -1.18查表知查表知 u0.05 = 1.96推斷:推斷:u u0.05 故故H0成立。成立。 本例若以本例若以np-np

41、= 208-216.75= -8.75 ,進(jìn)行測驗進(jìn)行測驗, np=(npq) =7.36 , u 不變。不變。 若以若以H0:p = 0.25 進(jìn)行檢驗,進(jìn)行檢驗, p或或 np結(jié)果一樣,結(jié)果一樣,u = 1.18。 本例因為有理論百分?jǐn)?shù)為測驗依據(jù),本例因為有理論百分?jǐn)?shù)為測驗依據(jù),具備計算總體標(biāo)準(zhǔn)誤的先決條件,所具備計算總體標(biāo)準(zhǔn)誤的先決條件,所以用以用u-test。這是很少見的幾種能直接這是很少見的幾種能直接應(yīng)用標(biāo)準(zhǔn)正態(tài)分布的場合應(yīng)用標(biāo)準(zhǔn)正態(tài)分布的場合,也是應(yīng)用,也是應(yīng)用二項總體抽樣分布進(jìn)行檢驗的優(yōu)勢。二項總體抽樣分布進(jìn)行檢驗的優(yōu)勢。 用正態(tài)分布替代二項分布進(jìn)行檢驗,用正態(tài)分布替代二項分布進(jìn)

42、行檢驗,其其本質(zhì)是將間斷性變量的概率分布去本質(zhì)是將間斷性變量的概率分布去逼近它的極限逼近它的極限連續(xù)性變量的連續(xù)性變量的fN(y)。這種近似過程會有偏差,當(dāng)數(shù)據(jù)不符這種近似過程會有偏差,當(dāng)數(shù)據(jù)不符合前表所列條件時還得照下例操作。合前表所列條件時還得照下例操作。 第三節(jié)第三節(jié) 二項資料的百分?jǐn)?shù)二項資料的百分?jǐn)?shù) 例例3.10 用基因型純合的糯和非糯玉米用基因型純合的糯和非糯玉米雜交,按遺傳規(guī)律雜交,按遺傳規(guī)律 ,預(yù)期預(yù)期F1植株上糯性花粉植株上糯性花粉粒的粒的P0 = 0.5?,F(xiàn)于一視野中檢視?,F(xiàn)于一視野中檢視20粒花粉,?;ǚ?,發(fā)現(xiàn)糯性花粉發(fā)現(xiàn)糯性花粉8粒粒, 試測驗此次鏡檢結(jié)果是試測驗此次鏡檢

43、結(jié)果是否符合否符合F1代配子代配子1 1的分離規(guī)律。的分離規(guī)律。解解 本例本例n = 2050, p = 8/20 = 0.4 不符合不符合u-test的條件的條件, 只能用只能用t-test H0:p = p0 或或p = 0.5S2= npq /(n-1)是是2= pq的無偏估計值的無偏估計值Sp=(pq/(n-1)=(0.40.619)=0.1124 tc= ( | p p | 0.5/n ) / Sp = 0.667 = ( 0.10.025 ) / 0.1124按自由度按自由度= 19 查得查得t0.05 = 2.093推斷:推斷:t t0.05 故故H0成立成立 本例若以本例若以n

44、p-np = 810 = -2進(jìn)行進(jìn)行測驗測驗, 則同樣應(yīng)根據(jù)則同樣應(yīng)根據(jù)2= pq的無偏估的無偏估計值計值 S2= npq / (n-1)先計算標(biāo)準(zhǔn)誤先計算標(biāo)準(zhǔn)誤:Snp=(n2 p q / (n-1) (n p q )。 = (202 0.40.619) = 2.25再算再算tc= ( |n p n p | 0.5 ) / Snp = (20.5 ) / 2.25 = 0.667 計算計算 tc 的做法叫連續(xù)性矯正,為的做法叫連續(xù)性矯正,為的是糾正用連續(xù)性變量的的是糾正用連續(xù)性變量的t 分布替代分布替代二項分布時二項分布時, 因為因為 n 太小而不能忽略太小而不能忽略的偏差。即使如此,對的

45、偏差。即使如此,對這種這種 n50的的資料進(jìn)行檢驗只適宜于希望資料進(jìn)行檢驗只適宜于希望 H0 被接被接受的場合;如果希望受的場合;如果希望H0被拒絕被拒絕, 設(shè)計設(shè)計獲得樣本百分?jǐn)?shù)的獲得樣本百分?jǐn)?shù)的 n 還是越大越好,還是越大越好,達(dá)不到達(dá)不到100也不要少于也不要少于50。 第三節(jié)第三節(jié) 二項資料的百分?jǐn)?shù)二項資料的百分?jǐn)?shù)二、兩個樣本百分?jǐn)?shù)二、兩個樣本百分?jǐn)?shù) 例例3.11 原殺蟲劑在原殺蟲劑在1000頭蟲子中殺死頭蟲子中殺死657頭頭, 新殺蟲劑在新殺蟲劑在1000頭蟲子中殺死頭蟲子中殺死728 頭頭, 試測驗兩者的殺蟲率有無顯著差異?試測驗兩者的殺蟲率有無顯著差異?解解 p1= 0.657

46、, p2 = 0.728 , n1 = n2 = 1000 p1或或 p2 (0.1, 0.9 ), 可進(jìn)行可進(jìn)行u-test (1)H0: p1 p2 (同時有同時有:p12 =p22 )(2)pe = ( n1 p1 +n2 p2 ) / (n1+n2 )= 0.6925 = ( 657 +728 ) / (1000+1000 ) qe =1 - pe = 1 0.6925 = 0.3075 p1- p2= (pe qe (1/n1+1/n2 )= 0.021 = (pe qe (1/1000+1/1000 ) u = (p1 p2 ) (p1 p2 ) / p1- p2 = (0.657

47、 0.728 ) / 0.021= -3.44 (3)查得兩尾)查得兩尾u0.05 = 1.96(4)推斷)推斷u u0.05 H0不成立。不成立。 本例計算標(biāo)準(zhǔn)誤的本例計算標(biāo)準(zhǔn)誤的前提是可以合并兩前提是可以合并兩個樣本百分?jǐn)?shù),然后計算個樣本百分?jǐn)?shù),然后計算Se2 = pe qe,之,之所以這樣作而不象前例計算所以這樣作而不象前例計算Se2 = (1S12 +2S22) / (1+2) 前先插入前先插入F檢驗且知檢驗且知兩個樣本方差比無顯著性,是因為該題兩個樣本方差比無顯著性,是因為該題型的型的H0有雙重作用有雙重作用,即作出即作出H0: p1 p2 后,后,H0 :p12 =p22 也同真也

48、同真,原因在于,原因在于二項總體的二項總體的2 = p q = p(1-p)。 至于至于n1 或或 n2 50的兩個樣本百分?jǐn)?shù)的兩個樣本百分?jǐn)?shù)差異顯著性檢驗問題,即使是有差異顯著性檢驗問題,即使是有 t-test并且可以進(jìn)行連續(xù)性矯正并且可以進(jìn)行連續(xù)性矯正, 同樣因為只同樣因為只有利于接受有利于接受H0而不利于拒絕而不利于拒絕H0, 實際應(yīng)實際應(yīng)用中不受推崇用中不受推崇。第四節(jié)第四節(jié) 次數(shù)資料的次數(shù)資料的2一、一、 2的定義和分布的定義和分布 假定從一個假定從一個既定的母總體中隨機抽取容量既定的母總體中隨機抽取容量為為 n 的樣本,則定義:的樣本,則定義: 2 = SS / 2 = (n 1)S 2 / 2 = S 2 / 2 抽樣研究的結(jié)果已證實抽樣研究的結(jié)果已證實, 2也是一個連續(xù)性也是一個連續(xù)性變量變量, 理論上存在著抽樣分布,這就是理論上存在著抽樣分布,這就是2分布。分布。它的兩個參數(shù)分別為:它的兩個參數(shù)分別為:2 =, 2 2 = 2 2分布是由自由度分布是由自由度 n 1 決定的曲線系統(tǒng),決定的曲線系統(tǒng),因為受因為受2 0的限制,任一條都限于縱坐標(biāo)右側(cè);的限制,任一條都

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論