第4章 統(tǒng)計推斷.ppt_第1頁
第4章 統(tǒng)計推斷.ppt_第2頁
第4章 統(tǒng)計推斷.ppt_第3頁
第4章 統(tǒng)計推斷.ppt_第4頁
第4章 統(tǒng)計推斷.ppt_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章 統(tǒng)計推斷,第一節(jié) 假設檢驗的方法 第二節(jié) 單個樣本平均數(shù)假設測驗 第三節(jié) 兩個樣本平均數(shù)假設測驗 第四節(jié) 參數(shù)的區(qū)間估計,學習目的,理解假設檢驗與區(qū)間估計的原理 掌握假設檢驗的步驟 對實際問題進行統(tǒng)計測驗及總體參數(shù)估計,第一節(jié) 假設檢驗的方法,統(tǒng) 計 推 斷 的 概 念,統(tǒng)計數(shù),抽樣分布,統(tǒng)計推斷,一. 統(tǒng)計推斷的概念,統(tǒng)計推斷:是指根據(jù)已知樣本的特征特性,推斷總體的特征特性。 統(tǒng)計推斷能排除試驗誤差影響,揭示出事物的內(nèi)在規(guī)律。 假設檢驗 參數(shù)估計,2.統(tǒng)計推斷在統(tǒng)計方法中的地位,統(tǒng)計方法,統(tǒng)計描述,統(tǒng)計推斷,假設檢驗,參數(shù)估計,例 某地區(qū)的當?shù)匦←溒贩N一般畝產(chǎn)300kg,其標準差為7

2、5kg,現(xiàn)有某新品種通過25個小區(qū)的試驗,計得其樣本平均產(chǎn)量為每畝330kg, 問新品種產(chǎn)量與當?shù)仄贩N產(chǎn)量是否有顯著差異?,實例,提出假設 假設新品種產(chǎn)量與當?shù)仄贩N產(chǎn)量無差異,=300,x=330,=300,抽樣分布,+1.96,樣本均值,330,我們是拒絕還是接受=300?,假設宣稱的敘述為真(假設新品種產(chǎn)量與當?shù)仄贩N產(chǎn)量無差異,即x=330屬于N(300,75)總體),如果推得實驗結(jié)果發(fā)生的可能性很低,則敘述不真。 “小概率原則”是指小概率事件在一次觀測或試驗中一般是不會發(fā)生的。如果在一次觀測中,小概率事件居然發(fā)生了,我們就有理由認為這個現(xiàn)象是不合適的。,3.假設測驗的理論基礎,1.假設:

3、對總體參數(shù)的一種看法 無效假設(或零假設 null hypothesis 備擇假設(或?qū)α⒓僭Oalternative hypothesis),二、假設測驗的步驟,如,假設我們所研究的樣本是來自指定的總體,這稱為無效假設。 常表示的形式有:H0:=0 H0:=C H0:1- 2=0 H0:1,什么是無效假設,與無效假設對立的假設。 常表示的形式有:HA:0 HA:C HA:1- 20 HA:1,什么是備擇假設,2.確定顯著水平Significance Level,用來推斷無效假設否定與否的概率標準叫做顯著水平 研究者根據(jù)試驗的要求和試驗的結(jié)論的重要性而定 試驗中難以控制的因素較多,試驗誤差可能較

4、大,則取大值。如果試驗耗費較大,對精確度要求較高,不容許反復,則取小值。,=0.05時否定原假設,稱差異性是顯著的,顯著性檢驗,=0.01時否定原假設,稱差異性是極顯著的,3.測驗計算,1、在無效假設正確的假定下,依據(jù)統(tǒng)計數(shù)的抽樣分布,計算樣本平均數(shù)的出現(xiàn)概率。 2、確定適當?shù)臏y驗統(tǒng)計量 是大樣本還是小樣本 總體方差已知還是未知,(1)已知時的假設檢驗 在H0:=0成立時有 (2)未知時的假設檢驗 當n30時近似服從正態(tài)分布 當n30時服從t分布,4、作出統(tǒng)計決策,根據(jù)給定的顯著水平,查表得出相應的臨界值u ()或u(/2) 將測驗統(tǒng)計量的值與水平的臨界值進行比較 得出接受或拒絕無效假設的結(jié)論

5、,(1) 提出假設,包括無效假設和備擇假設。 (2) 規(guī)定測驗的顯著水平 值。 (3) 在無效假設確定的情況下,計算概率。 (4) 統(tǒng)計推斷。 (5) 生物學意義說明。,綜合上述,統(tǒng)計假設測驗的步驟可總結(jié)如下:,第二節(jié) 單個樣本平均數(shù)假設測驗,例1, 某地區(qū)的當?shù)匦←溒贩N一般畝產(chǎn)300kg,其標準差為75kg,現(xiàn)有某新品種通過25個小區(qū)的試驗,計得其樣本平均產(chǎn)量為每畝330kg, 問新品種產(chǎn)量與當?shù)仄贩N產(chǎn)量是否有顯著差異?,1. 假設,先假設新品種產(chǎn)量與當?shù)仄贩N產(chǎn)量無差異,記作 H0:新=原=300kg HA:新原,2. 確定顯著水平,取=0.05,在假定H0成立的前提下進行計算,3. 統(tǒng)計計

6、算,查附表2,當u=2時,P(概率)界于0.04和0.05之間,即330kg在原抽樣總體中出現(xiàn)的概率小于5%,根據(jù)小概率不可能原理,拒絕H0,接受HA,4. 統(tǒng)計推斷,5. 生物學意義說明,新品種產(chǎn)量與當?shù)仄贩N產(chǎn)量有顯著差異, 例2 某春小麥良種的千粒重0=34g,現(xiàn)自外地引入一高產(chǎn)品種,在8個小區(qū)種植,得其千粒重(g)為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問新引入品種的千粒重是否與當?shù)亓挤N有顯著差異?,這里總體 為未知,又是小樣本,故需用t 測驗;,1.假設 H0:34g;對HA: 34g。,2.取顯著水平 =0.05。,3. 概率計算:,4.

7、統(tǒng)計推斷:,查附表 ,df=7時,t=2.069t0.05=1.895。故P0.05。,5. 推斷:拒絕H0: 34g ,即新引入品種千粒重顯著高于當?shù)亓挤N。,假設測驗的理論基礎為,“小概率事件實際不可能原理” 樣本平均數(shù)的抽樣分布,樣本平均數(shù)的抽樣分布,a、從正態(tài)總體抽取的樣本,無論樣本容量多大,其樣本平均數(shù)x的抽樣分布必成正態(tài)分布。 b、不是正態(tài)分布,當樣本容量n足夠大時,從這一總體抽出樣本平均數(shù)x的分布趨于正態(tài)分布。 c、不是正態(tài)分布,當樣本容量n較小時,樣本平均數(shù)x的分布趨于t分布。,(1)已知時的假設檢驗 在H0:=0成立時有 (2)未知時的假設檢驗 當n30時近似服從正態(tài)分布 當n

8、30時服從t分布,已知普通水稻單株產(chǎn)量符合正態(tài)分布N(250, 2.782)?,F(xiàn)測得10株雜交水稻單株產(chǎn)量分別為272、200、268、247、267、246、363、216、206、256。問雜交稻單株產(chǎn)量與普通水稻單株產(chǎn)量是否有差異?,兩尾測驗與一尾測驗,H0,抽樣分布,接收區(qū),樣本均值,1-,拒絕區(qū),拒絕區(qū),H0,抽樣分布,接收區(qū),樣本均值,1-,拒絕區(qū),臨界值,假設測驗的兩類錯誤,(1)選取適當?shù)闹担哼x取數(shù)值小的值,如從5%變?yōu)?%,可以降低犯I型錯誤的概率,但是將增大第二類錯誤的概率。 (2)增加試驗重復次數(shù):如果顯著水平已固定下來,則改進試驗技術(shù)和增加樣本容量,提高試驗的精確度,可

9、以有效地降低犯第二類錯誤的概率。 (3)對于田間試驗,由于試驗條件不容易控制,試驗誤差較大,應選取較高值,以降低犯II型錯誤的概率。,關(guān)于兩類錯誤的討論可總結(jié)如下:,由兩個樣本平均數(shù)的相差,以測驗這兩個樣本所屬的總體平均數(shù)有無顯著差異。,測驗方法,成組數(shù)據(jù)的平均數(shù)比較,成對數(shù)據(jù)的比較,第三節(jié) 兩個樣本平均數(shù)的假設測驗,(一) 成組數(shù)據(jù)的平均數(shù)比較,1. u檢驗 兩個樣本總體方差已知,或總體方差未知,但為大樣本時采用,例1 已知早稻佳輻品種2=1.35,用A、B兩種方法取樣,A取15個樣點,平均產(chǎn)量x1=7.69;B法取9個樣點,平均產(chǎn)量x2=8.77。檢驗兩種取樣法測得的小區(qū)產(chǎn)量是否有差異?,

10、2. t檢驗,在兩個樣本的總體方差未知(12= 22= 2 ),且為小樣本時,用t檢驗 在兩個樣本的總體方差未知(1222 2 ),且為小樣本時,用近似t檢驗,兩個總體方差的檢驗F檢驗,對于來自于兩個總體的樣本,其總體方差分別為12和22,從兩個總體中獨立抽取容量為n1和n2的樣本,對應樣本的方差分別為S12與S22。 該統(tǒng)計量服從分子自由度為n1-1,分母自由度n2-1的F分布。,1、它是一種非對稱分布,取值范圍是(0,+); 2、它有兩個自由度,求F時,將數(shù)值大的均方放在分子,數(shù)值小的均方放在分母; 3、F分布是隨自由度變化的一簇偏態(tài),不同的自由度決定了F 分布的形狀。,例,某廠家從兩個供

11、貨商進貨,分別是貨物A和貨物B。已經(jīng)列出兩種貨物的樣本數(shù)據(jù),如表所示。問貨物A的重量波動是否明顯高于貨物B。,在兩個樣本的總體方差未知(12= 22= 2 ),且為小樣本時,用t檢驗,例2 測得馬鈴薯兩個品種魯引1號和大西洋的塊莖干物質(zhì)含量結(jié)果如表,檢驗兩個品種馬鈴薯的塊莖干物質(zhì)含量有無差異? 兩個品種馬鈴薯干物質(zhì)含量(%),差數(shù)平均數(shù)的標準誤為:,它具有 v =n1。若假設 ,則上式改為:,(二) 成對數(shù)據(jù)的比較,例4-7 選生長期、發(fā)育進度、植株大小和其他方面皆比較一致的兩塊地的紅心地瓜苗配成一對,共有6對。每對中一塊地按標準化栽培,另一塊地進行綠色有機栽培,用來研究不同栽培措施對產(chǎn)量的影

12、響,每塊地瓜產(chǎn)量見表。檢驗兩種栽培方式的地瓜產(chǎn)量是否有差異。,表 兩種栽培方法的地瓜產(chǎn)量 單位(kg/畝),第四節(jié) 參數(shù)估計parameter estimation,參數(shù)估計:所謂參數(shù)估計根據(jù)樣本統(tǒng)計量對總體參數(shù)進行估計。 點估計:將樣本數(shù)據(jù)計算的統(tǒng)計量的觀測值作為總體的參數(shù)估計值。 區(qū)間估計:是指在一定的概率保證之下,用特征數(shù)估計總體參數(shù)的可能取值范圍。,一、什么是參數(shù)估計,在點估計中,用某個統(tǒng)計量作為總體參數(shù)的估計值,如x作為的估計值。 而區(qū)間估計中,要求出兩個統(tǒng)計量來分別估計總體參數(shù)的上限和下限,使在區(qū)間L1,L2的概率為1-。 1-稱為置信水平 L1,L2稱為置信區(qū)間,在總體方差 為未知時 因為 服從自由度為n-1的t分布,兩尾概率為時,有,置信區(qū)間為:,例1 已算得某春小麥良種在8個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論