生物統(tǒng)計第四章統(tǒng)計推斷_第1頁
生物統(tǒng)計第四章統(tǒng)計推斷_第2頁
生物統(tǒng)計第四章統(tǒng)計推斷_第3頁
生物統(tǒng)計第四章統(tǒng)計推斷_第4頁
生物統(tǒng)計第四章統(tǒng)計推斷_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

生物統(tǒng)計第四章統(tǒng)計推斷第一頁,共七十六頁,編輯于2023年,星期日第一節(jié):概率論基礎(chǔ)第二節(jié):抽樣分布第三節(jié):參數(shù)估計簡介第四節(jié):假設(shè)檢驗的基本原理第四章統(tǒng)計推斷概述第二頁,共七十六頁,編輯于2023年,星期日什么是統(tǒng)計推斷統(tǒng)計推斷Statisticalinference通過樣本數(shù)據(jù)的統(tǒng)計分析對總體特征或分布所作出的估計或推論統(tǒng)計推斷通常是以概率的形式表述的主要內(nèi)容包括參數(shù)估計和假設(shè)檢驗第三頁,共七十六頁,編輯于2023年,星期日如果事件A和事件B為獨立事件,則事件A與事件B同時發(fā)生的概率P(AB)=P(A)?P(B)。乘法定理:獨立事件同時發(fā)生加法原理:互斥事件和概率第一節(jié)概率論基礎(chǔ)第四頁,共七十六頁,編輯于2023年,星期日第五頁,共七十六頁,編輯于2023年,星期日3.正態(tài)分布曲線上第六頁,共七十六頁,編輯于2023年,星期日(μ)確定曲線在x軸上的中心位置,(σ)確定曲線的展開程度。平均數(shù)的影響標準差的影響第七頁,共七十六頁,編輯于2023年,星期日第八頁,共七十六頁,編輯于2023年,星期日第九頁,共七十六頁,編輯于2023年,星期日第十頁,共七十六頁,編輯于2023年,星期日第十一頁,共七十六頁,編輯于2023年,星期日第十二頁,共七十六頁,編輯于2023年,星期日第二節(jié)抽樣分布統(tǒng)計學(xué)的一個主要任務(wù)是研究總體和樣本之間的關(guān)系。從兩個方向進行研究:1.總體到樣本:要研究從總體中抽出的所有可能樣本統(tǒng)計量的分布及其與原總體的關(guān)系,即為抽樣分布;2.樣本到總體:從總體中隨機抽取樣本,并用樣本對總體做出推論,即為統(tǒng)計推斷。第十三頁,共七十六頁,編輯于2023年,星期日抽樣分布的概念樣本統(tǒng)計量的概率分布稱為抽樣分布統(tǒng)計量:由樣本數(shù)完全確定,不包含任何未知數(shù)的量。

樣本是通過對總體的隨機抽樣獲得的樣本統(tǒng)計量是隨機變量,有一定的概率分布簡單隨機樣本抽樣是完全隨機的-總體中的每個個體都有相同的機會被抽中抽樣是彼此對立的-每次抽樣的結(jié)果都不會影響到其他抽樣的結(jié)果第十四頁,共七十六頁,編輯于2023年,星期日抽樣分布的概念n

統(tǒng)計量原總體樣本1樣本2樣本n新總體第十五頁,共七十六頁,編輯于2023年,星期日一、2分布定義設(shè)隨機變量X1,X2,,Xn彼此獨立且都服從標準正態(tài)分布N(0,1),則隨機變量服從自由度為n的2分布,記為第十六頁,共七十六頁,編輯于2023年,星期日2分布第十七頁,共七十六頁,編輯于2023年,星期日性質(zhì)2分布隨機變量的取值范圍為(0,)若Y1~2(n),Y2~2(m),且相互獨立,則Y1±Y2~2(n±m(xù))(可加性)2分布為非對稱分布,其分布曲線的形狀由自由度決定,自由度越大,分布越趨于對稱當(dāng)

n

,2(n)N(n,2n)

2分布第十八頁,共七十六頁,編輯于2023年,星期日第十九頁,共七十六頁,編輯于2023年,星期日t分布定義設(shè)Z~N(0,1),Y~2(n),且相互獨立,則

服從自由度為n的t分布,記為第二十頁,共七十六頁,編輯于2023年,星期日t分布第二十一頁,共七十六頁,編輯于2023年,星期日性質(zhì)與標準正態(tài)分布相似關(guān)于t=0對稱只有一個峰,峰值在t=0分布曲線受自由度影響,自由度越小,離散程度越大當(dāng)n

,t(n)N(0,1)t分布第二十二頁,共七十六頁,編輯于2023年,星期日t分布與正態(tài)分布的比較:低于標準正態(tài)分布t分布第二十三頁,共七十六頁,編輯于2023年,星期日t分布雙側(cè)分位數(shù)表:附表t分布第二十四頁,共七十六頁,編輯于2023年,星期日F分布定義若X~2(m),Y~2(n),且相互獨立,則服從自由度為m(第一自由度)和n(第二自由度)的F分布,記為第二十五頁,共七十六頁,編輯于2023年,星期日F分布第二十六頁,共七十六頁,編輯于2023年,星期日性質(zhì)F分布隨機變量的取值范圍為(0,)F分布的分布曲線受兩個自由度的影響若F~F(m,n),則1/F~F(n,m)若X~t(n),則X2~F(1,n)F分布第二十七頁,共七十六頁,編輯于2023年,星期日F分布的上側(cè)分位數(shù)表:附表F分布第二十八頁,共七十六頁,編輯于2023年,星期日正態(tài)總體樣本平均數(shù)的分布樣本平均數(shù)的期望和方差設(shè)樣本來自均數(shù)為,方差為2的總體設(shè)樣本為簡單隨機樣本第二十九頁,共七十六頁,編輯于2023年,星期日期望正態(tài)總體樣本平均數(shù)的分布第三十頁,共七十六頁,編輯于2023年,星期日方差標準差(平均數(shù)的標準誤)正態(tài)總體樣本平均數(shù)的分布第三十一頁,共七十六頁,編輯于2023年,星期日正態(tài)總體樣本平均數(shù)的分布設(shè)樣本來自正態(tài)總體N(,2),則樣本平均數(shù)也服從正態(tài)分布,其總體均數(shù)為,方差為2/n。正態(tài)總體樣本平均數(shù)的分布第三十二頁,共七十六頁,編輯于2023年,星期日正態(tài)總體樣本平均數(shù)的分布設(shè)樣本來自正態(tài)總體N(,2),則樣本平均數(shù)也服從正態(tài)分布,其總體均數(shù)為,方差為2/n。正態(tài)總體樣本平均數(shù)的分布第三十三頁,共七十六頁,編輯于2023年,星期日例題:設(shè)總體X~N(52,6.32)中隨機抽取一容量為36的樣本,求樣本均值落在50.8和53.8之間的概率。第三十四頁,共七十六頁,編輯于2023年,星期日第三十五頁,共七十六頁,編輯于2023年,星期日中心極限定理

無論樣本所來自的總體是否服從正態(tài)分布,只要樣本足夠大,樣本平均數(shù)就近似服從正態(tài)分布,樣本越大,近似程度越好。所需的樣本含量隨原總體的分布而異,但只要樣本含量30,無論原總體是何分布,都足以滿足近似的要求。設(shè)原總體的期望為,方差為2,則樣本平均數(shù)的期望為,方差為2/n。第三十六頁,共七十六頁,編輯于2023年,星期日正態(tài)總體樣本方差的

分布樣本方差的期望和方差設(shè)樣本來自均數(shù)為,方差為2的總體設(shè)樣本為簡單隨機樣本第三十七頁,共七十六頁,編輯于2023年,星期日樣本方差的分布正態(tài)總體樣本方差的

分布第三十八頁,共七十六頁,編輯于2023年,星期日第二節(jié)參數(shù)估計第三十九頁,共七十六頁,編輯于2023年,星期日參數(shù)估計參數(shù)估計的定義以樣本統(tǒng)計量對總體參數(shù)進行估計基本形式點估計(pointestimation):是以樣本的統(tǒng)計數(shù)估計總體的相應(yīng)參數(shù)。區(qū)間估計(intervalestimation):在一定概率保證下,估計參數(shù)可能在內(nèi)的一個范圍或區(qū)間。第四十頁,共七十六頁,編輯于2023年,星期日第四十一頁,共七十六頁,編輯于2023年,星期日

基本方法-構(gòu)造函數(shù)g(x)的方法矩法:用與總體參數(shù)相應(yīng)的樣本統(tǒng)計量作為估計值,必要時可對統(tǒng)計量作適當(dāng)調(diào)整最大似然法:用使樣本觀測值的似然函數(shù)達到最大的統(tǒng)計量作為估計值最小二乘法:用使估計誤差平方和的統(tǒng)計量作為估計值貝葉斯法:根據(jù)貝葉斯理論構(gòu)造估計量第四十二頁,共七十六頁,編輯于2023年,星期日衡量估計值優(yōu)劣的指標無偏性:無偏估計:有偏估計:參數(shù)估計-點估計第四十三頁,共七十六頁,編輯于2023年,星期日樣本方差的期望s2是2的無偏估計量參數(shù)估計-點估計第四十四頁,共七十六頁,編輯于2023年,星期日抽樣方差/標準誤:估計值的方差/標準差樣本平均數(shù)的抽樣方差:參數(shù)估計-點估計第四十五頁,共七十六頁,編輯于2023年,星期日均方誤差:一致性:估計值隨著樣本的增大而更加接近 真值有效性:抽樣方差達到最小的無偏估計充分性:估計函數(shù)包含了關(guān)于被估參數(shù)的全 部信息參數(shù)估計-點估計第四十六頁,共七十六頁,編輯于2023年,星期日參數(shù)估計-區(qū)間估計以一定的置信度對參數(shù)可能取值范圍的估計1-:置信度(置信水平)[t1,t2]:置信區(qū)間t1、t2:置信限(置信下限、置信上限)求統(tǒng)計量t1和t2

,使得對于給定的(01,常用=0.05和=0.01),有第四十七頁,共七十六頁,編輯于2023年,星期日正態(tài)總體平均數(shù)的區(qū)間估計當(dāng)2已知標準正態(tài)分布兩尾概率分位點參數(shù)估計-區(qū)間估計第四十八頁,共七十六頁,編輯于2023年,星期日參數(shù)估計-區(qū)間估計例4-1:已知某一樣本所屬的總體方差為σ2=100,隨機抽取10個變數(shù)為:34、19、30、27、11、29、27、30、48、26。求總體平均數(shù)μ的置信區(qū)間。Ⅰ。樣本平均數(shù):Ⅱ。確定置信水平為0.95:Ⅲ。算得標準誤及置信半徑:

Ⅳ。計算置信區(qū)間:解:第四十九頁,共七十六頁,編輯于2023年,星期日正態(tài)總體平均數(shù)的區(qū)間估計當(dāng)2未知參數(shù)估計-區(qū)間估計第五十頁,共七十六頁,編輯于2023年,星期日t分布兩尾概率分位點參數(shù)估計-區(qū)間估計第五十一頁,共七十六頁,編輯于2023年,星期日從某魚場收蝦的總體中,隨機取20尾對蝦,測得平均體長為120mm,標準差15mm,試估計置信度為99%的對蝦總體平均數(shù)分布區(qū)間。由于2未知,需要S2估計2。查t值雙尾表,當(dāng)df=20-1=19,t0.01=2.861.具體計算如下:x-s=s√n=15√20=3.354第五十二頁,共七十六頁,編輯于2023年,星期日正態(tài)總體方差的區(qū)間估計2分布上尾概率分位點參數(shù)估計-區(qū)間估計第五十三頁,共七十六頁,編輯于2023年,星期日/2/21-參數(shù)估計-區(qū)間估計第五十四頁,共七十六頁,編輯于2023年,星期日例4-2、設(shè)出生嬰兒的體重服從正態(tài)總體中隨機地抽取11名出生嬰兒,測得其體重如下:(單位;kg)3.10、2.52、3.00、3.60、3.16、3.56、3.32、2.88、2.60、3.40、2.54,試求方差的置信度為0.95得置信區(qū)間。解:因為置信度1-為0.95,所以=0.05,/2=0.025,1-

/2=0.975,自由度df=10,查附表3得:第五十五頁,共七十六頁,編輯于2023年,星期日參數(shù)估計-區(qū)間估計置信下限置信上限第五十六頁,共七十六頁,編輯于2023年,星期日第三節(jié)假設(shè)檢驗第五十七頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗(Hypothesis)概念:所謂假設(shè)是指對總體的某些未知的或不完全知道的性質(zhì)所提出的得考察的命題,假設(shè)檢驗是指根據(jù)樣本資料對假設(shè)的成立與否進行推斷假設(shè)檢驗又稱為顯著性檢驗(TestofSignificance)第五十八頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗(Hypothesis)假設(shè)檢驗的基本原理:某種豬場場長對客戶稱該豬場種豬在100kg體重時的平均背膘厚為9mm,場長的態(tài)度導(dǎo)致4種可能:誠實確實為9mm不知道估計值,低于或高于9mm謹慎保守說法,實際低于9mm,吹??浯笳f法,實際高于9mm,第一種假設(shè)分別與第二、三、四種假設(shè)是對立的,即有三對對立的假設(shè),對假設(shè)進行判斷,就要進行假設(shè)檢驗第五十九頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗(Hypothesis)如何進行檢驗:樣本平均數(shù)總體均數(shù)推斷樣本隨機抽樣總體第六十頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗的基本步驟

假設(shè)我們從某種豬場隨機抽取了10頭豬,其平均背膘厚為8.7mm,已知該豬場100kg體重時的平均背膘厚服從N(9,2.52),試問該場長宣稱的9mm是否可信?第六十一頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗的基本步驟1、提出假設(shè)(成對的)

H0:原假設(shè)或零假設(shè),被直接檢驗的假設(shè),否定或接受(nullhypothesis)

HA:備擇假設(shè),一旦否定原假設(shè)就接受備擇假設(shè)(alternativehypothesis)第六十二頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗的基本步驟2、構(gòu)造并計算檢驗統(tǒng)計量(teststatistic)

利用原假設(shè)所提供的信息,而且其抽樣分布已知第六十三頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗的基本步驟3、確定否定域(臨界值)

根據(jù)小概率事件原理,比較檢驗統(tǒng)計量和臨界值的關(guān)系,確定其落在否定域還是接收域。-1.961.96接受區(qū)域95%否定區(qū)域2.5%否定區(qū)域2.5%0-2.582.58第六十四頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗的基本步驟4、對假設(shè)進行統(tǒng)計推斷

顯著水平:0.01;0.05

(1)差異不顯著:接受原假設(shè)(2)差異顯著:在0.05水平下,否定原假設(shè),接受備擇假設(shè)(3)差異極顯著:在0.01水平下,否定原假設(shè),接受備擇假設(shè)結(jié)論:否定原假設(shè),接受備擇假設(shè)第六十五頁,共七十六頁,編輯于2023年,星期日假設(shè)檢驗的基本步驟統(tǒng)計推斷結(jié)果的表示方式(1)差異不顯著:用ns作上標(2)差異顯著:用*作上標(3)差異極顯著:用**作上標第六十六頁,共七十六頁,編輯于2023年,星期日一些相關(guān)概念雙側(cè)(二尾)檢驗與單側(cè)(一尾)檢驗

采用什么檢驗,這與檢驗的目的有關(guān),根據(jù)備擇假設(shè)同樣可以確定檢驗的尾數(shù)。

(無效假設(shè),HO

:1

=

2

雙側(cè)檢驗:檢驗時采用的否定域位于檢驗統(tǒng)計量的二尾,備擇假設(shè)為,HA

:1

2

或1

20

單側(cè)檢驗:檢驗時采用的否定域位于檢驗統(tǒng)計量的一尾,備擇假設(shè)為,HA

:1

2

或1

2

一尾t(df)=二尾t2(df),一尾t0.05(df)=二尾t0.10(df)第六十七頁,共七十六頁,編輯于2023年,星期日一些相關(guān)概念雙側(cè)檢驗單側(cè)檢驗單側(cè)檢驗左側(cè)右側(cè)第六十八頁,共七十六頁,編輯于2023年,星期日一些相關(guān)概念雙側(cè)檢驗右側(cè)檢驗左側(cè)檢驗/2/2第六十九頁,共七十六頁,編輯于2023年,星期日一些相關(guān)概念相伴概率

相伴概率是指在原假設(shè)成立時檢驗統(tǒng)計量觀察值以及比它更為極端的可能值出現(xiàn)的概率之和,用P表示。

左側(cè)檢驗右側(cè)檢驗雙側(cè)檢驗第七十頁,共七十六頁,編輯于2023年,星期日一些相關(guān)概念根據(jù)“小概率事件實際不可能性原理”來進行統(tǒng)計推斷是沒有百分之百的把握。

“差異顯著”95%把握,冒5%的風(fēng)險

(I型錯誤又稱α錯誤)。

“差異極顯著”99%把握,冒1%的風(fēng)險

(I型錯誤拒真錯誤當(dāng)Ho正確時,被否定了的錯誤)。

“差異不顯著”,如果接受Ho,也同樣要犯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論