生物統(tǒng)計學第3章:抽樣與抽樣分布_第1頁
生物統(tǒng)計學第3章:抽樣與抽樣分布_第2頁
生物統(tǒng)計學第3章:抽樣與抽樣分布_第3頁
生物統(tǒng)計學第3章:抽樣與抽樣分布_第4頁
生物統(tǒng)計學第3章:抽樣與抽樣分布_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

生物統(tǒng)計學

第三章抽樣與參數(shù)估計[1]1參數(shù)估計在統(tǒng)計方法中的地位統(tǒng)計方法2描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗統(tǒng)計推斷的過程3樣本總體樣本統(tǒng)計量例如:樣本均值比例、方差總體均值、比例、方差第三章抽樣與參數(shù)估計第一節(jié)抽樣與抽樣分布第二節(jié)參數(shù)估計基本方法第三節(jié)總體均值和總體比例的區(qū)間估計第四節(jié)兩個總體均值及兩個總體比例之差的估計第五節(jié)正態(tài)總體方差及兩正態(tài)總體方差比的區(qū)間估計4學習目標了解抽樣和抽樣分布的基本概念理解抽樣分布與總體分布的關系了解點估計的概念和估計量的優(yōu)良標準掌握總體均值、總體比例和總體方差的

區(qū)間估計5第一節(jié)抽樣與抽樣分布一.總體、個體和樣本二.關于抽樣方法三.樣本均值的分布與中心極限定理四.樣本方差的分布五.兩個樣本方差比的分布六.

T統(tǒng)計量的分布6總體、個體和樣本

(概念要點回顧)總體(Population):調(diào)查研究的事物或現(xiàn)象的全體個體(Itemunit):組成總體的每個元素樣本(Sample):從總體中所抽取的部分個體樣本容量(Samplesize):樣本中所含個體的數(shù)量7抽樣方法歸類

(概念要點)概率抽樣:根據(jù)已知的概率選取樣本

簡單隨機抽樣:完全隨機地抽選樣本

分層抽樣:總體分成不同的“層”,在每一層內(nèi)進行抽樣

整群抽樣:將一組被調(diào)查者(群)作為一個抽樣單位

等距抽樣:在樣本框中每隔一定距離抽選一個被調(diào)查者非概率抽樣:不是完全按隨機原則選取樣本

非隨機抽樣:由調(diào)查人員自由選取被調(diào)查者

判斷抽樣:通過某些條件過濾來選擇被調(diào)查者配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調(diào)查者8樣本均值的抽樣分布9抽樣分布

(概念要點)所有樣本指標(如均值、比例、方差等)所形成的分布稱為抽樣分布是一種理論概率分布隨機變量是樣本統(tǒng)計量樣本均值,樣本比例和樣本方差等結果來自容量相同的所有可能樣本 10樣本均值的抽樣分布

[例子3.1]11【例3.1】設一個總體,含有4個元素(個體),即總體元素數(shù)N=4。4個元素分別為X1=1、X2=2、X3=3、X4=4總體的均值、方差及分布如下均值和方差總體分布14230.1.2.3樣本均值的抽樣分布

[例子3.1]12現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布

[例子3.1]13計算出各樣本的均值如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有樣本均值的均值和方差14式中:M為樣本數(shù)目比較及結論:樣本均值的均值(數(shù)學期望)等于總體均值樣本均值的方差等于總體方差的1/n樣本均值的分布與總體分布的比較15抽樣分布

=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布規(guī)律16

=50

=10X總體分布n=4抽樣分布Xn=16當總體服從正態(tài)分布N(μ,

σ2)時,來自該總體的所有容量為n的樣本的均值

也服從正態(tài)分布,

的數(shù)學期望為μ,方差為σ2/n。即

~N(μ,

σ2/n)中心極限定理(圖示)17當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設從均值為

,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X樣本方差的抽樣分布18樣本方差的分布19

設總體服從正態(tài)分布N(μ,σ2),X1,X2,…,Xn為來自該正態(tài)總體的樣本,則樣本方差S2

的分布為將

2(n–1)稱為自由度為(n-1)的卡方分布卡方分布卡方分布是統(tǒng)計學家Pearson于1900年首先提出的。卡方分布是重要的統(tǒng)計分布。在假設檢驗、區(qū)間估計、方差分析、回歸分析和試驗設計等數(shù)理統(tǒng)計均有重要應用。20卡方(c2)分布21

選擇容量為n的簡單隨機樣本計算樣本方差S2計算卡方值

2=(n-1)S2/σ2計算出所有的

2值不同自由度的抽樣分布c2df=1df=4df=10df=20ms總體均值的標準誤所有可能的樣本均值的標準差,測度所有樣本均值的離散程度小于總體標準差??計算公式為22兩個樣本方差比的抽樣分布23兩個樣本方差比的抽樣分布24

設X1,X2,…,Xn1是來自于一個正態(tài)分布總體X~N(μ1,σ12)的一個樣本,Y1,Y2,…,Yn2是來自正態(tài)總體Y~N(μ2,σ22)的一個樣本,且Xi(i=1,2,…,n1),Yi(i=1,2,…,n2)相互獨立,則將F(n1-1,n2-1)稱為第一自由度為(n1-1),第二自由度為(n2-1)的F分布兩個樣本方差比的抽樣分布25

不同自由度的抽樣分布F(1,10)(5,10)(10,10)F分布F分布是統(tǒng)計學家R.A.Fisher于1924年首先發(fā)現(xiàn)的。F分布在假設檢驗、區(qū)間估計、方差分析、回歸分析和試驗設計等數(shù)理統(tǒng)計均有重要應用。26T統(tǒng)計量的分布

由英國統(tǒng)計學家威廉?西利?戈塞特(Willam

SealyGosset)在1908年提出。27T

統(tǒng)計量的分布28

設X1,X2,…,Xn是來自正態(tài)總體N(μ1,

σ12)的一個樣本,稱為統(tǒng)計量,它服從自由度為n-1的t

分布Xt

分布與正態(tài)分布的比較t分布正態(tài)分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)Z第二節(jié)參數(shù)估計基本方法點估計點估計的優(yōu)良性準則區(qū)間估計29參數(shù)估計方法30矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計被估計的總體參數(shù)31總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體均值比例方差兩個總體均值之差比例之差方差比點估計32點估計

(概念要點)從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計例如:用樣本均值作為總體未知均值的估計值就是一個點估計2.

點估計沒有給出估計值接近總體未知參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等33估計量

(概念要點)1.用于估計總體某一參數(shù)的隨機變量如樣本均值,樣本比例、樣本中位數(shù)等例如:樣本均值就是總體均值

的一個估計量如果樣本均值

x

=3,則3

就是

的估計值2.理論基礎是抽樣分布34二戰(zhàn)中的點估計估計量的優(yōu)良性準則

(無偏性)無偏性:估計量的數(shù)學期望等于被估計的總體參數(shù)35P(X)XCA

無偏有偏估計量的優(yōu)良性準則

(有效性)36AB

中位數(shù)的抽樣分布均值的抽樣分布XP(X)有效性:一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量相比,樣本均值是一個更有效的估計量估計量的優(yōu)良性準則

(一致性)一致性:隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)37AB較小的樣本容量較大的樣本容量

P(X)X區(qū)間估計38區(qū)間估計

(概念要點)根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍給出總體參數(shù)落在這一區(qū)間的概率例如:總體均值落在50~70之間,置信度為95%39樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限置信區(qū)間估計

(內(nèi)容)40

2

已知

2

未知均值方差比例置信區(qū)間落在總體均值某一區(qū)間內(nèi)的樣本41

x_XX=

Z

x

95%的樣本

-1.96

x

+1.96

x

99%的樣本

-2.58

x

+2.58

x

90%的樣本

-1.65

x

+1.65

x置信水平總體未知參數(shù)落在區(qū)間內(nèi)的概率

p{θ1(x1,x2,…,xn)

θ

θ2(x1,x2,…,xn)}=1-

1-

為置信度、置信水平或置信概率

為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的置信水平值有99%,95%,90%相應的

為0.01,0.05,0.1042區(qū)間與置信水平43均值的抽樣分布(1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論