計量資料統(tǒng)計推斷_第1頁
計量資料統(tǒng)計推斷_第2頁
計量資料統(tǒng)計推斷_第3頁
計量資料統(tǒng)計推斷_第4頁
計量資料統(tǒng)計推斷_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

抽樣誤差與假設(shè)檢驗均數(shù)的抽樣誤差和總體均數(shù)的估計(一)、均數(shù)的抽樣誤差與標準誤統(tǒng)計推斷

用樣本的信息推論總體的特征。參數(shù)估計統(tǒng)計推斷假設(shè)檢驗健康女性體溫102人

均數(shù)的抽樣誤差----由于抽樣造成的樣本均數(shù)與總體均數(shù)、樣本均數(shù)之間的差異。℃樣本1樣本2樣本k總體均數(shù)···根據(jù)中心極限定理:1.從正態(tài)總體中抽樣,抽取樣本含量為n的樣本,樣本均數(shù)服從正態(tài)分布。即使是從偏態(tài)總體中抽樣,在樣本含量足夠(n>50)大時,

也近似正態(tài)分布。2.從均數(shù)為,標準差為的正態(tài)或偏態(tài)總體中抽樣樣本例數(shù)為n的樣本,新樣本組成的數(shù)據(jù)中,樣本均數(shù)為,標準差標準誤:樣本均數(shù)的標準差反映各均數(shù)間的離散程度。標準誤的意義:

描述抽樣誤差的大小,越小,說明抽樣誤差越小,樣本均數(shù)越接近總體均數(shù),用代表的可靠性越高。標準誤的計算均數(shù)的標準誤

以某地14歲健康女生身高的標準差σ=5.30cm及每個樣本包含的例數(shù)10代入公式,求得

均數(shù)標準誤的用途:①可用來衡量樣本均數(shù)的可靠性。②與樣本均數(shù)結(jié)合,可用于估計總體均數(shù)的可信區(qū)間;③可用于進行均數(shù)的假設(shè)檢驗。應(yīng)用時,用樣本標準差來代替總體標準差,則標準誤的估計值為:???減少抽樣誤差的有效途徑(二)t分布u變換(將正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布)t變換

全國14歲女生(身高)120人120人120人120人…………(t分布)(u分布)…………t分布特征:(1)單峰分布,以0為中心左右對稱。(2)t分布是一簇曲線,其形狀受ν的影響。t分布與標準正態(tài)分布(u

分布)區(qū)別:*

t分布曲線峰部較矮,尾部稍翹。*

n(自由度)越大,t

分布與u

分布越接近;當時,t

分布=u

分布。t分布的特征:t界值表:(附錄9-P261)t界值表的特征:

⑴自由度相同時越大,概率P越??;⑵雙側(cè)概率P為單側(cè)概率P的兩倍。

自由度為,概率為(檢驗水準)時,

t

的界值記為。t界值表的查法:

=?通常取0.05或0.01

(t

越大,概率P

越?。?.2623.2501.962.58當n≥50,為大樣本(t分布=u

分布),可用來代替

(三)總體均數(shù)的可信區(qū)間估計

統(tǒng)計描述統(tǒng)計分析參數(shù)估計---用樣本指標估統(tǒng)計推斷計總體指標假設(shè)檢驗點估計---用估計參數(shù)估計區(qū)間估計---按一定的概率估計總體均數(shù)落在某個范圍這個范圍稱之為:

總體均數(shù)的可信區(qū)間CI

,用區(qū)間()表示。如(37.02,37.10),說明總體均數(shù)在37.02~37.10之間,但不包含上限(37.10)及下限(37.02)兩個值。總體均數(shù)可信區(qū)間的計算1)已知

95%置信區(qū)間

99%置信區(qū)間

未知時總體均數(shù)可信區(qū)間的計算2)大樣本----按u

分布

95%置信區(qū)間

99%置信區(qū)間例7-15102名健康女大學(xué)生口腔溫度總體均數(shù)為=37.06℃,標準差S=0.198℃,標準誤=0.0196℃,試估計該地健康女大學(xué)生口腔溫度總體均數(shù)95%可信區(qū)間和99%可信區(qū)間。95%可信區(qū)間為37.06±1.96×0.0196,(37.02,37.10)99%可信區(qū)間為37.06±2.58×0.0196,(37.01,37.11)某市2001年120名7歲男童的身高=123.62

(cm)S=4.75(cm),計算該市7歲男童總體均數(shù)90%的可信區(qū)間。

n=120>100,故可以用標準正態(tài)分布代替t分布,u0.01=1.645==

總體均數(shù)可信區(qū)間的計算3)小樣本或未知----按

t分布

95%置信區(qū)間

99%置信區(qū)間

隨機抽取某地健康男子20人,測得該樣本的收縮壓均數(shù)為118.4mmHg,標準差S為10.8mmHg,試估計該地男子收縮壓總體均數(shù)的95%置信區(qū)間。此為小樣本,應(yīng)按

t

分布。收縮壓過高過低均為異常,故取雙側(cè)。95%置信區(qū)間:

代入數(shù)據(jù)

(

)

即(113.3,123.5)隨機抽查某地30名40-44歲哈薩克族成年男性的骨密度,測得骨密度均數(shù)資料,=187.11mg/cm2,試估計該地40-44歲哈薩克族成年男性的骨密度總體均數(shù)的95%可信區(qū)間N=30,則v=29,查附表2,t界值表,t0.05/2,29=2.045可信區(qū)間的兩個要素:1.準確度:反映在的大小上。2.精確度:反映在區(qū)間的長度上。在樣本含量一定的情況下二者是矛盾的。常用的95%置信區(qū)間。

均數(shù)可信區(qū)間與參考值范圍的區(qū)別

95%可信區(qū)間:從至范圍有95%的可能性包含了總體均數(shù)。95%正常值范圍:一組觀察值中,有95%個體(頻數(shù))的觀察值在至范圍內(nèi)。六、均數(shù)的假設(shè)檢驗(一)假設(shè)檢驗的基本思想—利用反證法的思想例

某地抽樣調(diào)查了25名健康成年男性的脈搏,,其均數(shù)為74.2次/分,標準差為6.5次/分。已知正常成年男性脈搏的均數(shù)為72次/分。試問能否認為該地抽樣調(diào)查的25名成年男性的脈搏與正常成年男性脈搏的均數(shù)不同?μ0=72次/分μn=25

=74.2次/分

S=6.5次/分已知總體未知總體差異的原因:

(1)由于抽樣誤差造成的.(實際上,但由于抽樣誤差不能很好代表)(2)該地成年男性的脈搏與正常成年男性脈搏均數(shù)不同()

假設(shè)檢驗的目的就是判斷差異的原因:

求出由抽樣誤差造成此差異的可能性(概率P)有多大

!若P

較大(P>0.05),認為是由于抽樣誤差造成的。原因(1),實際上若P

較小(P≤0.05),認為不是由于抽樣誤差造成的。原因(2),實際上>(二)假設(shè)檢驗的基本步驟1、建立假設(shè),確定檢驗水準H0:(無效假設(shè))μ=μ0H1:(備擇假設(shè))μ>μ0檢驗水準的意義及確定2、選定檢驗方法,計算檢驗統(tǒng)計量3、確定P值,作出推斷結(jié)論

(推斷的結(jié)論=統(tǒng)計結(jié)論+專業(yè)結(jié)論)

P>0.05,按檢驗水準,不拒絕H0,差異無統(tǒng)計學(xué)意義(差異無顯著性),還不能認為……不同或不等。

P≤0.05

,按檢驗水準,拒絕H0,接受H1,

差異有統(tǒng)計學(xué)意義(差異有顯著性)

,可以認為……不同或不等。

P≤0.01,按檢驗水準,拒絕H0,接受H1,差異有高度統(tǒng)計學(xué)意義(差異有高度顯著性)

,可以認為……不同或不等。72次/分

單、雙側(cè)檢驗的選擇:

1、根據(jù)專業(yè)知識事先不知道會出現(xiàn)什么結(jié)果雙側(cè)事先知道只能出現(xiàn)某種結(jié)果單側(cè)*通常用雙側(cè)(除非有充足的理由選用單側(cè)之外,

一般選用保守的雙側(cè)較穩(wěn)妥)

確定P值:(用求出的t值與查表查出的t

值比較)查t

值表:

(t

越大,P

越小)

(1)求出t=1.833,P>0.05

(2)求出t=4.18,

P<0.01

(3)求出t=2.96,

0.01<P<0.05(簡寫為P<0.05)

(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96

假設(shè)檢驗的思路是:首先對未知或不完全知道的總體提出一個假設(shè),然后借助一定的分布,觀察實測樣本情況是否屬于小概率事件。一般把概率P≤0.05的事件稱為小概率事件,小概率事件在一次觀察中可以認為是不會發(fā)生的,如實測樣本情況屬于小概率事件,則不拒絕原來的假設(shè);如實測樣本情況不屬于小概率事件,則拒絕原來的假設(shè)。當然,小概率事件在一次觀察中還是可能發(fā)生的,若我們恰好碰上,則假設(shè)檢驗的結(jié)論就是錯誤的,不過因為小概率事件發(fā)生的概率小,所以犯這種錯誤的概率也小。(1)建立假設(shè)、確定檢驗水準H0:μ=μ0即山區(qū)成年男子平均脈搏數(shù)與一般成年男子相等H1:μ>μ0

即山區(qū)成年男子平均脈搏數(shù)高于一般成年男子(2)選定檢驗方法,計算檢驗統(tǒng)計量(3)確定P值,作出推斷結(jié)論T界值表,得t0.1,24=1.711,t<t0.1,24,故P>0.1

t檢驗和u檢驗t檢驗應(yīng)用條件:

①當n<100時,要求樣本取自正態(tài)分布的總體,總體標準差未知;②兩小樣本均數(shù)比較時,要求兩樣本總體方差相等(σ12=σ22)。一、樣本均數(shù)與總體均數(shù)比較的t檢驗(即:樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較)例9-15已知某小樣本中含CaCO3的真值是20.7mg/L?,F(xiàn)用某法重復(fù)測定該小樣本15次,CaCO3含量(mg/L)分別為:20.99,20.41,20.62,20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50,23.00,22.60。問該法測得的均數(shù)與真值有無差別?(1)建立假設(shè)、確定檢驗水準H0:μ=μ0即該測量方法所得均數(shù)與真值相等H1:μ≠μ0

即該測量方法所得均數(shù)與真值不相等(2)選定檢驗方法,計算檢驗統(tǒng)計量n=25<100,故選用t檢驗。已知=21.13(3)確定P值,作出推斷結(jié)論

查t界值表

為單側(cè)檢驗Pt0.050.012.9772.145P>0.051.70P>0.05,按檢驗水準,不拒絕H0,無統(tǒng)計學(xué)意義。尚不能認為該法測得的均數(shù)與真值不同。二、配對設(shè)計的均數(shù)比較常見的配對設(shè)計主要有以下情形:①自身比較:同一受試對象處理前后。②同一受試對象分別接受兩種不同的處理。③將條件近似的觀察對象兩兩配成對子,對子中的兩個個體分別給予不同的處理。配對t檢驗的基本原理:

假設(shè)兩種處理的效應(yīng)相同,即μ1=μ2

,則μ1-μ2=0,即可看成是差值的樣本均數(shù)所代表的未知總體均數(shù)μd與已知總體均數(shù)μ0=0的比較,此時,我們可套用前述t檢驗的公式。例9-16應(yīng)用某藥治療8例高血壓患者,觀察患者治療前后舒張壓變化情況,如表9-10,問該藥是否對高血壓患者治療前后舒張壓變化有影響?表9-10用某藥治療高血壓患者前后舒張壓變化情況病人編號舒張壓(mmHg)差值dd2治療前治療后⑴⑵⑶⑷=⑵-⑶1

96

88

8642

112

108

4163

108

102

6364

102

98

4165

98

100

-246

100

96

4167

106

102

4168

100

92

864合計--36232

H0:

該藥對舒張壓無影響。

H1:

該藥對舒張壓有影響。Pt0.050.012.365P<0.014.023.499⑶確定P值,判斷結(jié)果

自由度ν=n-1=8-1=7,查表9-9t界值表,t0.05,7=2.365,今4.02>2.365,故P<0.05,故按α=0.05水準,拒絕H0,接受H1,認為差異有高度顯著性,可以認為該藥有降低舒張壓的作用。三、兩個樣本均數(shù)比較的t檢驗大樣本(n>50)----u檢驗小樣本---正態(tài)分布資料t檢驗偏態(tài)分布資料秩和檢驗1、兩個大樣本均數(shù)的比較

例9-17

某地隨機抽取正常男性新生兒175名,測得血中甘油三酯濃度的均數(shù)為0.425mmol/L,標準差為0.254mmol/L;隨機抽取正常女性新生兒167名,測得甘油三酯濃度的均數(shù)為0.438mmol/L,標準差為0.292mmol/L,問男、女新生兒的甘油三酯濃度有無差別?⑴建立假設(shè),確定檢驗水準

H0:μ1=μ2

H1:μ1≠μ2

α=0.05⑵選擇檢驗方法,計算檢驗統(tǒng)計量u值

(3)查u界值表(t界值表中自由度為的一行),u=0.438<1.96,故P>0.05,按=0.05水準,不拒絕H0,差異無統(tǒng)計學(xué)意義;尚不能認為正常男女新生兒血中甘油三酯濃度均數(shù)不同。

單樣本均數(shù)的u檢驗適用于當n較大(如n>50)或已知時。檢驗統(tǒng)計量分別為P121例8-2

例1995年,已知某地20歲應(yīng)征男青年的平均身高為168.5cm。2003年,在當?shù)?0歲應(yīng)征男青年中隨機抽取85人,平均身高為171.2cm,標準差為5.3cm,問2003年當?shù)?0歲應(yīng)征男青年的身高與1995年相比是否不同?

檢驗界值u0.05/2=1.96,u0.01/2=2.58,u>u0.01/2,得P<0.01,按α=0.05水準,拒絕H0,接受H1,2003年當?shù)?0歲應(yīng)征男青年與1995年相比,差別有統(tǒng)計學(xué)意義。2、兩個小樣本均數(shù)的比較例9-18兩組雄性大鼠分別飼以高蛋白和低蛋白飼料,觀察每只大鼠在實驗第28天到84天之間所增加的體重,見表9-11。問用兩種不同飼料喂養(yǎng)大鼠后,體重的增加有無差別?表9-11用兩種不同蛋白質(zhì)含量飼料喂養(yǎng)大鼠后體重增加的克數(shù)高蛋白組1341461041191241611078311312997123低蛋白組

70118101

85107132

94⑴建立假設(shè),確定檢驗水準H0:μ1=μ2H1:μ1≠μ2α=0.05⑵選擇檢驗方法,計算檢驗統(tǒng)計量t值⑶確定P值,判斷結(jié)果查表9-9t界值表,t0.05,17=2.110,今1.891<2.110,故P>0.05,故按α=0.05水準,不拒絕H0,尚不能認為兩種飼料喂養(yǎng)大鼠后體重的增加是不同的。PP=?t=1.891P=0.05tP=0.01t=2.110t=2.898四兩獨立樣本方差的齊性檢驗

兩獨立小樣本均數(shù)的t檢驗,除要求兩組數(shù)據(jù)均應(yīng)服從正態(tài)分布外,還要求兩組數(shù)據(jù)相應(yīng)的兩總體方差相等,即方差齊性。但即使兩總體方差相等,兩個樣本方差也會有抽樣誤差,兩個樣本方差不等是否能用抽樣誤差解釋?可進行方差齊性檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論