參數(shù)估計(jì)基礎(chǔ)及假設(shè)檢驗(yàn)_第1頁(yè)
參數(shù)估計(jì)基礎(chǔ)及假設(shè)檢驗(yàn)_第2頁(yè)
參數(shù)估計(jì)基礎(chǔ)及假設(shè)檢驗(yàn)_第3頁(yè)
參數(shù)估計(jì)基礎(chǔ)及假設(shè)檢驗(yàn)_第4頁(yè)
參數(shù)估計(jì)基礎(chǔ)及假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩99頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 參數(shù)估計(jì)基礎(chǔ)與假設(shè)檢驗(yàn)參數(shù)估計(jì)基礎(chǔ)與假設(shè)檢驗(yàn) 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷參數(shù)參數(shù)估計(jì)估計(jì)假設(shè)假設(shè)檢驗(yàn)檢驗(yàn)授課教師:授課教師:馬海燕馬海燕 一、一、 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤(standard error) 1、均數(shù)的抽樣誤差、均數(shù)的抽樣誤差 n1=30,x1 n2=30,x2 n3=30,x3 . x1 x2 x3 x100 . . n100=30,x100 (均數(shù)的抽樣誤差)(均數(shù)的抽樣誤差)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤差均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤差樣本均數(shù)間的變異程度樣本均數(shù)間的變異程度正態(tài)總體N(155.4,5.32)100份隨機(jī)樣本的計(jì)算結(jié)果(n=30) 2、標(biāo)準(zhǔn)誤的概念、標(biāo)準(zhǔn)誤的概

2、念 即樣本均數(shù)的標(biāo)準(zhǔn)差即樣本均數(shù)的標(biāo)準(zhǔn)差, 是說(shuō)明是說(shuō)明均數(shù)抽樣誤差大小的指標(biāo)均數(shù)抽樣誤差大小的指標(biāo)。 標(biāo)準(zhǔn)誤愈小標(biāo)準(zhǔn)誤愈小, 表示抽樣誤差愈表示抽樣誤差愈小小, 樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的估樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的估計(jì)愈可靠,用計(jì)愈可靠,用 x,或,或s x 表示表示。 2、標(biāo)準(zhǔn)誤的計(jì)算、標(biāo)準(zhǔn)誤的計(jì)算 x= n s sx= (估計(jì)值估計(jì)值) n 3、標(biāo)準(zhǔn)誤的應(yīng)用、標(biāo)準(zhǔn)誤的應(yīng)用 表示樣本均數(shù)的散布情形表示樣本均數(shù)的散布情形,表示抽樣誤表示抽樣誤差的大小,差的大小,用以說(shuō)明樣本均數(shù)的可靠性用以說(shuō)明樣本均數(shù)的可靠性; XSX總體均數(shù)的估計(jì)總體均數(shù)的估計(jì) 一、一、t分布分布 1、 t分布的概念分布的概念

3、對(duì)正態(tài)變量對(duì)正態(tài)變量 X采用采用z=( X - )/ x變換變換, 將將N( , x2)變換為標(biāo)準(zhǔn)正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布, 即即U分分布布, 而實(shí)際中而實(shí)際中 x往往用往往用sx來(lái)估計(jì)來(lái)估計(jì), 這時(shí)對(duì)正這時(shí)對(duì)正態(tài)變量態(tài)變量 X采用的不是采用的不是U變換而是變換而是t變換變換, 即即 t = ( X - )/ sx 其結(jié)果也不是其結(jié)果也不是U分布而是分布而是t分布。分布。X-N(,)X-N(,X)固定固定n抽樣抽樣 x-z= x-z= xz-N(O,1)0標(biāo)準(zhǔn)正態(tài)分布示意圖標(biāo)準(zhǔn)正態(tài)分布示意圖x=1-4 -3 -2 -1 0 1 2 3 4=1=5=(z分布)t分布示意圖分布示意圖t = (

4、X - )/ sx 2、 t分布的特征分布的特征 與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征: a.二者都是單峰分布二者都是單峰分布, 以以0為中心為中心, 左右對(duì)稱左右對(duì)稱; b.t分布的峰部較矮而尾部翹得較高分布的峰部較矮而尾部翹得較高, 說(shuō)明遠(yuǎn)說(shuō)明遠(yuǎn)側(cè)的側(cè)的t值的個(gè)數(shù)相對(duì)較多值的個(gè)數(shù)相對(duì)較多, 即尾部面積即尾部面積(概率概率P)較較大。大。 自由度自由度 越小這種情況越明顯越小這種情況越明顯, 逐漸增大時(shí)逐漸增大時(shí), t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布; 當(dāng)當(dāng) = 時(shí)時(shí), t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了, =n-1 。 3、t界值

5、界值 t界值表界值表, 橫標(biāo)目為自由度橫標(biāo)目為自由度 , 縱標(biāo)目為縱標(biāo)目為概率概率P, 表中數(shù)字表示自由度為表中數(shù)字表示自由度為 , P為為 (檢檢驗(yàn)水準(zhǔn)驗(yàn)水準(zhǔn))時(shí)時(shí), t的界值的界值, 常記為常記為t , 。理論上。理論上 單側(cè)單側(cè): P( t - t , )= , 或或P(t t , )= 雙側(cè)雙側(cè): P( t - t , )+P(t t , )= ; P( - t , t t , )= 1 - t t分布曲線下面積(附表分布曲線下面積(附表2 2)雙側(cè)雙側(cè)t t0.05/20.05/2,9 92.2622.262 單側(cè)單側(cè)t t0.0250.025,9 9單側(cè)單側(cè)t t0.050.05,

6、9 91.8331.833雙側(cè)雙側(cè)t t0.01/20.01/2,9 93.2503.250 單側(cè)單側(cè)t t0.0050.005,9 9單側(cè)單側(cè)t t0.010.01,9 92.8212.821雙側(cè)雙側(cè)t t0.05/20.05/2,1.961.96 單側(cè)單側(cè)t t0.0250.025,單側(cè)單側(cè)t t0.050.05, 1.641.64095%95%1.96-1.96t0.O5,n-1-t0.O5,n-12.5%2.5%t分布與分布與z分布的面積示意圖分布的面積示意圖 一位學(xué)生在某篇文獻(xiàn)上看到以下敘述:“在95%的置信度下,美國(guó)年輕人在“全國(guó)教育進(jìn)展評(píng)估”中的平均分為267.8276.2?!痹?/p>

7、學(xué)生認(rèn)為,所有年輕人中,95%的人得分在267.8 276.2之間。他的理解正確嗎?請(qǐng)給出答案。 二、估計(jì)總體均數(shù)的估計(jì)二、估計(jì)總體均數(shù)的估計(jì) (一)置信區(qū)間的概念一)置信區(qū)間的概念 總體均數(shù)的估計(jì)總體均數(shù)的估計(jì)包括點(diǎn)值估計(jì)和區(qū)間估計(jì)包括點(diǎn)值估計(jì)和區(qū)間估計(jì) 點(diǎn)值估計(jì):點(diǎn)值估計(jì):X 置信區(qū)間置信區(qū)間估計(jì)估計(jì)(interval estimation):可能包含總可能包含總體均數(shù)在內(nèi)的一個(gè)范圍體均數(shù)在內(nèi)的一個(gè)范圍,其包含總體均數(shù)可能性其包含總體均數(shù)可能性的大小的大小,以百分?jǐn)?shù)表示以百分?jǐn)?shù)表示,習(xí)慣上使用習(xí)慣上使用95%與與99%可可信區(qū)間(信區(qū)間(confidence interval,CI)。 a

8、.區(qū)間估計(jì)的涵義區(qū)間估計(jì)的涵義: 有有1- 可能包含可能包含總體均數(shù)在內(nèi)的一個(gè)范圍總體均數(shù)在內(nèi)的一個(gè)范圍, 習(xí)慣上使用習(xí)慣上使用95%與與99%置信置信區(qū)間(區(qū)間(confidence interval,CI)。 1- :可信度(:可信度( confidence level)正態(tài)總體N(155.4,5.32)100份隨機(jī)樣本的計(jì)算結(jié)果(n=30)12345155.4 95% CI意思是從總體中作隨機(jī)抽樣意思是從總體中作隨機(jī)抽樣, 每個(gè)樣本可以算得一個(gè)可信區(qū)間每個(gè)樣本可以算得一個(gè)可信區(qū)間, 如如95%可信區(qū)間可信區(qū)間, 意味著做意味著做100個(gè)可信區(qū)個(gè)可信區(qū)間間, 平均有平均有95個(gè)可信區(qū)間包括

9、總體均個(gè)可信區(qū)間包括總體均數(shù)數(shù)(估計(jì)正確估計(jì)正確), 只有只有5個(gè)可信區(qū)間不包個(gè)可信區(qū)間不包括總體均數(shù)括總體均數(shù)(估計(jì)錯(cuò)誤估計(jì)錯(cuò)誤)。 可信區(qū)間的兩個(gè)要素:準(zhǔn)確度精密度反映在可信度的大小反映在區(qū)間的長(zhǎng)度 (二)區(qū)間估計(jì)的方法(二)區(qū)間估計(jì)的方法: X t /2, sx X + t /2, sx ; 95% CI(X- t0.05/2, sx ,X+ t0.05/2, sx ) 已知,已知,X - z /2, x X + z /2, x ; 未知,但未知,但n足夠大足夠大 X - z /2,sx 0.05 (來(lái)自同一總體)(來(lái)自同一總體) ? 假設(shè)檢驗(yàn)回答假設(shè)檢驗(yàn)回答 環(huán)境條件影響環(huán)境條件影響

10、P0.05 (來(lái)自不同總體)(來(lái)自不同總體)兩均數(shù)或兩率不兩均數(shù)或兩率不等等 原理:反證法思想原理:反證法思想 假設(shè):假設(shè): = 0 ,由于抽樣誤差造成的可能,由于抽樣誤差造成的可能性有多大?性有多大? 若若 = 0 成立,可計(jì)算相應(yīng)成立,可計(jì)算相應(yīng)t或或u值,若值,若X與與 0 相差較遠(yuǎn),相差較遠(yuǎn), t或或u值就大,值就大,P值小,值小,當(dāng)當(dāng)P ,按所取按所取檢驗(yàn)水準(zhǔn),不拒絕檢驗(yàn)水準(zhǔn),不拒絕H0。 t檢驗(yàn)檢驗(yàn)馬海燕馬海燕 t檢驗(yàn)條件檢驗(yàn)條件: 樣本含量小時(shí)樣本含量小時(shí) (1)正態(tài)分布資料)正態(tài)分布資料 (2)方差齊)方差齊(兩樣本比較兩樣本比較) (一)單樣本(一)單樣本t檢驗(yàn)檢驗(yàn)(one

11、sample/group t-test) 根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為72次次/分分, 某醫(yī)生在山區(qū)隨機(jī)抽查某醫(yī)生在山區(qū)隨機(jī)抽查25名健康成年名健康成年男子男子,求得其脈搏均數(shù)為求得其脈搏均數(shù)為74.2次次/分分, 標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為6.0次次/分分, 能否據(jù)此認(rèn)為山區(qū)成年男子的脈搏數(shù)與能否據(jù)此認(rèn)為山區(qū)成年男子的脈搏數(shù)與一般成年男子脈搏數(shù)有所不同一般成年男子脈搏數(shù)有所不同? 72次次/分分 74.2次次/分分, 需考慮兩種可能需考慮兩種可能 1、由于抽樣誤差所致、由于抽樣誤差所致 2、兩者來(lái)自不同總體、兩者來(lái)自不同總體 1、建立假設(shè)并確定檢驗(yàn)水

12、準(zhǔn)、建立假設(shè)并確定檢驗(yàn)水準(zhǔn) H0: = 0,即假設(shè)山區(qū)與一般成年男子脈搏數(shù)相等;,即假設(shè)山區(qū)與一般成年男子脈搏數(shù)相等; H1: 0,即假設(shè)山區(qū)與一般成年男子脈搏數(shù)不等。,即假設(shè)山區(qū)與一般成年男子脈搏數(shù)不等。 =0.05 2、計(jì)算統(tǒng)計(jì)量、計(jì)算統(tǒng)計(jì)量 x- 0 x- 0 74.2-72 t= = = =1.833 s x s/ n 6.0/ 25 =25 - 1=24, t0.05,24=2.064 t0.05 按按 =0.05水準(zhǔn),不拒絕水準(zhǔn),不拒絕H0,還不能認(rèn)為還不能認(rèn)為假設(shè)山區(qū)與一般成年假設(shè)山區(qū)與一般成年男子脈搏數(shù)不等。男子脈搏數(shù)不等。 (二)配對(duì)(二)配對(duì)t檢驗(yàn)檢驗(yàn)(paired/mat

13、ched t-test for dependent samples) 配對(duì)資料的配對(duì)資料的t檢驗(yàn)檢驗(yàn): 即差值均數(shù)與總體均數(shù)即差值均數(shù)與總體均數(shù)0比比較的較的t檢驗(yàn)。檢驗(yàn)。 配對(duì)資料配對(duì)資料: 1、對(duì)同對(duì)的兩個(gè)受試對(duì)象分別給予兩種處理、對(duì)同對(duì)的兩個(gè)受試對(duì)象分別給予兩種處理; 2、對(duì)同一受試對(duì)象分別給予兩種處理、對(duì)同一受試對(duì)象分別給予兩種處理; 3、同一受試對(duì)象處理前后的比較。、同一受試對(duì)象處理前后的比較。 H0: d = 0 , t = d / sd , =對(duì)數(shù)對(duì)數(shù)-1 配對(duì)資料的配對(duì)資料的t檢驗(yàn)檢驗(yàn) 例例.以大鼠以大鼠16只只, 配成配成8對(duì)對(duì)(每對(duì)大白鼠同性別、每對(duì)大白鼠同性別、同窩別、體

14、重相近者同窩別、體重相近者), 分別喂以含水解蛋白與分別喂以含水解蛋白與酪蛋白的飼料酪蛋白的飼料, 四周后測(cè)定其體重增加情況四周后測(cè)定其體重增加情況, 問(wèn)問(wèn)兩種飼料對(duì)大白鼠體重之增加有無(wú)不同影響兩種飼料對(duì)大白鼠體重之增加有無(wú)不同影響?大白鼠在四周內(nèi)所增體重大白鼠在四周內(nèi)所增體重(g)對(duì)別對(duì)別 酪蛋白組酪蛋白組水解蛋白組水解蛋白組差值差值d 1 82 15 67 2 66 28 38 3 74 29 45 4 78 28 50 5 82 24 58 6 76 38 38 7 73 21 52 8 90 37 53合計(jì)合計(jì) 401 H0: d = 0 H1: d0 =50.13/3.48 = 14

15、.4 t0.05,7=2.365,t0.001,7=5.408 P S2 本例本例F=42.3072/0.9047=46.76 本例本例F=46.76F.05(30,5),P0.05,故在故在=0.05水準(zhǔn)處拒水準(zhǔn)處拒絕絕H0,接受,接受H1。兩方差的差別顯著。兩方差的差別顯著。 1、總體方差相等、總體方差相等 例如,某克山病區(qū)測(cè)得例如,某克山病區(qū)測(cè)得11名急性克山病名急性克山病患者與患者與13名健康人的血磷值(名健康人的血磷值(mmol/L),試問(wèn)該地急性克山病患者與健康人的血試問(wèn)該地急性克山病患者與健康人的血磷值是否不同?磷值是否不同?11名急性克山病人與名急性克山病人與13名健康人血磷值

16、(名健康人血磷值(mmol/L) 急性克山病患者急性克山病患者 克山病區(qū)健康人克山病區(qū)健康人 編號(hào)編號(hào) x1 x12 編號(hào)編號(hào) x2 x22 1 0.84 0.7056 1 0.54 0.2916 2 1.05 1.1025 2 0.64 0.4069 3 1.20 1.4400 3 0.64 0.4096 4 1.20 1.4400 4 0.75 0.5625 5 1.39 1.9321 5 0.76 0.5776 6 1.53 2.3409 6 0.81 0.6561 7 1.67 2.7889 7 1.16 1.3456 8 1.80 3.2400 8 1.20 1.4400 9 1.8

17、7 3.4969 9 1.34 1.7956 10 2.07 4.2849 10 1.35 1.8225 11 2.11 4.4521 11 1.48 2.1904 12 1.56 2.4336 13 1.87 3.4969合計(jì)合計(jì) 16.73 27.2239 14.10 17.4316 H0: 1 = 2 ,克山病患者與健康人血磷值總體均數(shù)相同克山病患者與健康人血磷值總體均數(shù)相同 H1: 1 = 2 ,克山病患者與健康人血磷值總體均數(shù)不同克山病患者與健康人血磷值總體均數(shù)不同 =0.05 = n1 + n2 -2 2121xxsxxt2121222211112) 1() 1(21nnnnsns

18、nsxx x1=1.521(mmol/L) x2=1.085(mmol/L) s(x1-x2)=0.1729 1.521-1.085 t= =2.522 0.1729 =(11+13)-2=22, t0.02, 22=2.508, t0.01, 22=2.819 t0.02, 22 t t0.01, 22 , 0.01p 2 , 該地該地17歲男青年坐高高于女青年坐高歲男青年坐高高于女青年坐高 =0.05(單側(cè))(單側(cè)) n1=44, s1=3.52; n2=76, s2=2.33 (44-1)(3.52)2+(76-1) (2.33)2 sc2= =7.97 (44-1)+ (76-1) s

19、x1-x2= 7.97(1/44+1/76)=0.535 t=(83.1-80.2)/0.535=5.42, =44+76-2=118 Pt0.01,18 P100),), ( X1 - X2) ( X1 - X2 ) Z= = sx12+sx22 ( s12 /n1)+ ( s22 /n2) 單樣本單樣本Z檢驗(yàn)檢驗(yàn) 某醫(yī)院對(duì)某醫(yī)院對(duì)4050歲年齡組的男、女不同性別的健康人群歲年齡組的男、女不同性別的健康人群測(cè)定了測(cè)定了 脂蛋白,結(jié)果見(jiàn)表,試問(wèn)不同性別健康人群的脂蛋白,結(jié)果見(jiàn)表,試問(wèn)不同性別健康人群的 脂蛋白有無(wú)差別?脂蛋白有無(wú)差別? 不同性別的健康人群不同性別的健康人群 脂蛋白脂蛋白 性別性別 人群人群 均值均值 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 男男 193 3.97 1.04 女女 128 3.58 0.90 n1100 n2100 可用可用Z檢驗(yàn)檢驗(yàn) H0: 1 = 2 , 不同性別健康人群不

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論