




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、(衛(wèi)生統(tǒng)計(jì)學(xué))第5章 參數(shù)估計(jì)基礎(chǔ)2統(tǒng)計(jì)分析: 統(tǒng)計(jì)描述(statistical description) 統(tǒng)計(jì)推斷(statistical inference) 參數(shù)估計(jì)(estimation of parameter) 假設(shè)檢驗(yàn)(hypothesis test)統(tǒng)計(jì)描述:選用恰當(dāng)?shù)慕y(tǒng)計(jì)量、合適的統(tǒng)計(jì)表與統(tǒng)計(jì)圖,測(cè)定、描述資料的數(shù)量特征及其分布規(guī)律。統(tǒng)計(jì)推斷:在一定的可信程度下,由樣本信息推斷總體特征。參數(shù)估計(jì):由樣本統(tǒng)計(jì)量(statistic)估計(jì)總體參數(shù)(parameter)。假設(shè)檢驗(yàn):由樣本差異推斷總體之間是否可能存在差異。第一章 緒論第二章 定量變量的統(tǒng)計(jì)描述第三章 定性變量的統(tǒng)計(jì)描
2、述第四章 常用概率分布第五章 參數(shù)估計(jì)基礎(chǔ)第六章 假設(shè)檢驗(yàn)基礎(chǔ)總體往往是無(wú)窮大的抽象概念,個(gè)體之間存在差異,以樣本為基礎(chǔ),進(jìn)行關(guān)于總體特征或參數(shù)的推斷或估計(jì)。 已經(jīng)學(xué)習(xí)了描述性統(tǒng)計(jì),實(shí)際研究中,統(tǒng)計(jì)推斷更有價(jià)值。美國(guó)專欄作家Ann Landers問(wèn)她的讀者:“如果可以重新選擇,你還要孩子嗎?”,她收到了近1萬(wàn)份讀者來(lái)信。于是,Landers在她的專欄中寫下了“將近70%的父母后悔要孩子”的標(biāo)題。Newsday針對(duì)同樣的問(wèn)題開(kāi)展了全美范圍的專業(yè)調(diào)查,獲得了一份包含1373對(duì)父母的隨機(jī)樣本,發(fā)現(xiàn),91%的父母對(duì)當(dāng)初的選擇無(wú)怨無(wú)悔。美國(guó)的父母?jìng)儗?duì)孩子的態(tài)度究竟是什么?只要樣本能夠代表全美5 491.
3、7萬(wàn)個(gè)家庭這個(gè)總體,就可以用樣本的 “事實(shí)”估計(jì)總體的真實(shí)信息。Landers獲得的只是一份自發(fā)性回應(yīng)的便利樣本,有高度偏差(對(duì)某個(gè)議題有強(qiáng)烈感覺(jué)尤其是有負(fù)面感覺(jué)的人更容易不厭其煩地回應(yīng)),導(dǎo)致她的樣本中寧愿不要孩子的百分比遠(yuǎn)高于全體父母(總體)中寧愿不要孩子的百分比。Newsday的簡(jiǎn)單隨機(jī)樣本(SRS, simple random sample)既不受抽樣者偏好左右,也沒(méi)有回應(yīng)者的自行加入,且每個(gè)家庭都有相同的中選機(jī)會(huì)。雖然重新抽取一份1 373對(duì)父母的隨機(jī)樣本,幾乎可以肯定不會(huì)再獲得91%,但如果重復(fù)抽取同樣大小的隨機(jī)樣本,所有樣本的變異將會(huì)遵循某種規(guī)律,借此,可以實(shí)現(xiàn)對(duì)總體的無(wú)偏估計(jì)。
4、第一節(jié) 抽樣分布與抽樣誤差 由于個(gè)體變異的存在,從某一總體中隨機(jī)抽取一個(gè)樣本,所得樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差異稱為抽樣誤差(sampling error)。從同一總體中隨機(jī)抽取若干份樣本,所得樣本統(tǒng)計(jì)量之間也不盡相同,這也是抽樣誤差的表現(xiàn)。在醫(yī)學(xué)抽樣研究中,抽樣誤差是不可避免的,但抽樣誤差是有規(guī)律的,而且是可以被認(rèn)識(shí)的。一、樣本均數(shù)的抽樣分布與抽樣誤差 實(shí)驗(yàn)5-1 正態(tài)分布總體樣本均數(shù)抽樣分布假定某年某地所有13歲女生的身高服從 。計(jì)算機(jī)模擬在該總體中隨機(jī)抽樣,共抽100次。每次抽取30例組成一份樣本,計(jì)算每份樣本的平均身高并繪制樣本均數(shù)的頻率分布表。 樣本號(hào)(1)樣本均數(shù)(2)標(biāo)準(zhǔn)誤
5、(3)95%置信區(qū)間 (4)1156.70.91154.8158.6 *2158.10.95156.2160.13155.61.16153.3158.04155.21.03153.1157.35155.01.01152.9157.06156.41.08154.2158.67154.91.12152.6157.18156.50.74154.9158.09155.01.09152.8157.210155.90.98153.9157.9表5-1 從正態(tài)總體 抽出的100份隨機(jī)樣本的計(jì)算結(jié)果 組段(cm)頻數(shù)頻率(%)152.6153.2153.8154.4155.0155.6156.2156.815
6、7.4158.0158.6 1 4 319252318 4 1 2 1.0 4.0 3.019.025.023.018.0 4.0 1.0 2.0合計(jì) 100 100.0表5-2 從正態(tài)總體 中隨機(jī)抽樣求得的100個(gè) 樣本均數(shù)(平均身高cm)的頻率分布正態(tài)分布總體,樣本均數(shù)抽樣分布的特點(diǎn):樣本均數(shù)恰好等于總體均數(shù)是極其罕見(jiàn)的;樣本均數(shù)之間存在差異;樣本均數(shù)圍繞總體均數(shù),中間多、兩邊少,左右基本對(duì)稱,呈近似正態(tài)分布;樣本均數(shù)之間的變異明顯小于原始變量值之間的變異( cm)。 樣本均數(shù)的標(biāo)準(zhǔn)差,稱均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean,SEM或SE),用于反映均數(shù)抽樣誤差的大小
7、。 均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值:均數(shù)標(biāo)準(zhǔn)誤與原變量的標(biāo)準(zhǔn)差成正比,與樣本含量的平方根成反比。可通過(guò)增加樣本含量來(lái)減小均數(shù)的標(biāo)準(zhǔn)誤,從而降低抽樣誤差。 實(shí)驗(yàn)5-2 非正態(tài)總體樣本均數(shù)抽樣分布圖5-1(a):總體的原始數(shù)據(jù)呈正偏峰分布,從中抽取n =5,10,30和50的樣本各1 000份,計(jì)算其樣本均數(shù)并繪制相應(yīng)的頻率分布圖。圖5-1(b) (e)顯示:當(dāng)n較小時(shí),樣本均數(shù)的分布呈非正態(tài)分布,當(dāng)n足夠大時(shí)(如 ),樣本均數(shù)的分布就近似服從正態(tài)分布了。 (a) 原始數(shù)據(jù) (b) (c) (d) (e)圖5-1 從正偏峰總體隨機(jī)抽樣,樣本均數(shù)的分布 對(duì)任意分布,在樣本含量足夠大時(shí),其樣本均數(shù)的分布近似于正態(tài)
8、分布,且樣本均數(shù)的均數(shù)等于原分布的均數(shù),均數(shù)的標(biāo)準(zhǔn)誤為 。 圖5-2 非正態(tài)分布的總體: 總體A:均勻分布; 總體B:雙峰分布; 總體C:指數(shù)分布; 總體D:三角分布。從各總體中抽取若干個(gè)n2, 5, 30的樣本,計(jì)算各樣本的均數(shù)并繪制樣本均數(shù)的抽樣分布圖。 X 的分布 的分布 的分布 的分布 總體總體 總體 總體 n=2時(shí)n=5時(shí)n=30時(shí)圖5-2 四種總體分布、不同樣本含量時(shí)樣本均數(shù)的抽樣分布均數(shù)的抽樣分布的均數(shù)與原分布均數(shù)是相同的,抽樣分布的變異隨樣本含量的增加而減少。 二、樣本頻率的抽樣分布與抽樣誤差 實(shí)驗(yàn)5-3 二項(xiàng)分布總體樣本頻率的分布特征摸球?qū)嶒?yàn):一個(gè)口袋內(nèi)裝有形狀、重量完全相同
9、的黑球和白球,已知黑球的比例為20%(總體概率 )。從口袋中每摸一次看清顏色后放回去,攪勻后再摸,重復(fù)摸球50次( ),計(jì)算摸到黑球的百分比(樣本頻率 )。重復(fù)這樣的實(shí)驗(yàn)100次,每次得到黑球的比例見(jiàn)表5-3。樣本頻率 (%) 頻數(shù)百分比(%) 82 2.00 104 4.00128 8.00147 7.0016 1111.0018 1313.0020 1919.0022 1111.0024 1111.00266 6.00283 3.00304 4.00321 1.00 合計(jì) 100 100.00表5-3 時(shí)的隨機(jī)抽樣結(jié)果( ) 在100份樣本中, 黑球比例為20%的頻率最大,其次是黑球比例為
10、18%;樣本頻率圍繞總體概率呈近似對(duì)稱分布,多數(shù)樣本頻率離20%較近,少數(shù)樣本頻率離20%較遠(yuǎn)。樣本頻率與樣本頻率之間、樣本頻率與總體概率之間的差異是由抽樣造成的。若隨機(jī)變量 , 則樣本頻率 的總體概率為 ,頻率的標(biāo)準(zhǔn)誤: 頻率的標(biāo)準(zhǔn)誤愈小,用樣本頻率估計(jì)總體概率的可靠性愈好;頻率的標(biāo)準(zhǔn)誤愈大,用樣本頻率估計(jì)總體概率的可靠性愈差。 實(shí)際工作中,總體概率一般未知,常用樣本頻率來(lái)近似地代替。頻率標(biāo)準(zhǔn)誤的估計(jì)值: 頻率的標(biāo)準(zhǔn)誤與樣本含量的平方根成反比,增加樣本含量可以減少樣本頻率的抽樣誤差。 例5-1 某研究組隨機(jī)調(diào)查了某市50歲以上的中老年婦女776人, 其中患有骨質(zhì)疏松癥者322人, 患病率為4
11、1.5%, 試估計(jì)該樣本頻率的抽樣誤差。 p=0.415, n=776, 頻率標(biāo)準(zhǔn)誤的估計(jì)值: 該頻率標(biāo)準(zhǔn)誤的估計(jì)值較小,說(shuō)明用樣本患病率41.5%來(lái)估計(jì)總體患病率的可靠性較好。 第二節(jié) t 分布(學(xué)生 t 分布)(Students t distribution) 一、t 分布( )的概念( :正態(tài)變量)( 未知時(shí))二、t 分布的圖形與特征 實(shí)驗(yàn)5-4 t 分布的計(jì)算機(jī)模擬實(shí)驗(yàn)。從前述的13歲女生身高這個(gè)正態(tài)總體中分別作n=3和50的隨機(jī)抽樣,各抽取1000份樣本,分別得到1000個(gè)樣本均數(shù)和1000個(gè)均數(shù)的標(biāo)準(zhǔn)誤,再對(duì)其分別作 t 變換,并將 t 值繪制成2個(gè)頻率分布圖。 圖5-3 不同樣本
12、含量時(shí) t 值的頻率分布圖 (a) n=3 (b) n=50 (標(biāo)準(zhǔn)正態(tài)分布)=5=1012345-1-2-3-4-5f(t)圖5-4 不同自由度下的 t 分布圖t 分布的特征:?jiǎn)畏宸植?,?為中心,左右對(duì)稱; 越小,t 值越分散,曲線的峰部越矮,尾部越高;隨著 逐漸增大,t 分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布;當(dāng) 趨向 時(shí), t 分布趨近標(biāo)準(zhǔn)正態(tài)分布,故標(biāo)準(zhǔn)正態(tài)分布是 t 分布的特例。 t 界值表:橫標(biāo)目-自由度 ;縱標(biāo)目-概率, P ( t 分布曲線下的尾部面積);表中數(shù)字-當(dāng) 和 P 確定時(shí),單側(cè)概率 (one-tailed probability)和雙側(cè)概率 (two-tail
13、ed probability) 所對(duì)應(yīng)的 t 臨界值 (critical value) 或 。當(dāng) ,單側(cè)檢驗(yàn)水準(zhǔn) 時(shí),查得單側(cè) ,即當(dāng) ,雙側(cè)檢驗(yàn)水準(zhǔn) 時(shí),查得雙側(cè) , 即(a)(b)圖5-5 單、雙側(cè) t 分布示意圖 (a) 為單側(cè)臨界值;(b) 為雙側(cè)臨界值 對(duì)于單側(cè)臨界值對(duì)于雙側(cè)臨界值在自由度相同時(shí), 值越大,t 分布的尾部概率越小;在 t 值相同時(shí),雙側(cè)尾部概率為單側(cè)尾部概率的兩倍:第三節(jié) 總體均數(shù)及總體概率的估計(jì) 一、參數(shù)估計(jì)的基礎(chǔ)理論參數(shù)估計(jì)分為:點(diǎn)估計(jì)和區(qū)間估計(jì)。 (一)點(diǎn)估計(jì)(point estimation)是直接利用樣本統(tǒng)計(jì)量的一個(gè)數(shù)值來(lái)估計(jì)總體參數(shù)。如,根據(jù)例5-1求得的
14、樣本患病率,認(rèn)為該市50歲以上中老年婦女骨質(zhì)疏松癥的總體患病率約為41.5%。優(yōu)點(diǎn):方法簡(jiǎn)單;缺點(diǎn):沒(méi)有考慮到抽樣誤差的大小,故難以反映參數(shù)的估計(jì)值對(duì)其真值的代表性。 (二) 區(qū)間估計(jì)(interval estimation)總體參數(shù)的置信區(qū)間(confidence interval,CI):是將樣本統(tǒng)計(jì)量與標(biāo)準(zhǔn)誤結(jié)合起來(lái),確定一個(gè)具有較大置信度的包含總體參數(shù)的范圍。置信度:記為 或 , 值由研究者預(yù)先規(guī)定,一般取0.1,0.05或0.01。在醫(yī)學(xué)研究中,最常用的置信度是95%。置信區(qū)間由置信下限(lower limit)和置信上限(upper limit)構(gòu)成,是一個(gè)開(kāi)區(qū)間,不包括2個(gè)置信限
15、(confidence limit,CL)的數(shù)值。無(wú)特殊說(shuō)明,估計(jì)雙側(cè)置信區(qū)間。報(bào)告參數(shù)估計(jì)結(jié)果時(shí),應(yīng)同時(shí)給出點(diǎn)估計(jì)值和置信區(qū)間。二、總體均數(shù)及總體概率的區(qū)間估計(jì)(一) 總體均數(shù)的置信區(qū)間1. t 分布法:當(dāng) 未知且 n 較小(如 )時(shí),總體均數(shù) 的雙側(cè) 置信區(qū)間:置信區(qū)間寬度的一半 反映了估計(jì)的精度。表5-1第(4)列,5個(gè)置信區(qū)間估計(jì)錯(cuò)誤。 只有在 的場(chǎng)合下,上述推導(dǎo)才成立,而我們并不知道所研究的樣本是否屬于這種場(chǎng)合,所以只能講上述公式的置信程度為 。 總體均數(shù) 的單側(cè) 置信區(qū)間:總體均數(shù)的95%置信區(qū)間的含義:如果重復(fù)100次抽樣,每次樣本含量均為n,每個(gè)樣本均按 構(gòu)建置信區(qū)間,則在此100個(gè)置信區(qū)間中,平均有95個(gè)包含總體均數(shù),5個(gè)不包含總體均數(shù)。 例5-2 已知某地27名健康成年男子血紅蛋白含量的 g/L,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海售電合同范本
- 兄弟爭(zhēng)房子合同范本
- 農(nóng)村魚(yú)塘承包合同范本
- 合作協(xié)議合同范本4人
- 買賣見(jiàn)證合同范本
- 冶煉設(shè)備租賃合同范本
- 代理英國(guó)租房合同范本
- 出租車成本監(jiān)審合同范本
- 醫(yī)療設(shè)備轉(zhuǎn)租合同范本
- 含租房屋銷售合同范例
- 綠化遷移專項(xiàng)施工方案
- 2025屆高三化學(xué)一輪復(fù)習(xí) 原電池 化學(xué)電源(第一課時(shí))課件
- 全院護(hù)理查房(食管裂孔疝)
- 2024-2025學(xué)年統(tǒng)編版語(yǔ)文九年級(jí)下冊(cè)第7課《溜索》任務(wù)驅(qū)動(dòng)型教學(xué)設(shè)計(jì)
- 2023-2024學(xué)年五年級(jí)科學(xué)下冊(cè)(冀人版)第4課露和霜(教學(xué)設(shè)計(jì))
- 《管理學(xué)》第一章-管理導(dǎo)論
- 2024年國(guó)考公務(wù)員行測(cè)真題及參考答案
- 二手車交易定金合同范本5篇
- NB∕T 10391-2020 水工隧洞設(shè)計(jì)規(guī)范
- HJ 651-2013 礦山生態(tài)環(huán)境保護(hù)與恢復(fù)治理技術(shù)規(guī)范(試行)
- 車輛進(jìn)出道閘車牌識(shí)別系統(tǒng)采購(gòu)安裝調(diào)試合同樣本
評(píng)論
0/150
提交評(píng)論