生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)

上傳人：窩*** IP屬地：安徽上傳時(shí)間：2022-09-29 格式：PPT 頁數(shù)：50 大?。?63KB 積分：30 舉報(bào) 版權(quán)申訴

生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)_第2頁

生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)_第3頁

生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)_第4頁

生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)_第5頁

已閱讀5頁，還剩45頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、參數(shù)估計(jì)基礎(chǔ) 抽樣研究的目的就是要用樣本信息來推斷相應(yīng)總體的特征，這一過程稱為統(tǒng)計(jì)推斷。統(tǒng)計(jì)推斷包括兩方面的內(nèi)容：參數(shù)估計(jì)和假設(shè)檢驗(yàn)總體樣本抽取部分觀察單位統(tǒng)計(jì)量參數(shù) 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷statistical inference如：樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P如：總體均數(shù) 總體標(biāo)準(zhǔn)差總體率內(nèi)容：參數(shù)估計(jì)(estimation of parameters) 包括：點(diǎn)估計(jì)與區(qū)間估計(jì)2. 假設(shè)檢驗(yàn)（test of hypothesis)誤差：泛指測(cè)得值與真值之差，樣本指標(biāo)與總體指標(biāo)之差。誤差按其產(chǎn)生的原因與性質(zhì)分為兩大類（系統(tǒng)誤差和偶然誤差）。1.系統(tǒng)誤差：由于受試對(duì)象、研究者、儀器設(shè)

2、備、研究方法、非實(shí)驗(yàn)因素影響等確定性原因造成，有一定傾向性或規(guī)律性的誤差。可以避免。2.隨機(jī)測(cè)量誤差：由于多種無法控制的偶然因素引起，對(duì)同一樣品多次測(cè)量數(shù)據(jù)的不一致。無傾向性，不可避免。只可控制在一定的范圍內(nèi)。3.抽樣誤差：由個(gè)體變異產(chǎn)生的、由于抽樣而造成的樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差。無傾向性，不可避免。均數(shù)的抽樣誤差、總體均數(shù)的估計(jì)、分布 1、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤抽樣試驗(yàn)以110名20歲健康男大學(xué)生的身高作為假設(shè)的有限總體，其總體均數(shù) ，標(biāo)準(zhǔn)差。每次隨機(jī)抽取10個(gè)人的身高作為一個(gè)樣本，記錄下數(shù)據(jù)并計(jì)算均數(shù)、標(biāo)準(zhǔn)差，再放回重新抽樣，共重復(fù)100次，求

3、得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差，其樣本均數(shù)列入表3.1。表3.1 100個(gè)樣本均數(shù)上海市20歲男大學(xué)生身高 X1=172.7 X4 =172.49X2=173.09X3=172.96同濟(jì)復(fù)旦交大上大例3-1 某市1999年18歲男生身高服從 =167.7cm、 =5.3cm正態(tài)分布，從該N(167.7, 5.32)總體中隨機(jī)抽樣。每次 =10人，共有樣本g=100個(gè)，得到每個(gè)樣本均數(shù) 及標(biāo)準(zhǔn)差。將上述100個(gè)樣本均數(shù)看成新變量值，這100個(gè)樣本均數(shù)構(gòu)成一新分布。樣本均數(shù)抽樣分布具有如下特點(diǎn)：各樣本均數(shù)未必等于總體均數(shù)；各樣本均數(shù)間存在差異；樣本均數(shù)圍繞總體均數(shù)(167.7cm) 呈正態(tài)分布

4、；樣本均數(shù)變異范圍較原變量變異范圍大大縮小，這100個(gè)樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。在非正態(tài)分布總體中可進(jìn)行類似抽樣。數(shù)理統(tǒng)計(jì)推理和中心極限定理表明:從中隨機(jī)抽取n例的樣本，樣本均數(shù) 也服從正態(tài)分布,且即使從非正態(tài)總體中抽取樣本，當(dāng)n足夠大（n30), 分布仍近似正態(tài)分布。隨著樣本量的增大, 樣本均數(shù)的變異范圍也逐漸變窄。均數(shù)的抽樣誤差(sampling error of mean)-由于抽樣而造成的樣本均數(shù)與總體均數(shù)之差異或各樣本均數(shù)之差異稱為均數(shù)的抽樣誤差。標(biāo)準(zhǔn)誤(standard error) -反映均數(shù)抽樣誤差大小的指標(biāo)是樣本均數(shù) 的標(biāo)準(zhǔn)差，簡(jiǎn)稱標(biāo)準(zhǔn)

5、誤。理論值估計(jì)值標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)誤用于說明抽樣誤差的大小。實(shí)例分析例如：某地成年男子紅細(xì)胞數(shù)的抽樣調(diào)查，求其標(biāo)準(zhǔn)誤。例例： 2000年某研究所隨機(jī)調(diào)查某地健康成年男子27人，得到血紅蛋白的均數(shù)為125g/L，標(biāo)準(zhǔn)差為15g/L 。試估計(jì)該樣本均數(shù)的抽樣誤差。2 樣本頻率的抽樣分布與抽樣誤差從同一總體中隨機(jī)抽出觀察單位相等的多個(gè)樣本，樣本率與總體率及各樣本率之間都存在差異，這種差異是由于抽樣引起的，稱為頻率的抽樣誤差。表示頻率的抽樣誤差大小的指標(biāo)叫頻率的標(biāo)準(zhǔn)誤。：總體率，n：樣本例數(shù)。當(dāng)未知時(shí)，p （為樣本含量足夠大，且p和1-p不太?。?公式為: ：率的標(biāo)準(zhǔn)誤的估計(jì)值，p：樣本率

6、。據(jù)數(shù)理統(tǒng)計(jì)的原理，率的標(biāo)準(zhǔn)誤用表示例：某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人，其中患有骨質(zhì)疏松癥者322人，患病率為41.5%，試計(jì)算該樣本頻率的抽樣誤差。標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的比較標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤1.概念是衡量個(gè)體觀察值變異描述樣本均數(shù)距總體均數(shù)的離散不同程度的指標(biāo)。程度，是抽樣誤差大小的尺度。2.用途 A.衡量均數(shù)的代表性 A.衡量樣本均數(shù)代表總體均數(shù)的不同可靠性 B.與均數(shù)結(jié)合估計(jì)正常值范圍 B.與樣本均數(shù)結(jié)合估計(jì)總體均數(shù) 的可信區(qū)間 C.計(jì)算變異系數(shù)和標(biāo)準(zhǔn)誤 C.進(jìn)行顯著性檢驗(yàn)3.與例數(shù)的當(dāng)樣本含量足夠大時(shí)，標(biāo)準(zhǔn)差隨例數(shù)的增大而減小，若樣本含關(guān)系不同趨于

7、穩(wěn)定。量趨于總體例數(shù)，則標(biāo)準(zhǔn)誤近似零，即抽樣誤差為零。4.相同之處變異指標(biāo) 變異指標(biāo) （個(gè)體觀察值距樣本均數(shù)）（樣本均數(shù)距總體均數(shù)） t分布最早由英國統(tǒng)計(jì)學(xué)家W.S. Gosset于1908年以“Student”筆名發(fā)表，故又稱Students t-distribution。它的發(fā)現(xiàn)，開創(chuàng)了小樣本統(tǒng)計(jì)推斷的新紀(jì)元。 2、t 分布（distribution）隨機(jī)變量X標(biāo)準(zhǔn)正態(tài)分布變換均數(shù)標(biāo)準(zhǔn)正態(tài)分布Student t分布自由度： t變換 t 分布曲線分布的特征：以t0為中心的對(duì)稱分布，曲線在t0 處最高與正態(tài)分布相比，曲線最高處較矮，兩尾部翹得高（見綠線）隨自由度增大，曲線逐漸接

8、近正態(tài)分布；分布的極限為標(biāo)準(zhǔn)正態(tài)分布。t 根據(jù)不同自由度時(shí)曲線下面積與t值的關(guān)系編制橫標(biāo)目為自由度，縱標(biāo)目為概率P，表中數(shù)字為。表中只列出正值，負(fù)的t 值用其絕對(duì)值查表。相同自由度時(shí), t 的絕對(duì)值越大,概率P越小.相同、相同t 界值下，雙側(cè)P為單側(cè)P的兩倍。t 界值表=9 t分布與 u分布的異同相同點(diǎn)：1.二者都是以0為中心，左右對(duì)稱。 2.已平均數(shù)為最高點(diǎn)向兩側(cè)逐漸降。 3.尾部無限延伸，不與基線相交。不同點(diǎn)：1. t分布峰部矮尖尾翹，尤其自由度小時(shí)更為明顯。當(dāng)自由度逐漸增時(shí)， t 分布逐漸逼近u分布。 2.標(biāo)準(zhǔn)正態(tài)分布（u分布）曲線下面積 95%和99%的界值是一個(gè)常量，而

9、 t分布曲線不是常量，而是隨著自由度大小而變化。3、總體均數(shù)可信區(qū)間的估計(jì) 點(diǎn)值估計(jì)（point estimation）將樣本指標(biāo)作為總體指標(biāo)的估計(jì) 值。區(qū)間估計(jì)（interval estimation ）按一定的可信度估計(jì)總體均數(shù)所在的范圍。參數(shù)估計(jì)參數(shù)估計(jì)是指用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù)). ，即認(rèn)為2000年該地所有健康成年男性血紅蛋白量的總體均數(shù)為125g/L 。1.點(diǎn)估計(jì)：用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。例如于2000年測(cè)得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L，試估計(jì)其總體均數(shù)。同理，例5-2中776名50歲以上的中老年婦女骨質(zhì)疏松

10、癥的樣本患病率作為總體患病率的點(diǎn)值估計(jì)值，即認(rèn)為該市所有50歲以上的中老年婦女骨質(zhì)疏松癥的總體患病率約為41.5%。 1.單一總體均數(shù)的可信區(qū)間(1)未知：雙側(cè)1可信區(qū)間單側(cè)1可信區(qū)間例3-2 在例3-1中抽得第15號(hào)樣本的 =166.95(cm)，S=3.64(cm)，求其總體均數(shù)的95%可信區(qū)間。該故地18歲男生身高均數(shù)的95%可信區(qū)間為(164.35, 169.55)cm。(cm)例：已知某地27例健康成年男性血紅蛋白量的均數(shù)為，標(biāo)準(zhǔn)差S=15g/L ,試問該地健康成年男性血紅蛋白量的95%和99%置信區(qū)間。本例n=27，S=1595%CI：99%CI：(2)已知或未知但n足夠

11、大:已知:雙側(cè)1可信區(qū)間單側(cè)1可信區(qū) 未知但n足夠大:雙側(cè)1可信區(qū)間單側(cè)1可信區(qū)間例3-3 某地抽取正常成年人200名，測(cè)得其血清膽固醇均數(shù)為3.64 mmol/L，標(biāo)準(zhǔn)差為1.20mmol/L，估計(jì)該地正常成年人血清膽固醇均數(shù)95%可信區(qū)間。本例 =3.64、S=1.20、n=200、 =0.0849， =(3.47, 3.81)(mmolL) 該地正常成年人血清膽固醇均數(shù)雙側(cè)95%可信區(qū)間為(3.47, 3.81)mmolL。例5-4 某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高，其均數(shù)為172.2cm，標(biāo)準(zhǔn)差為4.5cm,，試估計(jì)該地19歲健康男大學(xué)生的身高的95%置信

12、區(qū)間。例該市19歲健康男大學(xué)生的身高的95%置信區(qū)間(171.3,173.1)cm總體均數(shù)可信區(qū)間的估計(jì) 可信已知未知未知區(qū)間但n足夠大且n小 95% X1.96x X1.96Sx Xt 0.05（）Sx 99% X2.58x X2.58Sx Xt 0.01（）Sx 總體概率的置信區(qū)間與樣本含量n，陽性頻率p的大小有關(guān)，可根據(jù)n和p的大小選擇以下兩種方法。1. 正態(tài)近似法當(dāng)樣本含量足夠大，且p和1-p不太小，則樣本率的分布近似正態(tài)分布。公式為： P為樣本率，為率的標(biāo)準(zhǔn)誤的估計(jì)值，（二）、總體概率的置信區(qū)間例5-7 用某種儀器檢查已確診的乳腺癌患者94例，檢出率為78.3%

13、。估計(jì)該儀器乳腺癌總體檢出率的95%置信區(qū)間。分析：本例樣本例數(shù)較大，且樣本率p不太小，可用正態(tài)近似法：2. 查表法當(dāng)n較小，如n50，特別是p和1-p接近0或1時(shí)，應(yīng)按照二項(xiàng)分布的原理估計(jì)總體率的可信區(qū)間。例5-5 某醫(yī)院對(duì)39名前列腺癌患者實(shí)施開放手術(shù)治療，術(shù)后有合并癥者2人，試估計(jì)該手術(shù)合并癥發(fā)生概率的95%置信區(qū)間。例5-6 某醫(yī)生用某藥物治療31例腦血管梗塞患者，其中25例患者治療有效，試求該藥物治療腦血管梗塞有效概率的95%置信區(qū)間。注意：此表僅列出Xn/2 的95%置信區(qū)間?？尚艆^(qū)間和可信限可信區(qū)間（confidence interval 簡(jiǎn)記為CI）可信區(qū)間是以上下可信限為界的一個(gè)范圍。例如95%的可信區(qū)間為（171.97，173.49）cm。可信限（ confidence limit 簡(jiǎn)記為CL）可信限是指上限和下限兩個(gè)點(diǎn)值。如171.97為下限結(jié)果報(bào)告：可將點(diǎn)值估計(jì)和區(qū)間估計(jì)同時(shí)寫出如 172.72（171.97，173.49）cm 可信區(qū)間的兩個(gè)要素1、準(zhǔn)確度即區(qū)間包含總體均數(shù)可能性（概率）大小，反映在可信度的大小。愈接近1愈好，如可信度 99%比95%好。2、精度反映在區(qū)間的長(zhǎng)度，長(zhǎng)度愈小愈精確。在樣本

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

生物統(tǒng)計(jì)學(xué)：參數(shù)估計(jì)基礎(chǔ)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔