生物統(tǒng)計(jì)學(xué):參數(shù)估計(jì)基礎(chǔ)_第1頁
生物統(tǒng)計(jì)學(xué):參數(shù)估計(jì)基礎(chǔ)_第2頁
生物統(tǒng)計(jì)學(xué):參數(shù)估計(jì)基礎(chǔ)_第3頁
生物統(tǒng)計(jì)學(xué):參數(shù)估計(jì)基礎(chǔ)_第4頁
生物統(tǒng)計(jì)學(xué):參數(shù)估計(jì)基礎(chǔ)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、參數(shù)估計(jì)基礎(chǔ) 抽樣研究的目的就是要用樣本信息來推斷相應(yīng)總體的特征,這一過程稱為統(tǒng)計(jì)推斷。 統(tǒng)計(jì)推斷包括兩方面的內(nèi)容:參數(shù)估計(jì)和假設(shè)檢驗(yàn)總體樣本抽取部分觀察單位 統(tǒng)計(jì)量 參 數(shù) 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷statistical inference如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率內(nèi)容:參數(shù)估計(jì)(estimation of parameters) 包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2. 假設(shè)檢驗(yàn)(test of hypothesis)誤差:泛指測(cè)得值與真值之差,樣本指標(biāo)與總體指標(biāo)之差。誤差按其產(chǎn)生的原因與性質(zhì)分為兩大類(系統(tǒng)誤差和偶然誤差)。1.系統(tǒng)誤差:由于受試對(duì)象、研究者、儀器設(shè)

2、備、研究方法、非實(shí)驗(yàn)因素影響等確定性原因造成,有一定傾向性或規(guī)律性的誤差。可以避免。2.隨機(jī)測(cè)量誤差:由于多種無法控制的偶然因素引起,對(duì)同一樣品多次測(cè)量數(shù)據(jù)的不一致。無傾向性,不可避免。只可控制在一定的范圍內(nèi)。3.抽樣誤差:由個(gè)體變異產(chǎn)生的、由于抽樣而造成的樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差。無傾向性,不可避免。均數(shù)的抽樣誤差、總體均數(shù)的估計(jì)、分布 1、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤抽樣試驗(yàn)以110名20歲健康男大學(xué)生的身高作為假設(shè)的有限總體,其總體均數(shù) ,標(biāo)準(zhǔn)差 。每次隨機(jī)抽取10個(gè)人的身高作為一個(gè)樣本,記錄下數(shù)據(jù)并計(jì)算均數(shù)、標(biāo)準(zhǔn)差,再放回重新抽樣,共重復(fù)100次,求

3、得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,其樣本均數(shù)列入表3.1。 表3.1 100個(gè)樣本均數(shù)上海市20歲男 大學(xué)生身高 X1=172.7 X4 =172.49X2=173.09X3=172.96同濟(jì)復(fù)旦交大上大例3-1 某市1999年18歲男生身高服從 =167.7cm、 =5.3cm正態(tài)分布,從該N(167.7, 5.32)總體中隨機(jī)抽樣。每次 =10人,共有樣本g=100個(gè),得到每個(gè)樣本均數(shù) 及標(biāo)準(zhǔn)差 。將上述100個(gè)樣本均數(shù)看成新變量值,這100個(gè)樣本均數(shù)構(gòu)成一新分布。 樣本均數(shù)抽樣分布具有如下特點(diǎn):各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異;樣本均數(shù)圍繞總體均數(shù)(167.7cm) 呈正態(tài)分布

4、;樣本均數(shù)變異范圍較原變量變異范 圍大大縮小,這100個(gè)樣本均數(shù)的 均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。在非正態(tài)分布總體中可進(jìn)行類似抽樣。 數(shù)理統(tǒng)計(jì)推理和中心極限定理表明:從 中隨機(jī)抽取n例的樣本,樣本均數(shù) 也服從正態(tài)分布,且即使從非正態(tài)總體中抽取樣本,當(dāng)n足夠大(n30), 分布仍近似正態(tài)分布。隨著樣本量的增大, 樣本均數(shù)的變異范圍也逐漸變窄。 均數(shù)的抽樣誤差(sampling error of mean)-由于抽樣而造成的樣本均數(shù)與總體均數(shù)之差異或各樣本均數(shù)之差異稱為均數(shù)的抽樣誤差。標(biāo)準(zhǔn)誤(standard error) -反映均數(shù)抽樣誤差大小的指標(biāo)是樣本均數(shù) 的標(biāo)準(zhǔn)差,簡(jiǎn)稱標(biāo)準(zhǔn)

5、誤。 理論值 估計(jì)值 標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)誤用于說明抽樣誤差的大小。實(shí)例分析例如:某地成年男子紅細(xì)胞數(shù)的抽樣調(diào)查,求其標(biāo)準(zhǔn)誤。例例: 2000年某研究所隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L 。試估計(jì)該樣本均數(shù)的抽樣誤差。2 樣本頻率的抽樣分布與抽樣誤差 從同一總體中隨機(jī)抽出觀察單位相等的多個(gè)樣本,樣本率與總體率及各樣本率之間都存在差異,這種差異是由于抽樣引起的,稱為頻率的抽樣誤差。 表示頻率的抽樣誤差大小的指標(biāo)叫頻率的標(biāo)準(zhǔn)誤。 :總體率,n:樣本例數(shù)。 當(dāng)未知時(shí),p (為樣本含量足夠大,且p和1-p不太?。?公式為: :率的標(biāo)準(zhǔn)誤的估計(jì)值,p:樣本率

6、。 據(jù)數(shù)理統(tǒng)計(jì)的原理,率的標(biāo)準(zhǔn)誤用 表示 例: 某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人,其中患有骨質(zhì)疏松癥者322人,患病率為41.5%,試計(jì)算該樣本頻率的抽樣誤差。標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的比較 標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)誤1.概念 是衡量個(gè)體觀察值變異 描述樣本均數(shù)距總體均數(shù)的離散 不同 程度的指標(biāo)。 程度,是抽樣誤差大小的尺度。2.用途 A.衡量均數(shù)的代表性 A.衡量樣本均數(shù)代表總體均數(shù)的 不同 可靠性 B.與均數(shù)結(jié)合估計(jì)正常值范圍 B.與樣本均數(shù)結(jié)合估計(jì)總體均數(shù) 的可信區(qū)間 C.計(jì)算變異系數(shù)和標(biāo)準(zhǔn)誤 C.進(jìn)行顯著性檢驗(yàn)3.與例數(shù)的 當(dāng)樣本含量足夠大時(shí),標(biāo)準(zhǔn)差 隨例數(shù)的增大而減小,若樣本含 關(guān)系不同 趨于

7、穩(wěn)定。 量趨于總體例數(shù),則標(biāo)準(zhǔn)誤近似 零,即抽樣誤差為零。4.相同之處 變異指標(biāo) 變異指標(biāo) (個(gè)體觀察值距樣本均數(shù)) (樣本均數(shù)距總體均數(shù)) t分布最早由英國統(tǒng)計(jì)學(xué)家W.S. Gosset于1908年以“Student”筆名發(fā)表,故又稱Students t-distribution。它的發(fā)現(xiàn),開創(chuàng)了小樣本統(tǒng)計(jì)推斷的新紀(jì)元。 2、t 分布(distribution) 隨機(jī)變量X標(biāo)準(zhǔn)正態(tài)分布變換 均數(shù)標(biāo)準(zhǔn)正態(tài)分布Student t分布自由度: t變換 t 分布曲線 分布的特征:以t0為中心的對(duì)稱分布,曲線在t0 處最高與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見綠線) 隨自由度增大,曲線逐漸接

8、近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。t 根據(jù)不同自由度時(shí)曲線下面積與t值的關(guān)系編制 橫標(biāo)目為自由度 ,縱標(biāo)目為概率P,表中數(shù)字為 。 表中只列出正值,負(fù)的t 值用其絕對(duì)值查表。 相同自由度時(shí), t 的絕對(duì)值越大,概率P越小.相同 、相同t 界值下,雙側(cè)P為單側(cè)P的兩倍。t 界值表=9 t分布與 u分布的異同相同點(diǎn):1.二者都是以0為中心,左右對(duì)稱。 2.已平均數(shù)為最高點(diǎn)向兩側(cè)逐漸降。 3.尾部無限延伸,不與基線相交。不同點(diǎn):1. t分布峰部矮尖尾翹,尤其自由度小 時(shí)更為明顯。當(dāng)自由度逐漸增時(shí), t 分布逐漸逼近u分布。 2.標(biāo)準(zhǔn)正態(tài)分布(u分布)曲線下面積 95%和99%的界值是一個(gè)常量,而

9、 t分布曲線不是常量,而是隨著自由 度大小而變化。3、總體均數(shù)可信區(qū)間的估計(jì) 點(diǎn)值估計(jì)(point estimation) 將樣本指標(biāo)作為總體指標(biāo)的估計(jì) 值。 區(qū)間估計(jì)(interval estimation ) 按一定的可信度估計(jì)總體均數(shù)所在 的范圍。參數(shù)估計(jì)參數(shù)估計(jì)是指用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù)). ,即認(rèn)為2000年該地所有健康成年男性血紅蛋白量的總體均數(shù)為125g/L 。1.點(diǎn)估計(jì): 用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。 例如 于2000年測(cè)得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L,試估計(jì)其總體均數(shù)。同理,例5-2中776名50歲以上的中老年婦女骨質(zhì)疏松

10、癥的樣本患病率作為總體患病率的點(diǎn)值估計(jì)值,即認(rèn)為該市所有50歲以上的中老年婦女骨質(zhì)疏松癥的總體患病率約為41.5%。 1.單一總體均數(shù)的可信區(qū)間(1)未知:雙側(cè)1可信區(qū)間單側(cè)1可信區(qū)間 例3-2 在例3-1中抽得第15號(hào)樣本的 =166.95(cm),S=3.64(cm),求其總體均數(shù)的95%可信區(qū)間。 該故地18歲男生身高均數(shù)的95%可信區(qū)間為(164.35, 169.55)cm。(cm)例: 已知某地27例健康成年男性血紅蛋白量的均數(shù)為 ,標(biāo)準(zhǔn)差S=15g/L ,試問該地健康成年男性血紅蛋白量的95%和99%置信區(qū)間。 本例n=27,S=1595%CI:99%CI:(2)已知或未知但n足夠

11、大:已知:雙側(cè)1可信區(qū)間 單側(cè)1可信區(qū) 未知但n足夠大:雙側(cè)1可信區(qū)間 單側(cè)1可信區(qū)間 例3-3 某地抽取正常成年人200名,測(cè)得其血清膽固醇均數(shù)為3.64 mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計(jì)該地正常成年人血清膽固醇均數(shù)95%可信區(qū)間。 本例 =3.64、S=1.20、n=200、 =0.0849, =(3.47, 3.81)(mmolL) 該地正常成年人血清膽固醇均數(shù)雙側(cè)95%可信區(qū)間為(3.47, 3.81)mmolL。例5-4 某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,,試估計(jì)該地19歲健康男大學(xué)生的身高的95%置信

12、區(qū)間。例該市19歲健康男大學(xué)生的身高的95%置信區(qū)間(171.3,173.1)cm總體均數(shù)可信區(qū)間的估計(jì) 可信 已知 未知 未知 區(qū)間 但n足夠大 且n小 95% X1.96x X1.96Sx Xt 0.05( )Sx 99% X2.58x X2.58Sx Xt 0.01()Sx 總體概率的置信區(qū)間與樣本含量n,陽性頻率p的大小有關(guān),可根據(jù)n和p的大小選擇以下兩種方法。1. 正態(tài)近似法 當(dāng)樣本含量足夠大,且p和1-p不太小,則樣本率的分布近似正態(tài)分布。公式為: P為樣本率, 為率的標(biāo)準(zhǔn)誤的估計(jì)值, (二)、總體概率的置信區(qū)間 例5-7 用某種儀器檢查已確診的乳腺癌患者94例,檢出率為78.3%

13、。估計(jì)該儀器乳腺癌總體檢出率的95%置信區(qū)間。分析:本例樣本例數(shù)較大,且樣本率p不太小,可用正態(tài)近似法:2. 查表法 當(dāng)n較小,如n50,特別是p和1-p接近0或1時(shí),應(yīng)按照二項(xiàng)分布的原理估計(jì)總體率的可信區(qū)間。 例5-5 某醫(yī)院對(duì)39名前列腺癌患者實(shí)施開放手術(shù)治療,術(shù)后有合并癥者2人,試估計(jì)該手術(shù)合并癥發(fā)生概率的95%置信區(qū)間。 例5-6 某醫(yī)生用某藥物治療31例腦血管梗塞患者,其中25例患者治療有效,試求該藥物治療腦血管梗塞有效概率的95%置信區(qū)間。注意:此表僅列出Xn/2 的95%置信區(qū)間??尚艆^(qū)間和可信限可信區(qū)間(confidence interval 簡(jiǎn)記為CI) 可信區(qū)間是以上下可信限為界的一個(gè)范圍。例如95%的可信區(qū)間為(171.97,173.49)cm。可信限( confidence limit 簡(jiǎn)記為CL) 可信限是指上限和下限兩個(gè)點(diǎn)值。如171.97為下限結(jié)果報(bào)告:可將點(diǎn)值估計(jì)和區(qū)間估計(jì)同時(shí)寫出 如 172.72(171.97,173.49)cm 可信區(qū)間的兩個(gè)要素1、準(zhǔn)確度即區(qū)間包含總體均數(shù)可能性(概率)大小,反映在可信度 的大小。愈接近1愈好,如可信度 99%比95%好。2、精度反映在區(qū)間的長(zhǎng)度,長(zhǎng)度愈小愈精確。 在樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論