![醫(yī)學統(tǒng)計學教學課件:第五章 參數(shù)估計_第1頁](http://file4.renrendoc.com/view/e86b4ba92169587c66ca118f9c106e44/e86b4ba92169587c66ca118f9c106e441.gif)
![醫(yī)學統(tǒng)計學教學課件:第五章 參數(shù)估計_第2頁](http://file4.renrendoc.com/view/e86b4ba92169587c66ca118f9c106e44/e86b4ba92169587c66ca118f9c106e442.gif)
![醫(yī)學統(tǒng)計學教學課件:第五章 參數(shù)估計_第3頁](http://file4.renrendoc.com/view/e86b4ba92169587c66ca118f9c106e44/e86b4ba92169587c66ca118f9c106e443.gif)
![醫(yī)學統(tǒng)計學教學課件:第五章 參數(shù)估計_第4頁](http://file4.renrendoc.com/view/e86b4ba92169587c66ca118f9c106e44/e86b4ba92169587c66ca118f9c106e444.gif)
![醫(yī)學統(tǒng)計學教學課件:第五章 參數(shù)估計_第5頁](http://file4.renrendoc.com/view/e86b4ba92169587c66ca118f9c106e44/e86b4ba92169587c66ca118f9c106e445.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第五章 參數(shù)估計(Parameter Estimation )復習計量資料的統(tǒng)計描述集中趨勢的描述 均數(shù)、中位數(shù)、幾何均數(shù)離散趨勢的描述 極差、四分位數(shù)間距、 方差和標準差、變異系數(shù)正態(tài)分布、標準正態(tài)分布 醫(yī)學參考值范圍的制定基本概念參數(shù)(Parameter):描述總體特征的統(tǒng)計指標。 如:(總體均數(shù))、(總體標準差)。統(tǒng)計量(Statistic):由樣本數(shù)據(jù)計算得到的統(tǒng)計指 標量。 如: (樣本均數(shù))、S (樣本標準差)總體(Population):根據(jù)研究目的確定的同質(zhì)觀察單位的全體。樣本(Sample):從總體中隨機抽取部分觀察單位,其實測值的集合。統(tǒng)計推斷抽樣研究是期望通過樣本提供的信
2、息來推斷總體特征,即統(tǒng)計推斷(Statistical Interference);其主要內(nèi)容是參數(shù)估計和假設(shè)檢驗。參數(shù)估計:用樣本均數(shù)、樣本率推斷總體均數(shù)、總體率。 11假設(shè)檢驗:用推理的方法來判斷某個(某幾個)樣本是否來源于預先假設(shè)的總體。 22populationsamplestatisticparameter現(xiàn)由某地健康成年男子中隨機抽得144人,測得紅細胞均數(shù)為5.38(1012/L),標準差為0.44(1012/L),試估計該地健康成年男子紅細胞均數(shù)。在某地隨機抽取329人,作血清登革熱血凝抑制抗體反應檢驗,結(jié)果29人陽性,估計該地人群血清登革熱血凝抑制抗體陽性率。 33如果已知健康
3、成年男子的紅細胞均數(shù)為5.20(1012/L),能否據(jù)此認為該地成年男子的紅細胞均數(shù)(均數(shù)為5.38(1012/L),標準差為0.44(1012/L))高于一般成年男子的紅細胞均數(shù)?X?第一節(jié) 抽樣分布與抽樣誤差 一、均數(shù)的抽樣誤差 在醫(yī)學研究中,絕大多數(shù)情況是由樣本信息研究總體。 由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數(shù) 往往不等于總體均數(shù) 。 這種由個體變異和抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異稱為抽樣誤差( Sampling error)100份樣本的均數(shù)和標準差 將這100份樣本的均數(shù)看成新變量值,按第二章的頻數(shù)分布方法,得到這100個樣本均數(shù)的直方圖見圖4
4、-1。圖4-1 隨機抽樣所得100個樣本均數(shù)的分布 100個樣本均數(shù)的抽樣分布特點: 100個樣本均數(shù)中,各樣本均數(shù)間存在差異,但各樣本均數(shù)在總體均數(shù)周圍波動。樣本均數(shù)的分布曲線為中間高,兩邊低,左右對稱,近似服從正態(tài)分布。 樣本均數(shù)的標準差明顯變?。簶藴收`(standard error,SE)樣本統(tǒng)計量的標準差稱為標準誤,用來衡量抽樣誤差的大小。標準誤與個體變異 成正比,與樣本含量n的平方根成反比。標準誤理論值標準誤的估計值 通過增加樣本含量n來降低抽樣誤差。 計算了100個樣本的標準差S,由此可計算每一樣本的抽樣誤差大小。3個抽樣實驗結(jié)果圖示抽樣實驗小結(jié) 均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。
5、均數(shù)的標準差即標準誤 與總體標準差 相差一個常數(shù)的倍數(shù),即 樣本均數(shù)的標準誤(Standard Error)=樣本標準差/ 從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n) 。標準差變量值圍繞樣本均數(shù)的離散程度頻數(shù)分布估計(醫(yī)學參考值范圍估計)聯(lián)系:標準誤樣本均數(shù)圍繞總體均數(shù)的離散程度總體均數(shù)估計(樣本推論總體)標準差與標準誤的異同與聯(lián)系相同:均為變異指標 練習題:在某地隨機抽查成年男子140人,計算得紅細胞均數(shù)4.771012/L,標準差0.38 1012/L ,試計算均數(shù)的標準誤。 二、抽樣誤差的分布 理論上可以證明:若從正態(tài)總體 中,反復多次隨機抽取樣
6、本含量固定為 n 的樣本,那么這些樣本均數(shù) 也服從正態(tài)分布,即 的總體均數(shù)仍為 ,樣本均數(shù)的標準差為 。抽樣分布 抽樣分布示意圖 中心極限定理: 當樣本含量很大的情況下,無論原始測量變量服從什么分布, 的抽樣分布均近似正態(tài)。 抽樣分布 抽樣分布示意圖t 分布(t-distribution)隨機變量XN(m,s2)標準正態(tài)分布N(0,12)Z變換均數(shù)標準正態(tài)分布N(0,12)Student t分布自由度:n-1 t 分布的特點以0為中心的單峰對稱分布曲線的中間比標準正態(tài)分布低,兩側(cè)翹得比標準正態(tài)分布略高 t 分布曲線的形狀與自由度()有關(guān)f3 2 1 0 1 2 3 不同自由度下t分布示意圖 9
7、1標準正態(tài)曲線 t 分布曲線下的面積統(tǒng)計應用中最為關(guān)心的是 t 分布曲線下的尾部面積(即概率 P)與橫軸 t值間的關(guān)系。t曲線是一簇曲線,t 曲線下面積為95或99%的界值不是一個常量,而是隨自由度變化的。t界值表 (P488,附表4)該表的橫標目為自由度,縱標目為概率P,表中數(shù)值為其相應的t界值,記作t, (為檢驗水準)。 陰影部分表示t,以外尾部面積占總面積的百分數(shù),即概率P。t分布是以0為中心的對稱分布,表中只列出正值,不管t值正負只用絕對值。1.8122.228-2.228tf (t)=10的t分布圖t分布曲線下面積雙側(cè)t0.05/2,92.262 單側(cè)t0.025,9單側(cè)t0.05,
8、91.833雙側(cè)t0.01/2,93.250 單側(cè)t0.005,9單側(cè)t0.01,92.821雙側(cè)t0.05/2,1.96 單側(cè)t0.025,單側(cè)t0.05, 1.64練習題1當樣本含量增大時,以下說法正確的是( )A. 標準差會變小B. 樣本均數(shù)標準誤會變小C. 均數(shù)標準誤會變大D標準差會變大B2. 標準誤的英文縮寫為:AS BSE C DSD3. 通??刹捎靡韵履欠N方法來減小抽樣誤差:A減小樣本標準差 B減小樣本含量 C擴大樣本含量 D以上都不對BC思考題1、抽樣誤差的大小常用哪個指標衡量? 大小與哪些因素有關(guān)?2、正態(tài)分布與t分布的關(guān)系如何?3、 t分布的單雙側(cè)的界值有何關(guān)系? 總體均數(shù)
9、的點估計(point estimation)與區(qū)間估計(interval estimation)參數(shù)的估計點估計:由樣本統(tǒng)計量 直接估計 總體參數(shù)區(qū)間估計:在一定可信度(Confidence level) 下,同時考慮抽樣誤差第二節(jié) 總體均數(shù)的估計 一、點估計 直接用樣本統(tǒng)計量作為總體參數(shù)的估計值 方法簡單,但未考慮抽樣誤差的大小在實際問題中,總體參數(shù)往往是未知的,但它們是固定的值,并不是隨機變量值。而樣本統(tǒng)計量隨樣本的不同而不同,屬隨機的 二、區(qū)間估計指按預先給定的概率,計算出一個區(qū)間 (也稱為可信區(qū)間Confidence Interval, CI),使它能夠包含未知的總體均數(shù)。事先給定的概
10、率 1-稱為可信度,通常取 1-=0.95 。二、總體均數(shù)可信區(qū)間的計算s已知,或 s 未知但 n 足夠大,按 Z 分布s未知,且 n 較小,按 t 分布(一) 已知一般情況其中 為標準正態(tài)分布的雙側(cè)界值。 可信區(qū)間:(二) 未知 通常未知,這時可以用其估計量S 代替,但 已不再服從標準正態(tài)分布,而是服從 t 分布??尚艆^(qū)間: 需要注意:在小樣本情況下,應用這一公式的條件是原始變量服從正態(tài)分布。在大樣本情況下(如n100),也可以用 替換 近似計算。 例5-3 隨機測得某地9名7歲男孩身高資料,均數(shù)為121.44cm,標準差為5.75cm,試計算該地7歲男孩身高總體均數(shù)的95%可信區(qū)間。P82
11、下限:上限: 例5-4 隨機抽的某地90名正常成年女性,計算其紅細胞數(shù)的均值為4.18( )、標準差為0.29( )。試計算該地成年女性紅細胞總體均數(shù)的95%可信區(qū)間。 本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因為 ,則95%可信區(qū)間為:下限:上限: 三、可信區(qū)間估計的優(yōu)劣一是可信度1(準確度),愈接近1愈好,如99%的可信度比95%的可信度要好; 二是區(qū)間的寬度(精密度),區(qū)間愈窄愈好。當樣本含量為定值時,上述兩者互相矛盾。 在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度??尚艆^(qū)間的涵義可信區(qū)間估計的涵義:可信區(qū)間的優(yōu)劣:P83四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別P84練習1. 對某人群隨機抽取20人,用某批號的結(jié)核菌素作皮試,平均侵潤直徑為10.9mm,標準差為3.86mm。問這批結(jié)核菌素在人群中使
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子產(chǎn)品物流合同要點分析
- 2025年度辦公室綠植養(yǎng)護與室內(nèi)環(huán)境美化合同
- 房屋租賃合同公文
- 企業(yè)人才測評及職業(yè)發(fā)展規(guī)劃支持方案設(shè)計
- 云計算服務配置與管理手冊
- 解決方案設(shè)計與實施指南
- 設(shè)計服務合同書
- 企業(yè)信息化解決方案操作手冊
- 建設(shè)工程施工分包委托協(xié)議書
- 車床購買合同樣本
- 2024年云南省公務員考試【申論縣鄉(xiāng)卷、行測、事業(yè)單位招聘】3套 真題及答案
- 數(shù)字媒體藝術(shù)專業(yè)行業(yè)分析報告
- 全國職業(yè)院校技能大賽高職組(市政管線(道)數(shù)字化施工賽項)考試題庫(含答案)
- 湖南省長沙市長郡教育集團2024-2025學年七年級上學期期末考試英語試題(含答案)
- 公司員工升職加薪制度模板
- 2024上海市招聘社區(qū)工作者考試題及參考答案
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院服務能力建設(shè)醫(yī)療質(zhì)控部分課件
- 《招標投標法》考試題庫200題(含答案)
- 2024版市政工程承包合同簽約流程規(guī)范指南2篇
- 立春氣象與健康
- 卵圓孔未閉病因介紹
評論
0/150
提交評論