版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)Medical Statistics 第三章 總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)Parameter estimation and hypothesis testingOutline 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計(jì)假設(shè)檢驗(yàn)的基本原理與步驟t檢驗(yàn)假設(shè)檢驗(yàn)的注意事項(xiàng)正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)統(tǒng)計(jì)學(xué)的分析思路samplepopulationSampling(抽樣研究)Inferring(統(tǒng)計(jì)推斷)統(tǒng)計(jì)推斷(statistical inference)總體參數(shù)的估計(jì)(第3節(jié))(parameter estimation)假設(shè)檢驗(yàn)(第4-7節(jié))(hypothesis testing) ? 樣本含量
2、n 樣本均 數(shù) 樣本標(biāo)準(zhǔn)差抽樣推斷 參數(shù)估計(jì)Parameter estimation點(diǎn)估計(jì)(point estimation) :由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì)(interval estimation): 獲得一個(gè)置信區(qū)間(confidence interval,CI)按預(yù)先給定的概率(1)所確定的包含未知總體參數(shù)的一個(gè)范圍。 總體均數(shù)的估計(jì)置信區(qū)間的計(jì)算總體均數(shù)置信區(qū)間估計(jì)的通式18歲男身高第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤抽樣誤差(sampling error)有兩種表現(xiàn)形式:(1)樣本統(tǒng)計(jì)量與總體參數(shù)間的差異,例如樣本均數(shù)與總體均數(shù)間的差異。(2)樣本統(tǒng)計(jì)量間的差異。 均數(shù)的抽樣誤差:
3、由個(gè)體變異產(chǎn)生、隨機(jī)抽樣造成的樣本均數(shù)與總體均數(shù)的差異。抽樣誤差產(chǎn)生的條件 抽樣誤差的存在離不開(kāi)兩個(gè)基本條件。(1) 抽樣研究。抽樣是抽樣誤差產(chǎn)生的基本條件之一。只有抽樣研究存在抽樣誤差;樣本例數(shù)越少,抽樣誤差可能會(huì)越大。(2) 個(gè)體變異。變異是抽樣誤差產(chǎn)生的又一基本條件。變異是普遍存在的,也正是醫(yī)學(xué)統(tǒng)計(jì)學(xué)所要研究的。變異大的事物其抽樣誤差也大,反之則小。抽樣誤差的意義與特點(diǎn)抽樣誤差的意義 用于參數(shù)估計(jì)和假設(shè)檢驗(yàn)抽樣誤差的特點(diǎn)抽樣研究中抽樣誤差不可避免可估計(jì)和控制抽樣誤差描述抽樣誤差的指標(biāo)樣本含量相等的樣本均數(shù)的變異度可描述均數(shù)的抽樣誤差。樣本均數(shù)的變異度如何度量? 中心極限定理(centra
4、l limit theorem)1、當(dāng)原始觀察值的分布為正態(tài)分布時(shí),樣 本均數(shù)的分布服從正態(tài)分布。 即使從非正態(tài)總體中隨機(jī)抽樣,只要樣本含 量足夠大,樣本均數(shù)的分布也趨于正態(tài)分布。 2、樣本均數(shù)的均數(shù)等于原總體的總體均數(shù) (),樣本均數(shù)的標(biāo)準(zhǔn)差等于 。標(biāo)準(zhǔn)誤通常將樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(standard error,SE) (理論值) (估計(jì)值) 標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系應(yīng)用:標(biāo)準(zhǔn)差屬統(tǒng)計(jì)描述參考值范圍 標(biāo)準(zhǔn)誤為統(tǒng)計(jì)推斷置信區(qū)間估計(jì)意義:標(biāo)準(zhǔn)差越小,均數(shù)代表性越好; 標(biāo)準(zhǔn)誤越小,抽樣誤差越小, 樣本均數(shù)估計(jì)總體均數(shù)可靠性越大。與n的關(guān)系:n越大,標(biāo)準(zhǔn)差越穩(wěn)定; n越大,標(biāo)準(zhǔn)誤越小。都是
5、描述變異度的指標(biāo)。樣本含量固定,標(biāo)準(zhǔn)差越大,標(biāo)準(zhǔn)誤越大。區(qū)別聯(lián)系第二節(jié) t 分布W.S. Gosset(18761937)1908年, Gosset首次以Student為筆名,在Biometrika雜志上發(fā)表了“The probable error of a mean”。由于這篇文章提供了“學(xué)生t檢驗(yàn)”的基礎(chǔ),為此,許多統(tǒng)計(jì)學(xué)家把1908年看作是統(tǒng)計(jì)推斷理論發(fā)展史上的里程碑。 William Sealy GossetGosset是英國(guó)一家釀酒廠的化學(xué)技師,在長(zhǎng)期從事實(shí)驗(yàn)和數(shù)據(jù)分析工作中,發(fā)現(xiàn)了t分布。但當(dāng)時(shí)Gosset的公司害怕商業(yè)機(jī)密外泄,禁止員工對(duì)外發(fā)表文章。所以Gosset在1908年以
6、“Student”筆名發(fā)表此項(xiàng)結(jié)果,故后人又稱它為“Student t分布”。在當(dāng)時(shí)正態(tài)分布一統(tǒng)天下的情況下, Gosset的分布沒(méi)有被外界理解和接受,只能在他的釀酒廠中使用,直到1923年英國(guó)統(tǒng)計(jì)學(xué)家Fisher給出分布的嚴(yán)格推導(dǎo)并于1925年編制了t分布表后,t分布才得到學(xué)術(shù)界的承認(rèn),并獲得迅速的傳播、發(fā)展和應(yīng)用。William Sealy Gosset英國(guó)統(tǒng)計(jì)學(xué)家,小樣本理論和方法的創(chuàng)立者,現(xiàn)代統(tǒng)計(jì)方法及其應(yīng)用于實(shí)驗(yàn)設(shè)計(jì)與分析的先驅(qū)。Gosset的主要貢獻(xiàn)是創(chuàng)立了t分布,開(kāi)創(chuàng)了小樣本理論的先河。由于Gosset開(kāi)創(chuàng)的理論使統(tǒng)計(jì)學(xué)開(kāi)始由大樣本向小樣本、由描述向推斷發(fā)展,因此,有人把Goss
7、et推崇為推斷統(tǒng)計(jì)學(xué)(尤其是小樣本理論研究)的先驅(qū)者。隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)u變換均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Student t分布自由度:n-1St 分布的圖形(u 分布 是t 分布的特例)t分布的特征 以0為中心,左右對(duì)稱的單峰分布; t分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)。 自由度越小,則t值越分散,曲線越低平; 自由度逐漸增大時(shí),t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)趨于時(shí),t分布即為u分布。 t 界值表應(yīng)用1已知 和 ,求t1.8122.228-2.228tf (t)=10的t分布圖t界值表應(yīng)用2已知 和t,求面積P舉例: =10,t=2,
8、P的范圍(單、雙側(cè)) =10,t=3,P的范圍 =10,t=5,P的范圍結(jié)論: 自由度一定,t絕對(duì)值越大,P值越小。自由度一定,t值一定,雙側(cè)概率為單側(cè)概率的2倍。 參數(shù)估計(jì)Parameter estimation點(diǎn)估計(jì)(point estimation) :由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì)(interval estimation): 獲得一個(gè)置信區(qū)間(confidence interval,CI)按預(yù)先給定的概率(1)所確定的包含未知總體參數(shù)的一個(gè)范圍。第三節(jié) 總體均數(shù)的估計(jì)置信區(qū)間的計(jì)算總體均數(shù)置信區(qū)間估計(jì)的通式 (1)或100 (1) 稱為置信度(confidence level),
9、常取95(90、99)。即95置信區(qū)間,或95%CI。置信區(qū)間的有關(guān)概念 置信區(qū)間的兩個(gè)界值即兩個(gè)置信限(confidence limit,CL): 較小的稱為置信下限(lower limit,L), 較大的稱為置信上限(upper limit,U), 換句話說(shuō),做出所有18歲男生身高總體均數(shù)為164.4 169.6cm的結(jié)論,說(shuō)對(duì)的概率是95%,說(shuō)錯(cuò)的概率是5%。置信區(qū)間的含義: 雖然不能知道某地所有18歲男生身高總體均數(shù)的確切數(shù)值,所有18歲男生身高均數(shù)在164.4 169.6cm之間的可能性是95%。置信區(qū)間的兩個(gè)要素準(zhǔn)確度:即置信度,越高越好。精 度:即區(qū)間的寬度,越窄越好。置信區(qū)間與
10、參考值范圍的區(qū)別第四節(jié) 假設(shè)檢驗(yàn)的基本原理與步驟例3-5某醫(yī)生測(cè)量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問(wèn)從事鉛作業(yè)男性工人的血紅蛋白含量均數(shù)是否不等于正常成年男性的均數(shù)140g/L?問(wèn)題: 鉛作業(yè)男性 正常成年男性? 0140 ?樣本含量: 36樣本均數(shù): 130.83樣本標(biāo)準(zhǔn)差: 25.74假設(shè)檢驗(yàn)的一般步驟 步驟1:建立假設(shè),確定檢驗(yàn)水準(zhǔn)。檢驗(yàn)假設(shè) (null hypothesis)、原假設(shè),或零假設(shè),記為H0,表示目前的差異是由于抽樣誤差引起的。H0:140g/L,鉛作業(yè)男性工人與一般正常成年男 性血紅蛋白總體均數(shù)相等;備擇
11、假設(shè)(alternative hypothesis),記為H1,表示目前的差異是主要由于本質(zhì)上的差別引起的。 H1: 140g/L,鉛作業(yè)男性工人與一般正常成年 男性血紅蛋白總體均數(shù)不等。假設(shè)檢驗(yàn)的一般步驟H0假設(shè)比較單純、明確,且在該假設(shè)的前提下有規(guī)律可尋。而H1假設(shè)包含的情況比較復(fù)雜。因此,檢驗(yàn)是針對(duì)H0的。 假設(shè)檢驗(yàn)的基本原理“小概率反證法”的原理提出一個(gè)假設(shè)如果假設(shè)成立,得到現(xiàn)有樣本的可能性可能性很?。ㄐ「怕适录谝淮卧囼?yàn)中本不該得到,居然得到了,即樣本信息不支持H0,說(shuō)明我們的假設(shè)有問(wèn)題,拒絕之。有可能得到手頭的結(jié)果,故根據(jù)現(xiàn)有的樣本無(wú)法拒絕事先的假設(shè)(沒(méi)理由)。雙側(cè)檢驗(yàn)與單側(cè)檢
12、驗(yàn)雙側(cè)檢驗(yàn)(two-sided test)H0 : 0H1 : 0單側(cè)檢驗(yàn) (one-sided test)H0 : 0 H0 : 0H1 : 0 H1 : 0.10,不拒絕H0 ,正態(tài)性滿足。P0.10,拒絕H0 ,接受H1,正態(tài)性不滿足。 配對(duì)t檢驗(yàn)(例3-6)兩樣本t檢驗(yàn)(例3-7)方差齊性考察Homoscedascity;Homogeneity of variances; Equal variances目測(cè)法 較大方差是較小方差的3或5倍以上,應(yīng)引起懷疑。方差齊性檢驗(yàn)方差齊性檢驗(yàn) 新藥組 常規(guī)藥組?22?標(biāo)準(zhǔn)差: 2.421方差: 2.421212?標(biāo)準(zhǔn)差: 3.060方差: 3.06
13、02方差齊性檢驗(yàn)F 檢驗(yàn):從同一總體隨機(jī)抽取的樣本之兩方差, 其方差比(大方差/小方差)的分布服從 F 分布t檢驗(yàn)應(yīng)用條件不滿足時(shí)的處理嘗試變量變換,如對(duì)數(shù)變換等。若變換后數(shù)據(jù)滿足t檢驗(yàn)條件,再行t檢驗(yàn)(對(duì)變換后數(shù)據(jù))。采用非參數(shù)檢驗(yàn)法(不要求正態(tài)性和方差齊性)。若方差不齊,可采用近似t檢驗(yàn)(又稱校正t檢驗(yàn)或t檢驗(yàn))變量變換(Variable Transformation)目的:方差齊性化;正態(tài)化常用方法:對(duì)數(shù)變換平方根變換倒數(shù)變換平方根反正弦變換方差不齊時(shí)的近似t檢驗(yàn)1. Cochran & Cox法(1950): 對(duì)t界值進(jìn)行校正2. Satterthwaite法(1946): 對(duì)自由度進(jìn)
14、行校正3. Welch法(1947): 對(duì)自由度進(jìn)行校正結(jié)果報(bào)告(例3-6)兩種方法對(duì)乳酸飲料中脂肪含量的測(cè)定結(jié)果(%) 組別 例數(shù) 哥特里-羅紫法 10 0.7950.184 脂肪酸水解法 10 0.5230.186t=7.925, P0.50。兩組均數(shù)差異無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為兩藥治療后空腹血糖下降量不同。 第六節(jié) 假設(shè)檢驗(yàn)的注意事項(xiàng)客觀實(shí)際假設(shè)檢驗(yàn)的結(jié)果拒絕 H0 不拒絕 H0 H0 成立I 型錯(cuò)誤()推斷正確(1- ) H0 不成立檢驗(yàn)效能(1-)II 型錯(cuò)誤()健康人與肝病病人的肝大指數(shù)分布肝大指數(shù)健康人H0肝病病人H1 誤診率(假陽(yáng)性率)漏診率(假陰性率)6.1 7.0 8.45
15、6891011 4 兩類錯(cuò)誤圖示mm0mm0 mm0I 型錯(cuò)誤和 II 型錯(cuò)誤當(dāng)P 而拒絕H0接受H1,要注意I型錯(cuò)誤(type I error)出現(xiàn);當(dāng)P 而不拒絕H0,要注意II型錯(cuò)誤(type II error)的出現(xiàn)。1 就是對(duì)真實(shí)的H1作出正確結(jié)論之概率,常被用來(lái)表達(dá)某假設(shè)檢驗(yàn)方法的效能或功效(power of a test),國(guó)內(nèi)學(xué)者稱它為把握度:假設(shè)檢驗(yàn)對(duì)真實(shí)的H1作正確結(jié)論之把握程度。Increasing the sample size decreases the chance of Type II error but does not have any effect on t
16、he chance of Type I error.Red : Type I errorGreen: Type II error 假設(shè)檢驗(yàn)應(yīng)注意的問(wèn)題嚴(yán)密的研究設(shè)計(jì)正確選用檢驗(yàn)方法正確理解Significant 的意義結(jié)論的概率性正確對(duì)待統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系假設(shè)檢驗(yàn)應(yīng)注意的問(wèn)題下統(tǒng)計(jì)檢驗(yàn)結(jié)論只能說(shuō)有、無(wú)統(tǒng)計(jì)學(xué)意義(statistical significance),而不能說(shuō)明專業(yè)上的差異大小。P值越小只能說(shuō)明:作出拒絕H0,接受H1的統(tǒng)計(jì)學(xué)證據(jù)越充分, 推論時(shí)犯錯(cuò)誤的機(jī)會(huì)越小,與專業(yè)上兩均數(shù)差異的大小無(wú)直接關(guān)系。Statistical descriptionPoint estimationStatistical inferenceInterval estimationParameter estimationConfidence interval, CIHypothesis testingConfidence levelSampling errorConfidence limit, CLStandard error, SELower limit, LStudents t distributionUpper limit, UNull hypothesi
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 血型抗原抗體相互作用機(jī)制-洞察分析
- 現(xiàn)場(chǎng)增強(qiáng)現(xiàn)實(shí)輔助訓(xùn)練-洞察分析
- 先進(jìn)材料對(duì)制造業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)提升-洞察分析
- 音視頻內(nèi)容分發(fā)網(wǎng)絡(luò)優(yōu)化-洞察分析
- 野生動(dòng)植物保護(hù)技術(shù)-洞察分析
- 語(yǔ)義檢索技術(shù)-第2篇-洞察分析
- 遠(yuǎn)洋船舶航行安全-洞察分析
- 音樂(lè)產(chǎn)業(yè)鏈整合的實(shí)踐與探索-洞察分析
- 《試乘試駕?!氛n件
- 2024年柳州鐵路局金城江醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫(kù)頻考點(diǎn)附帶答案
- 2024年全國(guó)鄉(xiāng)村醫(yī)生考試復(fù)習(xí)題庫(kù)及答案(共360題)
- 全屋定制家具店合伙經(jīng)營(yíng)協(xié)議書(shū)2024年
- 建筑施工安全生產(chǎn)隱患識(shí)別圖集(鋼結(jié)構(gòu)工程)
- 城市道路與開(kāi)放空間低影響開(kāi)發(fā)雨水設(shè)施
- 電氣二次危險(xiǎn)點(diǎn)分析及控制措施
- 初中必背古詩(shī)文138首
- 藍(lán)色國(guó)家科學(xué)基金4.3杰青優(yōu)青人才科學(xué)基金答辯模板
- DLT 5434-2021 電力建設(shè)工程監(jiān)理規(guī)范表格
- 2024年房屋交接確認(rèn)書(shū)
- 拓展低空經(jīng)濟(jì)應(yīng)用場(chǎng)景實(shí)施方案
- 北京市東城區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末生物試題【含答案解析】
評(píng)論
0/150
提交評(píng)論