統(tǒng)計學第四章多個樣本均數(shù)比較的方差分析課件_第1頁
統(tǒng)計學第四章多個樣本均數(shù)比較的方差分析課件_第2頁
統(tǒng)計學第四章多個樣本均數(shù)比較的方差分析課件_第3頁
統(tǒng)計學第四章多個樣本均數(shù)比較的方差分析課件_第4頁
統(tǒng)計學第四章多個樣本均數(shù)比較的方差分析課件_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章多個樣本均數(shù)比較的

Analysisofvariance(ANOVA)4/8/20231醫(yī)學統(tǒng)計學--供研究生用方差分析方差分析的基本思想完全隨機設計的單因素隨機區(qū)組設計的兩因素方差分析交叉設計的方差分析多個樣本均數(shù)間的多重比較2第一節(jié)方差分析的基本思想用途:檢驗3組及以上總體均數(shù)是否相等。通過分析處理組均數(shù)之間的差別,推論它們所代表的k個總體均數(shù)間是否存在差別,或k個處理組間的差別是否具有統(tǒng)計學意義。3全部實驗結果存在三種不同的變異總變異:全部實驗數(shù)據(jù)大小不等。變異的大小用觀察值與總均數(shù)的離均差平方和表示,記為SS總組間變異:各處理組的樣本均數(shù)也大小不等,變異的大小用各組均數(shù)與總體均數(shù)的離均差平方和表示,記為SS組間。組內變異:各處理組內部觀察值也大小不等,可用各處理組內部每個觀察值與組均數(shù)的離均差平方和表示。記為SS組內。5總變異=組間變異+組內變異總變異:組間變異:組內變異:總=N-1組間=k-1組內=N-k6F=MS組間/MS組內如果:各樣本均數(shù)來自同一總體(H0:m1=m2==mk),即各組均數(shù)之間無差別。則:組間變異與組內變異均只能反映隨機誤差,此時:F值應接近1。反之,若各樣本均數(shù)不是來自同一總體,組間變異應較大,F(xiàn)值將明顯大于1,則不能認為組間的變異僅反映隨機誤差,也就是認為處理因素有作用。7方差分析的基本思想根據(jù)資料的設計類型,將全部觀察值總的離均差平方和及自由度分解為兩個或多個部分,除隨機誤差(如SS組內)外,其余每個部分的變異(如SS組間)可由某個因素的作用(或某幾個因素的交互作用,如A因素×B因素)加以解釋。通過比較不同變異來源的均方,借助F分布作出統(tǒng)計推斷,從而了解該因素對觀測指標有無影響。9方差分析對數(shù)據(jù)的基本假設

(方差分析的應用條件)任何兩個觀察值之間均不相關每一水平下的觀察值均來自正態(tài)總體各總體方差相等,即方差齊性(homogeneityofvariance)10第二節(jié)完全隨機設計資料的

單因素方差分析在實驗研究中,將受試對象隨機分配到一個研究因素的多個水平中去,然后觀察實驗效應。在觀察研究中,按某個因素的不同水平分組,比較該因素的效應。如比較糖尿病患者,IGT異常和正常人的載脂蛋白有無差別(人群這個研究因素分為3個水平)。如將30名乙型腦炎患者隨機分為三組,分別用單克隆抗體、胸腺肽和利巴韋林三種藥物治療(藥物這個研究因素分為3個水平),觀察治療后的退熱時間。11二、變異分解:例:某社區(qū)隨機抽取了30名糖尿病患者(11例),IGT異常(9例)和正常人(10例)進行載脂蛋白(mg/dL)測定,問三種人的載脂蛋白有無差別?131.完全隨機設計方差分析中變異的分解

總變異=組間變異+組內變異表糖尿病患者、IGT異常及正常人的載脂蛋白測定結果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00………111.0099.00159.00106.50120.00115.00均數(shù)105.45(11)102.39(9)122.80(10)X=110.3142.分析計算步驟建立檢驗假設和確定檢驗水準H0:三種人載脂蛋白的總體均數(shù)相等,即m1=m2=m3H1:三種人載脂蛋白的總體均數(shù)不全相等=0.05計算檢驗統(tǒng)計量F值15表糖尿病患者、IGT異常及正常人的載脂蛋白測定結果糖尿病IGT正常人∑Xij

116011105.45123509.5912.59102.3996045.412283309.51030122.80110.3153420372974.9niX∑Xij2

C=3309.52/30=365093

(校正數(shù))SS總=372974.87-365093=7881.87SS組間=11602/11+921.52/9+12282/10-365093=2384.03SS組內=SS總-SS組間=7881.87-2384.03=5497.8417

確定P值和作出推斷結論查附表3F界值表(P522),1=2,2=27F0.05(2,27)=3.35,F0.01(2,27)=5.49本例F=5.85>F0.01(2,27),故P<0.01??烧J為三種人的載脂蛋白不同。方差分析計算表變異來源SSMSFP組間2384.0321192.015.85<0.01組內5497.8427203.62總7811.872918以上結論表明總的來說三種人的載脂蛋白有差別,但并不表明任何兩種人的載脂蛋白均有差別。要了解哪些組均數(shù)間有差別,需進一步作兩兩比較。當k=2時,對同一資料,F(xiàn)=t2。19一、隨機區(qū)組設計如何分組:先將全部受試對象按某種或某些特征分為若干個區(qū)組(block),使每個區(qū)組內的觀察對象隨機地接受研究因素某一水平的處理。由于區(qū)組內的個體特征比較一致,減少了個體差異對結果的影響。21

表A、B、C三種營養(yǎng)素喂養(yǎng)小白鼠所增體重區(qū)組號A營養(yǎng)B營養(yǎng)C營養(yǎng)均數(shù)150.1058.2064.5057.60Xij247.8048.5062.4052.90…761.9053.0051.2055.37842.2039.8046.2042.73均數(shù)53.9053.9559.1455.6622二、變異分解隨機區(qū)組設計方差分析中變異的分解:

SS總=SS處理+SS區(qū)組+SS誤差232.分析計算步驟建立檢驗假設和確定檢驗水準H0:三種營養(yǎng)素喂養(yǎng)的小白鼠體重增量相等,即m1=m2=m3H1:三種營養(yǎng)素喂養(yǎng)的小白鼠體重增量不全相等=0.05計算檢驗統(tǒng)計量F值25表隨機區(qū)組設計方差分析的計算公式26一般而言,隨機區(qū)組設計較成組設計更容易檢驗出處理組間的差別,提高了研究效率。但不是在任何情況下都能提高研究效率。區(qū)組效應是否具有統(tǒng)計學意義是重要的,它表明區(qū)組的劃分是否成功,即達到:區(qū)組內各實驗單位很均勻,而不同區(qū)組內的實驗單位具有很大差異。如果區(qū)組效應無統(tǒng)計學意義,則并不能提高研究效率,甚至會降低研究效率。(如果MS區(qū)組<MS誤差)若沒有足夠理由顯示不同區(qū)組間的差別確有統(tǒng)計學意義,則寧可不分區(qū)組。29第四節(jié)

交叉設計資料的方差分析在醫(yī)學研究中,將A、B兩種處理先后施加于同一批受試對象,先隨機的將一半的受試對象接受A后接受B,而另外一半則相反,先接受B再接受A,將兩種處理因素在全部試驗過程中交叉進行,故稱之為交叉設計(cross-overdesign)。30交叉設計是一種特殊的自身對照設計克服了試驗前后自身對照由于觀察期間各種非試驗因素對試驗結果的影響所造成的偏移。31交叉設計的優(yōu)點:1.節(jié)約樣本含量2.控制了時間因素以及個體差異對處理方式的影響3.每一個試驗對象同時接受試驗因素和對照,從醫(yī)德的觀點出發(fā),均等考慮了每一個患者的利益32交叉設計的缺點:不允許有病人失訪,否則會造成該個體已有的數(shù)據(jù)完全浪費不適用于病程較短的急性病治療效果的研究33交叉設計的限制條件前一個試驗階段的處理效應不能持續(xù)作用到下一個試驗階段洗脫時間(washouttime):目的是消除殘留效應(carry-overeffect)34例題為了研究12名高血壓病人用A、B兩種治療方案療效的差別,隨機的讓其中6名病人先以A法治療,后以B法治療,而另外一半的6名病人則先用B法,后用A法,記錄治療后血壓的下降值(KPa),請分析A、B兩方案療效有無差別。35二階段交叉設計變異的來源:1.處理(藥物)效應2.階段效應3.順序效應和個體差異其中處理效應是希望研究的因素,而順序效應則在目前常用的統(tǒng)計分析中被忽略,因為這是交叉設計能夠實施的前提條件。

保證順序效應忽略的辦法,就是消除殘留效應。4.誤差36例:12例高血壓病人交叉設計資料階段123456789101112IBBABAAAABBBA3.071.334.441.873.203.734.131.071.072.273.472.40IIAABABBBBAAAB2.801.473.733.602.671.602.671.731.471.873.471.7337第五節(jié)拉丁方設計

(latinsquaredesign)拉丁方設計是將三個因素(一個處理因素+兩個控制因素)按水平數(shù)r排列成一個r×r的隨機方陣。如3×3、4×4拉丁方。38常用拉丁方表ABCCABBCAABCDBADCCDBADCAB將兩個控制因素分別安排在拉丁方設計的行和列上,需對基本拉丁方表作行列變換。39拉丁方設計的優(yōu)點:與隨機區(qū)組相比較,可以多安排一個控制因素,增加了均衡性,減少了誤差,提高了效率。40例4-5

比較A、B、C、D、E、F6種藥物給家兔注射后產(chǎn)生的皮膚皰疹大?。╩m2),研究者選用6只家兔、并在每只家兔的6個不同部位進行注射。試驗結果見下表,試做拉丁方設計和方差分析。41家兔編號(行區(qū)組)注射部位編號(列區(qū)組)1234561A(73)B(75)C(67)E(61)D(69)F(79)2B(83)A(81)E(99)F(82)C(85)D(87)3E(73)D(60)F(73)C(77)B(68)A(74)4F(58)C(64)B(64)D(71)A(77)E(74)5C(64)F(62)D(64)A(81)E(85)B(71)6D(77)E(75)A(73)B(59)F(85)C(82)拉丁方設計與試驗結果(皮膚皰疹大小,mm2)

拉丁方設計與隨機區(qū)組區(qū)別42拉丁方設計變異的來源:1.處理組變異2.行區(qū)組變異3.列區(qū)組變異4.誤差其中處理效應是希望研究的因素。43第四節(jié)多個樣本均數(shù)間的多重比較multiplecomparison概念無效假設的兩種情況常用方法44一、概念指出哪幾組均數(shù)之間的差別具有或不具有統(tǒng)計學意義。當對比組數(shù)大于2時,為什么不能用t檢驗?因為會增加第一類錯誤的概率,使本來無無差別的兩總體均數(shù)判為有差別。如有5個樣本均數(shù),可作10次t檢驗。每次不犯第一類錯誤的概率為1-0.05=0.95。每次比較均不犯第一類錯誤的概率僅為0.9510=0.5987,每次犯第一類錯誤的概率為1-0.5987=0.4013,明顯增加了犯第一類錯誤的概率。45二、無效假設的兩種情況檢驗某幾個特定總體均數(shù)是否相等,其無效假設稱為部分無效假設。檢驗全部k個總體均數(shù)是否相等,其無效假設稱為完全無效假設。461.檢驗某幾個特定總體均數(shù)是否相等H0:i=j(ij)在試驗設計階段就根據(jù)研究目的或專業(yè)知識決定了某些均數(shù)間的兩兩比較,常用于事先有明確研究假設的證實性研究。如

多個處理組與對照組比較;處理后不同時間與處理前比較;幾個特定的處理組間比較472.檢驗全部k個總體均數(shù)是否相等H0:1=2=...=k。在研究設計階段對實驗結果知道不多的探索性研究,或經(jīng)數(shù)據(jù)結果的提示后,才決定作多個均數(shù)間的兩兩比較。一般涉及到每兩個均數(shù)的兩兩比較。48三、常用方法BonferroniTukeyDunnett-t檢驗Tamhane’sT2LSD-t檢驗(leastsignificantdifference)SNK-q檢驗(Student-Newman-Keuls)49SPSS統(tǒng)計軟件中的兩兩比較方法501.LSD-t檢驗Leastsignificantdifferencettest,最小有意義差異,比較k組中一對或幾對在專業(yè)上有特殊意義的均數(shù)差值的總體均數(shù)是否為“0”;51LSD-t檢驗公式以誤差自由度誤差(或組內)和檢驗水準查t界值表缺點:沒有調整多重比較的檢驗水準,比較的次數(shù)愈多,犯I類錯誤的可能性愈大。522.Dunnett-tk-1個實驗組與一個對照組均數(shù)差別的多重比較。根據(jù)算得的t值,誤差自由度誤差,試驗組數(shù)k-1,以及檢驗水準查Dunnett-t界值表,作出推斷結論。533.SNK-q檢驗Student-Newman-Keuls,q檢驗一般在方差分析結果拒絕H0時,再用q檢驗進行多重比較缺點:沒有調整多重比較的檢驗水準,比較的次數(shù)愈多,犯I類錯誤的可能性愈大。54組次123

均數(shù)102.39105.45122.80

組別IGT異常糖尿病患者正常人表三個樣本均數(shù)兩兩比較的q檢驗對比組兩均數(shù)之差標準誤q值組數(shù)q界值0.050.01P值1與3-20.414.63614.402433.494.45<0.051與2-3.064.53500.674822.893.89>0.052與3-17.354.40873.935422.893.89<0.01例將3個樣本均數(shù)從小到大排序:554.Bonferroni樣本組數(shù)不宜過多,樣本數(shù)一般≤4,這時的檢驗效率高于Tukey法。調整了多重比較時的檢驗水準:

=/比較的總次數(shù),當計算所得的t≥t(,)時,則以P<稱所比較的兩組均數(shù)的差別有統(tǒng)計學意義。是SPSS統(tǒng)計軟件推薦的方法565.Tukey當比較的樣本數(shù)大于5時,檢驗效率高于Bonferroni。當樣本數(shù)為5時,要作10次兩兩比較;當樣本數(shù)為6時,要作15次兩兩比較調整了多重比較時的檢驗水準,是SPSS統(tǒng)計軟件推薦的方法57BonferroniandTukeyTheBonferroniandTukeyshonestlysignificantdifferencetestsarecommonlyusedmultiplecomparisontests.58BonferroniTheBonferronitest,basedonStudentststatistic,adjuststheobservedsignificancelevelforthefactthatmultiplecomparisonsaremade.Forasmallnumberofpairs,Bonferroniismorepowerful.59TukeyTukeyshonestlysignificantdifferencetestusestheStudentizedrangestatistictomakeallpairwisecomparisonsbetweengroupsandsetstheexperimentwiseerrorratetotheerrorrateforthecollectionforallpairwisecomparisons.Whentestingalargenumberofpairsofmeans,TukeyshonestlysignificantdifferencetestismorepowerfulthantheBonferronitest.60容易得出有統(tǒng)計學意義結論的,依次為:LDS(最容易)SNKTukeybonferroni(最不容易)616.方差不齊時的兩兩比較Tamhane’sT2法:Conservativepairwisecomparisonstest(保守的兩兩比較檢驗,I類錯誤小)basedonattest.Thistestisappropriatewhenthevariancesareunequal.Dunnett’sT3Games–HowUDunnett’sC62多個方差的齊性檢驗

LeveneTestAhomogeneity-of-variancetestthatislessdependentontheassumptionofnormalitythanmosttests.Foreachcase,itcomputestheabsolutedifferencebetweenthevalueofthatcaseanditscellmeanandperformsaone-wayanalysisofvarianceonthosedifferences.63SPSS操作與結果解釋方差分析64建立SPSS數(shù)據(jù)工作表

g:分組(1:糖尿病;2:IGT;

3:正常人)

X:載脂蛋白表糖尿病患者、IGT異常及正常人的載脂蛋白測定結果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00………111.0099.00159.00106.50120.00115.00均數(shù)105.45(11)102.39(9)122.80(10)一、完全隨機設計方差分析的SPSS652.選用SPSS過程66One-wayANVOA對話框

將x選入DependentList欄,

g選入Factor欄67單擊PostHoc…按鈕68選擇Bonferroni,單擊Continue返回√69選擇Descriptive,Homogeneity…

單擊Continue返回70單擊OK按鈕運行ANOVA過程713.結果解釋

三組均數(shù)(mg/dL)依次為:

正常人(122.80)、糖尿病患者(105.46)

和IGT患者(102.39)。72經(jīng)方差齊性檢驗,P=0.548,

按=0.05水準,還不能認為3個總體方差不等。73經(jīng)完全隨機設計的單因素方差分析,F(xiàn)=5.85,P=0.008,可認為三種人的載脂蛋白不同。74經(jīng)Bonferroni檢驗,正常人與糖尿病患者(P=0.029)、正常人與IGT患者(P=0.013)載脂蛋白的差別有統(tǒng)計學意義75二、隨機區(qū)組設計的兩因素方差分析在不同的室溫下測定家兔的血糖濃度。室溫分七組,家兔分四個種屬,每一種屬七只。問不同溫度的血糖濃度有無差別及不同水平血糖濃度均數(shù)的變化趨勢?家兔種屬室溫5101520253035Ⅰ1301108282110120140Ⅱ12013011083100140160Ⅲ150140100110120120160Ⅳ1201007482100110130761.建立SPSS數(shù)據(jù)工作表家兔種屬室溫5101520253035Ⅰ1301108282110120140Ⅱ12013011083100140160Ⅲ150140100110120120160Ⅳ120100748210011013077求不同溫度的血糖濃度均值

AnalyzeComparemeansMeans781.選用SPSS過程:Analyze

GeneralLinearModelUnivariate79在Univariate對話框,將血糖濃度選入DependentVariable欄;將室溫選入Fixfactors欄;將家兔種屬選入Randomfactors欄80單擊Model按鈕81選擇Custom82將室溫和家兔種屬選入Model欄,從下拉菜單選擇Maineffents(因不能分析交互作用)。單擊Continue返回。83單擊PostHoc按鈕84將變量:室溫選入PostHocTestsfor欄,以便進行兩兩比較。由于組數(shù)多,選擇Tukey進行兩兩比較。單擊Continue按鈕返回85單擊OK按鈕863.SPSS結果解釋:Means過程顯示不同室溫的均值:可見從5分鐘(130.0mg%)到20分鐘(89.3mg%),血糖均值由高逐漸降低;從20分鐘(89.3mg%)到35分鐘(147.5mg%),血糖均值由低逐漸升高。873.SPSS結果解釋88經(jīng)隨機區(qū)組設計的兩因素方差分析:不同室溫血糖濃度的差別有統(tǒng)計學意義(F=19.12,P=0.000)不同家兔種屬血糖濃度的差別也有統(tǒng)計學意義(F=10.02,P=0.000)89期望均方表(可不看該結果)90Tukey檢驗結果(1)91Tukey檢驗結果(2)92Tukey法的均衡子集表93三、交叉設計方差分析的SPSS例4-6分析A、B兩種閃爍液測定血漿中3H-cGMP的交叉試驗結果。第I階段1、3、4、7、9號用A測定,2、5、6、8、10號用B測定;第II階段1、3、4、7、9號用B測定,2、5、6、8、10號用A測定。試對交叉試驗結果進行方差分析。941.建立數(shù)據(jù)庫95交叉設計方差分析的Spss過程AnalyzeGeneralLinealModelUnivariateDependentlist:X

FixedFactor框:treatphaseRandomFactor框personModel⊙Custo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論