計量資料的統(tǒng)計分析.ppt_第1頁
計量資料的統(tǒng)計分析.ppt_第2頁
計量資料的統(tǒng)計分析.ppt_第3頁
計量資料的統(tǒng)計分析.ppt_第4頁
計量資料的統(tǒng)計分析.ppt_第5頁
已閱讀5頁,還剩123頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

常用醫(yī)學統(tǒng)計方法 Medical Statistics,教 學 內(nèi) 容,9.7 3學時 計量資料的統(tǒng)計分析(理論課) 9.7 2學時 計量資料的軟件實現(xiàn)(操作演示) 9.9 3學時 計數(shù)資料的統(tǒng)計分析(理論課) 9.9 2學時 計數(shù)資料的軟件實現(xiàn)(操作演示),計量資料的統(tǒng)計描述 Descriptive Statistics,統(tǒng)計資料的分類,1、計量資料(或定量變量) 2、計數(shù)資料(或無序分類變量) 3、等級資料(或有序等級變量),計量資料(或定量變量),1.定義:測定每個觀察單位的某項指標量的大小,所得的資料稱為計量資料。其變量值是定量的,表現(xiàn)為數(shù)值大小,一般帶有度量衡或其它單位。 2.特點:每個觀察單位的觀察值之間有量的區(qū)別。,1.定義:將觀察單位按某種屬性或類別分組計數(shù),得到各組觀察單位數(shù)稱為計數(shù)資料。 2.特點:計數(shù)排列是無序分組,同組各觀察單位之間沒有量的差別,但各組間有質(zhì)的不同,不同質(zhì)的觀察單位不能歸入一組。 變量值是定性的,表現(xiàn)為互不相容的屬性或類別 二項分類和多項分類,計數(shù)資料(或無序分類變量),等級資料(或有序等級變量),1.定義:將觀察單位按某種屬性的不同程度而順序分組,所得各組的觀察單位數(shù)稱為等級資料,通常有兩個以上等級。這類資料具有計數(shù)資料的特點,但所分各組之間又有等級順序,如由輕到重、由小到大排列。 2.特點:等級是有序分組。同計數(shù)資料的區(qū)別是:屬性的分組有程度或等級的差別,各組按一定順序排列;與計量資料的區(qū)別是:每個觀察單位未確切定量,所以又稱為半定量資料。,資料的轉(zhuǎn)化,根據(jù)分析的需要,變量可以轉(zhuǎn)化,但只能由高級向低級轉(zhuǎn)化。連續(xù)型有序分類二值,血紅蛋白(g/dl) 等級 計數(shù) 6 重度貧血 異常 6 中度貧血 異常 9 輕度貧血 異常 1216 血紅蛋白正常 正常 16 血紅蛋白增高 異常 但必須明確,凡能計量的,應(yīng)盡可能采用計量資 料;因為計量資料可以得到較多的信息。,實例(一),實例(二),城市腦力勞動者調(diào)查資料部分指標摘錄,注:體重指數(shù)=體重/身高3 (Kg/m3); 嗜肥肉史 有1,無0 勞動強度 輕1,中等2,重3 緊張程度 不緊張1,一般2,緊張3 班制 日班制1,兩班制2,三班制3,平均數(shù)指標 Average Number,平均數(shù)指標,平均數(shù)(average) 是描述一群同質(zhì)變量值集中位置的特征值,用以說明同類現(xiàn)象或事物數(shù)量的中等水平(集中趨勢)。 常用的有算術(shù)均數(shù)、中位數(shù)、眾數(shù)、幾何均數(shù)等,算術(shù)均數(shù)(arithmetic mean),簡稱均數(shù)( mean ),符號為 (相應(yīng)的總體均數(shù)記為)。,算術(shù)均數(shù)的計算,實例: 某市10名7歲男童體重(kg)分別為: 17.3,18.0,19.4,20.6,21.2,21.8, 22.5,23.2,24.0,25.5,求其平均體重。,均數(shù)的應(yīng)用與特點 適用條件:算術(shù)均數(shù)適合于對稱分布的資料,如分布均勻的小樣本數(shù)據(jù)或近似正態(tài)分布的大樣本數(shù)據(jù); 特點:算術(shù)均數(shù)容易受極端值的影響.,幾何均數(shù)(geometric mean),符號為G。 幾何均數(shù)的計算 幾何均數(shù)的定義公式為:n個變量值x的連乘積的n次方根。,當n3時,上式計算不便,而常采用以下計算公式: 式中l(wèi)ogx表示對觀察值x求對數(shù),log-1為相應(yīng)對數(shù)的反對數(shù)。 幾何均數(shù)就是變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。,同一資料,幾何均數(shù)均數(shù),實例 5人的血清滴度為:1:2,1:4,1:8,1:16,1:32,求平均滴度。,幾何均數(shù)的應(yīng)用與特點,適用條件:幾何均數(shù)常用以描述觀察值為等比級數(shù)資料(呈倍數(shù)關(guān)系的等比資料)或?qū)?shù)正態(tài)分布資料的集中趨勢。 呈等比級數(shù)的資料,如血清滴度、抗體效價等; 特點:同一資料,幾何均數(shù)均數(shù),眾數(shù)(mode),眾數(shù)是指在一群觀察值中,出現(xiàn)頻率最高(即次數(shù)最多)的數(shù)據(jù),在頻數(shù)表上表現(xiàn)為頻數(shù)最多組的組中值,數(shù)理上指曲線上的最高點。用符號Mo表示。,適用條件:眾數(shù)主要應(yīng)用在對小樣本的探索性數(shù)據(jù)進行分析。 特點:它不受變量數(shù)列極端數(shù)值的影響,但眾值的計算只有在總體單位數(shù)足夠多,而且又具有明顯的集中趨勢時,才有意義。,中位數(shù)(median),將一組變量值按大小順序排列,位次居中的變量值即為中位數(shù)。中位數(shù)將變量值一分為二,一半比它小,一半比它大。符號為M、Md。計算公式為:,中位數(shù)的計算,實例 12個數(shù)據(jù)如下: 順序號 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) 數(shù)據(jù)值 7.4 8.6 8.6 10.8 11.6 11.6 11.6 12.1 12.3 14.3 15.0 15.6,中位數(shù)的應(yīng)用與特點,適用條件:適合各種類型的資料。尤其適合于大樣本偏態(tài)分布的資料; 資料有不確定數(shù)值;資料分布不明等。,特點:由于中位數(shù)總處在居中的位置上,將頻數(shù)等分為二,它不受特大或特小值的影響,僅僅利用了中間的12個數(shù)據(jù)。,均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系,正態(tài)分布時: 均數(shù)中位數(shù)眾數(shù) 正偏態(tài)分布時:均數(shù)中位數(shù)眾數(shù) 負偏態(tài)分布時:均數(shù)中位數(shù)眾數(shù),1.同質(zhì)事物或現(xiàn)象才能求平均數(shù) 2.要根據(jù)數(shù)據(jù)分布類型正確選用平均數(shù) 3.要與下一節(jié)的離散趨勢分析相結(jié)合,以彌補反映不出差異和易受極端值影響的缺陷。,在計算和應(yīng)用平均數(shù)指標時的注意事項,變異指標 Variation Number,變異指標(variation number)又稱離散指標( Dispersion number),用以描述一組計量資料各觀察值之間參差不齊的程度。 變異指標越大,觀察值之間差異愈大,說明平均數(shù)的代表性就越差;反之亦然。,三組同性別、同年齡兒童體重,極差(Range),意義:是一批數(shù)據(jù)中最大值與最小值之差,反映了數(shù)據(jù)散布范圍。,符號及計算:,優(yōu)點:簡便。 缺點:不能反映在該范圍以內(nèi)的其它數(shù)據(jù)的離散度; 各樣本含量大小懸殊時,不宜比較其極差; 極差的抽樣誤差較大,樣本的例數(shù)越多,極差越大,不夠穩(wěn)定 。 適用條件:極差僅適用于對未知分布的小樣本資料作粗略的分析。樣本量增大,極差會增大。通常與眾數(shù)結(jié)合使用。,極差(Range),四分位數(shù)間距(Quartile range),意義:包括了全部變量值中居于中間水平的一半數(shù)據(jù)的分布范圍。 Q =P25 P75,符號及計算:,缺點:比較穩(wěn)定,但不能反映其余數(shù)據(jù)的變異情況,沒有充分利用每個變量值的信息。 適用條件:四分位數(shù)間距用來描述大樣本偏態(tài)資料的變異情況。通常與中位數(shù)結(jié)合使用。,四分位數(shù)間距(Quartile range),符號及計算:方差分為樣本方差和總體方差。樣本方差符號為 ,相應(yīng)的總體方差符號為 。,方差(Variance),意義:樣本觀察值的離均差平方和(sum of square,SS)的均值。表示一組數(shù)據(jù)的平均離散情況。,標準差(standard deviation),意義:標準差即為方差的平方根。其單位與原變量X 的單位相同。,符號及計算:樣本標準差符號為s ,相應(yīng)的總體標準差符號為,三組同性別、同年齡兒童體重,方差與標準差的應(yīng)用,方差或標準差屬同類變異指標,它們多用來描述均勻分布或近似正態(tài)分布的資料,大、小樣本均可,其中以標準差的應(yīng)用最廣,通常與均數(shù)結(jié)合使用。比如在許多醫(yī)學研究報告中常用 的形式表達資料。,方差與標準差的應(yīng)用,方差是樣本觀察值的離均差平方的平均值,它全面地反映了數(shù)據(jù)的變異大小;方差越大,觀察值與均數(shù)間的差異就越大,數(shù)據(jù)的變異程度就越大,反之亦然; 標準差的量綱與原始數(shù)據(jù)一致,適用于對稱分布的資料;標準差保持了方差的優(yōu)點,其單位與觀察值單位一致。,變異系數(shù)( coefficient of variation ,CV),變異系數(shù)可用于不同類型資料間變異程度的比較,,變異系數(shù)也可用于均數(shù)相差懸殊時同單位資料間變異程度的比較,如不同年齡段同性別兒童的體重變異大小比較等。,符號及計算:,適用條件:,實例:某部隊干部體檢得到體脂的均數(shù)和標準差分別為18.9%和5.8%,血清膽固醇的均數(shù)與標準差分別為4.84mmol/L和1.03mmol/L,試比較兩者的變異情況。 由于體脂和血清膽固醇是兩個不同的觀察指標,不能直接比較其標準差大小,而應(yīng)比較變異系數(shù)。對本例: 體脂變異系數(shù): 血清膽固醇變異系數(shù): 顯然,體脂變異大于血清膽固醇變異。,變異系數(shù)主要用于量綱不同的指標間,或均數(shù)相差較大的指標間的變異程度的比較; 極差、四分位數(shù)間距與標準差有單位; 變異系數(shù)為標準差與均數(shù)的比值,無單位;,變異系數(shù)的特點,平均數(shù)與變異指標的使用范圍,均數(shù)與標準差: 適用是均勻分布的小樣本數(shù)據(jù)或近似正態(tài)分布數(shù)據(jù),對樣本含量沒有要求。 中位數(shù)與四分位數(shù)間距: 適用于大樣本偏態(tài)分布資料。 眾數(shù)與極差: 適用于描述未知分布的小樣本數(shù)據(jù)。 幾何均數(shù): 描述近似對數(shù)正態(tài)分布數(shù)據(jù)的平均水平或平均發(fā)展速度 變異系數(shù): 比較不同資料或同類資料均數(shù)相差懸殊時變異程度的比較。,AVERAGE、MEAN 算術(shù)均數(shù) GEOMEAN 幾何均數(shù) MEDIAN 中位數(shù) MODE 眾數(shù) HARMEAN調(diào)和均數(shù) STDEV 標準差 VAR 方差 QUARTILE 四分位數(shù) PERCENTILE 百分位數(shù) FREQUENCY頻數(shù)分布,計量資料的統(tǒng)計推斷 Analysis Statistics,假設(shè)檢驗概述 t檢驗 單因素方差分析,假設(shè)檢驗概述,假設(shè)檢驗(hypothesis testing)亦稱顯著性檢驗(significance testing):目的是通過考察一部分樣本對總體作出二擇一的決策。,一、假設(shè)檢驗的基本思想,樣本均數(shù)間存在差異,各樣本來自于同一總體,差異僅由抽樣誤差引起,各樣本來自于不同總體,差異不僅包含抽樣誤差,更主要反映了總體參數(shù)間確實存在差異,假設(shè)檢驗的意義,假設(shè)檢驗,質(zhì)量檢查例子:已知一批彈藥必須有95%以上的合格才算該批彈藥是合格的,現(xiàn)某工廠生產(chǎn)了一批彈藥,怎么判斷該批彈藥是否合格? 一個自然的想法是從該批產(chǎn)品中隨機抽取100件來做試驗,問題轉(zhuǎn)換成這100件樣品中最多有多少件不合格就可以判斷該批產(chǎn)品是合格的? 假定該批彈藥的合格率為95%,則根據(jù)二項分布,從該批彈藥中隨機抽取100件,有 件不合件的概率為 全部合格 的概率為:0.0059; 至多有1件不合格 的概率為:0.0312; 至多有2件不合格 的概率為:0.0812; 至多有3件不合格 的概率為:0.1396。,假設(shè)檢驗就是基于小概率事件原理即“小概率事件在一次隨機試驗中幾乎不可能發(fā)生”這一推斷原理的思維判斷形式而發(fā)展出來的依據(jù)隨機樣本對未知事物進行判斷和決策的規(guī)則。 它利用了數(shù)學中的反證法思想,從一個適當?shù)募僭O(shè)出發(fā),根據(jù)小概率事件原理,對該假設(shè)進行推斷。,例 通過以往大規(guī)模調(diào)查,已知某地一般新生兒的頭圍均數(shù)為34.50cm,標準差為1.99cm。為研究某礦區(qū)新生兒的發(fā)育狀況,現(xiàn)從該地某礦區(qū)隨機抽取新生兒55人,測得其頭圍均數(shù)為33.89cm,問該礦區(qū)新生兒的頭圍總體均數(shù)與一般新生兒頭圍總體均數(shù)是否不同?,假設(shè)檢驗的目的就是判斷差別是由哪種原因造成的。, 抽樣誤差造成的; 本質(zhì)差異造成的。,一般新生兒頭圍 34.50cm,33.89cn,礦區(qū)新生兒頭圍 34.50cm,一種假設(shè)H0,另一種假設(shè)H1,抽樣誤差,總體不同,1. 推斷總體是否服從某一分布類型,2.推斷總體參數(shù)與某一確定數(shù)值是否有顯著性差異,3.推斷兩個或多個總體參數(shù)是否有統(tǒng)計意義上的差異,假設(shè)檢驗可解決的問題,假設(shè)檢驗的基本步驟,建立檢驗假設(shè)和檢驗水準 選定檢驗方法計算統(tǒng)計量 確定P值作推斷結(jié)論,二、假設(shè)檢驗的基本步驟,假設(shè)的建立,假設(shè)的建立,1、檢驗假設(shè)(hypothesis under test) 即假設(shè)一,符號H0,亦稱無效假設(shè)。 2、備擇假設(shè)(alternative hypothesis ) 即假設(shè)二,符號H1。 兩種假設(shè)是相互對立的, H0是驗證的主題,只有H0在被拒絕時, H1才能接受。 在建立備擇假設(shè)時,根據(jù)不同問題有時用單側(cè)檢驗,有時用雙側(cè)檢驗。,例如比較山區(qū)成年男子的脈搏均數(shù)與一般成年男子的脈搏均數(shù)。 H0:山區(qū)成年男子的脈搏均數(shù)一般成年男子的脈搏均數(shù) 雙側(cè)檢驗:H1:山區(qū) 一般 單側(cè)檢驗:H1:山區(qū) 一般,單側(cè)檢驗與雙側(cè)檢驗,1.假設(shè)是針對總體而言,而不是針對樣本。 2.H0和H1是相互對立的假設(shè),后面的結(jié)論是根據(jù)H0和H1作出的,因此兩者不是可有可無,而是缺一不可。,對于檢驗假設(shè),須注意:,3.H1的內(nèi)容直接反映了檢驗單雙側(cè)。若H1中只是 0 或 0,則此檢驗為單側(cè)檢驗。它不僅考慮有無差異,而且還考慮差異的方向。 4.單雙側(cè)檢驗的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定。若從專業(yè)上看一種方法結(jié)果不可能低于或高于另一種方法結(jié)果,此時應(yīng)該用單側(cè)檢驗。一般認為雙側(cè)檢驗較保守和穩(wěn)妥。,對于檢驗假設(shè),須注意:,檢驗水準(significance level) 值:錯誤地拒絕H0 的概率或接受H1 的風險. 是預先規(guī)定的判斷小概率事件的概率尺度,它確定了小概率事件的標準。在實際工作中常取 = 0.05??筛鶕?jù)不同研究目的給予不同設(shè)置,但不能根據(jù)試驗結(jié)果事后設(shè)定。,檢驗水準,根據(jù)設(shè)計的類型和統(tǒng)計推斷的目的選用適當?shù)慕y(tǒng)計方法,計算相應(yīng)的統(tǒng)計量(如t, u, ,F值),利用它來進行統(tǒng)計推斷。,選定檢驗方法,計算統(tǒng)計量,P值概念:在H0所規(guī)定的總體中作隨機抽樣,得到絕對值等于或大于當前的檢驗統(tǒng)計量的概率。,確定P值作推斷結(jié)論,若P,結(jié)論為按所取檢驗水準拒絕H0,接受H1,差別有統(tǒng)計學意義; 其統(tǒng)計學依據(jù)是,在H0成立的情況下,得到現(xiàn)有統(tǒng)計量的概率P,是小概率事件,因為小概率事件不可能在一次抽樣中發(fā)生,所以拒絕H0。,確定P值作推斷結(jié)論,若P,結(jié)論為按所取檢驗水準接受H0,差別沒有統(tǒng)計學意義。 不拒絕H0,但不能下“無差別”或“相等”的結(jié)論,只能下“根據(jù)目前試驗結(jié)果,尚不能認為有差別”的結(jié)論。,確定P值作推斷結(jié)論,三、假設(shè)檢驗的注意事項,(1)可比性 (2)正確選用假設(shè)檢驗方法 (3)判斷結(jié)論時不能絕對化,提倡使用精確P值。 (4)單側(cè)檢驗與雙側(cè)檢驗,(5)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值,單側(cè)時應(yīng)注明; (6)可信區(qū)間與假設(shè)檢驗各自不同的作用,要結(jié)合使用。 95CI既能說明差別的大小,也具有檢驗的作用,建議使用。,t 檢驗,t 檢驗(t-test)源于t分布 t分布是英國統(tǒng)計學家W.S.Gosset于1908年以“Student”筆名發(fā)表論文提出的,所以又稱“Students t-distribution”。 t分布的發(fā)現(xiàn)使得小樣本統(tǒng)計推斷成為可能,它被認為是統(tǒng)計學發(fā)展歷史中的里程碑之一。 以t分布為基礎(chǔ)的檢驗稱為t 檢驗,在醫(yī)學統(tǒng)計學中, t 檢驗是非?;钴S的一類假設(shè)檢驗方法。,t 檢驗(t-test)又稱亦稱student t檢驗(Students t test),主要用于樣本含量較?。ɡ鏽30),總體標準差未知的正態(tài)分布資料。用于: 1. 小樣本均數(shù)與總體均數(shù)的比較; 2. 配對資料的比較; 3. 兩樣本均數(shù)的比較。,實例1:某地正常成年男子凝血酶時間(TT)均數(shù)為16.00s。某研究小組測得30例男性肺癌患者的凝血酶時間均數(shù)為18.39s,標準差為4.66s,問肺癌患者的凝血酶時間是否高于正常男子?,注意:醫(yī)學中一些公認的生理常數(shù)一般可看作總體均數(shù)0 。,目的:推斷樣本所代表的未知總體均數(shù)與已知總體均 數(shù)0有無差別。,(1)建立檢驗假設(shè) H0:=0=16.00 (男性肺癌患者的平均凝血酶時間 與正常男子平均凝血酶時間相同) ; H1: 0,t檢驗步驟:,(2)確定檢驗水準: =0.05,(3)計算檢驗統(tǒng)計量t:,實 例2,附表2 t界值表,根據(jù)專業(yè)知識確定單、雙側(cè)檢驗,二、配對t檢驗,隨機配對設(shè)計(randomized paired design):將受試對象按照某些重要的非處理因素配成對子,每對中的兩個受試對象隨機地接受兩種不同的處理。配對計量資料的特點是數(shù)據(jù)成對出現(xiàn),不可拆分。,實驗設(shè)計類型,(1)兩個同質(zhì)受試對象分別接受不同處理; 如對同窩、同性別大鼠施以兩種處理;對雙胞胎生理、心理測量結(jié)果等。,(2)同一受試對象分別接受不同的處理; 如對同一份血液樣品用兩種方法進行檢測。,(3)同一受試對象接受處理前后。 如對同一病人自身治療前后比較;將同一份標本一分為二分別處理等。,配對t檢驗實質(zhì)上是檢驗同對數(shù)據(jù)之差的總體均數(shù)是否為0;如果總體均數(shù)為0,說明兩種處理之間或處理前后之間沒有差別;如果總體均數(shù)不為0,說明兩種處理之間或處理前后之間有差別。 假設(shè)檢驗為同對數(shù)據(jù)之差的總體均數(shù)為0( H0: ),t值的計算,若差值的總體均數(shù)為0,則統(tǒng)計量t值服從自由度 的t分布。,實例:10名戰(zhàn)士在平原與高原的血氧飽和度(%)見表,試檢驗平原與高原的血氧飽和度相差是否顯著。,3、求P值,下結(jié)論 ,在 水準處拒絕H0,接受H1,認為 ,相差顯著,平原的血氧飽和度高于高原。,三、兩樣本t檢驗,兩組完全隨機設(shè)計:是指將受試單位完全隨機地分為兩組,每組給予不同的處理。 目的:推斷所來自的兩總體均數(shù)是否相同。 假設(shè)檢驗為兩總體均數(shù)相同( H0: ),兩樣本t檢驗又稱成組t檢驗,適用于完全隨機設(shè)計兩樣本的均數(shù)比較,t值的計算,實例:某高原研究組將籍貫相同、年齡相同、身高體重接近的20名新戰(zhàn)士隨機分為甲、乙兩組,甲組為鍛煉組,每天除常規(guī)訓練外,接受中速長跑與健身操鍛煉,乙組為對照組,按常規(guī)訓練,一月后測定肺活量(L)結(jié)果見表。試比較兩組的肺活量有無差別。,1、建立假設(shè)、確定檢驗水準,2、計算檢驗統(tǒng)計量,3、查t界值表,確定P值 在 水準處拒絕H0,接受H1, ,相差顯著,鍛煉組的肺活量高于對照組。,方 差 分 析,一、方差分析的基本思想,問題的提出 :比較兩個均數(shù) - t 檢驗,多個均數(shù): -方差分析(analysis of variance,ANOVA),例如全年級不同地區(qū)身高分析:,若用兩樣本均數(shù)比較的t檢驗進行多重比較,將會加大犯I型錯誤的概率。 例如:現(xiàn)有3個樣本均數(shù),進行兩兩比較共需要3次,若選用檢驗進行3次比較,每次比較的檢驗水準取0.05,則每次不犯I型錯誤的概率為1-0.05,3次均不犯I型錯誤的概率為(10.05)3 0.8574 ,此時總的I型錯誤的概率為1-0.8574=0.1426,比0.05大多了。,方差分析的基本原理:是將全部觀察值之間的變異(總變異)按設(shè)計和研究目的需要分解為兩個或多個部分,其自由度也分解為相應(yīng)的幾部分,每部分的變異可由某因素的作用解釋,通過比較分析判斷該因素對測定結(jié)果有無影響。,總變異 = 部分1變異 + 部分2變異 + 隨機誤差,樣本內(nèi)數(shù)據(jù)變化很小,但各樣本均值間變化較大。由于和樣本內(nèi)變異比較小,樣本間的變化較大,可直觀地認為對應(yīng)總體均值是不等的。,表1 三個樣本均值的比較(樣本內(nèi)變異小),樣本內(nèi)數(shù)據(jù)變異較大,且相對于樣本內(nèi)的變化,樣本均值間變異較小,依據(jù)這些數(shù)據(jù)就不大可能說對應(yīng)總體的均值是不同的。,表2 三個樣本均值的比較(樣本內(nèi)變異大),圖1 表1中的數(shù)據(jù),圖2 表2中的數(shù)據(jù),方差分析就是將樣本均值之間的差異和樣本內(nèi)的變異進行比較,從而判斷樣本均值之間的差異在統(tǒng)計上是否顯著。,例:某醫(yī)生為研究一種四類降糖新藥的療效,以同一的納入標準和排除標準選擇了60名2型糖尿病患者,按完全隨機設(shè)計方案將患者分為三組進行雙盲臨床試驗。其中降糖新藥高劑量組21人,低劑量組19人,對照組20人。對照組服用公認的降糖藥物,治療4周后測得其餐后2小時血糖的下降值(mmol/L),結(jié)果如表。問治療4周后,餐后2小時血糖下降值的三組總體平均水平是否相同?,例:2型糖尿病患者4周后餐后2小時血糖的下降值(mmol/L),1、總變異:包含隨機誤差(患者的個體差異和測量誤差),包含三組用藥即處理不同。其大小表示: 18.4176(601)1086.6384 2、組間變異:三組的樣本均數(shù)各不相同,與總均數(shù)也不相同,反映用藥不同的影響(處理因素),同時也包含隨機誤差(患者的個體差異和測量誤差)。其大小表示: 3、組內(nèi)變異: 個體不同,與本組樣本均數(shù)也不相同,反映隨機誤差(患者的個體差異和測量誤差)。其大小表示:,用均方表示:,若各樣本所代表的總體均數(shù)相等,即各樣本來自同一總體。本例,三組所用藥物處理效應(yīng)相同,組內(nèi)變異和組間變異一樣,只反映隨機誤差作用大小, 該比值服從分子自由度 ,分母自由度 的F分布。 理論上講F1,但不同處理對三組的作用不同,即三個總體均數(shù)不全相同時, 。 F值要大到多少才有統(tǒng)計學意義?查F界值表得到相應(yīng)的P值,然后根據(jù)檢驗水準作出推斷結(jié)論。,本例 312, 60357,查得 F=5.5374.98,P0.01。按0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義??梢哉J為2型糖尿病患者經(jīng)藥物(新藥和標準藥物)治療4周,其餐后2小時血糖的總體平均水平不全相同,即三個總體均數(shù)中至少有兩個不同。 方差分析表,三種“變異”之間的關(guān)系,均方(mean square,MS),F 值,F 界值表,方差分析的應(yīng)用條件,各樣本是相互獨立的隨機樣本; 各樣本來自正態(tài)總體; 各處理組總體方差相等,即方差齊性或齊同(homogeneity of variance)。,二、完全隨機設(shè)計資料的方差分析,完全隨機設(shè)計(the completely random design)是指將受試單位隨機地分配到各處理組中進行實驗研究,或分別從互相獨立的不同總體里隨機地抽取樣本進行比較的一種設(shè)計方法。,實例,某高原研究組將籍貫相同、年齡相同、身高體重接近的30名新戰(zhàn)士隨機分為三組,甲組為對照組,按常規(guī)訓練,乙組為鍛煉組,每天除常規(guī)訓練外,接受中速長跑與健身操鍛煉,丙組為藥物組,除常規(guī)訓練外,服用抗疲勞藥物,一月后測定第一秒用力肺活量(L),結(jié)果見表。試比較三組第一秒用力肺活量有無差別。,表2 完全隨機設(shè)計資料的方差分析表,檢驗步驟,建立假設(shè) H0:三個組第一秒用力肺活量的總體均數(shù)相同; H1:三個組第一秒用力肺活量的總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論