醫(yī)學統(tǒng)計學知識點匯總_第1頁
醫(yī)學統(tǒng)計學知識點匯總_第2頁
醫(yī)學統(tǒng)計學知識點匯總_第3頁
醫(yī)學統(tǒng)計學知識點匯總_第4頁
醫(yī)學統(tǒng)計學知識點匯總_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、醫(yī)學統(tǒng)計學總結(jié)緒論1、隨機現(xiàn)象:在同一條件下進行試驗,一次試驗結(jié)果不能確定,而在一定數(shù)量的重復試驗之后呈現(xiàn)統(tǒng)計規(guī)律的現(xiàn)象。2、同質(zhì):統(tǒng)計學中對研究指標影響較大的,可以控制的主要因素。3、變異:同質(zhì)基礎上各觀察單位某變量值的差異。 數(shù)值變量:變量值是定量的,由此而構(gòu)成的資料稱為數(shù)值變量資料或計量資料,其數(shù)值是連續(xù)性的,稱之為連續(xù)型變量。變量 無序分類變量:所分類別或?qū)傩灾g無順序和程度上的差異 分類變量 :定性變量 有序分類變量:有順序和程度上的差異4、總體:根據(jù)研究目的確定的同質(zhì)研究對象中所有觀察單位某變量值的集合??梢苑譃橛邢蘅傮w和無限總體。5、樣本:是按隨機化原則從同質(zhì)總體中隨機抽取的部分

2、觀察單位某變量值的集合。樣本代表性的前提:同質(zhì)總體,足夠的觀察單位數(shù),隨機抽樣。統(tǒng)計學中,描述樣本特征的指標稱為統(tǒng)計量,描述總體特征的指標稱為參數(shù)。6、概率:描述隨機事件發(fā)生的可能性大小的一個度量。若P(A)=1,則稱A為必然事件;若P(A)=0,則稱A為不可能事件;隨機事件A的概率為0P1.小概率事件:若隨機事件A的概率P,則稱隨機事件A為小概率事件,其統(tǒng)計學意義為:小概率事件在一次隨機試驗中認為是不可能發(fā)生的。統(tǒng)計描述1、頻數(shù)分布有兩個重要的特征:集中趨勢和離散程度。頻數(shù)分布有對稱分布和偏態(tài)分布之分。后者是指頻數(shù)分布不對稱,集中趨勢偏向一側(cè),如偏向數(shù)值小的一側(cè)為正偏態(tài)分布,如偏向數(shù)值大的一

3、側(cè)為負偏態(tài)分布。2、常用的集中趨勢的描述指標有:均數(shù),幾何均數(shù),中位數(shù)等。均數(shù):適用于正態(tài)或近似正態(tài)的分布的數(shù)值變量資料。樣本均數(shù)用表示,總體均數(shù)用表示。幾何均數(shù):適用于等比級數(shù)資料和對數(shù)呈正態(tài)分布的資料。注意觀察值中不能有零,一組觀察值中不能同時有正值和負值。中位數(shù):適用于偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)的資料。3、常用的離散程度的描述指標有:全距,四分位數(shù)間距,方差,標準差,變異系數(shù)。全距:任何資料,一組中最大值與最小值的差。四分位數(shù)間距:適用于偏態(tài)分布以及分布的一端或兩端無確切數(shù)據(jù)資料。方差和標準差:正態(tài)分布資料。標準差表示觀察值的變異度的大小。變異系數(shù):比較度量單位不同或

4、均數(shù)相差懸殊的兩組資料的變異度。4、標準正態(tài)分布:對正態(tài)分布的(X-)/進行u的變換,u=(X-)/,則正態(tài)分布變換為=0,=1的標準正態(tài)分布,亦稱u分布。u被稱為標準正態(tài)變量或標準正態(tài)離差。兩個參數(shù):是位置參數(shù),是形狀參數(shù)。用N(0,1)表示標準正態(tài)分布。常用估計醫(yī)學參考值范圍的方法有:(1) 正態(tài)分布方法:適用于正態(tài)或近似正態(tài)分布的資料。雙側(cè)界值:X±u/2S 單側(cè)上界:X+uS,或單側(cè)下界:X-uS(2) 對數(shù)正態(tài)分布方法:適用于對數(shù)正態(tài)分布資料。雙側(cè)界值:Lg-1(X lgx±u/2S lgx ) 單側(cè)上界:Lg-1(X lgx +uS lgx),或單側(cè)下界:Lg-

5、1(X lgx -uS lgx)(3)百分位數(shù)法:用于偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值的資料。雙側(cè)上界:P2.5和P97.5;單側(cè)上界:P95,或單側(cè)下界:P5參考值范圍(%) 單側(cè) 雙側(cè)80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.576常用的u值表5、分類變量資料的統(tǒng)計描述:常用相對數(shù)指標描述,包括:率,構(gòu)成比,相對比。率:說明某現(xiàn)象發(fā)生的頻率或強度。(病死率不等于死亡率)構(gòu)成比:說明某現(xiàn)象內(nèi)部組成部分所占的比重或分布,常以百分數(shù)表示。相對比:亦稱比,是A、B 2個有關指標之比,說明A為B的若干倍或百分之幾。兩個指標

6、可以性質(zhì)相同,也可以性質(zhì)不同。應用相對數(shù)時的注意事項: 1、計算相對數(shù)的分母不宜過??;2、分析時不能以構(gòu)成比代替率;3、對觀察單位數(shù)不等的幾個率,不能直接相加求其平均率;4、比較相對數(shù)時應注意其可比性;5、對樣本率(或構(gòu)成比)的比較應遵循隨機抽樣,并做假設檢驗。6、標準化法:標準化的目的在于消除混雜因素對結(jié)果的影響,使資料更具有可比性。其基本思想是:將所比較的兩組或多組資料的構(gòu)成按統(tǒng)一的“標準”調(diào)整后,計算標化率,使其更具有可比性。標準化率的計算方法:亦稱標化率,直接法用于已知被標化組的年齡別率,以及已知標準組的年齡別人口數(shù)或年齡別人口構(gòu)成比時;間接法用于已知被標化組的年齡別人口數(shù)與發(fā)?。ㄋ劳?/p>

7、)總數(shù),但年齡別率未知,以及已知標準組年齡別發(fā)?。ㄋ劳觯┞逝c總發(fā)病(死亡)率時。通常可從下列3種方法選用標準組:以兩組資料中任一組的年齡別人口數(shù)或構(gòu)成比作為標準組;以兩組資料合并的各年齡組的人口數(shù)或構(gòu)成比作為標準組;以公認的或便于與他人資料比較的標準作為標準組。7、統(tǒng)計表:結(jié)構(gòu):由標題、標目、線條和數(shù)字構(gòu)成。編制統(tǒng)計表的要求:標題:概括表的內(nèi)容,列于表的上方居中,應注明時間和地點;標目:主語和謂語分別列于橫、縱標目,文字簡明,層次清楚。橫標目列于表的左側(cè),通常為被研究的事物,縱標目列于表的上端,為說明橫標目的統(tǒng)計指標。線條:通常,除表的頂線、底線、縱標目下以及合計上的橫線外,其余線條均省去,頂

8、線和底線應略粗些,表的左上角不宜用斜線。數(shù)字:用阿拉伯數(shù)字表示,同一指標的小數(shù)位數(shù)要一致并對齊,數(shù)字暫缺或無數(shù)字者分別用“”或“-”表示,數(shù)字為0者要記作“0”,不應空項,為方便核實和分析,應有合計。備注:一般不列入表內(nèi),必要時可用“*”標出,列于表下。8、統(tǒng)計圖:條圖:用于相互對比關系的資料;圓圖與百分條圖:適用于百分構(gòu)成比資料,表示事物各組成部分所占的比重或構(gòu)成;線圖:用于連續(xù)性資料,用于說明事物在時間上的發(fā)展變化,或某現(xiàn)象隨另一現(xiàn)象而變動的情況;直方圖:表示連續(xù)性資料的頻數(shù)分布;散點圖:適用于直線相關分析,說明兩個變量間的數(shù)量關系和變化趨勢。抽樣分布與參數(shù)估計抽樣研究的目的是用樣本信息來

9、推斷總體特征,即統(tǒng)計推斷,包括兩個內(nèi)容:一是總體參數(shù)的估計,二是假設檢驗。1、抽樣誤差:由于變異的存在,抽樣研究所造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異稱為抽樣誤差。 常用標準誤反映均數(shù)抽樣誤差的大??;用率的標準誤p反映率的抽樣誤差的大??;用Possion計數(shù)的標準誤反映其抽樣誤差的大小。2、中心極限定理和正態(tài)分布推理:從正態(tài)分布N(,2)總體中以固定n隨機抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布,即使是從偏態(tài)分布總體中隨機抽樣,只要n足夠大,的分布也近似正態(tài)分布。樣本均數(shù)的均數(shù)仍為,樣本均數(shù)的標準差為。樣本均數(shù)的抽樣誤差(簡稱標準誤)是反映均數(shù)抽樣誤差大小的指標。 = 用

10、樣本均數(shù)S作為的估計值,則=3、t分布:將看成變量值,那么可將正態(tài)變量進行u變換(u=-/)后,也可將N(,)變換成標準正態(tài)分布N(0,1)。常用s作為的估計值,統(tǒng)計量為t,此分布為t分布。統(tǒng)計量 t= t曲線的形態(tài)變化與自由度v的大小有關。v越小,t值越分散,曲線越低平,v逐漸增大時,則t分布逐漸逼近正態(tài)分布,當v=無窮大時,t分布即為u分布。4、總體均數(shù)的估計有兩種方法:一種是點估計,即用統(tǒng)計量估計總體均數(shù);二是區(qū)間估計,亦稱可信區(qū)間。(1)未知且n?。?t/2,v sx+t/2,v sx(2)未知,但n足夠大,t分布逼近u分布:-u/2sx+u/2sx(3)已知:-u/2x+u/2x標準

11、差和標準誤的比較 標準差 標準誤S= =表示觀察值的變異程度大小 估計均數(shù)的抽樣誤差大小計算變異系數(shù)CV=100% 估計總體均數(shù)可信區(qū)間 -t/2,v sx+t/2,v sx確定醫(yī)學參考值的范圍 進行假設檢驗計算標準誤數(shù)值變量資料的假設檢驗1、假設檢驗的原理:假設在一次抽樣研究中得出了u1.96,則P0.05,此為小概率事件,依據(jù)“小概率事件在一次隨機試驗中認為是不可能發(fā)生的”的定理,可認為此樣本不是來自該總體。2、步驟:建立假設和確定檢驗水準;假設有兩種,一種是檢驗假設,常稱無效假設或零假設,記為H0,假設樣本所代表的總體參數(shù)與已知總體參數(shù)相等;另一種是備擇假設,記為H1,是與H0相聯(lián)系且對

12、立的假設;檢驗水準,亦稱顯著性水準,是判斷拒絕或不拒絕H0,也是允許犯型錯誤的概率,通常用0.05。選定檢驗方法和計算統(tǒng)計量確定P值,做出推斷結(jié)論。P值是指從H0所規(guī)定的總體中隨機抽樣時,獲得等于及大于現(xiàn)有樣本統(tǒng)計量的概率。3、t檢驗:適用于:樣本均數(shù)與總體均數(shù)比較(未知且n50或n30);成組設計的兩小樣本均數(shù)的比較(n1,n2均小于30或50);配對設計的兩樣本均數(shù)比較。應用條件:當樣本含量較小(n50或n30)時,要求樣本來自正態(tài)分布總體;用于成組設計的兩樣本均數(shù)比較時,要求兩樣本來自總體方差相等的總體。4、單樣本t檢驗:用于樣本均數(shù)與已知總體均數(shù)的比較,研究目的是推斷樣本所代表的總體均

13、數(shù)與已知總體均數(shù)0有無差別。統(tǒng)計量t= v=n-15、配對t檢驗:用于配對設計資料的兩均數(shù)的比較。其研究目的是推斷某種處理有無作用,或兩種處理的效果有無差別。配對設計類型有3種:先將受試對象按配比條件配對,然后用隨機分組方法將各對中的2個受試對象分別分配到不同的處理組;同一對象分別接受2種不同處理;同一對象處理前后。t= (是差值的樣本均數(shù))v=n-16、兩樣本t檢驗:用于完全隨機設計的兩樣本均數(shù)的比較,兩個樣本來自兩個總體,其研究目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。t= v=n1+n2-27、單樣本u檢驗:用于樣本均數(shù)與已知總體均數(shù)比較,其研究目的同t檢驗。研究目的是推斷樣本所代表

14、的總體均數(shù)與已知總體均數(shù)0有無差別。其統(tǒng)計量 u=8、兩樣本的u檢驗:用于完全隨機設計的兩樣本均數(shù)的比較,兩個樣本來自兩個總體,其研究目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。其統(tǒng)計量為:u=9、正態(tài)性檢驗和方差齊性檢驗:資料在做假設檢驗之前首先應該檢驗資料是否來自正態(tài)總體,并且它們的方差是否齊。10、兩類錯誤:型錯誤:拒絕了實際上成立的H0,即樣本來自=0的總體,由于抽樣的偶然性,按=0.05檢驗水準拒絕了H0,接受H1。這類在假設檢驗中拒絕了原本正確的H0的錯誤稱為型錯誤。,理論上犯型錯誤的概率為,值得大小視研究目的而定。通常設=0.05。型錯誤:不拒絕了實際上不成立的H0, 即樣本來

15、自0的總體,由于抽樣的偶然性,按=0.05檢驗水準不拒絕H0,這類在假設檢驗中不拒絕原本不正確的H0的錯誤稱為型錯誤。犯型錯誤的概率為,它只有與特定的H1結(jié)合起來才有意義。同時減少和的方法是增加樣本含量。1-稱為檢驗效能或把握度,即兩總體確有差別時,按水準能識別該差別的能力。如1-=0.95表示:若兩總體確有差別,理論上平均100次抽樣中,有95次能得出兩總體有差別的結(jié)論。11、假設檢驗時應注意的事項:要有嚴密的抽樣研究設計-假設檢驗的前提正確選用檢驗方法:完全隨機的設計的兩數(shù)值變量資料比較時,若n小且方差齊,則選用兩樣本t檢驗;若方差不齊,則選用t檢驗或成組設計的兩樣本比較的秩和檢驗;若n1

16、,n2均大于50,則選用兩樣本u檢驗。正確理解“顯著性”的含義 對差別有無統(tǒng)計學意義的判斷不能絕對化。方差分析1、基本思想:按研究目的和設計類型,將總變異的離均差平方和SS和自由度v分別分解成若干部分,并求得各相應部分的變異。其中的組內(nèi)變異或誤差主要反映個體差異或抽樣誤差,其它部分的變異與之比較得出統(tǒng)計量F值,由F值的大小確定P值,并作出推斷,從而了解該因素對觀測指標有無影響。組內(nèi)變異主要由個體差異所致,組間變異可能由兩種原因所致:一是抽樣誤差,二是由于接受的處理不同。2、總離均差平方和SS和自由度vSS總=v總=n-13、組間離均差平方和SS組間,自由度v組間和均方MS組間SS組間= v組間

17、=k-1 MS組間=4、組內(nèi)離均差平方和SS組內(nèi),自由度v組內(nèi)和均方MS組內(nèi)SS組內(nèi)=SS總-SS組間 v組內(nèi)=n-k MS組內(nèi)=SS組內(nèi)/v組內(nèi)多樣本均數(shù)比較的方差分析的應用條件:各樣本是相互獨立的隨機樣本;各樣本來自正態(tài)分布總體;各總體方差相等,即方差齊。5、完全隨機設計資料的方差分析:亦稱單因素的方差分析,可用于完全隨機設計的多個樣本均數(shù)比較的資料,研究目的是推斷各個樣本所代表的總體均數(shù)是否相等。單因素方差分析的計算公式變異來源 SS v MS F 總變異 n-1組間變異 k-1 組內(nèi)變異 SS總-SS組間 n-k SS組內(nèi)/v組內(nèi)*C為校正系數(shù) C=6、配伍組設計資料的方差分析:亦稱兩

18、因素的方差分析,用于配伍組設計的多個樣本均數(shù)比較的資料,其研究目的是推斷各樣本所代表的總體均數(shù)是否相等,但考慮了個體差異對試驗效應的影響。兩因素方差分析的計算公式變異來源 SS v MS F總變異 n-1處理組 k-1 SS處理/v處理 MS處理/MS誤差配伍組 b-1 SS配伍/v配伍 MS配伍/MS誤差誤差 SS總-SS處理-SS配伍 (k-1)(b-1) SS誤差/v誤差*C為校正系數(shù) C= b為配伍組數(shù)分類資料的假設檢驗1、二項分布:應用條件:各觀察單位只能具有兩種相互對立的結(jié)果已知發(fā)生某結(jié)果的概率為,其對立結(jié)果的概率為1-n次試驗是在相同的條件下進行的。性質(zhì):=n =若均數(shù)和標準差用

19、率表示,則 p= p=未知時,用樣本率P作為的估計值,則 Sp=總體率的估計:正態(tài)近似法:當樣本含量n足夠大,且樣本率p或1-p均不太小,如np與n(1-p)均大于5時樣本率p的抽樣誤差分布近似正態(tài)分布,可信區(qū)間為:(p-u/2Sp,p+u/2Sp)2、Poisson分布:對于二項分類變量,若某結(jié)果發(fā)生的概率很小,如0.05時,單位時間、人群、空間內(nèi)“陽性”發(fā)生次數(shù)x(x=0,1,2,)的概率可用Poisson分布概率函數(shù)來描述:P(X)= 遞推公式:P(0)= P(x)=應用條件:0.05外,其余同二項分布。分布的性質(zhì):(1)、Poisson分布式一種單參數(shù)的離散型分布,其參數(shù)為,表示單位時

20、間、人群、空間內(nèi)某事件平均發(fā)生的次數(shù)。(2)、Poisson分布的方差與均數(shù)相等。(3)、Poisson分布可以看成是二項分布的極限形式。(4)、Poisson分布的極限形式也是二項分布,一般當n20時,可按正態(tài)分布處理,當0.01時,二項分布可以當作Poisson分布來處理。(5)、Poisson分布具有可加性。總體均數(shù)的估計:(正態(tài)近似法), 3、服從二項分布資料的假設檢驗:(1)樣本率和總體率的估計:直接計算法:最多有k例陽性的概率:P(xk)= 最少有k例陽性的概率:P(xk)=1-正態(tài)近似法:當不太靠近0或1,且樣本含量n足夠大;或n5且n(1-)5時,二項分布接近正態(tài)分布。u=(2

21、)兩樣本率的比較:目的是推斷兩個樣本各自代表的兩總體率是否相等,當兩個樣本率均滿足正態(tài)近似條件時,可用u檢驗。其公式為:u= 為合并陽性率,=(x1+x2)/(n1+n2) x1,x2為兩個樣本的陽性例數(shù)。4、服從Poisson分布的假設檢驗:對于Poisson分布的假設檢驗,對于總體均數(shù)可以用乘法將小單位化大,也可以用除法將大單位化小,對于樣本均數(shù),只能用除法將大單位化小,而不能用乘法將小單位化大。(1)樣本均數(shù)與總體均數(shù)的比較:適用于020,且樣本陽性數(shù)X較小作單側(cè)檢驗時。直接計算法:最多有k例陽性的概率:P(xk)= 最少有k例陽性的概率:P(xk)=1-正態(tài)近似法:當20時,Poiss

22、on分布逼近正態(tài)分布。u=(2)兩樣本陽性數(shù)的比較:目的是推斷兩樣本各自代表的兩總體平均數(shù)是否相等。當兩樣本陽性數(shù)X1,X2均大于20時,可用u檢驗。其計算用兩種情況:兩樣本觀察單位(時間、面積、容積等)相同時:u=兩樣本觀察單位(時間、面積、容積等)不同時:u=5、檢驗:是一種連續(xù)型分布,u分布的平方即為分布。對于同一份資料,。檢驗的檢驗統(tǒng)計量為,其基本公式為:,自由度 v=(行數(shù)-1)(列數(shù)-1) 式中A為實際頻數(shù),T為理論頻數(shù)。理論頻數(shù)T的計算公式為: 為第R行第C列的理論頻數(shù),nR為相應行的合計,nC為相應列的合計,n為總例數(shù)。自由度 v=(R-1)(C-1). 反映了實際頻數(shù)與理論頻

23、數(shù)的吻合程度。只有考慮了自由度 v的影響,值才能正確地反應實際頻數(shù)A和理論頻數(shù)T的吻合程度。6、四格表資料的檢驗:最小理論頻數(shù)的判斷,R行與C列中,行合計數(shù)中的最小值與列合計數(shù)中的最小值所對應的理論頻數(shù)最小。(1)四個表資料檢驗的專用公式:(2)四個表資料檢驗的校正公式: 在實際工作中,對于四個表資料,通常規(guī)定為:(1)當n40且所有的T5時,用檢驗的基本公式或四個表資料檢驗的專用公式;當P時,改用四個表資料的Fisher確切概率法。(2)當n40,但1T5時,用四格表資料的檢驗的校正公式;或改用四個表資料的Fisher確切概率計算法。(3)當n40,或T1時,用四個表資料的Fisher確切概

24、率法。(4)連續(xù)性校正僅用于v=1的四格表資料,尤其是n小時。當v2時一般不做校正。7、配對四個表資料的檢驗:由于在抽樣研究中,抽樣誤差是不可避免的,樣本中的b和c往往不相等(即bc),為此,需進行假設檢驗,其檢驗統(tǒng)計量為: v=1 (條件為:b+c40) v=1 (條件為:b+c40)本方法只適用于樣本含量不太大的資料,它僅考慮了兩種方法結(jié)果不一致的情況,而未考慮樣本含量n和兩種方法一致的兩種情況,所以當n很大且a與d的數(shù)值也很大,而b與c的數(shù)值相對較小時,即使檢驗統(tǒng)計結(jié)果有統(tǒng)計學意義,其實際意義也不大。8、行*列表資料的檢驗:只適用于多個樣本率的比較,兩個或多個構(gòu)成比的比較以及雙向無序分類

25、資料的關聯(lián)性檢驗。其基本數(shù)據(jù)由三種情況:多個樣本率的比較時,有R行2列,稱為R*2表兩個樣本的構(gòu)成比比較時,有2列C列,稱為2*C表多個樣本的構(gòu)成比比較以及雙向無序分類資料關聯(lián)性檢驗時,有R行C列,稱為R*C表。 以上三種可統(tǒng)稱為行*列表資料基本公式:基本公式為:專用公式: 自由度 v=(行數(shù)-1)(列數(shù)-1)注意事項:一般人行*列表資料中各格的理論頻數(shù)不能小于1,且1T5格子數(shù)不能超過總數(shù)的1/5。如果出現(xiàn)以上情況,可通過以下方法解決:最好是增加樣本含量,使得理論頻數(shù)增大;根據(jù)專業(yè)知識,考慮能否刪去理論頻數(shù)太小的行和列,能否將理論頻數(shù)太小的行和列于性質(zhì)相近的鄰行或鄰列合并;改用雙向無序R*C

26、的Fisher確切概率計算法。當多個樣本率比較時,所得統(tǒng)計推斷為拒絕H0,接受H1時,只能認為各樣本率間總的來說有差別,但不能說明任兩個樣本率間均有差別,需要做多個樣本率的多重比較。對于有序的R*C表資料不宜用檢驗。對于R*C表的資料要根據(jù)分類類型和研究目的選用恰當?shù)臋z驗方法。9、雙向無序分類資料的關聯(lián)性檢驗:對于此資料,常常需要分析兩個分類變量之間有無關系,關系的密切程度如何,進一步分析密切程度時,可以用Pearson列聯(lián)系數(shù), 取值在01之間,0表示完全不相關,1表示完全相關,愈接近于0,關系愈不密切,愈接近1,關系愈密切。11、R*C表的分類及檢驗方法的選擇:分類:雙向無序、單向有序、雙

27、向有序?qū)傩韵嗤碗p向有序但屬性不同四種。雙向無序R*C表:兩個分類變量皆為無序分類變量,對于該資料:如果研究目的為兩個樣本率(或構(gòu)成比)的比較,可用行*列資料的檢驗;如果研究目的是分析兩個分類變量之間有無關聯(lián)性以及關系的密切程度時,可用行*列表資料的檢驗以及Pearson列聯(lián)系數(shù)進行分析。單向有序R*C表:有兩種形式:一種是R*C表的分組變量是有序的,而指標變量是無序的;研究的目的通常是多個構(gòu)成比的比較,可用行*列表資料的檢驗進行分析。另一種是R*C表中的分組變量是無序的,而指標變量是有序的,研究目的通常是多個等級資料的比較,可用秩和檢驗或Ridit分析。雙向有序?qū)傩孕瓮腞*C表:兩個分類變

28、量皆為有序且屬性相同,研究目的通常是分析兩種檢測方法的一致性,此時宜用一致性檢驗(或稱Kappa檢驗);也可用特殊模型分析方法。雙向有序?qū)傩圆煌腞*C表:兩分類變量皆為有序的,但屬性不同,對于該資料:如果研究目的是分析不同年齡組患者療效見有無差別,可把它視為單向有序的R*C表資料,選用秩和檢驗;如果研究目的是分析兩個有序分類變量間是否存在相關關系,可以用等級相關分析或Pearson積矩相關分析;如果研究目的是分析兩個有序分類變量是否存在線性變化趨勢,可以用有序分組資料的線性趨勢檢驗。非參數(shù)檢驗非參數(shù)檢驗的統(tǒng)計推斷基礎是比較分布而不是比較參數(shù),所以不必考慮被研究對象的為何種分布以及分布是否已知

29、。在實際工作中,對符合參數(shù)檢驗應用條件的資料,或經(jīng)變量變換后符合參數(shù)檢驗應用條件的資料應首選參數(shù)檢驗;而不能滿足參數(shù)檢驗應用條件的資料,應選用非參數(shù)檢驗。主要選擇編秩的方法,比較統(tǒng)計變量T,而做出統(tǒng)計推斷。直線回歸與相關分析1、直線相關:如果兩個隨機變量中,當其中的一個變量由大到小的變化時,另一個變量也相應的由大到小(后由小到大)的變化,并且相應變化的散點圖在直角坐標系呈現(xiàn)直線趨勢,則稱這兩個隨機變量存在直線相關。相關分析是研究變量和變量集合之間數(shù)量協(xié)同變化關系的密切程度和方向的統(tǒng)計方法。要求:兩個變量X和Y都服從正態(tài)分布,嚴格說應服從雙變量正態(tài)分布。直線相關系數(shù):用于說明具有直線相關關系的兩

30、個變量間的相關關系的密切程度和相關方向;亦稱積差相關系數(shù),總體的為,樣本的為。 的取值在-1,1之間。其意義如下:若則X與Y存在直線相關關系;為正相關;為負相關;越大,說明兩變量間的相關關系越密切;越小,說明兩變量間的相關關系越不密切;若為完全相關;若,則X和Y不存在相關關系。表示存在不同程度的線性相關關系:為低度線性相關;為顯著線性相關;為高度顯著線性相關。相關分析的步驟:(在X與Y均服從雙變量正態(tài)分布的情況下)繪制散點圖:呈線性趨勢,計算相關性;呈曲線趨勢,進行曲線擬合;無任何趨勢,不必分析。根據(jù)上述公式計算的值;相關系數(shù)的假設檢驗,由于抽樣誤差的存在,判斷是否來自的總體,常用t檢驗,公式

31、: (或直接查t界值表)總體相關系數(shù)的區(qū)間估計:當時,從這樣的總體中抽樣,計算出的不服從正態(tài)分布,而進行反正切變換后,n較大時,Z近似服從均數(shù)為Z,方差為的正態(tài)分布。 則Z的可信區(qū)間為(,),對其進行的變換,可以得出的可信區(qū)間。直線相關分析的注意事項:1 算相關系數(shù)時首先繪制散點圖,判斷兩變量是否存在線性趨勢;相關分析時要求X、Y均為隨機變量,而不能用于事先界定X、Y的資料;相關分析時必須剔除異常點;相關分析要有實際意義,兩變量相關,并不一定存在聯(lián)系,可能是另外一種因素引起的;分層資料不宜盲目的合并,進行相關分析;同時進行相關分析時,如果不能確定各層研究對象具有同質(zhì)基礎,不宜盲目合并。不能將假

32、設檢驗中顯著性大小理解為兩變量相關程度的大小,后者是由相關系數(shù)的大小決定的。2、等級相關:適用于不服從雙變量正態(tài)分布或總體分布未知的資料,還可用于等級資料的相關分析。等級相關系數(shù)表示兩個變量間相關系數(shù)的密切程度與相關方向。基本思想:對于不符合正態(tài)分布的資料或等級資料,將兩個變量的原始觀察值分別由小到大編秩,然后利用量變量的秩次計算相關系數(shù)。3、直線回歸: 處理兩個變量間線性數(shù)量依存關系的一種統(tǒng)計分析方法?;貧w方程為: 為應變量,給定x的y的條件均數(shù)的估計值;b為回歸斜率,表示當自變量x每變化1個單位時,應變量y平均變化b個單位;a為截距,表示沒有自變量x時其他因素對y的平均影響。線性回歸模型的

33、前提條件:線性:應變量y的總體均數(shù)與自變量x呈線性關系;因此進行回歸分析前應先繪制散點圖;獨立:任意兩個觀察單位之間相互獨立;正態(tài)性:對任意給定x的值,y均服從正態(tài)分布;該分布的均數(shù)是回歸直線上與x值相對應的那點的縱坐標;等方差:自變量x的取值范圍內(nèi),不論x取什么值,y都具有相同的方差。直線回歸分析的步驟:繪制散點圖,通過觀察散點的形態(tài)來判斷線性假設是否成立;建立直線回歸方程,即求出回歸參數(shù)a和b;通常用最小二乘法估計參數(shù),即要求殘差平方和達到最??; 繪制回歸線;注意:不應超過x的實測值范圍;所繪制的直線必然通過(,);直線的左端延長與縱軸的焦點必然是截距a。回歸方程的假設檢驗:檢驗方法有方差

34、分析和t檢驗方差分析:基本思想:將應變量y的總變異SS總分解成SS回歸和SS剩余兩部分,然后利用F檢驗來判斷回歸方程是否成立。任意一點P(x,y)的縱坐標被回歸直線與均數(shù)截成3段:三部分的變異可以表示為:=+即SS總=SS回歸+SS剩余各部分的意義:SS總 :即=,為y的總離均差平方和,反映未考慮x和y的回歸關系時的y的變異;SS回歸:即,稱回歸平方和,反映在y的總變異中,由于x和y的直線關系而使y變異減小的部分,即在總變異中可以用x解釋的部分;SS回歸越大,說明回歸效果越好,即SS總中可用X與Y線性關系解釋的變異越多。SS剩余:即,殘差平方和或剩余平方和,反映x和y的線性影響之外的一切因素對

35、y的變異的作用,即在總變異中無法用x解釋的部分。該部分越小說明直線回歸的估計值誤差越?。桓鞑糠值淖杂啥葹椋?+ =n-1,=1,=n-2各部分變異的計算公式為: SS總=SS剩余=SS總-SS回歸統(tǒng)計量F的計算公式:回歸系數(shù)的t檢驗:基本思想:通過樣本回歸系數(shù)b與總體均數(shù)回歸系數(shù)進行比較來判斷回歸方程是否成立。有關公式如下: ; ; ; 為剩余標準差,是指扣除了x因變量線性影響后離散程度。擬合效果評價:回歸模型的擬合優(yōu)度假設檢驗,檢驗回歸方程對樣本數(shù)據(jù)的擬合程度。決定系數(shù)表示, 總體回歸系數(shù)的區(qū)間估計:(,)回歸方程的應用:利用回歸方程進行預報;統(tǒng)計控制。直線回歸分析的注意事項: 回歸分析要有

36、實際意義,注意變量之間的內(nèi)在聯(lián)系和規(guī)律,兩變量之間還必須是因果關系; 對資料的要求:一般y來自正態(tài)總體的隨機變量,x可以是正態(tài)總體的隨機變量,也可以是精確測量和嚴密控制的值; 進行分析前應先繪制散點圖; 必須剔除一些異常點; 回歸方程的適用范圍不能隨意外延。其適用范圍一般以自變量取值范圍為界。直線相關和回歸的區(qū)別與聯(lián)系:區(qū)別:資料的要求不同:相關要求兩個變量呈雙變量正態(tài)分布;回歸要求y服從正態(tài)分布,而x可以是精確測量和嚴格控制的變量;統(tǒng)計意義不同:相關反映的是兩變量間的伴隨關系,二者的關聯(lián)程度如何,而回歸反映的是兩變量間的依存關系,即因果關系,或從屬關系;分析的目的不同:相關分析的目的是描述兩

37、個變量間的相互關系,用r來反映這種關系的方向以及密切程度,而回歸分析的目的是描述兩個變量間的數(shù)量依存關系,從而進行統(tǒng)計預測和統(tǒng)計控制;聯(lián)系:對于同一資料,r和b的符號一致,說明兩變量間關系的方向;相關系數(shù)與回歸系數(shù)的假設檢驗是等價的,對于同一樣本, ,實際應用中只檢驗其中之一即可;二者可以相互解釋,相關系數(shù)的平方和等于回歸平方和占總平方和的比例,即反映應變量y的總變異中歸因于x的部分; 實驗設計的概述實驗室研究:以動物或標本為研究對象實驗研究的分類 臨床試驗:以人為研究對象社區(qū)干預試驗:以社區(qū)人群為研究對象,又稱半試驗性研究處理因素試驗設計的基本因素 受試對象實驗效應1、處理因素:研究者根據(jù)研

38、究目的確定的,通過合理安排實驗,從而科學的考察其作用大小的因素;非處理因素:對正確的評價處理因素的作用有一定的干擾,但研究者并不想通過本次實驗考察其作用大小的因素;注意事項:要區(qū)分處理因素和非處理因素;主要依據(jù)研究目的來確定;抓住實驗中的主要因素,且因素的水平數(shù)不宜過多;處理因素必須標準化,即保證處理因素在整個實驗過程中始終如一,保持不變;2、實驗效應:通過觀察指標來反映觀察指標的基本原則:客觀性;精確性(包括準確度和精確度,準確度是指測值與真實值的接近程度,屬系統(tǒng)誤差;而精確度是指對同一變量重復觀測時,觀測值與平均值的接近程度);靈敏性;特異性3、實驗設計的基本原則:對照,隨機,重復,均衡對

39、照:使實驗組和對照組內(nèi)的非處理因素基本一致,從而使處理因素的效應得以顯示;對照組設計的三個條件:專設,同步,對等;對照的形式:空白對照:不給對照組施加任何處理因素,臨床試驗中不宜用空白對照; 實驗對照:不給對照組施加處理因素,但施加某種實驗因素; 標準對照:與現(xiàn)有的標準法或常規(guī)方法、公認的有效藥物作對照; 自身對照:對照與實驗在同一受試對象上進行; 相互對照:不單獨設立對照組,而是2個或幾個實驗組相互對照; 歷史對照:除了非處理因素影響較小的少數(shù)疾病外,一般不宜用此種對照配對對照;安慰劑對照隨機:包括隨機抽樣與隨機分配;重復:樣本含量與四個因素有關:,且均呈反變的關系。均衡:各組的受試對象除接

40、受的處理因素不同外,其他影響實驗的非處理因素要基本相同。常用的實驗設計方法1、完全隨機設計:亦稱單因素實驗設計,不考慮個體差異的影響,僅涉及1個處理因素,但可以有2個或2個以上的水平。將受試對象隨機分配到處理組合對照組中,各組的例數(shù)可以相等或不等。分析方法同前。2、配對設計和配伍組設計:先將受試對象按配比條件配成對子,再按隨機化的原則把每對中的受試對象分配到實驗組和對照組中。通常以影響實驗效應的主要處理因素為配對條件。醫(yī)學實驗中的自身對照也是配對設計,但容易產(chǎn)生混雜影響,最好設立平衡對照。配伍組設計,亦稱隨機區(qū)組設計,是配對設計的擴大。分析方法:配對設計:如果各對的觀察值的差值服從均數(shù)為0的正

41、態(tài)分布,用配對設計的t檢驗,否則用配對設計的秩和檢驗。配伍組設計:滿足方差分析條件的用方差分析,不滿足的經(jīng)變量變換后也可以用,仍達不到要求的用配伍組設計的秩和檢驗。3、交叉設計:是在自身配對設計基礎上發(fā)展起來的雙因素設計,該設計考慮了1個處理因素,此因素有兩個水平(A,B),并且還考慮了2個與處理因素無交互作用的非處理因素對實驗效應的影響。適用條件及應注意的問題:處理因素只有2個水平(A,B),且2個非處理因素(實驗階段、受試對象)與處理因素之間無交互作用;兩個實驗階段之間要安排一定的間隔時間,以便消除前一階段治療措施的殘留效應,保證兩個階段的起始條件一樣;兩次觀察的時間不能過長,處理效應不能

42、持續(xù)過久;適用于病情較穩(wěn)定,病程可以分階段,短期治療可見療效的疾??;為消除患者的心理作用或防止研究者的暗示,一般多采用盲法。分析方法:符合方差分析條件的應用方差分析,不符合的經(jīng)變量變換后也可以用,仍達不到要求的用秩和檢驗。方差分析將總變異分為4部分:受試者間,階段間,處理間和誤差。4、拉丁方設計:是按拉丁方陣的字母、行和列安排實驗的三因素等水平的設計??紤]了3個因素對實驗效應的影響?;疽螅罕仨毷?個因素的實驗,且3個因素的水平數(shù)相等(若不等,以主要的處理因素的水平數(shù)為主,其他2個進行調(diào)整);3個因素是相互獨立的,均無交互作用;各行、列和字母所得實驗數(shù)據(jù)的方差齊;設計步驟:根據(jù)主要處理因素的水平數(shù)確定基本型拉丁方;先將基本型拉丁方隨機化,然后按隨機化后拉丁方陣安排實驗,隨機化是通過拉丁方的任兩行或任兩列交換位置實現(xiàn);規(guī)定行、列、字母所代表的因素或水平,通常用字母表示主要的處理因素;分析方法:可用方差分析,將總變異分為列間、行間、字母間和誤差4部分。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論