醫(yī)學統(tǒng)計學重點_第1頁
醫(yī)學統(tǒng)計學重點_第2頁
醫(yī)學統(tǒng)計學重點_第3頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.醫(yī)學統(tǒng)計學重點第1章 緒論1. 基本概念:總體:根據(jù)研究目的確定的性質(zhì)相同或相近的研究對象的某個變量值的全體。樣本:從總體中隨機抽取部分個體的某個變量值的集合??傮w參數(shù):刻畫總體特征的指標,簡稱參數(shù)。是固定不變的常數(shù),一般未知。統(tǒng)計量:刻畫樣本特征的指標,由樣本觀察值計算得到,不包含任何未知參數(shù)。抽樣誤差:由隨機抽樣造成的樣本統(tǒng)計量與相應的總體參數(shù)之間的差異。頻率:若事件A在n次獨立重復試驗中發(fā)生了m次,則稱m為頻數(shù)。稱m/n為事件A在n次試驗中出現(xiàn)的頻率或相對頻率。概率:頻率所穩(wěn)定的常數(shù)稱為概率。統(tǒng)計描述:選用合適統(tǒng)計指標(樣本統(tǒng)計量)、統(tǒng)計圖、統(tǒng)計表對數(shù)據(jù)的數(shù)量特征及其分布規(guī)律進行刻畫和

2、描述。統(tǒng)計推斷:包括參數(shù)估計和假設(shè)檢驗。用樣本統(tǒng)計指標(統(tǒng)計量)來推斷總體相應指標(參數(shù)),稱為參數(shù)估計。用樣本差別或樣本與總體差別推斷總體之間是否可能存在差別,稱為假設(shè)檢驗。2. 樣本特點:足夠的樣本含量、可靠性、代表性。3.資料類型:(1)定量資料:又稱計量資料、數(shù)值變量或尺度資料。是對觀察對象測量指標的數(shù)值大小所 得的資料,觀察指標是定量的,表現(xiàn)為數(shù)值大小。每個個體都能觀察到一個觀察指標的 數(shù)值,有度量衡單位。(2)分類資料:包括無序分類資料(計數(shù)資料)和有序分類資料(等級資料)計數(shù)資料:是將觀察單位按某種屬性或類別分組,清點各組觀察單位的個數(shù)(頻數(shù)),由 各分組標志及其頻數(shù)構(gòu)成。包括二

3、分類資料和多分類資料。 二分類:將觀察對象按兩種對立的屬性分類,兩類間相互對立,互不相容。 多分類:將觀察對象按多種互斥的屬性分類等級資料:將觀察單位按某種屬性的不同程度、檔次或等級順序分組,清點各組觀察單 位的個數(shù)所得的資料。4.統(tǒng)計工作基本步驟:統(tǒng)計設(shè)計、資料收集、資料整理、統(tǒng)計分析。第二章 實驗研究的三要素1.實驗設(shè)計三要素:被試因素、受試對象、實驗效應2.誤差分類:隨機誤差(抽樣誤差、隨機測量誤差)、系統(tǒng)誤差、過失誤差。3.實驗設(shè)計的三個基本原則:對照原則、隨機化分組原則、重復原則。4.實驗設(shè)計方法有 析因設(shè)計 正交試驗設(shè)計 均勻試驗設(shè)計交互作用 兩組 :異體配對設(shè)計 同體配對設(shè)計 交

4、叉設(shè)計無 隨機同期對照實驗設(shè)計 (單因素兩水平) 擴展 多組:單因素多水平 配伍組設(shè)計 拉丁方設(shè)計 (兩因素多水平) (三因素多水平)配伍組設(shè)計:也稱隨機區(qū)組設(shè)計,將條件相近的受試對象配伍,每個配伍組中的對象隨機分配到各處理組中。析因設(shè)計:考察兩個或兩個以上的處理因素,將各個因素的水平進行全面組合,每個組合下至少有兩個以上的觀察對象重復測量。一般來講,應盡可能安排等重復試驗,以簡化計算,2-3個水平數(shù)。優(yōu)點是全面性和均衡性較好,可同時分析處理因素的效應及因素間的交互作用。拉丁方設(shè)計:用于三因素等水平無交互。第三章 定量資料的統(tǒng)計描述、參考值X圍1.頻數(shù)表編制過程(了解)(1)找出樣本數(shù)據(jù)的最大

5、值和最小值,計算極差 R;(2)分組:確定分組的組距 d 和組數(shù) k; 一般n100,10-15組(3)求頻率密度:統(tǒng)計頻數(shù),算出頻率、頻率密度和累積頻率;(4)畫出直方圖。2.頻數(shù)表和直方圖的作用:用于觀察個數(shù)較多資料的統(tǒng)計描述,可以直觀提示資料的分布特征和分布類型。3.集中趨勢、離散趨勢的指標及適用X圍(1)集中趨勢:,G,M,Px,M0 算術(shù)均數(shù):適用于對稱分布; 不適用于偏態(tài)分布和資料中出現(xiàn)極值的資料。 幾何均數(shù):適用于呈倍數(shù)關(guān)系的資料或?qū)?shù)正態(tài)分布的資料,尤其是正偏態(tài)分布。 不適用與觀察值中有0或正負數(shù)值同時出現(xiàn)的資料。 中位數(shù):適用于大樣本偏態(tài)分布或分布情況不明的資料或資料中有不確

6、定數(shù)值的資料。 百分位數(shù)的作用:多個百分位數(shù)結(jié)合使用,全面描述數(shù)據(jù)分布的特征; 用于確定醫(yī)學參考值X圍(偏態(tài)或分布不明的資料)。 眾數(shù):適用于大樣本,較粗糙。(2) 離散趨勢: 極差:優(yōu)點:簡單明了、容易使用。 缺點:只反映最大值和最小值間的差異,不能反映其他觀察值的變異程度。樣本容量越大,極差可能越大。極差的抽樣誤差大,不穩(wěn)定。 四分位數(shù)間距:適用于確定醫(yī)學參考值X圍,與中位數(shù)一起描述偏態(tài)分布資料變異程度。 缺點:類似于極差,利用度低。 方差與標準差:與均數(shù)一起描述對稱分布,特別是正態(tài)分布的分布特征。 變異系數(shù):適用于:適用于比較度量衡單位不同資料的變異度。比較均數(shù)相差懸殊的資料的變異度。衡

7、量實驗精密度和穩(wěn)定性的常用指標。(3)頻數(shù)分布特征 高峰在中間,左右大致對稱,稱為對稱分布。 平均數(shù)=中位數(shù)=眾數(shù) 高峰偏向小值的一側(cè)(左側(cè)),稱正偏態(tài)分布(亦稱右偏態(tài))。 平均數(shù)中位數(shù)眾數(shù) 高峰偏向大值的一側(cè)(左側(cè)),稱負偏態(tài)分布(亦稱左偏態(tài))。 平均數(shù)中位數(shù)眾數(shù)對稱分布 正(右)偏態(tài)分布 負(左)偏態(tài)分布4.正態(tài)分布圖形的特點及意義(1) 特點:f(x)關(guān)于x=對稱x=時取得最大值在x=處為拐點,且以 x 軸為水平漸近線f(x)大于0P(x=a)=0 若 f(x) 在點 x 處連續(xù),則F(x)=f(x)(2)意義:=1,f(x)在負無窮到正無窮的積分值為1,即曲線下方面積為1。5. 和2的

8、意義:位置參數(shù),當固定時,增大,曲線沿橫軸向右移動;減小,曲線沿橫軸向左移動。2:形狀參數(shù),當固定時,越大,曲線越矮胖;越小,曲線越高瘦。6.標準化變換 z= xN(,2) zN(0,1) F(x)=()=(z) 即P(Xx)=()=P(Zz) P(axb)=F(b)-F(a)=()-() P()=P( Z )7.標準正態(tài)分布界值 規(guī)定:界值右側(cè)曲線下方面積等于它的下角標。下角標一致,x軸上方中間面積一致。 雙側(cè)界值: P(|z|z)=1- P(zz)= 單側(cè)界值: 上限: 下限: P(zz)= P(zz1-)=1- P(zz)=1- P(zz1-)=8.正常值X圍及意義 概念:醫(yī)學臨床中,常

9、將就診者的某些生理、生化、免疫學指標的測定結(jié)果,與排除了對研 究指標有影響的疾病和有關(guān)因素的大多數(shù)“正常人”的相應數(shù)值進行比較,以就診者 的測定值是否超出了大多數(shù)“正常人”相應指標的波動X圍,作為臨床診斷的重要參 考,又稱醫(yī)學參考值X圍。 意義:95%的參考值X圍含義是指:樣本中有95%的個體測定值在所求X圍之內(nèi)。 以95%的置信區(qū)間來說,意義是:該區(qū)間以95%的概率包含了待估計的參數(shù),這種 估計的可信度是95%,會冒5%的風險。 公式: 雙側(cè)95%的界限值:1.96s 單側(cè)95%的上限值:+1.645s 單側(cè)95%的上限值:-1.645s第4章 總體均數(shù)的估計、假設(shè)檢驗1. 標準誤 (1)概

10、念:每次樣本計算出的不同,這些的標準差稱為均數(shù)的標準誤。 (2)意義:是衡量樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標。 (3)與標準差的區(qū)別:二者都是描述變異程度的指標,標準差描述個體值的變異,標準誤描 述統(tǒng)計量的變異。 (4)均數(shù)標準誤的公式:S=2. 置信區(qū)間 (1)定義:設(shè)為總體的未知參數(shù),若由樣本確定的兩個統(tǒng)計量1(x1、x2、xn)和2(x1、 x2、xn),且12,對于預先給定的值(01),若滿足P(150) z分布 單側(cè): 即 (4)兩要素: 準確度:由1- 決定,1- 越大,準確度越高。 精確度:由區(qū)間長度決定。 99%置信區(qū)間準確度高于95%置信區(qū)間。95%置信區(qū)間精確度更高。3.抽

11、樣分布 (1)t分布定義: 來自正態(tài)總體的一組樣本,和s分別是樣本的均數(shù)和標準差。則t= t分布,自由度 df=n-1,極限分布是標準正態(tài)分布。圖形分布特征: 以0為中心,左右對稱的單峰分布。 自由度越大,越高瘦 界值: 雙側(cè): P(|t|t)=1- P(tt)= 單側(cè): 上限: 下限: P(tt)=1- P(tt)= P(tt1-)=1- (2)2分布定義:若從均數(shù)為,標準差的正態(tài)總體中,每次抽取樣本含量為n的樣本,計算 樣本標準差s,則2=(n-1)s2/2服從自由度df=n-1的2分布。圖形分布特征: 曲線偏向左邊 自由度越小曲線越偏界值: 雙側(cè): P(x2x2)= P(x2)=1- P

12、(x2x2)=1- P(x2x2)= P(x2x21-)=1- P(x2x2)=1- P(x2F)= P(F)=1- P(FF)=1- P(FF)= P(FF1-)=1- P(FF)=1- P(F,則接受 H0,拒絕H1 ;若P時,接受H0,可能犯類錯誤()。此時,雖然未知,但P值越大,犯 類錯誤的概率越小,結(jié)論越可靠。減少(增加)I型錯誤,將會增加(減少)II型錯誤增大n,可以同時降低兩類錯誤。第5章 方差分析1.方差分析基本思想 目的:根據(jù)各個總體的樣本觀測值,檢驗各個總體均值間和兩兩總體均值間是否存在顯著性 差異。 基本思想:根據(jù)離差來源的不同,將總離差平方和分解為兩部分: 由試驗的隨機

13、因素(誤差)引起的組內(nèi)離差, 由因素的作用(即處理水平不同)引起的組間離差。 總離差平方和 = 組內(nèi)離差平方和+ 組間離差平方和(SST = SSE + SSA)2. 方差分析 單因素方差分析、配伍組設(shè)計方差分析、析因設(shè)計方差分析 拉丁方設(shè)計方差分析、正交設(shè)計方差分析 交叉設(shè)計方差分析、組內(nèi)分組設(shè)計方差分析第6章 雙變量相關(guān)與回歸1.散點圖特征 正相關(guān) 完全正相關(guān) 負相關(guān) 完全負相關(guān) 不相關(guān)2.相關(guān)系數(shù)意義及分類 (1)意義:相關(guān)系數(shù)r的大小反映隨機變量X和Y之間線性關(guān)系的密切程度: 若 r=0,則 X 與 Y 不相關(guān); 若 |r|=1,則 X 與 Y 完全相關(guān)。相關(guān)系數(shù)r的符號反映隨機變量X

14、和Y之間線性關(guān)系的相關(guān)方向: 若 0r1,則 X 與 Y 正相關(guān); 若 -1r0,則 X 與 Y 負相關(guān)。 (2)分類:積差相關(guān)系數(shù):雙變量為服從正態(tài)分布的計量資料等級相關(guān)系數(shù):等級或相對數(shù)資料;不服從正態(tài)分布;總體分布類型未知。 (3)適用X圍: 兩個變量必須是隨機變量,即變量的取值在實驗前或測定前是無法預先知道的。3.線性相關(guān)分析和回歸分析的聯(lián)系與區(qū)別 (1)聯(lián)系:r=、分別是x、y的標準差方向一致,r與b方向一致r與b的假設(shè)檢驗等價,即同一樣本存在:tr=tb回歸強度與相關(guān)強度:R2=SS回/SS總=r2 (僅限型回歸) (2)區(qū)別:資料 相關(guān):x,y必須是隨機變量 回歸: x是確定變量

15、稱型回歸, y必須是隨機變量 x是隨機變量稱型回歸計量單位:r不受單位影響,b受單位影響 意義: 相關(guān)說明相關(guān)關(guān)系,相關(guān)關(guān)系描述變量間關(guān)系的密切程度與方向。 回歸說明依存關(guān)系,回歸方程描述變量間的數(shù)量依存關(guān)系。取值X圍:|r|1,bR把觀測點 (xi, yi) 標在直角坐標系下作成散點圖,則必存在著一條直線,使每個點 (xi, yi) 距這條直線在縱方向上的距離的平方和為最小,此平方和稱為殘差平方和,這就是最小二乘法。4.最小二乘法5.決定系數(shù)的意義 R2=SS回/SS總=(SS總-SS剩)/SS總=(1-SS剩)/SS總 0 R2 1,R2越接近于1,表示回歸平方和在總平方和中所占的比重越大

16、,回歸效果越好。第7章 兩分類資料的統(tǒng)計描述與推斷1.相對數(shù)指標 兩個有聯(lián)系的指標之比。常用的有率和比(構(gòu)成比、相對比)。 (1)率:頻率,說明某現(xiàn)象發(fā)生的頻率和強度??傮w率:,樣本率:p 。 (2)構(gòu)成比說明某事物內(nèi)部各組成部分在總體中所占的比重或分布。 (3)相對比:兩個有關(guān)指標A、B之比,說明兩者的對比水平,A是B的若干倍或百分之幾。 對比的數(shù)值可以是絕對數(shù)、相對數(shù)或平均數(shù)。第8章 RC表資料的分析1. 列聯(lián)表分類及統(tǒng)計方法 (1)雙向無序:多個樣本率或構(gòu)成比比較2檢驗 (2)單向有序: 分組變量有序2檢驗(同雙向無序) 結(jié)果變量有序秩和檢驗或Ridit分析 (3)雙向有序: 屬性相同M

17、emar、Kappa檢驗 屬性不同秩相關(guān)分析、線性趨勢檢驗、秩和檢驗或Ridit分析2. 列聯(lián)表注意事項(1)RC表中不宜有20%以上的格子的T5,不能有T,接受H0,服從正態(tài);sig,接受H1,不服從正態(tài)。2. 方差齊性檢驗 (1)目的:利用樣本信息推斷總體方差是否相等 (2)前提:正態(tài)分布 (3)過程:建立假設(shè):假設(shè)H0:=即方差齊;H1:。計算統(tǒng)計量:= df1=n1-1 df2=n2-1P值:F,接受H0FF(df1,df2)則P,接受H0,滿足方差齊性;sig,接受H1,不滿足方差齊性。3. 單樣本t檢驗 (1)目的:推斷一組樣本代表的總體均數(shù)與已知總體均數(shù)間的差異。 (2)前提:單

18、組設(shè)計計量資料(非分類)資料服從正態(tài)分布 (3)過程:建立假設(shè):假設(shè)H0:=0 ;H1:0。計算統(tǒng)計量:或t= P值:z,接受H0zzdf1,則P,接受H0,差異無統(tǒng)計學意義;sig,接受H1,差異有統(tǒng)計學意義。4. 配對t檢驗 (1)目的:推斷兩組樣本代表的總體均數(shù)的差值是否為零。 (2)前提:配對設(shè)計計量資料(非分類)差值服從正態(tài)分布 (3)過程:建立假設(shè):假設(shè)H0:d=0;H1:d0。計算統(tǒng)計量:t= df=n-1 P值:t,接受H0 ,ttdf1,則P,拒絕H0 t,接受H0 ,tdf1,則P,接受H0,差異無統(tǒng)計學意義;sig2,12)。計算統(tǒng)計量:t或t(方差不齊)df=n1+n2

19、-2P值:t,接受H0 ,tt(df1,df2),則P,拒絕H0 t,接受H0 ,t(df1,df2),則P,接受H0,差異無統(tǒng)計學意義;sig,接受H0 ,P,接受H0,差異無統(tǒng)計學意義;sigF(k-1,N-k), P組內(nèi)SSEN-kMSE=SSE/(N-k)總和SSTN-1(5)注意:組內(nèi)變異:隨機誤差 組間變異:隨機誤差+處理因素 若H0成立:組內(nèi)變異組間變異 若H1成立:組內(nèi)變異 ,接受H0 ,P,接受H0,差異無統(tǒng)計學意義;sig,接受H0 ,P,接受H0,差異無統(tǒng)計學意義;sigr時,P,拒絕H0 ,認為有直線相關(guān)關(guān)系。 當|r|,接受H0 ,認為沒有直線相關(guān)關(guān)系。根據(jù)r,df=

20、n-2檢驗是否為0 假設(shè)H0:總體相關(guān)系數(shù)=0,即無關(guān)系;H1:總體相關(guān)系數(shù)0,即有關(guān)系。結(jié)合專業(yè)知識評價相關(guān)分析是否有價值 P值:P,接受H0 ,P,拒絕H0 ,P,接受H0,無直線相關(guān)關(guān)系;sig,接受H1,有直線相關(guān)關(guān)系。10. 線性回歸分析(1)目的:就是尋找出具有相關(guān)關(guān)系變量之間的函數(shù)關(guān)系,并進行統(tǒng)計推斷。 (2)前提:y必須是隨機變量 (3)過程:計算反映兩個變量依賴關(guān)系的直線回歸方程,即計算方程的截距a,斜率b。 意義:x每增加1,y增加a+bx 根據(jù)截距a,斜率b,檢驗樣本所抽自的總體截距是否為0,總體斜率是否為0。 做法1:直接查相關(guān)系數(shù)的臨界值表 做法2:費舍爾t檢驗法: df=n-2 做法3:F檢驗 假設(shè)H0:=0,即無回歸關(guān)系;H1:0,即有回歸關(guān)系。 F= df=n-1 結(jié)合專業(yè)知識,評價此直線回歸方程是否有實用價值。 F,接受H0,無回歸關(guān)系FFdf,則P,接受H0,無直線回歸關(guān)系;sig,接受H1,有直線回歸關(guān)系。11. 列聯(lián)表2檢驗 (1)目的:推斷兩個或多個總體率或構(gòu)成比之間的差異;分析行列兩種屬性或兩個變量之間有無關(guān)聯(lián)性(相關(guān)分析);頻數(shù)分布的擬合優(yōu)度檢驗。 (2)前提:小樣本,非二項分布 (3)過程:建立假設(shè):H0:總體率或構(gòu)成比無顯著性差異(行列變量獨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論