




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、醫(yī)學統(tǒng)計學重點第一章緒論1.基本概念:總體:根據(jù)研究目的確定的性質相同或相近的研究對象的某個變量值的全體。樣本:從總體中隨機抽取部分個體的某個變量值的集合??傮w參數(shù):刻畫總體特征的指標,簡稱參數(shù)。是固定不變的常數(shù),一般未知。統(tǒng)計量:刻畫樣本特征的指標,由樣本觀察值計算得到,不包含任何未知參數(shù)。抽樣誤差:由隨機抽樣造成的樣本統(tǒng)計量與相應的總體參數(shù)之間的差異。頻率:若事件A在n次獨立重復試驗中發(fā)生了m次,則稱m為頻數(shù)。稱m/n為事件A在n次試驗中出現(xiàn)的頻率或相對頻率。概率:頻率所穩(wěn)定的常數(shù)稱為概率。統(tǒng)計描述:選用合適統(tǒng)計指標(樣本統(tǒng)計量)、統(tǒng)計圖、統(tǒng)計表對數(shù)據(jù)的數(shù)量特征及其分布規(guī)律進行刻畫和描述。
2、統(tǒng)計推斷:包括參數(shù)估計和假設檢當用樣本統(tǒng)計指標(統(tǒng)計量)來推斷總體相應指標(參數(shù)),稱為參數(shù)估計。用樣本差別或樣本與總體差別推斷總體之間是否可能存在差別,稱為假設檢驗。2 .樣本特點:足夠的樣本含量、可靠性、代表性。3 .資料類型:(1)定量資料:又稱計量資料、數(shù)值變量或尺度資料。是對觀察對象測量指標的數(shù)值大小所得的資料,觀察指標是定量的,表現(xiàn)為數(shù)值大小。每個個體都能觀察到一個觀察指標的數(shù)值,有度量衡單位。(2)分類資料:包括無序分類資料(計數(shù)資料)和有序分類資料(等級資料)計數(shù)資料:是將觀察單位按某種屬性或類別分組,清點各組觀察單位的個數(shù)(頻數(shù)),由各分組標志及其頻數(shù)構成。包括二分類資料和多
3、分類資料。二分類:將觀察對象按兩種對立的屬性分類,兩類間相互對立,互不相容。多分類:將觀察對象按多種互斥的屬性分類等級資料:將觀察單位按某種屬性的不同程度、檔次或等級順序分組,清點各組觀察單位的個數(shù)所得的資料。4 .統(tǒng)計工作基本步驟:統(tǒng)計設計、資料收集、資料整理、統(tǒng)計分析第二章實驗研究的三要素1.實驗設計三要素:被試因素、受試對象、實驗效應2 .誤差分類:隨機誤差(抽樣誤差、隨機測量誤差)、系統(tǒng)誤差、過失誤差。3 .實驗設計的三個基本原則:對照原則、隨機化分組原則、重復原則。4 .實驗設計方法有/析因設計正交試驗設計均勻試驗設計交互作用/兩組:異體配對設計一同體配對設計一交叉設計無,隨機同期對
4、照實驗設計J(單因素兩水平)擴展多組:單因素多水平*配伍組設計一拉丁方設計(兩因素多水平) (三因素多水平)配伍組設計:也稱隨機區(qū)組設計,將條件相近的受試對象配伍,每個配伍組中的對象隨機分配到各處理組中。析因設計:考察兩個或兩個以上的處理因素,將各個因素的水平進行全面組合,每個組合下至少有兩個以上的觀察對象重復測量。一般來講,應盡可能安排等重復試驗,以簡化計算,2-3個水平數(shù)。優(yōu)點是全面性和均衡性較好,可同時分析處理因素的效應及因素間的交互作用。拉丁方設計:用于三因素等水平無交互。第三章定量資料的統(tǒng)計描述、參考值范圍1.頻數(shù)表編制過程(了解)(1)找出樣本數(shù)據(jù)的最大值和最小值,計算極差R;(2
5、)分組:確定分組的組距d和組數(shù)k;一般n100,10-15組(3)求頻率密度:統(tǒng)計頻數(shù),算出頻率、頻率密度和累積頻率;(4)畫出直方圖。2 .頻數(shù)表和直方圖的作用:用于觀察個數(shù)較多資料的統(tǒng)計描述,可以直觀提示資料的分布特征和分布類型。對稱分布正(右)偏態(tài)分布負(左)偏態(tài)分布3 .集中趨勢、離散趨勢的指標及適用范圍(1)集中趨勢:X,GMR,M算術均數(shù):適用于對稱分布;不適用于偏態(tài)分布和資料中出現(xiàn)極值的資料。幾何均數(shù):適用于呈倍數(shù)關系的資料或對數(shù)正態(tài)分布的資料,尤其是正偏態(tài)分布不適用與觀察值中有0或正負數(shù)值同時出現(xiàn)的資料。中位數(shù):適用于大樣本偏態(tài)分布或分布情況不明的資料或資料中有不確定數(shù)值的資料
6、。百分位數(shù)的作用:多個百分位數(shù)結合使用,全面描述數(shù)據(jù)分布的特征用于確定醫(yī)學參考值范圍(偏態(tài)或分布不明的資料)眾數(shù):適用于大樣本,較粗糙。(2)離散趨勢:極差:優(yōu)點:簡單明了、容易使用。缺點:只反映最大值和最小值間的差異,不能反映其他觀察值的變異程度。樣本容量越大,極差可能越大。極差的抽樣誤差大,不穩(wěn)定。四分位數(shù)間距:適用于確定醫(yī)學參考值范圍,與中位數(shù)一起描述偏態(tài)分布資料變異程度缺點:類似于極差,利用度低。方差與標準差:與均數(shù)一起描述對稱分布,特別是正態(tài)分布的分布特征。變異系數(shù):適用于:適用于比較度量衡單位不同資料的變異度。比較均數(shù)相差懸殊的資料的變異度衡量實驗精密度和穩(wěn)定性的常用指標。(3)頻
7、數(shù)分布特征高峰在中間,左右大致對稱,稱為對稱分布。平均數(shù)=中位數(shù)=眾數(shù)高峰偏向小值的一側(左側),稱正偏態(tài)分布(亦稱右偏態(tài))。平均數(shù)中位數(shù)眾數(shù)高峰偏向大值的一側(左側),稱負偏態(tài)分布(亦稱左偏態(tài))。平均數(shù)中位數(shù)眾數(shù)4 .正態(tài)分布圖形的特點及意義(1)特點:f(x)關于x=p對稱乂二小時取得最大值在x=Nb處為拐點,且以x軸為水平漸近線f(x)大于0P(x=a)=0若f(x)在點x處連續(xù),則F(x)=f(x)(2)意義:f(x)=1,f(x)在負無窮到正無窮的積分值為1,即曲線下方面積為1。5 .W和(T2的意義?。何恢脜?shù),當固定時,N增大,曲線沿橫軸向右移動;N減小,曲線沿橫軸向左移動一:形
8、狀參數(shù),當以固定時,越大,曲線越矮胖;越小,曲線越高瘦。6 .標準化變換z=x_-xN(p,er2)zN(0,1)(TF(x)=(x一-)=c(z)gpP(X(-一-)=RZz)(T(T_工b工a(i,aLtx-LibaaLLbLLP(axb)=F(b)-F(a)=C(-)-C(-)R-)=P(Z)(T(T(T(T(T(T(T7 .標準正態(tài)分布界值規(guī)定:界值右側曲線下方面積等于它的下角標。下角標一致,雙側界值:P(|z|z_a)=a單側界值:上限:P(zz)=aP(zz)=1-a8 .正常值范圍及意義概念:醫(yī)學臨床中,常將就診者的某些生理、生化、免疫學指標的測定結果,與排除了對研究指標有影響的
9、疾x軸上方中間面積一致億z1-)=1-a(zz1-)=a病和有關因素的大多數(shù)“正常人”的相應數(shù)值進行比較,以就診者的測定值是否超出了大多數(shù)“正常人”相應指標的波動范圍,作為臨床診斷的重要參考,又稱醫(yī)學參考值范圍。意義:95%勺參考值范圍含義是指:樣本中有95%勺個體測定值在所求范圍之內。以95%勺置信區(qū)間來說,意義是:該區(qū)間以95%勺概率包含了待估計的參數(shù),這種估計的可信度是95%會冒5%勺風險。公式:雙側95%勺界限值:x1.96s單側95%勺上限值:x+1.645s單側95%勺上限值:x-1.645s第四章總體均數(shù)的估計、假設檢驗1.標準誤(1)概念:每次樣本計算出的x不同,這些x的標準差
10、稱為均數(shù)的標準誤。(2)意義:是衡量樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標。(3)與標準差的區(qū)別:二者都是描述變異程度的指標,標準差描述個體值的變異,標準誤描述統(tǒng)計量的變異。(4)均數(shù)標準誤的公式:SX=多、n2 .置信區(qū)間(1)定義:設8為總體的未知參數(shù),若由樣本確定的兩個統(tǒng)計量81(x1、X2、xn)和82(x1、X2、xn),且8102,對于預先給定的值a(0a1),若滿足P(。1%)=1-a,則稱隨機區(qū)間(01,%)為8的1-a置信區(qū)間,其中稱為3置信下限,稱為置信上限,1-a稱置信度。r雙側:分布I單側:(T未知:3 .抽樣分布(1)t分布定義:來自正態(tài)總體的一組樣本,x和S分別是樣本的均
11、數(shù)和標準差分布,自由度df=n-1,極限分布是標準正態(tài)分布。圖形分布特征:以0為中心,左右對稱的單峰分布。自由度越大,越高瘦(2)意義:區(qū)間(01,%包含有參數(shù)8的概率為1-a,不能說8在(01,02)的概率為1-例: 可以說(a,b)包含均數(shù)小的概率為95%不能說11在(a,b)的概率為95%(3)公式:單個正態(tài)總體均數(shù)小的區(qū)間估計雙側:t_sx2(4)兩要素:準確度:精確度:小樣本(n50)由1-a決定,由區(qū)間長度決定分布單側:tsx雙側:z_sx2z分布單側:sz.nzsx1-a越大,準確度越高。99%置信區(qū)間準確度高于95%!信區(qū)間。95%!信區(qū)間精確度更高。t=xs/-n定義:若從均
12、數(shù)為-標準差6的正態(tài)總體中,每次抽取樣本含量為n的樣本,計算樣本標準差s,則x2=(n-1)s2/62服從自由度df=n-1的2分布。圖形分布特征:曲線偏向左邊自由度越小曲線越偏界化一2(x2x12)=1-22,2x1、a(xxl)=1-aP(x2xl)=a(3)F分布定義:如果分別從兩個正態(tài)總體N(N1,(T1)和N(N1,(T1)中隨機抽取樣本含量2n1、n2的兩個樣本,算出樣本均數(shù)和方差分別為二,s2和;2,2,則F*-x1s1x2S2/s服從df1=n1-1,df2=n2-1的F分布。2若X1、X2分別服從自由度df1、df2的X2分布,則F=2/df1df1df22/df2界化雙側:
13、P(|t|t_a)=a2單側:上限:P(tt)=a(2)x2分布a(tt士2下限:(tt1)=1-a雙側:P(x2x2+)=22P(x2x)=aP(x2F+)=:Pp(FF)=aP(FF)=11 22l1-a(FF-a)=1-a若Pa,則接受Ho,拒絕Hi;若Pa時,接受H0,可能犯R類錯誤(B)。此時,雖然B未知,但P值越大,犯R類錯誤的概率越小,結論越可靠。減少(增加)I型錯誤,將會增加(減少)II型錯誤增大n,可以同時降低兩類錯誤。第五章方差分析1.方差分析基本思想目的:根據(jù)各個總體的樣本觀測值,檢驗各個總體均值間和兩兩總體均值問是否存在顯著性差異?;舅枷耄焊鶕?jù)離差來源的不同,將總離差
14、平方和分解為兩部分:由試驗的隨機因素(誤差)引起的組內離差,由因素的作用(即處理水平不同)引起的組間離差。總離差平方和=組內離差平方和+組間離差平方和(SS=SSE+SSA)2 .方差分析單因素方差分析、配伍組設計方差分析、析因設計方差分析拉丁方設計方差分析、正交設計方差分析交叉設計方差分析、組內分組設計方差分析第六章雙變量相關與回歸1.散點圖特征正相關完全正相關負相關完全負相關不相關2 .相關系數(shù)意義及分類(1)意義:相關系數(shù)r的大小反映隨機變量X和Y之間線性關系的密切程度:若r=0,則X與Y不相關;若|r|=1,則X與Y完全相關。相關系數(shù)r的符號反映隨機變量X和Y之間線性關系的相關方向:若
15、0r1,則X與Y正相關;若-1r0,則X與Y負相關。(2)分類:積差相關系數(shù):雙變量為服從正態(tài)分布的計量資料等級相關系數(shù):等級或相對數(shù)資料;不服從正態(tài)分布;總體分布類型未知。(3)適用范圍:兩個變量必須是隨機變量,即變量的取值在實驗前或測定前是無法預先知道的3,線性相關分析和回歸分析的聯(lián)系與區(qū)別(1)聯(lián)系:二bJlxx/|xyIxx、|xy分別是x、y的標準差方向一致,r與b方向一致r與b的假設檢驗等價,即同一樣本存在:tr=tb22回歸強度與相關強度:R=SS回百$總=(僅限II型回歸)(2)區(qū)別:資料相關:x,y必須是隨機變量回歸:x是確定變量稱I型回歸,y必須是隨機變量4xI是隨機變量稱
16、II型回歸計量單位:r不受單位影響,b受單位影響意義:相關說明相關關系,相關關系描述變量間關系的密切程度與方向?;貧w說明依存關系,回歸方程描述變量間的數(shù)量依存關系。取值范圍:|r|=(1-SS剩)/SS總0R21,R越接近于1,表示回歸平方和在總平方和中所占的比重越大,回歸效果越好第七章兩分類資料的統(tǒng)計描述與推斷1.相對數(shù)指標兩個有聯(lián)系的指標之比。常用的有率和比(構成比、相對比)。(1)率:頻率,說明某現(xiàn)象發(fā)生的頻率和強度??傮w率:冗,樣本率:p。多某現(xiàn)象實際發(fā)生的例數(shù)一K可能發(fā)生該現(xiàn)象的總例數(shù)(2)構成比說明某事物內部各組成部分在總體中所占的比重或分布。小1”某一組成部分的觀察單位數(shù)構成比一
17、,一、-100%同一事物各組成部分觀祭單位總數(shù)(3)相對比:兩個有關指標A、B之比,說明兩者的對比水平,A是B的若干倍或百分之幾對比的數(shù)值可以是絕對數(shù)、相對數(shù)或平均數(shù)。第八章RXC表資料的分析1.列聯(lián)表分類及統(tǒng)計方法(1)雙向無序:多個樣本率或構成比比較一x2檢驗(2)單向有序:分組變量有序一X2檢驗(同雙向無序)結果變量有序一秩和檢驗或Ridit分析(3)雙向有序:屬性相同一McNemarKappa檢驗屬性不同一秩相關分析、線性趨勢檢驗、秩和檢驗或Ridit分析2 .列聯(lián)表注意事項(1)RXC表中不宜有20犯上的格子的T5,不能有Ta,接受H0,服從正態(tài);siga,接受H,不服從正態(tài)2.方差
18、齊性檢驗(1)目的:利用樣本信息推斷總體方差是否相等(2)前提:正態(tài)分布(3)過程:2222建立假設:假設1=2即方差齊;H:1*2。a222計算統(tǒng)計量:F一2=s2dfi=ni-1df2=n2-1S2/2s2P值:Fa,接受H0FF(df1,df2)則Pa,接受H),滿足方差齊性;siga,接受H,不滿足方差齊性。3.單樣本 t 檢驗(1)目的:推斷一組樣本代表的總體均數(shù)與已知總體均數(shù)間的差異(2)前提:單組設計計量資料(非分類)資料服從正態(tài)分布(3)過程:建立假設:假設H:N=(IO;Hi:(1*(10。a計算統(tǒng)計量:z三或t=/.nP值:za,接受zzdf1,則Pa,接受H),差異無統(tǒng)計
19、學意義;siga,接受Hi,差異有統(tǒng)計學意義檢驗方法s/-n4,配對 t 檢驗(1)目的:推斷兩組樣本代表的總體均數(shù)的差值是否為零。(2)前提:配對設計計量資料(非分類)差值服從正態(tài)分布(3)過程:建立假設:假設H:Nd=0;H:Nd*0。a計算統(tǒng)計量:t=一d-方df=n-1Sd/nP值:ta,接受H0,ttadfi,則Pa,t!絕H0ta,接受H0,tt_dfi,貝UPa,接受H),差異無統(tǒng)計學意義;sig(I2,仙1(!2)o0C計算統(tǒng)計量:t或t(方差不齊)df=n1+n2-2P值:ta,接受代,tt”(df1,df2),則Pa,t!絕H)ta,接受H0,tt_(df1,df2),則P
20、a,接受H),差異無統(tǒng)計學意義;siga,接受H0,Pa,接受H,差異無統(tǒng)計學意義;sigR(k-1,N-k),Pa組內SSEN-kMS=SS/(N-k)總和SSN-1(5)注意:組內變異:隨機誤差組問變異:隨機誤差+處理因素若H成立:組內變異弋組間變異若H成立:組內變異a,接受代,Pa,接受H,差異無統(tǒng)計學意義;siga,接受H0,Pa,接受H,差異無統(tǒng)計學意義;sigr.時,Pa,f1絕H,認為有直線相關關系。當|r|a,接受H,認為沒有直線相關關系。根據(jù)r,df=n-2檢驗p是否為0假設H0:總體相關系數(shù)p=0,即無關系;H:總體相關系數(shù)pw0,即有關系。民結合專業(yè)知識評價相關分析是否有
21、價值P值:Pa,接受代,Pa,f!絕H0,Pa,接受H),無直線相關關系;siga,接受Hi,有直線相關關系10.線性回歸分析(1)目的:就是尋找出具有相關關系變量之間的函數(shù)關系,并進行統(tǒng)計推斷。(2)前提:y必須是隨機變量(3)過程:計算反映兩個變量依賴關系的直線回歸方程,即計算方程的截距a,斜率b?abx意義:x每增加1,y增力口a+bxn_(xix)(yiy)_b?J-Ln=3ybx(xix)2i1根據(jù)截距a,斜率b,檢驗樣本所抽自的總體截距a是否為0,總體斜率B是否為0做法1:直接查相關系數(shù)的臨界值表做法2:費舍爾t檢驗法:trjdf=n-21r2r=df=n-2做法3:F檢驗假設代:
22、戶0,即無回3關系;Hl:BW0,即有回歸關系。aS0/df一df=n-1SS/df剩結合專業(yè)知識,評價此直線回歸方程是否有實用價值。接受H0,無回歸關系拒絕H0,有回歸關系,接受代,無直線回歸關系;siga,接受H,有直線回歸關系。11.列聯(lián)表 X2檢驗(1)目的:推斷兩個或多個總體率或構成比之間的差異;分析行列兩種屬性或兩個變量之間有無關聯(lián)性(相關分析);頻數(shù)分布的擬合優(yōu)度檢驗。(2)前提:小樣本,非二項分布(3)過程:計算最小理論頻數(shù)Tj,并計算Xn40,T1四格表確切概率法(Fisher)2a,接受若x22df則Pa,接受H0,總體率或構成比無顯著性差異;siga建立假設:H0:總體率
23、或構成比無顯著性差異H1:總體率或構成比有顯著性差異(行列變量獨立或無相關性)(行列變量不獨立或有相關性),a般公式:2N(1)nrncicdf=(r-1)x(c-1)四格表公式:(最小理論頻數(shù):T)基本公式:n40且T5(A2T)/T(a2n(adbc)b)(cd)(ac)(bd)校正公式:n40且1&T&5(|A2T|0.5)/Tnn(|adbc|-)(ab)(cd)(ac)(bd)特殊公式:12 .拉丁方設計方差分析三因素、等水平、無交互的設計。拉丁字母一處理因素,行、列一區(qū)組因素、序列因素13 .正交設計方差分析(1)正交性:設A,B分別是兩個n階拉丁方,記為aij,bj(i,j=1,2,n)。若n2個有序對(aij,bj)都是不同的,則稱拉丁方A與B是正交的。(2)特點:均衡性:同一列中各水平的重復次數(shù)相同。正交性:任兩列之間各水平搭配均衡。(3)表頭設計:記號含義:以L9(34)為例:L:表小正交表9:表示行數(shù),即試驗次數(shù)10:表示因素的水平數(shù);11:表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國珠蘭盆景行業(yè)投資前景及策略咨詢研究報告
- DB13T 5154-2019 高速公路高性能混凝土應用技術規(guī)程
- DB13T 2857-2018 軋縱剪用熱連軋低碳鋼帶通 用技術要求
- DB13T 5013-2019 金屬聲屏障通 用技術要求
- 中國足協(xié)e級教練員理論考試試題及答案
- 光伏建筑一體化綠色建材行業(yè)深度調研及發(fā)展項目商業(yè)計劃書
- 支點教師面試題及答案解析
- 懸崖秋千體驗點行業(yè)深度調研及發(fā)展項目商業(yè)計劃書
- 針灸學的考試試題及答案
- 《國學修養(yǎng)》課件魅力女性之職場篇2
- 施工現(xiàn)場視頻監(jiān)控系統(tǒng)施工方案
- (正式版)JTT 1495-2024 公路水運危險性較大工程安全專項施工方案審查規(guī)程
- 《征兵入伍應征公民體格檢查標準條文釋義》
- MOOC 電子技術實習-北京科技大學 中國大學慕課答案
- 切花月季巖棉無土栽培技術
- 2023年教師招考中小學音樂學科專業(yè)知識考試真題及答案
- 中心靜脈深靜脈導管維護操作評分標準
- 2024年-2024五屆華杯賽小高年級組試題及答案
- 傷醫(yī)事件應急預案演練
- XXX手機馬達射頻干擾問題解決分析過程
- 醫(yī)院網(wǎng)絡信息安全培訓
評論
0/150
提交評論