下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、(1)edicine醫(yī)學(xué)統(tǒng)計學(xué)實(shí)用Sistical Methods博士2009.3統(tǒng)計定義是一種對客觀現(xiàn)象數(shù)量方面進(jìn)行的研究活動;是收集、整理、分析、推斷、判斷等認(rèn)識活動的總稱。數(shù)據(jù)匯總僅僅是統(tǒng)計工作的一小部分內(nèi)容。統(tǒng)計三個層次:dollection dataysis data mining MedSci博士工作生活中常見的統(tǒng)計學(xué)問題這個藥物治療高血壓有效嗎?(假設(shè)檢驗(yàn))能活多久? (生存分析)吸煙,喝酒與冠心病有關(guān)嗎? (因子分析)肝硬化與肝癌有關(guān)嗎? (相關(guān)分析)為什么象父母,其強(qiáng)度有多大?(相關(guān)與回歸)類分析)的海量數(shù)據(jù)如何歸類總結(jié)?(聚臨床不同的化療方案,對不同的分期腫瘤的效果統(tǒng)計(方
2、差分析)統(tǒng)計學(xué)是對令人困惑費(fèi)解的數(shù)字問題做出設(shè)想的藝術(shù)。醫(yī)學(xué)中的統(tǒng)計學(xué)問題60年代到80年代,國外醫(yī)學(xué)雜志結(jié)果:有20%72%。統(tǒng)計錯誤的1996年對4586篇統(tǒng)計(中華醫(yī)學(xué)會系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。2001年中華預(yù)防醫(yī)學(xué)雜志:中華醫(yī)學(xué)會系列雜志誤用約54%(1995篇)。統(tǒng)計數(shù)據(jù)科學(xué)道德1976年New Science 雜志關(guān)于科研舞弊行為的(1)74%的表反映有不正當(dāng)修改數(shù)據(jù)的情況(2)17%拼湊實(shí)驗(yàn)結(jié)果(3)7%憑空捏造數(shù)據(jù)(4)2%故意曲解結(jié)果A Warning!istical methods cannot rescue garbage dataFancy
3、sFancy sistical methods can help you gain insight oyour data, over and above what seems obvious on its faceYou should always worry about whether the sledresults are represenive of the population, and whetheryour sle allows you to make inferen aboutthe population.統(tǒng)計學(xué)是現(xiàn)代醫(yī)學(xué)的一個重要支柱醫(yī)學(xué)會雜志(JAMA)主編統(tǒng)計學(xué)是挖掘數(shù)據(jù)背
4、后的真理統(tǒng)計學(xué)基礎(chǔ)概念統(tǒng)計資料的類型有三種類型的資料:計量資料,計數(shù)資料,等級資料基本概念:變量及變量值,研究者對每個觀察的某項特征進(jìn)行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。按變量值的性質(zhì)可將資料分為定量資料和定性資料。1. 計量資料定義:通過度量衡的方法,測量每一個觀察的某項研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):有度量衡多為連續(xù)性資料(通過測量得到)如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、 紅細(xì)胞計數(shù)(10/L)2. 計數(shù)資料定義:將全體觀測按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個數(shù)。特點(diǎn):沒有度量衡
5、多為間斷性資料(通過枚舉或記數(shù)得來)如膚色(黑、白)、血型(ABO)、職業(yè)(工農(nóng)兵)、(男女)3. 等級資料定義: 介于計量資料和計數(shù)資料之間的一種資料,通過半定量方法測量得到。特點(diǎn):每一個觀察沒有確切值各組之間有性質(zhì)上的差別或程度上的不同。分期:I、II、III。藥物療效:治愈、好轉(zhuǎn)、無效、尿蛋白: ,+,+及以上。(三)資料的轉(zhuǎn)化(變量類型的轉(zhuǎn)化)數(shù)值變量等級資料積分制計量資料等級資料例如:測得5人的WBC(個/m3)數(shù)如下:3000過低6000正常5000正常8000正常12000異常數(shù)值變量等級變量若按正常3人,異常2人分組二分類變量若按過低1人,正常3人,過高1人分組等級資料觀察ob
6、servations變量variablesUnits;elementsindividuals身高住體院重天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局2025655 27165 71.55無中學(xué)順產(chǎn)足月2025653 22160 74.05無小學(xué)助產(chǎn)足月2025830 25158 68.06管理員大學(xué)順產(chǎn)足月2022543 23161 69.05無中學(xué)剖宮產(chǎn)足月2022466 25159 62.011商業(yè)中學(xué)剖宮產(chǎn)足月2024535 27157 68.02無小學(xué)順產(chǎn)早產(chǎn)2025834 20158 66.04無中學(xué)助產(chǎn)早產(chǎn)2019464 24158 70.53無中學(xué)助產(chǎn)足月2025783 29154 57.0
7、7中學(xué)剖宮產(chǎn)足月ive計量資料dataQualiivedata計數(shù)資料統(tǒng)計學(xué)中的幾個基本概念1、齊性與變異2、總體與樣本3、參數(shù)與統(tǒng)計量4、誤差(標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)誤)5、頻率1.齊性與變異homogeneity and variation同質(zhì)事物異。間的差2520來源于一些未加控制或無法控制的甚至不明原1510因的。5是統(tǒng)計學(xué)存在的基礎(chǔ),從本質(zhì)上說,統(tǒng)計學(xué)就是研究變異的科學(xué)。02.63.23.84.45.05.66.2紅細(xì)胞計數(shù)(10/L)120名正常成年男子細(xì)胞計數(shù)直方圖圖 1-1頻率%表11120名正常成年男子紅細(xì)胞計數(shù)值(1012/L)最大值=6.18, 最小值=3.29, 極差=2.89算
8、術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.575.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.1
9、35.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.692.總體與樣本(population and sle)總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體。當(dāng)研究有具體而明確的指標(biāo)時,總體是指該項變量植的全體。樣本:從總體中隨機(jī)抽取的有代表性的一部分。觀察():最
10、基本的研究分為有限總體和無限總體。由于總體的不可能性、巨大性和沒必要。對其中的一部分對象樣本 (總體與樣本的關(guān)系。舉例。)樣本選擇的原則?樣本量(sle size)population and sle總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機(jī)抽取的部分觀察隨機(jī)抽樣 random sling為了保證樣本的可靠性和代表性,需要采用隨機(jī)的抽樣方法(在總體中每個具有相同的機(jī)會被抽到)。但目前幾乎沒有幾個研究是完全按照標(biāo)準(zhǔn)的隨機(jī)方法進(jìn)行的!3. 參數(shù)與統(tǒng)計量parameter and sistic參數(shù):總體的統(tǒng)計指標(biāo),抽取部分觀察如總體均數(shù),采用希臘字母記
11、為。固定的常數(shù)總體樣本?X推斷inference統(tǒng)計量:樣本的統(tǒng)計指標(biāo),如樣本均數(shù),采用拉丁字母分X別記為。統(tǒng)計量是參數(shù)附近波動的隨量 。4. 誤差誤差:統(tǒng)計上所說的誤差泛指測量值與真值之差,樣本指標(biāo)與總體指標(biāo)之差。主要有以下二種:系統(tǒng)誤差和隨機(jī)誤差(隨機(jī)測量誤差,抽樣誤差)。(1)系統(tǒng)誤差:指數(shù)據(jù)搜集和測量過程中由于儀器確、標(biāo)準(zhǔn)不規(guī)范等原因,造成觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱為系統(tǒng)誤差。特點(diǎn):具有累加性(2).隨機(jī)誤差:由于一些為的偶然使得結(jié)果或大或小,是不確定、不可預(yù)知的。特點(diǎn):隨測量次數(shù)增加而減小。5. 概率probability確定性現(xiàn)象:在一定條件下,一定會發(fā)生或一定不會發(fā)
12、生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。隨機(jī)現(xiàn)象:在同樣條件下可能會出現(xiàn)兩種或多種結(jié)果,究竟會發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機(jī)事件。隨機(jī)事件的特征:隨機(jī)性;規(guī)律性:每次發(fā)生的可能性的大小是確定的。概率:描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值,用大寫的P表示;取值0,1。統(tǒng)計學(xué)常用的方法Terminologyssistical descriptionistical inference統(tǒng)計描述統(tǒng)計推斷參數(shù)估計頻數(shù)分布頻數(shù)表算術(shù)平均值標(biāo)準(zhǔn)差方差極差,全距,范圍幾何平均值中位數(shù) 正態(tài)分布參考值范parameter estimationF
13、requency distribution frequency table arithmetic Mean, average standard deviation variancerange geometric mean mediannormal distribution reference range圍一些常用看到的統(tǒng)計方法率u檢驗(yàn),2 ,確切概率u, 2,確切概率似然比2, 確切概率比(分布) 2均數(shù)u檢驗(yàn),t檢驗(yàn)u檢驗(yàn),t檢驗(yàn) 方差分析,兩兩比較等級Wilcoxon , u Wilcoxon, uKruskalWallis, 2方差F檢驗(yàn): FBartlet方差齊性第一節(jié)數(shù)值型變量資料的
14、統(tǒng)計描述(也稱 參數(shù)統(tǒng)計)YesNoMann Kolm (-Whitney U or ogorov-Smirnov Z-Parametric Method)Two In S(Paramdependent les t-testetric Method)Data is Normally DistributedDescription計資例.1某醫(yī)師測得如下血紅蛋白值(g%),試作基本的描述性統(tǒng)計分析:對象編號血紅蛋白值對象編號血紅蛋白值234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男18161817161816181817181816171712.
15、8315.5012.2510.0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.032122232425262728293031323334353637383940女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35激活數(shù)據(jù)管理窗口,定義變量名:
16、為sex,為age,血紅蛋白值為hb。按順序輸入數(shù)據(jù)(sex變量中,男為1,女為2),結(jié)果見下圖。激活菜單選pare Means中的Means.框(如圖5.2示)。今欲分性項,彈出Means別同時分求血紅蛋白值的均數(shù)和標(biāo)準(zhǔn)差Tests of Normality*. This is a lower bound of the true significance.a. Lilfors Significance CorrectionKolmogorov-SmirnovaShapiro-WilkSisticdfSig.SisticdfSig.bwt.043189.200*.992189.440Plots
17、ExploreDescriptive SisticsyzeSPSSQ: Compare the BW betn smoker and-smoker*. This is a lower bound of the true significance.a. Lilfors Significance CorrectionFor n 50Tests of NormalityFor n = 80 isitiveTest Sisticsaa. GrouVariable: ANA = 80 isitiveTBIITRABMann-Whitney U Wilcoxon WZAsymp. Sig. (2-tail
18、ed)1845.5002973.500-1.500.134parametric Two Sles TestGroup Sistics(25.482 / 93) 2.64Std. Error ANA = 80 isitiveNMeanStd. DeviationMeanTBIITRAB.009348.6625.482.641.004742.4619.042.78Independent Sles TestTwo Independent sles t-testLevenes Test for Equality of Variant-test for Equality of MeansFSig.tdf
19、Sig. (2-tailed)Mean DifferenceStd. Error Difference95%erval of the DifferenceLowerUpperTBIITRABEqual varianamedEqual variannot amed6.826.0101.472138.1436.206.204.213.83-2.13-1.3914.5313.791.617118.447.109先看F, 後看 t第三節(jié) Paired-Sles T Test過程配對資料包括:同對(重、病況等非處理、體相同或相似者)或同一研究對象分別給予兩種不同處理的效果比較,以及同一研究對象處理前后的
20、效果比較。前者推斷兩種效果有無差別,后者推斷某種處理是否有效某研究飼料中缺乏維生素E與肝中維生素A含量的關(guān)系,將大白鼠按、體重等配為8對,每對中兩只大白鼠分別喂給正常飼料和維生素E缺乏飼料,一段時期后將之宰殺,測定其肝中維生素A含量(mol/L)如下,問飼料中缺乏維生素E對鼠肝中維生素A含量有無影響?大白鼠對別肝中維生素A含量(mol/L)正常飼料組維生素E缺乏飼料組137.225.7220.925.1331.418.8441.433.5539.834.0639.328.3736.126.2831.918.3ay ANOVA過程第四節(jié)多組間的均數(shù)比較問兩制劑是否有效?對照組甲制劑組乙制劑組27
21、9334303338298129174110210285117實(shí)際觀察值定義為x,組別用變量range表示:其中對照組的值為、甲制劑實(shí)驗(yàn)組的值為、乙制劑實(shí)驗(yàn)組的值為,輸入后的結(jié)果如圖菜單選Compare Means中的ay ANOVA.項,彈出ay框(如圖5.8示)。從框左側(cè)的變量列表中選x,點(diǎn)擊ANOVA之進(jìn)入Dependent List框,選range 點(diǎn)擊之進(jìn)入Factor框,點(diǎn)擊Define Range鈕打開框,因本ay ANOVA: Define Range例為3組比較,故在Minimum處輸入1,在um處輸入3,點(diǎn)擊Continue鈕返回框。如果欲作多個樣本均數(shù)間ay ANOVA兩
22、兩比較,可點(diǎn)擊該點(diǎn)擊框的t Hoc.鈕打開ay ANOVA:框(如圖5.9所示),這時可見在t Hoc Multiple Comparisons Tests框中有7種比較方法供選擇:SPSS中的數(shù)據(jù)輸入以及統(tǒng)計處理的過程SPSS中t Hoc統(tǒng)計的選擇示意圖t Hoc Multiple ComparisonsLeastsignificant difference (LSD):最小顯著差法??芍付?01之間任何顯著性水平,默認(rèn)值為0.05; Bonferroni:Bonferroni修正差別檢驗(yàn)法??芍付?1之間任何顯著性水平,默認(rèn)值為0.05;Duncans multiple range tes
23、t:Duncan多范圍檢驗(yàn)。只能指定為0.05或0.01或0.1,默認(rèn)值為0.05;Keuls:StudentKeuls檢驗(yàn),簡Student稱NK檢驗(yàn),亦即q檢驗(yàn)。只能為0.05;Tukeys honestly significant difference:Tukey顯著性檢驗(yàn)。只能為0.05;Tukeys b:Tukey另一種顯著性檢驗(yàn)。只能為0.05; Scheffe:Scheffe差別檢驗(yàn)法ANOVAbwtSum of SquaresdfMean SquareFSig.Betn Groups5078209.2782 2539104.6394.979.008Within Groups94
24、843977.939186509913.860Total99922187.217188先F檢驗(yàn), P=0.008Regres=Curve estimation(歲)錫克試驗(yàn)率(%)XY123456757.176.090.993.096.795.696.2SPSS中曲線擬合方程選項擬合曲線結(jié)果SPSS可以任意選擇各種曲線擬合的形式,然后可以根據(jù)擬合的R值(越接近1,表明擬合越一致),然后再選擇合適的方程,這樣更佳。Binary Logistic過程所謂Logistic回歸,是指應(yīng)變量為二級計分或二類評定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:評定)的概率跟與否(即生、死二類自身生理狀況和所患疾病
25、的嚴(yán)重程度有關(guān);對某種疾病的易感性的概率(患病、不患病二類評定)與個體、免疫水有關(guān)。此類問題的解決均可借助邏輯回歸來完成。某醫(yī)師研究胃癌患者發(fā)生術(shù)后院內(nèi)的影響,資料如下表,請通過Logistic回歸統(tǒng)計方法對主要影響進(jìn)行分析。術(shù)后(有無)Y(歲)X1手術(shù)程度(5等級)X2營養(yǎng)狀態(tài)(3等級)X3術(shù)前預(yù)防性抗菌(有無)X4白細(xì)胞數(shù)(109/L)X5癌腫病理分度(TNM得分總和)X6有有無無無有無有有無無無無無無無無無有有有有無有有無有有有有5.64.49.711.210.47.03.16.67.96.09.18.45.34.612.896455566746865432655854555964364
26、24850激活數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y(字符變量,有輸入Y、無輸入N),為X1,手術(shù)程度為X2,營養(yǎng)狀態(tài)為X3,術(shù)前預(yù)防性抗菌為X4(字符變量,有輸入Y、無輸入N),白細(xì)胞數(shù)為X5,癌腫病理分度為X6。按要求輸入原始數(shù)據(jù)。菜單選Regres中的Logistic.項,彈出Logistic Regres框(如圖8.8示)。從框左側(cè)的變量列表中選y,點(diǎn)擊之進(jìn)入Dependent框,選x1、x2、x3、x4、x5和x6,點(diǎn)擊之進(jìn)入Covariates框;點(diǎn)擊Method處的下拉按鈕,系統(tǒng)提供7種方法:Probit過程完成劑量效應(yīng)關(guān)系的分析。通過概率使劑量效應(yīng)的S型曲線關(guān)系轉(zhuǎn)化成直線,從而
27、利用回歸方程推算各效應(yīng)水平的相應(yīng)劑量值??汞懰幁h(huán)氯胍對小白鼠的毒性,試驗(yàn)結(jié)果如下表所示。試計算環(huán)氯胍的半數(shù)致死劑量。定義變量名:劑量為DOSE、試驗(yàn)動物數(shù)為OBSERVE、DEATH。然后輸入原始數(shù)據(jù)動物數(shù)為劑量(mg/kg)動物數(shù)數(shù)菜單選Regres中的Probit.項,彈出Probit框(如圖8.9示)。從框左側(cè)的變ysis量列表中選death,點(diǎn)擊之進(jìn)入ResponseFrequency框;選observe,點(diǎn)擊之進(jìn)入TotalObserved框;選dose,點(diǎn)擊之進(jìn)入Covariate(s)框,并下拉Transform菜單,選Log base10項(即要求對劑量進(jìn)行以10為底的對數(shù)轉(zhuǎn)換
28、)。系統(tǒng)在M欄中提供兩種模型,一是概率模型(Probit),另一是比數(shù)比自然對數(shù)模型(Logit)。本例選用概率模型。系統(tǒng)輸出以劑量對數(shù)值為自變量X、以概率為應(yīng)變量Y的回歸直線散點(diǎn)圖,從圖中各點(diǎn)的分布狀態(tài)亦可看出,回歸直線的擬合程度是很好的。linear過程表中4080歲各選取某地某年組的人數(shù)資料如下表,請就該資料試擬合Gompertz曲線(Y = b1b2(b3X))。組(歲)簡化值(X)人數(shù)(Y)404550556065707580012345678812777925876532728506756859911508003932528074相關(guān)與回歸的區(qū)別意義 :相關(guān)反映兩變量的相互關(guān)系,即
29、在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關(guān)系。回歸是反映兩個變量的依存關(guān)系,一個變量的改變會引起另一個變量的變化,是一種單向的關(guān)系。應(yīng)用:研究兩個變量的相互關(guān)系用相關(guān)分析。研究兩個變量的依存關(guān)系用回歸分析。研究性質(zhì):相關(guān)是對兩個變量之間的關(guān)系進(jìn)行描述,看兩個變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是正相關(guān)還是負(fù)相關(guān)?;貧w是對兩個變量做定量描述,研究兩個變量的數(shù)量關(guān)系,已知一個變量值可以出另一個變量值,可以得到定量結(jié)果。4.相關(guān)系數(shù)r與回歸系數(shù)b :r與b的絕對值反映的意義不同。r的絕對值越大,散點(diǎn)圖中的點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對值
30、越大,回歸直線越陡,說明當(dāng)X變化一個時,Y的平均變化就越大。反之也是一樣。相關(guān)與回歸的聯(lián)系關(guān)系:能進(jìn)行回歸分析的變量之間存在相關(guān)關(guān)系。所以,對于兩組新數(shù)據(jù)(兩個變量)可先做散點(diǎn)圖,求出它們的相關(guān)系數(shù),對于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。相關(guān)系數(shù)r與回歸系數(shù)b :r與b的符號一致。r為正時,b也為正,表示兩變量是正相關(guān),是同向變化。r為負(fù)時,b也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化。r與b的假設(shè)檢驗(yàn)結(jié)果一致,可用r的顯著檢驗(yàn)代替 b的顯著性檢驗(yàn)。第節(jié)生存分析 Survivalysis生存分析在臨床醫(yī)學(xué)中, 對治療效果的考查. 一方面可以看治療結(jié)局的好壞,另一方面還可以通過治療時間
31、的長短來衡量。例如某手術(shù)后的存活時間,某種疾病治愈的時間等,把這類與時間有關(guān)的資料統(tǒng)稱為生存資料。生存分析(survivalysis)是將事件的結(jié)果(終點(diǎn)事件,縱坐標(biāo))和出現(xiàn)這一結(jié)果所經(jīng)歷的時間(橫坐標(biāo))結(jié)合起來分析的一種統(tǒng)計分析方法。生存分析不同于其它多分析的主要區(qū)別點(diǎn)就是生存分析考慮了每個觀測出現(xiàn)某一結(jié)局的時間長短。生存分析基本概念一、生存時間( survival time,failure time )終點(diǎn)事件與起始事件之間的時間間隔。終點(diǎn)事件指研究者所關(guān)心的特定結(jié)局。起始事件是反映研究對象生存過程的起始特征的事件。生存時間舉例起始事件服藥手術(shù)切除染毒化療緩解終點(diǎn)事件痊愈緩解復(fù)發(fā)時間序列生
32、存時間的類型1. 完全數(shù)據(jù)(complete data)從起點(diǎn)至的時間。(死于所研究疾?。┧?jīng)歷2. 截尾數(shù)據(jù)(刪失數(shù)據(jù),censored data)從起點(diǎn)至截尾點(diǎn)所經(jīng)歷的時間。截尾原因:失訪、死于其它疾病、觀察結(jié)束時活等。例如,某腫瘤醫(yī)院了19911995經(jīng)手術(shù)治療的大癌患者150例,對可能影響大癌術(shù)后生存時間的進(jìn)行了,如、組學(xué)分類、腫瘤大小、DureS分期等。隨日期為2000年1230日,隨見下表。 手術(shù)日期1991.05.201992.01.121991.10.241994.11.021994.06.251993.12.05隨日期隨結(jié)生存時間()男男女男女女123456455036525
33、6601995.06.041998.08.251994.03.182000.12.301995.03.171996.08.1614762417876+2250+265985+存活死于其它生存時間生存時間的度量可以是年、日、小時等。常用符號t表示,數(shù)據(jù)在其上標(biāo)記“+”。生存資料的主要特點(diǎn):含有數(shù)據(jù)。數(shù)據(jù)的特點(diǎn):真實(shí)的生存時間未知,只知道比觀察到的生存時間要。生存時間的分布一不呈正態(tài)分布。條件生存概率、生存率、生存曲線條件生存概率:(conditional probability of survival)表示某時段開始時存活的,到該時段結(jié)時存活的可能性。年條件生存概率表示年初性。存活1年的可能p
34、活一年例數(shù)年初觀察例數(shù)生存率:(survival rate, survival function )指觀察對象經(jīng)t個時段后存活的可能性。活3年例數(shù)3年生存率期初觀察例數(shù)活5年例數(shù)5年生存率期初觀察例數(shù)生存曲線(survival curve)以觀察(隨訪)時間為橫軸,以生存率為縱軸,將各個時間點(diǎn)所對應(yīng)的生存率連接在一起的曲線圖。生存曲線是一條下降的曲線,分析時應(yīng)注意曲線的高度和下降的坡度。平緩的生存曲線表示高生存率或較長生存期,陡峭的生存曲線表示低生存率或較短生存期。生存曲線示例某醫(yī)師收集20例腦瘤患者甲、乙兩療療的生存時間(周)如下:甲療法組乙療法組1 3 3 7101315 1523 302
35、330+30387+42 45+51342Survival Functions1.0.8.6組別.4乙療法組乙療法組-censored甲療法線框甲療法組-censored.2圖1表主0.050010203040生存時間(周)Cum SurvivalSPSS中生存分析操作表法( Life Tables)在SPSS中作案例作某臨床試驗(yàn)對20名第或第期黑色素瘤患者進(jìn)行隨研究,至研究期結(jié),的生存資料見表1。試計算100生存率。注:數(shù)據(jù)后跟符號“+”表示該數(shù)據(jù)為數(shù)據(jù)。12.8 15.6 24.0+ 26.4 29.2 30.8+ 39.2 42.0 58.4+ 72.0+77.2 82.4 87.2+
36、94.4+ 97.2+ 106.0+ 114.8+ 117.2+ 140.0+ 168.0+定義第2層,即分層定義第1層,即分組生存狀態(tài)變量,并定義終結(jié)事件的標(biāo)記值生存時間范圍及組距選入生存時間變量選入變量“Sus”后,【Define Event】鈕被激活變黑,擊該按鈕,彈出定義終結(jié)事件標(biāo)記值的框圖2 定義終結(jié)事件標(biāo)記值的框擊Options按鈕,彈出選項框。生存函數(shù)被1減后的曲線有分組比較時出現(xiàn)累積風(fēng)險函數(shù)散點(diǎn)圖密度函數(shù)散點(diǎn)圖對數(shù)累積生存函數(shù)曲線累積生存函數(shù)曲線輸出表,系統(tǒng)默認(rèn)KaplanMeier過程療66例白血病患者的緩解時間()3種療注:數(shù)據(jù)后跟符號“+”表示該數(shù)據(jù)為數(shù)據(jù)。A 療法4,5
37、,9,10,11,12,13,28,28,28,29,31,32,37,41,41,57,62,74,100,139,20+,258+,269,B療法8,10,10,12,14,20,48,70,75,99,103,162,169,195,220,161+,199+,217+,245+C療法8,10,11,23,25,28,28,31,31,40,48,89,124,143,12+,159+,190+,196+,197+,205+,219+Kaplan-Meier法主 Life Tables框yze Survival標(biāo)記分層變量分組變量生存狀態(tài)變量生存時間變量Test Sistics for
38、Equality of Survival Distributions fROUP3種療法的生存時間差異無顯著性意義。進(jìn)一步兩兩比較,同樣沒有顯著性差異!SisticdfSignificanceLog R Breslow Tar4.313.674.352220.11580.15950.1137are過程Cox Regres用以描述多個變量對生存時間的影響。此時可控制一個或幾個,其他對生存時間的影響,及各之間的互作用主編的醫(yī)學(xué)隨統(tǒng)計方法1993,77義)40名肺癌患者的生存資料(見生存時間411126118狀態(tài)生活能評分年齡到研究時間勁癌小細(xì)胞癌癌療法類別.00.001.00變量定義肺癌分類:0,
39、0,0為其它癌;1,0,0為勁注:原數(shù)據(jù)庫是癌;0,1,0為小細(xì)胞癌;0,0,1為。表中的最后一個變量是我加上類別,1為勁癌;2為小細(xì)胞癌;3為變量計算一樣。;4為其它癌。實(shí)表明結(jié)果的與Cox回歸主框Enter: Covariates框內(nèi)的全部變量均進(jìn)入回歸模型選入自變量后,categorical鈕被激活。按categorical鈕,進(jìn)入確定分類變量的框【Plots】選項yze=Survival =Cox regres上表輸出總例數(shù)、刪失例數(shù)、失訪例數(shù)。輸出各種的頻數(shù)及系統(tǒng)所賦的亞變量x81、x82、x83值,當(dāng)類型是鱗癌時,x81取值為1,其它亞變量取值為0,依此類推。輸出各種的累積生存函數(shù)
40、曲線。生存資料統(tǒng)計學(xué)處理方法(一)設(shè)計目的:專業(yè)目的:據(jù)專業(yè)知識確定。統(tǒng)計學(xué)目的:估計:根據(jù)樣本生存資料估計總體生存率及其它有關(guān)指標(biāo)(如中位生存期等),如根據(jù)腦瘤患者治療后的生存時間資料,估計不同時間的生存率、生存曲線以及中位生存期等。比較:對不同處理組生存率進(jìn)行比較,如比較不同療療腦瘤的生存率,以了解哪種治療方案較優(yōu)。影響長短的些分析:目的是為了探索和了解影響生存時間,或平衡某些影響后,研究某個或某對生存率的影響。如為改善腦瘤的預(yù)后,應(yīng)了解影響預(yù)后的主要,包括的、病程、腫瘤分期、治療方案等。:具有不同水平的生存,如根據(jù)腦瘤的、病程、腫瘤分期、治療方案等該t年(月)生存率。方法:前性隊列研究回
41、乒性隊列研究確定起始事件、點(diǎn)事件、隨日期、生存時間、。確定可能的影響、水平以及量化方法。大癌影響量化表變量名X1量化值女=0男=140=1 4060=260=3病例數(shù)3234103719比(%)48.551.515.156.128.8(歲)X2X3組學(xué)分類狀=0=12046293730.369.743.956.1X4腫瘤大?。╟m)?6=06=1細(xì)胞增抗原(PCNA)0,RR1,說明變量X增加時,率增加,即X是。0,RR50mg” )依賴于特定分布類型,比較的是參數(shù)不受總體參數(shù)的影響,比較分布或分布位置計量資料,呈正態(tài)分布對總體的分布類型不作任何要求參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計原理幾乎一致,適用有別參
42、數(shù)統(tǒng)計非參數(shù)統(tǒng)計頻率分析Frequency方ChiSquare分布情況分析正態(tài)分布統(tǒng)計Runs(程檢驗(yàn))單組平均數(shù)1Sle KS兩組(立)Independent Sles T Test2 Independent Sles(如WilcoxonMannWhitney U 檢驗(yàn))兩組(配對)PairedSles T Test2 Related Sles(如Wilcoxon signed )多組ay ANOVAk Independent Sles (KruskalWallis H檢驗(yàn))多組多變量方差分析General Factorial ANOVAK Related Sles(如Friedman等)C
43、hiSquare過程方檢驗(yàn)適用于配合度檢驗(yàn),主要用于分析實(shí)際頻數(shù)與某理論頻數(shù)是否相符。某地一內(nèi)各日數(shù)的分布如下表,請檢驗(yàn)一內(nèi)各日的性是否相同? 日數(shù)一二三四五六日11191715151619數(shù)據(jù)錄入窗口數(shù)據(jù)框激活Sistics菜單選parametric Tests中的ChiSquare.命令項,彈出框(圖13.3)?,F(xiàn)欲對一周內(nèi)各日的數(shù)進(jìn)行分ChiSquare Test布分析,故在框左側(cè)的變量列表中選day,點(diǎn)擊之進(jìn)入TestVariable List框,點(diǎn)擊OK鈕即可。Binomial過程(二項分布分析)某地某一時期內(nèi)出生40名兒,其中女性12名(定Sex=0),28名(定Sex=1)。問這個地方出生兒的性比例與通常的男女性比例(總體概率為0.5)是否不同?激活Sistics菜單選parametric Tests中的Binomial Test.命令項,彈出Binomial Test框(圖13.4)。在框左側(cè)的變量列表中選sex,點(diǎn)擊之進(jìn)入Test Variable List框,在Test Proportion框中入0.50,再點(diǎn)擊OKRuns(游程檢驗(yàn))過程某村發(fā)生一種地方病,其住戶沿一條河排列,記為“1”,對非發(fā)病的住戶標(biāo)記為“0”,共17戶:時對發(fā)病的住戶標(biāo)0問病戶的分布排列是呈0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年透明銳鈦型光觸媒項目投資價值分析報告
- 2024至2030年縫紉針項目投資價值分析報告
- 2024至2030年文件儲柜項目投資價值分析報告
- 2024年高清晰度監(jiān)視器項目可行性研究報告
- 2024至2030年中國茶黃素數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國連續(xù)型電動執(zhí)行器行業(yè)投資前景及策略咨詢研究報告
- 2024個人工程合同范本
- 2024至2030年中國油鋸配件數(shù)據(jù)監(jiān)測研究報告
- 2024業(yè)務(wù)代理合同范文
- 2025屆高考?xì)v史一輪復(fù)習(xí)課題綜合集訓(xùn)16兩次工業(yè)革命含解析新人教版
- 住建系統(tǒng)消防安全專項整治工作方案
- 農(nóng)機(jī)安全生產(chǎn)隱患排查記錄
- 電銷團(tuán)隊組建方案(共12頁)
- 人際溝通風(fēng)格測試-
- 關(guān)于口算訓(xùn)練的方法及注意的問題麗麗
- 煤化工課程設(shè)計(DOC30頁)
- 液壓技術(shù)與氣動技術(shù)課程設(shè)計
- (完整版)國家電投集團(tuán)公司招聘高校畢業(yè)生應(yīng)聘登記表
- 部編版小學(xué)語文四年級上冊習(xí)作七《寫信》PPT教學(xué)講座課件
- EN10130-2006冷成形用低碳鋼冷軋鋼板和鋼帶交貨技術(shù)條件
- CMMI過程域介紹(完美版)
評論
0/150
提交評論