醫(yī)學研究的數(shù)據(jù)管理與分析——第一章-緒論 PPT課件_第1頁
醫(yī)學研究的數(shù)據(jù)管理與分析——第一章-緒論 PPT課件_第2頁
醫(yī)學研究的數(shù)據(jù)管理與分析——第一章-緒論 PPT課件_第3頁
醫(yī)學研究的數(shù)據(jù)管理與分析——第一章-緒論 PPT課件_第4頁
醫(yī)學研究的數(shù)據(jù)管理與分析——第一章-緒論 PPT課件_第5頁
已閱讀5頁,還剩76頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)學研究的數(shù)據(jù)管理與分析,Data Management and Analysis,目錄,課程教學目標,能利用統(tǒng)計學的思維解決醫(yī)學研究中遇到的問題; 能夠掌握EpiData、SPSS等軟件的常規(guī)運用; 能夠進一步自學EpiData、SPSS等軟件; 提高醫(yī)學研究數(shù)據(jù)處理和統(tǒng)計分析的能力。,課程教學計劃,緒論調(diào)查研究基礎 數(shù)據(jù)管理 EpiData軟件應用 數(shù)據(jù)分析 SPSS軟件應用 表格數(shù)據(jù)分析 EpiCalc軟件應用(自學) 數(shù)據(jù)綜合分析實際資料演練,主要參考書目,衛(wèi)生統(tǒng)計學(第七版) 方積亁 主編,人民衛(wèi)生出版社,2012年8月。 醫(yī)學統(tǒng)計學(第五版) 馬斌榮 主編,人民衛(wèi)生出版社,2008

2、年6月。 中醫(yī)統(tǒng)計學(第二版) 申杰、王泓午等編著,科學出版社,2012年7月。 醫(yī)學科研中的統(tǒng)計方法(第四版) 馬斌榮 主編,科學出版社,2012年6月。 臨床醫(yī)學研究設計和數(shù)據(jù)分析 趙耐青 主編,復旦大學出版社,2005年7月。 醫(yī)學科研數(shù)據(jù)的處理與分析方法 陳大方、陳常中 主編,北京醫(yī)科大學出版社,2006年5月。 醫(yī)學統(tǒng)計學與SPSS軟件實現(xiàn)方法 郭秀花、劉美娜等編著,科學出版社,2012年8月。,數(shù)據(jù),決策,第一章 緒論,研究設計與數(shù)據(jù)的管理及分析 數(shù)據(jù)類型與統(tǒng)計分析方法選擇 數(shù)據(jù)管理和分析應遵循的原則,科學研究和研究設計,科學研究是通過實驗或調(diào)查觀察取得信息,并對其進行加工(如數(shù)據(jù)

3、資料的統(tǒng)計學處理)的過程。 科學研究的核心是對未知事物的探索、觀測和分析,生命力在于創(chuàng)新。 用科學的觀點和方法進行研究,其全過程應當是一個嚴肅的探索和思維過程,包括合理的假說、嚴謹?shù)脑O計、嚴格的實驗、嚴密的觀測和正確的分析。,第一節(jié) 研究設計與數(shù)據(jù)的管理及分析,科研工作的基本程序(1),立題 設計 觀察和實驗 資料整理和數(shù)據(jù)統(tǒng)計分析 理性概括,科研工作的基本程序(2),研究設計的重要性,進行一項科研課題如同造一座大橋、一座大廈。如果大廈事先沒有良好的設計就會倒塌,同樣科研課題事先沒有良好的設計就會失敗。 科研設計如同建筑設計一樣舉足輕重。 研究設計的好壞,直接關系到研究結果的可靠信,任何設計上

4、的缺陷,都不能期望事后彌補。,進行完試驗后再找統(tǒng)計學家分析數(shù)據(jù),如同病人死后再找醫(yī)生進行尸體解剖,醫(yī)生會告訴病人死亡的原因是什么。同樣,統(tǒng)計學家會告訴你試驗失敗的原因是什么。 Ronand A. Fisher,1890-1962,研究設計:調(diào)查設計/實驗設計 收集資料:準確可靠的原始資料 整理資料:核對/清理/糾錯和量化 分析資料:統(tǒng)計描述/統(tǒng)計推斷,統(tǒng)計學和流行病學在科研中重要性,調(diào)查研究設計,What to do?做什么? Why to do?為什么做? How to do?怎么做?(設計),Study design,(選題),搜集資料,整理與分析資料,調(diào)查(研究)項目,分析表(指標),研

5、究目的,回答,統(tǒng)計分析步驟,調(diào)查研究步驟,解釋、呈現(xiàn)結果,15,設計思路,研究設計思路與統(tǒng)計學分析步驟的關系,研究設計 專業(yè)設計 統(tǒng)計學設計,確定調(diào)查和研究的目的是選定研究指標的依據(jù) 研究指標又是研究目的的具體體現(xiàn),一、明確調(diào)查和研究的目的,了解參數(shù),用以說明總體。 研究變量間的關系,通過確立統(tǒng)計學聯(lián)系來 探索病因或驗證療效等。 ,16,二、確定研究對象和觀察單位,研究對象:對象來源總體是什么? 抽樣方法:如何抽樣?代表性? 觀察單位:個體?群體?,17,三、研究設計類型的選擇,根據(jù)研究目的選擇合適的設計類型: 描述疾病的或健康狀況的三間分布 探討病因 驗證預防和控制措施的效果 評價疫苗的效果

6、 新藥上市前臨床試驗,18,常用的實驗設計方法,完全隨機設計(completely random design) 配對設計(paired design) 配伍組設計 隨機區(qū)組設計(randomized block design) 析因試驗設計(factorial design) 拉丁方設計(Latin square design) 正交設計(orthogonal design) 序貫設計(sequential design),20,現(xiàn)況(橫斷面)研究設計原理,普查抽樣調(diào)查,抽樣調(diào)查,總體,描述疾病或健康狀況的三間分布情況,進行社區(qū)診斷 (community diagnosis)。 描述某些因素

7、或特征與疾病或健康狀態(tài)的聯(lián)系,提出病因假設或提供病因線索 。 評價防制措施的效果 。 確定高危人群、篩查出患有研究疾病的人群,從而達到早發(fā)現(xiàn)、早診斷和早治療的目的。 二級預防 為進一步流行病學研究提供基礎。,現(xiàn)況研究的應用,病例對照研究設計原理,Time,Now,回顧性研究 廣泛探索病因,或初步驗證病因假設。特別適用于罕見病的病因研究 省力、省錢、省時間,易于組織實施 同時調(diào)查多個暴露因素與疾病的關系,病例對照研究的應用和特點,隊列研究設計原理,Time,前瞻性研究 因果時間順序明確,檢驗病因假說能力較強,可證實病因聯(lián)系 有助于了解疾病的自然史,并可獲得一種暴露與多種疾病結局的關系 研究費時間

8、、費人力、費物力,隊列研究的應用和特點,臨床試驗設計原理,四、確定研究項目,擬定調(diào)查表(問卷),調(diào)查和研究項目的確定:分析項目、備選項目 調(diào)查表和原始數(shù)據(jù)記錄表的設計,29,調(diào)查表也稱 “調(diào)查問卷(Questionnaire)”,通過把擬收集的數(shù)據(jù)項目用恰當?shù)拇朐~構成一系列問題的“答卷”。 調(diào)查表是醫(yī)學研究資料收集的最主要工具。 調(diào)查表如何設計取決于研究目的和分析手段的需要,關鍵在于保證所獲得信息的準確性和可靠性。,四、確定研究項目,擬定調(diào)查表(問卷),第一類錯誤的概率:即檢驗水準,越小所需樣本含量越多,對于相同的檢驗水準,雙側檢驗比單側檢驗所需的樣本含量更大,通常取0.05。 把握度(pow

9、er) 1-,一般0.8-0.9 單側檢驗還是雙側檢驗,單側檢驗所需樣本量小,雙側檢驗所需樣本量大。,五、樣本含量的估計,31,五、樣本含量的估計,32,單純隨機抽樣的樣本量估計 實驗設計的樣本含量估計 流行病學研究的樣本含量估計,討論(一):如何估計樣本量?,應用專門的公式和統(tǒng)計學軟件估算,常用軟件:EpiCalc 2000,33,常用軟件:EPI INFO,34,常用軟件:OPENEPI,35,直接觀察法 采訪法 包括面訪、調(diào)查會及信訪、電話訪問等,六、原始資料的收集,原始資料的收集方式,36,面訪,信訪,電話,自填,其它,如internet,體檢檢查,實驗室檢查,敏感問題調(diào)查,資料的收集

10、方法,37,七、調(diào)查和研究的質(zhì)量控制,真實性(效度) 可靠性(信度),偏倚如何控制?,如何評價?, 錄入前的核對 錄入計算機,建立數(shù)據(jù)庫(database) Excel、Access、EpiData、STATA、SPSS、SAS軟件等 錄入后的核對和整理 邏輯檢查、核對 排序(sorting) 建立新變量 數(shù)據(jù)的編碼和轉(zhuǎn)換 缺失值的處理,八、 數(shù)據(jù)資料的整理,39,常用數(shù)據(jù)錄入、管理軟件,Visual FoxPro,F(xiàn)oxBase,Lotus等,常用數(shù)據(jù)分析軟件,SAS,Stata,R等,醫(yī)學研究的數(shù)據(jù)類型,定量數(shù)據(jù)(measurement data):連續(xù)型/離散型,特殊類型:兩分類數(shù)據(jù)(d

11、ichotomic data),等級數(shù)據(jù):有序分類/半定量 名義數(shù)據(jù):,定性數(shù)據(jù)(qualitative data),(計數(shù)資料),(計量資料),如何描述和比較?,第二節(jié) 數(shù)據(jù)類型與統(tǒng)計分析方法選擇,資料分析(DATA ANALYSIS),43,(1)統(tǒng)計描述(descriptive statistic)指用統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及其分布規(guī)律進行描述。 (2)統(tǒng)計推斷(inferential statistic)指如何由樣本信息推斷總體特征問題。,醫(yī)學研究的數(shù)據(jù)統(tǒng)計分析方法和指標,45,定量數(shù)據(jù)統(tǒng)計資料的描述,指標描述 集中位置:算術均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)

12、離散程度:極差、標準差、方差、四分位數(shù)間距 圖形描述 頻數(shù)分布圖 趨勢圖,定量數(shù)據(jù),集中趨勢的描述,算術均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù),46,定量數(shù)據(jù),集中趨勢的描述,算術均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù),47,mean,最適于對稱分布資料,特別是正態(tài)分布資料; 對于偏態(tài)資料,均數(shù)不能較好地反映其集中趨勢。,定量數(shù)據(jù),集中趨勢的描述,算術均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù),48,geometric mean,1.等比資料,如抗體平均滴度 2.對數(shù)正態(tài)分布資料,定量數(shù)據(jù),集中趨勢的描述,算術均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù),49,Median 將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位

13、數(shù)。,中位數(shù)常用于描述偏態(tài)資料,開口資料,有不確定值的資料的集中趨勢; 中位數(shù)和均數(shù)在對稱分布上理論上是相同的。,定量數(shù)據(jù),集中趨勢的描述,算術均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù),50,Percentile 用于描述某個觀察序列在某百分位置上的水平。,常用于確定參考值范圍,亦稱正常值范圍。 50%分位數(shù)就是中位數(shù) 25%,75%分位數(shù)稱四分位數(shù)(quartile),X% PX (100-X)%,定量數(shù)據(jù),51,均數(shù)應用時的注意事項,均數(shù)適用于:單峰對稱分布的資料 幾何均數(shù)適用于:對數(shù)變換后單峰對稱的資料 中位數(shù)適用于:任何分布資料,有不確定值的資料,定量數(shù)據(jù),52,極差 /全距 (range)

14、四分位數(shù)間距 (inter-quartile range) 方差 (variance) 標準差 SD (standard deviation) 變異系數(shù) CV (coefficient of variation),描述離散程度的指標:,定量數(shù)據(jù),53,極差 /全距 四分位數(shù)間距 方差 標準差 變異系數(shù),描述離散程度的指標:,極差(全距),描述數(shù)據(jù)分布的范圍。極差大,說明數(shù)據(jù)分布較分散。 方法簡單明了。 不靈敏。 不穩(wěn)定。,定量數(shù)據(jù),54,極差 /全距 四分位數(shù)間距 方差 標準差 變異系數(shù),描述離散程度的指標:,四分位數(shù) (quartile) QU -QL 下四分位數(shù)即第25百分位數(shù),常用QL表

15、示; 上四分位數(shù)即第75百分位數(shù),常用QU表示,定量數(shù)據(jù),55,極差 /全距 四分位數(shù)間距 方差 標準差 變異系數(shù),描述離散程度的指標:,方差是實際值與期望值之差平方的平均值,而標準差是方差的平方根。,一般情況下,總體均數(shù)未知,需用樣本均數(shù)估計,定量數(shù)據(jù),56,極差 /全距 四分位數(shù)間距 方差 標準差 變異系數(shù),描述離散程度的指標:,變異系數(shù)CV coefficient of variation,定量數(shù)據(jù),57,集中趨勢+離散趨勢共同描述,均數(shù)標準差(min,max) 中位數(shù)四分位數(shù)間距 (min,max) 變異度小,則均數(shù)代表性好! 變異度大,數(shù)據(jù)分散,則均數(shù)代表性差! 平均數(shù)所表示的集中性

16、與變異度所表示的離散性,從兩個不同的角度闡明計量資料的特征!,定量數(shù)據(jù),假設檢驗兩組或多組均數(shù)比較,58,定量數(shù)據(jù),定量數(shù)據(jù)差別的統(tǒng)計意義檢驗小結,59,定量數(shù)據(jù),兩連續(xù)變量間的關系分析,直線回歸和多元線性回歸,相關分析,回歸分析,Pearson相關,Spearman相關,60,定量數(shù)據(jù),定性數(shù)據(jù)統(tǒng)計分析,統(tǒng)計分析,統(tǒng)計描述,統(tǒng)計推斷,參數(shù)估計,假設檢驗,Example,分類資料,率、比、構成比,總體率的可信區(qū)間,2檢驗、u檢驗,定性數(shù)據(jù),常用的相對數(shù) 率 Rate 構成比 Proportion 比 Ratio,62,定性數(shù)據(jù),定性數(shù)據(jù)統(tǒng)計描述,比可以是任意兩個數(shù)值之比,包括比和比率。當分子是

17、分母的一部分時,稱為比例;當比例與觀察時限有關時,稱為率。比例又分為構成比和頻率。而率與時間單位有關,即率有速率和強度的含義,它表示單位時間某事件發(fā)生的可能性大小。流行病學研究中常用的兩個比是相對危險度和優(yōu)勢比(比值比)。,63,定性數(shù)據(jù)統(tǒng)計推斷,定性數(shù)據(jù),數(shù)據(jù)類型的轉(zhuǎn)換,定量數(shù)據(jù)轉(zhuǎn)換為定性數(shù)據(jù)一般比較簡單,但從名義變量、等級數(shù)據(jù)轉(zhuǎn)換為定量數(shù)據(jù),則比較繁瑣且損失數(shù)據(jù)信息。 對兩組或多組研究單項的某項指標進行統(tǒng)計學檢驗時,數(shù)據(jù)從定量轉(zhuǎn)換為定性或等級數(shù)據(jù)時,統(tǒng)計學的效率會下降。,64,以正常參考值或臨床診斷標準作為分組依據(jù)。 某些定量指標尚無公認的正常參考值,可根據(jù)均數(shù)、中位數(shù)或三分位、四分位間距

18、值,將其分為兩組或多組。 根據(jù)數(shù)據(jù)的分布特點和研究需要,自行確定,但要能對統(tǒng)計分析結果做出合理的解釋。,定量數(shù)據(jù)轉(zhuǎn)換為定性或等級數(shù)據(jù)分組切割值確定方法,65,數(shù)據(jù)類型 計量資料? 計數(shù)資料? 分布類型 是否正態(tài)分布? 數(shù)據(jù)轉(zhuǎn)換 研究設計 成組?配對?配伍組?其他?,統(tǒng)計分析方法和指標的選擇,取決于,66,常用的數(shù)據(jù)轉(zhuǎn)換類型及方法,67,常用正態(tài)性及方差齊性檢驗的方法,68,常用非參數(shù)統(tǒng)計方法小結,69,醫(yī)學數(shù)據(jù)統(tǒng)計分析方法選擇流程圖,70,(三組及以上均數(shù)比較),71,醫(yī)學數(shù)據(jù)統(tǒng)計分析方法選擇流程圖,(定性數(shù)據(jù):RC表資料分析),72,醫(yī)學數(shù)據(jù)統(tǒng)計分析方法選擇流程圖,忠實于原始數(shù)據(jù) 重視數(shù)據(jù)整

19、理過程 選擇合適的統(tǒng)計方法和指標 科學合理地解釋統(tǒng)計分析結果,第三節(jié) 數(shù)據(jù)管理和分析應遵循的原則,一、忠實于原始數(shù)據(jù)是必須具備的科學精神 醫(yī)學研究的結果和客觀現(xiàn)實之間,總會存在或多或少的不一致(即誤差,error) 隨機誤差 系統(tǒng)誤差 醫(yī)學研究過程中,應盡量通過科學的設計和嚴格的質(zhì)量控制措施,控制系統(tǒng)誤差。 任何篡改研究數(shù)據(jù)的行為,不管出自什么目的,都違背科學精神。 二、重視研究數(shù)據(jù)資料的處理過程 保證被分析數(shù)據(jù)的正確性,和獲得的客觀結果盡可能保持一致,控制信息偏倚; 使原始數(shù)據(jù)經(jīng)過編碼、轉(zhuǎn)換、重新賦值后符合進一步統(tǒng)計分析的需要。 三、選擇合適的統(tǒng)計分析方法和指標 取決于數(shù)據(jù)及其分布得類型 (一)數(shù)據(jù)轉(zhuǎn)換 (二)正態(tài)性檢驗 (三)非參數(shù)統(tǒng)計法 (四)分析指標的選擇,四、醫(yī)學研究數(shù)據(jù)分析結果的解釋,一般來說,要從統(tǒng)計學、邏輯學和生物醫(yī)學三個方面科學、合理地解釋數(shù)據(jù)統(tǒng)計分析結果,正確認識統(tǒng)計學聯(lián)系和因果聯(lián)系的區(qū)別,并應用因果關系判定的標準進行評判。,統(tǒng)計學解釋,了解不同研究設計的效率、優(yōu)點和局限性 理解樣本和總體的關系 應從抽樣的隨機化程度和樣本含量兩方面解釋樣本的代表性 合理分析抽樣誤差和選擇性偏倚對研究結果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論