科研數(shù)據(jù)的分析與處理_第1頁
科研數(shù)據(jù)的分析與處理_第2頁
科研數(shù)據(jù)的分析與處理_第3頁
科研數(shù)據(jù)的分析與處理_第4頁
科研數(shù)據(jù)的分析與處理_第5頁
已閱讀5頁,還剩72頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

科研數(shù)據(jù)的分析與處理第1頁,課件共77頁,創(chuàng)作于2023年2月醫(yī)學(xué)科研數(shù)據(jù)的整理與分析第2頁,課件共77頁,創(chuàng)作于2023年2月醫(yī)學(xué)科研數(shù)據(jù)的整理與分析第一節(jié)科研數(shù)據(jù)的檢查與整理第二節(jié)科研數(shù)據(jù)的描述第三節(jié)統(tǒng)計分析方法的選擇第四節(jié)科研數(shù)據(jù)的綜合分析第五節(jié)統(tǒng)計分析結(jié)果的解釋與表達第3頁,課件共77頁,創(chuàng)作于2023年2月一、對象的檢查二、缺項與差錯三、資料的整理第一節(jié)科研數(shù)據(jù)的檢查與整理第4頁,課件共77頁,創(chuàng)作于2023年2月一、對象的檢查首先要鑒別所調(diào)查或研究的個體是否屬于所規(guī)定的調(diào)查對象或研究對象。在進行臨床研究時,要特別注意疾病診斷、分類的正確性,這對于保證研究結(jié)果的正確性是十分必要的。第5頁,課件共77頁,創(chuàng)作于2023年2月由于多種原因在一些調(diào)查表中經(jīng)??梢砸姷饺表椀拇嬖?,缺項的存在嚴重地影響到資料的完整性。通過檢查發(fā)現(xiàn)研究資料中的差錯也是十分必要的,應(yīng)對研究數(shù)據(jù)作認真的檢查。二、缺項與差錯檢查第6頁,課件共77頁,創(chuàng)作于2023年2月專業(yè)檢查統(tǒng)計檢查二、缺項與差錯檢查第7頁,課件共77頁,創(chuàng)作于2023年2月人工檢查計算機檢查二、缺項與差錯檢查第8頁,課件共77頁,創(chuàng)作于2023年2月在周密實驗設(shè)計指導(dǎo)下獲得的實驗數(shù)據(jù),不應(yīng)隨意舍棄,否則實驗結(jié)果的真實性與完整性就會受到破壞??梢蓴?shù)據(jù)的處理第9頁,課件共77頁,創(chuàng)作于2023年2月第10頁,課件共77頁,創(chuàng)作于2023年2月在該數(shù)據(jù)指標服從正態(tài)分布的前提下,可用統(tǒng)計方法檢查個別“可疑值”是否應(yīng)當舍棄。當n>10時,可以用“”作為舍棄可疑值的準則。當n≤10時,可以采用Q檢驗法、Dixon檢驗法或Grubbs檢驗法,進行測量值的一致性檢驗,從而判斷是否剔除可疑值??梢蓴?shù)據(jù)的處理第11頁,課件共77頁,創(chuàng)作于2023年2月第12頁,課件共77頁,創(chuàng)作于2023年2月在對資料做好檢查、核對后,就需要把雜亂無章的資料條理化,以便于進行統(tǒng)計計算與分析,即整理資料。三、資料的整理第13頁,課件共77頁,創(chuàng)作于2023年2月數(shù)據(jù)的計算機管理數(shù)據(jù)庫的選擇數(shù)據(jù)錄入數(shù)據(jù)核查與清理數(shù)據(jù)加工(如編碼、標準化、根據(jù)原始記錄產(chǎn)生新的研究變量等)數(shù)據(jù)最終鎖定并進入分析第14頁,課件共77頁,創(chuàng)作于2023年2月第15頁,課件共77頁,創(chuàng)作于2023年2月醫(yī)學(xué)科研數(shù)據(jù)的整理與分析第一節(jié)科研數(shù)據(jù)的檢查與整理第二節(jié)科研數(shù)據(jù)的描述第三節(jié)統(tǒng)計分析方法的選擇第四節(jié)科研數(shù)據(jù)的綜合分析第五節(jié)統(tǒng)計分析結(jié)果的解釋與表達第16頁,課件共77頁,創(chuàng)作于2023年2月一、統(tǒng)計指標二、統(tǒng)計表三、統(tǒng)計圖第二節(jié)科研數(shù)據(jù)的描述表達第17頁,課件共77頁,創(chuàng)作于2023年2月(一)總量指標與相對數(shù)指標(二)平均數(shù)指標(三)變異指標一、統(tǒng)計指標第18頁,課件共77頁,創(chuàng)作于2023年2月統(tǒng)計表是用表格的方式表達統(tǒng)計資料和指標。在編制統(tǒng)計表時,應(yīng)該遵循以下原則:1.重點突出,簡單明了。即一張表只包含一個中心內(nèi)容,使人一目了然,不要包羅萬象。2.主謂分明,層次清楚。二、統(tǒng)計表第19頁,課件共77頁,創(chuàng)作于2023年2月一、統(tǒng)計指標二、統(tǒng)計表三、統(tǒng)計圖第二節(jié)科研數(shù)據(jù)的描述表達第20頁,課件共77頁,創(chuàng)作于2023年2月第21頁,課件共77頁,創(chuàng)作于2023年2月第22頁,課件共77頁,創(chuàng)作于2023年2月醫(yī)學(xué)科研數(shù)據(jù)的整理與分析第一節(jié)科研數(shù)據(jù)的檢查與整理第二節(jié)科研數(shù)據(jù)的描述第三節(jié)統(tǒng)計分析方法的選擇第四節(jié)科研數(shù)據(jù)的綜合分析第五節(jié)統(tǒng)計分析結(jié)果的解釋與表達第23頁,課件共77頁,創(chuàng)作于2023年2月(一)假設(shè)檢驗(二)區(qū)間估計(三)變量間關(guān)系的研究(四)判別分析一、統(tǒng)計分析方法概述第24頁,課件共77頁,創(chuàng)作于2023年2月包括有計量資料分布類型的假設(shè)檢驗、計量資料方差的假設(shè)檢驗、計量資料均數(shù)的假設(shè)檢驗、等級資料分布或位置的假設(shè)檢驗、兩種屬性間的獨立性檢驗以及兩種方法判斷結(jié)果一致性的檢驗等。(一)假設(shè)檢驗第25頁,課件共77頁,創(chuàng)作于2023年2月(二)區(qū)間估計▲概念:根據(jù)樣本均數(shù),按一定的可信度計算出總體均數(shù)很可能在的一個數(shù)值范圍,這個范圍稱為總體均數(shù)的可信區(qū)間。▲方法:(1)u分布法(2)t分布法第26頁,課件共77頁,創(chuàng)作于2023年2月總體均數(shù)(μ)的100(1-α)%置信區(qū)間(CI):(1)已知總體標準差σ,按正態(tài)分布原理,計算公式為:(2)σ未知,n較小,按t分布原理計算:(3)σ未知,n足夠大(如n>100),按正態(tài)分布原理計算:(二)區(qū)間估計第27頁,課件共77頁,創(chuàng)作于2023年2月總體率的置信區(qū)間估計查表法當n≤50時正態(tài)近似法當樣本含量足夠大,且樣本率p和(1-p)均不太小。一般認為np和n(1-p)≥5。

p±uαsp

第28頁,課件共77頁,創(chuàng)作于2023年2月(一)假設(shè)檢驗(二)區(qū)間估計(三)變量間關(guān)系的研究(四)判別分析一、統(tǒng)計分析方法概述第29頁,課件共77頁,創(chuàng)作于2023年2月1.各指標之間無自變量與因變量之分(1) 研究變量之間的相互關(guān)系有直線相關(guān)分析、典型相關(guān)分析等。(2) 研究多個變量的內(nèi)部從屬關(guān)系,并尋找綜合指標,降低變量的維數(shù),其常用的方法主要有主成分分析、因子分析和對應(yīng)分析。(3) 研究多個變量內(nèi)部或多個樣品之間的親疏關(guān)系有聚類分析。(4) 研究多個變量內(nèi)部的各種復(fù)雜關(guān)系有線性結(jié)構(gòu)方程的協(xié)方差分析。(三)變量間關(guān)系的研究第30頁,課件共77頁,創(chuàng)作于2023年2月2.各指標之間有自變量與因變量之分研究變量之間的依存關(guān)系有直線回歸分析、曲線回歸分析、多項式回歸分析、多元線性回歸分析、概率模型回歸分析、生存資料的參數(shù)模型回歸分析、COX模型回歸分析和對數(shù)線性模型分析。(三)變量間關(guān)系的研究第31頁,課件共77頁,創(chuàng)作于2023年2月(一)假設(shè)檢驗(二)區(qū)間估計(三)變量間關(guān)系的研究(四)判別分析根據(jù)一些明確分類的總體所提供的信息,對未知個體的歸屬進行分類的判別分析。一、統(tǒng)計分析方法概述第32頁,課件共77頁,創(chuàng)作于2023年2月分析目的資料類型設(shè)計方案數(shù)理統(tǒng)計條件選擇統(tǒng)計分析方法需考慮的因素第33頁,課件共77頁,創(chuàng)作于2023年2月二、計量資料假設(shè)檢驗方法的選擇例:欲了解某地城鄉(xiāng)嬰兒營養(yǎng)狀況有無差別,測量了其血紅蛋白含量,見下表。第34頁,課件共77頁,創(chuàng)作于2023年2月首先要明確每次擬分析的定性變量個數(shù)是多少?其次要弄清定性變量的屬性、列聯(lián)表中頻數(shù)的多少以及資料的收集方式。三、計數(shù)資料假設(shè)檢驗方法的選擇第35頁,課件共77頁,創(chuàng)作于2023年2月第36頁,課件共77頁,創(chuàng)作于2023年2月每次只分析兩個變量時,可將資料整理為2×2表、2×k表和R×C表的形式。常用的統(tǒng)計分析方法有Pearsonχ2檢驗、校正χ2檢驗、配對計數(shù)資料的McNemarχ2檢驗、Fisher精確概率法檢驗、秩和檢驗、Ridit分析、等級相關(guān)分析、典型相關(guān)分析、一般趨勢和線性趨勢檢驗、Kappa檢驗等;如果需要同時分析研究的定性變量的個數(shù)≥3時,常用的統(tǒng)計分析方法有加權(quán)χ2檢驗、Mantel-haenszelχ2檢驗、logistic回歸模型和對數(shù)線性模型等。第37頁,課件共77頁,創(chuàng)作于2023年2月在計數(shù)資料的分析過程中,對于R×C表形式資料的分析是一個難點,存在的問題比較多。根據(jù)二維列聯(lián)表中兩個分組變量的類型以及分析的目的,對R×C表資料進行分類,因為不同類型的R×C表資料和不同的分析目的,就有不同的分析方法。R×C表檢驗方法的選擇第38頁,課件共77頁,創(chuàng)作于2023年2月雙向無序R×C表資料及其統(tǒng)計分析方法的選擇單向有序R×C表資料及其統(tǒng)計分析方法的選擇雙向有序且屬性不同的R×C表資料及其統(tǒng)計分析方法的選擇雙向有序且屬性相同的R×C表資料及其統(tǒng)計分析方法的選擇R×C表檢驗方法的選擇第39頁,課件共77頁,創(chuàng)作于2023年2月第40頁,課件共77頁,創(chuàng)作于2023年2月第41頁,課件共77頁,創(chuàng)作于2023年2月對單向有序R×C表的兩個分組變量,其中一個是無序的(實驗分組變量——不同藥品);另一個卻是有序的(指標分組變量——處理效果)。此時不適合選用χ2檢驗分析資料,因為χ2檢驗與“療效”的有序性之間沒有任何聯(lián)系,故應(yīng)采用與“有序性”有聯(lián)系的秩和檢驗或Ridit分析。R×C表檢驗方法的選擇第42頁,課件共77頁,創(chuàng)作于2023年2月第43頁,課件共77頁,創(chuàng)作于2023年2月對雙向有序且屬性不同的R×C表的兩個分組變量,如年齡組別與某種疾病發(fā)生程度都是有序的,但屬性不同,此時,也不適合選用χ2檢驗分析資料,因為χ2檢驗與兩個變量的有序性之間沒有任何聯(lián)系,應(yīng)改用與兩個變量的“有序性”有聯(lián)系的等級相關(guān)分析、典型相關(guān)分析或線性趨勢檢驗。R×C表檢驗方法的選擇第44頁,課件共77頁,創(chuàng)作于2023年2月第45頁,課件共77頁,創(chuàng)作于2023年2月對雙向有序且屬性相同的R×C表的兩個分組變量,如兩種方法對某種疾病發(fā)病程度診斷結(jié)果,它們都是有序的,且屬性也相同。此時,研究的目的是要考察兩種測定方法的測定結(jié)果之間是否具有一致性,故仍不適合選用一般的χ2檢驗分析資料,應(yīng)采用與兩個變量的有序性有聯(lián)系的一致性檢驗或稱Kappa檢驗,還可以用特殊的模型分析方法。R×C表檢驗方法的選擇第46頁,課件共77頁,創(chuàng)作于2023年2月醫(yī)學(xué)科研數(shù)據(jù)的整理與分析第一節(jié)科研數(shù)據(jù)的檢查與整理第二節(jié)科研數(shù)據(jù)的描述第三節(jié)統(tǒng)計分析方法的選擇第四節(jié)科研數(shù)據(jù)的綜合分析第五節(jié)統(tǒng)計分析結(jié)果的解釋與表達第47頁,課件共77頁,創(chuàng)作于2023年2月對于同一份統(tǒng)計資料,由于研究目的的不同,處理方法不同,可以從多個方面進行分析,此即“綜合分析”。通過對數(shù)據(jù)資料的綜合分析,可以充分利用、挖掘資料所內(nèi)涵的信息。第四節(jié)科研數(shù)據(jù)的綜合分析第48頁,課件共77頁,創(chuàng)作于2023年2月【實例】某醫(yī)師將20名失眠患者隨機等分為兩組,一組服用安眠藥,另一組服用安慰劑,研究者要評價某安眠藥的催眠效果,治療失眠前后的睡眠時間及其差值結(jié)果見表,試作統(tǒng)計分析。第49頁,課件共77頁,創(chuàng)作于2023年2月第50頁,課件共77頁,創(chuàng)作于2023年2月平行組對照設(shè)計分析思路試驗組:療前療后=>差值同質(zhì)性比較組間比較

對照組:療前療后=>差值第51頁,課件共77頁,創(chuàng)作于2023年2月療前是否均衡可比?

–兩組療前的比較每種藥物是否有療效?

–各組療效的組內(nèi)比較療效間有沒有差別?

–療效差別的比較本例分析中的三個步驟是環(huán)環(huán)相扣的。第52頁,課件共77頁,創(chuàng)作于2023年2月平行組對照設(shè)計分析思路試驗組:療前療后=>差值

同質(zhì)性比較組間比較

對照組:療前療后=>差值第53頁,課件共77頁,創(chuàng)作于2023年2月【實例】對一組胃癌病人先后用兩種泌酸刺激劑,然后分別測定其最大酸排量(mEq/h),以分析兩藥的效果,見表。第54頁,課件共77頁,創(chuàng)作于2023年2月第55頁,課件共77頁,創(chuàng)作于2023年2月配對資料t檢驗分析。按α=0.05水準拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義,胃癌病人用加大組織胺后的最大酸排量與用五肽胃泌素后的最大酸排量間差別有統(tǒng)計學(xué)意義。第56頁,課件共77頁,創(chuàng)作于2023年2月五肽胃泌素引起的最大酸排量是加大組織胺的百分之多少?第57頁,課件共77頁,創(chuàng)作于2023年2月?胃癌病人用加大組織胺后的最大酸排量比用五肽胃泌素者平均多1.30(95%CI:1.02~1.57)mEq/h。而兩次測定值之間回歸分析顯示:若加大組織胺引起的最大酸排量升高1mEq/h,則五肽胃泌素引起者將平均遞升0.90(95%CI:0.88~0.92)mEq/h,即五肽胃泌素引起的最大酸排量只是加大組織胺的90%。綜合分析的結(jié)論第58頁,課件共77頁,創(chuàng)作于2023年2月針對差值分析的配對t檢驗與闡明變量線性依存關(guān)系的回歸分析相結(jié)合,假設(shè)檢驗與區(qū)間估計互補,使所得結(jié)論更加豐富、更加具體。第59頁,課件共77頁,創(chuàng)作于2023年2月例研究放射線對嗜酸粒細胞的影響。對一批同一種系的體重接近的小白鼠,以完全隨機抽樣方法抽取了11只小白鼠,在注射腎上腺素前、后二次測定其嗜酸粒細胞數(shù),然后用一定劑量的放射線照射,經(jīng)過24小時,再重復(fù)上述實驗,每一只小白鼠均有4個測定值。二、進行綜合分析的方法第60頁,課件共77頁,創(chuàng)作于2023年2月第61頁,課件共77頁,創(chuàng)作于2023年2月1.單純腎上腺素的作用

放射線照射之前,測定嗜酸粒細胞數(shù)(×106個/L),然后注射一定劑量的腎上腺素,再測其嗜酸性粒細胞,將⑵、⑶按自身對照設(shè)計作t檢驗(t=3.767,P<0.01)。2.照射放射線后腎上腺素的作用在照射一定劑量的放射線后,重復(fù)上述實驗,將⑷、⑸按自身對照設(shè)計作t檢驗(t=6.921,P<0.001)。綜合分析第62頁,課件共77頁,創(chuàng)作于2023年2月3.單純照射放射線的作用將尚未注射腎上腺素時,照射放射線前、后的測定值,即⑵、⑷按自身對照設(shè)計作t檢驗(t=4.219,P<0.01)。4.照射放射線是否改變腎上腺素的作用

將放射線照射前的差值[⑶―⑵]與放射線照射后的差值[⑸―⑷],按自身對照設(shè)計作t檢驗(t=0.849,P>0.40)。

綜合分析第63頁,課件共77頁,創(chuàng)作于2023年2月1.小白鼠受到放射線照射后,血液中嗜酸性粒細胞減少;2.小白鼠注射腎上腺素后,血液中嗜酸性粒細胞減少;3.小白鼠受放射線照射24小時內(nèi),并未改變腎上腺素降低嗜酸性粒細胞數(shù)的作用和程度。結(jié)論第64頁,課件共77頁,創(chuàng)作于2023年2月例7.2下面就是該科研資料較為完整的背景介紹:某研究者收集到103例冠心病患者和100例正常對照者的多項指標,其中有組別(G)、性別(X1)、年齡(X2)、高血壓史(X3)、吸煙史(X4)、膽固醇含量(X5)、甘油三酯含量(X6)、低密度脂蛋白含量(X7)、密度脂蛋白含量(X8)、脂蛋白(X9)、載脂蛋白A1含量(X10)、載脂蛋白B含量(X11)、基因型Xbal(X12)、基因型EcoRl(X13)、用藥情況(X14),資料的格式見表7.5所示。第65頁,課件共77頁,創(chuàng)作于2023年2月第66頁,課件共77頁,創(chuàng)作于2023年2月(1)對冠心病人而言,直接分析某種基因型(X12或X13)取不同水平時7項血脂指標的均值和均值向量之間的差別有無顯著性意義?(2)對冠心病人而言,同時分析“性別、吸煙史、高血壓史、某種基因型(X12或X13)”對7項血脂指標的均值和均值向量的影響有無顯著性意義?(3)對冠心病人而言,在設(shè)法排除“年齡、性別、吸煙史、高血壓史和用藥情況”等因素影響的前提下,分析某種基因型(X12或X13)取不同水平時7項血脂指標均值之間的差別有無顯著性意義?第67頁,課件共77頁,創(chuàng)作于2023年2月第68頁,課件共77頁,創(chuàng)作于2023年2月(4)對冠心病人而言,試對7項血脂指標間的內(nèi)部從屬性做客觀評價。(5)對冠心病人而言,試對7項血脂指標間的親疏關(guān)系做客觀評價。(6)對冠心病人而言,假定病情輕重可通過7項血脂指標很好地反映出來,試根據(jù)7項血脂指標的數(shù)據(jù),將他們劃分成3組,以便做出關(guān)于病情“輕、中、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論