數(shù)據(jù)管理分析課件_第1頁
數(shù)據(jù)管理分析課件_第2頁
數(shù)據(jù)管理分析課件_第3頁
數(shù)據(jù)管理分析課件_第4頁
數(shù)據(jù)管理分析課件_第5頁
已閱讀5頁,還剩475頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學研究數(shù)據(jù)管理與統(tǒng)計分析

Datamanagement&analysis

1搜集資料整理與分析資料調(diào)查(研究)專案分析表(指標)研究目的回答統(tǒng)計分析步驟調(diào)查研究步驟研究設(shè)計思路與數(shù)據(jù)管理分析步驟解釋、呈現(xiàn)結(jié)果2☉確定調(diào)查和研究的目的是選定研究指標的依據(jù)

☉研究指標又是研究目的的具體體現(xiàn)一、明確調(diào)查和研究的目的瞭解參數(shù),用以說明總體。研究變數(shù)間的關(guān)係,通過確立統(tǒng)計學聯(lián)繫來探索病因或驗證療效等?!?二、確定研究對象和觀察單位

研究對象:對象來源-總體是什麼?抽樣方法:如何抽樣?代表性?觀察單位:個體?群體?4三、研究設(shè)計類型的選擇

根據(jù)研究目的選擇合適的設(shè)計類型:描述疾病的或健康狀況的三間分佈探討病因驗證預防和控制措施的效果評價疫苗的效果新藥上市前臨床試驗56四、確定研究專案,擬定調(diào)查表(問卷)

調(diào)查和研究專案的確定:分析專案、備選專案調(diào)查表和原始數(shù)據(jù)記錄表的設(shè)計7根據(jù)研究設(shè)計類型確定所需樣本量計算公式。相關(guān)參數(shù):一類錯誤的概率α:即檢驗水準,α越小所需樣本含量越多,對於相同的檢驗水準,雙側(cè)檢驗比單側(cè)檢驗所需的樣本含量更大,α通常取0.05。把握度(power)

1-β,一般0.8-0.9單側(cè)檢驗還是雙側(cè)檢驗,單側(cè)檢驗所需樣本量小,雙側(cè)檢驗所需樣本量大。五、樣本含量的估計8常用樣本含量的估計軟體:EpiCalc20009常用軟體:EPIINFO10常用軟體:OPENEPI11

①直接觀察法②採訪法包括面訪、調(diào)查會及信訪、電話訪問等

③…

六、原始資料的收集☉原始資料的收集方式12七、調(diào)查和研究的品質(zhì)控制

真實性(效度)可靠性(信度)偏倚及其如何控制?如何評價?13①錄入前的核對②錄入電腦,建立資料庫(database)→

Excel、Access、EpiData、STATA、SPSS、SAS軟體等③錄入後的核對和整理☉邏輯檢查、核對→排序(sorting)☉建立新變數(shù)☉數(shù)據(jù)的編碼和轉(zhuǎn)換☉缺失值的處理八、數(shù)據(jù)資料的整理14Dbase,FoxBase,VisualFoxPro,Lotus數(shù)據(jù)錄入和管理軟體15用Epidata構(gòu)建調(diào)查表資料庫1617用Epidata錄入調(diào)查表統(tǒng)計分析常用軟體18讓我們從一個簡單的調(diào)查開始..研究目的:瞭解本班同學姓名、性別、身高、出生日期等資訊。Step1:建立調(diào)查表

文本編輯軟體:Word1920調(diào)查表

編號:□□□□姓名:______性別:(1)男(2)女身高:____.__CM出生日期:______年____月____日為何不寫成性別:____Step2:調(diào)查表數(shù)據(jù)錄入21EpiData軟體概述一、EpiData的設(shè)計設(shè)計者:丹麥的JensM、MichaelBruus和英國的MarkMyatt編程者:丹麥的MichaelBruus開發(fā)思路和原理:基於EpiInfo6.0二、軟體下載和登記註冊下載地址:http://www.epidata.dk/download.htm三、版本資訊

EpiData1.5(2001年2月22日);EpiData2.1a(2002年)

EpiData3.02(2004);EpiData3.10(NOW)22EpiData軟體概述EpiData軟體安裝如同拷貝程式文檔一樣簡單。例如,它可以從U盤運行,並且佔用記憶體很小(<2.5M)。由於捐助和志願者的工作,軟體免費發(fā)佈。23EpiData程式下載與安裝http://www.epidata.dk/24EpiData程式下載與安裝25數(shù)據(jù)錄入EpiData軟體EpiData軟體是在吸收DOS版的EpiInfo6.0軟體優(yōu)點基礎(chǔ)上開發(fā)研製的Windows版軟體。26EpiData軟體它一方面吸收了EpiInfo軟體的長處,同時又極具自身特色。與視窗版EpiInfo軟體相比,佔用空間小,更加簡單易學,且介面友好,可以很方便的對數(shù)據(jù)進行儲存、核對和管理等,27?用EpiData軟體進行數(shù)據(jù)錄入和管理,將產(chǎn)生三種基本的檔.(1)調(diào)查表檔:尾碼為.QES。通過建立調(diào)查表檔,系統(tǒng)根據(jù)特定規(guī)則自動定義數(shù)據(jù)檔的結(jié)構(gòu),包括變數(shù)名、變數(shù)類型和長度等,用於數(shù)據(jù)錄入。(2)數(shù)據(jù)檔:尾碼為.REC。數(shù)據(jù)檔包含錄入的數(shù)據(jù)資訊以及已經(jīng)定義好的編碼,用於數(shù)據(jù)的統(tǒng)計分析。(3)核對檔:尾碼為.CHK。通過建立核對檔,系統(tǒng)將定義數(shù)據(jù)錄入的有效性規(guī)則。檔組成28EpiData

Entry的特點調(diào)查表設(shè)計便捷

數(shù)據(jù)核查功能強大且實現(xiàn)簡便

與調(diào)查表形式一致的可視數(shù)據(jù)錄入介面數(shù)據(jù)轉(zhuǎn)換功能強大

29講了半天,EpiData究竟長什麼樣?30請打開電腦上EpiData主程序為何我的電腦上沒有‘歡迎使用EpiData’?31EpiData軟體的窗口介紹32編輯過程工具條工具欄數(shù)據(jù)表預覽粘貼字段編輯器編碼編輯器33建立調(diào)查表檔(.QES)建立調(diào)查表檔是建立資料庫、實現(xiàn)數(shù)據(jù)錄入和管理的第一步。34建立調(diào)查表檔有以下幾種方法:第一種:在菜單中,點擊“檔”(File)→“生成調(diào)查表檔QES檔”第二種:在工作欄的工作流程中,點擊“1.打開檔”(1.DefineData)→“建立新QES檔”第三種:在按鈕欄中,點擊,這時窗口中會在工作區(qū)顯示一個空白的文檔,你可以在此文檔中鍵入調(diào)查表內(nèi)容和框架,編輯完成後,將調(diào)查表檔保存,檔的擴展名統(tǒng)一為.QES。35假定現(xiàn)有一調(diào)查表如下,如何建立.QES檔?調(diào)查表姓名:______性別:(1)男(2)女身高:____.__CM出生日期:______年____月____日36如果按原調(diào)查表格式直接建立資料庫,結(jié)果會怎樣?37必須定義字段名和字段類型字段類型字段編碼自動ID號<IDNUM>數(shù)字######.###文本___________加密字段<E>大寫文本<A>邏輯(是/否)<Y>日期<dd/mm/yyyy><mm/dd/yyyy><yyyy/mm/dd>自動插入日期<today-dmy><today-mdy><today-ymd>聲音提示<s>38調(diào)用字段編輯器:第一種方法:直接按CTRL-Q鍵。第二種方法:在編輯器工具條上點擊字段編輯器圖示。手工輸入或使用字段編輯器39字段類型介紹①數(shù)值型字段:##,###.##…;僅接受數(shù)字和空格,不輸按空格處理,分析時作缺失值處理,以“.”顯示。數(shù)字位數(shù)由“#”個數(shù)決定,小數(shù)位數(shù)由小數(shù)點右邊的“#”個數(shù)確定。最長可達14位,小數(shù)點按1個字元計算。40②文本型字段:包括三種。一種是常用的文本(或下劃線、或底線)型字段:________;該型字段由連續(xù)下劃線來定義,長度由下劃線字元個數(shù)決定,最大值為80,空白字段(字段內(nèi)容空缺)時,數(shù)據(jù)管理時將按缺失值處理。另一種為大寫文本型字段:<A>。41③日期型字段:包括兩種。一種為常用日期字段:<MM/DD/YYYY>、<DD/MM/YYYY>,分美式、英式兩種,輸入時即進行合法性檢驗;只需輸入日期,系統(tǒng)自動插入斜杠。另一種為自動日期型字段:<Today-DMY>、<Today-MDY>;儲存或修改數(shù)據(jù)時該字段自動輸入系統(tǒng)日期,如系統(tǒng)日期正確,也即當天日期。42④自動ID號型字段:<IDNUM>;這是一種專用字段,用作記錄識別號,檔的第一個記錄為1,以後記錄自動賦值順次較前增加1,並自動保證編號的唯一性。輸入數(shù)據(jù)時光標跳過此字段。如需使第一個記錄號大於1,則可在“檔”菜單“選擇項”中的“高級設(shè)置”中設(shè)置。⑤邏輯型字段(即布爾函數(shù)型字段):<Y>;只接受Y、N、空格或回車鍵。後兩者作缺失值處理。Y、N字元輸入後即轉(zhuǎn)為大寫字母。43我們按照這些要求重新建立資料庫,這次應該成功了吧?先預覽一下44怎麼會這樣?45定義字段名(FieldNames)以調(diào)查表中字段的第一個詞命名(Firstwordinquestionisfieldnames)使用{}內(nèi)的內(nèi)容自動添加字段名(Automaticfieldnames)46軟體安裝後默認是第一種命名方式,建議大家安裝軟體後立即修改選項!定義字段名(FieldNames)“檔”(File)→“選項”(Option)→“生成REC檔”(Createdatafile)→在“如何生成字段名”(Howtogeneratefieldnames)中選擇字段的命名方式。47“更新問題為實際檔案名”如果未勾選48預覽顯示的並非真實的字段名如“姓名”,真實的字段名是Field14950按{}命名規(guī)則修改調(diào)查表,然後預覽生成REC檔51別忘了修改“選項”否則…會是這樣的52?製作調(diào)查表檔可用EpiData編輯器進行。?也可用Word或其他文本編輯器編寫。注意,必須以純文本格式存盤,檔尾碼名必須是“.qes”。?也可在其他文本編輯器編寫,再粘貼到EpiData編輯器窗口。如何編寫調(diào)查表檔53編寫調(diào)查表檔注意事項(一)①編寫過程中及時保存檔,檔類型為.qes檔。②系統(tǒng)只會根據(jù)“特殊符號”來定義一個輸入字段(包括類型和長度),並根據(jù)符號前的字元給字段命名。建議在編寫過程中利用“字段快速清單”插入“特殊符號”,即:選擇字段類型,定義好長度後,按“插入”圖示,可避免由於“特殊符號”輸入錯誤而不能產(chǎn)生有效的輸入字段。③調(diào)查表用中文編寫時,可用定界符(“{}”)將字段名定義為英文字元(英文字母或英文字母+阿拉伯數(shù)字),有利於資料庫的管理和其他軟體的統(tǒng)計分析。注意:“{}”必須為半角型,而不能是全角型(“{}”)。54④盡可能把字段定義數(shù)值型,有利於統(tǒng)計分析。如糖尿病史“dmhis”可定義為數(shù)值型字段,“1”表示“有”,“0”表示“無”。⑤調(diào)查表檔格式盡可能和原調(diào)查表一致,有利於直觀錄入數(shù)據(jù)。⑥如果用其他文本編輯器編寫.qes檔,在運行EpiData後,打開該.qes檔即可編輯。⑦調(diào)查表檔的編寫是否符合要求,可通過“數(shù)據(jù)表預覽”來查看。編寫調(diào)查表檔注意事項(二)55數(shù)據(jù)檔的產(chǎn)生和修改①主菜單→選擇數(shù)據(jù)導入/導出菜單→“根據(jù)QES檔生成REC檔”②在工作過程工具條按第二個按鈕“生成REC檔”③在編輯器菜單→REC檔菜單→選擇“生成REC檔”56生成REC檔5758請大家根據(jù)EPIDATA建立調(diào)查表庫data.qes,生成資料庫,保存為data.rec59調(diào)查表姓名:______性別:(1)男(2)女身高:____.__CM出生日期:______年____月____日現(xiàn)在我們已經(jīng)有了兩個檔:*.QES調(diào)查表檔*.REC數(shù)據(jù)檔*.REC檔是根據(jù)QES檔生成的,用於數(shù)據(jù)錄入萬一我的QES檔丟了怎麼辦?60數(shù)據(jù)檔結(jié)構(gòu)的修改61調(diào)查表結(jié)構(gòu)重新修改後怎麼辦?資料庫建立後,錄入了一部分分數(shù)據(jù),發(fā)現(xiàn)漏掉了一個字段,於是重新修改調(diào)查表,這裏可以根據(jù)修改後的QES檔更新REC檔。62我一邊QQ聊天,一邊錄入數(shù)據(jù),萬一錄錯了,軟體會通知我嗎?63嗨!有第3種人嗎?核對檔的建立核對檔:CHECK檔或.CHK檔

範圍/合法值(Range/Legal)跳轉(zhuǎn)(Jumps)必須輸入(MustEnter)重複輸入(Repeat)6465游標懸停,會提示你命令格式66錄入錯誤時,軟體會彈出警告67關(guān)鍵字段的定義以編號code2為例,這個編號具有唯一性,為避免重複輸入,可在CHK檔中定義:code2

KEYUNIQUE1

MUSTENTEREND68練習請大家根據(jù)下列調(diào)查表內(nèi)容,利用EPIDATA建立調(diào)查表資料庫,保存為data1.qes,並生成data1.rec用於錄入資料。69調(diào)查表1.地區(qū):_______

2.調(diào)查表編號:□□□□3.錄入ID號:□□□□4.姓名:__________5.性別:(1)男

(2)女6.你吸煙嗎?(1)否[跳問7](2)是[續(xù)問6.1]6.1你多在年齡開始吸煙的?____歲6.2平均每天吸煙支數(shù)?____支7.身高:____.__CM8.血壓值(收縮壓/舒張壓):_____/_____mmHg9.出生日期:____月____日______年10.你是否具有下列癥狀?如有請在相應癥狀前打勾。

⑴咳嗽⑵咳痰⑶發(fā)熱⑷胸痛⑸呼吸困難⑹咯血11.調(diào)查表錄入日期:____月____日______年70錄入時自動編碼請大家根據(jù)data1.rec資料庫,建立CHK檔,保存為data1.chk要求:(1)地區(qū)號自動錄入(2)編號、姓名必須錄入(3)性別只能填1或2(4)是否吸煙只能填1、2或9(5)是否吸煙能夠?qū)崿F(xiàn)跳轉(zhuǎn)(6)平均每天吸煙支數(shù)的範圍在1-40之間或填99並請嘗試錄入3-5份調(diào)查表,存盤。71記錄刪除此處僅是在記錄加上刪除標記,徹底刪除需至“工具””清理REC檔”點擊72如果研究對象是(1)男性,而我卻錄成了(2)女性,軟體好象不會彈出警告嘛!73雙錄入核對doubleentry為了確保錄入品質(zhì),可以採用雙人錄入法進行核對。首先利用工具->複製REC檔結(jié)構(gòu),複製已建立好的資料庫(包括CHK檔),另存為一新庫,但已錄入的數(shù)據(jù)不會被複製。74雙錄入核對doubleentry如需要,可不複製字元型變數(shù)因為家庭住址、工作單位等很少有人願意錄入兩次。75兩次錄入的一致性檢驗雙軌錄入完成後可進行一致檢驗比較兩次錄入不同的地方注意選擇兩資料庫中的匹配字段用於比較767778調(diào)查表錄入兩次,比較後發(fā)現(xiàn)錯誤再修改,好象太麻煩!有沒有邊錄入邊比較的方法?79雙錄入即時校驗先點擊工具->準備雙錄入即時校驗80與雙錄入一致性檢驗比較,使用較少雙錄入即時校驗指定第1次已錄入的REC檔創(chuàng)建1新的REC檔,用於雙錄入81雙錄入即時校驗82應注意錄入調(diào)查表的順序顯示數(shù)據(jù)83流覽資料庫其他一些常用功能列印調(diào)查表(在數(shù)據(jù)錄入窗體下)檔->列印數(shù)據(jù)表84將資料庫存檔工具->創(chuàng)建壓縮檔可以將指定目錄下所有檔、僅EPIDATA檔或單個檔壓縮、打包和保存。(ZIP)需要的時候再利用“工具->解壓縮檔”解壓縮85描述數(shù)據(jù)86簡單描述和分析數(shù)據(jù)數(shù)據(jù)檔的導出和導入87資料庫的縱向追加與橫向合併88資料庫的縱向追加(頭-尾)一般用於追加記錄,如同學甲錄了50份,同學乙錄入了60份,現(xiàn)將兩資料庫合併成1個庫,共110份記錄。注意選項89資料庫的橫向合併(肩-肩)如一份調(diào)查表包括兩部分,同學甲錄了Part1,同學乙錄入Part2,現(xiàn)將兩資料庫合併成1個庫,包含Part1和Part2。選擇關(guān)鍵字段用於匹配,一般用記錄號NO作為關(guān)鍵字段,注意需保證其唯一性90請大家將資料庫data3與data4合併,保存為data34.rec請大家將資料庫data5與data6合併,保存為data56.rec請大家將資料庫data5與data7合併,保存為data57.rec比較異同點91Data3

+data492追加記錄(注意變數(shù)是否增加)Data5

+data693追加變數(shù)Data5+data794追加變數(shù)及記錄EpiData軟體的工具菜單95EpiData軟體的選項96有了資料庫,那就得考慮如何分析了統(tǒng)計描述統(tǒng)計推斷97資料分析(dataanalysis)98(1)統(tǒng)計描述(descriptivestatistic)指用統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特徵及其分佈規(guī)律進行描述。(2)統(tǒng)計推斷(inferentialstatistic)指如何由樣本資訊推斷總體特徵問題。資料的分類99

計量資料分類資料

二分類多分類無序多分類有序多分類(等級資料)100統(tǒng)計資料的描述指標描述

集中位置:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)

離散程度:極差、標準差、方差、四分位數(shù)間距圖形描述

頻數(shù)分佈圖 趨勢圖……計量資料集中趨勢的描述算術(shù)均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)101計量資料集中趨勢的描述算術(shù)均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)102mean最適於對稱分佈資料,特別是正態(tài)分佈資料;對於偏態(tài)資料,均數(shù)不能較好地反映其集中趨勢。計量資料集中趨勢的描述算術(shù)均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)103geometricmean1.等比資料,如抗體平均滴度2.對數(shù)正態(tài)分佈資料

flgx

fG=lg-1計量資料集中趨勢的描述算術(shù)均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)104Median

將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位數(shù)。中位數(shù)常用於描述偏態(tài)資料,開口資料,有不確定值的資料的集中趨勢;中位數(shù)和均數(shù)在對稱分佈上理論上是相同的。計量資料集中趨勢的描述算術(shù)均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)105Percentile用於描述某個觀察序列在某百分位置上的水準。常用於確定參考值範圍,亦稱正常值範圍。50%分位數(shù)就是中位數(shù)25%,75%分位數(shù)稱四分位數(shù)(quartile)X%

PX

(100-X)%計量資料106均數(shù)應用時的注意事項均數(shù)適用於:單峰對稱分佈的資料幾何均數(shù)適用於:對數(shù)變換後單峰對稱的資料中位數(shù)適用於:任何分佈資料,有不確定值的資料計量資料107極差/全距(range)四分位數(shù)間距(inter-quartilerange)

方差(variance)標準差SD

(standarddeviation)變異係數(shù)CV

(coefficientofvariation)

描述離散程度的指標:計量資料108極差/全距四分位數(shù)間距方差標準差變異係數(shù)

描述離散程度的指標:極差(全距),描述數(shù)據(jù)分佈的範圍。極差大,說明數(shù)據(jù)分佈較分散。方法簡單明瞭。不靈敏。不穩(wěn)定。計量資料109極差/全距四分位數(shù)間距方差標準差變異係數(shù)

描述離散程度的指標:四分位數(shù)

(quartile)QU-QL下四分位數(shù)即第25百分位數(shù),常用QL表示;上四分位數(shù)即第75百分位數(shù),常用QU表示計量資料110極差/全距四分位數(shù)間距方差

標準差變異係數(shù)

描述離散程度的指標:方差是實際值與期望值之差平方的平均值,而標準差是方差的平方根。一般情況下,總體均數(shù)未知,需用樣本均數(shù)估計計量資料111極差/全距四分位數(shù)間距方差標準差變異係數(shù)

描述離散程度的指標:變異係數(shù)CVcoefficientofvariation計量資料112集中趨勢+離散趨勢共同描述均數(shù)±標準差(min,max)中位數(shù)±四分位數(shù)間距(min,max)變異度小,則均數(shù)代表性好!變異度大,數(shù)據(jù)分散,則均數(shù)代表性差!平均數(shù)所表示的集中性與變異度所表示的離散性,從兩個不同的角度闡明計量資料的特徵!計量資料假設(shè)檢驗-兩組或多組均數(shù)比較⊙樣本均數(shù)與總體均數(shù)比較⊙成組設(shè)計兩樣本均數(shù)比較(成組t檢驗)⊙配對設(shè)計資料均數(shù)比較(配對t檢驗)

t檢驗(兩組比較)方差分析⊙成組設(shè)計多個樣本均數(shù)的比較(one-wayANOVA)⊙配伍組設(shè)計多個樣本均數(shù)比較(two-wayANOVA)⊙多個樣本均數(shù)的兩兩比較(q檢驗,Student-Newman-Keuls法)⊙多個實驗組和一個對照組均數(shù)間的兩兩比較(LSD法和Duncan法)(兩組或多組比較)113計量資料定量數(shù)據(jù)差別的統(tǒng)計意義檢驗小結(jié)114計量資料兩連續(xù)變數(shù)間的關(guān)係分析直線回歸和多元線性回歸

相關(guān)分析回歸分析Pearson相關(guān),Spearman相關(guān)115計量資料分類資料統(tǒng)計分析統(tǒng)計分析統(tǒng)計描述統(tǒng)計推斷參數(shù)估計假設(shè)檢驗Example分類資料率、比、構(gòu)成比總體率的可信區(qū)間χ2檢驗、u檢驗分類資料分類資料統(tǒng)計描述常用的相對數(shù)率Rate構(gòu)成比Proportion比Ratio117分類資料比值比(OR)聯(lián)繫強度病例對照研究佇列研究相對危險度(RR)118分類資料統(tǒng)計推斷☉數(shù)據(jù)類型的轉(zhuǎn)換①定量數(shù)據(jù)轉(zhuǎn)換為定性數(shù)據(jù)一般比較簡單,但從名義變數(shù)、等級數(shù)據(jù)轉(zhuǎn)換為定量數(shù)據(jù),則比較繁瑣且損失數(shù)據(jù)資訊。②對兩組或多組研究單項的某項指標進行統(tǒng)計學檢驗時,數(shù)據(jù)從定量轉(zhuǎn)換為定性或等級數(shù)據(jù)時,統(tǒng)計學的效率會下降。119①以正常參考值或臨床診斷標準作為分組依據(jù)。②某些定量指標尚無公認的正常參考值,可根據(jù)均數(shù)、中位數(shù)或三分位、四分位間距值,將其分為兩組或多組。③根據(jù)數(shù)據(jù)的分佈特點和研究需要,自行確定,但要能對統(tǒng)計分析結(jié)果做出合理的解釋。定量數(shù)據(jù)轉(zhuǎn)換為定性或等級數(shù)據(jù)-分組切割值確定方法120數(shù)據(jù)類型計量資料?計數(shù)資料?分佈類型是否正態(tài)分佈?→數(shù)據(jù)轉(zhuǎn)換研究設(shè)計成組?配對?配伍組?其他?統(tǒng)計分析方法和指標的選擇取決於121

常用的數(shù)據(jù)轉(zhuǎn)換類型及方法數(shù)據(jù)類型轉(zhuǎn)換方法舉例Poisson分佈平方根轉(zhuǎn)換水中細菌數(shù)、單位時間放射性計數(shù)等二項分佈反正弦函數(shù)轉(zhuǎn)換非傳染病患病率、白細胞百分數(shù)、淋巴細胞轉(zhuǎn)換率等標準差與均數(shù)呈正比關(guān)係對數(shù)轉(zhuǎn)換發(fā)汞含量122檢驗方法正態(tài)性用直方圖或正態(tài)概率紙進行觀察用矩法、W法或D法進行統(tǒng)計檢驗兩組方差齊性F檢驗多組方差齊性Bartlett檢驗常用正態(tài)性及方差齊性檢驗的方法123常用非參數(shù)統(tǒng)計方法小結(jié)設(shè)計方法參數(shù)統(tǒng)計方法非參數(shù)統(tǒng)計方法配對比較配對t檢驗符號檢驗*、符號等級檢驗(Wilcoxon法)兩組比較成組比較t檢驗兩樣本等級秩和檢驗(WilcoxonMannandWhitney法)、中位數(shù)檢驗*配伍組比較隨機區(qū)組ANOVAM檢驗(Friedman法)多組比較完全隨機設(shè)計ANOVAH檢驗(KruskalandWallis法)124醫(yī)學數(shù)據(jù)統(tǒng)計分析方法選擇-流程圖125(三組及以上均數(shù)比較)126醫(yī)學數(shù)據(jù)統(tǒng)計分析方法選擇-流程圖(定性數(shù)據(jù):R×C表資料分析)127醫(yī)學數(shù)據(jù)統(tǒng)計分析方法選擇-流程圖統(tǒng)計學分析結(jié)果如何呈現(xiàn)?

統(tǒng)計量和概率為斜體:t,F(xiàn),P<0.05;

不是統(tǒng)計表一般為三線表

統(tǒng)計圖、表的標注要清楚P值:應盡可能給出具體的P值(如:P=0.023),但目前大多數(shù)的文獻中都只用P<0.05等說明。文字、統(tǒng)計表和統(tǒng)計圖相結(jié)合128統(tǒng)計檢驗結(jié)論的表達129由於統(tǒng)計檢驗不能得出差別的大小,因而結(jié)論不能說“有明顯差異”或“有顯著差異”,也不能說“差異非常顯著”,更不能說“差異明顯”。正確的說法應當是“差異有統(tǒng)計意義”或“差異有高度統(tǒng)計意義”兩組有顯著差異兩組差異有統(tǒng)計學意義×關(guān)聯(lián)有統(tǒng)計學意義常見統(tǒng)計學錯誤辯析(1)某文獻關(guān)於統(tǒng)計分析方法方面寫道:“測量參數(shù)以

表示。根據(jù)性別及骨密度(2.5s為界)分組,用兩樣本均數(shù)t檢驗對組間各形態(tài)計量參數(shù)進行統(tǒng)計分析(SPSS8.0軟體)。樣本均數(shù)與總體均數(shù)用t檢驗比較形態(tài)計量學參數(shù)與正常參考值之間的差異”130存在的問題:由數(shù)據(jù)可以看到標準差是平均數(shù)的1/2以上,甚至接近和超過平均數(shù)。這就提示數(shù)據(jù)嚴重偏離了正態(tài)分佈。因為,當數(shù)據(jù)不可能為負值(如日數(shù)),且樣本不是過小的時候,按正態(tài)分佈規(guī)律,平均數(shù)減3個標準差仍應是正數(shù)。131Noticet檢驗和方差分析是一種所謂“穩(wěn)建的”(robust)統(tǒng)計方法。就是說,當分佈偏離正態(tài)分佈不大時,對其結(jié)果的影響不大。但對於計量數(shù)據(jù)還是應當先做正態(tài)性檢驗。如果正態(tài)性檢驗結(jié)果認為數(shù)據(jù)不服從正態(tài),可以進行數(shù)據(jù)轉(zhuǎn)換,但比較麻煩。簡單的方法是用非參數(shù)統(tǒng)計,常用的有秩和檢驗和符號秩和檢驗等。132常見統(tǒng)計學錯誤辯析(2)某文獻關(guān)於燃煤型砷中毒患者皮膚組織中P53mt陽性表達在不同組別的差異A:癌;B:癌前病變;C:一般患者133存在的問題:在多組計量資料的組間兩兩比較時不可以用“一攬子比較”。所謂“一攬子比較”是進行多組比較時進行所有的兩兩比較。在進行兩組間比較時我們確定了第Ⅰ類錯誤的概率α。一般我們用α=0.05。如果做一攬子比較,α就會擴大,也即第Ⅰ類錯誤的概率擴大了。我們就會得到過多的假陽性結(jié)果。134Notice正確的做法應當是先做總的檢驗,然後再做多重比較。本例還有各組間方差不齊的問題。不宜用方差分析,而需用非參數(shù)統(tǒng)計方法來處理。135常見統(tǒng)計學錯誤辯析(3)在表3這個假設(shè)的例子中,Pearsonχ2

檢驗得到差別有高度統(tǒng)計意義的結(jié)果。是否可認為A藥好於B藥?136存在的問題:2組有效率的比較,用四格表χ2檢驗或Fisher精確檢驗法是可以的。但是,如按療效分成多個等級,如痊癒、顯效、進步、無效4個療效等級,則目前常用的χ2

(Pearsonχ2

)不能說明療效的好壞。如果我們對表3中任何兩列進行對換,Pearsonχ2

的數(shù)值也不會有變化。137138常用統(tǒng)計軟體SASSTATASPSS139常用統(tǒng)計軟體SASSTATASPSSSPSS公司成立於1968年,總部在芝加哥。在納斯達克上市的股票代碼為SPSS。它在全球100多個國家和地區(qū)有分支機構(gòu)或合作夥伴,直屬員工超過2000人。140141SPSS軟體簡介SPSS原為StatisticalPackagefortheSocialSciences的簡稱,意為“社會科學統(tǒng)計軟體包”。2002年SPSS公司正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統(tǒng)計產(chǎn)品與服務解決方案”。近年來版本不斷更新。SPSS

社會科學統(tǒng)計軟體包(Statistical

Packageforthe

Social

Sciences)SPSS

統(tǒng)計產(chǎn)品與服務解決方案(Statistical

Productand

Service

Solutions)142SPSS13菜單式操作易學易用143PASW(SPSS18)Between2009and2010thepremiersoftwareforSPSSwascalledPASW(PredictiveAnalyticsSoftWare)Statistics.2009年4月9日美國芝加哥SPSS公司宣佈重新包裝旗下的SPSS產(chǎn)品線,定位為預測統(tǒng)計分析軟體(PredictiveAnalyticsSoftware)PASW.ThecompanyannouncedJuly28,2009thatitwasbeingacquiredbyIBMforUS$1.2billion.AsofJanuary2010,itbecame"SPSS:AnIBMCompany".IBM於2009年7月28日宣佈以12億美元收購SPSS公司,SPSS正式成為IBMInformationManagement產(chǎn)品線下品牌。

144PASW

Statistics18中文版介面PASWStatisticsFamily的每個模組都可以獨立安裝和運行,或者是幾個模組組合在一起,每個模組都擁有數(shù)據(jù)訪問、數(shù)據(jù)管理和繪圖功能。IBMSPSSStatistics20145多國語言可以切換功能更強大146SPSS軟體簡介SPSSforWindows是一個集數(shù)據(jù)整理、分析功能於一身的組合式軟體包。SPSS的基本功能:數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等早期SPSS是DOS版的147

基本窗口

TheFourWindows:

Dataeditor

(主窗口,數(shù)據(jù)管理)

Outputviewer

(輸出窗口)Syntaxeditor

(命令編輯)Scriptwindow

(腳本)我們應用SPSS時接觸最多的兩個窗口148TheFourWindows:DataEditorDataEditor

數(shù)據(jù)編輯 Spreadsheet-likesystemfordefining,entering,editing,anddisplayingdata.Extensionofthesavedfilewillbe“.sav”149TheFourWindows:OutputViewerOutputViewer

結(jié)果輸出 Displaysoutputanderrors.Extensionofthesavedfilewillbe“spo”(SPSS13);spv(SPSS16-)150TheFourWindows:SyntaxeditorSyntaxEditor Texteditorforsyntaxcomposition.Extensionofthesavedfilewillbe*.sps例如:我們對年齡進行統(tǒng)計描述,菜單式操作背後的命令語句是這樣的,執(zhí)行該語句可獲得相同結(jié)果151TheFourWindows:ScriptWindowScriptWindow Providestheopportunitytowritefull-blownprograms,inaBASIC-likelanguage.Texteditorforsyntaxcomposition.Extensionofthesavedfilewillbe“.sbs”152STEP1:讓我們先打開SPSS程式153STEP1:讓我們先打開SPSS程式改變介面語言154155SPSS數(shù)據(jù)錄入與管理ThedefaultwindowwillhavethedataeditorTherearetwosheetsinthewindow:1.Dataview(錄入或流覽記錄)

2.Variableview(定義變數(shù),包括字段名稱、字段類型、長度、標籤等)ClickClick156數(shù)據(jù)的錄入157單擊變數(shù)視圖數(shù)據(jù)錄入和分析前,我們需先定義字段(變數(shù),),有兩種方法可進入變數(shù)定義狀態(tài):在數(shù)據(jù)視圖下雙擊變數(shù)158數(shù)據(jù)錄入:Name(變數(shù)名)Thefirstcharacterofthevariablenamemustbealphabetic.Variablenamesmustbeunique.SpacesareNOTallowed.定義變數(shù)名不同版本對於變數(shù)名的限制不同但變數(shù)名應儘量簡化雖然SPSS支持,但不建議使用中文作為變數(shù)名159數(shù)據(jù)錄入:Type定義變數(shù)類型160數(shù)據(jù)錄入:Width寬度determinethenumberofcharactersSPSSwillallowtobeenteredforthevariable定義變數(shù)長度161數(shù)據(jù)錄入:DecimalsNumberofdecimals(小數(shù)位數(shù))定義數(shù)值變數(shù)的小數(shù)點位數(shù)對於字元型和日期型變數(shù)該選項無效162數(shù)據(jù)錄入:Labelspecifythedetailsofthevariable(標籤)定義變數(shù)標籤,提示你變數(shù)的含義,有利於統(tǒng)計分析163數(shù)據(jù)錄入:Values(1)suggestwhichnumbersrepresentwhichcategorieswhenthevariablerepresentsacategory(變數(shù)值標籤)Click別忘了點添加

定義變數(shù)值標籤,例如:數(shù)據(jù)錄入時我們一般以數(shù)值型變數(shù)表示性別,如(1)男,(2)女。通過設(shè)置標籤值就可讓軟體知道1=男,2=女164數(shù)據(jù)錄入:Values(2)Click點擊該按鈕用於讓軟體知道是顯示原始數(shù)值?還是顯示標籤值?165Practice1姓名性別1=男;2=女年齡工作時間張三1201990.1.20王五1301991.2.21趙六2401992.3.22錢七2301994.4.23試建立SPSS資料庫,錄入下列資料,並保存為test1.sav不建議用中文作為變數(shù)名166Openanexistingdatabase

打開一個已有數(shù)據(jù)庫SPSS資料庫格式*.sav

167SPSS(*.sav)SPSS數(shù)據(jù)檔EXCEL(*.xls)EXCEL數(shù)據(jù)檔SAS(*.sd2)SAS數(shù)據(jù)檔dBase(*.dbf)dBase系列數(shù)據(jù)檔Text(*.txt)純文本格式的數(shù)據(jù)檔data(*.dat)純文本格式的數(shù)據(jù)檔

SPSS軟體常用資料庫類型168文本數(shù)據(jù)的讀入使用文本導入嚮導讀入文本類型的數(shù)據(jù)*.txtNotice:支持EXCEL檔直接copy/paster但請注意變數(shù)句和類型的修正169可直接打開EXCEL檔170使用數(shù)據(jù)轉(zhuǎn)換軟體進行多種檔格式間的互轉(zhuǎn)如Stata/Transfer常用編輯菜單快捷菜單中有類似功能鍵171172InsertVariables/Cases

“插入變數(shù)”或“插入記錄”

將游標置於不同位置,點擊右鍵,快捷菜單會彈出相應的“插入變數(shù)”或“插入記錄”選項插入變數(shù)插入記錄變數(shù)屬性的定義外部檔格式(如Excel或文本檔)讀入的數(shù)據(jù),缺乏某些有用的變數(shù)屬性,包括:?

描述值標籤的定義(例如:0=

Male

和1=

Female)。?

缺失值代碼的標識(例如:99=

缺失值)。?

指定測量級別(名義、有序或刻度)。變數(shù)屬性可在數(shù)據(jù)編輯器的“變數(shù)視圖”中指定。還可以使用其他程式,如:

173174數(shù)據(jù)的管理檔級別的管理變數(shù)級別的管理175檔級別的管理常用命令:查找重複的記錄排序?qū)⒍鄠€檔合併為1個檔將1個檔拆分,分別輸出結(jié)果選擇記錄分析加權(quán)176SortCase...排序?qū)①Y料庫按某一個或多個變數(shù)排序昇冪Accednding降序Decending177SortCase...排序在某一變數(shù)名上點擊滑鼠右鍵同樣可進行排序操作178轉(zhuǎn)置Transpose...將資料庫的行列,列行179大家還記得EPIDATA中的縱向追加記錄和橫向合併字段嗎?縱向合併橫向合併MergeFiles...資料庫合併180AddCases...添加個案原則:兩個待合併的SPSS數(shù)據(jù)檔,其內(nèi)容合併是有實際意義的;為方便SPSS數(shù)據(jù)檔的合併,在不同數(shù)據(jù)檔中,數(shù)據(jù)含義相同的列,最好起相同的檔案名,變數(shù)類型和變數(shù)長度也要儘量相同,這樣方便SPSS對變數(shù)的自動對應和匹配。181AddVariables...添加變數(shù)原則:如果不是按照記錄號對應的規(guī)則進行合併,則兩個數(shù)據(jù)檔必須至少有一個變數(shù)名相同的公共變數(shù),這個變數(shù)是兩個數(shù)據(jù)檔橫向?qū)蟻愕囊罁?jù),稱為關(guān)鍵變數(shù);如果是使用關(guān)鍵變數(shù)進行合併的對應,則兩個數(shù)據(jù)檔都必須事先按關(guān)鍵變數(shù)進行排序,否則會出錯;為方便SPSS數(shù)據(jù)檔的合併,在不同數(shù)據(jù)檔中,數(shù)據(jù)含義不同的列,變數(shù)名不應該取相同的名稱。182AddVariables添加變數(shù)合併數(shù)據(jù)A與數(shù)據(jù)B,以no為關(guān)鍵變數(shù)183184*橫向合併一定要按照關(guān)鍵變數(shù)進行排序185選擇不同的合併方式,合併後的資料庫不同186Practice2姓名身高(CM)體重(Kg)張三17060王五16070趙六16580錢八17590試建立SPSS資料庫,錄入下列資料,並保存為test2.sav試將test1與test2兩個數(shù)據(jù)庫橫向合併,產(chǎn)生一新資料庫,命名為test12,保存於桌面。NOTICE187實際應用中儘量使用數(shù)值型變數(shù)為識別(KEY)變數(shù),如記錄號ID,便於資料庫合併,且需唯一。注意SORT。188Practice3姓名性別年齡工作時間李一2501950.1.20孫二1401961.2.21劉三1401962.3.22馬四2601944.4.23試建立SPSS資料庫,錄入下列資料,並保存於桌面,檔案名test3.sav性別:1=男;2=女試將test1與test3兩個數(shù)據(jù)庫合併,產(chǎn)生一新資料庫,命名為test13,保存於桌面。比較一下兩種合併方式的異同。189SplitFile...例如:我們欲分別比較男性和女性的某些特徵,可以採用檔分割功能,按性別分割,結(jié)果將會按性別分層分別輸出。拆分文件190SelectCases...對於前例我們也可以採用selectcases功能按性別進行統(tǒng)計分析,與Split不同的是,該選項無法實現(xiàn)男性和女性的結(jié)果同時輸出,需分別select

ifsex=1(男);ifsex=2(女)選擇個案191SelectCases...選擇個案分析所有的記錄,沒有select只分析滿足條件的記錄(常用)刪除(慎用)過濾未被選中的記錄將從資料庫中刪除,謹慎操作192WeightCases...加權(quán)個案請思考一下,如何錄入下列數(shù)據(jù)?性別人數(shù)男5女10性別:1=男;2=女一種錄入方法193假如不是15例,而是100例、1000例…呢?194加權(quán)WeightCases...另一種方法通過weight,告訴SPSS該變數(shù)是頻數(shù),f=5表示有5條記錄以example.sav為例,假定我們錯誤地將id(198)錄入兩次,id(199)錄入了三次,如何利用SPSS正確識別出來?*有幾種方法?195記錄重複的識別196記錄重複的識別識別變數(shù)是否產(chǎn)生新變數(shù),用於指示記錄197常用命令:計算變數(shù)重新編碼日期和時間嚮導變數(shù)級別的管理198Compute...計算變數(shù)(可以根據(jù)現(xiàn)有變數(shù)或直接)生成一新變數(shù)。例如:收縮壓共測量了三次,我們需產(chǎn)生一新變數(shù)sbp,等於三次的平均值。可使用函數(shù)功能進行計算Sbp=(sbp1+sbp2+sbp3)/3可定義條件1991、計算平均的收縮壓和舒張壓:2、計算BMI:Practice4分析資料庫example.sav,200Recode...重新編碼重新產(chǎn)生一新變數(shù),原變數(shù)不變(建議使用)對變數(shù)自身賦值,將改變原變數(shù)數(shù)值對變數(shù)進行賦值,可以將連續(xù)性變數(shù)分類化。例如:年齡可以通過該命令劃分為不同的年齡組。201IntoSameVariables重新編碼為相同變數(shù)1.先確定需賦值的變數(shù)對變數(shù)自身賦值,將改變原變數(shù)數(shù)值2.點擊舊值和新值3.選擇原變數(shù)相應的賦值規(guī)則4.定義新值,別忘了點添加

202IntoDifferentVariables重新編碼為不同變數(shù)定義新變數(shù)名後,別忘了點‘更改’重新產(chǎn)生一新變數(shù),原變數(shù)不變1.先確定需賦值的變數(shù)2.定義新變數(shù)名3.點擊oldandnewvariables4.選擇原變數(shù)相應的賦值規(guī)則5.定義新值,別忘了點Add變數(shù)賦值規(guī)則(以年齡為例)203以年齡為例某一具體年齡值某年齡範圍,如15-25歲從最小值至某一年齡,如=<25歲從某一年齡至最大值,如>=25歲204練習:1、IntoSameVariables

將性別變數(shù)編碼(1=男;2=女)修改為2=男;1=女2、IntoDifferentVariables

根據(jù)計算出來的BMI分組,產(chǎn)生新變數(shù)obesity,變數(shù)賦值1:BMI<25(正常),2:25-29(超重),3:>=30(肥胖)Practice5分析資料庫example.sav205Date/time與時間有關(guān)變數(shù)的便捷處理方法例如:已知調(diào)查日期和出生日期,可利用此功能計算研究對象的年齡(=調(diào)查日期-出生日期)206Date/time(以計算年齡為例)207統(tǒng)計資料的描述指標描述

集中位置:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)

離散程度:極差、標準差、方差、四分位數(shù)間距圖形描述

頻數(shù)分佈圖 趨勢圖……計量資料集中趨勢的描述算術(shù)均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)208計量資料209極差/全距(range)四分位數(shù)間距(inter-quartilerange)

方差(variance)標準差SD

(standarddeviation)變異係數(shù)CV

(coefficientofvariation)

描述離散程度的指標:計量資料210基本描述統(tǒng)計分析SPSS的許多模組均可以完成統(tǒng)計描述的任務。除了各種可以用於統(tǒng)計推斷的過程會附帶進行相關(guān)的統(tǒng)計描述外,SPSS還專門提供了幾個用於統(tǒng)計描述的過程,均集中在描述統(tǒng)計子菜單中。常用命令211頻率requencies…能計算各種百分位數(shù),描述數(shù)據(jù)的分佈特徵,既可以描述連續(xù)性變數(shù),又可以描述分類變數(shù)是否顯示頻數(shù)表集中趨勢百分位數(shù)離散趨勢正態(tài)檢驗212

結(jié)果輸出窗口中文顯示不正確,可在編輯>選項中修改字體。213可以調(diào)整SPSS結(jié)果中表格的輸出格式

如是否需豎線、是否三線表等

編輯>選項214描述Descriptives…類似頻率過程可描述的統(tǒng)計指標與“頻率”命令有些不同215探索Explore…判斷有無離群點或極端值提示數(shù)據(jù)轉(zhuǎn)換方法瞭解組間差異的特徵給出統(tǒng)計量、正態(tài)檢驗和描述性統(tǒng)計圖,包括莖葉圖、直方圖及箱圖該過程用於對連續(xù)性資料分佈狀況不清楚時的探索性分析,可以計算許多描述統(tǒng)計量,給出各種統(tǒng)計圖,並進行簡單的參數(shù)估計216探索Explore…需分析的變數(shù),可選1個或多個分組變數(shù)。如有多個分組變數(shù),則分別分組描述記錄標籤,如ID編號,可不填僅統(tǒng)計圖僅統(tǒng)計描述217缺失值處理繪製圖形描述統(tǒng)計量218探索Explore…最大、最小極端值一般描述百分位數(shù):5%、25%、50%、75%、90%、95%219探索Explore…莖葉圖直方圖正態(tài)檢驗圖探索過程不僅具有統(tǒng)計描述的功能,還能繪製統(tǒng)計圖散佈-層次圖;組間方差齊性檢驗,如未指定分組變數(shù),該選項無效220Exercise:(1)對example.sav中研究對象的身高分佈進行描述,填寫下表(2)僅分析男性(3)按男女性分別描述變數(shù)合計男女變數(shù)合計男女調(diào)查人數(shù)標準差均數(shù)

最小值

中位數(shù)

最大值

眾數(shù)

極差

10%位數(shù)

思考一下有幾種方法?分類變數(shù)的描述率比構(gòu)成比病例(%)對照(%)不吸煙100(10)500(50)吸煙900(90)500(50)221例如:對於分類變數(shù),我們常用這種R*C表格表示,這在SPSS中如何實現(xiàn)呢?222交叉表Crosstabs…行列分層變數(shù)交叉表,是分類資料統(tǒng)計分析常用的命令之一,不僅具有描述功能,還可以進行卡方檢驗、精確檢驗、分層分析等223如何在格子中顯示百分比呢?可以點擊在“編輯〉選項”更改顯示變數(shù)名還是標籤;顯示變數(shù)標籤的真實值還是標籤值?224統(tǒng)計構(gòu)成比225Exercise例:對example.sav中男性與女性文化程度的差異列表進行描述性別小學或以下(%)初中或以上(%)男女226一、均數(shù)的計算方法計量資料的均數(shù)和標準差計算可採用上節(jié)課介紹的分析→描述統(tǒng)計→***如果分組(如按性別)計算均數(shù)和標準差可以:(1)拆分文件或(2)選擇個案或(3)

分析→描述統(tǒng)計→探索還有什麼方法嗎?227均數(shù)與均數(shù)間的比較一、均數(shù)的計算方法分析Analyze→比較均值CompareMeans→均值Means試采用多種方法計算example.sav中,男性和女性的平均年齡與標準差。分組變數(shù)可選的統(tǒng)計量可再添加分組變數(shù)228均數(shù)與均數(shù)間的比較上例僅是對男女性年齡的均數(shù)和標準差進行了描述,那麼男性和女性的年齡差異是否存在統(tǒng)計學意義呢?這類資料應該採用何種統(tǒng)計學檢驗方法?性別MeanStd.Deviation男55.109.991女54.579.500Total54.909.787age229均數(shù)間的比較一、t檢驗

1、樣本均數(shù)與總體均數(shù)的比較

2、完全隨機設(shè)計(成組設(shè)計)的兩樣本均數(shù)的比較

3、配對設(shè)計的兩樣本均數(shù)比較二、方差分析

1、完全隨機設(shè)計(成組設(shè)計)的單因素方差分析

2、隨機區(qū)組設(shè)計(配伍設(shè)計)的兩因素方差分析三、協(xié)方差分析230樣本均數(shù)與已知總體均數(shù)的比較231樣本均數(shù)與已知總體均數(shù)的比較例:通過大量調(diào)查,已知某地正常男嬰體重為3.26Kg,某醫(yī)生隨機抽取20名難產(chǎn)男嬰,測得出生體重如下:問,該地難產(chǎn)男嬰體重是否不同於本地正常男嬰?3.53.53.23.53.33.03.33.23.42.73.43.63.52.83.42.93.53.54.04.0

SPSS分析命令:分析Analyze→比較均值CompareMeans→單樣本t檢驗One-SampleTTest…資料庫:onesampleTtest.sav232樣本均數(shù)與已知總體均數(shù)的比較總體均數(shù)233樣本均數(shù)與已知總體均數(shù)的比較結(jié)論:不能認為難產(chǎn)男嬰的出生體重與正常男嬰不同。P

值自由度t值234

成組比較t檢驗需注意:個體之間相互獨立兩組資料均取自正態(tài)分佈的總體滿足方差齊性235完全隨機設(shè)計(成組設(shè)計)兩個樣本均數(shù)的比較例:某醫(yī)生測得12名正常人和13名病毒性肝炎患者血清轉(zhuǎn)鐵蛋白含量(g/L)結(jié)果如下:問肝炎患者和正常人血清轉(zhuǎn)鐵蛋白含量有無差異?病毒性肝炎患者:2.342.472.222.312.362.382.152.572.192.252.282.312.42正常人:

2.612.712.732.642.682.812.762.552.912.852.712.64Q:此類數(shù)據(jù)如何錄入?資料庫:IndependentSamplesTTest.sav236完全隨機設(shè)計(成組設(shè)計)兩個樣本均數(shù)的比較分析變數(shù)分組變數(shù)237完全隨機設(shè)計(成組設(shè)計)兩個樣本均數(shù)的比較統(tǒng)計描述方差齊性檢驗結(jié)論:病毒性肝炎患者與正常人血清轉(zhuǎn)鐵蛋白含量差異有統(tǒng)計學意義。238239配對t檢驗240配對設(shè)計的兩個樣本均數(shù)比較(配對t檢驗)例:為比較某新藥與常規(guī)藥降血脂的效果,將性別相同、血清總膽固醇水準相近的高血脂患者配成對子,每對中隨機抽取一個人服用新藥,另一個人服用常規(guī)藥。服用一段時間後,測得血清總膽固醇含量(mmol/L)如下:問新藥與常規(guī)藥降血清總膽固醇效果是否相同?新藥:6.576.466.276.896.217.617.607.046.687.42常規(guī)藥:6.006.835.977.286.306.647.387.006.037.22

SPSS分析命令:Q:此類數(shù)據(jù)如何錄入?paired-sampleTtest.sav241配對設(shè)計的兩個樣本均數(shù)比較選中欲比較的兩個因素,再點擊◥242配對設(shè)計的兩個樣本均數(shù)比較結(jié)論:不能認為新藥與常規(guī)藥降低血清總膽固醇的效果不同。配對差值243Q:能否採用我們前面學過的單樣本T檢驗(樣本均數(shù)與已知總體均數(shù)比較)比較新藥與常規(guī)藥降血清總膽固醇效果是否相同?244Compute計算產(chǎn)生一新變數(shù)d,d=group1-group2檢驗d=02452組均數(shù)比較可採用t-test

多組均數(shù)如何比較?246方差分析AnalysisofVariance,ANOVA方差分析的目的:推斷兩個或多個總體均數(shù)是否相等方差分析的使用條件:各處理組樣本來自正態(tài)總體各樣本是相互獨立的隨機樣本各處理組的總體方差相等,即方差齊性247方差分析的結(jié)果解釋:方差分析的F檢驗,當P<0.05,可以認為各組總體均數(shù)不等或不全相等,但並不可認為任意兩組總體均數(shù)都有差別。需要進一步作兩兩比較才能知道哪些組間有差別。多個樣本均數(shù)間的兩兩比較當樣本組數(shù)大於2時,不宜再用前述的t檢驗分別作兩兩比較,否則會增大犯第一類錯誤的概率。方差分析與t檢驗的聯(lián)繫

t檢驗可以看作時方差分析的特例:方差分析的注意事項248完全隨機設(shè)計方差分析

(成組設(shè)計)249250完全隨機設(shè)計(成組設(shè)計)的單因素方差分析1個因素,k個水準例:某社區(qū)隨機抽取30名糖尿病患者、糖耐量減低(IGT)者和正常人進行載脂蛋白(mg/dl)測定,結(jié)果如下:問三種人載脂蛋白水準有無差別?糖尿病患者:85.70105.20109.5096.00115.2095.30110.00100.00125.60111.00106.50IGT異常者:96.00124.50105.1076.4095.30110.0095.2099.00120.00正常人:144.00117.00110.00109.00103.00123.00127.00121.00159.00115.00

方法一:Q:此類數(shù)據(jù)如何錄入?One-wayANOVA.sav251完全隨機設(shè)計(成組設(shè)計)的單因素方差分析1個因素,k個水準分組變數(shù)分析變數(shù)252方差齊性檢驗輸出描述統(tǒng)計量253完全隨機設(shè)計(成組設(shè)計)的單因素方差分析1個因素,k個水準結(jié)論:可以認為三種人血清載脂蛋白水準有差別。但哪兩組間有區(qū)別呢?254兩兩比較假定方差齊時假定方差不齊時255兩兩比較256兩兩比較每兩個均數(shù)進行比較AB、AC、BCABC257兩兩比較分別與對照組進行比較AC、BCABC(對照)258前述的方差分析還可以通過一般線性模型實現(xiàn)Analyze→GeneralLinearModel→Univariate…因變數(shù)分組變數(shù)協(xié)變數(shù)259組間變異組內(nèi)變異總變異除了方差分析表不同以外,方法一和方法二的其他輸出結(jié)果是一致的:260

SPSS分析命令:Analyze→GeneralLinearModel→Univariate…隨機區(qū)組設(shè)計(配伍組設(shè)計)資料的方差分析(1個研究因素a個水準,1個配伍組因素b個水準)例:為探索丹參對肢體缺血再灌注損傷的影響,將30只純種新西蘭實驗用大白兔,按窩別相同、體重相近劃分為10個區(qū)組。每個區(qū)組3只大白兔隨機採用A、B、C三種處理方案,即在松止血帶前分別給予丹參2ml/kg、丹參1ml/kg、生理鹽水2ml/kg,在松止血帶前及松後1小時分別測定血中白蛋白含量(g/L),算出白蛋白減少量。問三種方案的處理效果是否不同?GLMUnivariate.sav261白蛋白減少量A、B、C三種處理方案區(qū)組因素(配伍組)262分組變數(shù)分析變數(shù)263分析主效應或交互作用分析所有主效應和交互作用264隨機區(qū)組設(shè)計資料的方差分析組間區(qū)組組內(nèi)結(jié)論:認為10個區(qū)組的總體均數(shù)相同。但是,A、B、C三種方案的處理效果不全相同,即三個總體均數(shù)中至少有兩個不同。至於三個總體均數(shù)中哪些不同,同樣需要進行多個均數(shù)間的兩兩比較。265隨機區(qū)組設(shè)計資料的方差分析結(jié)論:認為A、B種方案的處理效果沒有差異,但均與C種處理方案的效果有差異,松止血帶前給予丹參能使血中白蛋白含量降低。SNK法兩兩比較266協(xié)方差分析AnalysisofCovariance,ANCOVAANCOVA的目的將協(xié)變數(shù)對因變數(shù)的影響從引數(shù)中分離出去,可以進一步提高實驗精確度和統(tǒng)計檢驗靈敏度ANCOVA的適用條件各處理組樣本來自正態(tài)總體各樣本是相互獨立的隨機樣本各處理組的總體方差相等,即方差齊性各組的回歸斜率相等,即回歸齊性267一元協(xié)方差分析例:研究鎘作業(yè)工人暴露於煙塵的年數(shù)與肺活量的關(guān)係。按暴露年數(shù)將工人分為兩組:甲組暴露≥

10年,乙組暴露<10年。兩組工人的年齡未經(jīng)控制。測得兩組年齡及肺活量如下,問兩組暴露於鎘作業(yè)工人平均肺活量是否相同?ancova.sav268SPSS操作步驟:先檢驗是否滿足回歸齊性的假定;若滿足回歸齊性的假定,則可以採用ANCOVA。1、檢驗回歸齊性的方法作圖法檢驗研究因素與協(xié)變數(shù)的交互作用2、ANCOVA方法2691、檢驗回歸齊性的方法作圖法:對兩組X、Y分別作散點圖,並擬合回歸直線,觀察組間回歸直線是否平行。若平行,則滿足回歸齊性的假定。簡單直觀,但具有主觀性。270Doubleclick圖片

打開圖片編輯器,添加趨勢線按分組變數(shù)顯示不同顏色的點2712722731、檢驗回歸齊性的方法檢驗研究因素與協(xié)變數(shù)的交互作用274275交互作用項276結(jié)論:研究因素與協(xié)變數(shù)的交互作用無統(tǒng)計學意義(P>0.05),滿足回歸齊性的假定,因此可以採用ANCOVA。交互作用項2772、ANCOVA方法278結(jié)論:扣除了年齡對肺活量的影響後,不能認為甲、乙兩組工人的肺活量有差別。279分類變數(shù)的統(tǒng)計分析

1、成組設(shè)計的兩樣本率比較

2、配對設(shè)計的兩樣本率比較

3、完全隨機設(shè)計的多個樣本率比較280完全隨機設(shè)計兩個樣本率的比較例1:某中藥在改變劑型前曾在臨床觀察152例,治癒129例,未治癒23例;改變劑型後又在臨床觀察130例,治癒101例,未治癒29例,能否得出新劑型療效與舊劑型不同的結(jié)論?療效合計治癒未治癒新劑型12923152舊劑型10129130合計23052282crosstabs1.sav281完全隨機設(shè)計兩個樣本率的比較282完全隨機設(shè)計兩個樣本率的比較283SPSS分析命令:→DescriptiveStatistics→Crosstabs…284行變數(shù)列變數(shù)285286287288例2:某礦石粉廠當生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)即有部分工人患職業(yè)性皮炎,本生產(chǎn)季節(jié)開始,隨機抽取15名車間工人穿上新防護服,其中1名患皮炎,其餘28名工人仍穿舊防護服,其中10名患皮炎。生產(chǎn)一段時間後,檢查兩組工人皮炎患病率,問兩組工人皮炎患病率有無差異?皮炎患病情況合計患病未患病新防護服11415舊防護服101828合計113243crosstabs2.sav289290例3:某醫(yī)師A藥治療9例病人,治癒7人;用B藥治療10例病人,治癒1人,問兩藥療效是否有差別?療效合計治癒未治癒A藥729B藥1910合計81119crosstabs3.sav291292配對設(shè)計兩個樣本率的比較例1:分別用反向血凝法和酶標法對200名獻血員進行HBsAg檢測,結(jié)果如下,問兩種檢驗方法檢出率有無差異?反向血凝法合計+-酶標法+-3018482150152合計32168200pair-crosstab.sav293方法一:交叉表Crosstabs294295296方法二:非參數(shù)檢驗NonparametricTest297非參數(shù)檢驗NonparametricTest298非參數(shù)檢驗NonparametricTest精確概率法299完全隨機設(shè)計的多個樣本率的比較例:某省從水氟含量不同的地區(qū)隨機抽取10-12歲兒童,進行第一恒齒患病率的調(diào)查,問3個地區(qū)第一恒齒患病率是否不同?地區(qū)患病數(shù)合計高氟區(qū)4571干預區(qū)3146低氟區(qū)4348合計119165300完全隨機設(shè)計的多個樣本率的比較資料整理地區(qū)患病數(shù)未患病數(shù)合計高氟區(qū)452671干預區(qū)311546低氟區(qū)43548合計11946165crosstabs4.sav301SPSS分析命令:Analyze→DescriptiveStatistics→Crosstabs…完全隨機設(shè)計的多個樣本率的比較crosstabs4.sav302結(jié)論:3個地區(qū)第一恒齒患病率不同或不全相同。303分層分析與混雜偏倚混雜偏倚(confoundingbias)是指暴露因素與疾病發(fā)生的相關(guān)(關(guān)聯(lián))程度受到其他因素的歪曲或干擾。由於一個或多個外來因素的存在,掩蓋或誇大了研究因素與疾病(或事件)的聯(lián)繫,從而部分或全部地歪曲了兩者之間的真實聯(lián)繫304混雜偏倚ConfoundingExposure

OutcomeThirdvariable(Confounder)混雜因素具有下述三項特點:

(1)混雜因素必須與所研究疾病的發(fā)生有關(guān),是該疾病的危險因素之一。(2)混雜因素必須與所研究因素有關(guān)。(3)混雜因素必須不是研究因素與疾病病因鏈上的中間環(huán)節(jié)或中間步驟。305混雜偏倚的控制在設(shè)計階段:可以通過配比、隨機化分配或限制進入(選擇混雜因素的某個層的對象)等方法來控制。在統(tǒng)計分析階段:可採用標準化率分析、分層分析和多因素分析等來控制。306M-H(Mantel-Haenszel)

分層分析法對可能的混雜因素進行分層,在各層內(nèi)混雜因素就不再可能對暴露與疾病關(guān)聯(lián)起混雜干擾;(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論