版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、醫(yī)學數據處理與SPSS實用技術1目 錄SPSS 13-23界面介紹(1學時)數據庫建立和結果輸出(1學時)數據整理(1學時)數據變換(1學時)報表(1學時)常用統(tǒng)計圖(3學時)統(tǒng)計描述(2學時)2T檢驗(2學時)非參數檢驗(4學時)方差分析(4學時)相關分析(4學時)線性回歸分析(4學時)Logistic回歸分析(4學時)生存分析(4學時)案例分析(4學時)3SPSS 13-23 界面介紹(Statistical Products and Services Solutions )窗口類型介紹主界面菜單介紹對話框介紹SPSS系統(tǒng)設置目錄4窗口類型介紹數據編輯窗口變量編輯窗口5窗口類型介紹數據編輯
2、窗口變量編輯窗口6結果輸出窗口腳本編輯窗口命令語句編輯窗口7結果輸出窗口腳本編輯窗口命令語句編輯窗口8數據觀察/編輯窗口變量名個體序號數據格編輯欄數據格位置9數據觀察/編輯窗口變量名個體序號數據格編輯欄數據格位置10變量定義選項:變量名類型數據位小數位標簽數值標簽缺失值數據量度變量定義編輯窗口欄寬對齊方式11主界面菜單介紹文件菜單編輯菜單視圖菜單12數據庫處理菜單變量變換菜單13統(tǒng)計分析菜單描述性統(tǒng)計子菜單統(tǒng)計分析菜單數據概況統(tǒng)計子菜單14統(tǒng)計分析菜單均數比較子菜單統(tǒng)計分析菜單一般線性模型子菜單15統(tǒng)計分析菜單相關分析子菜單統(tǒng)計分析菜單回歸分析子菜單16統(tǒng)計分析菜單對數線性分析生存分析非參數檢
3、驗分類分析17作圖菜單條形圖線圖面積圖圓圖散點圖直方圖圖形特性描述高_低圖誤差條圖箱圖18工具菜單變量信息定義變量使用變量19繪圖菜單發(fā)生了變化20對話框介紹變量類型設置對話框變量標簽設置對話框21SPSS系統(tǒng)設置Edit / Options 可以對數據、表格、草稿、標題、數據編輯器、結果閱讀器、草稿閱讀器視圖界面進行定義或修改。22新版本的選項23數據庫建立和結果輸出相關統(tǒng)計學概念(1)SPSS數據統(tǒng)計分析步驟數據庫的建立數據編輯數據保存、轉換和讀取結果輸出數據和結果打印目錄24相關統(tǒng)計學概念(1)總體(population):總體是根據研究目的確定的同質觀察 單位的全體,或者說是同質的所有
4、觀察單位某種觀察 值(變量值)的集合。樣本(sample):樣本是總體中隨機抽取部分觀察單位,其 實測值的集合。隨機抽樣就是按隨機化原則(即總體 中每一個觀察單位都有同等機會被選入到樣本中來)獲 取樣本,以避免誤差和偏倚對研究結果有所影響。樣本 包含的觀察單位稱樣本含量或樣本大?。╯ample size), 也稱樣本例數。資料和變量(data and variable):研究者對每個觀察單位的 某項特征進行測量和觀察 ,這種特征稱為變量。對變 量測得的值稱變量值(value of variable)或觀察值( observed value)亦稱為資料。觀察個體間的差異,稱 為變異(variat
5、ion)。25定量資料(quantitative data):數值變量(numerical variable) 其變量的值是定量的,表現(xiàn)為數值的大小,一般有度量 衡。分類資料(categorical data):分類變量( categorical variable ) 其觀察值是定性的,表現(xiàn)為互不相容的類別或屬性。 無序分類:陽性或陰性,治愈或未治愈 有序分類:治愈、顯效、好轉、無效概率(probability):概率是描述隨機事件發(fā)生的可能性大小的 數值,常用P表示。隨機事件概率的大小在0與1之間,既 0 P 1。P值越接近于1,表示某事件發(fā)生的可能性越大; P值越接近于0,表示某事件發(fā)生的
6、可能性越小。P=1表示 事件必然發(fā)生,P=0表示事件不可能發(fā)生。P 0.05稱為小 概率事件,表示在一次實驗或觀察中該事件發(fā)生的可能性 很小,可以認為很可能不發(fā)生。26SPSS 數據統(tǒng)計分析步驟輸入供SPSS分析的數據選擇統(tǒng)計分析過程為統(tǒng)計分析選擇變量運行過程并對統(tǒng)計結果做出判斷27作業(yè)一:數據庫的建立-原始數據.sav問題舉例: 一個醫(yī)生觀察了一組住院病人,完成了其中24名患者的資料收集,指標包括:觀察編號、住院號(inno)、年齡(age)、性別(sex)、身高(x1,cm)、體重(x2,kg)、血壓(收縮壓x3,舒張壓x4,mmHg)、空腹血糖(x5,mmol/L)和胰島素樣生長因子-1
7、水平(igf-1,ng/ml),并根據臨床情況將患者的病情分為5級( x0 ,1為正常,2為一級,3為二級,4為三級,5為四級),建立其原始數據表。數據分析: 住院日期為日期變量 病情分級為有序變量(Ordinal) 性別為字符變量(in nominal) 其它各指標為連續(xù)變量(Scale) 注意到igf-1指標中有個體數據丟失或實驗誤差28 編號 inno indate age sex x0 x1 x2 x3 x4 x5 ifg-1 155 17442 10/21/1996 23.0 男 3 166.0 52.5 108 78 8.90 186.63 177 17281 10/16/1996
8、 25.2 女 5 160.0 60.0 90 50 5.99 230.32 118 17264 10/15/1996 26.4 女 4 164.0 58.5 100 80 7.59 117.45 171 20999 02/25/1997 28.0 男 2 172.0 61.2 110 70 14.07 105.74 70 24797 06/27/1997 32.0 女 2 152.0 42.0 118 76 5.89 135.89 49 17204 10/14/1996 33.9 女 2 157.0 58.0 146 86 12.41 8.33 64 19503 01/23/1997 35.
9、0 男 3 167.0 68.0 124 76 7.94 162.40 166 28460 10/20/1997 38.0 女 1 153.5 50.5 114 62 8.81 416.74 17 41332 10/26/1998 43.2 男 3 174.0 80.0 144 94 12.60 141.73 158 28117 10/09/1997 45.0 女 2 155.0 67.0 180 110 5.76 297.58 146 19218 12/17/1996 48.1 男 2 178.0 69.0 110 72 7.44 234.85 240 43437 12/21/1998 49
10、.3 男 3 173.0 69.0 110 70 9.80 467.81 42 22075 03/31/1997 52.8 男 2 163.0 62.0 125 80 14.87 150.62 72 22239 04/07/1997 54.2 男 2 167.5 72.0 140 90 7.80 172.55 195 31257 01/08/1998 57.3 女 2 143.5 41.5 152 88 13.53 0 .00 20 40910 10/13/1998 58.8 男 2 168.0 61.5 110 70 15.80 120.42 22 41965 11/11/1998 62.8
11、 男 2 160.0 60.0 140 90 8.83 160.37 36 24681 06/24/1997 65.6 男 3 162.0 52.0 166 70 17.79 180.41 16 41231 10/22/1998 67.4 女 2 153.0 62.0 140 86 11.94 175.18 62 44951 02/05/1999 68.9 女 1 145.0 42.0 108 50 11.72 160.33 172 45549 03/03/1999 71.1 女 4 151.0 61.5 150 90 15.80 145.97 14 36978 06/25/1998 72.3
12、 女 2 148.0 50.0 96 66 16.88 181.51 38 24868 06/30/1997 73.0 女 2 149.0 51.5 116 74 13.16 129.26 24 43579 12/25/1998 74.6 男 4 170.0 60.0 160 86 9.37 350.09原始數據表29數據編輯(1)剪切復制粘貼清除網格字體File / New / Data30數據編輯(2)Data / Insert Case 插入個體31數據編輯(3)Data / Insert Variable 插入變量32數據編輯_變量設置(1)Width、Decimals、Column選
13、項通過微調按鈕調整數值33數據編輯_變量設置(2)變量類型數值(默認)逗號點科學記數日期時間貨幣自定義數據類型字符34數據編輯_變量設置(3)數值標簽Value Labels數值數值標簽35數據編輯_變量設置(4)丟失值Missing Values沒有丟失值離散丟失值混合丟失值連續(xù)值離散值36數據編輯_變量設置(5)數據量度Measure有序變量名字變量連續(xù)變量37數據保存、轉換和讀取數據文件默認保存為 *.sav File / Save File / Save As可以將數據文件轉換為其它格式如:*.xls *.dat *.dbf File / Save As數據文件讀?。篎ile / Op
14、en /Data 直接讀取 *.sav文件或直接讀取 *.xls文件等數據文件38結果輸出(1)激活結果閱讀器 SPSS Viewer File / New / Output分析結果窗分析結果目錄窗39結果輸出(2)選擇分析過程,如:Means Analyze / Compare Means / Means 40修改選項內容:原文字為Mean更換為平均值41結果輸出(3)統(tǒng)計分析_圖表設置 Graphs / Bar 42 圖表結果輸出:可以通過Copy復制到其它應用程序,或Export輸出為圖形文件 *.jpg 默認輸出文件:*.spo43數據和結果打印可以根據需要打印全部或部分數據44數據整
15、理個體排序行列轉置合并文件選擇個體加權個體目錄45個體排序Data / Sort Cases選擇排序變量升序降序復置46按住院號inno排序結果_升序47行列轉置(Transpose)變量值轉換為變量名變量(Variable)轉換為個體(Case)丟失的變量復置Data / Transpose48行列轉換丟失了name、sex變量,以id變量值作為新數據表變量49合并文件(Merge File)-1Data / Merge files /Add Cases50合并文件_僅合并相同變量51Data / Merge files /Add Variables合并文件(Merge File)-252合
16、并文件_增加變量以主表為主合并所有個體53Data / Merge files /Add Variables合并文件(Merge File)-354合并文件_增加變量以主表為準合并相同個體55選擇個體(Select Cases)篩選某些符合特定條件的個體 Data / Select Cases全部個體若滿足條件隨機個體樣本基于時間或個體范圍應用變量過濾56條件表達式生成器函數選擇框輸入條件表達式符號按鈕框57若條件滿足過濾未滿足條件的個體58Filter_$=0非選擇個體Filter_$=1選擇個體59刪除未滿足條件的個體若條件滿足60僅保留符合條件的個體不符合條件的個體被刪除,不可恢復;因此
17、必須將其另存為新的數據文件。Sex=“女” and (x5=8 and x51女-273記數Transform / Count74170男性75報 表實時分析處理立體表綜合表行輸出綜合報告列輸出綜合報告目錄76實時多維分析立體表計算綜合變量統(tǒng)計量,顯示分組變量的統(tǒng)計量,但不能顯示變量值綜合表顯示分組變量各分類下綜合變量的統(tǒng)計量及變量值行輸出綜合報表以行的形式輸出統(tǒng)計量,列變量為綜合變量列輸出綜合報表以列的形式輸出統(tǒng)計量77sex age sbp_b dbp_b sbp_0 dbp_0 sbp_10 dbp_10 sbp_20 dbp_20 sbp_30 dbp_30 group 2 58 16
18、0.0 100.0 150.0 94.0 150.0 90.0 146.0 90.0 150.0 92.0 1 2 51 146.0 90.0 130.0 80.0 118.0 70.0 110.0 70.0 110.0 70.0 1 2 47 150.0 90.0 145.0 75.0 135.0 75.0 130.0 60.0 130.0 60.0 1 1 70 160.0 100.0 146.0 90.0 140.0 90.0 140.0 90.0 140.0 90.0 1 1 72 150.0 96.0 140.0 90.0 140.0 90.0 140.0 90.0 140.0 90
19、.0 1 1 60 170.0 100.0 148.0 76.0 140.0 74.0 136.0 72.0 136.0 72.0 1 2 52 148.0 90.0 120.0 80.0 120.0 80.0 120.0 80.0 120.0 80.0 1 2 55 155.0 80.0 140.0 85.0 130.0 80.0 130.0 85.0 130.0 80.0 1 1 77 160.0 100.0 140.0 90.0 140.0 90.0 140.0 90.0 140.0 90.0 1 1 55 150.0 94.0 145.0 80.0 140.0 80.0 135.0 7
20、5.0 135.0 75.0 1 2 77 165.0 90.0 160.0 82.0 155.0 80.0 151.0 72.0 140.0 70.0 1 2 66 150.0 100.0 130.0 90.0 120.0 80.0 120.0 80.0 120.0 80.0 1 2 62 150.0 90.0 140.0 86.0 140.0 96.0 140.0 82.0 140.0 82.0 1 2 63 160.0 95.0 150.0 85.0 155.0 75.0 140.0 70.0 136.0 70.0 1 2 67 165.0 90.0 145.0 80.0 140.0 8
21、0.0 135.0 75.0 135.0 75.0 1治療前后兩組病人血壓原始數據表(治療組):說明:sex=性別(1為女,2為男),age=年齡,sbp_b=治療前收縮壓,dbp_b治療前舒張壓, sbp_0=治療后0分鐘收縮壓, dbp_0治療后0 分鐘舒張壓,group=分組78sex age sbp_b dbp_b sbp_0 dbp_0 sbp_10 dbp_10 sbp_20 dbp_20 sbp_30 dbp_30 group 2 65 150.0 80.0 150.0 80.0 150.0 80.0 150.0 80.0 150.0 80.0 2 2 69 180.0 80.0
22、 180.0 80.0 184.0 80.0 184.0 80.0 184.0 80.0 2 2 63 150.0 92.0 146.0 90.0 146.0 90.0 146.0 90.0 150.0 90.0 2 2 65 160.0 100.0 160.0 100.0 162.0 100.0 160.0 98.0 160.0 98.0 2 1 77 170.0 95.0 170.0 95.0 170.0 95.0 170.0 95.0 170.0 95.0 2 2 51 150.0 90.0 142.0 80.0 142.0 80.0 146.0 80.0 146.0 80.0 2 2
23、69 170.0 110.0 166.0 108.0 170.0 110.0 170.0 110.0 170.0 110.0 2 1 60 160.0 100.0 150.0 100.0 158.0 100.0 158.0 100.0 160.0 100.0 2 1 64 170.0 100.0 168.0 98.0 168.0 98.0 170.0 100.0 170.0 100.0 2 2 58 160.0 95.0 160.0 95.0 160.0 95.0 160.0 95.0 160.0 95.0 2 1 60 180.0 96.0 180.0 96.0 182.0 96.0 182
24、.0 96.0 182.0 96.0 2 2 53 150.0 96.0 150.0 96.0 150.0 96.0 150.0 96.0 150.0 96.0 2 2 67 170.0 100.0 170.0 100.0 170.0 100.0 170.0 100.0 170.0 100.0 2 1 66 150.0 90.0 150.0 90.0 154.0 92.0 154.0 92.0 154.0 92.0 2 1 70 160.0 100.0 158.0 96.0 160.0 100.0 160.0 100.0 160.0 100.0 2 2 62 155.0 94.0 152.0
25、94.0 155.0 92.0 155.0 94.0 155.0 94.0 2 1 67 164.0 98.0 160.0 95.0 160.0 95.0 164.0 98.0 164.0 98.0 2續(xù)前表(對照組)79實時分析處理立體表(Online Analytic Processing Cubs)Analyze / Reports / OLAP Cubs綜合統(tǒng)計變量分組變量擬統(tǒng)計內容統(tǒng)計學內容80求均值和標準偏差(立體報表)81求均值和標準偏差(立體表不同層統(tǒng)計結果)治療組(1)對照組(2)男性組(整體)女性組(整體)82取消層合并為平面報表雙擊OLAP Cubs表Pivot / Mo
26、ve Layer to RowsPivot / Move Layer to Rows或Pivot / Reset Pivot Defaults還原表83綜合表Analyze / Reports / Case Summaries84樣本綜合表(無分組)85樣本分組綜合表86樣本綜合表(分類統(tǒng)計)不顯示個體可進行分類統(tǒng)計87鼠標雙擊綜合表上的對象可進行文字修改Edit / SPSS Pivot Table Object /Edit88行輸出綜合報告 Report Summaries in Rows 行輸出綜合報告過程是以行的形式輸出統(tǒng)計量,每個所選的變量都在報告中產生一列。Analyze / Re
27、port / Report Summaries in Rows分組排序方式89綜合統(tǒng)計選項頁面設置標題預覽格式化顯示個體數據變量數據列變量選擇分組變量選擇90分組綜合統(tǒng)計內容Summary數據列格式化定義 Format91分組格式定義Format分組選項 Options分類間空行每一分類從新一頁開始綜合分析前的空行頁碼從1開始92報表綜合統(tǒng)計內容Summary報表標題設置Titles頁眉頁腳變量93行綜合輸出表結果注意:行綜合輸出適合于多項統(tǒng)計分析結果的輸出94列輸出綜合報告 Report Summaries in Column 列輸出綜合報告過程是以列的形式輸出統(tǒng)計量,每個所選的變量都在報告
28、中產生一列。Analyze / Report / Report Summaries in Column插入統(tǒng)計合計值95列綜合輸出表結果注意:列綜合輸出僅適合于單項統(tǒng)計分析結果的輸出96常用統(tǒng)計圖一般概念條形圖(Bar Charts)圓圖(Pie Charts )線圖(Line Charts )目錄97一般概念 統(tǒng)計圖用各種幾何圖將統(tǒng)計數據直觀和形象化,便于了解數據的特點。SPSS圖形制作步驟:Graph / 建立數據文件生成圖形修飾生成的圖形98條形圖(Bar Charts)Graph / Bar問題:某地1952年與1972年三種疾病的死亡率(1/10萬), 畫出單式條形圖。 年 疾病 死
29、亡率 1952 肺結核 163.20 1952 心臟病 72.50 1952 惡性腫瘤 57.20 1972 肺結核 27.40 1972 心臟病 83.60 1972 惡性腫瘤 178.2099100單式條形圖101單式條形圖復式條形圖102誤差條形圖Graph / Interactive / Bar103104105誤差條形圖106圓圖(Pie Charts )Graph / Pie107108線圖(Line Charts ) 年代 傷寒 結核病 1950 31.3 174.5 1952 22.4 157.1 1954 18.0 142.0 1956 9.2 127.0 1958 5.0
30、97.2 1960 3.8 71.3 1962 1.8 59.2 1964 1.0 42.6 1966 .4 28.7Graph / Line問題:根據某地居民1950年與1966年傷寒與結核病死亡率 (1/10萬)的數據文件,將其制成線圖。109多重線圖110多重線圖111統(tǒng)計描述頻數表分析(Frequencies過程)描述性統(tǒng)計分析(Descriptives過程)平均數分析(Means過程)探索性分析(Explore過程) 統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷。 統(tǒng)計描述是用統(tǒng)計圖表、統(tǒng)計指標來描述資料的分布規(guī)律及其數據特征。目錄112頻數(frequency):各組段內的數據個數,頻數分布類型
31、 有正態(tài),左偏態(tài)和右偏態(tài)算術均數(mean):總體均數,樣本均數X幾何均數(geometric mean):原始數據分布不對稱,但 經對數轉換后呈對稱分布的數據。幾何均數G中位數 (median):指將一組數值從小到大排序后居于 中間位置的那個數值。中位數M極差(range):全距R,描述數據的分布范圍,極差大說 明數據分布較分散四分位數間距(inter-quartile range): QU與QL的差距 相關統(tǒng)計學概念(2)113 百分位數(percentile):Px ,如P25,P50等 四分位數:QL(下四分位數,25%),QU(上四分位數,75%)方差(variance):樣本方差S
32、2,總體方差2標準差(standard deviation):標準差S替代方差描述數據 分布的離散程度變異系數(coefficient of variation):CV,標準差與算術 均數之比,它描述數據分布的相對離散程度。標準誤(standard error,SE)與均數的標準誤( standard error of mean,SEM ):均數的標準誤與標準差成正 比,與樣本例數n的平方根成反比114頻數表分析( Frequencies過程 ) Frequencies分析過程可產生頻數分布圖、條形圖、餅圖、直方圖、計算任意百分位數、分布參數估計值、集中趨勢與離散趨勢等各項統(tǒng)計學指標。Anal
33、yze / Descriptive Statistics / Frequencies統(tǒng)計圖表格式化顯示頻數表115某市1982年110名7歲男童的身高資料:序號數據cm116統(tǒng)計圖表直方圖餅圖條形圖正態(tài)曲線117頻數表身高的各項統(tǒng)計學指標集中趨勢指標離散趨勢指標偏度系數峰度系數分布參數估計值四分位數118某城市7歲男童身高直方圖正態(tài)曲線119描述性統(tǒng)計分析(Descriptives過程) Descriptive分析過程可計算數值變量的描述性統(tǒng)計量:均數、總和、標準差、方差、全距、最小值、最大值、標準誤、峰度系數、偏度系數及標準化(Z值、Z分數)。Analyze / Descriptive St
34、atistics / Descriptives120Data / Select Cases / If condition is satisfied sex=男Data / Select Cases / All Cases121平均數分析(Means過程) Means過程可分組計算指定變量的描述性計算如:均數、總和、標準差、方差、觀察例數等;可進行單因素隨機設計方差分析(One-way analysis of variance)和線性檢驗(Testfor linearity)。第一層:以病情分級進行分組自變量列表因變量列表Analyze / Compare Means / Means 122第二
35、層: 以性別進行分組均值個體數量標準差中位數123第一層:病情分級第二層:性別中位數124續(xù)前表總病例統(tǒng)計值125抗體滴度 X 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512人 數 f 1 5 6 2 7 10 4 5 40名麻疹易感兒的血凝抑制抗體滴度平均抗體滴度統(tǒng)計表(平均滴度為1:64)126第一步:建立分組變量第二步:加權頻數變量127幾何均數第三步:選擇統(tǒng)計變量和分組變量第四步:選擇統(tǒng)計項目128探索性分析(Explore過程) Explor過程對數據進行探索性分析,包括數據描述、篩選、奇異值辨認和假設驗證,提供整體或分組數據的概要性統(tǒng)計指標或圖表,
36、以了解數據的分布規(guī)律和特征以及亞組間的特征性差異。提供反映數據集中趨勢的四種最大似然估計量、數據中前5位最大值和最小值、正態(tài)分布檢驗及正態(tài)分布Q-Q圖、轉換前和多種轉換后的方差齊性檢驗及分布-水平散點圖。129女性:66名281.14 162.82 339.26 206.04 214.19 294.24 120.37 332.60 191.95 144.76 207.67 255.37 419.86 621.73 984.81 841.97 330.86 229.97 273.67 147.20 179.07 215.55 203.72 258.34 100.40 53.71 684.86 4
37、22.84 655.12 354.67 462.16 186.35 206.41 112.71 81.71 185.54 218.39 106.90 141.48 119.18 160.22 82.86 180.46 486.38 228.43 263.99 398.26 74.31 359.48 434.70 579.99 102.51 280.48 171.75 86.32 298.43 412.01 453.15 478.43 78.28 374.38 371.23 147.26 130.89 301.08 234.21男性:83名169.49 125.82 190.62 262.67
38、279.77 181.48 286.85 262.20 308.34 101.09 215.60 822.86 566.27 207.51 163.33 193.32 121.89 182.52 147.31 269.30 243.46 225.86 106.90 123.27 134.27 118.60 227.46 148.01 167.59 166.06 275.34 119.80 327.97 100.61 253.28 290.93 335.76 147.37 190.99 196.50 164.99 131.27 164.45 183.77 99.75 189.96 138.29
39、215.07 547.76 412.64 470.84 400.32 103.72 111.13 145.15 142.14 87.22 111.95 184.54 102.61 93.30 237.02 165.51 80.73 143.27 130.38 417.64 401.25 249.38 120.31 160.49 256.92 202.69 347.91 345.86 727.59 95.73 404.00 393.26 427.08 432.65 321.65 160.11某醫(yī)生測定了149名正常人的空腹血清胰島素樣因子-1水平:130Analyze / Descriptive
40、 Statistics / Explore統(tǒng)計指標統(tǒng)計圖131描述性統(tǒng)計指標反映集中性趨勢的4種似然估算量奇異值百分位值及Tukeys折點均值可信限范圍所有分析均忽略缺失值個體分析中檢驗變量含缺失值個體被忽略缺失值作為分組之一132每個因變量分別做箱圖多個因變量在一個箱圖中顯示莖-葉圖直方圖正態(tài)分布Q-Q圖方差齊性檢驗及分布-水平散點圖方差齊性的力度估計數據轉換數據轉換方式133描述性統(tǒng)計指標134反映集中性趨勢的4種似然估算量百分位值及Tukeys折點135奇異值136正態(tài)檢驗方差正態(tài)檢驗137直方圖-1138直方圖-2139正態(tài)Q-Q圖-1期望正態(tài)分布直線140正態(tài)Q-Q圖-2期望正態(tài)分布
41、直線141去勢正態(tài)分布Q-Q圖-1期望正態(tài)分布直線142去勢正態(tài)分布Q-Q圖-2期望正態(tài)分布直線143均數箱圖奇異值P50均值P25-P75144分布自然對數-水平自然對數散點圖數據轉換力度不接近0,表示要使兩組方差齊性,需做數據轉換145數據轉換經數據轉換后的方差正態(tài)齊性檢驗選擇自然對數轉換基于均數的顯著性為0.1350.05,表示接受兩組均數方差的假設146147先進行IGF-1F數據轉換(自然對數)148數據轉換(Ln)后的描述性統(tǒng)計指標149數據轉換(Ln)后的百分位值及Tukeys折點數據轉換(Ln)后的4種似然估算值150數據轉換(Ln)后的奇異值151數據轉換(Ln)后的正態(tài)檢驗
42、數據轉換(Ln)后的方差正態(tài)齊性檢驗兩組間方差齊性P0.05152數據轉換(Ln)后的直方圖正態(tài)分布153數據轉換(Ln)后的正態(tài)分布Q-Q圖接近期望正態(tài)分布直線154數據轉換(Ln)后的去勢正態(tài)分布Q-Q圖接近期望正態(tài)分布直線155討論三、某醫(yī)院內、外科25例住院病人使用抗生素的情況156(1) 計算住院時間的算術均數、幾何均數、中位數;(2) 計算住院時間的最大值、最小值、四分位數與四分位數間距;(3) 計算住院時間的全距、方差、標準差和變異系數;病人編號性別年齡(歲)入院體溫()入院時白細胞計數(103)抗生素使用細菌培養(yǎng)所在科室住院時間123037.282215227336.75211
43、10157T檢驗單樣本T檢驗獨立樣本T檢驗配對樣本T檢驗目錄158相關統(tǒng)計學概念(3)假設檢驗(hypothesis test)也稱顯著性檢驗(significance test) 1、建立檢驗假設( hypothesis under test ): 無效假設,= 0 (樣本均數=總體均數) H0 2、建立備擇假設( alternative hypothesis ): H1,若H0被否決, 則H1成立。 3、設定檢驗水準(size of test)或稱顯著性水準( significance level): =0.05(方差齊性檢驗=0.10,正態(tài)性檢驗 =0.20) 4、確定P值,作出推斷:推
44、斷結論包括統(tǒng)計結論和專業(yè)結論, 統(tǒng)計結論說明有統(tǒng)計學意義(statistical significance)或 無統(tǒng)計學意義(no statistical significance ),若P ,則拒 絕H0 ,接受H1 ,有統(tǒng)計學意義(統(tǒng)計結論);則可認為 不同或不等(專業(yè)結論)。假設檢驗的方法:t檢驗(t-test或稱Students t-test)和u檢驗(159u-test或稱Z-test)。 t檢驗應用條件:當樣本量較小時(如 n50),理論上要求樣 本取自正態(tài)總體,兩小樣本均數比較時要求兩樣本總體方差 相等。 u檢驗的應用條件:樣本含量n較大,或n雖小但總體標準差已 知。單樣本t檢驗
45、(one sample/group t-test):即樣本均數代表的 未知總體均數和已知總體均數0 (一般為理論值、標準值 或經過大量觀察所得的穩(wěn)定值)的比較。配對t檢驗(paired t-test for dependent samples): 兩種情況 (1)兩個同質受試對象分別接受兩種不同的處理;(2)同 一受試對象分別接受兩種不同的處理。配對t檢驗設兩種處 理的效應相同,即1 = 2 ,則1 - 2 =0(即已知總體0 )。兩樣本t檢驗( tow-sample t-test for independent samples ): 完全隨機設計兩樣本均數的比較。當關心兩總體均數1 , 2
46、是否相等時,理論上應考慮是否兩總體方差相同,即齊性方 差(homogeneity),若相等直接接受t檢驗。160單樣本T檢驗(One-sample T Test) SPSS的One-sample T Test過程用于執(zhí)行單樣本T檢驗,它是進行單變量均數與一常數或假設值的比較,要求單變量為定量變量(數值型變量)。Analyze / Compare Means / One-sample T Test檢驗變量檢驗值161T檢驗:樣本均數與總體均數的比較問題:正常人的脈搏平均72次/分,現(xiàn)測得10例某病患者的脈搏(次/分):54,67,68,78,70,66,67,70,65,69,試問此病患者與正常
47、人有無顯著性差別?結論:因t=-2.453,df=9,P=0.0370.05,有統(tǒng)計學意義;故此病患者與正常人脈搏有顯著性差異。162問題:某市1982年110名7歲男童的身高(cm)如下表,試估計該市7歲男童身高的95%可信區(qū)間。不設檢驗值163T檢驗:總體均數的可信區(qū)間估計結論:因t=-264.848,df=109,雙側概率P0. 05,可認為兩總體方差相等。取t=2.524,df=22,P=0.0190.05,可認為該地克山病患者與健康人的血磷值之間有統(tǒng)計意義。兩獨立樣本均數比較167兩獨立樣本幾何均數比較問題:選甲型流感病毒抑制抗體滴度(倒數)0. 05,可認為兩總體方差相等。取t=-
48、2.934,df=22,P=0.0080.05,可認為兩種方法的免疫效果差別之間有統(tǒng)計意義。169配對樣本T檢驗 SPSS的 Paired-Samples T Test 過程用于執(zhí)行配對樣本均數的比較。Analyze / Compare Means / Paired-Samples T Test問題:某單位研究飲食中缺乏維生素E與肝中維生素A含量的關系,將同種屬的大白鼠按性別相同,年齡、體重相近配成對子,共8對并將每對種的兩頭動物隨機分到正常飼料組和維生素E缺乏組,經一定時期將大白鼠殺死,測得其肝中維生素A的含量,結果如下。問不同飼料的大白鼠肝中維生素A含量有無差別?大白鼠對號(1): 1 2
49、 3 4 5 6 7 8正常飼料組(x1): 3550 2000 3000 3940 3800 3750 3450 3050 維生素E缺乏組(x2): 2450 2400 1800 3200 3250 2700 2500 1750170配對樣本均數比較配對變量171結論:相關系數=0.584,P(sig.)=0.129,認為兩配對變量無相關關系。t=4.207,df=7,P=0.0040.05,拒絕H0,接受H1,可以 認為各組方差齊同254方差分析表結論:組間F值=MS組間/MS組內=84.544,根據第一和第二自由度得P0.0005, 按=0.05檢驗水準,拒絕H0,接受H1,可認為各組總
50、體均數不等或 不全等; 線性趨勢檢驗MS未加權/MS加權一致,F(xiàn)=9.165組間/1.534組內=167.259,根 據第一和第二自由度得P0.0005,按=0.05檢驗水準,拒絕H0,接受 H1,可認為三組別值與各組均數間呈線性趨勢; 偏離線性趨勢檢驗F=0.100組間/1.534組內=1.829,根據第一和第二自由 度得P0.187,按=0.05檢驗水準,接受H0,可認為偏離線性無統(tǒng)計 學意義。255各組肺活量兩兩比較表星號表示均數的差別在=0.05檢驗水準上有統(tǒng)計學意義因各組方差齊同,故不選擇Tamhanes T2法檢驗256各組均數趨勢圖結論:各組肺活量均數隨分類值(分組值)的增大而增
51、加呈線性趨勢257討論五、某篇論文,研究4組病人某基因表達率的差異,結果見下表258隨機區(qū)組設計的兩因素方差分析 廣義線性模型(GLM)中的單變量(Univariate)過程可以進行雙因素和多因素方差分析、協(xié)方差分析和線性回歸分析。適用條件:1、各樣本是相互獨立的隨機樣本;2、各樣本來自正態(tài);3、各樣本的總體方差齊同;4、單個因變量為連續(xù)型變量;5、單個或以上因素為分類變量;6、單個或以上的協(xié)變量(Covariate)為連續(xù)變量。Analyze / General linear Model/ UnivariateGLM-單變量過程259問題:在不同的室溫下測定家兔的血糖濃度。室溫分七組, 家兔
52、分四個種屬,每一種屬七只,見下表。問不同 溫度的血糖濃度有無差別及不同水平血糖濃度均數 的變化趨勢? 室 溫家兔種屬 5 10 15 20 25 30 35 I 130 110 82 82 110 120 140 II 120 130 110 83 100 140 160 III 150 140 100 110 120 120 160 IV 120 100 74 82 100 110 130260Analyze / General linear Model/ Univariate因變量固定因素隨機因素協(xié)變量加權變量模型參照值繪圖因素各水平兩兩比較261全析因模型自定義模型因素和協(xié)變量效應選擇平
53、方和模型中包含截距262參照類型:Polynomial多項式模型趨勢檢驗參照分類263假定方差齊同時的兩兩比較方法選項假定方差不齊時的兩兩比較方法選項因素兩兩比較檢驗因素264因素室溫和因素家兔種屬及其各水平值和例數方差分析表因素室溫的F=MS室溫/MS家兔種屬=18.866,根據第一自由度df1=3和第二自由度df2=18得P0.0005;按=0.05檢驗水準,可認為不同室溫的血糖濃度總體不等或不完全相等。同左下道理因素家兔種屬, P0.0005;按=0.05檢驗水準,可認為不同家兔種屬(區(qū)組)的血糖濃度總體不等或不完全相等,故該區(qū)組因素(控制因素)不容忽略。265期望均方表檢驗結果表類似方
54、差分析表因素室溫變異和殘差266多項式參照模型線性二次(拋物線)三次四次模型指標因變量值六個模型中,假定值均相同都等于0,故參照估計值和差值相等;參照估計值和差值以二次模型最大,同時P值最小故取其模型;按=0.05檢驗水準,可認為不同室溫水平與其血糖濃度均數呈拋物線模型趨勢。267Tukey法的不同室溫均數兩兩比較表星號表示均數差別在=0.05檢驗水準上有統(tǒng)計學意義268Tukey法的均衡子集表每個均衡子集內的各組均數比較均無統(tǒng)計學意義269A藥 B藥 用藥(1) 不用藥(2)用藥(1)不用藥(2)2.1 0.92.2 1.12.0 1.01.3 0.81.2 0.91.1 0.7問題:用A和
55、B兩種藥治療貧血病人,治療一個月測得血中紅 細胞增加數(百萬/mm3)。12名性別、年齡和病情都 一致的病人,按A和B兩藥的使用與否分成四組。結果 如下表,問A和B單獨使用的治療效果如何?兩藥同時 使用的治療效果如何?析因(有重復數,平衡數據)設計的雙因素方差分析270Analyze / General linear Model/ Univariate因變量固定因素隨機因素協(xié)變量加權變量模型參照值繪圖因素各水平兩兩比較271因素水平軸分離線分離圖繪圖272估計邊緣均數顯示邊緣均數殘差圖擬合度不足設定檢驗水準參照系數矩陣因素和因素交互效應欄273因素A和因素B及其各水平值和例數因素A和因素B的描
56、述性統(tǒng)計A藥和B藥同時使用紅細胞增加的均數為210萬/mm3單獨使用A藥紅細胞增加的均數為120萬/mm3單獨使用B藥紅細胞增加的均數為100萬/mm3都不使用紅細胞增加的均數為80萬/mm3274方差齊性檢驗方差分析表P=1.000 ,按=0.05檢驗水準,接受H0,可認為各格子方差齊同。同上道理推出:使用和不使用B藥的紅細胞增加總體均數不等。A藥和B藥存在交互作用。因素A P0.0005,可認為使用和不使用A藥的紅細胞增加總體均數不等。275均數與標準差二維圖均數與方差二維圖兩項對應指標均不成比例,提示各格子方差齊同276因素A和因素B邊緣均數圖圖中兩線不平行,提示A藥和B藥存在交互作用。
57、277析因(有重復數,不平衡)設計的雙因素方差分析性別工廠男(1)女(1)繡品廠電視機廠蓄電池廠(1):54.1 31.8 19.1 20.7 36.6 53.4 28.7 27.1 31.8 21.4 31.8 22.3(2):15.0 21.7 21.7 23.3 41.7 35.0 15.0 28.3 36.7(3):163.9 192.3 183.6 129.4 160.8 160.8 155.6 188.8 129.0 110.1 90.0 97.9 136.4問題:從三個工廠隨機抽查一些男女職工的血原卟啉 (g/100ml),數據見下表;問各廠男女職工 的血原卟啉有無差異?278A
58、nalyze / General linear Model/ Univariate因變量固定因素隨機因素協(xié)變量加權變量模型參照值繪圖因素各水平兩兩比較279因素水平軸分離線分離圖繪圖280假定方差齊同時的兩兩比較方法選項假定方差不齊時的兩兩比較方法選項因素兩兩比較檢驗因素281估計邊緣均數顯示邊緣均數設定檢驗水準觀察效能因素和因素交互效應欄282因素廠別和因素性別及其各水平值和例數因素廠別和因素性別的描述性統(tǒng)計283方差齊性檢驗方差分析表P0.05,可認為各格子總體方差不齊同因素廠別P0.05,可認為不同性別之間職工的血原卟啉相等因素廠別*性別P0.05,可認為廠別與性別之間不存在交互作用檢驗
59、效能很大284邊緣均數表285不同廠別血卟啉兩兩比較表由于方差檢驗認定各格子總體方差不齊同因此使用Tamhane法數據繡品廠與電視機廠、電視機廠與繡品廠比較,P0.05,可認為均數比較無統(tǒng)計學意義。繡品廠與蓄電池廠、電視機廠與蓄電池廠、蓄電池廠與繡品廠、蓄電池廠與電視機廠比較,P0.05,可認為各格子總體方差齊同292方差分析表協(xié)變量飼料 P0.05,可認為用不同飼料喂養(yǎng)白鼠的增重調整均數相等觀察效能飼料=1.000,可認為的檢驗效能很大,協(xié)變量飼料無須增加 標本含量;觀察效能飼料=0.064,可認為的檢驗效能很小,即使增 加樣本含量也難于得出顯著差異結果293參數估計值表公共回歸系數不為零邊
60、緣均數表消除協(xié)變量對增重的影響,顯示調整后的均數、標準誤及95%可信區(qū)間294完全隨機區(qū)組設計的協(xié)方差分析核黃素缺乏組X1: 256.9 271.6 210.2 300.1 262.2 304.4 272.4 248.2 242.8 342.9 356.9 198.2核黃素缺乏組增重Y1: 27.0 41.7 25.0 52.0 14.5 48.8 48.0 9.5 37.0 56.5 76.0 9.2限食量組X2: 260.3 271.1 214.7 300.1 269.7 307.5 278.9 256.2 240.8 340.7 356.3 199.2 限食量組增重Y2: 32.0 47
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家庭教育與兒童綜合素質的培養(yǎng)
- 家庭健康飲食與互聯(lián)網經濟的結合點
- 家庭教育中的心理干預與效果評估研究
- 教育類線上展覽會的創(chuàng)新實踐案例分享
- 小學科學教育中的生態(tài)環(huán)保意識培養(yǎng)
- 數學與科學在商業(yè)決策中的融合應用
- 教育信息化的內容創(chuàng)新與媒體應用研究
- 工業(yè)生產中的安全生產與環(huán)保技術創(chuàng)新
- 提升小學生實踐能力的課外勞動教育方案研究
- 第一單元:探索世界與把握規(guī)律大單元說課稿
- 吸氧術課件教學課件
- 八年級數學家長會課件
- 光伏發(fā)電項目試驗檢測計劃
- 民航概論5套模擬試卷考試題帶答案
- 2024屆中國電建地產校園招聘網申平臺高頻500題難、易錯點模擬試題附帶答案詳解
- COCA20000詞匯音標版表格
- 滬教版七年級數學上冊專題06圖形的運動(原卷版+解析)
- JTG-T-F20-2015公路路面基層施工技術細則
- 光伏發(fā)電站集中監(jiān)控系統(tǒng)通信及數據標準
- 建筑垃圾減排及資源化處置措施
- 2024年遼寧石化職業(yè)技術學院單招職業(yè)適應性測試題庫附答案
評論
0/150
提交評論