分類變量資料的統計分析_第1頁
分類變量資料的統計分析_第2頁
分類變量資料的統計分析_第3頁
分類變量資料的統計分析_第4頁
分類變量資料的統計分析_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、分類變量資料的統計分析1 率(rate):說明某現象或某事物發(fā)生的頻率或強度。 率=(實際發(fā)生數/可能發(fā)生總數)比例基數 比例基數:100%、1000、10000/萬、100000(1/10萬) 如:發(fā)病率、死亡率、發(fā)生率、陽性率、患病率等分類變量資料的統計描述 構成比(proportion):說明某一事物內部,各組成部分所占的比重。也叫百分比。 構成比=(某部分觀察單位數/各組成部分觀察單位總數)100% 如:教研室16人中高級職稱有4人,占202 相對比(relative ratio):是A、B兩個有關指標之比,說明A是B的若干倍或百分之幾,通常用倍數或分數表示。 如:男:女、醫(yī)生:護士、

2、教師:學生3分類變量資料的統計推斷4率的抽樣誤差與標準誤 樣本率(p)和總體率()的差異稱為率的抽樣誤差,用率的標準誤表示如果總體率未知,用樣本率p估計5標準誤的計算6總體率的可信區(qū)間總體率的可信區(qū)間 (confidence interval of rate):根據樣本率推算總體率可能所在的范圍1. 查表法:樣本含量較小(如n50),np或n(1-p)510卡方檢驗 檢驗(Chi-square test)是現代統計學的創(chuàng)始人之一,英國人K . Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統計方法。可用于兩個或多個率間的比較,計數資料的關聯度分析,擬合優(yōu)度檢驗等。11

3、 檢驗的基本公式121.四格表形式 組別 陽性數 陰性數 合計 甲組 a b a+b 乙組 c d c+d 合計 a+c b+d N2.四格表專用公式四格表專用公式13 舉例14連續(xù)性校正公式 檢驗的應用條件:當n40,T5時,用專用公式當n40,而1T5時,用連續(xù)性校正公式當n40或T1時,用Fisher精確檢驗(Fisher exact test )校正公式:15配對四格表資料的 檢驗表516 計算公式17H0:b,c來自同一個實驗總體(兩種劑量的毒性無差異)H1:b,c來自不同的實驗總體(兩種劑量的毒性有差別)=0.05。 舉例18行列(RC)表資料的 檢驗 四格表是指只有2行2列的表格

4、,當行數或列 數超過2時,統稱為行 列表。行列表的 檢驗是對多個樣本率(或構成比)的檢驗。 適用條件:表中不宜有1/5以上格子的理論頻數小于5,或有一個格子的理論頻數小于1。19兩個(多個)率或構成比的比較推斷兩個或多個分類變量是否相關聯或相互獨立兩個或多個發(fā)生率或構成比是否相同20一致性檢驗與配對卡方檢驗配對設計包括 同一樣本接受不同處理的比較 配對的兩個受試對象分別給予兩種處理21一致性檢驗與配對卡方檢驗資料為配對資料 結果是否基本一致 * Kappa 0.75一致性好 * 0.75Kappa0.4一致性一般 * Kappa 0.4一致性較差結果有無差別:配對卡方檢驗22freq過程功能:

5、描述性統計以及假設檢驗的功能對分類變量計算頻數分布,產生頻數表和列聯表;對于列聯表資料(兩個或更多因素),對兩因素間的關系進行統計學推斷;對于三維表,可作Mentel-Hanszel分層分析。23freq過程表 freq過程的功能卡方檢驗關聯性的推斷及其強度測量22表資料危險度計算以及危險度差別的檢驗22表資料OR值以及相對危險度的計算趨勢檢驗一致性檢驗Cochran-Mantel-Haenszel 統計量計算24freq過程的一般格式 25freq過程的一般格式 PROC FREQ; TABLES A;產生變量A的一維頻數表 PROC FREQ; TABLES A*B;產生A、B兩個變量的列

6、聯表,*前為行變量,*后為列變量TABLES語句:26freq過程的一般格式 在TABLES語句中用*號連接三個或n個變量名,可得到三維或n維列聯表,最后一個變量各水平形成表的列,倒數第二個變量各水平形成表的行,其它變量的每一級水平(或水平組合)形成一層,且每一層都形成分離的列聯表。如:PROC FREQ; TABLES A*B*C*D;列聯表的數量為A、B不同水平的組合數,每個表的上部為D的各水平,左側為C的各水平。27freq過程的一般格式 表 多表格表達式示例表達式等同表達式tables a*(b c); tables a*b a*c; tables (a b)*(c d); table

7、s a*c b*c a*d b*d; tables (a b c)*d; tables a*d b*d c*d; tables a-c; tables a b c; tables (a-c)*d; tables a*d b*d c*d; 28freq過程的一般格式 TABLES語句中“/” 后面的選項:1、統計分析選項 CHISQ:對每層作 檢驗,包括Pearson 、似然比 和Mantel-Haenszel 。此外還給出與 檢驗有關的關聯指標包括Phi系數、列聯系數和Cramers V。對于22表,給出Fisher精確概率。 AGREE:進行配對 檢驗。 EXACT :對大于22的列聯表計算

8、Fisher精確概率。同時也給出CHISQ選項的全部統計量。 29freq過程的一般格式 TABLES語句中“/” 后面的選項: MEASURES :對每層的二維表計算一系列關聯指標及相應的標準誤,包括Pearson和Spearman相關系數,以及Gamma和Kendall系數等。對于22表,還給出常用的危險度指標及其標準誤。 ALPHAp :給出檢驗水準。缺省為0.05。30freq過程的一般格式 TABLES語句中“/” 后面的選項: CMH: 給出Cochran-Mantel-Haenszel統計量,可檢驗在調整了TABLES語句中其它變量后,行變量與列變量之間的關聯程度。對于22表,F

9、REQ過程給出相對危險度估計及其可信區(qū)間,還給出各層關聯度指標是否齊性的Breslow檢驗。 ALL :給出CHISQ、MEASURES、CMH所請求的全部統計量。31freq過程的一般格式 TABLES語句中“/” 后面的選項:2、有關表格信息選項 EXPECTED: 給出期望頻數 DEVIATION :給出每格的實際頻數與期望頻數的差值 CELLCHISQ:給出每格對總c 2的貢獻,即計算每格的(實際頻數-期望頻數)2/期望頻數。 CUMCOL: 給出累積列百分數32freq過程的一般格式 TABLES語句中“/” 后面的選項:3、禁止輸出選項 NOFREQ:不給出列聯表中的格頻數 NOP

10、ERCENT:不給出列聯表中的格百分數 NOROW:不給出列聯表中各格的行百分數 NOCOL:不給出列聯表中各格的列百分數 NOCUM:不給出頻數表的累積頻數和累積百分數 NOPRINT: 不給出表格,但給出CHISQ、MEASURES 或CMH等語句所指定的統計量。33freq過程的一般格式 WEIGHT 語句: 通常每個觀察值提供數值1給頻數計數,當WEIGHT語句出現時,每個觀察值提供的是該觀察值的加權變量值。該值必須非負,但可不必為整數。 只能使用一個WEIGHT語句,且該語句作用于所有的表。34例1:兩獨立樣本率的比較 在研究糖尿病的臨床試驗中,將258名患者隨機分為兩組,一組204

11、人服用鹽酸苯乙雙胍藥,死于心血管病的26人,另一組64人服安慰劑,死于心血管病2人,問兩種藥物心血管病死率有無差別?35表 兩種療法心血管病病死率比較 療法 死亡人數 生存數 合計 病死率% 苯乙雙胍 26 178 204 12.75 安慰劑 2 62 64 3.13 合計 28 240 268 10.45問:兩組病死率差別是否是抽樣誤差或是用苯乙雙胍藥物的作用?26 1782 62四格表的數字組別 + 甲乙36SAS程序Data a1; input treat outcome f; cards; 1 1 178 1 2 26 2 1 62 2 2 2;Proc freq; weight f;

12、 tables treat*outcome/chisq;Run;37SAS結果3839例2:多個獨立樣本率的比較將做了手術的761例皮膚黑色瘤患者分為4組。1組:術后不接受治療2組:術后接受化療3組:術后接受免疫療法4組:術后接受化療和免疫療法問:不同療法患者3年生存率有無差別?40表 黑色素瘤患者隨訪3年生存情況治療組 生存人數 死亡人數 合計 生存率% 77 108 185 41.6 89 103 192 46.4 99 104 203 48.8 90 91 181 50.0合計 355 406 761 46.61.假設:H0; 1= 2 = 3= c=355/761=46.6 H1:四組總體生存率不等或不全等 2. =0.05(差別顯著的水準) 41SAS程序Data a2; do a=1 to 4; do b=1 to 2; input f ; output; end; end;cards; 77 108 89 103 99 104 90 91 ;Proc freq; weight f; tab

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論