分類資料統(tǒng)計推斷_第1頁
分類資料統(tǒng)計推斷_第2頁
分類資料統(tǒng)計推斷_第3頁
分類資料統(tǒng)計推斷_第4頁
分類資料統(tǒng)計推斷_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

關于分類資料統(tǒng)計推斷第1頁,課件共40頁,創(chuàng)作于2023年2月一、率的抽樣誤差與標準誤

抽樣研究所得的率同樣存在抽樣誤差,描述其大小的指標是率的標準誤(standarderrorofproportion),其計算公式如下:

第2頁,課件共40頁,創(chuàng)作于2023年2月二、總體率的估計和率的u檢驗

1、總體率的估計:

總體率的估計有兩種方法,一是正態(tài)分布法,二是查表法?!镎龖B(tài)分布法適用于樣本較大,且p和/或1-p都不太小,如np和n(1-p)都大于5時。計算公式為:★查表法適用于小樣本。利用樣本含量n和陽性數(shù)x查“百分率的可信區(qū)間”表獲得。第3頁,課件共40頁,創(chuàng)作于2023年2月例1檢查居民800人糞便中蛔蟲陽性200人,陽性率為25%,試求當?shù)鼐用窦S便蛔蟲陽性率的95%可信區(qū)間和99%可信區(qū)間。

公式:其中,即:

陽性率的95%可信區(qū)間為:

(0.22,0.28)或(22%,28%)同理可得陽性率的99%可信區(qū)間。第4頁,課件共40頁,創(chuàng)作于2023年2月2、率的u檢驗

(1)樣本率與總體率比較樣本率與總體率(一般為理論值、標準值或經(jīng)大量觀察所得的穩(wěn)定值等)比較的目的,是推斷樣本所代表的未知總體率π與已知總體率π0是否相等??蛇x方法有直接計算概率法(用于π偏離0.5較遠,且陽性數(shù)X較小作單側檢驗時)和正態(tài)近似法。這里著重介紹正態(tài)近似法。當π或1—π不太小,而n足夠大時,如nπ和n(1—π)大于5時,即可按正態(tài)近似法做假設檢驗。檢驗統(tǒng)計量為u值,計算公式如下:式中n為樣本例數(shù),X為樣本陽性數(shù),樣本率p=X/n;π0為總體率;0.5為連續(xù)性校正數(shù),當n較大時可以省去,而︱X—nπ︱≤0.5時不宜采用校正數(shù)。第5頁,課件共40頁,創(chuàng)作于2023年2月

例2以往經(jīng)驗腦梗塞患者治療三周的生活能力改善率為30%,某醫(yī)院用新療法治療38例的三周生活能力改善率為50%,能否認為新療法的改善率與以往不同?

此為樣本率與總體率比較:且np和n(1-p)都大于5,故用u檢驗。

α=0.05

計算統(tǒng)計量u值:

本例︱X—nπ︱≤0.5,因此不宜用校正系數(shù),故=2.69

確定P值,作結論:查t界值表中,υ=∞時,u0.01=2.5758,u0.005=2.8070,因而0.01>P>0.005,則P<α,拒絕H0,接受H1,可以認為新療法的改善率與以往不同,新療法的改善率高于以往。第6頁,課件共40頁,創(chuàng)作于2023年2月(2)兩個樣本率比較

式中P0為合并陽性率,P0=(X1+X2)/(n1+n2)檢驗統(tǒng)計量計算公式如下:

第7頁,課件共40頁,創(chuàng)作于2023年2月

例3某中藥研究所試用某種草藥預防流感,觀察用藥組和對照組(未用藥組)的流感發(fā)病率,結果如下表,問兩組的流感發(fā)病率是否不同?表1用藥組和對照組的流感發(fā)病率此為兩大樣本率的比較,可用u檢驗。

第8頁,課件共40頁,創(chuàng)作于2023年2月

假設檢驗過程:

α=0.05計算統(tǒng)計量u值:

=2.031確定P值,作結論:查t界值表中,υ=∞時,u0.05=1.96,u0.01=2.5758,因而0.05>P>0.01,則P<α,拒絕H0,接受H1,可以認為兩組發(fā)病率不同,用藥組發(fā)病率低于對照組,說明該草藥有預防流感的作用第9頁,課件共40頁,創(chuàng)作于2023年2月三、χ2檢驗χ2檢驗(Chi-squaretest)用途極廣,這里僅介紹它在分類變量資料中用于推斷兩個或兩個以上總體率(或構成比)之間有無差別或有無關聯(lián)的分析方法。

第10頁,課件共40頁,創(chuàng)作于2023年2月1、χ2檢驗的基本思想例4:某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸球部潰瘍,以甲氰咪胍作對照組,結果如表5,問兩種方法治療效果有無差別?表2.兩種藥物治療十二指腸球部潰瘍的效果Chi-squaretest第11頁,課件共40頁,創(chuàng)作于2023年2月設

α=0.05

計算統(tǒng)計量χ2值:

χ2值的基本公式為:

式中A為實際頻數(shù),即所獲資料中的基本數(shù)據(jù);T為理論頻數(shù),是根據(jù)檢驗假設H0推算得到的,,其中,nR為同行合計,nC為同列合計,n為總例數(shù)。χ2檢驗的基本思想體現(xiàn)在χ2值的基本公式中,即當H0成立時,實際頻數(shù)A就與理論頻數(shù)T很接近,此時χ2值不會太大;反之,如若A與T相差較大,就會計算得到一個較大的χ2值,當其超出一定范圍時,就有理由認為H0不成立。因此,實際上χ2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。Pearson卡方值第12頁,課件共40頁,創(chuàng)作于2023年2月2、四格表資料的χ2檢驗

四格表資料即基本數(shù)據(jù)只有四個,為兩行兩列,如兩個率的比較。檢驗統(tǒng)計量專用計算公式為:

,[υ=(R-1)(C-1)]

式中a,b,c,d分別代表四個實際頻數(shù),n為總例數(shù);υ為自由度,R為行數(shù),C為列數(shù)。fourfoldtable第13頁,課件共40頁,創(chuàng)作于2023年2月

(1)四個表資料χ2檢驗實例:例4:某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸球部潰瘍,以甲氰咪胍作對照組,結果如表5,問兩種方法治療效果有無差別?表2.兩種藥物治療十二指腸球部潰瘍的效果

第14頁,課件共40頁,創(chuàng)作于2023年2月假設檢驗過程:

α=0.05

計算統(tǒng)計量χ2值:

確定P值,作結論:查χ2界值表中,υ=1時,χ20.05,1=3.84,χ20.01,1=6.63,因而0.05>P>0.01,即P<α,因而拒絕H0,接受H1,可以認為兩組潰瘍愈合率差別顯著,呋喃硝胺的愈合率高于甲氰咪胍。第15頁,課件共40頁,創(chuàng)作于2023年2月(2)四格表資料χ2檢驗應用注意:①當n>40,且任意T≥5時,可四格表專用公式。②當n>40,且任意1<T<5時,應,其計算公式為:例5.某醫(yī)生欲比較胞磷膽堿與腦益嗪治療腦動脈硬化的療效,觀察結果如表3,問兩種藥物的療效有無差別?表3.兩種藥物治療腦動脈硬化的療效

表3顯示有一個理論頻數(shù)T<5,因此應用校正χ2檢驗。③當n<40或任意T<1時,應改用確切概率法。直接使用計算校正χ2值第16頁,課件共40頁,創(chuàng)作于2023年2月(3)四格表資料χ2檢驗與u檢驗的關系

例6以例3資料作χ2檢驗,整理如表4:表4用藥組和對照組的流感發(fā)病率的比較

即兩大樣本率比較的χ2檢驗與u檢驗是等價的。

=4.125=u2≈(2.031)2第17頁,課件共40頁,創(chuàng)作于2023年2月例7某市對醫(yī)院空氣消毒監(jiān)測,市級醫(yī)院65個抽樣點中52個合格,合格率80.00%,鄉(xiāng)鎮(zhèn)醫(yī)院53個抽樣點中22個合格,合格率41.51%。問城鄉(xiāng)醫(yī)院空氣消毒合格率是否不同?表5城鄉(xiāng)醫(yī)院空氣消毒合格率的比較采用χ2檢驗=18.50第18頁,課件共40頁,創(chuàng)作于2023年2月

例8某醫(yī)生用兩種療法治療某病,結果如表6,問可否認為新療法優(yōu)于傳統(tǒng)療法?表6兩種療法治療某病治愈率比較=7.47第19頁,課件共40頁,創(chuàng)作于2023年2月3、行×列表(R×C表)資料的χ2檢驗

行×列表資料即基本數(shù)據(jù)在四個以上,如多個率的比較,其基本數(shù)據(jù)為R行×2列;兩組構成比的比較,其基本數(shù)據(jù)為2行×C列;多組構成比的比較,其基本數(shù)據(jù)為R行×C列。檢驗統(tǒng)計量計算公式為:,[υ=(R-1)(C-1)]其應用條件是T<5的格子數(shù)不超過1/5和沒有任意格的T<1。如果出現(xiàn)上述情況應作如下處理:①根本辦法是增加觀察例數(shù),使各格基本數(shù)據(jù)增大;②將T較小的行或列與性質(zhì)相近的行或列作合理的合并。ROWCOLUMN第20頁,課件共40頁,創(chuàng)作于2023年2月

例9某地在流行性腦脊髓膜炎流行期間進行了帶菌調(diào)查,結果如表7,問不同人群帶菌率是否不同?

表7某地流行性腦脊髓膜炎流行期不同人群帶菌率采用R×C表資料χ2檢驗。

第21頁,課件共40頁,創(chuàng)作于2023年2月

設H0:四個人群帶菌率相同,即

H1:四個人群帶菌率不同或不全相同α=0.05

計算統(tǒng)計量χ2值

=18.17

確定P值,作結論:

查χ2界值表,按υ=(R-1)(C-1)求得υ=3,,因而P<0.005。按α=0.05水準,拒絕H0,可以認為不同人群帶菌率不同或不全相同。

第22頁,課件共40頁,創(chuàng)作于2023年2月

例10兩個醫(yī)院合作進行腦梗塞療效試驗中,各醫(yī)院受試病例的腦梗塞部位如表8所示,問兩所醫(yī)院病例的梗塞部位的分布(構成比)是否不同?

表8甲乙兩醫(yī)院病例的腦梗塞部位的分布采用R×C表資料χ2檢驗。第23頁,課件共40頁,創(chuàng)作于2023年2月

設H0:兩所醫(yī)院病例的梗塞部位的總體分布(構成比)相同

H1:兩所醫(yī)院病例的梗塞部位的總體分布(構成比)不同α=0.05計算統(tǒng)計量χ2值=14.29確定P值,作結論:查χ2界值表,按υ=(R-1)(C-1)求得υ=2,,因而P<0.005。按α=0.05水準,拒絕H0,可以認為兩所醫(yī)院病例的梗塞部位的分布(構成比)不同,因而可比性較差。第24頁,課件共40頁,創(chuàng)作于2023年2月

例11某市和某兩縣進行地方性甲狀腺腫普查,查出各型患者如表9,問三地間地方性甲狀腺腫的型別構成是否不同?表9不同地區(qū)地方性甲狀腺腫的型別分布檢驗方法同例10。

需注意,當?shù)慕Y論為差異顯著時,只能認為各總體率(或總體構成比)之間總的說來有差別,而不能說明其彼此間都有差別,或某兩者之間有差別。若要進一步分析此問題,需作χ2分割檢驗。第25頁,課件共40頁,創(chuàng)作于2023年2月4、列聯(lián)表資料的χ2檢驗

列聯(lián)表資料是指對同一組觀察資料分別用兩種方法分類或處理,將所得的結果歸納成雙向交叉排列表的資料。其中,2×2列聯(lián)表為對同一個(或同一對)觀察對象比較兩種分類方法(或兩種處理)結果有無差別和研究兩種分類方法(或兩種處理)結果間是否有關聯(lián);R×C列聯(lián)表是檢驗兩個變量間有無關聯(lián)。分析目的不同,則檢驗方法不同,即所用檢驗統(tǒng)計量公式不同,檢驗假設亦有所不同。contingencytable第26頁,課件共40頁,創(chuàng)作于2023年2月(1)2×2列聯(lián)表資料的χ2檢驗

對同一個(或同一對)觀察對象比較兩種分類方法(或兩種處理)結果有無差別時,檢驗統(tǒng)計量公式為:式中分子上的1為連續(xù)性校正數(shù),若b+c>40時可以略去。

對同一個(或同一對)觀察對象研究兩種分類方法(或兩種處理)結果間是否有關聯(lián)時,檢驗統(tǒng)計量公式為:需注意,此時公式應用條件同前。上述兩種情況分析目的不同,其檢驗假設亦不同。How第27頁,課件共40頁,創(chuàng)作于2023年2月

例12為了研究兩種培養(yǎng)基分離空腸彎曲桿菌的效果,將每份糞便標本分別接種于甲乙兩種培養(yǎng)基共做50份培養(yǎng)結果如表10。

表10兩種培養(yǎng)基培養(yǎng)50份標本培養(yǎng)結果表11兩種培養(yǎng)基培養(yǎng)50份標本培養(yǎng)結果

此為同一標本用兩種方法培養(yǎng)的配對設計,應列為2×2雙向交叉分類表(即2×2列聯(lián)表),如表11。表中每一格表示同一份標本兩種培養(yǎng)基結果不同組合的實際對子數(shù)。應注意,若將表10數(shù)據(jù)歸納為下表的形式,是不能明確反映出同一標本兩種培養(yǎng)結果的異同,而只是單獨列出了每種培養(yǎng)基的培養(yǎng)結果,這就將配對設計歸納成了每組50份標本的兩個獨立的樣本了,這是不恰當?shù)?。?8頁,課件共40頁,創(chuàng)作于2023年2月兩種方法檢出結果差別的檢驗設

或b=c或b≠c

α=0.05計算統(tǒng)計量:確定P值,作結論:經(jīng)查χ2界值表中,υ=1時,χ20.05,1=3.84,因而P>0.05,即P>α,因而不能拒絕H0,還不能認為兩種培養(yǎng)基的檢出率不同。第29頁,課件共40頁,創(chuàng)作于2023年2月兩種方法檢出結果關聯(lián)性檢驗設H0:兩種培養(yǎng)基的培養(yǎng)結果無關聯(lián)H1:兩種培養(yǎng)基的培養(yǎng)結果有關聯(lián)

α=0.05計算統(tǒng)計量:確定P值,作結論:

經(jīng)查χ2界值表中,υ=1時,χ20.005,1=7.88,因而P<0.005,即P<α,因而拒絕H0,可以認為兩種培養(yǎng)基的檢出率有關聯(lián)。從表內(nèi)數(shù)據(jù)看檢出結果一致率為(20+21)/50=82%。第30頁,課件共40頁,創(chuàng)作于2023年2月例13某研究室用甲乙兩種血清學方法檢查410例確診的鼻咽癌患者,得結果如表12,問兩種檢驗結果間有無聯(lián)系?有無差別?

表12兩種血清學方法檢驗結果

相關性分析:χ2=38.85,υ=1,查χ2界值表得P<0.005,可以認為兩種血清學方法檢驗結果間有聯(lián)系。差別性檢驗:χ2=86.44,υ=1,查χ2界值表得P<0.005,可以認為兩種血清學方法檢出率不同,甲法陽性檢出率較高。第31頁,課件共40頁,創(chuàng)作于2023年2月

例14為了解巨細胞病毒感染情況,某醫(yī)師分別采集了302對母親與嬰兒血清,并測定其IgM抗體,結果如表13。問母嬰間血清IgM抗體檢出是否相關?母嬰間血清IgM抗體檢出率有無差別?

表13302對母嬰血清IgM抗體檢測結果

本例,Tmin=1.02<5,故而在分析“是否相關”時采用四格表資料校正χ2檢驗得:χ2=142.318,υ=1,則P<0.005,可以認為母嬰間血清IgM抗體含量有相關。在“有無差別”的分析中,χ2=2.50,υ=1,P>0.10,尚不能認為母嬰間血清IgM抗體檢出率有差別。第32頁,課件共40頁,創(chuàng)作于2023年2月(2)R×C列聯(lián)表資料的χ2檢驗

同一觀察對象(或同一組觀察人群)分別按兩種分類變量的不同水平分組,若所分水平多于2個時,就可將觀察結果歸納成R×C列聯(lián)表,如例15中表14。其形式與前述R×C表資料類似,但其研究設計和分析目的是不同的。R×C列聯(lián)表資料的χ2檢驗的分析目的是檢驗兩個分類變量間有無關聯(lián),其檢驗統(tǒng)計量的計算仍用行×列表專用公式,即:第33頁,課件共40頁,創(chuàng)作于2023年2月

例15某醫(yī)師為研究肥胖程度與發(fā)胖年齡間的關系,觀察了438名肥胖兒童青少年,結果如下表:

表14438名肥胖兒童青少年肥胖程度和發(fā)胖年齡

其檢驗假設為:Ho:肥胖程度與發(fā)胖年齡無關聯(lián)H1:肥胖程度與發(fā)胖年齡有關聯(lián)本例,χ2=40.95,υ=(4-1)(3-1)=6,查χ2界值表得χ20.005,6=18.55,則P<0.005,可以認為肥胖程度與發(fā)胖年齡間有關聯(lián)性。第34頁,課件共40頁,創(chuàng)作于2023年2月例16觀察依沙酰胺治療皮膚真菌感染效果的臨床試驗,結果如表15。試分析該病的療效是否與病程有關?

表15依沙酰胺治療皮膚真菌感染療效

當獲得兩個變量間有關聯(lián)時,若需進一步說明相關的密切程度,可計算列聯(lián)系數(shù),其計算公式為:P值在0-1之間,P越接近于1,關聯(lián)性越強,即關系越密切;P越接近于0,則關聯(lián)性越弱。本例χ2=24.64,P<0.005,Pearson列聯(lián)系數(shù)=0.232。病程痊愈好轉無效合計<1個月792481111個月--30131443個月-5年1028330215>5年29261065合計24014649435第35頁,課件共40頁,創(chuàng)作于2023年2月例17某礦職工醫(yī)院探討矽肺不同期次患者的胸片肺門密度變化,把492名患者的資料歸納如表16。問矽肺患者肺門密度的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論