分類統(tǒng)計(jì)(2)推斷_第1頁
分類統(tǒng)計(jì)(2)推斷_第2頁
分類統(tǒng)計(jì)(2)推斷_第3頁
分類統(tǒng)計(jì)(2)推斷_第4頁
分類統(tǒng)計(jì)(2)推斷_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

分類資料的統(tǒng)計(jì)推斷

一、率的抽樣誤差與標(biāo)準(zhǔn)誤

抽樣研究所得的率同樣存在抽樣誤差,描述其大小的指標(biāo)是率的標(biāo)準(zhǔn)誤(standarderrorofproportion),其計(jì)算公式如下:

二、總體率的估計(jì)和率的u檢驗(yàn)

1、總體率的估計(jì):

總體率的估計(jì)有兩種方法,一是正態(tài)分布法,二是查表法?!镎龖B(tài)分布法適用于樣本較大,且p和/或1-p都不太小,如np和n(1-p)都大于5時(shí)。計(jì)算公式為:★查表法適用于小樣本。利用樣本含量n和陽性數(shù)x查“百分率的可信區(qū)間”表獲得。例1檢查居民800人糞便中蛔蟲陽性200人,陽性率為25%,試求當(dāng)?shù)鼐用窦S便蛔蟲陽性率的95%可信區(qū)間和99%可信區(qū)間。

公式:其中,即:

陽性率的95%可信區(qū)間為:

(0.22,0.28)或

(22%,28%)

同理可得陽性率的99%可信區(qū)間。2、率的u檢驗(yàn)

(1)樣本率與總體率比較樣本率與總體率(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值等)比較的目的,是推斷樣本所代表的未知總體率π與已知總體率π0是否相等。可選方法有直接計(jì)算概率法(用于π偏離0.5較遠(yuǎn),且陽性數(shù)X較小作單側(cè)檢驗(yàn)時(shí))和正態(tài)近似法。這里著重介紹正態(tài)近似法。當(dāng)π或1—π不太小,而n足夠大時(shí),如nπ和n(1—π)大于5時(shí),即可按正態(tài)近似法做假設(shè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為u值,計(jì)算公式如下:式中n為樣本例數(shù),X為樣本陽性數(shù),樣本率p=X/n;π0為總體率;0.5為連續(xù)性校正數(shù),當(dāng)n較大時(shí)可以省去,而︱X—nπ︱≤0.5時(shí)不宜采用校正數(shù)。

例2以往經(jīng)驗(yàn)?zāi)X梗塞患者治療三周的生活能力改善率為30%,某醫(yī)院用新療法治療38例的三周生活能力改善率為50%,能否認(rèn)為新療法的改善率與以往不同?

此為樣本率與總體率比較:且np和n(1-p)都大于5,故用u檢驗(yàn)。

設(shè)

α=0.05

計(jì)算統(tǒng)計(jì)量u值:

本例︱X—nπ︱≤0.5,因此不宜用校正系數(shù),故

=2.69

確定P值,作結(jié)論:查t界值表中,υ=∞時(shí),u0.01=2.5758,u0.005=2.8070,因而0.01>P>0.005,則P<α,拒絕H0,接受H1,可以認(rèn)為新療法的改善率與以往不同,新療法的改善率高于以往。(2)兩個(gè)樣本率比較

式中P0為合并陽性率,P0=(X1+X2)/(n1+n2)檢驗(yàn)統(tǒng)計(jì)量計(jì)算公式如下:

例3某中藥研究所試用某種草藥預(yù)防流感,觀察用藥組和對照組(未用藥組)的流感發(fā)病率,結(jié)果如下表,問兩組的流感發(fā)病率是否不同?表1用藥組和對照組的流感發(fā)病率此為兩大樣本率的比較,可用u檢驗(yàn)。

假設(shè)檢驗(yàn)過程:

設(shè)

α=0.05

計(jì)算統(tǒng)計(jì)量u值:

=2.031

確定P值,作結(jié)論:查t界值表中,υ=∞時(shí),u0.05=1.96,u0.01=2.5758,因而0.05>P>0.01,則P<α,拒絕H0,接受H1,可以認(rèn)為兩組發(fā)病率不同,用藥組發(fā)病率低于對照組,說明該草藥有預(yù)防流感的作用三、χ2檢驗(yàn)χ2檢驗(yàn)(Chi-squaretest)用途極廣,這里僅介紹它在分類變量資料中用于推斷兩個(gè)或兩個(gè)以上總體率(或構(gòu)成比)之間有無差別或有無關(guān)聯(lián)的分析方法。

1、χ2檢驗(yàn)的基本思想例4:某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸球部潰瘍,以甲氰咪胍作對照組,結(jié)果如表5,問兩種方法治療效果有無差別?表2.兩種藥物治療十二指腸球部潰瘍的效果wChi-squaretest設(shè)

α=0.05

計(jì)算統(tǒng)計(jì)量χ2值:

χ2值的基本公式為:

式中A為實(shí)際頻數(shù),即所獲資料中的基本數(shù)據(jù);T為理論頻數(shù),是根據(jù)檢驗(yàn)假設(shè)H0推算得到的,,其中,nR為同行合計(jì),nC為同列合計(jì),n為總例數(shù)。

χ2檢驗(yàn)的基本思想體現(xiàn)在χ2值的基本公式中,即當(dāng)H0成立時(shí),實(shí)際頻數(shù)A就與理論頻數(shù)T很接近,此時(shí)χ2值不會(huì)太大;反之,如若A與T相差較大,就會(huì)計(jì)算得到一個(gè)較大的χ2值,當(dāng)其超出一定范圍時(shí),就有理由認(rèn)為H0不成立。因此,實(shí)際上χ2值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。

Pearson卡方值2、四格表資料的χ2檢驗(yàn)

四格表資料即基本數(shù)據(jù)只有四個(gè),為兩行兩列,如兩個(gè)率的比較。檢驗(yàn)統(tǒng)計(jì)量專用計(jì)算公式為:

,[υ=(R-1)(C-1)]

式中a,b,c,d分別代表四個(gè)實(shí)際頻數(shù),n為總例數(shù);υ為自由度,R為行數(shù),C為列數(shù)。fourfoldtable

(1)四個(gè)表資料χ2檢驗(yàn)實(shí)例:例4:某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸球部潰瘍,以甲氰咪胍作對照組,結(jié)果如表5,問兩種方法治療效果有無差別?表2.兩種藥物治療十二指腸球部潰瘍的效果

假設(shè)檢驗(yàn)過程:

設(shè)

α=0.05

計(jì)算統(tǒng)計(jì)量χ2值:

確定P值,作結(jié)論:查χ2界值表中,υ=1時(shí),χ20.05,1=3.84,χ20.01,1=6.63,因而0.05>P>0.01,即P<α,因而拒絕H0,接受H1,可以認(rèn)為兩組潰瘍愈合率差別顯著,呋喃硝胺的愈合率高于甲氰咪胍。(2)四格表資料χ2檢驗(yàn)應(yīng)用注意:①當(dāng)n>40,且任意T≥5時(shí),可四格表專用公式。②當(dāng)n>40,且任意1<T<5時(shí),應(yīng),其計(jì)算公式為:例5.某醫(yī)生欲比較胞磷膽堿與腦益嗪治療腦動(dòng)脈硬化的療效,觀察結(jié)果如表3,問兩種藥物的療效有無差別?表3.兩種藥物治療腦動(dòng)脈硬化的療效

表3顯示有一個(gè)理論頻數(shù)T<5,因此應(yīng)用校正χ2檢驗(yàn)。③當(dāng)n<40或任意T<1時(shí),應(yīng)改用確切概率法。直接使用計(jì)算校正χ2值(3)四格表資料χ2檢驗(yàn)與u檢驗(yàn)的關(guān)系

例6以例3資料作χ2檢驗(yàn),整理如表4:表4用藥組和對照組的流感發(fā)病率的比較

即兩大樣本率比較的χ2檢驗(yàn)與u檢驗(yàn)是等價(jià)的。

=4.125=u2≈(2.031)2例7某市對醫(yī)院空氣消毒監(jiān)測,市級(jí)醫(yī)院65個(gè)抽樣點(diǎn)中52個(gè)合格,合格率80.00%,鄉(xiāng)鎮(zhèn)醫(yī)院53個(gè)抽樣點(diǎn)中22個(gè)合格,合格率41.51%。問城鄉(xiāng)醫(yī)院空氣消毒合格率是否不同?表5城鄉(xiāng)醫(yī)院空氣消毒合格率的比較采用χ2檢驗(yàn)

=18.50

例8某醫(yī)生用兩種療法治療某病,結(jié)果如表6,問可否認(rèn)為新療法優(yōu)于傳統(tǒng)療法?表6兩種療法治療某病治愈率比較

=7.473、行×列表(R×C表)資料的χ2檢驗(yàn)

行×列表資料即基本數(shù)據(jù)在四個(gè)以上,如多個(gè)率的比較,其基本數(shù)據(jù)為R行×2列;兩組構(gòu)成比的比較,其基本數(shù)據(jù)為2行×C列;多組構(gòu)成比的比較,其基本數(shù)據(jù)為R行×C列。檢驗(yàn)統(tǒng)計(jì)量計(jì)算公式為:,[υ=(R-1)(C-1)]

其應(yīng)用條件是T<5的格子數(shù)不超過1/5和沒有任意格的T<1。如果出現(xiàn)上述情況應(yīng)作如下處理:①根本辦法是增加觀察例數(shù),使各格基本數(shù)據(jù)增大;②將T較小的行或列與性質(zhì)相近的行或列作合理的合并。ROWCOLUMN

例9某地在流行性腦脊髓膜炎流行期間進(jìn)行了帶菌調(diào)查,結(jié)果如表7,問不同人群帶菌率是否不同?

表7某地流行性腦脊髓膜炎流行期不同人群帶菌率采用R×C表資料χ2檢驗(yàn)。

設(shè)H0:四個(gè)人群帶菌率相同,即

H1:四個(gè)人群帶菌率不同或不全相同

α=0.05

計(jì)算統(tǒng)計(jì)量χ2值

=18.17

確定P值,作結(jié)論:

查χ2界值表,按υ=(R-1)(C-1)求得υ=3,

,因而P<0.005。按α=0.05水準(zhǔn),拒絕H0,可以認(rèn)為不同人群帶菌率不同或不全相同。

例10兩個(gè)醫(yī)院合作進(jìn)行腦梗塞療效試驗(yàn)中,各醫(yī)院受試病例的腦梗塞部位如表8所示,問兩所醫(yī)院病例的梗塞部位的分布(構(gòu)成比)是否不同?

表8甲乙兩醫(yī)院病例的腦梗塞部位的分布采用R×C表資料χ2檢驗(yàn)。

設(shè)H0:兩所醫(yī)院病例的梗塞部位的總體分布(構(gòu)成比)相同

H1:兩所醫(yī)院病例的梗塞部位的總體分布(構(gòu)成比)不同

α=0.05計(jì)算統(tǒng)計(jì)量χ2值

=14.29確定P值,作結(jié)論:查χ2界值表,按υ=(R-1)(C-1)求得υ=2,

,因而P<0.005。按α=0.05水準(zhǔn),拒絕H0,可以認(rèn)為兩所醫(yī)院病例的梗塞部位的分布(構(gòu)成比)不同,因而可比性較差。

例11某市和某兩縣進(jìn)行地方性甲狀腺腫普查,查出各型患者如表9,問三地間地方性甲狀腺腫的型別構(gòu)成是否不同?表9不同地區(qū)地方性甲狀腺腫的型別分布檢驗(yàn)方法同例10。

需注意,當(dāng)?shù)慕Y(jié)論為差異顯著時(shí),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,而不能說明其彼此間都有差別,或某兩者之間有差別。若要進(jìn)一步分析此問題,需作χ2分割檢驗(yàn)。4、列聯(lián)表資料的χ2檢驗(yàn)

列聯(lián)表資料是指對同一組觀察資料分別用兩種方法分類或處理,將所得的結(jié)果歸納成雙向交叉排列表的資料。其中,2×2列聯(lián)表為對同一個(gè)(或同一對)觀察對象比較兩種分類方法(或兩種處理)結(jié)果有無差別和研究兩種分類方法(或兩種處理)結(jié)果間是否有關(guān)聯(lián);R×C列聯(lián)表是檢驗(yàn)兩個(gè)變量間有無關(guān)聯(lián)。分析目的不同,則檢驗(yàn)方法不同,即所用檢驗(yàn)統(tǒng)計(jì)量公式不同,檢驗(yàn)假設(shè)亦有所不同。

contingencytable(1)2×2列聯(lián)表資料的χ2檢驗(yàn)

對同一個(gè)(或同一對)觀察對象比較兩種分類方法(或兩種處理)結(jié)果有無差別時(shí),檢驗(yàn)統(tǒng)計(jì)量公式為:式中分子上的1為連續(xù)性校正數(shù),若b+c>40時(shí)可以略去。

對同一個(gè)(或同一對)觀察對象研究兩種分類方法(或兩種處理)結(jié)果間是否有關(guān)聯(lián)時(shí),檢驗(yàn)統(tǒng)計(jì)量公式為:需注意,此時(shí)公式應(yīng)用條件同前。上述兩種情況分析目的不同,其檢驗(yàn)假設(shè)亦不同。

How

例12為了研究兩種培養(yǎng)基分離空腸彎曲桿菌的效果,將每份糞便標(biāo)本分別接種于甲乙兩種培養(yǎng)基共做50份培養(yǎng)結(jié)果如表10。

表10兩種培養(yǎng)基培養(yǎng)50份標(biāo)本培養(yǎng)結(jié)果表11兩種培養(yǎng)基培養(yǎng)50份標(biāo)本培養(yǎng)結(jié)果

此為同一標(biāo)本用兩種方法培養(yǎng)的配對設(shè)計(jì),應(yīng)列為2×2雙向交叉分類表(即2×2列聯(lián)表),如表11。表中每一格表示同一份標(biāo)本兩種培養(yǎng)基結(jié)果不同組合的實(shí)際對子數(shù)。應(yīng)注意,若將表10數(shù)據(jù)歸納為下表的形式,是不能明確反映出同一標(biāo)本兩種培養(yǎng)結(jié)果的異同,而只是單獨(dú)列出了每種培養(yǎng)基的培養(yǎng)結(jié)果,這就將配對設(shè)計(jì)歸納成了每組50份標(biāo)本的兩個(gè)獨(dú)立的樣本了,這是不恰當(dāng)?shù)?。兩種方法檢出結(jié)果差別的檢驗(yàn)設(shè)

或b=c

或b≠c

α=0.05計(jì)算統(tǒng)計(jì)量:確定P值,作結(jié)論:經(jīng)查χ2界值表中,υ=1時(shí),χ20.05,1=3.84,因而P>0.05,即P>α,因而不能拒絕H0,還不能認(rèn)為兩種培養(yǎng)基的檢出率不同。兩種方法檢出結(jié)果關(guān)聯(lián)性檢驗(yàn)設(shè)

H0:兩種培養(yǎng)基的培養(yǎng)結(jié)果無關(guān)聯(lián)

H1:兩種培養(yǎng)基的培養(yǎng)結(jié)果有關(guān)聯(lián)

α=0.05計(jì)算統(tǒng)計(jì)量:確定P值,作結(jié)論:

經(jīng)查χ2界值表中,υ=1時(shí),χ20.005,1=7.88,因而P<0.005,即P<α,因而拒絕H0,可以認(rèn)為兩種培養(yǎng)基的檢出率有關(guān)聯(lián)。從表內(nèi)數(shù)據(jù)看檢出結(jié)果一致率為(20+21)/50=82%。例13某研究室用甲乙兩種血清學(xué)方法檢查410例確診的鼻咽癌患者,得結(jié)果如表12,問兩種檢驗(yàn)結(jié)果間有無聯(lián)系?有無差別?

表12兩種血清學(xué)方法檢驗(yàn)結(jié)果

相關(guān)性分析:χ2=38.85,υ=1,查χ2界值表得P<0.005,可以認(rèn)為兩種血清學(xué)方法檢驗(yàn)結(jié)果間有聯(lián)系。差別性檢驗(yàn):χ2=86.44,υ=1,查χ2界值表得P<0.005,可以認(rèn)為兩種血清學(xué)方法檢出率不同,甲法陽性檢出率較高。

例14為了解巨細(xì)胞病毒感染情況,某醫(yī)師分別采集了302對母親與嬰兒血清,并測定其IgM抗體,結(jié)果如表13。問母嬰間血清IgM抗體檢出是否相關(guān)?母嬰間血清IgM抗體檢出率有無差別?

表13302對母嬰血清IgM抗體檢測結(jié)果

本例,Tmin=1.02<5,故而在分析“是否相關(guān)”時(shí)采用四格表資料校正χ2檢驗(yàn)得:χ2=142.318,υ=1,則P<0.005,可以認(rèn)為母嬰間血清IgM抗體含量有相關(guān)。在“有無差別”的分析中,χ2=2.50,υ=1,P>0.10,尚不能認(rèn)為母嬰間血清IgM抗體檢出率有差別。(2)R×C列聯(lián)表資料的χ2檢驗(yàn)

同一觀察對象(或同一組觀察人群)分別按兩種分類變量的不同水平分組,若所分水平多于2個(gè)時(shí),就可將觀察結(jié)果歸納成R×C列聯(lián)表,如例15中表14。其形式與前述R×C表資料類似,但其研究設(shè)計(jì)和分析目的是不同的。

R×C列聯(lián)表資料的χ2檢驗(yàn)的分析目的是檢驗(yàn)兩個(gè)分類變量間有無關(guān)聯(lián),其檢驗(yàn)統(tǒng)計(jì)量的計(jì)算仍用行×列表專用公式,即:

例15某醫(yī)師為研究肥胖程度與發(fā)胖年齡間的關(guān)系,觀察了438名肥胖兒童青少年,結(jié)果如下表:

表14438名肥胖兒童青少年肥胖程度和發(fā)胖年齡

其檢驗(yàn)假設(shè)為:Ho:肥胖程度與發(fā)胖年齡無關(guān)聯(lián)

H1:肥胖程度與發(fā)胖年齡有關(guān)聯(lián)本例,χ2=40.95,υ=(4-1)(3-1)=6,查χ2界值表得χ20.005,6=18.55,則P<0.005,可以認(rèn)為肥胖程度與發(fā)胖年齡間有關(guān)聯(lián)性。例16觀察依沙酰胺治療皮膚真菌感染效果的臨床試驗(yàn),結(jié)果如表15。試分析該病的療效是否與病程有關(guān)?

表15依沙酰胺治療皮膚真菌感染療效

當(dāng)獲得兩個(gè)變量間有關(guān)聯(lián)時(shí),若需進(jìn)一步說明相關(guān)的密切程度,可計(jì)算列聯(lián)系數(shù),其計(jì)算公式為:P值在0-1之間,P越接近于1,關(guān)聯(lián)性越強(qiáng),即關(guān)系越密切;P越接近于0,則關(guān)聯(lián)性越弱。本例χ2=24.64

,P<0.005,Pearson列聯(lián)系數(shù)=0.232。病程痊愈好轉(zhuǎn)無效合計(jì)<1個(gè)月

79

24

81111個(gè)月--

30

13

1

443個(gè)月-5年102

8330215>5年

29

2610

65合計(jì)24014649435例17某礦職工醫(yī)院探討矽肺不同期次患者的胸片肺門密度變化,把492名患者的資料歸納如表16。問矽肺患者肺門密度的增加與矽肺的期次有無關(guān)系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論