統(tǒng)計與軟件4課件_第1頁
統(tǒng)計與軟件4課件_第2頁
統(tǒng)計與軟件4課件_第3頁
統(tǒng)計與軟件4課件_第4頁
統(tǒng)計與軟件4課件_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

中醫(yī)藥統(tǒng)計學與軟件

czq9771@163.com第四章總體均數(shù)的估計、假設(shè)檢驗總體均數(shù)的估計正態(tài)性檢驗、方差齊性檢驗T檢驗構(gòu)成比不同的兩樣本均數(shù)比較假設(shè)檢驗注意的問題假設(shè)檢驗P>α時檢驗效能1-β的估計置信區(qū)間與假設(shè)檢驗的關(guān)系2總體均數(shù)的估計一、標準誤、樣本均數(shù)分布1.標準誤統(tǒng)計量的標準差稱標準誤(standarderror)

2.樣本均數(shù)的分布與均數(shù)的標準誤

在抽樣研究中,即使是嚴格遵守隨機抽樣原則,從同一總體中每次抽取樣本含量相等(都為n)的樣本,計算每一個樣本的樣本均數(shù),由于變異存在,樣本均數(shù)有大有小,不盡相同,是隨機變量,其分布稱為樣本均數(shù)的分布。3⑵設(shè)分布的均數(shù)是,則=⑶設(shè)的方差是,則=,是總體標準誤.即x~N(μ,σ)時

情形Ⅱ當抽樣來自非正態(tài)分布總體時,樣本均數(shù)的分布(抽樣分布)有下面的性質(zhì):5⑴的分布是近似正態(tài)的,隨樣本容量的增加,靠近正態(tài)的程度就越好.一般地,的抽樣分布靠近正態(tài)分布所需要的樣本容量取決于最初分布的外形.在幾乎所有的情形里面,對的抽樣分布,樣本容量在50或以上就可以得到很好的正態(tài)近似.(均數(shù)的這個性質(zhì)就是眾所周知的中心極限定理CentralLimitTheorem)(2)不是正態(tài)總體,n足夠大樣本均數(shù)近似服從正態(tài)分布.

二、t分布在公式中用代替得到:6用S替換σ產(chǎn)生了一個不同的樣本分布.如果σ值未知又必須估計它,用估計值s替換σ所得變量的分布稱為t分布.有時稱為Student’st分布,這個分布族取決于參數(shù)n-1.Z是具有μ=0,σ=1的標準正態(tài)分布,而t是具有μ=0,σ取決于樣本容量的t分布.隨樣本容量的增加.t分布漸近標準正態(tài)分布.見圖(4-3)(4-4)7t分布的準確外形取決于被稱為自由度(degreesoffreedom)的數(shù)量.像正態(tài)分布一樣,t分布是對稱的鐘形曲線,但是有點平坦,例如,它們有大的標準差.對任何t分布,自由度恰好是樣本容量減1:df=n-1.

作為為多個t分布的部分累積分布函數(shù)的比較已經(jīng)列在附表3里.P43281.t分布有兩條重要性質(zhì):(1)從正態(tài)總體中每次隨機抽取例數(shù)為n的樣本,按(式4-4)計算的統(tǒng)計量服從自由度為df=n-1的t分布(即樣本均數(shù)與總體均數(shù)相差多少個標準誤服從自由度為n-1的t分布)。(2)從相互獨立,總體均數(shù)分別為μ1,μ2,而標準差都為σ的兩個正態(tài)總體中,隨機抽取樣本含量分別為n1,n2的兩個樣本,分別算出樣本均數(shù)和標準差為X1和S1,X2和S2,按(式4-5)計算的統(tǒng)計量服從自由度為df=n1+n2-2的t分布。自由度df=n1+n2-2(4-5)10三.

總體均數(shù)的估計由樣本觀察值算出總體參數(shù)的一個估計值(為統(tǒng)計量)稱為該參數(shù)的一個點估計(pointestimation)。點估計給出未知參數(shù)的一個近似值,但沒考慮試驗誤差影響,也未指出這種估計的可靠程度。因為估計量是來自一個隨機抽取的樣本,每一次取值都有隨機性,剛好等于待估計參數(shù)的可能性極小,而在參數(shù)值左右的情況較多。1.點估計和區(qū)間估計總體參數(shù)的估計有點估計和區(qū)間估計。統(tǒng)計學上更合理的估計是在一定概率(1-α)下,由含有未知參數(shù)及其點估計值所構(gòu)成的統(tǒng)計量的分布規(guī)律估計出參數(shù)可能存在的范圍,稱為區(qū)間估計。(intervalestimation)12實踐中一般不會去抽取許多個樣本,通常只抽取一個樣本,計算出一個區(qū)間,雖然無法確認這個區(qū)間是否包含了待估計的參數(shù),但可知這種估計可信的程度為95%,會冒5%犯錯誤的風險。因5%是小概率,在實際應(yīng)用中就認為待估計的總體參數(shù)在算得的區(qū)間內(nèi)。3.可信區(qū)間有兩要素:一是準確度,反映在可信度(1-α)的大小,即區(qū)間包含總體參數(shù)的可能性(概率)的大小,準確度越接近1越好,例如,可信度99%比95%犯錯誤的風險??;二是精密度,反映在區(qū)間的長度,區(qū)間的長度愈小愈精密。在可信度確定的情況下,增大樣本含量,相應(yīng)的界值(如t界值)減少,標準誤也減小,可減小區(qū)間長度,提高精密度。在樣本含量確定的情況下,可信度(1-α)愈大,總體參數(shù)估計的準確度愈高,但精密度愈差。二者是矛盾的,為兼顧準確度和精密度,常用95%可信區(qū)間。置信區(qū)間和置信限95%置信區(qū)間CICL144.單個總體均數(shù)的估計樣本均數(shù)是總體均數(shù)μ的一個點估計。σ已知時,按(式4-3)計算的統(tǒng)計量服從標準正態(tài)分布,根據(jù)標準正態(tài)分布的規(guī)律

P(-uα/2<u<uα/2)=1-α,有

條件統(tǒng)計量的分布(1-α)可信區(qū)間公式縮寫σ已知正態(tài)分布σ未知小樣本t分布σ未知大樣本逼近正態(tài)分布15【例4.1】醫(yī)圣張仲景的處方中,用桂枝的量服從正態(tài)分布,標準差σ=3g,查《傷寒論》中桂枝處方39張,算得桂枝用量的樣本均數(shù)為=8.14g,試求醫(yī)圣張仲景桂枝用量總體均數(shù)μ的95%可信區(qū)間解計算得n=39,樣本均數(shù)=8.14,標準差s=3,df=38,u0.05/2=1.9616例4.2從同一批號的逍遙丸中隨機抽檢5丸,測得崩解時間(月)為21,18,20,16,15。已知藥丸崩解時間服從正態(tài)分布,求該批藥丸崩解時間總體均數(shù)的95%、99%可信區(qū)間。17置信區(qū)間(confidenceinternal)的意義

.在樣本被抽出之前計算總體均數(shù)μ的一個置信區(qū)間,人們聲稱在給定的概率下它包含μ.在樣本抽出后所計算的置信區(qū)間,如同前面所述,它或者包含μ(P=1)或者不包含μ(P=0).這就是在公式里使用C(confidence)而不是概率P(probability)的理由.換句話說,全部區(qū)間的95%實際上包含了μ.見圖18假設(shè)檢驗一、假設(shè)檢驗的的基本思想

假設(shè)檢驗(hypothesistesting)亦稱顯著性檢驗(significancetest),它和參數(shù)估計是統(tǒng)計推斷的兩個重要內(nèi)容。假設(shè)檢驗是先對總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè)(hypothesis),如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等,然后根據(jù)隨機樣本提供的信息,運用“小概率原理”推斷假設(shè)是否成立。假設(shè)檢驗通過隨機樣本認識總體的結(jié)論有助于作出正確的專業(yè)結(jié)論。假設(shè)檢驗是對總體的特征提出假設(shè),根據(jù)樣本提供信息用“小概率原理”推斷假設(shè)是否成立20所謂小概率原理,就是“在一次試驗中,概率很小(接近于零)的事件認為是實際上不可能發(fā)生的事件”。例如,假設(shè)在1000支復方大青葉注射液針劑中只有一支是失效的,現(xiàn)在從中隨機抽取一支,則取得“失效的那支”概率為1/1000,這個概率是很小的,因此,可以認為在一次抽取中是不會發(fā)生的,若從中任取一支恰好為“失效的那支”,我們就有理由懷疑“失效概率為1/1000”的假設(shè)不成立,而認為失效率不是1/1000,從而否定假設(shè)。否定假設(shè)的依據(jù)就是小概率原理。例4-3:已知正常成年男子脈博平均為72次/分,現(xiàn)隨機檢查20名慢性胃炎所致脾虛男病人,其脈博均數(shù)為75次/分,標準差為6.4次/分,能否認為此類脾虛男病人的脈博快于健康成年男子的脈博?21

如果出現(xiàn)了小概率事件,就拒絕這個假設(shè);如果沒有出現(xiàn)小概率事件,則沒有理由懷疑這個假設(shè),所以不拒絕這個假設(shè)。這種推斷方法的特點是依據(jù)小概率原理,采用類似于數(shù)學中邏輯論證的反證法,但又區(qū)別于純數(shù)學中邏輯推理的反證法。因為這里并不是形式邏輯中的絕對矛盾,而是基于人們在實踐中廣泛應(yīng)用的小概率原理。所以,可以說假設(shè)檢驗的基本思想是某種帶有概率性質(zhì)的反證法。假設(shè)檢驗有兩種類型:(1)參數(shù)檢驗(nparametric):在許多問題中,總體分布的類型為已知,只是一個或幾個參數(shù)未知,只對未知參數(shù)作出假設(shè),然后根據(jù)隨機樣本提供的信息,選取檢驗統(tǒng)計量,按檢驗統(tǒng)計量的分布規(guī)律,用“小概率原理”推斷假設(shè)是否成立。(2)非參數(shù)檢驗(nonparametric):是一種與總體分布無關(guān)的統(tǒng)計檢驗方法,它不比較參數(shù),而是比較分布的位置。當不知道樣本來自的總體分布類型或已知總體分布與檢驗所要求的條件不符,可用非參數(shù)檢驗。23二、假設(shè)檢驗的一般步驟1.建立假設(shè)并確定檢驗水準(1)建立假設(shè):①假設(shè)需根據(jù)研究的目的對總體的特征而提出。假設(shè)有兩種:一種是檢驗假設(shè)(hypothesistobetested),假設(shè)差異完全由抽樣誤差造成,常稱無效假設(shè)(hullhypothesis),用H0表示。另一種是和H0相對立的備擇假設(shè)(alternativehypothesis),用H1表示,H1通常是希望證實的情況。假設(shè)檢驗是針對H0進行的,希望用樣本數(shù)據(jù)推斷H0是假的,從而證實H1是真的。假設(shè)檢驗的結(jié)果是在零假設(shè)H0和對立假設(shè)H1之間作出抉擇。當拒絕H0時,接受H1,認為差異有統(tǒng)計意義;當不拒絕H0時,認為差異無統(tǒng)計意義,則不接受H1。24簡言之:根據(jù)專業(yè)知識或研究目的H1不能肯定方向,則檢驗是雙側(cè)的,稱雙側(cè)檢驗。H1能肯定方向,則檢驗是單側(cè)的,稱單側(cè)檢驗。

例4-3的目的是推斷此類脾虛病人的脈博是否快于正常人(正常人的脈博總體均數(shù)為μ0=72次/分),H0為此類脾虛病對脈博數(shù)無影響,即此類脾虛病人的脈博總體均數(shù)等于正常人,用符號表示為:H0:μ=72次/分,即μ=μ0與之對應(yīng)的備擇假設(shè)為該類脾虛病的脈博數(shù)快于正常人,用符號表示為:

H1:μ>72次/分,即μ>μ026(2)確定檢驗水準:檢驗水準(sizeofatest)亦稱顯著性水平(significancelevel),常用符號α表示。α是假設(shè)檢驗時預先確定的,用以作為判斷多小的概率可以認為是小概率的水準,故稱為檢驗水準。α的大小視具體情況而定,一般α取0.05或0.01,若按α=0.05拒絕H0,接受H1,作出這樣的判斷要冒5%錯誤的風險。從圖4-2可以看出,同一資料、同一檢驗水準α時,因單側(cè)檢驗的界值t0.025相當于雙側(cè)檢驗的界值t0.05,雙側(cè)P為單側(cè)P的兩倍,所以單側(cè)檢驗比雙側(cè)檢驗更易拒絕H0。一般認為雙側(cè)檢驗較為穩(wěn)妥,故較為常用。27強調(diào)指出,檢驗水準α的確定,以及選擇單側(cè)檢驗還是雙側(cè)檢驗,都應(yīng)結(jié)合專業(yè)知識和研究目的,在實驗設(shè)計時決定,不能等到樣本結(jié)果計算完后再根據(jù)主觀愿望選定。2.選取檢驗統(tǒng)計量,明確其分布,并由樣本計算檢驗統(tǒng)計量值檢驗統(tǒng)計量是指建立在無效假設(shè)H0基礎(chǔ)上的,用于抉擇是否拒絕H0而選定的樣本函數(shù)。參數(shù)檢驗的檢驗統(tǒng)計量要求滿足以下條件:①在H0成立的條件下,它的分布函數(shù)是已知的;②它必須包含要檢驗的總體參數(shù);③對于給定的樣本數(shù)據(jù),能計算出該檢驗統(tǒng)計量的數(shù)值。假設(shè)檢驗通常是以選定的檢驗統(tǒng)計量來命名的,例如,以u值為檢驗統(tǒng)計量的假設(shè)檢驗稱為u檢驗,以t值為檢驗統(tǒng)計量的假設(shè)檢驗稱為t檢驗。檢驗統(tǒng)計量的選取,因資料不同而不同。如例4-3,樣本均數(shù)與總體均數(shù)比較,如果H0(μ=μ0)成立,(-μ0)的絕對值應(yīng)比較小,一旦很大,就認為H0不成立。28三、假設(shè)檢驗的兩類錯誤當H0為真.

●如果我們接受H0,我們就做對了.

●如果我們拒絕H0,我們就犯了錯誤.(Ⅰ型錯誤)定義P(Ⅰ型錯誤)=拒絕一個真實的零假設(shè)的概率這個概率用α表示,在第3步選擇顯著性水平時就確定了.顯著性水平是指在零假設(shè)為真的情況下,作為拒絕H0的稀有結(jié)果的度量.當H0為假●如果我們接受H0,我們就犯了錯誤.(Ⅱ型錯誤)●如果我們拒絕H0,我們就做對了.

定義P(Ⅱ型錯誤)=拒絕一個虛假的零假設(shè)的概率.

30這個概率用β表示,評價它困難多,因為它取決于下面討論的一些因素.事實上當H0為假的時候,拒絕H0的概率就是1-β,稱它為檢驗效率(powerofthetest)客觀實際拒絕H0不拒絕H0H0為真H0為假Ⅰ型錯誤(α)推斷正確(1-β)推斷正確(1-α)Ⅱ型錯誤(β)統(tǒng)計推斷可能出現(xiàn)的4種結(jié)果α的含義是,兩總體無差別,按α水準檢驗為有差別的概率β的含義是,兩總體有差別,按α水準檢驗為無差別的概率1-α為可信度,是指兩總體確無差別,按α水準能作出正確推斷的概率。即不出現(xiàn)Ⅰ型錯誤的概率1-β為把握度,是指兩總體確有差別,按α水準能檢驗出差別的概率,故又有檢驗效能之稱。31從圖中看出,當樣本含量n確定時,α愈小,β愈大;反之,α愈大,β愈小。若要同時減少Ⅰ型錯誤和Ⅱ型錯誤,則只有增加樣本含量。當不可能同時達到較小的檢驗水準α和較大的檢驗效能1-β時,一般先確定檢驗水準α,然后決定檢驗效能。檢驗水準稱顯著性水平,一般α取0.05或0.01。32正態(tài)性檢驗、方差齊性檢驗一、正態(tài)性檢驗

正態(tài)性檢驗的目的是檢驗資料是否服從正態(tài)分布,確定樣本是否來自正態(tài)分布的總體正態(tài)分布特征:一是對稱,二是正態(tài)峰,描述對稱用偏度系數(shù)s,描述峰態(tài)用峰度系數(shù)k。33偏度系數(shù)=0表示與正態(tài)分布相同,偏度系數(shù)>0表示正或右偏態(tài),偏度系數(shù)<0表示負或左偏態(tài)。峰度系數(shù)=0表示與正態(tài)分布相同,峰度系數(shù)>0表示比正態(tài)分布陡峭,峰度系數(shù)<0表示比正態(tài)平坦34【例4-4】判斷例3-1資料正常人血糖的正態(tài)性解

H0:總體服從正態(tài)分布,H1:不服從正態(tài)分布

SPSS:→Analyze→Explore或→Analyze→NonparametricTests→1-SampleK-S(柯爾莫哥諾夫-斯米爾諾夫檢驗)

用統(tǒng)計軟件不方便時,否定正態(tài)性的方法最簡單的是將均數(shù)與中位數(shù)及標準差進行比較,均數(shù)與中位數(shù)兩者不等且相差較大時,分布不對稱;標準差大于均數(shù)時,表示數(shù)據(jù)分散,曲線“矮、胖”,峰平闊,與正態(tài)峰度不同。這類資料,可以判定不符合正態(tài)分布。非偏態(tài)資料不一定具有正態(tài)峰,均數(shù)近于中位數(shù)或標準差小于均數(shù)的資料也不一定都符合正態(tài)分布。35【例4.4】判斷例3.1資料正常人血糖的正態(tài)性解

H0:總體服從正態(tài)分布,H1:不服從正態(tài)分布

SPSS:→Analyze→Explore或→Analyze→NonparametricTests→1-SampleK-S二、方差齊性檢驗

1.2分布如果Z1,Z2,...,Zn是獨立的標準正態(tài)變量,則稱2=Z12+Z22+...+Zn2為自由度為df=n的2分布。36⑴2分布具有可加性若隨機變量12,22分別服從自由度為df1,df2的2分布,且它們相互獨立,則12±22服從自由度為df=df1±df2的2分布。⑵若從均數(shù)為μ,標準差為σ的正態(tài)總體中,抽取樣本含量為n的樣本,計算樣本標準差s,則2=(n-1)s2/σ2服從自由度為df=n-1的2分布。

2.F分布。

如果隨機變量X1、X2分別服從自由度為df1,df2的2分布,則稱隨機變量F=(X1/df1)/(X2/df2)服從自由度為df1,df2

的F分布。37P(F>Fα(df1,df2))=α表示F分布曲線下,界值Fα(df1,df2)

右側(cè)面積占總面積的百分數(shù)

F分布具有倒數(shù)性質(zhì)分別從兩個正態(tài)總體N(μ1,σ1)和N(μ2,σ2)中隨機抽取含量為n1,n2的樣本,樣本方差分別為s12和s22,則統(tǒng)計量F=(s12/σ12)/(s22/σ22)服從自由度為df1=n1-1,df2=n2-1的F分布。

383.兩樣本或多樣本方差的齊性檢驗法例4.5治療急性上消化道出血,抗血纖溶芳酸x1:n1=20,s12=47.61;大黃組x2:n2=30,s22=0.7744H0:σ12=σ22,H1:σ12

σ22

。正態(tài)分布時,兩總體方差齊性檢驗:從方差分別為σ12,σ22的正態(tài)總體中隨機抽樣,則s12,s22分別是σ12,σ22

的估計,在H0:σ12=σ22=σ2時,F(xiàn)=s12/s22,df1=n1-1,df2=n2-1。df1=20–1=19,df2=30–1=29,查F界值表,P<0.05,按α=0.05水準拒絕H0接受H1,兩個總體方差不齊394.樣本方差與已知總體方差比較

多樣本方差齊性檢驗時,有Bartlett、Levene、Brown&Forsythe、QBrien檢驗等多種在H0:σ2=σ02假設(shè)下

【例4.6】含碳量服從均數(shù)為1.408,方差為0.0482的正態(tài)分布。某班產(chǎn)品隨機抽取5件,測得含碳量(%)為1.32,1.55,1.36,1.40和1.44,問生產(chǎn)是否正常40解

n=5,x-=1.414和規(guī)定的總體均數(shù)μ0=1.408差不多,但s2=0.0882比規(guī)定的總體方差0.0482波動性大。要檢驗s2=0.0882

是否來自σ02=0.0482的總體H0:σ2=0.0482;H1:σ2>0.04822=(5-1)×0.0882/0.0482=13.5,df=n-1=4查2界值表,得2

0.01(4)=13.28,P<0.01,按α=0.01水準拒絕H0,可認為這個班的生產(chǎn)是不正常的,含碳量的波動性超過了標準第四節(jié)t檢驗

41一、單樣本t檢驗2.大樣本,或正態(tài)小樣本但σ已知,可用Z

檢驗1.正態(tài)分布資料σ未知小樣本,可用t檢驗

3.不服從正態(tài)分布或分布類型未知,用非參數(shù)檢驗或作變量變換轉(zhuǎn)換為正態(tài)分布資料處理

42不滿足不滿足滿足滿足σ已知正態(tài)性非參數(shù)檢驗變量替換結(jié)論不滿足單組資料大樣本u檢驗t檢驗滿足【例4.7】M含量服從正態(tài)分布,μ=63.5μg。測得40.0,41.0,41.5,41.8,42.4,43.1,43.5,43.8,44.2。這批培植人參含量與野生是否相同43解

H0:μ=63.5g,H1:μ≠63.5g計算得到n=9,x-=42.37,s=1.40

df=n-1=8,t0.01/2(8)=3.355,|t|>t0.01/2(8),P<0.01,拒絕H0,可以認為人工培植人參中M物質(zhì)的含量低于野生人參。【SPSS操作】在數(shù)據(jù)編輯窗以M為變量名,輸入M物質(zhì)含量的9個數(shù)據(jù),建立數(shù)據(jù)文件L4-7.sav?!鶤nalyze→DescriptiveStatistics→Explore,M選入DependentList框,→Plots選Nomalityplotswithtests44P=0.840>0.05,可認為M物質(zhì)含量服從正態(tài)分布?!鶤nalyze→CompareMeans→One-SampleTTest,將M選入Testvariable[s]框,改TestValue框檢驗值為63.5。45t=-45.142,自由度df=8,雙側(cè)P=0.000<0.05。故可認為人工培植人參與野生人參的M物質(zhì)含量不同。差值的95%CI

為(-22.2129,-20.0538),不包含0,按α=0.05水準,可認為人工培植人參與野生人參的M物質(zhì)含量不同。單組計量資料,調(diào)用univariate過程,使用格式為

procunivariatenormalmu0=常數(shù)

cibasicalpha=水平;var變量;freq頻數(shù);run;其中,參數(shù)mu0指定檢驗常數(shù)(為0可?。?,cibasic為可信區(qū)間,alpha指定顯著水平(為0.05可省),freq指定頻數(shù)變量(為1可?。?。46例3101隨機抽取5丸測得崩解時間為:21、18、20、16、15。崩解時間不得超過60min,判斷是否合格。dataL3101;/*逍遙丸崩解時間*/

inputx@@;cards;2118201615;procunivariatemu0=60normalcibasic;varx;run;正態(tài)性檢驗檢驗----統(tǒng)計量-----------P值-------Shapiro-WilkW0.9437Pr<W0.6919Kolmogorov-SmirnovD0.1836Pr>D>0.1500Cramer-vonMisesW-Sq0.0314Pr>W-Sq>0.2500Anderson-DarlingA-Sq0.2139Pr>A-Sq>0.250047正態(tài)性檢驗Shapiro-Wilk統(tǒng)計量=0.9437、P=0.6919>0.05,數(shù)據(jù)來自正態(tài)總體。

位置檢驗:Mu0=60檢驗--------統(tǒng)計量------------------P值----------學生tt-36.8364Pr>|t|<.0001符號M-2.5Pr>=|M|0.0625符號秩S-7.5Pr>=|S|0.0625由位置檢驗t=-36.8364、P<0.0001,以α=0.01水準拒絕H0,有統(tǒng)計學意義。由均值=18<60,可以認為,該批藥丸平均崩解時間低于60min。

48例31028名脾虛納呆患兒尿液淀粉酶含量為4,4,8,8,8,16,16,32,推斷脾虛納呆患兒尿液淀粉酶的含量是否低于10(U/10min)。

dataL3102;/*頻數(shù)資料的幾何均數(shù)檢驗*/inputxf@@;y=log10(x);cards;4283162321;procunivariatemu0=1normalcibasic;vary;freqf;run;

正態(tài)性檢驗Shapiro-Wilk統(tǒng)計量=0.9173、P=0.4082>0.05,脾虛納呆患兒尿液淀粉酶的含量取對數(shù)后的數(shù)據(jù)來自正態(tài)總體。49由位置檢驗t=-0.1965、P=0.8498>0.05,不能以α=0.05水準拒絕H0,無統(tǒng)計學意義。不能認為脾虛納呆患兒尿液淀粉酶的含量低于10(U/10min)。三、配對設(shè)計資料的均數(shù)比較

50配對t檢驗是把配對的兩組資料轉(zhuǎn)化為一組差值,假設(shè)配對差值d的總體均數(shù)μd為0,適用于配對設(shè)計成功,對子差值服從正態(tài)分布的資料。配對差值的標準誤與n1=n2=n的完全隨機設(shè)計兩均數(shù)之差的標準誤計算公式分別為式中r為配對數(shù)據(jù)的積差相關(guān)系數(shù)。

r>0時,配對設(shè)計成功,用配對t檢驗。r<0,配對設(shè)計失敗,實驗效率低于完全隨機實驗。51【例4.8】20只小白鼠配成10對,隨機分到實驗組和對照組,已知抑瘤效果滿足正態(tài)性,試比較兩組瘤體大小是否相同對子號12345678910對照組x7.04.15.04.5實驗組y3.04.02.61.3d=x-y3.3-配對設(shè)計成功時52解H0:μd=0,n=10,x-=2.16,s=1.3209r=0.075>0,配對設(shè)計成功,可以用配對t檢驗。t=2.16×100.5/1.3209=5.1709

df=9查t界值表,t0.01/2(9)=3.2498,│t│>t0.01/2(9),P<0.01,拒絕H0,可認為三棱莪術(shù)液有抑瘤效果【SPSS操作】以實驗和對照為變量名,建立2列10行的配對計量資料數(shù)據(jù)文件L4-8.sav。53→Transform→Compute,在TargetVariable框輸入d;在Numericexpression框輸入“實驗-對照”。→Analyze→DescriptiveStatistics→Explore,將d送入DependentList框,→Plots選Nomalityplotswithtests?!鶤nalyze→CompareMeans→Paired-SampleTTest,將實驗和對照同時選入PairedVariables框。數(shù)據(jù)文件L4-8.sav增加新變量d。

P=0.819>0.05,可認為配對差d服從正態(tài)分布。相關(guān)系數(shù)r=0.075>0,可認為配對設(shè)計成功。54配對檢驗統(tǒng)計量t=5.171,df=9,P=0.001,拒絕H0,可以認為三棱莪術(shù)液有抑瘤效果

。差值的95%CI為(1.2151,3.1049),不包含配對差值的總體均數(shù)0,按α=0.05水準,拒絕H0。

55相關(guān)系數(shù)計算,可以調(diào)用corr過程語句,即proccorr;varx1x2;

例3103黃芪對健康人群小腸傳遞時間作用研究。中藥新藥與臨床藥理,2001年5月第12卷第3期。測得服藥前后的數(shù)據(jù),判斷傳遞時間是否不同。編號1234567891011121314151617181920藥前2321233822222838213121223322326721605029藥后2423303521212538213021223022306822645230編號2122232425262728293031323334353637383940藥前212811610638362164212862273922402121242626藥后212711010638212536232821233022326422605222配對比較,H0:μd=0,H1:μd≠0。

56dataL3103;/*黃芪對健康人群小腸傳遞時間*/inputxy@@;d=x-y;cards;2324212121232827……………29302622;proccorr;varxy;procunivariatenormal;vard;run;Shapiro-Wilk統(tǒng)計量0.7358,P<0.0001,d不服從正態(tài)分布,應(yīng)該選擇非參數(shù)檢驗。57例3104某大學校醫(yī)院用銀楂丹桃合劑治療高血壓患者,測得治療前后舒張壓數(shù)據(jù),判斷該中藥治療高血壓是否有效。病人編號12345678治療前13.614.917.217.316.514.214.514.6治療后11.915.313.417.214.611.512.213.8打開程序L3103.sas,修改數(shù)據(jù),存為L3104.sas。Shapiro-Wilk統(tǒng)計量0.9781,P=0.9528>0.05,服從正態(tài)分布。58Pearson相關(guān)系數(shù)r=0.6949>0,配對設(shè)計成功,可以使用配對t檢驗。由t=3.2807,P=0.0135<0.05,檢驗有統(tǒng)計學意義,治療前后的舒張壓不同。由t值>0,可認為治療前的舒張壓高于治療后,銀楂丹桃合劑治療高血壓有效。例3105測得造模兔使用眼傷寧前及用藥后兩月的角膜厚度值,判斷眼傷寧對促進家兔角膜傷口愈合有無作用。

59打開程序L3104.sas,修改數(shù)據(jù)并運行。三、成組t檢驗造模兔編號12345678910用藥前厚度0.740.740.720.720.760.720.720.760.640.68用藥后厚度0.560.580.580.580.560.600.600.600.580.60Shapiro-Wilk統(tǒng)計量0.9648,P=0.8384>0.05,服從正態(tài)分布。Pearson相關(guān)系數(shù)r=-0.2315<0,配對設(shè)計失敗,應(yīng)當改用成組t檢驗。60兩小樣本均數(shù)比較,滿足正態(tài)性和方差齊性時用t檢驗,不滿足方差齊性時用t’檢驗,也可變量轉(zhuǎn)換后用t檢驗。資料分布類型未知或不滿足正態(tài)性和方差齊性時,可以用非參數(shù)檢驗方差齊性?成組t檢驗非參數(shù)檢驗不滿足正態(tài)性?變量變換滿足滿足不滿足變量變換t′檢驗結(jié)論1、正態(tài)分布資料兩樣本均數(shù)比較的t檢驗61當兩樣本含量相等,即n1=n2=n時方差齊,在H0:μ1=μ2假設(shè)下,t檢驗統(tǒng)計量為62方差不齊兩小樣本均數(shù)比較,H0:μ1=μ2

兩大樣本均數(shù)比較,可用u檢驗

,H0:μ1=μ2

63【例4.9】12名正常人和15名病毒性肝炎患者血清轉(zhuǎn)鐵蛋白含量,已檢驗兩組方差相等,問患者和健康人轉(zhuǎn)鐵蛋白含量是否有差異正常265.4271.5284.6291.3254.8275.9281.7268.6264.1273.2270.8260.5---患者256.9235.9215.4251.8224.7228.3231.1253.0221.7218.8233.8230.9240.7260.7224.4解

H0:σ12=σ22,H1:σ12≠σ22n1=12,x1-=271.8667,s1=10.3971n2=15,x2-=235.2067,s2=14.390764查F界值得F0.05(14,11)=2.7186,P>0.05,不能按α=0.05水準拒絕H0,不能認為兩組總體方差不同。df=12+15-2=25,查t界值表得t0.01/2(25)=2.7874,P<0.01,按α=0.01水準拒絕H0,可以認為病毒性肝炎患者的轉(zhuǎn)鐵蛋白量較低。H0:μ1=μ2,H1:μ1≠μ265【SPSS操作】以觀察對象(標簽值用1=正常人,2=肝炎患者)和轉(zhuǎn)鐵蛋白為變量名,建立2列27行的完全隨機設(shè)計計量資料數(shù)據(jù)文件L4-9.sav?!鶤nalyze→DescriptiveStatistics→Explore,將觀察對象選入Factorlist框,轉(zhuǎn)鐵蛋白選入DependentList框;→Plots,選擇Normalityplotswithtest。樣本含量≤50,宜看Shapiro-Wilk。正常人的統(tǒng)計量=0.986,P=0.998;患者統(tǒng)計量=0.927,P=0.245,兩組均滿足正態(tài)性。66→Analyze→CompareMeans→Independent-SamplesTTest,將轉(zhuǎn)鐵蛋白選入TestVariables框,將觀察對象選入GroupingVariable框,→DefineGroups,在group1框中鍵入1,在group2框中鍵入2。Levene’sTestforEqualityofVariances統(tǒng)計量F=1.877,P=0.183>0.05,可認為兩總體方差齊性。67用Equalvariancesassumed的t檢驗結(jié)果,t=7.402,雙側(cè)P=0.000。故拒絕H0,接受H1,可以認為正常人與病毒性肝炎患者的轉(zhuǎn)鐵蛋白含量不等,轉(zhuǎn)鐵蛋白測定對病毒性肝炎診斷有臨床意義。

68例2107測定功能性子宮出血癥中實熱組與虛寒組的免疫功能,其淋巴細胞轉(zhuǎn)化率如表所示。比較實熱組與虛寒組的淋巴細胞轉(zhuǎn)化率均數(shù)是否不同。

實熱組0.7090.7550.6550.7050.723-----虛寒組0.6170.6080.6230.6350.5930.6840.6950.7180.6060.618這是成組比較。H0:μ1=μ2,H1:μ1≠μ2。69當資料與正態(tài)分布偏倚較大時,可采用非參數(shù)檢驗,也可用適當?shù)淖兞孔儞Q【例4.10】甲組24人用補益法加預防注射,乙組22人只用預防注射。測定抗體滴度倒數(shù),問兩組免疫效果有無差別滴度倒數(shù)x48163264128256甲組人數(shù)f14428132乙組人數(shù)f234372212、非正態(tài)分布的兩均數(shù)比較

70解觀察值呈倍數(shù)關(guān)系,不滿足正態(tài)性,可用對數(shù)變換達到正態(tài)性要求H0:σ12=σ22,H1:σ12≠σ22n1=24,x1-=3.2058,s1=1.3058n2=22,x2-=3.1192,s2=1.1667查F界值表得P>0.05,不能按α=0.05水準拒絕H0,不能認為兩組的總體方差不同

71H0:μ1=μ2,H1:μ1≠μ2df=24+22-2=44查t界值表得P>0.05,不能按α=0.05水準拒絕H0,不能認為兩組效果有差別【SPSS操作】分別以x和組別為變量名,在x的列中,先按所給甲組資料鍵入4個4,4個8,…,2個256,并在組別列鍵入1;接著按乙組資料鍵入3個4,4個8,…,1個256,并在組別列鍵入2;建立2列46行的數(shù)據(jù)文件L4-10.sav72對抗體滴度倒數(shù)按組別檢驗正態(tài)性,甲組Shapiro-Wilk統(tǒng)計量=0.670,P=0.000;乙組Shapiro-Wilk=0.650,P值=0.000,均不滿足正態(tài)性。

→Transform→Compute,在TargetVariable框鍵入lnx,Numericexpression框輸入ln(x),對lnx按組別檢驗正態(tài)性,甲組lnx的Shapiro-Wilk統(tǒng)計量=0.920,P=0.058;乙組=0.943,P=0.224,均滿足正態(tài)性。73Levene’sTestforEqualityofVariances的P=0.600>0.05,方差齊。成組t檢驗t=0.236,P=0.834>0.05,不拒絕H0,故不能認為兩組免疫效果有差別。故不能認為兩組免疫效果有差別。74EqualityofVariances統(tǒng)計量F=1.25,P=0.6075>0.05,不能認為兩組的總體方差不齊。由VariancesEqual,統(tǒng)計量t=0.24,P=0.8142>0.05,不能以α=0.05水準拒絕H0,無統(tǒng)計意義。故,不能認為兩組的免疫效果有差別。

兩樣本均數(shù)比較,如果資料不滿足齊同對比性,應(yīng)設(shè)法在統(tǒng)計分析時盡量消除影響因素的干擾兩組的Shapiro-Wilk統(tǒng)計量為0.9197、0.9426,P=0.0576、0.2244,均服從正態(tài)分布。

四、加權(quán)均數(shù)法75【例4.11】輕病人46例,重病人44例,用完全隨機方法分配到A、B兩種療法組治療輕病人(46例)重病人(44例)合計(90例)病例數(shù)x-±s病例數(shù)x-±s病例數(shù)x-±s甲療法3423.5±6.0813.5±4.64221.6±5.8乙療法1224.0±5.93612.5±4.54815.4±4.9不考慮兩組病情構(gòu)成比不同,用不分病情的合計數(shù)據(jù)比較兩樣本均數(shù),得t=5.497,P<0.01,認為A療法療效優(yōu)于B療法,但結(jié)論是不正確的病情輕的患者療效較好,病情重的患者相對較差。76要消除病情因素構(gòu)成比不同的影響,綜合比較兩療法降低某酶的療效,或者要在綜合回答兩種療法差異有無統(tǒng)計學意義外,同時還了解病情因素的影響大小,可采用兩因素設(shè)計試驗的方差分析或協(xié)方差分析。若僅僅為了刪除病情因素影響,則可用加權(quán)均值法來進行分析先按不同構(gòu)成n=n1+n2計算權(quán)重系數(shù)w

wi=ni/n

再計算各比較組的加權(quán)均值xw-與加權(quán)標準差sw

77最后,對各比較組的加權(quán)均值進行假設(shè)檢驗解計算輕組與重組的權(quán)重系數(shù)

w1=(34+12)/(42+48)=0.5111w2=(8+36)/(42+48)=0.4889分別計算甲及乙療法的加權(quán)均值xw-與標準差sw

xwA-=0.5111×23.5+0.4889×13.5=18.6111

swA=0.5111×6+0.4889×4.6=5.3156

xwB-=0.5111×23.5+0.4889×13.5=18.6111

swB=0.5111×5.9+0.4889×4.5=5.2156

78對加權(quán)均值進行檢驗

查F界值得P>0.05,不能按α=0.05水準拒絕H0,不能認為兩組的總體方差不同df=42+48-2=88查t界值得P>0.05,不能按α=0.05水準拒絕H0,不能認為兩種療法療效有差別79一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論