




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 統(tǒng)計(jì)統(tǒng)計(jì)中的幾個基本概念中的幾個基本概念一、一、總體與樣本總體與樣本1、總體總體:指:指同質(zhì)同質(zhì)的觀察單位某種變量值的的觀察單位某種變量值的集合;(同質(zhì)是指集合;(同質(zhì)是指被研究指標(biāo)被研究指標(biāo)的主要的主要影響影響因素因素相同)相同)總體根據(jù)有無時間和空間的限制又分為總體根據(jù)有無時間和空間的限制又分為有有限總體限總體和和無限總體無限總體2、樣本樣本:從總體中按:從總體中按隨機(jī)抽樣隨機(jī)抽樣的方式抽取的方式抽取一定數(shù)量一定數(shù)量的觀察單位所組成的集合的觀察單位所組成的集合樣本樣本要具備以下兩個條件:要具備以下兩個條件:(1)可靠性可靠性:樣本中的每一個個體均來自:樣本中的每一個個體均來自既定既定的的
2、同一總同一總體體(2)代表性代表性:樣本:樣本中受試對象的構(gòu)成分布與總體構(gòu)成分中受試對象的構(gòu)成分布與總體構(gòu)成分布齊同。布齊同。隨機(jī)抽樣隨機(jī)抽樣 足夠足夠數(shù)量數(shù)量 分層抽樣分層抽樣總體總體和和樣本樣本的關(guān)系如下:的關(guān)系如下:總體總體抽樣研究抽樣研究過程過程統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷過程過程樣本樣本統(tǒng)計(jì)分析的基本思想總總 體體樣本抽樣抽樣推斷推斷樣樣本本統(tǒng)計(jì)描述統(tǒng)計(jì)描述二、二、變異變異1、變異變異:指:指同質(zhì)事物同質(zhì)事物間的間的差異差異。是客觀存在的現(xiàn)。是客觀存在的現(xiàn)象,可分為以下兩類:象,可分為以下兩類:(1)個體變異個體變異:指同一特征或同一條件下個體間:指同一特征或同一條件下個體間的差異。的差異。同質(zhì)
3、條件:都是鼻咽癌患者同質(zhì)條件:都是鼻咽癌患者 都用相同治療方法都用相同治療方法變異現(xiàn)象:療效各不相同變異現(xiàn)象:療效各不相同(2)隨機(jī)測量變異隨機(jī)測量變異:指同一個體:指同一個體重復(fù)觀測重復(fù)觀測結(jié)果未結(jié)果未必相等的現(xiàn)象。必相等的現(xiàn)象。三、三、概率概率與與頻率頻率1、頻率頻率: 某變量值出現(xiàn)的次數(shù)(頻數(shù))某變量值出現(xiàn)的次數(shù)(頻數(shù))/重復(fù)觀察的重復(fù)觀察的總次數(shù)??偞螖?shù)。 對對一個隨機(jī)事件重復(fù)觀察時,盡管每進(jìn)行一個隨機(jī)事件重復(fù)觀察時,盡管每進(jìn)行n次試驗(yàn),所得到的頻率可能各不相同,但次試驗(yàn),所得到的頻率可能各不相同,但隨著隨著n的增大,頻率會逐漸穩(wěn)定在的增大,頻率會逐漸穩(wěn)定在某個常數(shù)某個常數(shù)附近波動附近
4、波動。 頻率頻率的的穩(wěn)定性穩(wěn)定性說明隨機(jī)事件發(fā)生的可能性說明隨機(jī)事件發(fā)生的可能性大小是事件本身固有的一種客觀屬性。大小是事件本身固有的一種客觀屬性。2、概率概率:表示:表示隨機(jī)事件隨機(jī)事件發(fā)生可能性大小的發(fā)生可能性大小的數(shù)數(shù)值值。(。(用用P表示表示)通常由)通常由頻率的穩(wěn)定值頻率的穩(wěn)定值反映。反映。確定性事件:確定性事件:(1)必然事件必然事件P=1, (2)不可能事件)不可能事件P=0;隨機(jī)性事件隨機(jī)性事件 (3)概率概率取值介于取值介于01之間。之間。 概率越接近概率越接近0,表明事件發(fā)生的,表明事件發(fā)生的 可能性越小。概率越接近可能性越小。概率越接近1,表,表 明事件發(fā)生的可能性越大。
5、明事件發(fā)生的可能性越大。概率概率和和頻率頻率有區(qū)別:有區(qū)別: 頻率頻率是是已經(jīng)已經(jīng)進(jìn)行進(jìn)行試驗(yàn)的結(jié)果,描述的是試驗(yàn)的結(jié)果,描述的是樣本樣本中事件出現(xiàn)的可能性大?。颖拘畔ⅲ?,中事件出現(xiàn)的可能性大?。颖拘畔ⅲ瑯訕颖静煌?,其值也不同本不同,其值也不同,具有,具有偶然性偶然性; 概率概率刻畫的則是刻畫的則是總體總體中隨機(jī)事件出現(xiàn)的可能中隨機(jī)事件出現(xiàn)的可能性大?。傮w信息),是一種客觀存在,性大小(總體信息),是一種客觀存在,是是個確定數(shù)值個確定數(shù)值,具有,具有必然性必然性。v小概率原理小概率原理:概率很小的隨機(jī)事件在:概率很小的隨機(jī)事件在一次一次或或少量少量實(shí)際觀察中是不可能發(fā)生的(盡管理論實(shí)際
6、觀察中是不可能發(fā)生的(盡管理論上有發(fā)生的可能)上有發(fā)生的可能)v小概率:小概率:P0.05或或P0.01五、五、參數(shù)與統(tǒng)計(jì)量參數(shù)與統(tǒng)計(jì)量1、參數(shù)參數(shù):根據(jù)總體分布特征而計(jì)算的總體:根據(jù)總體分布特征而計(jì)算的總體指標(biāo)。一般用小寫的希臘字母表示。指標(biāo)。一般用小寫的希臘字母表示。2、統(tǒng)計(jì)量統(tǒng)計(jì)量: :根據(jù)樣本計(jì)算的相應(yīng)指標(biāo)根據(jù)樣本計(jì)算的相應(yīng)指標(biāo)( (樣本樣本指標(biāo)指標(biāo)) )。用拉丁字母表示。用拉丁字母表示。v六、六、假設(shè)檢驗(yàn)與兩類錯誤假設(shè)檢驗(yàn)與兩類錯誤v1、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn):先對:先對總體總體的的參數(shù)參數(shù)或或分布分布作出某作出某種假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)種假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)樣本樣本對總體對總體
7、提供的信息,運(yùn)用提供的信息,運(yùn)用“小概率原理小概率原理”推斷假設(shè)推斷假設(shè)是否成立。是否成立。2、兩類錯誤兩類錯誤:型錯誤型錯誤: 拒絕拒絕實(shí)際成立實(shí)際成立的的H0 (棄棄真真)型錯誤型錯誤:不拒絕:不拒絕實(shí)際不成立實(shí)際不成立的的H0(存?zhèn)未鎮(zhèn)危?)由假設(shè)檢驗(yàn)可知,假設(shè)檢驗(yàn)實(shí)際是在)由假設(shè)檢驗(yàn)可知,假設(shè)檢驗(yàn)實(shí)際是在假定假定H0(1= 2成立成立)的前提下抽樣觀察,)的前提下抽樣觀察,出現(xiàn)出現(xiàn)當(dāng)前當(dāng)前樣本現(xiàn)象樣本現(xiàn)象的的可能性大小可能性大小(概率(概率P)來進(jìn)行推斷的來進(jìn)行推斷的21XX(2)假設(shè)檢驗(yàn)的結(jié)論假設(shè)檢驗(yàn)的結(jié)論是是概率性結(jié)論概率性結(jié)論,無論是拒,無論是拒絕絕H0還是不拒絕還是不拒絕H0
8、,都有犯錯誤的可能;,都有犯錯誤的可能; 拒絕拒絕H0時可能犯時可能犯型錯誤型錯誤(當(dāng)(當(dāng)H0成立時),成立時),這時犯錯誤的限制為這時犯錯誤的限制為通過假設(shè)檢驗(yàn)下結(jié)論通過假設(shè)檢驗(yàn)下結(jié)論,平均平均100次抽樣推斷犯錯次抽樣推斷犯錯誤不超過誤不超過5次次;也就是說05.0v不拒絕實(shí)際不成立的不拒絕實(shí)際不成立的H0時時;可能犯可能犯型錯型錯誤誤,犯錯誤的概率用犯錯誤的概率用 不易確定不易確定。v 為把握度為把握度,即即1和和2確實(shí)有差別的話確實(shí)有差別的話,通過假設(shè)檢驗(yàn)發(fā)通過假設(shè)檢驗(yàn)發(fā)現(xiàn)這種差別的能力現(xiàn)這種差別的能力(檢驗(yàn)效能檢驗(yàn)效能)1(,越大越小有關(guān)系與但值表示,(3)要要同時降低同時降低犯兩類
9、錯誤的概率犯兩類錯誤的概率,唯一的辦法唯一的辦法就是增大樣本含量進(jìn)行觀察就是增大樣本含量進(jìn)行觀察.第五章第五章 參數(shù)估計(jì)參數(shù)估計(jì)v有關(guān)抽樣的概念有關(guān)抽樣的概念v隨機(jī)抽樣:在抽樣過程中,要使總隨機(jī)抽樣:在抽樣過程中,要使總體中的每一個觀察對象都有同等機(jī)體中的每一個觀察對象都有同等機(jī)會被抽中成為樣本。會被抽中成為樣本。v抽樣研究的目的:利用樣本信息估抽樣研究的目的:利用樣本信息估計(jì)或推斷總體特征計(jì)或推斷總體特征。統(tǒng)計(jì)分析的基本思想總總 體體樣本抽樣抽樣推斷推斷樣樣本本統(tǒng)計(jì)描述統(tǒng)計(jì)描述第一節(jié)第一節(jié) 抽樣誤差抽樣誤差v 定義:定義:(1)從總體中隨機(jī)抽取樣本所產(chǎn)生的樣本指從總體中隨機(jī)抽取樣本所產(chǎn)生的樣
10、本指標(biāo)(統(tǒng)計(jì)量)與總體指標(biāo)(參數(shù))之間的差異。標(biāo)(統(tǒng)計(jì)量)與總體指標(biāo)(參數(shù))之間的差異。v (2)從從同一同一總體中隨機(jī)抽樣總體中隨機(jī)抽樣,樣本指標(biāo)(統(tǒng)樣本指標(biāo)(統(tǒng)計(jì)量)計(jì)量)之間的差異。之間的差異。v產(chǎn)生原因:總體中存在產(chǎn)生原因:總體中存在個體差異個體差異(生物的(生物的個體變異個體變異)v特點(diǎn):客觀存在,不可避免;有一定范圍,可以控制特點(diǎn):客觀存在,不可避免;有一定范圍,可以控制并估計(jì)其大小。并估計(jì)其大小。 假定正常成年男子的紅細(xì)胞計(jì)數(shù)服從正態(tài)分布,假定正常成年男子的紅細(xì)胞計(jì)數(shù)服從正態(tài)分布, 總體均數(shù)總體均數(shù) =5.00(10=5.00(101212/L/L) )、 總體總體標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差
11、=0.50(10=0.50(101212/L/L) )。 我們我們借助計(jì)算機(jī)從該總體中作隨機(jī)抽樣,每次借助計(jì)算機(jī)從該總體中作隨機(jī)抽樣,每次抽抽1010名成年男子的紅細(xì)胞計(jì)數(shù)組成一個樣本,名成年男子的紅細(xì)胞計(jì)數(shù)組成一個樣本,重復(fù)重復(fù)100100次抽樣。次抽樣。求出每個樣本的樣本均數(shù)和標(biāo)準(zhǔn)求出每個樣本的樣本均數(shù)和標(biāo)準(zhǔn)差。差。 = 5.00 =0.50X2, S2X1,S1X3, S3n=10100次抽樣所得樣本均數(shù)與標(biāo)準(zhǔn)差次抽樣所得樣本均數(shù)與標(biāo)準(zhǔn)差樣本號個體值樣本均數(shù),X標(biāo)準(zhǔn)差,S15.59、5.11、4.265.555.040.4425.49、5.56、5.474.865.190.42194.5
12、6、4.87、5.214.234.710.33734.08、4.73、4.845.334.660.46總體總體5.005.00 0.50樣本均數(shù)的抽樣分布具有如下樣本均數(shù)的抽樣分布具有如下特點(diǎn):特點(diǎn):v 各樣本均數(shù)各樣本均數(shù) 未必等于總體未必等于總體均數(shù);均數(shù);v 各樣本均數(shù)間存在差異;各樣本均數(shù)間存在差異;v 樣本均數(shù)的分布為中間多,兩邊少,樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱。左右基本對稱。 v 樣本均數(shù)的變異范圍較之原變量的變樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。異范圍大大縮小。XX第二節(jié)第二節(jié) 總體均數(shù)的估計(jì)總體均數(shù)的估計(jì)對數(shù)值變量資料的統(tǒng)計(jì)分析,一般先作對數(shù)值變量資
13、料的統(tǒng)計(jì)分析,一般先作集中集中性性和和離散性離散性的的描述描述,然后再進(jìn)行,然后再進(jìn)行統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷第一節(jié)第一節(jié) 均數(shù)的抽樣誤差均數(shù)的抽樣誤差和和標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤:是:是統(tǒng)計(jì)量統(tǒng)計(jì)量(如樣本均數(shù)、樣本率)(如樣本均數(shù)、樣本率)的的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差,描述的是,描述的是樣本統(tǒng)計(jì)量的離散程度樣本統(tǒng)計(jì)量的離散程度(即抽樣誤差的大?。闯闃诱`差的大小)。XSSnXn 100次抽樣所得樣本均數(shù)與標(biāo)準(zhǔn)差樣本號個體值樣本均數(shù),X標(biāo)準(zhǔn)差,S標(biāo)準(zhǔn)誤Sx15.59、5.115.555.040.440.13925.49、5.564.865.190.420.133194.56、4.874.234.710.330
14、.104734.08、4.735.334.660.460.145總體總體5.005.00 0.500.158 標(biāo)準(zhǔn)誤的值越大,反映樣本統(tǒng)計(jì)量的離標(biāo)準(zhǔn)誤的值越大,反映樣本統(tǒng)計(jì)量的離散程度越大,通過一次抽樣得到的某個樣本散程度越大,通過一次抽樣得到的某個樣本統(tǒng)計(jì)量與總體參數(shù)(是個定值)相差也越大。統(tǒng)計(jì)量與總體參數(shù)(是個定值)相差也越大。第三節(jié)第三節(jié) 總體均數(shù)的估計(jì)總體均數(shù)的估計(jì)統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷包括包括參數(shù)估計(jì)參數(shù)估計(jì)和和假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)兩方面。兩方面。參數(shù)估計(jì)參數(shù)估計(jì) 用用樣本指標(biāo)樣本指標(biāo)(即樣本統(tǒng)計(jì)量)來(即樣本統(tǒng)計(jì)量)來估計(jì)估計(jì)總體指標(biāo)總體指標(biāo)(即參數(shù))。(即參數(shù))。統(tǒng)計(jì)描述統(tǒng)計(jì)分析統(tǒng)計(jì)推斷假
15、設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)估計(jì)參數(shù)估計(jì)區(qū)間估計(jì)區(qū)間估計(jì)點(diǎn)估計(jì)點(diǎn)估計(jì)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)指標(biāo)集中趨勢集中趨勢 離散趨勢離散趨勢統(tǒng)計(jì)圖表統(tǒng)計(jì)圖表二、二、t分布分布1、 t分布分布:從同一總體中抽出許多樣本(:從同一總體中抽出許多樣本(n相同),就可得到許多相同),就可得到許多t值,將這些值,將這些t值繪成值繪成直方圖,當(dāng)樣本數(shù)無限多時,就得到一條光直方圖,當(dāng)樣本數(shù)無限多時,就得到一條光滑的曲線,這就是滑的曲線,這就是t分布曲線,這種分布曲線,這種t值的分值的分布就稱為布就稱為t分布。分布。2、 t分布分布的的特點(diǎn)特點(diǎn):(:(1)是)是單峰分布單峰分布,以,以0為為中心左右兩側(cè)對稱;(中心左右兩側(cè)對稱;(2)形似標(biāo)
16、準(zhǔn)正態(tài)分形似標(biāo)準(zhǔn)正態(tài)分布布,當(dāng)自由度趨向無窮大時,當(dāng)自由度趨向無窮大時, t分布就成了分布就成了標(biāo)準(zhǔn)正態(tài)分布;(標(biāo)準(zhǔn)正態(tài)分布;(3) t分布是一簇曲線分布是一簇曲線,一,一個自由度對應(yīng)一條曲線,自由度越大,曲線個自由度對應(yīng)一條曲線,自由度越大,曲線的峰越高,尾越低。(圖的峰越高,尾越低。(圖16-1)間的概率值落在該區(qū)得樣本態(tài)總體中隨機(jī)抽樣的意思是從正積占總面積的百分?jǐn)?shù)以外尾部面圖中陰影部分表示所示的關(guān)系如表右上角插圖與確定后當(dāng)常寫成的界值條件下一個表中數(shù)值為對應(yīng)于某檢驗(yàn)水準(zhǔn)即縱標(biāo)目為概率表中橫標(biāo)目為自由度附表界值表tPPttttPt,.,),(),(,:)5(.3,v一、總體均數(shù)的一、總體均
17、數(shù)的點(diǎn)值估計(jì)點(diǎn)值估計(jì)v點(diǎn)值估計(jì)點(diǎn)值估計(jì):用某一隨機(jī):用某一隨機(jī)樣本均數(shù)樣本均數(shù)來作來作總體均數(shù)總體均數(shù)的估計(jì)值。的估計(jì)值。v 如隨機(jī)抽查如隨機(jī)抽查120例成年男子,測得血清銅含例成年男子,測得血清銅含量均值為量均值為14.48(mol/L),以此值作為當(dāng)?shù)爻?,以此值作為?dāng)?shù)爻赡昴凶拥目傮w均數(shù)的估計(jì)值,叫年男子的總體均數(shù)的估計(jì)值,叫“點(diǎn)值估計(jì)點(diǎn)值估計(jì)”。v 由于存在抽樣誤差,不同的樣本可能得到不由于存在抽樣誤差,不同的樣本可能得到不同的估計(jì)值。同的估計(jì)值。二、總體均數(shù)的二、總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)區(qū)間估計(jì):區(qū)間估計(jì):是按預(yù)先給定的是按預(yù)先給定的概率概率(稱為可信(稱為可信度,符號為度,符號為1
18、-)利用利用樣本樣本來給來給總體均數(shù)總體均數(shù)定出定出一個范圍(可信區(qū)間)一個范圍(可信區(qū)間)。用公式表示為:用公式表示為:),(,xxstxstx 其其含義含義為:從被估計(jì)的總體中隨機(jī)抽取若為:從被估計(jì)的總體中隨機(jī)抽取若干個含量為干個含量為n的樣本,每一個樣本可得到一個的樣本,每一個樣本可得到一個相應(yīng)的可信區(qū)間,理論上有(相應(yīng)的可信區(qū)間,理論上有( 1-)個區(qū)間包)個區(qū)間包含總體均數(shù)(估計(jì)正確),有含總體均數(shù)(估計(jì)正確),有個區(qū)間不包總個區(qū)間不包總體均數(shù)(估計(jì)錯誤)。體均數(shù)(估計(jì)錯誤)。 當(dāng)當(dāng)=0.05時,被估計(jì)的總體均數(shù)不在該區(qū)時,被估計(jì)的總體均數(shù)不在該區(qū)間的概率僅間的概率僅5%,是個小概率
19、,故可認(rèn)為該區(qū),是個小概率,故可認(rèn)為該區(qū)間包含總體均數(shù)(總體均數(shù)間包含總體均數(shù)(總體均數(shù)95%可信區(qū)間)??尚艆^(qū)間)。 總體均數(shù)總體均數(shù)95%CI表示該區(qū)間包括總體均數(shù)表示該區(qū)間包括總體均數(shù) 的的概率為概率為95%,意思是若作,意思是若作100次抽樣,可算得次抽樣,可算得100個可信區(qū)間,平均有個可信區(qū)間,平均有95個區(qū)間包括個區(qū)間包括 (估計(jì)(估計(jì)正確),只有正確),只有5個區(qū)間不包括個區(qū)間不包括 (估計(jì)錯誤);(估計(jì)錯誤);由于由于5%是小概率,在一次實(shí)驗(yàn)中可認(rèn)為小概率是小概率,在一次實(shí)驗(yàn)中可認(rèn)為小概率不發(fā)生,故實(shí)際應(yīng)用時可認(rèn)為估計(jì)的區(qū)間包括總不發(fā)生,故實(shí)際應(yīng)用時可認(rèn)為估計(jì)的區(qū)間包括總體均
20、數(shù)。體均數(shù)。三、模擬實(shí)驗(yàn)三、模擬實(shí)驗(yàn) 模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定: : 產(chǎn)生產(chǎn)生100100個隨機(jī)樣本,分別計(jì)算其個隨機(jī)樣本,分別計(jì)算其95%95%的可信區(qū)間,的可信區(qū)間,結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù)可信區(qū)間包含總體參數(shù) ,只有,只有5 5個可信區(qū)間個可信區(qū)間沒有包含總體參數(shù)。沒有包含總體參數(shù)。14039.075.4n,754.圖圖4-2 模擬抽樣成年男子紅細(xì)胞數(shù)模擬抽樣成年男子紅細(xì)胞數(shù)100次的次的95%可信區(qū)間示意圖可信區(qū)間示意圖)14039. 075. 4(n,)86.4,7
21、2.4()14042.0979.1979.4,14042.0979.179.4(:%95)(979.1).%95(%95;42.0,79.4),/10(140116139,05.012CItCIsxL查表后用內(nèi)插法求得可信區(qū)間的求總體均數(shù)數(shù)例成年男性的紅細(xì)胞隨機(jī)抽查例可信間的兩要素:可信間的兩要素:1、準(zhǔn)確度:就是、準(zhǔn)確度:就是CI包含包含的概率大?。唬ǖ母怕蚀笮?;(1-)值越大,)值越大,可信度越高??尚哦仍礁?。2、精密度:就是區(qū)間的長度;長度越?。▍^(qū)間越、精密度:就是區(qū)間的長度;長度越?。▍^(qū)間越窄)精密度越高。窄)精密度越高。*當(dāng)當(dāng)n確定時,準(zhǔn)確度越高則精密度越低,兩者是確定時,準(zhǔn)確度越高
22、則精密度越低,兩者是相矛盾的,在實(shí)際工作中為兼顧兩者,以相矛盾的,在實(shí)際工作中為兼顧兩者,以95%CI更為常用。更為常用。v第六章第六章 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) v第一節(jié)第一節(jié) 假設(shè)檢驗(yàn)的概念假設(shè)檢驗(yàn)的概念:v 在比較樣本均數(shù)與已知總體均數(shù)在比較樣本均數(shù)與已知總體均數(shù)差異差異、或、或兩個樣本均數(shù)及多個樣本均數(shù)兩個樣本均數(shù)及多個樣本均數(shù)差異差異時,先對時,先對總體總體的參數(shù)或分布作出某種假設(shè),然后用適的參數(shù)或分布作出某種假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)當(dāng)?shù)姆椒ǜ鶕?jù)樣本樣本對總體提供的信息,運(yùn)用對總體提供的信息,運(yùn)用“小概率原理小概率原理”推斷假設(shè)是否成立。推斷假設(shè)是否成立。v小概率原理小概率原理:概率很小的
23、隨機(jī)事件在:概率很小的隨機(jī)事件在一次一次或或少量少量實(shí)際觀察中是不可能發(fā)生的(盡管理論實(shí)際觀察中是不可能發(fā)生的(盡管理論上有發(fā)生的可能)上有發(fā)生的可能)v小概率:小概率:P0.05或或P0.01 C病病10例A藥A藥10例樣本1樣本2有效率有效率50% 有效率有效率60%差異差異 ?試驗(yàn)試驗(yàn)1問題:差異是什么原因?qū)е??問題:差異是什么原因?qū)е??v抽樣誤差(個體差異) C病病10例A藥B藥10例樣本1樣本2有效率有效率50% 有效率有效率60%差異差異 ?試驗(yàn)試驗(yàn)2問題:差異是什么原因?qū)е拢繂栴}:差異是什么原因?qū)е??A藥藥=B藥藥抽樣誤差(個體差異) C病病10例A藥B藥10例樣本1樣本2有效率
24、有效率50% 有效率有效率60%差異差異 ?試驗(yàn)試驗(yàn)3問題:差異是什么原因?qū)е??問題:差異是什么原因?qū)е??A藥藥B藥藥處理因素(藥物因素) C病病10例A藥B藥10例樣本1樣本2有效率有效率50% 有效率有效率60%差異差異 ?試驗(yàn)試驗(yàn)4問題:差異是什么原因?qū)е拢繂栴}:差異是什么原因?qū)е??v1 處理因素(藥物因素)v2 抽樣誤差(個體差異)A總體總體=B總體總體 差異差異 A總體總體B總體(抽總體(抽樣誤差)樣誤差) (處理因素)(處理因素)A總體總體A總體總體B總體總體B總體總體第二節(jié)第二節(jié) 假設(shè)檢驗(yàn)的一般步驟假設(shè)檢驗(yàn)的一般步驟一、建立假設(shè),確定檢驗(yàn)水準(zhǔn)一、建立假設(shè),確定檢驗(yàn)水準(zhǔn)1、檢驗(yàn)假設(shè)
25、(無效假設(shè))、檢驗(yàn)假設(shè)(無效假設(shè))H0:1= 2( 或或d=0) 備擇假設(shè)備擇假設(shè) H1:1 2(或或d 0) 1 2( d 0)0二、二、計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量根據(jù)根據(jù)設(shè)計(jì)的類型設(shè)計(jì)的類型、資料的類型資料的類型和和分布情況分布情況、統(tǒng)計(jì)推斷目的統(tǒng)計(jì)推斷目的以及以及n的大小的大小選用不同的檢驗(yàn)選用不同的檢驗(yàn)方法,計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。如完全隨機(jī)方法,計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。如完全隨機(jī)設(shè)計(jì)實(shí)驗(yàn)中,兩樣本均數(shù)比較可計(jì)算統(tǒng)計(jì)量設(shè)計(jì)實(shí)驗(yàn)中,兩樣本均數(shù)比較可計(jì)算統(tǒng)計(jì)量t值(即作值(即作t 檢驗(yàn))。檢驗(yàn))。v三、三、確定確定P值,作出推斷結(jié)論值,作出推斷結(jié)論:v P值是指在值是指在H0所規(guī)
26、定的總體(例如所規(guī)定的總體(例如1= 2)中作隨機(jī)抽)中作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量(如樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量(如t值)的概率;亦即這種樣本差異(值)的概率;亦即這種樣本差異( )來自抽樣誤)來自抽樣誤差的概率。差的概率。v v 推斷結(jié)論:推斷結(jié)論:v 統(tǒng)計(jì)結(jié)論:統(tǒng)計(jì)結(jié)論:1 對對H0如何推斷?如何推斷?v 2 對對H1如何推斷?如何推斷?v 3 對對差異差異如何推斷?如何推斷?v 專業(yè)結(jié)論專業(yè)結(jié)論 1 正確正確v 2 明確明確v 3 符合醫(yī)學(xué)邏輯符合醫(yī)學(xué)邏輯21xx第七章第七章 兩樣本均數(shù)比較的假設(shè)檢驗(yàn)兩樣本均數(shù)比較的假設(shè)檢驗(yàn)第一節(jié)第一節(jié)
27、 單單樣本均數(shù)樣本均數(shù)t檢驗(yàn)檢驗(yàn) (樣本均數(shù)樣本均數(shù)與與總體均數(shù)總體均數(shù)比較)比較):理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀測所得的穩(wěn):理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀測所得的穩(wěn) 定值。定值。正態(tài)分布或大樣本。正態(tài)分布或大樣本。推斷樣本所代表的未知總體均數(shù)推斷樣本所代表的未知總體均數(shù) 與已與已 知的總體均數(shù)知的總體均數(shù) 0是否相等(是否相等( = 0 )。)。v1、資料類型資料類型:v(1)給定)給定一個已知的總體均數(shù)一個已知的總體均數(shù)和和一個隨機(jī)一個隨機(jī)抽取的樣本抽取的樣本,v(2)該)該隨機(jī)樣本服從正態(tài)分布隨機(jī)樣本服從正態(tài)分布(若原數(shù)據(jù)(若原數(shù)據(jù)是非正態(tài)分布,要通過數(shù)據(jù)變換使之服從正是非正態(tài)分布,要通過數(shù)據(jù)變換
28、使之服從正態(tài)分布)態(tài)分布)v2、計(jì)算統(tǒng)計(jì)量、計(jì)算統(tǒng)計(jì)量t值:值:nsxt/通過以往大量資料得知某地通過以往大量資料得知某地20歲男子平均身歲男子平均身高為高為168,現(xiàn)隨機(jī)測量當(dāng)?shù)?,現(xiàn)隨機(jī)測量當(dāng)?shù)?6名名20歲男子,歲男子,其身高均數(shù)為其身高均數(shù)為172,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為14。問當(dāng)。問當(dāng)?shù)噩F(xiàn)在地現(xiàn)在20歲男子的平均身高是否比以往高?歲男子的平均身高是否比以往高?v一一 H0:= 0 H1: 0 =0.05v二二 t = 1.143 v三三 查查t界值表(界值表(t 、V)t0.05 15=1.753 v v P 0.05 接受接受H0 ,拒絕,拒絕H1,差異無統(tǒng)計(jì)學(xué)意義(差,差異無統(tǒng)計(jì)學(xué)意義
29、(差異無顯著意義)?,F(xiàn)在當(dāng)?shù)禺悷o顯著意義)?,F(xiàn)在當(dāng)?shù)?0歲男子平均身高與以往相歲男子平均身高與以往相同。同。v nsxt/第二節(jié)第二節(jié) 成對資料均數(shù)成對資料均數(shù)的的t檢驗(yàn)檢驗(yàn)成對(配對)比較成對(配對)比較的的t檢驗(yàn)檢驗(yàn)適用于下列情況適用于下列情況:自身配對自身配對: 1 同一受試對象處理前后的比較同一受試對象處理前后的比較 2 同一受試對象接受兩種不同處理同一受試對象接受兩種不同處理異體配對異體配對: 3 將兩個受試者配成對子,施予兩種不同處理將兩個受試者配成對子,施予兩種不同處理要求:要求:1 配對資料(配對資料(差值差值d符合正態(tài)分布)符合正態(tài)分布)2 假設(shè)成對資料假設(shè)成對資料差數(shù)的總體
30、均數(shù)差數(shù)的總體均數(shù)為為0( d = 0 ),),檢驗(yàn)樣本差數(shù)的均數(shù)與檢驗(yàn)樣本差數(shù)的均數(shù)與0之間差別有無顯著性之間差別有無顯著性v例7-2 某醫(yī)院用A、B兩種血紅蛋白測定儀檢測16名健康男青年的血紅蛋白含量(g/L),問兩種血紅蛋白測量儀的檢測結(jié)果是否有差別?表表7-1兩種血紅蛋白測量儀的檢測結(jié)果( g/L )v一一 H0:d= 0 H1:0 =0.05v二二 t = 2.366v三三 查查t界值表(界值表(t 、V)t0.05 15=1.753 v v P 0.05 拒絕拒絕H0 ,接受,接受H1,差異有統(tǒng)計(jì)學(xué)意,差異有統(tǒng)計(jì)學(xué)意義(差異有顯著意義)。義(差異有顯著意義)。 儀器儀器B檢測的血紅
31、蛋白檢測的血紅蛋白值高于儀器值高于儀器Anssnnddsnddsdtdddd,1/)(,022 為研究三棱莪術(shù)液的抑瘤效果,將為研究三棱莪術(shù)液的抑瘤效果,將20只只小白鼠按體重配成小白鼠按體重配成10對,然后把每對中的對,然后把每對中的2只動物隨機(jī)分到實(shí)驗(yàn)組和對照組中。兩組動只動物隨機(jī)分到實(shí)驗(yàn)組和對照組中。兩組動物都接種腫瘤,實(shí)驗(yàn)組在接種腫瘤物都接種腫瘤,實(shí)驗(yàn)組在接種腫瘤3天后注天后注射射30%的三棱莪術(shù)液的三棱莪術(shù)液0.5ml,對照組不加任,對照組不加任何處理。測量瘤體直徑如表何處理。測量瘤體直徑如表16-3,問兩組瘤,問兩組瘤體大小差異是否有統(tǒng)計(jì)學(xué)意義,從而判斷體大小差異是否有統(tǒng)計(jì)學(xué)意義,
32、從而判斷三三棱莪術(shù)棱莪術(shù)是否有抑制腫瘤生長的作用?是否有抑制腫瘤生長的作用?36.626.2124.102.33.15.41075.54.26.20.5984.42.29.11.4849.183.47.20.7761.39.17.36.5609.03.00.47.3589.103.31.14.4424.38.14.22.4384.42.23.25.4236.06.00.36.312合計(jì)實(shí)驗(yàn)組對照組對子數(shù)dd 表表16-3 三棱莪術(shù)液抑瘤實(shí)驗(yàn)的結(jié)果(三棱莪術(shù)液抑瘤實(shí)驗(yàn)的結(jié)果(cm).,05.0.4;05.0,833.1)(9110.3167.510/321.161.2321.1110)6 .21
33、(36.62,106 .2136.62,6 .21,10.2;05.0;0;0:.1109,05.0220制腫瘤的作用可認(rèn)為三棱莪術(shù)液有抑不拒絕水準(zhǔn)拒絕按單側(cè)檢驗(yàn)界值表查按本例單側(cè)HHPttttsdddnHdddPaired Samples Test2.16001.32094.417721.21513.10495.1719.001MeanStd. DeviationStd. Error MeanLowerUpper95% Confidence Intervalof the DifferencePaired DifferencestdfSig. (2-tailed)對 照 - 實(shí) 驗(yàn)Pair 1
34、#用用SPSS分析結(jié)果:分析結(jié)果:analyzeCompareMeanspaired-samplesT test第三節(jié)第三節(jié) 兩獨(dú)立樣本均數(shù)兩獨(dú)立樣本均數(shù)t比較比較 目的目的是推斷兩樣本分別代表的兩總體均是推斷兩樣本分別代表的兩總體均數(shù)是否相等(數(shù)是否相等( 1= 2 )。)。1、資料類型資料類型: 隨機(jī)分組的兩組資料隨機(jī)分組的兩組資料,為獨(dú)立樣本,為獨(dú)立樣本 滿足滿足正態(tài)性正態(tài)性和和方差齊性方差齊性2) 1() 1(2/)(/)(2122221121222212112nnsnsnnnnxxnxxsc221212121212; )11(xxcxxsxxtnnnnss例例7-4為了解內(nèi)毒素對肌酐
35、的影響,將為了解內(nèi)毒素對肌酐的影響,將20只雄只雄性中年大鼠隨機(jī)分為甲、乙兩組,甲組中的性中年大鼠隨機(jī)分為甲、乙兩組,甲組中的大鼠不給于內(nèi)毒素,乙組中的每只大鼠則給大鼠不給于內(nèi)毒素,乙組中的每只大鼠則給予予3mg/kg的內(nèi)毒素。分別測得兩組大鼠的肌的內(nèi)毒素。分別測得兩組大鼠的肌酐(酐(mg/L)結(jié)果如下,問內(nèi)毒素對肌酐是否)結(jié)果如下,問內(nèi)毒素對肌酐是否有影響?有影響?甲組(甲組( mg/L): 6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.9乙組(乙組( mg/L): 8.5 6.8 11.3 9.4 9.3 7.3 5.6 7.9 7.2 8.2v一一 H0:1
36、= 2 H1:1 2 =0.05v二二 t = -3.785v三三 查查t界值表(界值表(t 、V)t0.05 18=2.101 v v P 0.05 拒絕拒絕H0 ,接受,接受H1,差異有統(tǒng)計(jì)學(xué)意,差異有統(tǒng)計(jì)學(xué)意義。義。 內(nèi)毒素具有升高肌酐的作用。內(nèi)毒素具有升高肌酐的作用。Independent Samples Test.097.759.454.4541817.469.656.656.8000.80001.763831.76383-2.90568-2.913764.505684.51376FSig.Levenes Test forEquality of VariancestdfSig. (2
37、-tailed)Mean DifferenceStd. Error DifferenceLowerUpper95% Confidence Intervalof the Differencet-test for Equality ofMeansEqual variances assumed Equal variances not assumed下 降 幅 度用用SPSS分析結(jié)果:分析結(jié)果:analyzeCompare Meansindependent-samples T test時間時間分組分組2W4W8W12W24W正常對照組正常對照組26862232664247269724626612262
38、658237B組組對照對照26742392681237270025826602482655232試驗(yàn)試驗(yàn)*23501832086153175415813201771365101 兔咬肌兔咬肌IIb型纖維平均橫截面積型纖維平均橫截面積 (n=5 s,m2)X第五節(jié)第五節(jié) 兩樣本的兩樣本的方差齊性方差齊性檢驗(yàn)(檢驗(yàn)(F檢驗(yàn))檢驗(yàn))一、一、兩個方差的齊性檢驗(yàn)兩個方差的齊性檢驗(yàn)用檢驗(yàn)比較兩樣本均數(shù)的差別,其先決條件用檢驗(yàn)比較兩樣本均數(shù)的差別,其先決條件之一是之一是兩總體方差兩總體方差相等,即相等,即對于對于兩樣本方差不等兩樣本方差不等是否由是否由抽樣誤差抽樣誤差所致,所致,需用需用方差齊性檢驗(yàn)方差齊性
39、檢驗(yàn)(計(jì)算(計(jì)算F值)值)22212221/ ssF 結(jié)論可作出方差是否相等的表確定概率界值查和相應(yīng)的自由度分別為方差是較小樣本的是較在樣本的方差式中,212221PFssv例例7-6 對例對例7-4用用F檢驗(yàn)判斷兩總體的方差是否齊性?檢驗(yàn)判斷兩總體的方差是否齊性?v一一 H0:21= 22 H1:21 22 v =0.05v二二 F = =1.13v三三 查查F界值表(界值表(F 、V) F0.05( 9 9)=4.03v v P 0.05 拒絕拒絕H0 ,接受,接受H1,無統(tǒng)計(jì)學(xué)意義。,無統(tǒng)計(jì)學(xué)意義。 兩組資料總體方差齊性兩組資料總體方差齊性2212SS檢驗(yàn)二.t方差不齊方差不齊時時兩樣本
40、均數(shù)的比較兩樣本均數(shù)的比較,(,(1)可采)可采用適當(dāng)?shù)挠眠m當(dāng)?shù)淖兞孔儞Q,使之達(dá)到方差齊變量變換,使之達(dá)到方差齊的要的要求,再作求,再作t檢驗(yàn);(檢驗(yàn);(2)作)作秩和檢驗(yàn)秩和檢驗(yàn);(;(3)作作檢驗(yàn)t2121xxsxxt222121222,121,222121/;2121nsnsnstnsttnsnssxx值并作結(jié)論可得及校正界值有了界值表查得由和確定后當(dāng)Pttttt,21090. 230/88. 020/9 . 230/)88. 0(045. 220/)9 . 2(093. 2045. 2,903. 2.084. 8668. 05 . 19 . 6668. 03088. 0209 . 2.
41、 205. 0;:,:. 1,616716222205. 029,05. 019,05. 02221121021ttttsHHxx試比較其均數(shù)有無差別齊已知兩組總體方差不由例例組化道出血效果優(yōu)于西藥為單味大黃組治療上消可認(rèn)水準(zhǔn)拒絕按本例,05. 0;05. 0,. 3005. 0HPtt*對于用G表示其平均水平平均水平的資料,因不能滿足參數(shù)參數(shù)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的正態(tài)性和方差齊性,可將原數(shù)據(jù)變換以滿足要求。例如教材P157例16-5用SPSS11.0軟件作假設(shè)檢驗(yàn)過程如下:(以下為正態(tài)性檢驗(yàn)情況)取對數(shù)值2.502.001.501.00.50HistogramFor GROUP= 甲組Frequ
42、ency1086420Std. Dev = .57 Mean = 1.39N = 24.00取對數(shù)值2.502.001.501.00.50HistogramFor GROUP= 乙組Frequency86420Std. Dev = .51 Mean = 1.35N = 22.00Normal Q-Q Plot of 取對數(shù)值For GROUP= 甲組Observed Value2.52.01.51.0.5Expected Normal2.01.51.0.50.0-.5-1.0-1.5Normal Q-Q Plot of 取對數(shù)值For GROUP= 乙組Observed Value2.52.0
43、1.51.0.5Expected Normal2.01.51.0.50.0-.5-1.0-1.5Tests of Normality.17124.067.92024.058.16222.137.94322.224分 組甲 組乙 組取 對 數(shù) 值StatisticdfSig.StatisticdfSig.Kolmogorov-SmirnovaShapiro-WilkLilliefors Significance Correctiona. Test of Homogeneity of Variance.279144.600.163144.688.163143.767.688.292144.592B
44、ased on MeanBased on MedianBased on Median andwith adjusted dfBased on trimmed mean取 對 數(shù) 值Levene Statisticdf1df2Sig.以下是方差齊性檢驗(yàn)方差齊性檢驗(yàn)結(jié)果:進(jìn)行對數(shù)變換后,原變量的對數(shù)值原變量的對數(shù)值組成的新變量新變量(變量名為“取對數(shù)值”)經(jīng)檢驗(yàn)滿足正態(tài)性和方差齊性,可以進(jìn)一步作成組資料的t檢驗(yàn),結(jié)果如下:Independent Samples Test.279.600.236.2384443.976.814.813.0376.0376.15913.15834-.28307-.28148.35833.35
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年陪診師考試復(fù)習(xí)的誤區(qū)與試題及答案
- 投資咨詢工程師考生經(jīng)驗(yàn)分享試題及答案
- 2024年陪診師考試高效提升的方法與試題及答案
- 大學(xué)語文沖突解析試題及答案
- 備戰(zhàn)育嬰師考試的試題及答案2024
- 家庭教育指導(dǎo)師考試中的心理調(diào)適試題及答案
- 2024國際物流師考試復(fù)習(xí)手冊及試題及答案
- 黑龍江省佳木斯市富錦市2025屆五下數(shù)學(xué)期末達(dá)標(biāo)檢測試題含答案
- 黑龍江省雙鴨山市尖山區(qū)第一中學(xué)2024-2025學(xué)年高中畢業(yè)班第三次教學(xué)質(zhì)量監(jiān)測文綜試題含解析
- 黑龍江省哈爾濱市哈工大附中2025屆初三下學(xué)期第一次摸擬試化學(xué)試題含解析
- 2025年山西省長治市部分學(xué)校中考一模語文試卷(含解析)
- 西安特教面試試題及答案
- 2025年中考道德與法治必背知識總結(jié)(按主題分類)
- 2025年涂裝工藝考試試題及答案
- 2025年糧食、棉花、化肥等農(nóng)產(chǎn)品倉儲服務(wù)項(xiàng)目可行性研究報告
- DeepSeek在金融服務(wù)中的創(chuàng)新應(yīng)用
- DBJ04T 467-2023 建筑防煙排煙系統(tǒng)技術(shù)標(biāo)準(zhǔn)
- 生物反饋療法在盆底失弛緩型便秘中的研究進(jìn)展
- 2025年全國臺聯(lián)機(jī)關(guān)服務(wù)中心招聘事業(yè)編制人員歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024-2030年全球及中國近紅外熒光成像系統(tǒng)行業(yè)運(yùn)行模式及未來應(yīng)用前景報告
- 成立工作專班的通知怎么寫-成立工作專班的通知
評論
0/150
提交評論