精選衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)匯總_第1頁
精選衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)匯總_第2頁
精選衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)匯總_第3頁
精選衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)匯總_第4頁
精選衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)匯總_第5頁
已閱讀5頁,還剩170頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計(jì)學(xué)知識點(diǎn)匯總PAGE PAGE 175第一講 緒論總體:是研究目的所確定的所有同質(zhì)個(gè)體某指標(biāo)實(shí)際值的集合;或說, 總體是根據(jù)研究目確實(shí)定的所有同質(zhì)觀察對象的全體。樣本:根據(jù)隨機(jī)化的原那么從總體中抽取有代表性的局部觀察單位,其變量實(shí)測值構(gòu)成樣本。樣本含量:樣本所包含個(gè)體或個(gè)體值的個(gè)數(shù)。抽樣Sampling :從總體中抽取有代表性的一局部樣本的過程,稱為抽樣。抽樣研究:從確定的同質(zhì)總體中隨機(jī)抽取局部樣本進(jìn)行觀察,用樣本信息來推斷總體特征,該研究方法叫抽樣研究。統(tǒng)計(jì)推斷:樣本的現(xiàn)象推斷所研究總體的特征。即分析樣本數(shù)據(jù),獲得關(guān)于總體的知識。同質(zhì)homogeneity:指研究對象在一定范疇的各種

2、可能影響主要觀察指標(biāo)的其它因素處于相同或非常相似的情況,即把具有相同性質(zhì)的觀察單位簡稱為同質(zhì)的homogeneous,否那么稱為異質(zhì)的heterogeneous 。變異variation:同質(zhì)根底上的各觀察單位間的差異 參數(shù):根據(jù)總體變量值統(tǒng)計(jì)計(jì)算出來,描述總體特征的統(tǒng)計(jì)指標(biāo)。統(tǒng)計(jì)量:根據(jù)樣本個(gè)體值統(tǒng)計(jì)計(jì)算出來,描述特征的統(tǒng)計(jì)指標(biāo)。變量:變異性表現(xiàn)為取值上的大小就是變量。通常把觀察單位的觀察指標(biāo)稱為變量。如身高、體重等變量值:觀察單位 的觀察值 叫變量值,如身高 118cm,體重26kg 等。誤差:為觀察值X與實(shí)際值之差。抽樣誤差sampling error :由抽樣造成的樣本統(tǒng)計(jì)量和總體參數(shù)

3、的差異、以及樣本統(tǒng)計(jì)量之間的差異稱為抽樣誤差。隨機(jī)事件(Radom event):隨機(jī)試驗(yàn)中可能出現(xiàn)的各種結(jié)果,叫隨機(jī)事件。即在一定條件下具有多種可能發(fā)生的結(jié)果,而究竟發(fā)生那一個(gè)結(jié)果不能肯定,又稱偶然事件。概率Probability:描述隨機(jī)事件發(fā)生的可能性大小的一種度量,常用P 表示。 小概率事件:當(dāng)隨機(jī)事件A的概率P(A),習(xí)慣上,當(dāng)=0.05時(shí),就稱A為小概率事件;其統(tǒng)計(jì)學(xué)意義是小概率事件在一次隨機(jī)試驗(yàn)中不可能發(fā)生。頻率(Frequency):在n次試驗(yàn)中,假設(shè)事件A發(fā)生的次數(shù)為m,那么:m稱為事件A在n次試驗(yàn)中的頻數(shù),fn(A)稱為事件A在n次試驗(yàn)中發(fā)生的頻率。統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)

4、計(jì)表、統(tǒng)計(jì)圖等方法,對樣本資料的數(shù)量特征及其分布規(guī)律進(jìn)行描述統(tǒng)計(jì)推斷:指用樣本信息推斷總體特征,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。第二講:數(shù)值變量的統(tǒng)計(jì)描述一、頻數(shù)表與頻數(shù)分布圖一根本概念:頻數(shù)( frequency ):指在一個(gè)抽樣資料中,某變量值出現(xiàn)的次數(shù)。頻數(shù)分布表frequency distribution table:將各數(shù)值變量的值及其相應(yīng)的頻數(shù)列表,簡稱頻數(shù)表。頻率是表示頻數(shù)出現(xiàn)機(jī)率的指標(biāo),可用百分?jǐn)?shù)或小數(shù)表示,頻率為100%或1。頻數(shù)分布圖frequency distribution figure :根據(jù)頻數(shù)分布表,以變量值為橫坐標(biāo),頻數(shù)為縱坐標(biāo),繪制的直方圖。二連續(xù)型變量頻數(shù)表的編制方

5、法: 求全距(Range,簡記R ):是一組資料中最大值Xmax與最小值Xmin之差,亦稱極差。2. 定組距:將全距分為假設(shè)干段,稱為組段。組與組之間的距離,稱為組距;用小寫i 表示。原那么:1“組段數(shù)一般為10-15個(gè);2“組距一般為R/10取整;3為計(jì)算方便根據(jù)組距采取取整數(shù)方法3.寫組段:即將全距分為假設(shè)干段的過程。原那么:1第一組段要包括Xmin,最末組段包括 Xmax ; 2每組段均用下限值加 “ 表示,最終組段同時(shí)注明上下限。4. 列表劃記:根據(jù)預(yù)定的組段和組距,用劃記的方法整理原始資料。三頻數(shù)表的用途:1.揭示頻數(shù)的分布特征:集中趨勢與離散趨勢結(jié)合能全面反映頻數(shù)的分布特征2.揭示

6、頻數(shù)的分布類型 對稱分布 : 集中部位在中部,兩端漸少,左右兩側(cè)的根本對稱,為對稱正態(tài)分布。 正偏 : 集中部位偏于較小值一側(cè)(左側(cè)),較大值方向漸減少,為正偏態(tài)分布。負(fù)偏 : 集中部位偏于較大值一側(cè)(右側(cè)),較小值方向漸減少,為負(fù)偏態(tài)分布。3.便于發(fā)現(xiàn)某些特大或特小的可疑值。4. 樣本含量足夠大時(shí),以頻率作為概率的估計(jì)值。5.作為陳述資料的形式。二、集中趨勢的指標(biāo)集中趨勢:用于描述一組計(jì)量資料的集中位置,說明這種變量值大小的平均水平,常用平均數(shù)average表示。注意:1.同質(zhì)的事物或現(xiàn)象才能求平均數(shù).應(yīng)根據(jù)資料分布狀態(tài)選用適當(dāng)?shù)木鶖?shù)。 算術(shù)均數(shù) : 單峰對稱分布包括 幾何均數(shù) : 對數(shù)正態(tài)

7、分布中位數(shù)、百分位數(shù) : 偏態(tài)分布一 算術(shù)平均數(shù)arithmetic mean 使用條件:數(shù)據(jù)分布比擬均勻呈正態(tài)分布或近似正態(tài)分布。 樣本均數(shù)用符號:X 表示 總體均數(shù)用符號:表示 計(jì)算方法有兩種:直接法小樣本和加權(quán)法大樣本1直接法:舉例: 某地10名18歲健康男大學(xué)生身高為cm: 168.7, 178.4, 170.0, 170.4, 172.1, 167.6, 172.4, 170.7, 177.3, 169.7求平均身高?10X)(171.7cm7169.4178.168.7 適用范圍:小樣本資料,n30方法:將觀察值X1、X2、X3、Xn直接相加,再除以觀察值的個(gè)數(shù)n。公式:2加權(quán)法:

8、適用范圍:大樣本含量的分組資料或頻數(shù)表資料。方法:計(jì)算各組段的組中值 Xi與其頻數(shù)f i的乘積和f x,然后除以總頻數(shù)f。公式:舉例: 用加權(quán)法計(jì)算某市8歲男童身高平均數(shù)(表3.1 )計(jì)算各組段的組中值xi、fxi和fx第1組段:117.5121191162上限下限x 用加權(quán)法計(jì)算該組身高值的均值)(050cmnfXX二 幾何均數(shù)geometric mean, G 概念:對一組觀察值,先進(jìn)行對數(shù)變換,按算術(shù)均數(shù)計(jì)算方法求其對數(shù)值的均數(shù),該均數(shù)的反對數(shù)值即幾何均數(shù)G。 使用條件:用于原始數(shù)據(jù)分布呈偏態(tài)分布,等比資料倍數(shù)變化或?qū)?shù)正態(tài)分布資料的平均數(shù)的計(jì)算。 表示符號:G

9、 計(jì)算方法:直接法和加權(quán)法1直接法:適用范圍:小樣本資料方法:將n個(gè)觀察值X1,X2,3,Xn直接相乘再開n次方。公式:用對數(shù)形式表示為:舉例:設(shè)有5份血清樣品,滴度分別為: 1:1, 1:10, 1:100, 1:1000, 1:10000 求其平均滴度。G或 Glg-1(lg1+lg10+lg100+lg1000+lg10000)/5) lg-1(0+1+2+3+4)/5) lg-12 =100即:平均滴度為1:100;較好地代表了觀察值的平均水平。 2加權(quán)法:適用范圍:大樣本含量的分組資料或頻數(shù)表資料。公式:Glg-1 (f lgX/f )舉例:有95名麻疹易感兒童,接種麻疹疫苗一個(gè)月后

10、,血凝抑制抗體滴度見下表,試求平均滴度例3.3。 Glg-1 (f lgX/f )lg-1(145.0948/95) 33.68即95名易感兒童接種疫苗一個(gè)月后,血凝抑制抗體的 平均滴度為1:33.68。計(jì)算幾何均數(shù)G 考前須知:1觀察值不能為0;2觀察值不能同時(shí)有正有負(fù);3同一組資料求得的幾何均數(shù)小于算術(shù)均數(shù)。練習(xí):1.有8份血清的抗體效價(jià)分別為:1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640 求平均抗體效價(jià)。將各抗體效價(jià)的倒數(shù)代入公式:所以血清的抗體平均為1:56.572.有50人的血清抗體效價(jià),分別為:5人1:10, 9人1:20, 20

11、人1:40, 10人1:80, 6人1:160 求平均抗體效價(jià)。將各抗體效價(jià)的倒數(shù)代入公式:所以該50人的血清抗體效價(jià)為1:41.70三中位數(shù)Median,M 概念:把一組變量值從小到大排列,位于中間位置的變量值叫中位數(shù),用M表示。 使用條件:當(dāng)一組資料類型分布不清或明顯 偏態(tài)分布時(shí)的平均數(shù)的計(jì)算。 表示符號:M 計(jì)算方法:直接法和加權(quán)法百分位數(shù)Percentile,P 概念:為一種位置指標(biāo),表示位于全部觀察值第X%位置處的數(shù)值。一個(gè)PX將總體或樣本的全部觀察值分為兩局部,理論上有X%的觀察值比它小,100-X%的觀察值比它大,P50分位數(shù)即是中位數(shù)。 表示符號:x 計(jì)算方法: 頻數(shù)表計(jì)算1直

12、接法由原始數(shù)據(jù)計(jì)算中位數(shù):當(dāng)n為奇數(shù)時(shí):2用頻數(shù)表計(jì)算中位數(shù)和百分位數(shù)步驟:按所分組段,由小到大計(jì)算累計(jì)頻數(shù)和累計(jì)頻率代入公式計(jì)算中位數(shù)及其它百分位數(shù)中位數(shù)計(jì)算公式 百分位數(shù)計(jì)算公式(mm)2/LfnfiLP注:fm 、 fx為所在組的頻數(shù), i 為該組段的組距, L為其下限 ,fL 為小于L的各組段的累積頻數(shù)。例:求164例沙門菌食物中毒病人潛伏期的中位數(shù)和百分位數(shù)P5、P95潛伏期(h) 頻數(shù)f 累積頻數(shù) 累計(jì)頻率(%) 0 21 2115.2412 58 7948.1724 4412375.0036 2314689.0248 1215896.3460 516399.3972 116410

13、0.001. 由表第(4)、 (1)欄可見,M(P50)在24 組段, 所以 L=24、i=12、fx=44、fL=79。2. 把 L=24、i=12、fx=44、fL=79代入公式, 求M。1244M(P50) = 24+ 164/2-79=24.8(h)3. 同樣方法,可求P5、P95 。P5 = 0+ 1645%-0=4.7(h)P95 = 48+ 16495%-146=57.8(h)應(yīng)用:1.中位數(shù): 常用于描述偏態(tài)分布資料的集中位置,反映位置居中的觀察值的水平,它和均數(shù)、幾何均數(shù)不同,不是由全部觀察值的數(shù)量值綜合計(jì)算出來的,只受居中變量值的影響,不受兩端特大值和特小值的影響。因此,當(dāng)

14、分布的一端或兩端無確定數(shù)值或資料的分布不清可以求中位數(shù)。 2.百分位數(shù): A.用于描述數(shù)據(jù)某一百分位的位置,最常用的是P50,即中位數(shù);也可用多個(gè)百分位數(shù)的結(jié)合來描述一組資料的分布特征,如用P25和 P75合用時(shí),反映中間50%觀察值的分布情況。B.用于確定參考值范圍: WBC的95%參考值范圍:P2.5 P97.5過高過低均異常 肺活量95%參考值范圍:P5 過低異常 尿鉛95%參考值范圍:P95 過高異常C.用一組PX可較全面地描述總體或樣本的分布特征。 三、離散趨勢的指標(biāo)離散趨勢:用于描述一組數(shù)值變量觀察值之間參差不齊的程度,即變異程度。 極差Range, R四分位數(shù)間距Quartile

15、, Q包括 方差Variance, 標(biāo)準(zhǔn)差Standard deviation,S2變異系數(shù)Coefficient of variation,CV一 極差Range, 簡稱R計(jì)算:R=最大值最小值= Xmax - Xmin 意義:反映樣本變量值的全范圍。條件:對變量值的各種分布類型的資料都適用。優(yōu)點(diǎn):簡單明了,容易理解,使用方便。缺點(diǎn):僅考慮了極大值和極小值,未考慮其它變量的個(gè)體差異。建議:與其他離散指標(biāo)共同使用。極差的缺點(diǎn):1.R只考慮最大值和最小值之差,不能反映組內(nèi)其它觀察值的變異度。2.樣本例數(shù)越多,抽到極大值和極小值的可能性越大,故樣本例數(shù)懸殊時(shí)不易比擬極差。3.即使樣本例數(shù)不變,極差

16、的抽樣誤差亦較大,即不夠穩(wěn)定。二 四分位數(shù)間距uartile, 簡稱計(jì)算:=-=P75-P25意義:中間一半觀察值的極差。條件:對變量值的各種分布類型的資料都適用。優(yōu)點(diǎn):類似值但比其穩(wěn)定。缺點(diǎn):未考慮全部觀察值的變異度。建議:與其他離散指標(biāo)共同使用。例:有164例沙門氏菌食物中毒病人的潛伏期小時(shí), 求該潛伏期的四分位數(shù)間距。 P25 L i / f25 ( n25 % fL ) 12 12/5816425%21 16.14小時(shí)P75 L i / f 75 ( n75 % f L ) 24 12/4416475%79 36小時(shí)Q= P 75 - P 25 =36-16.14=19.86 小時(shí) 即

17、該潛伏期的四分位數(shù)間距為19.86小時(shí)。三 方差 Variance, 簡稱 計(jì)算:總體方差 樣本方差 意義:克服了值的缺乏,考慮了每個(gè)變量值的離散情況并消除了的影響。優(yōu)點(diǎn):全面地考慮每個(gè)變量值的離散情況缺點(diǎn):其單位是原度量單位的平方。)2nXXs1(四標(biāo)準(zhǔn)差Standard deviation,SD或S計(jì)算:總體標(biāo)準(zhǔn)差: 樣本標(biāo)準(zhǔn)差: 標(biāo)準(zhǔn)差的計(jì)算: 直接法: 加權(quán)法:1直接法:用于小樣本資料舉例 現(xiàn)有一影像醫(yī)生,測得10名患者的EA值分別為: 0.47, 0.60, 0.86, 0.96, 1.01, 1.13, 1.27, 1.58, 1.72, 2.88試計(jì)算其標(biāo)準(zhǔn)差?首先列表,求出X

18、和X 2表3.6將X、X2代入公式:2加權(quán)法:用于大樣本資料或頻數(shù)表資料舉例 計(jì)算100名8歲男孩身高的標(biāo)準(zhǔn)差從列表可知:fx =13 055.0、fX2 =1 707 127.00 和n =100代入公式:五 變異系數(shù):簡稱CV概念:是同一組資料的標(biāo)準(zhǔn)差與均數(shù)之比,又叫變異度或離散系數(shù)。計(jì)算:實(shí)際含義:標(biāo)準(zhǔn)差相對于同組均數(shù)的百分比。優(yōu)點(diǎn):CV 消除了度量衡單位,用于比擬 1.單位不同的多組資料的變異度。 2.均數(shù)相差懸殊的多組資料的變異度身高體重舉例 :某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差4.71 cm;體重均數(shù)為22.29kg,標(biāo)準(zhǔn)差2.26kg。試比擬其身高、體重的變異程度。

19、說明其體重的變異度大于身高的,即身高比體重穩(wěn)定。小 結(jié)為描述數(shù)值變量的分布特征,可將觀察值編制頻數(shù)表,繪制頻數(shù)分布圖。集中趨勢描述的主要指標(biāo)是平均數(shù)。百分位數(shù),傳染病潛伏期可用于醫(yī)學(xué)參考值范圍,適用于任何分布觀察序列在某百分位置的水平,是分布的百分界值3.描述頻數(shù)分布離散程度的指標(biāo)有:極差與四分位數(shù)間距,后者較穩(wěn)定,但均不能綜合反映個(gè)觀察值的變異程度。方差和標(biāo)準(zhǔn)差,最常用,對正態(tài)分布尤重要。 變異系數(shù),可用于多組資料間單位不同或均數(shù)相差較大時(shí),變異度的比擬。注意: 變異指標(biāo)的大小這與平均指標(biāo)值的大小無關(guān)。平均指標(biāo)和變異指標(biāo)相結(jié)合,能對各種分布的資料作很好的描述。集中趨勢 離散趨勢 應(yīng)用場合算術(shù)

20、均數(shù) 方差、標(biāo)準(zhǔn)差適用于對稱分布,特別是正態(tài)分布幾何均數(shù)正偏態(tài)分布資料或?qū)?shù)正態(tài)分布資料中位數(shù) 極差百分位數(shù) 四分位數(shù)間距 變異系數(shù) 適用于任何分布資料,特別是偏態(tài) 分布、分布不明、分布末端無確定 值適用于均數(shù)相差懸殊或度量衡單位不同的資料第三講 概率分布一、二項(xiàng)分布及其應(yīng)用摸球模型摸摸球模型球模型一個(gè)袋子里有5個(gè)乒乓球,其中2個(gè)黃球、3個(gè)白球,我們進(jìn)行摸球游戲,每次摸1球,放回后再摸。先后摸100次,請問: 摸到0次黃球的概率是多大?解: 每次摸到白球的概率 =0.6 第1次摸到白球的概率=0.6第2次摸到白球的概率=0.6第100次摸到白球的概率=0.6 100次摸到0次黃球的概率=0.6

21、0.60.6=0.6100先后摸100次,摸到3次黃球的概率是多大?解:每次摸到黃球的概率 =0.4黃白黃白黃白白白概率=(0.4)3(0.6)97 100次摸到3次黃球的概率 = (0.4)3(0.6)97+ (0.4)3(0.6)97+ (0.4)3(0.6)97+ =C1003 (0.4)3(0.6)97每次摸到白球的概率 =0.6黃黃黃白白白白白黃白黃黃白白白白概率=(0.4)3(0.6)97概率=(0.4)3(0.6)97 先后摸100次,摸到x次黃球的概率是多大?解:100次摸到x次黃球的概率=C100 x (0.4)x(0.6)100-x 先后摸n次,摸到x次黃球的概率是多大?n

22、次摸到x次黃球的概率=Cnx (0.4)x(0.6)100-x解: 如果摸到黃球的概率不是0.4,而是,先后摸n次,摸到x次黃球的概率是多大?n次摸到x次黃球的概率=Cnx ()x(1- )100-x解:小結(jié):摸球模型二分類:每次摸球都有兩種可能的結(jié)果黃球或白球獨(dú)立:每次摸球都是彼此獨(dú)立的重復(fù):每次摸到黃球的概率都是、 摸到白球的概率都是1- 所以,先后摸n次,摸到x次黃球的概率為:n次摸到x次黃球的概率=Cnx ()x(1- )100-x二項(xiàng)分布的概念假設(shè)變量X在n此獨(dú)立實(shí)驗(yàn)中,具有:1各觀察單位只能具有相互對立的兩種結(jié)果之一。2發(fā)生某一結(jié)果陽性的概率為,其對立結(jié)果的概率為1-。3n次試驗(yàn)在

23、相同條件下進(jìn)行,且各個(gè)觀察單位的觀察結(jié)果相互獨(dú)立。那么稱變量X服從二項(xiàng)分布,記作:BX;n, 一般地,假設(shè)隨機(jī)變量取值x的概率為:P(x)=Cnx ()x(1- )n-x x 取值0、1、2、nCnx= x!(n-x)!(n)!其中:那么稱此隨機(jī)變量附合二項(xiàng)分布那么 :P(x)=Cnx ()x(1- )n-x 稱為二項(xiàng)分布的概率函數(shù)。 小結(jié):一個(gè)二分類的情況、獨(dú)立重復(fù)事件n次,假設(shè)每次出現(xiàn)某事物的概率為,那么n次中有x次出現(xiàn)該事物的概率服從二項(xiàng)分布。舉 例:臨床上用針炙治療某型頭痛,有效的概率為60%;現(xiàn)以該法治療患者3例,其中 0 例、1例、2例、3例有效的概率各是多大?解:P(x)=Cnx

24、 ()x(1- )n-x 有效人數(shù)xC3x x1-n-x出現(xiàn)該結(jié)果概率P(x)010.600.430.064130.610.420.288230.620.410.432310.630.400.216二項(xiàng)分布的概率分布示意圖 n=30,=0.3n=10,=0.3n=20,=0.5n=5,=0.3二項(xiàng)分布圖形的特征:二項(xiàng)分布圖的形態(tài)取決于和n,頂峰在= n處?;蛘f:和n是二項(xiàng)分布的兩個(gè)參數(shù),n決定x的取值范圍,n和P決定了x的概率分布。 當(dāng)=0.5,圖形是對稱的; 離0.5愈遠(yuǎn),對稱性愈差。 當(dāng)0.5,隨著n的增大,分布趨于對稱。當(dāng)n時(shí),只要不太靠近0或1特別是n 和n(1-) 都 大于5時(shí),二項(xiàng)

25、分布接近于正態(tài)分布。二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差對于二分類情況,進(jìn)行n次隨機(jī)試驗(yàn),每次試驗(yàn)出現(xiàn)陽性結(jié)果的概率為,出現(xiàn)陽性結(jié)果的次數(shù)為x,那么X的總體均數(shù) 、方差2及標(biāo)準(zhǔn)差分別為: 總體均數(shù): =n總體方差: 2= n 1- 總體標(biāo)準(zhǔn)差: = 1- 二項(xiàng)分布的應(yīng)用: 概率估計(jì):例:如果某地鉤蟲感染率是13%,隨機(jī)觀察當(dāng)?shù)?50人,其中10人感染鉤蟲的概率有多大?解析:二分類感染、不感染獨(dú)立假定互不影響重復(fù)=150,每人感染鉤蟲機(jī)率均為=0.13故:感染鉤蟲的人數(shù)x附合二項(xiàng)分布B(150,0.13)所以: P(x=10)=C15010 0.13100.87140=0.0055單側(cè)累積概率的計(jì)算:單純計(jì)算

26、二項(xiàng)分布x恰好取某值的概率沒有太大意義經(jīng)常需要計(jì)算的是二項(xiàng)分布的累積概率1出現(xiàn)陽性次數(shù)至多為k次的概率為:P(xk)= Cnx ()x(1- )n-x kx=02出現(xiàn)陽性次數(shù)至少為k次的概率為:P(xk)= Cnx ()x(1- )n-x nx=k舉例:某地鉤蟲感染率是13%,隨機(jī)觀察當(dāng)?shù)?50人。1其中最多有2人感染的概率有多大?解:P(x2)= C150 x 0.13x(0.97)150-x = C1500 0.130 0.97150 +C1501 0.131 0.97149+C1502 0.132 0.971482其中最少有2人感染的概率有多大?解:P(x2)= C150 x 0.13x

27、(0.97)150-x = 1 -C1500 0.130 0.97150 +C1501 0.131 0.971493其中最少有20人感染的概率有多大?解:P(x20)= C150 x 0.13x(0.97)150-x =1-C150 x 0.13x(0.97)150-x 練習(xí): 5人服藥,該藥腸胃反響概率為10%;求:k個(gè)人、不多于2人、有人有反響的概率。二、Possion分布及其應(yīng)用Poission分布的概念:是描述罕見事件發(fā)生次數(shù)的概率分布。Poisson分布可看作是二項(xiàng)分布的特例:獨(dú)立重復(fù)的次數(shù)很大很大每次出現(xiàn)某事件的概率很小,或未出現(xiàn)某事件的概率1- 很小。Poission分布的概念:

28、對二項(xiàng)分布,當(dāng)n,n 時(shí),可以證明:P(x)=Cnx ()x(1- )n-x P(x)=e-xX!所以,假設(shè)隨機(jī)變量X的概率函數(shù)為:P(x)=e-xX!假設(shè)那么稱此變量服從Poission分布,記敘X () 。 =n為Poission分布的總體均數(shù),X 為觀察單位內(nèi)某稀有事件的發(fā)生次數(shù), 是Poisson分布的總體參數(shù),也是唯一的參數(shù)舉例:某地20年間共出生肢短畸形兒10名,平均每年0.5名,估計(jì)該地每年出生此類畸形人數(shù)為0、1、2的概率P(X )。解析: e=2.71828, =0.5=2.71828-0.50.5 0!0 x=0時(shí),P(0)=e-xX!=0.607故:所以不同x取值時(shí),概率

29、值如下表示:x012345P(x)0.6070.3030.0760.0130.0020.000Poission的概率分布示意圖: poisson分布圖形與有關(guān)。當(dāng)20時(shí),其分布近似正態(tài)分布。=nPoission分布圖形的特征:二項(xiàng)分布圖的形態(tài)取決于 , 5時(shí)為偏峰, 愈小分布愈偏,隨著的增大,分布趨向于對稱。總體均數(shù)=總體方差= ; 當(dāng)觀察結(jié)果具有可加性,即:假設(shè)X1服從總體均數(shù)為1的Poission分布, X2服從總體均數(shù)為2的Poission分布, 那么T= X1+ X2為服從總體均數(shù)為1+2的Poission分布。舉例:從同一水源獨(dú)立取水樣5次,進(jìn)行細(xì)胞培養(yǎng)。第1樣水樣的菌落數(shù) X1 (

30、1)第2樣水樣的菌落數(shù) X2 (2)第5樣水樣的菌落數(shù) X5 (5)把5份水樣混合,那么合計(jì)菌落數(shù)也符合Poission分布,那么:X1+X2 +X3 +X4+ X5 (1+ 2 +3+ 4+ 5)醫(yī)學(xué)研究中常利用其可加性,將小的觀察單位合并,來增大發(fā)生次數(shù)X,以便用后面講到的正態(tài)近似法作出統(tǒng)計(jì)推斷。Poission分布的應(yīng)用: 概率估計(jì):舉例1:假設(shè)某地新生兒先生性心臟病的發(fā)病概率是8 ,那么該地120名新生兒中有4人患先天性心臟病的概率是多少?解析:發(fā)病、不發(fā)病 二項(xiàng)分布發(fā)病概率8,概率很小 Poission分布n=120,相對較大 =n=1208=0.960.964 4!=2.71828

31、-0.96P(4)=e-xX!=0.014單側(cè)累積概率的計(jì)算:1稀有事件發(fā)生次數(shù)至多為k次的概率為:P(xk)= kx=0e-xX!2稀有事件發(fā)生次數(shù)至少為k次的概率為:P(xk)= nx=ke-xX! k -1= 1- x=0e-xX!三、正態(tài)分布及其應(yīng)用一正態(tài)分布normal distribution的概念:又稱高斯分布,Gauss distribution):是描述連續(xù)型隨機(jī)變量最重要的分布。正態(tài)分布的密度函數(shù)f(x) ,即正態(tài)曲線的函數(shù)表達(dá)式: 當(dāng)給定不同的x 值后,就可以根據(jù)此方程求得相應(yīng)的縱坐標(biāo)高度頻數(shù),并可繪制出正態(tài)曲線的圖形,記作XN(,2) : 正態(tài)分布曲線:頂峰位于中間,兩

32、側(cè)逐漸下降并完全對稱,曲線兩端永遠(yuǎn)不與橫軸相交的“鐘型曲線。決定正態(tài)曲線圖形的兩個(gè)參數(shù): 和 當(dāng)固定不變時(shí),越大,曲線沿橫軸越向右移動(dòng);反之, 越小,那么曲線沿橫軸越向左移動(dòng),所以叫正態(tài)曲線N, 2的位置參數(shù), 。當(dāng)固定不變時(shí),越大,曲線越平闊;越小,曲線越尖峭, 叫正態(tài)曲線 N, 2的形狀參數(shù)。 為了應(yīng)用方便,常將上述函數(shù)中的 x 作如下變量代換,令: 相對于正態(tài)變量 x,u 沒有度量單位。根據(jù) u 的不同取值,代入上式可繪出標(biāo)準(zhǔn)正態(tài)分布的圖形。正態(tài)分布曲線 標(biāo)準(zhǔn)正態(tài)分布曲線 XN(,2) XN(0,1)這樣就把原來個(gè)別的正態(tài)分布轉(zhuǎn)換為一般的標(biāo)準(zhǔn)正態(tài)分布 N0,1,亦稱為分布有書中用 Z表示

33、 。二正態(tài)分布特征及曲線下面積分布規(guī)律: 正態(tài)分布有五個(gè)方面的特征:1. 集中性: 正態(tài)曲線在橫軸上方,且均數(shù)位于曲線的最高處,即當(dāng)x=時(shí), f (x)取最大值。2. 對稱性:正態(tài)分布以均數(shù)為中心,左右對稱,即曲線 f (x)關(guān)于x=對稱。3. 正態(tài)分布有兩個(gè)參數(shù),通常用 N (, 2) 表示均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布;用 N(0,1表示均數(shù)為 0 和標(biāo)準(zhǔn)差為 1 的標(biāo)準(zhǔn)正態(tài)分布。 反映曲線的位置,反映曲線的形狀。4. 正態(tài)曲線在,標(biāo)準(zhǔn)正態(tài)曲線在1處各有一個(gè)拐點(diǎn)5. 正態(tài)曲線下的面積分布有一定的規(guī)律性。 由于正態(tài)曲線下累計(jì)頻數(shù)的總和等于 100% 或 1,故橫軸上曲線下的面積概率就等于 100

34、% 或 1。均數(shù)兩側(cè)的面積或頻數(shù)概率各占 50%。正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布曲線下的面積分布規(guī)律正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布 面積分布規(guī)律 68.27% 95.00% 99.00%當(dāng)總體均數(shù)和總體標(biāo)準(zhǔn)差未知時(shí),就用樣本均數(shù)和樣本標(biāo)準(zhǔn)差來代替, u 值可用下式計(jì)算:此時(shí)可用 來代替, 代替 , , 代替 。對于正態(tài)分布或近似正態(tài)分布資料,只要求出均數(shù)和標(biāo)準(zhǔn)差,便可就其頻數(shù)分布作出概略性的估計(jì)舉例: 120 名 12 歲男孩身高均數(shù)為 143 cm,標(biāo)準(zhǔn)差為 5.8 cm,試估計(jì)該地 12 歲男孩身高在 135 cm 以下者有多少人?答:1. 首先按題意計(jì)算 u 值:2. 查 u 值表 當(dāng) u = -1.3

35、8 時(shí),左側(cè)尾部面積 0.0838,即身高在 135cm 以下者占總?cè)藬?shù)的 8.38%。 3.據(jù)概率計(jì)算人數(shù):身高在 135 cm 以下者有:1208.38% =10人練 習(xí):某地正常成年女子的血清總蛋白數(shù)服從正態(tài)分布,調(diào)查了該地110名正常成年女子,得樣本血清總蛋白均數(shù)為72.8g/L,標(biāo)準(zhǔn)差為3.8g/L,試估計(jì)該地正常成年女子血清總蛋白介于66.075.0 g/L之間的比例,以及110名正常成年女子中血清總蛋白介于66.075.0 g/L之間的人數(shù)。 . 解析:由于本例是大樣本,可用樣本均數(shù)X和樣本標(biāo)準(zhǔn)差 S 作為總體、 的估計(jì)值,即將該地正常成年女子的血清總蛋白數(shù)近似看作服從N72.8

36、, 3.82的正態(tài)分布。 1. 將變量作如下標(biāo)準(zhǔn)化變換:2. 查 u 值表得3. 求所定區(qū)間概率: z2- (z1)=0.719-0.0367=68.23%即估計(jì)血清總蛋白介于66.075.0g/L的比例為68.23%4. 求所定區(qū)間的可能人數(shù): 所以110名正常成年女子中血清總蛋白介于之間的人數(shù)約為 110 68.23% =75人。 三、正態(tài)分布在醫(yī)學(xué)中的應(yīng)用一 制定醫(yī)學(xué)參考值范圍 參考值范圍reference range):指所謂“正常人的解剖、生理、生化等指標(biāo)的波動(dòng)范圍。制定方法:制定參考值范圍時(shí),首先要確定一批樣本含量足夠大的“正常人。所謂“正常人不是指“健康人,而是 指排除了影響所研

37、究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群,必須是隨機(jī)選擇的大樣本。而后根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值?根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰?,常?5%。 .雙側(cè)臨界值:標(biāo)準(zhǔn)正態(tài)分布雙側(cè)尾部面積之和等于時(shí)所對應(yīng)的正側(cè)變量值,記作Z/2或U/2。單側(cè)臨界值:標(biāo)準(zhǔn)正態(tài)分布單側(cè)尾部面積等于時(shí)所對應(yīng)的正側(cè)變量值,記作Z或U。以不同的方法計(jì)算參考值范圍:1正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料常用參考值范圍的制定舉例1:調(diào)查某地120名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài),試估計(jì)該地健康女性血紅蛋白的95%參考值范圍。解析:1. 分布近似正態(tài) 正態(tài)分布法求參考值范圍2. 過高過低均為異常 設(shè)定雙

38、側(cè)界值3. 求上、下界值下界:上界 所以,該地健康女性血紅蛋白的95%參考值范圍是97.41,137.39g/l。舉例2: 某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù) X =4.2(L), 標(biāo)準(zhǔn)差S =0.7(L),試據(jù)此估計(jì)其第一秒肺通氣量的95%參考值范圍。 1. 分布近似正態(tài) 正態(tài)分布法求參考值范圍 2. 僅過低為異常 單側(cè)下限3. 求下界值所以,該地健康成年男子第一秒肺通氣量的95%參考值范圍為不低于3.05L。 2百分位法:特別適用于偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值的資料。如95%參考值范圍:雙側(cè)界值單側(cè)下限單側(cè)上限P 2.5和P 97.5P 5 P 95二估計(jì)頻數(shù)

39、分布舉例:定出生體重低于2500g的嬰兒為低體重兒,假設(shè)由某項(xiàng)研究得某地嬰兒出生體重均數(shù)為3200g ,標(biāo)準(zhǔn)差為350g,估計(jì)當(dāng)年出生低體重兒所占的比例。1. 分布近似正態(tài), X= 3200g ,S=350g。2. 轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,求u 值 說明標(biāo)準(zhǔn)正態(tài)曲線下 (-,-2的面積為2.28%,故此題正態(tài)曲線(-,2500g的比例為2.28% ,即X2500g的為2.28%,故估計(jì)當(dāng)年出生低體重兒的比例為2.28%。 三進(jìn)行質(zhì)量控制根本原理:許多臨床檢驗(yàn)指標(biāo),當(dāng)影響某一指標(biāo)的隨機(jī)因素很多,而每個(gè)因素所起的作用均不太大時(shí),這個(gè)指標(biāo)的隨機(jī)波動(dòng)屬于隨機(jī)誤差,那么往往服從正態(tài)分布??刂品椒ǎ撼R?作為

40、上下警戒值,以 作為上下控制值。這里的2s和3s可視為1.96s和2.58s的約數(shù)。第四講:抽樣分布及參數(shù)估計(jì)一、抽樣研究和抽樣誤差一正態(tài)分布樣本均數(shù)的抽樣分布【實(shí)驗(yàn)一】假定某年某地16歲所有女學(xué)生的身高服從總體均數(shù)=155.4cm,總體標(biāo)準(zhǔn)差s2=5.3cm的正態(tài)分布N ( , s2),在這樣的一個(gè)總體中進(jìn)行隨機(jī)抽樣: 1.每次均抽取30例組成一個(gè)樣本 2.共抽100次 3.計(jì)算每個(gè)樣本的平均身高得出了一組數(shù)據(jù):153.6,153.1,154.9,157.7 n=100從正態(tài)總體 N (155.4, 5.32) 抽樣得到的100個(gè)樣本均數(shù)的分布頻數(shù)表n=30組段cm頻數(shù)頻率%152.6 1

41、1.0153.2 4 4.0153.8 4 4.0154.4 22 22.0155.0 25 25.0155.6 21 21.0156.2 17 17.0156.8 3 3.0157.4 2 2.0158.0 158.6 1 1.0合 計(jì)100100.0正態(tài)分布樣本均數(shù)的分布規(guī)律:1.各樣本均數(shù)未必等于總體均數(shù)。2.樣本均數(shù)之間存在差異。3.樣本均數(shù)的分布總是圍繞著總體均數(shù),近似于正態(tài)分布。4.樣本均數(shù)的變異程度較之原變量的變異程度大大的縮小了。所以假設(shè)隨機(jī)變量X服從XN ( , s2) 的正態(tài)分布,那么以之隨機(jī)抽樣計(jì)算的樣本均數(shù)所構(gòu)成的分布也呈正態(tài)分布。1. 樣本均數(shù)的總體均數(shù)仍等于原來的總

42、體均數(shù)。 2. 樣本均數(shù)的標(biāo)準(zhǔn)差 叫做標(biāo)準(zhǔn)誤 (standard error of mean, SEM),記作 ,是描述均數(shù)的抽樣誤 差大小的指標(biāo)。樣本均數(shù)的標(biāo)準(zhǔn)誤的意義:1衡量樣本均數(shù)的可靠性:均數(shù)標(biāo)準(zhǔn)誤越小,說明均數(shù)的抽樣誤差越小,樣本均數(shù)代表總體均數(shù)就越可靠。2估計(jì)總體均數(shù)的可信區(qū)間。3用于均數(shù)的假設(shè)檢驗(yàn)。標(biāo)準(zhǔn)誤的計(jì)算:1. 理論標(biāo)準(zhǔn)誤:2. 實(shí)際工作中,常用 S 代,計(jì)算樣本標(biāo)準(zhǔn)誤。樣本量 n越大 ,樣本均數(shù)的標(biāo)準(zhǔn)誤就越小。所以增加樣本量 n ,可以降低抽樣誤差。標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)誤區(qū)別公式與n 關(guān)系n 增大,標(biāo)準(zhǔn)差趨于穩(wěn)定。n 越大,標(biāo)準(zhǔn)誤越小概念描述的是樣本個(gè)體觀察值的變異程度大小。描述

43、的是樣本均數(shù)的變異程度和抽樣誤差大小。意義小說明變量值圍繞均數(shù)的波動(dòng)小,均數(shù)對一組變量值的代表性好。小表示樣本均數(shù)圍繞總體均數(shù)的波動(dòng)小,用樣本推斷總體的可靠性越強(qiáng)。用途與均數(shù)結(jié)合,描述觀察值的分布范圍,常用于估計(jì)醫(yī)學(xué)參考值范圍、計(jì)算變異系數(shù)、標(biāo)準(zhǔn)誤等。均數(shù)結(jié)合,用于估計(jì)總體均數(shù)可能出現(xiàn)的范圍,即可信區(qū)間,并用于假設(shè)檢驗(yàn)。聯(lián)系1.都是描述變異程度的指標(biāo)2.標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比, n一定時(shí),標(biāo)準(zhǔn)差越大,標(biāo)準(zhǔn)誤也越大。二非正態(tài)分布樣本均數(shù)的抽樣分布【實(shí)驗(yàn)二】:圖6-2是一個(gè)正偏態(tài)分布,用電腦從中隨機(jī)抽取樣本含量分別為5、10、30、50的樣本各1000次,計(jì)算樣本均數(shù),繪制直方圖,并觀察其樣本均數(shù)的

44、分布。n = n = 5 5n = 10n = 30n = 50當(dāng)樣本容量足夠大時(shí)(n 30) ,樣本均數(shù)的抽樣分布逐漸趨于正態(tài)分布假設(shè)隨機(jī)變量X呈偏態(tài)分布,當(dāng)每次抽取的樣本量 n 足夠大時(shí)例如,當(dāng)n= 50,樣本均數(shù)的分布也近似于正態(tài)分布。1. 樣本均數(shù)的總體均數(shù)仍等于原來的總體均數(shù)。 2. 樣本均數(shù)的標(biāo)準(zhǔn)差 仍叫做標(biāo)準(zhǔn)誤,記作 。二、樣本統(tǒng)計(jì)量的分布 規(guī)律-t 分布一t 分布的概念: 1n=SXXXSn【實(shí)驗(yàn)三】:從前述13歲女學(xué)生身高這個(gè)正態(tài)總體中分別作樣本量為3或50的隨機(jī)抽樣,各取1000份樣本,分別得到1000個(gè)樣本的均數(shù)及其標(biāo)準(zhǔn)誤,對它們分別作t 轉(zhuǎn)換,將t 值繪成直方圖: 。n

45、 =3時(shí)的t分布 n =50時(shí)的t分布二t 分布的圖形特征圖6-2 不同自由度的t分布的曲線t 分布的圖形特征 : 1. 分布是一簇曲線,它有一個(gè)參數(shù)即自由度 。2. 單峰分布,以0為中心,左右對稱; 3. t 分布曲線較標(biāo)準(zhǔn)正態(tài)曲線要扁平,越小,t 值的越分散,曲線的峰越矮,尾越高。4. 增大, t 分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;假設(shè),那么t 分布完全成為標(biāo)準(zhǔn)正態(tài)分布。三t 界值表:以自由度為橫標(biāo)目,概率P為縱標(biāo)目,表中數(shù)字表示當(dāng)和 P確定時(shí),對應(yīng)的是正側(cè)或雙側(cè)的t 臨界值表,記作t(,)或t(/2,) 。單側(cè)概率的t 臨界值,記作t(,)雙側(cè)概率的t 臨界值,記作t(/2,)1. 相同 時(shí),t

46、 值越大,對應(yīng)的尾部概率就越小2. 相同t 值,雙側(cè)尾部概率是單側(cè)尾部概率的2倍。單側(cè)和雙側(cè)2的t界值同,即單側(cè)t,雙側(cè)t2, 三、總體均數(shù)可信區(qū)間的估計(jì)一)根本概念參數(shù)估計(jì):用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)。點(diǎn)值估計(jì)( Point estimation ):不考慮抽樣誤差,直接用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù) 區(qū)間估計(jì)(Interval estimation):考慮抽樣誤差,按一定的概率估計(jì)總體參數(shù)的所在范圍??傮w參數(shù)的可信區(qū)間(confidence interval, CI ) 1-可信區(qū)間,一般取值0.05或0.01, 所以1-為0.95或0.99可信區(qū)間:總體均數(shù)的1-可信區(qū)間指一個(gè)范圍,指包含在

47、內(nèi)的可能性為1-,不包含在內(nèi)的可能性為。常用的可信區(qū)間為95%和99%,又稱置信區(qū)間??尚畔蓿褐缚尚艆^(qū)間的下限和上限,即兩個(gè)端點(diǎn)值??尚艆^(qū)間是指以上、下可信限為界的一個(gè)范圍,但不包含上下限兩個(gè)值,故用 表示,其為開區(qū)間。二總體均數(shù)的區(qū)間估計(jì)的計(jì)算t =資料不同計(jì)算方法也不同:t 分布法 1.未知 n 較小時(shí)n 30服從自由度n-1的t分布u =正態(tài)分布法 2. t =3.未知 n 較大時(shí)n30 t分布 接近于標(biāo)準(zhǔn)正態(tài)u分布1. t 分布法:樣本均數(shù)呈正態(tài)分布,將變量進(jìn)行t 轉(zhuǎn)換:1n=SXXXSn舉例:確定1- = 0.95,雙側(cè)SXX-t0.05/2, t0.05/2, X-t0.05/2,

48、SX X+tSX 注釋:可信程度95%。舉例:抽樣得到一個(gè)n=9的樣本,樣本均數(shù)為70.54,標(biāo)準(zhǔn)差為5.79,求該次抽樣的95% 及99%的可信區(qū)間。查t 值表答:即:此次抽樣95%的可信區(qū)間為(69.40,74.68);99%的可信區(qū)間為63.59,76.49。t 分布法適用條件和計(jì)算公式適用條件:未知n 較小時(shí)n 30區(qū)間范圍:舉例:測得某地110名18歲男大學(xué)生身高=172.73cm,S=4.19cm,估計(jì)該地18歲男大學(xué)生身高均數(shù)的95%和99%的可信區(qū)間。 答:1.明確條件 n=110, =172.73cm,S=4.19cm,雙側(cè)u0.05=1.96 2.用正態(tài)分布法求可信區(qū)間).

49、49173,97.171()0194.11.9617317241.,11019.96.73172( 即:該地18歲男大學(xué)生身高均數(shù)的95%可信區(qū)間為171.97cm173.49cm 第五講:定量資料的假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的概念與原理一假設(shè)檢驗(yàn)的根本概念:假設(shè)檢驗(yàn)(hypothesis test):亦稱顯著性檢驗(yàn)(significance test),是依據(jù)樣本提供的有限信息,對樣本所代表的總體 是否與某特定的總體相等做出統(tǒng)計(jì)學(xué)結(jié)論的決策過程。 目的:分辨某樣本是否來自于某特定總體,并以一定的概率對總體的假設(shè)作出推斷。 二假設(shè)檢驗(yàn)的步驟:1.提出無效假設(shè)和備擇假設(shè)2.規(guī)定顯著性水平3.計(jì)算檢驗(yàn)統(tǒng)

50、計(jì)量4.確定P值,作出統(tǒng)計(jì)推斷結(jié)論1. 選擇檢驗(yàn)方法,建立檢驗(yàn)假設(shè)確定水準(zhǔn):1選擇檢驗(yàn)方法:根據(jù)研究目的、設(shè)計(jì)類型和資料特點(diǎn)等因素選擇適宜的檢驗(yàn)方法,并計(jì)算出對應(yīng)統(tǒng)計(jì)量。變量分類變量數(shù)值變量單樣本資料兩、多組獨(dú)立樣本資料配對設(shè)計(jì)資料2提出無效假設(shè)和備擇假設(shè) 什么是無效假設(shè) (Null Hypothesis) ? 一般是作沒有差異的假設(shè),又稱“原假設(shè)或“零假設(shè) ,表示為 H0,即 H0: = 某一數(shù)值,如 = 0該假設(shè)將差異的原因歸結(jié)為抽樣誤差什么是備擇假設(shè) (Alternative Hypothesis) ?與無效假設(shè)相對立有差異的假設(shè),由不等號 , 或 組成,常表示為 H1;即H1: 某一數(shù)

51、值;或 某一數(shù)值, 某一數(shù)值。該假設(shè)將差異的原因歸結(jié)為非抽樣誤差.3規(guī)定檢驗(yàn)水準(zhǔn) (size of test): 抽樣分布H0值臨界值臨界值/2 /2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受域1 - 置信水平什么檢驗(yàn)水準(zhǔn)? 規(guī)定了規(guī)定了小概率事件的最大概率,概率不超過 的事件就是小概率事件; 旨在假設(shè)H0成立的前提下,而根據(jù)樣本的信息拒絕H0可能性大小的度量。注意:由研究者事先確定。 表示為 ,常用的 值有0.01、0.05; 是一個(gè)概率值,假設(shè)原假設(shè)為真時(shí),拒絕原假設(shè)的概率,又被稱為抽樣分布的拒絕域。什么雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)? 雙側(cè)檢驗(yàn):用于推斷兩總體有無差異時(shí),對兩總體間可能存在的兩種位置關(guān)系均要考慮在

52、內(nèi)。單側(cè)檢驗(yàn):用于推斷兩總體有無差異時(shí),僅考慮兩總體間可能存在的兩種位置關(guān)系的一種。一般情況下,如結(jié)果不明確時(shí),采用雙側(cè)假設(shè) H1: 某一數(shù)值,如 0雙側(cè),包括 0和 0 兩方面如果從專業(yè)上能肯定其中一側(cè)是不可能的,那么采用單側(cè)對立假設(shè) H1: 某一數(shù)值;如 0 右單側(cè) 2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量:根據(jù)樣本數(shù)據(jù)算出相應(yīng)的統(tǒng)計(jì)量,此步驟的目的是把樣本信息以檢驗(yàn)統(tǒng)計(jì)量的方式反映出來。3. 確定 p 值p 值意義是:在H0成立的前提下,統(tǒng)計(jì)量獲得現(xiàn)有數(shù)值以及更不利于H0的可能性概率有多大? 即假設(shè)成立= 0)的 概率有多大?4. 作出統(tǒng)計(jì)結(jié)論假設(shè)檢驗(yàn)的推斷結(jié)論是指對 “ 假設(shè)的H0 是否真實(shí) 作出判斷的過

53、程。 即:比擬 p 值和檢驗(yàn)水準(zhǔn),得出拒絕或不拒絕無效假設(shè)的結(jié)論。在兩個(gè)對立的檢驗(yàn)假設(shè)間二取一的規(guī)那么是: 假設(shè) p ,意味著在H0成立的前提下,不大可能發(fā)生當(dāng)前或是更不利的狀況 拒絕 假設(shè) p , 意味著在H0成立的前提下,發(fā)生當(dāng)前狀況或是更不利的狀況的可能性還是比擬大的 不拒絕【舉例7-1】北方農(nóng)村兒童前囪門閉合月齡為14.1月;某研究人員從東北某縣抽取36名兒童,得前囪門閉合月齡為14.3月,標(biāo)準(zhǔn)差為5.08月。 問該縣兒童前囪門閉合月齡的均數(shù)是否大于一般兒童?答:假設(shè)檢驗(yàn):HO : = 14.1月, 即該縣兒童前囪門閉合月齡的均數(shù)與一般兒童相同;H : 14.1月, 該縣兒童前囪門閉合

54、月齡的均數(shù)大于一般兒童檢驗(yàn)水準(zhǔn):右單側(cè)檢驗(yàn),設(shè)=0.05??傮w0=14.1;樣本 n=36、 X=14.3、 S=5.08 35,t 檢驗(yàn) = 0.236=SXX14.3 -14.15.0836t = 樣本統(tǒng)計(jì)量 t = 0.236,所以 P0.05 。二、不同設(shè)計(jì)類型資料 的假設(shè)檢驗(yàn)一單樣本的假設(shè)檢驗(yàn)二兩組獨(dú)立樣本資料的假設(shè)檢驗(yàn)三配對設(shè)計(jì)資料的假設(shè)檢驗(yàn)一單樣本的假設(shè)檢驗(yàn):確定方法主要考慮樣本例數(shù)及分布狀況:樣本例數(shù)n 較大如n50時(shí),t 檢驗(yàn)樣本例數(shù)n 較小如n50時(shí),但樣本來自正態(tài)分布,t檢驗(yàn)樣本例數(shù)n50且樣本來自偏態(tài)分布,變量變換或秩和檢驗(yàn)【例 1】根據(jù)大量調(diào)查,健康成年男子的脈搏均數(shù)

55、是72.2次/min;某醫(yī)生在山區(qū)隨機(jī)抽查25名健康成年男子,求得其脈搏均數(shù)為74.5次/min,標(biāo)準(zhǔn)差為6.0次/min。 . 否據(jù)此認(rèn)為山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)相同? 資料特點(diǎn): 1. 條件:總體:總體均數(shù)記為0,一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值。. 抽樣樣本:認(rèn)為來自一個(gè)未知總體,均數(shù)為。2. 檢驗(yàn)?zāi)康模杭偻茢鄻颖舅淼奈粗傮w,與總體均數(shù)為0有無差異。資料類型:數(shù)值變量資料設(shè)計(jì)類型:單樣本單樣本的假設(shè)檢驗(yàn)中無效假設(shè)和備那么假設(shè)假設(shè)研究的問題雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)H0m = m0m = m0H1m m0m m0【案例解析】1. 由于樣本例數(shù)n 50且總體標(biāo)準(zhǔn)

56、差未知,所以首先考慮t 檢驗(yàn),2. t 檢驗(yàn)要求樣本來自正態(tài)分布的總體,所以首先對進(jìn)行正態(tài)性檢驗(yàn),結(jié)果說明該樣本所屬總體來自正態(tài)分布3. 計(jì)算公式:t 檢驗(yàn)統(tǒng)計(jì)量為:檢驗(yàn)過程:4 步驟1. 建立假設(shè):確定顯著性水平:2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量:3. 確定 p 值,得出結(jié)論:查t 界值表,得t (0.05,24) =2.064,按0.05 檢驗(yàn)水準(zhǔn),不拒絕H0。 故本研究尚不能認(rèn)為山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)不同。二兩組獨(dú)立樣本資料的假設(shè)檢驗(yàn):當(dāng)樣本量n50時(shí),要求兩樣本均來自正態(tài)總體且總體方差齊,t 檢驗(yàn)當(dāng)n50時(shí)數(shù)據(jù)的正態(tài)性可以忽略,t 檢驗(yàn)兩樣本來自正態(tài)總體但總體方差不齊,t檢驗(yàn)

57、當(dāng)數(shù)據(jù)來自偏態(tài)分布總體時(shí),首先考慮采用變量變換,再考慮選用秩和檢驗(yàn)。1.總體方差齊時(shí)雙樣本的假設(shè)檢驗(yàn)【例 2】為研究某新藥治療貧血患者的療效,將20名貧血患者隨機(jī)分成兩組,一組用新藥治療,另一組用常規(guī)藥治療,測得血紅蛋白增加量 (g/L) 見下表。問新藥與常規(guī)藥治療貧血患者后的血紅蛋白增加量有無差異?. 附表 兩種藥物治療貧血患者結(jié)果資料特點(diǎn): 1. 條件:從一個(gè)人群中隨機(jī)抽取一定數(shù)量的觀察單位,隨機(jī)分配到兩個(gè)不同的處理組,測量某項(xiàng)指標(biāo)后進(jìn)行組間比擬。 處理組1:認(rèn)為其所在總體均數(shù)為1。. 處理組2:認(rèn)為其所在總體均數(shù)為2。. 2. 檢驗(yàn)?zāi)康模浩鋵?shí)質(zhì)就是比擬兩個(gè)處理組的觀察指標(biāo)有無差異,即 是

58、否成立。資料類型:數(shù)值變量資料 設(shè)計(jì)類型:兩獨(dú)立樣本雙樣本的假設(shè)檢驗(yàn)中無效假設(shè)和備那么假設(shè)假設(shè)研究的問題雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)H0m1 = m2m1 = m2H1m 1 m0m1 m2【案例解析】1.由于兩處理組樣本量均小于50,故考慮用t 檢驗(yàn)。2. 計(jì)算公式:兩樣本均數(shù)比擬 t 檢驗(yàn)的統(tǒng)計(jì)量:式中X1、X2分別為兩樣本均數(shù),S12、S22分別為兩樣本的方差,n1+n2 -2為自由度。檢驗(yàn)過程:1. 建立假設(shè):新藥和常規(guī)藥治療后血紅蛋白增加量同,即 H0: 1 = 2新藥和常規(guī)藥治療后血紅蛋白增加量同,即 H1 :1 2確定顯著性水平:a =0.052. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量:3. 確定 p 值,得出結(jié)

59、論:t =4.137,查 t界值表, p 0.05; 按a = 0.05水準(zhǔn)拒絕H0,接受H1 。故可認(rèn)為新藥和常規(guī)藥治療后血紅蛋白增加量不同,根據(jù)樣本均數(shù)的信,認(rèn)為,即服用新藥后血紅蛋白含量平均增加量高于常規(guī)藥?!窘Y(jié)果報(bào)告】在a=0.10檢驗(yàn)水準(zhǔn)下,新藥組和常規(guī)藥物組血紅蛋白的增加量均服從正態(tài)分布W檢驗(yàn):P1=0.466, P2=0.482且兩總體方差齊F =1.345, P=0.261;采用兩獨(dú)立樣本的 t 檢驗(yàn):t =4.137, =18,P=0.001。結(jié)果說明:在a=0.05雙側(cè)檢驗(yàn)水準(zhǔn)下,可認(rèn)為兩藥療效不同,新藥治療患者的血紅蛋白平均增加量高于常規(guī)藥治療患者。1 -2 的95%可信

60、區(qū)間3.829,11.731也說明新藥治療的患者血紅蛋白質(zhì)平均增加量高。組別nHb含量g/L新藥組1027.994.56常規(guī)藥組1020.213.82表7.2 不同組別血紅蛋白增加量()兩樣本均數(shù)t 檢驗(yàn)的前提條件是數(shù)據(jù)的正態(tài)性和方差齊性。1.假設(shè)兩樣本所屬總體均為正態(tài),方差齊, t 檢驗(yàn)2.假設(shè)兩樣本所屬總體均為正態(tài),但方差不齊, t 檢驗(yàn),同時(shí)校正自由度3.假設(shè)兩樣本所屬總體偏態(tài),變量變換后再t 檢驗(yàn)或非參數(shù)檢驗(yàn)2. 總體方差不齊時(shí)雙樣本的假設(shè)檢驗(yàn)【例 3】為探討硫酸氧釩對糖尿病性白內(nèi)障大鼠血糖的影響,研究人員將已誘導(dǎo)糖尿病模型的100只大鼠隨機(jī)分為兩組,實(shí)驗(yàn)組給予硫酸氧釩治療,對照組為空

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論