衛(wèi)生統(tǒng)計學(xué)潘海燕衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第1頁
衛(wèi)生統(tǒng)計學(xué)潘海燕衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第2頁
衛(wèi)生統(tǒng)計學(xué)潘海燕衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第3頁
衛(wèi)生統(tǒng)計學(xué)潘海燕衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第4頁
衛(wèi)生統(tǒng)計學(xué)潘海燕衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩175頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四章定量資料的統(tǒng)計描述統(tǒng)計圖表1第四章定量資料的統(tǒng)計描述統(tǒng)計圖表1【例4-1】2019年某市120名10歲男孩的身高(cm)資料如下。135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5

【例4-1】2019年某市120名10歲男孩的身高(cm)資【問題4-1】該組數(shù)據(jù)為何種類型資料?如何描述10歲男孩身高的數(shù)量特征?【問題4-1】本章主要內(nèi)容頻數(shù)表和頻數(shù)圖

集中趨勢的描述

離散趨勢的描述正態(tài)分布及其應(yīng)用本章主要內(nèi)容頻數(shù)表和頻數(shù)圖第一節(jié)頻數(shù)表和頻數(shù)圖第一節(jié)表達(dá)變量取值及其不同取值頻數(shù)分布情況的統(tǒng)計表稱為頻數(shù)分布表,簡稱頻數(shù)表(frequencytable)。

頻數(shù)表和頻數(shù)圖頻數(shù)表頻數(shù)表和頻數(shù)圖頻數(shù)表頻數(shù)表的編制

求極差(range)

找出一組觀察值中的最大值與最小值,其差值即為極差(或全距),用R表示。如例4-1中:R=155.4-130.2=25.2。頻數(shù)表和頻數(shù)圖頻數(shù)表的編制求極差(range)頻數(shù)表和頻數(shù)圖2.確定組數(shù)和組距(i)

根據(jù)樣本含量的大小及研究目的確定組數(shù);一般設(shè)8~15個組。例4-1:i=25.2/10=2.52,取整數(shù)2做組距。頻數(shù)表和頻數(shù)圖2.確定組數(shù)和組距(i)頻數(shù)表和頻數(shù)圖3.確定組段

即確定每一組的起點(下限)和終點(上限)。

起點稱為下限(lowerlimit)終點稱為上限(upperlimit)

上限=下限+組距頻數(shù)表和頻數(shù)圖3.確定組段上限=下限+組距頻數(shù)表和頻數(shù)圖4.歸組計數(shù),整理成表

確定組段界限后,采用計算機或用劃記法將各原始數(shù)據(jù)歸入各組匯總,得出各組段的觀察例數(shù),也就是頻數(shù)。

頻數(shù)表和頻數(shù)圖4.歸組計數(shù),整理成表頻數(shù)表和頻數(shù)圖表4-12019年某市120名10歲男孩身高(cm)的頻數(shù)表身高(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合計120100.0——頻數(shù)表和頻數(shù)圖表4-12019年某市120名10歲男孩身高(cm)的頻頻數(shù)表的用途

揭示資料的頻數(shù)分布特征和頻數(shù)分布類型

頻數(shù)分布的特征:集中趨勢(centraltendency)離散趨勢(dispersion)頻數(shù)分布的類型:對稱分布偏態(tài)分布頻數(shù)表和頻數(shù)圖頻數(shù)表的用途揭示資料的頻數(shù)分布特征和頻數(shù)分布類型頻數(shù)表和頻數(shù)頻數(shù)頻數(shù)圖1101名正常女子血清總膽固醇的頻數(shù)分布圖269例RA患者血清EBV-VCA-IgG抗體滴度的頻數(shù)分布圖3101名正常人血清肌紅蛋白的頻數(shù)分布血清肌紅蛋白(μg/ml)正(右)偏態(tài)負(fù)(左)偏態(tài)對稱分布頻數(shù)頻數(shù)頻數(shù)圖1101名正常女子血清總膽固醇的2.便于進(jìn)一步計算指標(biāo)和統(tǒng)計處理

可利用頻數(shù)表計算百分位數(shù)、中位數(shù)、標(biāo)準(zhǔn)差等頻數(shù)表和頻數(shù)圖3.便于發(fā)現(xiàn)某些特大或特小的可疑值。2.便于進(jìn)一步計算指標(biāo)和統(tǒng)計處理頻數(shù)表和頻數(shù)圖3.便頻數(shù)圖(graphoffrequency)是以變量值為橫坐標(biāo)、頻數(shù)(頻率)為縱坐標(biāo)(不等距分組時以頻率/組距=頻率密度為縱坐標(biāo)),以每個等寬的距形面積表示每組的頻數(shù)(或頻率)。頻數(shù)表和頻數(shù)圖頻數(shù)圖頻數(shù)表和頻數(shù)圖頻數(shù)圖連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(histogram);離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱直條圖(bargraph)。

頻數(shù)表和頻數(shù)圖連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(hist圖4-12019年某市120名10歲男孩身高的頻數(shù)圖頻數(shù)表和頻數(shù)圖圖4-12019年某市120名10歲男孩身高的頻數(shù)圖頻第二節(jié)集中趨勢的描述第二節(jié)定量資料集中趨勢的描述,常用平均數(shù)(average)——表達(dá)一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。集中趨勢的描述算術(shù)均數(shù)

幾何均數(shù)中位數(shù)

眾數(shù)調(diào)和均數(shù)定量資料集中趨勢的描述,常用平均數(shù)(average)集中趨勢又稱均數(shù)(mean),是用一組觀察值相加除以觀察值的個數(shù)所得。樣本均數(shù)用,總體均數(shù)用。

算術(shù)均數(shù)(arithmeticmean)

集中趨勢的描述又稱均數(shù)(mean),是用一組觀察值相加除以觀察值的個數(shù)所得1.計算方法直接法:樣本含量較少

加權(quán)法:相同觀察值較多或頻數(shù)表資料集中趨勢的描述1.計算方法集中趨勢的描述【例4-2】某醫(yī)生測量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的均數(shù)。集中趨勢的描述【例4-2】某醫(yī)生測量了10名腦出血患者的血尿素氮(mmo【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名10歲男孩身高的均數(shù)。身高(1)頻數(shù)fi(2)組中值xi(3)fixi(4)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106311311331351371391411431451471491511531551313995401096166823973003290020581490906459155合計120()–17202()表4-22019年某市120名10歲男孩身高(cm)的均數(shù)計算表集中趨勢的描述【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名10歲男孩身2.應(yīng)用均數(shù)適用于對稱分布特別是正態(tài)分布資料。集中趨勢的描述2.應(yīng)用集中趨勢的描述是n個觀察值乘積的n次方根,又稱倍數(shù)均數(shù),用G表示。

幾何均數(shù)(geometricmean)

集中趨勢的描述是n個觀察值乘積的n次方根,又稱倍數(shù)均數(shù),用G表示。幾何1.計算方法直接法:樣本含量較少

加權(quán)法:相同觀察值較多或頻數(shù)表資料集中趨勢的描述1.計算方法集中趨勢的描述【例4-4】某實驗室測得7人血清中某種抗體的滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平均滴度。

集中趨勢的描述【例4-4】某實驗室測得7人血清中某種抗體的滴度分別為集中趨勢的描述【例4-6】50名麻疹易感兒接種麻疹疫苗后,測得血凝抑制抗體滴度資料見表4-3,求抗體的平均滴度。86.9977抗體滴度(1)頻數(shù)(2)滴度倒數(shù)(3)(4)(5)1/41/81/161/321/641/1281/2561361013107481632641282560.60210.90311.20411.50511.80622.10722.40820.60212.70937.224615.505123.480621.072016.8574合計50--表4-350名麻疹易感兒血凝抑制抗體滴度集中趨勢的描述【例4-6】50名麻疹易感兒接種麻疹疫苗后集中趨勢的描述50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54。

集中趨勢的描述50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體2.應(yīng)用及注意事項幾何均數(shù)適用

①對數(shù)正態(tài)分布②等比級數(shù)資料觀察值中不能有0實驗設(shè)計的基本要素實驗設(shè)計的基本要素中位數(shù)與百分位數(shù)

集中趨勢的描述

【例4-7】200名食物中毒患者潛伏期資料如表4-4,研究人員據(jù)此采用加權(quán)法計算均數(shù)得平均潛伏期為27小時。(1)該組數(shù)據(jù)在分布上有何特點?

(2)用均數(shù)描述該資料的平均水平是否合適?中位數(shù)與百分位數(shù)集中趨勢的描述【例4-7】200集中趨勢的描述表4-4200名食物中毒患者的潛伏期潛伏期(小時)(1)頻數(shù)(2)累計頻數(shù)(3)累計頻率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合計200--集中趨勢的描述表4-4200名食物中毒患者的潛伏期中位數(shù)(median):將一組觀察值由小到大排序后,居于中間位置的數(shù)值即為中位數(shù),用表示。

中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列平均分為兩部分,小于和大于中位數(shù)的觀察值個數(shù)相等,各占50%。集中趨勢的描述中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列1.中位數(shù)的計算(1)直接法:觀察值個數(shù)較少集中趨勢的描述集中趨勢的描述【例4-8】某實驗師對10只小白鼠染毒后觀察各小鼠的生存時間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計算小白鼠的平均生存時間。集中趨勢的描述集中趨勢的描述(2)頻數(shù)表法:頻數(shù)表資料LM

中位數(shù)所在組段下限

組距

中位數(shù)所在組段的頻數(shù)

中位數(shù)所在組段前一組的累計頻數(shù)(2)頻數(shù)表法:頻數(shù)表資料LM中位數(shù)所在組段下限集中趨勢的描述求:下表200名食物中毒患者的平均潛伏期潛伏期(小時)(1)頻數(shù)(2)累計頻數(shù)(3)累計頻率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合計200--集中趨勢的描述求:下表200名食物中毒患者的平均潛伏期潛集中趨勢的描述(小時)

集中趨勢的描述(小時)百分位數(shù)(percentile):是指將一組觀察值由小到大排序后,將其平均分成100等份,對應(yīng)于每一分割位置上的數(shù)值就稱為一個百分位數(shù),用

表示。

集中趨勢的描述集中趨勢的描述是一種位置指標(biāo),一個百分位數(shù)將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。集中趨勢的描述集中趨勢的描述【例4-10】根據(jù)表4-4,計算P25、P75。集中趨勢的描述【例4-10】根據(jù)表4-4,計算P25、P75。集中趨勢的描2.中位數(shù)與百分位數(shù)的應(yīng)用中位數(shù):偏態(tài)分布資料一端或兩端無確切值總體分布不明百分位數(shù):非正態(tài)分布資料

集中趨勢的描述2.中位數(shù)與百分位數(shù)的應(yīng)用集中趨勢的描述第三節(jié)離散趨勢的描述

第三節(jié)【例4-11】分別觀察兩組各9只動物的每日進(jìn)食量(mg/g),結(jié)果如下:A組242526272829303132B組202122232425262764兩組動物每日進(jìn)食量的平均數(shù),均為28mg/g。

【例4-11】分別觀察兩組各9只動物的每日進(jìn)食量(mg/離散趨勢是頻數(shù)分布的另一特征,反映了觀察值之間的變異情況,只有將集中趨勢與離散趨勢結(jié)合起來描述才能全面反映定量資料的數(shù)量特征。

離散趨勢是頻數(shù)分布的另一特征,反映了觀察值之間的變異情況,只描述離散趨勢指標(biāo)

極差四分位間距標(biāo)準(zhǔn)差變異系數(shù)描述離散極差極差(range,R):亦稱全距,是一組同質(zhì)觀察值中最大值()與最小值()之差。

極差概念極差概念只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度樣本含量越大,極差可能越大極差不足之處極差不足之處四分位數(shù)間距(inter-quartilerange,Q):為上四分位數(shù)QU(即P75)與下四分位數(shù)QL

(即P25)之差。四分位數(shù)間距概念四分位數(shù)間距概念

【例4-12】根據(jù)例4-7資料,計算四分位數(shù)間距。小時小時四分位數(shù)間距:(小時)

【例4-12】根據(jù)例4-7資料,計算四分位數(shù)間距。每個觀察值x與間的變異稱為離均差由于變異程度用離均差平方和反應(yīng)

方差考慮觀察值個數(shù)N的影響

方差考慮觀察值個數(shù)N的影響在實際工作中方差n-1稱為自由度(degreeoffreedom)方差適用:描述對稱分布特別是正態(tài)分布資料的離散程度。

方差n-1稱為自由度方差適用:方差的度量單位是原度量單位的平方

方差開方后即與原數(shù)據(jù)的度量單位相同,這就是標(biāo)準(zhǔn)差(standarddeviation)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差在實際工作中n-1稱為自由度(degreeoffreedom)標(biāo)準(zhǔn)差適用:描述對稱分布特別是正態(tài)分布資料的離散程度。

標(biāo)準(zhǔn)差n-1稱為自由度標(biāo)準(zhǔn)差適用:標(biāo)準(zhǔn)差數(shù)學(xué)上可以證明標(biāo)準(zhǔn)差數(shù)學(xué)上可以證明標(biāo)準(zhǔn)差【例4-13】某醫(yī)生測量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差【例4-13】某醫(yī)生測量了10名腦出血患者的血尿素氮(mm身高(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合計120100.0——【例4-14】根據(jù)下表資料,計算120名10歲男孩身高的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差身高頻數(shù)頻率(%)累計頻數(shù)累計頻率(%)130~10.8標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差【例4-15】某醫(yī)院預(yù)防保健科,對一組5歲男孩進(jìn)行體檢,測量身高、體重等指標(biāo)。得身高均數(shù)與標(biāo)準(zhǔn)差為115.8cm和4.5

cm,體重均數(shù)與標(biāo)準(zhǔn)差為20.2kg和0.56kg,得出結(jié)論:身高的變異程度比體重大。變異系數(shù)上述結(jié)論是否正確?

變異系數(shù)上述結(jié)論是否正確?變異系數(shù)(coefficientofvariation,簡記為CV):是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值,

概念變異系數(shù)度量衡單位不同的資料單位相同但均數(shù)相差懸殊的兩組或多組資料

適用于概念變異系數(shù)度量衡單位不同的資料適用于變異系數(shù)根據(jù)例4-15資料分別計算身高與體重的變異系數(shù)。身高:體重:

變異系數(shù)根據(jù)例4-15資料分別計算身高與體重的變異系數(shù)描述數(shù)值變量資料集中趨勢的指標(biāo)描述數(shù)值變量資料集中趨勢的指標(biāo)描述數(shù)值變量資料離散趨勢的指標(biāo)描述數(shù)值變量資料離散趨勢的指標(biāo)第四節(jié)正態(tài)分布及其應(yīng)用第四節(jié)正態(tài)分布的概念與特征圖4-1120名10歲男孩身高資料的頻數(shù)圖正態(tài)分布的概念與特征圖4-1120名10歲男孩正態(tài)分布的概念與特征正態(tài)分布的概念與特征正態(tài)分布(normaldistribution)稱為高斯分布(Gaussdistribution),如果連續(xù)型隨機變量X的概率密度函數(shù)為:概念正態(tài)分布的概念與特征則稱隨機變量X服從參數(shù)為和的正態(tài)分布,記作:-∞<x<+∞概念正態(tài)分布的概念與特征則稱隨機變量X服從參數(shù)為正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對稱;兩端與橫軸永不相交,呈鐘形的曲線。正態(tài)分布特征正態(tài)分布的概念與特征正態(tài)曲線正態(tài)分布特征正態(tài)分布的概念與特征正態(tài)曲線正態(tài)分布有兩個參數(shù),即位置參數(shù)和形狀參數(shù)

正態(tài)分布的概念與特征位置參數(shù)正態(tài)分布的概念與特征位置參數(shù)形態(tài)參數(shù)σ正態(tài)分布的概念與特征形態(tài)參數(shù)σ正態(tài)分布的概念與特征正態(tài)分布的概念與特征正態(tài)曲線下面積的分布有一定的規(guī)律。

①正態(tài)曲線與橫軸之間的面積恒等于1或100%;②對稱分布,對稱軸兩側(cè)的面積各為50%;③在區(qū)間的面積為68.27%在區(qū)間的面積為95.00%在區(qū)間的面積為99.00%

正態(tài)分布的概念與特征正態(tài)曲線下面積的分布有一定的規(guī)律。正態(tài)分布的概念與特征正態(tài)分布的概念與特征思考:能否編制正態(tài)曲線下面積的分布表,然后通過查表來確定某區(qū)間對應(yīng)的面積呢?

標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計學(xué)家發(fā)現(xiàn),可以使所有的正態(tài)分布轉(zhuǎn)化為統(tǒng)一的的正態(tài)分布,該正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計學(xué)家發(fā)現(xiàn),可以使所有的正態(tài)分布轉(zhuǎn)化為統(tǒng)標(biāo)準(zhǔn)正態(tài)分布這種變換稱為標(biāo)準(zhǔn)化變換或Z變換。若X服從正態(tài)分布,則Z就服從。標(biāo)準(zhǔn)正態(tài)分布這種變換稱為標(biāo)準(zhǔn)化變換或Z變換。若X服從正標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律【例4-18】已知某地2019年18歲男大學(xué)生身高的均數(shù)cm,標(biāo)準(zhǔn)差cm,且18歲男大學(xué)生的身高服從正態(tài)分布。問該地18歲男大學(xué)生中身高在166.8cm及其以下者占多大的比例?標(biāo)準(zhǔn)正態(tài)分布先將x轉(zhuǎn)換為z

查附表3表的左側(cè)找-1.9,表的上方找0.06,相交處為0.025

標(biāo)準(zhǔn)正態(tài)分布先將x轉(zhuǎn)換為z查附表3表的左側(cè)找-1.【例4-19】某地2019年抽樣調(diào)查了100名18歲男大學(xué)生身高,算得均數(shù)為172.70cm,標(biāo)準(zhǔn)差為4.01cm。正態(tài)分布的應(yīng)用

估計正態(tài)分布資料的頻數(shù)分布【問題】該地18歲男大學(xué)生中身高在162.35cm~183.05cm范圍內(nèi)者所占的比例是多少?【例4-19】某地2019年抽樣調(diào)查了100名18歲男大查附表3,左側(cè)的面積為0.005,由正態(tài)分布曲線的對稱性可知,右側(cè)的面積也為0.005,又由正態(tài)分布曲線下的總面積為1,可得-2.58與2.58之間的面積為1-2×0.005=0.99=99%。查附表3,左側(cè)的面積為0.0正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍

醫(yī)學(xué)參考值范圍:亦稱正常值范圍,指絕大多數(shù)“正常人”的解剖、生理、生化等指標(biāo)的波動范圍。所謂“正常人”不是指絕對的“健康人”,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍醫(yī)學(xué)參考值范圍:亦稱正正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍的注意事項①要確定一批樣本含量足夠大的“正常人”②根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰耽鄹鶕?jù)專業(yè)知識確定單側(cè)或雙側(cè)界值④根據(jù)資料的分布選用恰當(dāng)?shù)挠嬎惴椒ㄕ龖B(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍的注意事項正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍常用方法正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布的資料

雙側(cè)界值

單側(cè)界值

正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍常用方法正態(tài)分布法:適用表4-6常用z值表參考值范圍(%)單側(cè)雙側(cè)800.8421.282901.2821.645951.6451.960992.3262.576表4-6常用z值表參考值范圍(%)單側(cè)雙側(cè)800.842【例4-19】某地2019年抽樣調(diào)查了100名18歲男大學(xué)生身高(cm),算得均數(shù)為172.70cm,標(biāo)準(zhǔn)差為4.01cm。

【例4-20】利用例4-19資料估計該地18歲男大學(xué)生身高的95%參考值范圍。衛(wèi)生統(tǒng)計學(xué)潘海燕衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件身高服從正態(tài)分布,其參考值范圍應(yīng)為雙側(cè)。

采用公式計算,百分?jǐn)?shù)取95%,

得164.84~180.56,故該地18歲男大學(xué)生身高的95%參考值范圍是(164.84~180.56)cm。身高服從正態(tài)分布,其參考值范圍應(yīng)為雙側(cè)。采用公式正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍常用方法百分位數(shù)法:偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值雙側(cè)界值

單側(cè)界值

P2.5~P97.5上界為:P95

下界為:P5正態(tài)分布的應(yīng)用制定醫(yī)學(xué)參考值范圍常用方法百分位數(shù)法:偏態(tài)【例4-21】測得某地200名正常人尿汞值(),求該地正常人尿汞值的95%參考值范圍?

表4-7某地200名正常人尿汞值()尿汞值0~4~8~12~16~20~24~28~32~36~40~44~48~52~56例數(shù)302133272522148653321【例4-21】測得某地200名正常人尿汞值(由表4-7可以看出,正常人尿汞值的分布為偏態(tài)分布,不適宜采用正態(tài)分布法,應(yīng)采用百分位數(shù)法;且尿汞的參考值范圍應(yīng)為單側(cè)上界由表4-7可以看出,正常人尿汞值的分布為偏態(tài)分布,不適宜采用正態(tài)分布的應(yīng)用質(zhì)量控制

正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ)

正態(tài)分布的應(yīng)用質(zhì)量控制正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ)THEENDTHEEND謝謝!謝謝!第四章定量資料的統(tǒng)計描述統(tǒng)計圖表91第四章定量資料的統(tǒng)計描述統(tǒng)計圖表1【例4-1】2019年某市120名10歲男孩的身高(cm)資料如下。135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5

【例4-1】2019年某市120名10歲男孩的身高(cm)資【問題4-1】該組數(shù)據(jù)為何種類型資料?如何描述10歲男孩身高的數(shù)量特征?【問題4-1】本章主要內(nèi)容頻數(shù)表和頻數(shù)圖

集中趨勢的描述

離散趨勢的描述正態(tài)分布及其應(yīng)用本章主要內(nèi)容頻數(shù)表和頻數(shù)圖第一節(jié)頻數(shù)表和頻數(shù)圖第一節(jié)表達(dá)變量取值及其不同取值頻數(shù)分布情況的統(tǒng)計表稱為頻數(shù)分布表,簡稱頻數(shù)表(frequencytable)。

頻數(shù)表和頻數(shù)圖頻數(shù)表頻數(shù)表和頻數(shù)圖頻數(shù)表頻數(shù)表的編制

求極差(range)

找出一組觀察值中的最大值與最小值,其差值即為極差(或全距),用R表示。如例4-1中:R=155.4-130.2=25.2。頻數(shù)表和頻數(shù)圖頻數(shù)表的編制求極差(range)頻數(shù)表和頻數(shù)圖2.確定組數(shù)和組距(i)

根據(jù)樣本含量的大小及研究目的確定組數(shù);一般設(shè)8~15個組。例4-1:i=25.2/10=2.52,取整數(shù)2做組距。頻數(shù)表和頻數(shù)圖2.確定組數(shù)和組距(i)頻數(shù)表和頻數(shù)圖3.確定組段

即確定每一組的起點(下限)和終點(上限)。

起點稱為下限(lowerlimit)終點稱為上限(upperlimit)

上限=下限+組距頻數(shù)表和頻數(shù)圖3.確定組段上限=下限+組距頻數(shù)表和頻數(shù)圖4.歸組計數(shù),整理成表

確定組段界限后,采用計算機或用劃記法將各原始數(shù)據(jù)歸入各組匯總,得出各組段的觀察例數(shù),也就是頻數(shù)。

頻數(shù)表和頻數(shù)圖4.歸組計數(shù),整理成表頻數(shù)表和頻數(shù)圖表4-12019年某市120名10歲男孩身高(cm)的頻數(shù)表身高(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合計120100.0——頻數(shù)表和頻數(shù)圖表4-12019年某市120名10歲男孩身高(cm)的頻頻數(shù)表的用途

揭示資料的頻數(shù)分布特征和頻數(shù)分布類型

頻數(shù)分布的特征:集中趨勢(centraltendency)離散趨勢(dispersion)頻數(shù)分布的類型:對稱分布偏態(tài)分布頻數(shù)表和頻數(shù)圖頻數(shù)表的用途揭示資料的頻數(shù)分布特征和頻數(shù)分布類型頻數(shù)表和頻數(shù)頻數(shù)頻數(shù)圖1101名正常女子血清總膽固醇的頻數(shù)分布圖269例RA患者血清EBV-VCA-IgG抗體滴度的頻數(shù)分布圖3101名正常人血清肌紅蛋白的頻數(shù)分布血清肌紅蛋白(μg/ml)正(右)偏態(tài)負(fù)(左)偏態(tài)對稱分布頻數(shù)頻數(shù)頻數(shù)圖1101名正常女子血清總膽固醇的2.便于進(jìn)一步計算指標(biāo)和統(tǒng)計處理

可利用頻數(shù)表計算百分位數(shù)、中位數(shù)、標(biāo)準(zhǔn)差等頻數(shù)表和頻數(shù)圖3.便于發(fā)現(xiàn)某些特大或特小的可疑值。2.便于進(jìn)一步計算指標(biāo)和統(tǒng)計處理頻數(shù)表和頻數(shù)圖3.便頻數(shù)圖(graphoffrequency)是以變量值為橫坐標(biāo)、頻數(shù)(頻率)為縱坐標(biāo)(不等距分組時以頻率/組距=頻率密度為縱坐標(biāo)),以每個等寬的距形面積表示每組的頻數(shù)(或頻率)。頻數(shù)表和頻數(shù)圖頻數(shù)圖頻數(shù)表和頻數(shù)圖頻數(shù)圖連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(histogram);離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱直條圖(bargraph)。

頻數(shù)表和頻數(shù)圖連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(hist圖4-12019年某市120名10歲男孩身高的頻數(shù)圖頻數(shù)表和頻數(shù)圖圖4-12019年某市120名10歲男孩身高的頻數(shù)圖頻第二節(jié)集中趨勢的描述第二節(jié)定量資料集中趨勢的描述,常用平均數(shù)(average)——表達(dá)一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。集中趨勢的描述算術(shù)均數(shù)

幾何均數(shù)中位數(shù)

眾數(shù)調(diào)和均數(shù)定量資料集中趨勢的描述,常用平均數(shù)(average)集中趨勢又稱均數(shù)(mean),是用一組觀察值相加除以觀察值的個數(shù)所得。樣本均數(shù)用,總體均數(shù)用。

算術(shù)均數(shù)(arithmeticmean)

集中趨勢的描述又稱均數(shù)(mean),是用一組觀察值相加除以觀察值的個數(shù)所得1.計算方法直接法:樣本含量較少

加權(quán)法:相同觀察值較多或頻數(shù)表資料集中趨勢的描述1.計算方法集中趨勢的描述【例4-2】某醫(yī)生測量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的均數(shù)。集中趨勢的描述【例4-2】某醫(yī)生測量了10名腦出血患者的血尿素氮(mmo【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名10歲男孩身高的均數(shù)。身高(1)頻數(shù)fi(2)組中值xi(3)fixi(4)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106311311331351371391411431451471491511531551313995401096166823973003290020581490906459155合計120()–17202()表4-22019年某市120名10歲男孩身高(cm)的均數(shù)計算表集中趨勢的描述【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名10歲男孩身2.應(yīng)用均數(shù)適用于對稱分布特別是正態(tài)分布資料。集中趨勢的描述2.應(yīng)用集中趨勢的描述是n個觀察值乘積的n次方根,又稱倍數(shù)均數(shù),用G表示。

幾何均數(shù)(geometricmean)

集中趨勢的描述是n個觀察值乘積的n次方根,又稱倍數(shù)均數(shù),用G表示。幾何1.計算方法直接法:樣本含量較少

加權(quán)法:相同觀察值較多或頻數(shù)表資料集中趨勢的描述1.計算方法集中趨勢的描述【例4-4】某實驗室測得7人血清中某種抗體的滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平均滴度。

集中趨勢的描述【例4-4】某實驗室測得7人血清中某種抗體的滴度分別為集中趨勢的描述【例4-6】50名麻疹易感兒接種麻疹疫苗后,測得血凝抑制抗體滴度資料見表4-3,求抗體的平均滴度。86.9977抗體滴度(1)頻數(shù)(2)滴度倒數(shù)(3)(4)(5)1/41/81/161/321/641/1281/2561361013107481632641282560.60210.90311.20411.50511.80622.10722.40820.60212.70937.224615.505123.480621.072016.8574合計50--表4-350名麻疹易感兒血凝抑制抗體滴度集中趨勢的描述【例4-6】50名麻疹易感兒接種麻疹疫苗后集中趨勢的描述50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54。

集中趨勢的描述50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體2.應(yīng)用及注意事項幾何均數(shù)適用

①對數(shù)正態(tài)分布②等比級數(shù)資料觀察值中不能有0實驗設(shè)計的基本要素實驗設(shè)計的基本要素中位數(shù)與百分位數(shù)

集中趨勢的描述

【例4-7】200名食物中毒患者潛伏期資料如表4-4,研究人員據(jù)此采用加權(quán)法計算均數(shù)得平均潛伏期為27小時。(1)該組數(shù)據(jù)在分布上有何特點?

(2)用均數(shù)描述該資料的平均水平是否合適?中位數(shù)與百分位數(shù)集中趨勢的描述【例4-7】200集中趨勢的描述表4-4200名食物中毒患者的潛伏期潛伏期(小時)(1)頻數(shù)(2)累計頻數(shù)(3)累計頻率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合計200--集中趨勢的描述表4-4200名食物中毒患者的潛伏期中位數(shù)(median):將一組觀察值由小到大排序后,居于中間位置的數(shù)值即為中位數(shù),用表示。

中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列平均分為兩部分,小于和大于中位數(shù)的觀察值個數(shù)相等,各占50%。集中趨勢的描述中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列1.中位數(shù)的計算(1)直接法:觀察值個數(shù)較少集中趨勢的描述集中趨勢的描述【例4-8】某實驗師對10只小白鼠染毒后觀察各小鼠的生存時間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計算小白鼠的平均生存時間。集中趨勢的描述集中趨勢的描述(2)頻數(shù)表法:頻數(shù)表資料LM

中位數(shù)所在組段下限

組距

中位數(shù)所在組段的頻數(shù)

中位數(shù)所在組段前一組的累計頻數(shù)(2)頻數(shù)表法:頻數(shù)表資料LM中位數(shù)所在組段下限集中趨勢的描述求:下表200名食物中毒患者的平均潛伏期潛伏期(小時)(1)頻數(shù)(2)累計頻數(shù)(3)累計頻率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合計200--集中趨勢的描述求:下表200名食物中毒患者的平均潛伏期潛集中趨勢的描述(小時)

集中趨勢的描述(小時)百分位數(shù)(percentile):是指將一組觀察值由小到大排序后,將其平均分成100等份,對應(yīng)于每一分割位置上的數(shù)值就稱為一個百分位數(shù),用

表示。

集中趨勢的描述集中趨勢的描述是一種位置指標(biāo),一個百分位數(shù)將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。集中趨勢的描述集中趨勢的描述【例4-10】根據(jù)表4-4,計算P25、P75。集中趨勢的描述【例4-10】根據(jù)表4-4,計算P25、P75。集中趨勢的描2.中位數(shù)與百分位數(shù)的應(yīng)用中位數(shù):偏態(tài)分布資料一端或兩端無確切值總體分布不明百分位數(shù):非正態(tài)分布資料

集中趨勢的描述2.中位數(shù)與百分位數(shù)的應(yīng)用集中趨勢的描述第三節(jié)離散趨勢的描述

第三節(jié)【例4-11】分別觀察兩組各9只動物的每日進(jìn)食量(mg/g),結(jié)果如下:A組242526272829303132B組202122232425262764兩組動物每日進(jìn)食量的平均數(shù),均為28mg/g。

【例4-11】分別觀察兩組各9只動物的每日進(jìn)食量(mg/離散趨勢是頻數(shù)分布的另一特征,反映了觀察值之間的變異情況,只有將集中趨勢與離散趨勢結(jié)合起來描述才能全面反映定量資料的數(shù)量特征。

離散趨勢是頻數(shù)分布的另一特征,反映了觀察值之間的變異情況,只描述離散趨勢指標(biāo)

極差四分位間距標(biāo)準(zhǔn)差變異系數(shù)描述離散極差極差(range,R):亦稱全距,是一組同質(zhì)觀察值中最大值()與最小值()之差。

極差概念極差概念只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度樣本含量越大,極差可能越大極差不足之處極差不足之處四分位數(shù)間距(inter-quartilerange,Q):為上四分位數(shù)QU(即P75)與下四分位數(shù)QL

(即P25)之差。四分位數(shù)間距概念四分位數(shù)間距概念

【例4-12】根據(jù)例4-7資料,計算四分位數(shù)間距。小時小時四分位數(shù)間距:(小時)

【例4-12】根據(jù)例4-7資料,計算四分位數(shù)間距。每個觀察值x與間的變異稱為離均差由于變異程度用離均差平方和反應(yīng)

方差考慮觀察值個數(shù)N的影響

方差考慮觀察值個數(shù)N的影響在實際工作中方差n-1稱為自由度(degreeoffreedom)方差適用:描述對稱分布特別是正態(tài)分布資料的離散程度。

方差n-1稱為自由度方差適用:方差的度量單位是原度量單位的平方

方差開方后即與原數(shù)據(jù)的度量單位相同,這就是標(biāo)準(zhǔn)差(standarddeviation)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差在實際工作中n-1稱為自由度(degreeoffreedom)標(biāo)準(zhǔn)差適用:描述對稱分布特別是正態(tài)分布資料的離散程度。

標(biāo)準(zhǔn)差n-1稱為自由度標(biāo)準(zhǔn)差適用:標(biāo)準(zhǔn)差數(shù)學(xué)上可以證明標(biāo)準(zhǔn)差數(shù)學(xué)上可以證明標(biāo)準(zhǔn)差【例4-13】某醫(yī)生測量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差【例4-13】某醫(yī)生測量了10名腦出血患者的血尿素氮(mm身高(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合計120100.0——【例4-14】根據(jù)下表資料,計算120名10歲男孩身高的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差身高頻數(shù)頻率(%)累計頻數(shù)累計頻率(%)130~10.8標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差【例4-15】某醫(yī)院預(yù)防保健科,對一組5歲男孩進(jìn)行體檢,測量身高、體重等指標(biāo)。得身高均數(shù)與標(biāo)準(zhǔn)差為115.8cm和4.5

cm,體重均數(shù)與標(biāo)準(zhǔn)差為20.2kg和0.56kg,得出結(jié)論:身高的變異程度比體重大。變異系數(shù)上述結(jié)論是否正確?

變異系數(shù)上述結(jié)論是否正確?變異系數(shù)(coefficientofvariation,簡記為CV):是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值,

概念變異系數(shù)度量衡單位不同的資料單位相同但均數(shù)相差懸殊的兩組或多組資料

適用于概念變異系數(shù)度量衡單位不同的資料適用于變異系數(shù)根據(jù)例4-15資料分別計算身高與體重的變異系數(shù)。身高:體重:

變異系數(shù)根據(jù)例4-15資料分別計算身高與體重的變異系數(shù)描述數(shù)值變量資料集中趨勢的指標(biāo)描述數(shù)值變量資料集中趨勢的指標(biāo)描述數(shù)值變量資料離散趨勢的指標(biāo)描述數(shù)值變量資料離散趨勢的指標(biāo)第四節(jié)正態(tài)分布及其應(yīng)用第四節(jié)正態(tài)分布的概念與特征圖4-1120名10歲男孩身高資料的頻數(shù)圖正態(tài)分布的概念與特征圖4-1120名10歲男孩正態(tài)分布的概念與特征正態(tài)分布的概念與特征正態(tài)分布(normaldistribution)稱為高斯分布(Gaussdistribution),如果連續(xù)型隨機變量X的概率密度函數(shù)為:概念正態(tài)分布的概念與特征則稱隨機變量X服從參數(shù)為和的正態(tài)分布,記作:-∞<x<+∞概念正態(tài)分布的概念與特征則稱隨機變量X服從參數(shù)為正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對稱;兩端與橫軸永不相交,呈鐘形的曲線。正態(tài)分布特征正態(tài)分布的概念與特征正態(tài)曲線正態(tài)分布特征正態(tài)分布的概念與特征正態(tài)曲線正態(tài)分布有兩個參數(shù),即位置參數(shù)和形狀參數(shù)

正態(tài)分布的概念與特征位置參數(shù)正態(tài)分布的概念與特征位置參數(shù)形態(tài)參數(shù)σ正態(tài)分布的概念與特征形態(tài)參數(shù)σ正態(tài)分布的概念與特征正態(tài)分布的概念與特征正態(tài)曲線下面積的分布有一定的規(guī)律。

①正態(tài)曲線與橫軸之間的面積恒等于1或100%;②對稱分布,對稱軸兩側(cè)的面積各為50%;③在區(qū)間的面積為68.27%在區(qū)間的面積為95.00%在區(qū)間的面積為99.00%

正態(tài)分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論