




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2022/12/191定量資料的統(tǒng)計(jì)描述StatisticDescriptionforQuantitativeData
2022/12/171定量資料的統(tǒng)計(jì)描述2定量資料的統(tǒng)計(jì)描述主要內(nèi)容頻數(shù)表與頻數(shù)圖**集中趨勢(shì)的統(tǒng)計(jì)描述*離散趨勢(shì)的統(tǒng)計(jì)描述*正態(tài)分布*2定量資料的統(tǒng)計(jì)描述主要內(nèi)容頻數(shù)表與頻數(shù)圖**3
第一節(jié)
頻數(shù)表與頻數(shù)圖定量資料的統(tǒng)計(jì)描述3第一節(jié)定量資料的統(tǒng)計(jì)描述【例4-1】某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)
值(×1012/L)的頻數(shù)表5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69【例4-1】某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)【問(wèn)題4-1】該資料為何種類型資料?如何對(duì)該資料進(jìn)行描述?定量資料的統(tǒng)計(jì)描述【問(wèn)題4-1】定量資料的統(tǒng)計(jì)描述由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無(wú)章的,而是有一定規(guī)律的,呈一定的分布(distribution)將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計(jì)各組的頻數(shù),得到頻數(shù)分布表;也可再將頻數(shù)表繪制成頻數(shù)分布圖由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是頻數(shù)(frequency):一組資料中各觀察值或不同組段內(nèi)觀察值出現(xiàn)的頻繁程度(次數(shù))頻數(shù)分布表(frequencytable):由變量值及其頻數(shù)編制而成的表一、頻數(shù)分布表定量資料的統(tǒng)計(jì)描述頻數(shù)(frequency):一組資料中各觀察值或不同組段內(nèi)觀(一)頻數(shù)表的編制1.求極差(range):極差又稱全距,是指全部觀察值中最大值與最小值之差,用符號(hào)R表示
R=xmax-xmin定量資料的統(tǒng)計(jì)描述(一)頻數(shù)表的編制1.求極差(range):定量資料的統(tǒng)計(jì)2.確定組數(shù)和組距
(1)根據(jù)研究目的和分析要求靈活確定組數(shù):若為計(jì)算用,組數(shù)可適當(dāng)增多,以減少計(jì)算誤差;若為顯示分布特征,則組數(shù)不宜太多或太少,一般n<50,5~8,n>50,9~152.確定組數(shù)和組距
(2)確定組距(classinterval):相鄰兩個(gè)組段下限之差為組距,一般采用等距分組。i=R/組數(shù),為了方便資料整理匯總,組距一般取整數(shù)定量資料的統(tǒng)計(jì)描述(2)確定組距(classinterval):相鄰兩個(gè)
3.確定組段組段起點(diǎn)稱為下限(lowerlimit)組段終點(diǎn)稱為上限(upperlimit)注意:第一組段必須包含最小值,最后一個(gè)組段必須包括最大值,各組段不能重疊。除最末一個(gè)組段需同時(shí)寫出上下限外,其余組段只寫出其下限定量資料的統(tǒng)計(jì)描述3.確定組段定量資料的統(tǒng)計(jì)描述4.歸組計(jì)數(shù),整理成表用計(jì)算機(jī)或手工劃記法匯總,得到各組段觀察單位個(gè)數(shù),繪制成頻數(shù)分布表定量資料的統(tǒng)計(jì)描述4.歸組計(jì)數(shù),整理成表定量資料的統(tǒng)計(jì)描述表4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的頻數(shù)表表4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(二)頻數(shù)分布表的用途1.揭示頻數(shù)分布的特征2.揭示頻數(shù)分布的類型3.便于發(fā)現(xiàn)特大或特小的可疑值4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析定量資料的統(tǒng)計(jì)描述(二)頻數(shù)分布表的用途1.揭示頻數(shù)分布的特征定量資料的統(tǒng)計(jì)頻數(shù)分布的兩個(gè)特征集中趨勢(shì)(centraltendency):指一組數(shù)據(jù)向某個(gè)位置聚集或集中的傾向離散趨勢(shì)(dispersion):指一組數(shù)據(jù)的分散性或變異度
定量資料的統(tǒng)計(jì)描述頻數(shù)分布的兩個(gè)特征定量資料的統(tǒng)計(jì)描述
頻數(shù)分布的類型
對(duì)稱分布(symmetricdistribution):集中位置在中間,左右兩側(cè)頻數(shù)基本對(duì)稱定量資料的統(tǒng)計(jì)描述頻數(shù)分布的類型定量資料的統(tǒng)計(jì)描述偏態(tài)分布(skeweddistribution):集中位置(高峰位置)偏向一側(cè),兩側(cè)頻數(shù)分布不對(duì)稱正偏態(tài)(positiveskew)高峰位置偏向數(shù)值小的一側(cè)負(fù)偏態(tài)(negativeskew)高峰位置偏向數(shù)值小的一側(cè)正偏態(tài)負(fù)偏態(tài)偏態(tài)分布(skeweddistribution):集中位置二、頻數(shù)分布圖頻數(shù)分布圖(graphoffrequency)是以變量值為橫坐標(biāo)、頻數(shù)(或頻率)為縱坐標(biāo)(不等距分組時(shí)以頻率/組距=頻率密度為縱坐標(biāo)),以每個(gè)等寬的距形面積表示每組的頻數(shù)(或頻率)定量資料的統(tǒng)計(jì)描述二、頻數(shù)分布圖頻數(shù)分布圖(graphoffrequenc連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(histogram)離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱直條圖(bargraph)定量資料的統(tǒng)計(jì)描述連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(hist圖4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的頻數(shù)圖正態(tài)分布連續(xù)型定量資料圖4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×對(duì)稱分布正偏態(tài)負(fù)偏態(tài)對(duì)稱分布正偏態(tài)負(fù)偏態(tài)434名少數(shù)民族已婚婦女現(xiàn)有子女?dāng)?shù)頻數(shù)分布圖離散型定量資料434名少數(shù)民族已婚婦女現(xiàn)有子女?dāng)?shù)頻數(shù)分布圖離散型定量資料23
第二節(jié)
集中趨勢(shì)的統(tǒng)計(jì)描述(一)定量資料的統(tǒng)計(jì)描述23第二節(jié)定量資料的統(tǒng)計(jì)描述平均數(shù)(average)是一類描述計(jì)量資料集中位置或平均水平的統(tǒng)計(jì)指標(biāo),在醫(yī)學(xué)領(lǐng)域中常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)平均數(shù)(average)是一類描述計(jì)量資料集中位置或平均水平一、算術(shù)均數(shù)(arithmeticmean)簡(jiǎn)稱均數(shù)(mean),總體均數(shù)用希臘字母
(miu)表示,樣本均數(shù)用(xbar)表示。均數(shù)描述一組數(shù)據(jù)在數(shù)量上的平均水平一、算術(shù)均數(shù)(arithmeticmean)簡(jiǎn)稱均數(shù)(me直接法
將所有數(shù)據(jù)直接相加,再除以總例數(shù)
Σ:是希臘字母,讀作sigma,為求和符號(hào)1.計(jì)算方法直接法
將所有數(shù)據(jù)直接相加,再除以總例數(shù)
Σ:是希臘字母【例4-2】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的均數(shù)【例4-2】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol加權(quán)法用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),將相同觀察值的個(gè)數(shù)(頻數(shù)f)乘以該觀察值x,以代替相同觀察值逐個(gè)相加加權(quán)法【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的均數(shù)計(jì)算表【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名正常成年男子f起了“權(quán)數(shù)”的作用,權(quán)衡了各組中值由于頻數(shù)不同對(duì)均數(shù)的影響。加權(quán)法計(jì)算的均數(shù)是近似的f起了“權(quán)數(shù)”的作用,權(quán)衡了各組中值由于頻數(shù)不同對(duì)均數(shù)的影均數(shù)兩個(gè)重要的性質(zhì)均數(shù)兩個(gè)重要的性質(zhì)適用于描述單峰對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集中趨勢(shì)均數(shù)在描述正態(tài)分布特征方面有重要意義均數(shù)的應(yīng)用適用于描述單峰對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集例現(xiàn)有5人,其血清抗體效價(jià)分別為1:10、1:100、1:1000、1:10000和1:100000,求其效價(jià)倒數(shù)的平均水平若計(jì)算效價(jià)倒數(shù)的算術(shù)均數(shù)用算術(shù)均數(shù)反映這類資料的平均水平是不合適的例現(xiàn)有5人,其血清抗體效價(jià)分別為1:10、1:100、先求效價(jià)倒數(shù)對(duì)數(shù)值的均數(shù),然后求反對(duì)數(shù)1000位于10、100、1000、10000、100000的中間位置,具有很好的表性,這種平均數(shù)就稱為幾何均數(shù)先求效價(jià)倒數(shù)對(duì)數(shù)值的均數(shù),然后求反對(duì)數(shù)直接法:當(dāng)n較小時(shí),直接將n個(gè)觀察值的乘積開(kāi)n次方1.計(jì)算方法二、幾何均數(shù)(Geometricmean,G)直接法:當(dāng)n較小時(shí),直接將n個(gè)觀察值的乘積開(kāi)n次方
【例4-4】某實(shí)驗(yàn)室測(cè)得5人血清中某種抗體的滴度分別為1/20,1/40,1/80,1/80,1/320,試求平均滴度【例4-4】某實(shí)驗(yàn)室測(cè)得5人血清中某種抗體的滴度分別為加權(quán)法:當(dāng)資料中出現(xiàn)相同觀察值時(shí),也可用加權(quán)法計(jì)算幾何均數(shù)加權(quán)法:當(dāng)資料中出現(xiàn)相同觀察值時(shí),也可用加權(quán)法計(jì)算幾何均數(shù)【例4-6】50名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝抑制抗體滴度資料見(jiàn)表4-3,求抗體的平均滴度。表4-350名麻疹易感兒血凝抑制抗體滴度【例4-6】50名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝表4-3即50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54即50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/2.應(yīng)用及注意事項(xiàng)幾何均數(shù)應(yīng)用于:等比資料,如抗體平均滴度對(duì)數(shù)正態(tài)分布資料2.應(yīng)用及注意事項(xiàng)幾何均數(shù)應(yīng)用于:使用幾何均數(shù)時(shí)應(yīng)注意:觀察值不能有0觀察值不能同時(shí)有正值和負(fù)值。若全為負(fù)值,在計(jì)算時(shí)先把負(fù)號(hào)去掉,得出結(jié)果再加上負(fù)號(hào)使用幾何均數(shù)時(shí)應(yīng)注意:42
第三節(jié)
集中趨勢(shì)的統(tǒng)計(jì)描述(二)定量資料的統(tǒng)計(jì)描述42第三節(jié)定量資料的統(tǒng)計(jì)描述
【例4-7】200名食物中毒患者潛伏期資料如表4-4,研究人員據(jù)此采用加權(quán)法計(jì)算均數(shù)得平均潛伏期為27小時(shí)。(1)該組數(shù)據(jù)在分布上有何特點(diǎn)?(2)用均數(shù)描述該資料的平均水平是否合適?三、中位數(shù)與百分位數(shù)【例4-7】200名食物中毒患者潛伏期資料如表4-4,研表4-4200名食物中毒患者的潛伏期表4-4200名食物中毒患者的潛伏期中位數(shù)(median):一組觀察值從小到大排列,位次居中的觀察值即中位數(shù),是一個(gè)位置指標(biāo)中位數(shù)(median):一組觀察值從小到大排列,位次居中的觀直接法n為奇數(shù),n為偶數(shù),直接法【例4-8】某實(shí)驗(yàn)師對(duì)10只小白鼠染毒后觀察各小鼠的生存時(shí)間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計(jì)算小白鼠的平均生存時(shí)間將10個(gè)觀察值由小到大排列:35,60,62,63,63,65,66,68,69,69
【例4-8】某實(shí)驗(yàn)師對(duì)10只小白鼠染毒后觀察各小鼠的生存時(shí)間頻數(shù)表法LM中位數(shù)所在組段下限
組距中位數(shù)所在組段的頻數(shù)中位數(shù)所在組段前一組的累計(jì)頻數(shù)頻數(shù)表法LM中位數(shù)所在組段下限組距中位數(shù)所在組段的頻【例4-9】根據(jù)例4-7的資料計(jì)算中位數(shù)表4-4200名食物中毒患者的潛伏期【例4-9】根據(jù)例4-7的資料計(jì)算中位數(shù)表4-4200醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦百分位數(shù)(percentile):是指將一組觀察值由小到大排序后,將其平均分成100等份,對(duì)應(yīng)于每一分割位置上的數(shù)值就稱為一個(gè)百分位數(shù),用
表示百分位數(shù)(percentile):是指將一組觀察值由小到大排x%
Px(100-x)%50%分位數(shù)就是中位數(shù)25%,75%分位數(shù)稱四分位數(shù)(quartile)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦式中:第x百分位數(shù)所在組段下限組距第x百分位數(shù)所在組段的頻數(shù)第x百分位數(shù)所在組段前一組的累計(jì)頻數(shù)頻數(shù)表法式中:第x百分位數(shù)所在組段下限頻數(shù)表法【例4-10】根據(jù)表4-4,計(jì)算P25、P75【例4-10】根據(jù)表4-4,計(jì)算P25、P75適用條件:偏態(tài)分布資料分布類型不明確的資料“開(kāi)口資料”(即一端或兩端無(wú)確切數(shù)值的資料)適用條件:56
第四節(jié)
離散趨勢(shì)的統(tǒng)計(jì)描述定量資料的統(tǒng)計(jì)描述56第四節(jié)定量資料的統(tǒng)計(jì)描述
三組軀體功能維度得分三組軀體功能維度得分描述離散趨勢(shì)的常用指標(biāo)極差(range)四分位數(shù)間距(interquartilerange)方差(variance)和標(biāo)準(zhǔn)差(standarddeviation)變異系數(shù)(coefficientofvariation)描述離散趨勢(shì)的常用指標(biāo)極差(range)1.極差/全距(range)
全部觀察值中最大值與最小值之差,用符號(hào)R表示,即常用于描述單峰對(duì)稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度1.極差/全距(range)全部觀察值中最大值與最小值之極差描述離散趨勢(shì)的局限只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異程度樣本含量越大,極差可能越大,樣本含量相差懸殊時(shí)不宜用極差作比較極差描述離散趨勢(shì)的局限四分位數(shù):P25,P50,P75三個(gè)點(diǎn)將全部觀察值等分為四部分,處于分位點(diǎn)上的數(shù)值就是四分位數(shù)下四分位數(shù)即第25百分位數(shù),用QL表示
上四分位數(shù)即第75百分位數(shù),用QU表示2.四分位數(shù)間距四分位數(shù):P25,P50,P75三個(gè)點(diǎn)將全部觀察值等分為四分位數(shù)間距(interquartilerange)即上、下四分位數(shù)之差200名食物中毒患者的潛伏期資料,P25=15.4,P75=36四分位數(shù)間距(interquartilerange)即上、四分位數(shù)間距常用于描述偏態(tài)分布及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度四分位數(shù)間距較全距穩(wěn)定,但仍不能全面概括所有觀察值的變異情況四分位數(shù)間距常用于描述偏態(tài)分布及分布的一端或兩端無(wú)確切數(shù)值資醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦3.方差(variance)和標(biāo)準(zhǔn)差(SD)式中n–1稱為自由度(Degreeoffreedom),允許自由取值的變量值個(gè)數(shù),用符號(hào)(niu紐)表示3.方差(variance)和標(biāo)準(zhǔn)差(SD)式中n–方差的度量單位是原度量單位的平方方差開(kāi)方后即與原數(shù)據(jù)的度量單位相同,這就是標(biāo)準(zhǔn)差(standarddeviation)方差的度量單位是原度量單位的平方
標(biāo)準(zhǔn)差應(yīng)用公式
直接法
加權(quán)法標(biāo)準(zhǔn)差應(yīng)用公式
【例4-13】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的標(biāo)準(zhǔn)差【例4-13】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(m【例4-14】根據(jù)表4-1資料,計(jì)算2006年某市120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的標(biāo)準(zhǔn)差【例4-14】根據(jù)表4-1資料,計(jì)算2006年某市120名正描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的變異程度描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的變異程度
【例4-15】某醫(yī)院預(yù)防保健科,對(duì)一組5歲男孩進(jìn)行體檢,測(cè)量身高、體重等指標(biāo)。得身高均數(shù)與標(biāo)準(zhǔn)差為103.5cm和5.6cm,體重均數(shù)與標(biāo)準(zhǔn)差為22.3kg和0.78kg,由此認(rèn)為身高的變異程度比體重大。上述結(jié)論是否正確?4.變異系數(shù)(coefficientofvariation)【例4-15】某醫(yī)院預(yù)防保健科,對(duì)一組5歲男孩進(jìn)行體檢,醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦
【例4-16】某實(shí)驗(yàn)室分別測(cè)量了10只小白鼠和10只家兔的體重,得小白鼠體重的均數(shù)與標(biāo)準(zhǔn)差分別為32g和3g,家兔體重的均數(shù)與標(biāo)準(zhǔn)差分別為1350g和120g。經(jīng)比較得出結(jié)論,因家兔體重的標(biāo)準(zhǔn)差大于小白鼠體重的標(biāo)準(zhǔn)差,所以家兔體重的變異程度比小白鼠體重的變異程度大?!纠?-16】某實(shí)驗(yàn)室分別測(cè)量了10只小白鼠和10只家兔小白鼠體重:家兔的體重:小白鼠體重:家兔的體重:變異系數(shù)(coefficientofvariation,CV):是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值用途:比較度量衡單位不同的資料的變異度比較均數(shù)相差懸殊的資料的變異度變異系數(shù)(coefficientofvariation,描述頻數(shù)分布特征的指標(biāo)總結(jié)描述頻數(shù)分布特征的指標(biāo)總結(jié)描述數(shù)值變量資料分布特征的內(nèi)容:分布范圍集中趨勢(shì)離散趨勢(shì)是否對(duì)稱描述數(shù)值變量資料分布特征的內(nèi)容:78
第五節(jié)
正態(tài)分布及其應(yīng)用(一)定量資料的統(tǒng)計(jì)描述78第五節(jié)定量資料的統(tǒng)計(jì)描述圖4-2頻數(shù)分布逐漸接近正態(tài)分布示意圖圖4-2頻數(shù)分布逐漸接近正態(tài)分布示意圖1.正態(tài)分布的概念及特征正態(tài)分布(Normaldistribution),也稱高斯分布(Gaussiandistribution),是一種非常重要的連續(xù)型隨機(jī)變量的概率分布,是自然界中最常見(jiàn)的一種分布1.正態(tài)分布的概念及特征正態(tài)分布(Normaldistr10馬克的錢幣10馬克的錢幣82第四套德國(guó)馬克中的10馬克紙幣,發(fā)行于1989年至2001年。紙幣正面的人物是德國(guó)數(shù)學(xué)家高斯(JohannCarlFriedrichGauss)。雖然現(xiàn)在已經(jīng)不再流通,但有很高的收藏價(jià)值。現(xiàn)在在歐洲、中國(guó)就有很多收藏愛(ài)好者,專收珍藏德國(guó)馬克、意義非常之大!82第四套德國(guó)馬克中的10馬克紙幣,發(fā)行于1989年至283正態(tài)分布(normaldistribution)稱為高斯分布(Gaussdistribution),如果連續(xù)型隨機(jī)變量X的概率密度函數(shù)為:
概念正態(tài)分布的概念與特征則稱隨機(jī)變量X服從參數(shù)為和的正態(tài)分布,記作:-∞<x<+∞83概念正態(tài)分布的概念與特征則稱隨機(jī)變量X服從參數(shù)84正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對(duì)稱;兩端與橫軸永不相交,呈鐘形曲線。
正態(tài)分布特征正態(tài)曲線84正態(tài)分布特征正態(tài)曲線正態(tài)分布圖示x0.1.2.3.4f(x)正態(tài)分布圖示x0.1.2.3.4f(x)概率密度函數(shù)(PDF)和累積分布函數(shù)(CDF)概率密度函數(shù)(PDF)和累積分布函數(shù)(CDF)正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù)和形狀參數(shù)
峰的位置-位置參數(shù)μ峰的位置-位置參數(shù)μ方差相等、均數(shù)不等的正態(tài)分布圖示312方差相等、均數(shù)不等的正態(tài)分布圖示31289形態(tài)參數(shù)σ89形態(tài)參數(shù)σ均數(shù)相等、方差不等的正態(tài)分布圖示213均數(shù)相等、方差不等的正態(tài)分布圖示21391正態(tài)曲線下面積的分布有一定的規(guī)律。
①正態(tài)曲線與橫軸之間的面積恒等于1或100%;②對(duì)稱分布,對(duì)稱軸兩側(cè)的面積各為50%;③在區(qū)間的面積為68.27%在區(qū)間的面積為95.00%在區(qū)間的面積為99.00%
91正態(tài)曲線下面積的分布有一定的規(guī)律。①正態(tài)曲線與橫軸之間9292正態(tài)曲線下的面積規(guī)律-+15.87%15.87%68.27%正態(tài)曲線下的面積規(guī)律-+15.87%15.87%6-1.96+1.962.5%2.5%95%-1.96+1.962.5%2.5%95%-2.58+2.580.5%0.5%99%-2.58+2.580.5%0.5%99%正態(tài)分布的特征概率密度函數(shù)曲線在均數(shù)處最高以均數(shù)為中心左右對(duì)稱,且逐漸減少正態(tài)分布有兩個(gè)參數(shù),即和曲線下的面積分布有一定規(guī)律正態(tài)分布的特征正態(tài)分布的判斷方法⑴利用頻數(shù)分布表或頻數(shù)分布圖⑵根據(jù)專業(yè)知識(shí)判斷⑶正態(tài)分布的經(jīng)驗(yàn)判斷①若,可認(rèn)為資料呈偏態(tài)分布②若,則有理由懷疑資料呈偏態(tài)分布⑷正態(tài)性檢驗(yàn)(P108)正態(tài)分布的判斷方法98
第六節(jié)
正態(tài)分布及其應(yīng)用(二)定量資料的統(tǒng)計(jì)描述98第六節(jié)定量資料的統(tǒng)計(jì)描述2.標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換2.標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦標(biāo)準(zhǔn)正態(tài)分布曲線下面積(z)
z 0.00 0.02 0.04 0.06 0.08-3.0 0.0013 0.0013 0.0012 0.0011 0.0010-2.5 0.0062 0.0059 0.0055 0.0052 0.0049-2.0 0.0228 0.0217 0.0207 0.0197 0.0188-1.9 0.0287 0.0274 0.0262 0.0250 0.0239-1.6 0.0548 0.0526 0.0505 0.0485 0.0465-1.0 0.1587 0.1539 0.1492 0.1446 0.1401-0.5 0.3085 0.3015 0.2946 0.2877 0.28100 0.5000 0.4920 0.4840 0.4761 0.46810z標(biāo)準(zhǔn)正態(tài)分布曲線下面積(z)z 0.00 0
【例4-18】
已知某地2003年18歲男大學(xué)生身高的均數(shù)cm,標(biāo)準(zhǔn)差cm,且18歲男大學(xué)生的身高服從正態(tài)分布。問(wèn)該地18歲男大學(xué)生中身高在166.8cm及其以下者占多大的比例?
查附表3(P195):表的左側(cè)找-1.9,表的上方找0.06,相交處為0.025,即2.5%
【例4-18】已知某地2003年18歲男大學(xué)生身高的均3.正態(tài)分布的應(yīng)用估計(jì)頻率分布
【例4-19】某地2003年抽樣調(diào)查了100名18歲男大學(xué)生身高,算得均數(shù)為172.70cm,標(biāo)準(zhǔn)差為4.01cm。該地18歲男大學(xué)生中身高在162.35cm~183.05cm范圍內(nèi)者所占的比例是多少?3.正態(tài)分布的應(yīng)用估計(jì)頻率分布查附表3(P195)得:查附表3(P195)得:制定醫(yī)學(xué)參考值范圍醫(yī)學(xué)參考值范圍也稱正常值范圍絕大多數(shù)正常人某觀察指標(biāo)的波動(dòng)范圍。絕大多數(shù):90%、95%、99%等,最常用的是95%正常人:不是指完全健康的人,而是指排除了影響研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群用于判斷正常與異常制定醫(yī)學(xué)參考值范圍確定參考值范圍的原則以同質(zhì)的正常人為研究對(duì)象控制測(cè)量誤差判斷是否分組(性別、年齡組)決定取單側(cè)還是雙側(cè)選定合適的百分界限根據(jù)資料分布類型選擇適當(dāng)方法制定參考值確定參考值范圍的原則根據(jù)醫(yī)學(xué)專業(yè)知識(shí)確定!
肺活量、IQ
……
轉(zhuǎn)氨酶、尿鉛、發(fā)汞……雙側(cè):白細(xì)胞計(jì)數(shù)、血清總膽固醇……
過(guò)低異常---單側(cè)下限過(guò)高異常---單側(cè)上限過(guò)低、過(guò)高均異常---雙側(cè)單側(cè)下限異常正常單側(cè)上限異常正常異常正常雙側(cè)下限雙側(cè)上限異常根據(jù)醫(yī)學(xué)專業(yè)知識(shí)確定!過(guò)低異常---單側(cè)下限過(guò)高正常人病人假陽(yáng)性率假陰性率正常人與病人的數(shù)據(jù)分布重疊示意圖(單側(cè))正常人病人假陽(yáng)性率假陰性率正常人與病人的數(shù)據(jù)分布重疊示意圖(醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦
【例4-20】利用例4-19資料估計(jì)該地18歲男大學(xué)生身高的95%參考值范圍。164.84~180.56cm【例4-20】利用例4-19資料估計(jì)該地18歲男大學(xué)生
【例4-21】測(cè)得某地200名正常人尿汞值,求該地正常人尿汞值的95%參考值范圍。表4-7某地200名正常人尿汞值【例4-21】測(cè)得某地200名正常人尿汞值,求該地正常百分位數(shù)法單側(cè)上界
百分位數(shù)法質(zhì)量控制UCL(上控制限)UWL(上警戒限)CL(中心線)LWL(下警戒限)LCL(下控制限)樣本編號(hào)、取樣時(shí)間質(zhì)量控制UCL(上控制限)樣本編號(hào)、取樣時(shí)間質(zhì)量控制圖(qualitycontrolchart) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15取樣時(shí)間質(zhì)量控制圖(qualitycontrolchart) 正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)后面章節(jié)將要講到的t檢驗(yàn)、F檢驗(yàn)及相關(guān)回歸分析等多種統(tǒng)計(jì)方法均要求分析的指標(biāo)服從正態(tài)分布或近似正態(tài)分布正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)小結(jié)定量資料統(tǒng)計(jì)描述的方法:頻數(shù)表、頻數(shù)圖、統(tǒng)計(jì)指標(biāo);集中趨勢(shì)指標(biāo)及應(yīng)用:均數(shù)(正態(tài)分布)、幾何均數(shù)(等比數(shù)列)、中位數(shù)(偏態(tài)分布、開(kāi)口數(shù)據(jù));離散趨勢(shì)的指標(biāo)及應(yīng)用:極差(參考)、四分位數(shù)間距(偏態(tài)分布)、標(biāo)準(zhǔn)差(正態(tài)分布)、變異系數(shù)(單位不同或均數(shù)相差較大幾組數(shù)據(jù)變異的比較);正態(tài)分布的特征:一個(gè)高峰,兩個(gè)參數(shù)μ和σ,面積規(guī)律,標(biāo)準(zhǔn)正態(tài)分布兩個(gè)參數(shù)分別為0和1;正常值范圍(參考值范圍)的含義及計(jì)算。小結(jié)定量資料統(tǒng)計(jì)描述的方法:頻數(shù)表、頻數(shù)圖、統(tǒng)計(jì)指標(biāo)117謝謝大家!117謝謝大家!2022/12/19118定量資料的統(tǒng)計(jì)描述StatisticDescriptionforQuantitativeData
2022/12/171定量資料的統(tǒng)計(jì)描述119定量資料的統(tǒng)計(jì)描述主要內(nèi)容頻數(shù)表與頻數(shù)圖**集中趨勢(shì)的統(tǒng)計(jì)描述*離散趨勢(shì)的統(tǒng)計(jì)描述*正態(tài)分布*2定量資料的統(tǒng)計(jì)描述主要內(nèi)容頻數(shù)表與頻數(shù)圖**120
第一節(jié)
頻數(shù)表與頻數(shù)圖定量資料的統(tǒng)計(jì)描述3第一節(jié)定量資料的統(tǒng)計(jì)描述【例4-1】某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)
值(×1012/L)的頻數(shù)表5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69【例4-1】某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)【問(wèn)題4-1】該資料為何種類型資料?如何對(duì)該資料進(jìn)行描述?定量資料的統(tǒng)計(jì)描述【問(wèn)題4-1】定量資料的統(tǒng)計(jì)描述由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無(wú)章的,而是有一定規(guī)律的,呈一定的分布(distribution)將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計(jì)各組的頻數(shù),得到頻數(shù)分布表;也可再將頻數(shù)表繪制成頻數(shù)分布圖由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是頻數(shù)(frequency):一組資料中各觀察值或不同組段內(nèi)觀察值出現(xiàn)的頻繁程度(次數(shù))頻數(shù)分布表(frequencytable):由變量值及其頻數(shù)編制而成的表一、頻數(shù)分布表定量資料的統(tǒng)計(jì)描述頻數(shù)(frequency):一組資料中各觀察值或不同組段內(nèi)觀(一)頻數(shù)表的編制1.求極差(range):極差又稱全距,是指全部觀察值中最大值與最小值之差,用符號(hào)R表示
R=xmax-xmin定量資料的統(tǒng)計(jì)描述(一)頻數(shù)表的編制1.求極差(range):定量資料的統(tǒng)計(jì)2.確定組數(shù)和組距
(1)根據(jù)研究目的和分析要求靈活確定組數(shù):若為計(jì)算用,組數(shù)可適當(dāng)增多,以減少計(jì)算誤差;若為顯示分布特征,則組數(shù)不宜太多或太少,一般n<50,5~8,n>50,9~152.確定組數(shù)和組距
(2)確定組距(classinterval):相鄰兩個(gè)組段下限之差為組距,一般采用等距分組。i=R/組數(shù),為了方便資料整理匯總,組距一般取整數(shù)定量資料的統(tǒng)計(jì)描述(2)確定組距(classinterval):相鄰兩個(gè)
3.確定組段組段起點(diǎn)稱為下限(lowerlimit)組段終點(diǎn)稱為上限(upperlimit)注意:第一組段必須包含最小值,最后一個(gè)組段必須包括最大值,各組段不能重疊。除最末一個(gè)組段需同時(shí)寫出上下限外,其余組段只寫出其下限定量資料的統(tǒng)計(jì)描述3.確定組段定量資料的統(tǒng)計(jì)描述4.歸組計(jì)數(shù),整理成表用計(jì)算機(jī)或手工劃記法匯總,得到各組段觀察單位個(gè)數(shù),繪制成頻數(shù)分布表定量資料的統(tǒng)計(jì)描述4.歸組計(jì)數(shù),整理成表定量資料的統(tǒng)計(jì)描述表4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的頻數(shù)表表4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(二)頻數(shù)分布表的用途1.揭示頻數(shù)分布的特征2.揭示頻數(shù)分布的類型3.便于發(fā)現(xiàn)特大或特小的可疑值4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析定量資料的統(tǒng)計(jì)描述(二)頻數(shù)分布表的用途1.揭示頻數(shù)分布的特征定量資料的統(tǒng)計(jì)頻數(shù)分布的兩個(gè)特征集中趨勢(shì)(centraltendency):指一組數(shù)據(jù)向某個(gè)位置聚集或集中的傾向離散趨勢(shì)(dispersion):指一組數(shù)據(jù)的分散性或變異度
定量資料的統(tǒng)計(jì)描述頻數(shù)分布的兩個(gè)特征定量資料的統(tǒng)計(jì)描述
頻數(shù)分布的類型
對(duì)稱分布(symmetricdistribution):集中位置在中間,左右兩側(cè)頻數(shù)基本對(duì)稱定量資料的統(tǒng)計(jì)描述頻數(shù)分布的類型定量資料的統(tǒng)計(jì)描述偏態(tài)分布(skeweddistribution):集中位置(高峰位置)偏向一側(cè),兩側(cè)頻數(shù)分布不對(duì)稱正偏態(tài)(positiveskew)高峰位置偏向數(shù)值小的一側(cè)負(fù)偏態(tài)(negativeskew)高峰位置偏向數(shù)值小的一側(cè)正偏態(tài)負(fù)偏態(tài)偏態(tài)分布(skeweddistribution):集中位置二、頻數(shù)分布圖頻數(shù)分布圖(graphoffrequency)是以變量值為橫坐標(biāo)、頻數(shù)(或頻率)為縱坐標(biāo)(不等距分組時(shí)以頻率/組距=頻率密度為縱坐標(biāo)),以每個(gè)等寬的距形面積表示每組的頻數(shù)(或頻率)定量資料的統(tǒng)計(jì)描述二、頻數(shù)分布圖頻數(shù)分布圖(graphoffrequenc連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(histogram)離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱直條圖(bargraph)定量資料的統(tǒng)計(jì)描述連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(hist圖4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的頻數(shù)圖正態(tài)分布連續(xù)型定量資料圖4-1某市2010年120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×對(duì)稱分布正偏態(tài)負(fù)偏態(tài)對(duì)稱分布正偏態(tài)負(fù)偏態(tài)434名少數(shù)民族已婚婦女現(xiàn)有子女?dāng)?shù)頻數(shù)分布圖離散型定量資料434名少數(shù)民族已婚婦女現(xiàn)有子女?dāng)?shù)頻數(shù)分布圖離散型定量資料140
第二節(jié)
集中趨勢(shì)的統(tǒng)計(jì)描述(一)定量資料的統(tǒng)計(jì)描述23第二節(jié)定量資料的統(tǒng)計(jì)描述平均數(shù)(average)是一類描述計(jì)量資料集中位置或平均水平的統(tǒng)計(jì)指標(biāo),在醫(yī)學(xué)領(lǐng)域中常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)平均數(shù)(average)是一類描述計(jì)量資料集中位置或平均水平一、算術(shù)均數(shù)(arithmeticmean)簡(jiǎn)稱均數(shù)(mean),總體均數(shù)用希臘字母
(miu)表示,樣本均數(shù)用(xbar)表示。均數(shù)描述一組數(shù)據(jù)在數(shù)量上的平均水平一、算術(shù)均數(shù)(arithmeticmean)簡(jiǎn)稱均數(shù)(me直接法
將所有數(shù)據(jù)直接相加,再除以總例數(shù)
Σ:是希臘字母,讀作sigma,為求和符號(hào)1.計(jì)算方法直接法
將所有數(shù)據(jù)直接相加,再除以總例數(shù)
Σ:是希臘字母【例4-2】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的均數(shù)【例4-2】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol加權(quán)法用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),將相同觀察值的個(gè)數(shù)(頻數(shù)f)乘以該觀察值x,以代替相同觀察值逐個(gè)相加加權(quán)法【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的均數(shù)計(jì)算表【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名正常成年男子f起了“權(quán)數(shù)”的作用,權(quán)衡了各組中值由于頻數(shù)不同對(duì)均數(shù)的影響。加權(quán)法計(jì)算的均數(shù)是近似的f起了“權(quán)數(shù)”的作用,權(quán)衡了各組中值由于頻數(shù)不同對(duì)均數(shù)的影均數(shù)兩個(gè)重要的性質(zhì)均數(shù)兩個(gè)重要的性質(zhì)適用于描述單峰對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集中趨勢(shì)均數(shù)在描述正態(tài)分布特征方面有重要意義均數(shù)的應(yīng)用適用于描述單峰對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集例現(xiàn)有5人,其血清抗體效價(jià)分別為1:10、1:100、1:1000、1:10000和1:100000,求其效價(jià)倒數(shù)的平均水平若計(jì)算效價(jià)倒數(shù)的算術(shù)均數(shù)用算術(shù)均數(shù)反映這類資料的平均水平是不合適的例現(xiàn)有5人,其血清抗體效價(jià)分別為1:10、1:100、先求效價(jià)倒數(shù)對(duì)數(shù)值的均數(shù),然后求反對(duì)數(shù)1000位于10、100、1000、10000、100000的中間位置,具有很好的表性,這種平均數(shù)就稱為幾何均數(shù)先求效價(jià)倒數(shù)對(duì)數(shù)值的均數(shù),然后求反對(duì)數(shù)直接法:當(dāng)n較小時(shí),直接將n個(gè)觀察值的乘積開(kāi)n次方1.計(jì)算方法二、幾何均數(shù)(Geometricmean,G)直接法:當(dāng)n較小時(shí),直接將n個(gè)觀察值的乘積開(kāi)n次方
【例4-4】某實(shí)驗(yàn)室測(cè)得5人血清中某種抗體的滴度分別為1/20,1/40,1/80,1/80,1/320,試求平均滴度【例4-4】某實(shí)驗(yàn)室測(cè)得5人血清中某種抗體的滴度分別為加權(quán)法:當(dāng)資料中出現(xiàn)相同觀察值時(shí),也可用加權(quán)法計(jì)算幾何均數(shù)加權(quán)法:當(dāng)資料中出現(xiàn)相同觀察值時(shí),也可用加權(quán)法計(jì)算幾何均數(shù)【例4-6】50名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝抑制抗體滴度資料見(jiàn)表4-3,求抗體的平均滴度。表4-350名麻疹易感兒血凝抑制抗體滴度【例4-6】50名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝表4-3即50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54即50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/2.應(yīng)用及注意事項(xiàng)幾何均數(shù)應(yīng)用于:等比資料,如抗體平均滴度對(duì)數(shù)正態(tài)分布資料2.應(yīng)用及注意事項(xiàng)幾何均數(shù)應(yīng)用于:使用幾何均數(shù)時(shí)應(yīng)注意:觀察值不能有0觀察值不能同時(shí)有正值和負(fù)值。若全為負(fù)值,在計(jì)算時(shí)先把負(fù)號(hào)去掉,得出結(jié)果再加上負(fù)號(hào)使用幾何均數(shù)時(shí)應(yīng)注意:159
第三節(jié)
集中趨勢(shì)的統(tǒng)計(jì)描述(二)定量資料的統(tǒng)計(jì)描述42第三節(jié)定量資料的統(tǒng)計(jì)描述
【例4-7】200名食物中毒患者潛伏期資料如表4-4,研究人員據(jù)此采用加權(quán)法計(jì)算均數(shù)得平均潛伏期為27小時(shí)。(1)該組數(shù)據(jù)在分布上有何特點(diǎn)?(2)用均數(shù)描述該資料的平均水平是否合適?三、中位數(shù)與百分位數(shù)【例4-7】200名食物中毒患者潛伏期資料如表4-4,研表4-4200名食物中毒患者的潛伏期表4-4200名食物中毒患者的潛伏期中位數(shù)(median):一組觀察值從小到大排列,位次居中的觀察值即中位數(shù),是一個(gè)位置指標(biāo)中位數(shù)(median):一組觀察值從小到大排列,位次居中的觀直接法n為奇數(shù),n為偶數(shù),直接法【例4-8】某實(shí)驗(yàn)師對(duì)10只小白鼠染毒后觀察各小鼠的生存時(shí)間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計(jì)算小白鼠的平均生存時(shí)間將10個(gè)觀察值由小到大排列:35,60,62,63,63,65,66,68,69,69
【例4-8】某實(shí)驗(yàn)師對(duì)10只小白鼠染毒后觀察各小鼠的生存時(shí)間頻數(shù)表法LM中位數(shù)所在組段下限
組距中位數(shù)所在組段的頻數(shù)中位數(shù)所在組段前一組的累計(jì)頻數(shù)頻數(shù)表法LM中位數(shù)所在組段下限組距中位數(shù)所在組段的頻【例4-9】根據(jù)例4-7的資料計(jì)算中位數(shù)表4-4200名食物中毒患者的潛伏期【例4-9】根據(jù)例4-7的資料計(jì)算中位數(shù)表4-4200醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦百分位數(shù)(percentile):是指將一組觀察值由小到大排序后,將其平均分成100等份,對(duì)應(yīng)于每一分割位置上的數(shù)值就稱為一個(gè)百分位數(shù),用
表示百分位數(shù)(percentile):是指將一組觀察值由小到大排x%
Px(100-x)%50%分位數(shù)就是中位數(shù)25%,75%分位數(shù)稱四分位數(shù)(quartile)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦式中:第x百分位數(shù)所在組段下限組距第x百分位數(shù)所在組段的頻數(shù)第x百分位數(shù)所在組段前一組的累計(jì)頻數(shù)頻數(shù)表法式中:第x百分位數(shù)所在組段下限頻數(shù)表法【例4-10】根據(jù)表4-4,計(jì)算P25、P75【例4-10】根據(jù)表4-4,計(jì)算P25、P75適用條件:偏態(tài)分布資料分布類型不明確的資料“開(kāi)口資料”(即一端或兩端無(wú)確切數(shù)值的資料)適用條件:173
第四節(jié)
離散趨勢(shì)的統(tǒng)計(jì)描述定量資料的統(tǒng)計(jì)描述56第四節(jié)定量資料的統(tǒng)計(jì)描述
三組軀體功能維度得分三組軀體功能維度得分描述離散趨勢(shì)的常用指標(biāo)極差(range)四分位數(shù)間距(interquartilerange)方差(variance)和標(biāo)準(zhǔn)差(standarddeviation)變異系數(shù)(coefficientofvariation)描述離散趨勢(shì)的常用指標(biāo)極差(range)1.極差/全距(range)
全部觀察值中最大值與最小值之差,用符號(hào)R表示,即常用于描述單峰對(duì)稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度1.極差/全距(range)全部觀察值中最大值與最小值之極差描述離散趨勢(shì)的局限只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異程度樣本含量越大,極差可能越大,樣本含量相差懸殊時(shí)不宜用極差作比較極差描述離散趨勢(shì)的局限四分位數(shù):P25,P50,P75三個(gè)點(diǎn)將全部觀察值等分為四部分,處于分位點(diǎn)上的數(shù)值就是四分位數(shù)下四分位數(shù)即第25百分位數(shù),用QL表示
上四分位數(shù)即第75百分位數(shù),用QU表示2.四分位數(shù)間距四分位數(shù):P25,P50,P75三個(gè)點(diǎn)將全部觀察值等分為四分位數(shù)間距(interquartilerange)即上、下四分位數(shù)之差200名食物中毒患者的潛伏期資料,P25=15.4,P75=36四分位數(shù)間距(interquartilerange)即上、四分位數(shù)間距常用于描述偏態(tài)分布及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度四分位數(shù)間距較全距穩(wěn)定,但仍不能全面概括所有觀察值的變異情況四分位數(shù)間距常用于描述偏態(tài)分布及分布的一端或兩端無(wú)確切數(shù)值資醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦3.方差(variance)和標(biāo)準(zhǔn)差(SD)式中n–1稱為自由度(Degreeoffreedom),允許自由取值的變量值個(gè)數(shù),用符號(hào)(niu紐)表示3.方差(variance)和標(biāo)準(zhǔn)差(SD)式中n–方差的度量單位是原度量單位的平方方差開(kāi)方后即與原數(shù)據(jù)的度量單位相同,這就是標(biāo)準(zhǔn)差(standarddeviation)方差的度量單位是原度量單位的平方
標(biāo)準(zhǔn)差應(yīng)用公式
直接法
加權(quán)法標(biāo)準(zhǔn)差應(yīng)用公式
【例4-13】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的標(biāo)準(zhǔn)差【例4-13】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(m【例4-14】根據(jù)表4-1資料,計(jì)算2006年某市120名正常成年男子紅細(xì)胞計(jì)數(shù)值(×1012/L)的標(biāo)準(zhǔn)差【例4-14】根據(jù)表4-1資料,計(jì)算2006年某市120名正描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的變異程度描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的變異程度
【例4-15】某醫(yī)院預(yù)防保健科,對(duì)一組5歲男孩進(jìn)行體檢,測(cè)量身高、體重等指標(biāo)。得身高均數(shù)與標(biāo)準(zhǔn)差為103.5cm和5.6cm,體重均數(shù)與標(biāo)準(zhǔn)差為22.3kg和0.78kg,由此認(rèn)為身高的變異程度比體重大。上述結(jié)論是否正確?4.變異系數(shù)(coefficientofvariation)【例4-15】某醫(yī)院預(yù)防保健科,對(duì)一組5歲男孩進(jìn)行體檢,醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:定量資料的描述(研究生)-推薦
【例4-16】某實(shí)驗(yàn)室分別測(cè)量了10只小白鼠和10只家兔的體重,得小白鼠體重的均數(shù)與標(biāo)準(zhǔn)差分別為32g和3g,家兔體重的均數(shù)與標(biāo)準(zhǔn)差分別為1350g和120g。經(jīng)比較得出結(jié)論,因家兔體重的標(biāo)準(zhǔn)差大于小白鼠體重的標(biāo)準(zhǔn)差,所以家兔體重的變異程度比小白鼠體重的變異程度大?!纠?-16】某實(shí)驗(yàn)室分別測(cè)量了10只小白鼠和10只家兔小白鼠體重:家兔的體重:小白鼠體重:家兔的體重:變異系數(shù)(coefficientofvariation,CV):是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值用途:比較度量衡單位不同的資料的變異度比較均數(shù)相差懸殊的資料的變異度變異系數(shù)(coefficientofvariation,描述頻數(shù)分布特征的指標(biāo)總結(jié)描述頻數(shù)分布特征的指標(biāo)總結(jié)描述數(shù)值變量資料分布特征的內(nèi)容:分布范圍集中趨勢(shì)離散趨勢(shì)是否對(duì)稱描述數(shù)值變量資料分布特征的內(nèi)容:195
第五節(jié)
正態(tài)分布及其應(yīng)用(一)定量資料的統(tǒng)計(jì)描述78第五節(jié)定量資料的統(tǒng)計(jì)描述圖4-2頻數(shù)分布逐漸接近正態(tài)分布示意圖圖4-2頻數(shù)分布逐漸接近正態(tài)分布示意圖1.正態(tài)分布的概念及特征正態(tài)分布(Normaldistribution),也稱高斯分布(Gaussiandistribution),是一種非常重要的連續(xù)型隨機(jī)變量的概率分布,是自然界中最常見(jiàn)的一種分布1.正態(tài)分布的概念及特征正態(tài)分布(Normaldistr10馬克的錢幣10馬克的錢幣199第四套德國(guó)馬克中的10馬克紙幣,發(fā)行于1989年至2001年。紙幣正面的人物是德國(guó)數(shù)學(xué)家高斯(JohannCarlFriedrichGauss)。雖然現(xiàn)在已經(jīng)不再流通,但有很高的收藏價(jià)值?,F(xiàn)在在歐洲、中國(guó)就有很多收藏愛(ài)好者,專收珍藏德國(guó)馬克、意義非常之大!82第四套德國(guó)馬克中的10馬克紙幣,發(fā)行于1989年至2200正態(tài)分布(normaldistribution)稱為高斯分布(Gaussdistribution),如果連續(xù)型隨機(jī)變量X的概率密度函數(shù)為:
概念正態(tài)分布的概念與特征則稱隨機(jī)變量X服從參數(shù)為和的正態(tài)分布,記作:-∞<x<+∞83概念正態(tài)分布的概念與特征則稱隨機(jī)變量X服從參數(shù)201正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對(duì)稱;兩端與橫軸永不相交,呈鐘形曲線。
正態(tài)分布特征正態(tài)曲線84正態(tài)分布特征正態(tài)曲線正態(tài)分布圖示x0.1.2.3.4f(x)正態(tài)分布圖示x0.1.2.3.4f(x)概率密度函數(shù)(PDF)和累積分布函數(shù)(CDF)概率密度函數(shù)(PDF)和累積分布函數(shù)(CDF)正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù)和形狀參數(shù)
峰的位置-位置參數(shù)μ峰的位置-位置參數(shù)μ方差相等、均數(shù)不等的正態(tài)分布圖示312方差相等、均數(shù)不等的正態(tài)分布圖示312206形態(tài)參數(shù)σ89形態(tài)參數(shù)σ均數(shù)相等、方差不等的正態(tài)分布圖示213均數(shù)相等、方差不等的正態(tài)分布圖示213208正態(tài)曲線下面積的分布有一定的規(guī)律。
①正態(tài)曲線與橫軸之間的面積恒等于1或100%;②對(duì)稱分布,對(duì)稱軸兩側(cè)的面積各為50%;③在區(qū)間的面積為68.27%在區(qū)間的面積為95.00%在區(qū)間的面積為99.00%
91正態(tài)曲線下面積的分布有一定的規(guī)律。①正態(tài)曲線與橫軸之間20992正態(tài)曲線下的面積規(guī)律-+15.87%15.87%68.27%正態(tài)曲線下的面積規(guī)律-+15.87%15.87%6-1.96+1.962.5%2.5%95%-1.96+1.962.5%2.5%95%-2.58+2.580.5%0.5%99%-2.58+2.580.5%0.5%99%正態(tài)分布的特征概率密度函數(shù)曲線在均數(shù)處最高以均數(shù)為中心左右對(duì)稱,且逐漸減少正態(tài)分布有兩個(gè)參數(shù),即和曲線下的面積分布有一定規(guī)律正態(tài)分布的特征正態(tài)分布的判斷方法⑴利用頻數(shù)分布表或頻數(shù)分布圖
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人支出月度計(jì)劃表
- 大健康產(chǎn)業(yè)創(chuàng)新發(fā)展模式研究與實(shí)踐
- 鋼平臺(tái)安全施工方案
- 跨部門協(xié)作事務(wù)處理指南與文書(shū)流程
- 汽車后市場(chǎng)智能化服務(wù)解決方案
- 三農(nóng)村電子商務(wù)發(fā)展模式研究方案
- 初級(jí)母嬰護(hù)理師考試復(fù)習(xí)測(cè)試卷
- 婦產(chǎn)科護(hù)理練習(xí)試題及答案(一)
- 法律實(shí)務(wù)案例解析知識(shí)題
- 城市綠化與生態(tài)保護(hù)方案
- 基于單片機(jī)的電子廣告牌設(shè)計(jì)
- 應(yīng)用PDCA管理工具提高病案歸檔率
- 果蔬自發(fā)氣調(diào)包裝原理與應(yīng)用演示文稿
- DB43T 2428-2022 水利工程管理與保護(hù)范圍劃定技術(shù)規(guī)范
- SB/T 11016-2013足部保健按摩服務(wù)規(guī)范
- GB/T 4062-2013三氧化二銻
- 神經(jīng)系統(tǒng)的結(jié)構(gòu)與神經(jīng)調(diào)節(jié)的基本方式 【知識(shí)精講+高效備課】 高考生物一輪復(fù)習(xí) (新教材)
- GB/T 15328-2019普通V帶疲勞試驗(yàn)方法無(wú)扭矩法
- 馬克思主義基本原理(完整版)
- 涉密人員脫密期管理制度
- 企業(yè)風(fēng)險(xiǎn)管理-戰(zhàn)略與績(jī)效整合(中文版)
評(píng)論
0/150
提交評(píng)論