計(jì)量資料的統(tǒng)計(jì)描述課件_第1頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述課件_第2頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述課件_第3頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述課件_第4頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章數(shù)值變量資料的統(tǒng)計(jì)分析

DescriptiveStatistics計(jì)量資料的統(tǒng)計(jì)描述

統(tǒng)計(jì)描述統(tǒng)計(jì)分析統(tǒng)計(jì)推斷2024/12/62計(jì)量資料的統(tǒng)計(jì)描述【例7-1】某地用隨機(jī)抽樣的方法對(duì)130名健康成年男性紅細(xì)胞數(shù)進(jìn)行了檢測(cè),資料如表1,請(qǐng)描述男性紅細(xì)胞的情況。2024/12/63計(jì)量資料的統(tǒng)計(jì)描述表1某地130名正常成年男子紅細(xì)胞數(shù)(1012/L)3.79*4.575.194.864.284.675.374.984.455.88*4.535.164.844.154.665.314.974.434.774.785.14.834.114.635.284.944.44.745.675.054.813.984.615.234.94.354.75.465.034.493.894.575.214.874.294.675.384.984.464.784.545.164.854.174.665.324.974.434.775.075.134.834.134.645.294.954.424.745.694.534.814.014.625.264.914.364.735.495.044.783.944.575.234.94.314.685.394.994.485.084.545.174.864.274.665.364.984.434.774.535.154.844.134.645.294.964.424.755.694.84.824.14.625.264.934.394.745.615.045.13.984.585.234.94.334.685.454.494.82024/12/64計(jì)量資料的統(tǒng)計(jì)描述問題??表1的130個(gè)數(shù)據(jù),無論多認(rèn)真審視,也說不清這些人紅細(xì)胞的情況怎樣、特征如何。你應(yīng)該如何著手整理,整理的目的是什么?結(jié)合學(xué)過的知識(shí),你認(rèn)為用什么方式描述這份資料能讓人對(duì)資料內(nèi)容一目了然?統(tǒng)計(jì)描述就是解決此問題的方法,即用統(tǒng)計(jì)表、統(tǒng)計(jì)圖和統(tǒng)計(jì)指標(biāo)來描述樣本數(shù)據(jù)的特征2024/12/65計(jì)量資料的統(tǒng)計(jì)描述第一節(jié)計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表與頻數(shù)分布平均指標(biāo)(算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù))變異指標(biāo)(極差、百分位數(shù)與四分位間距、方差、標(biāo)準(zhǔn)差、變異系數(shù))2024/12/66計(jì)量資料的統(tǒng)計(jì)描述一、頻數(shù)表與頻數(shù)分布

(frequencytableandfrequencydistribution)

頻數(shù)(frequency):變量值出現(xiàn)的次數(shù),即例數(shù)

頻數(shù)表(frequencydistributiontable):反映變量值與頻數(shù)之間關(guān)系的統(tǒng)計(jì)表2024/12/67計(jì)量資料的統(tǒng)計(jì)描述表1某地130名正常成年男子紅細(xì)胞數(shù)(1012/L)3.79*4.575.194.864.284.675.374.984.455.88*4.535.164.844.154.665.314.974.434.774.785.14.834.114.635.284.944.44.745.675.054.813.984.615.234.94.354.75.465.034.493.894.575.214.874.294.675.384.984.464.784.545.164.854.174.665.324.974.434.775.075.134.834.134.645.294.954.424.745.694.534.814.014.625.264.914.364.735.495.044.783.944.575.234.94.314.685.394.994.485.084.545.174.864.274.665.364.984.434.774.535.154.844.134.645.294.964.424.755.694.84.824.14.625.264.934.394.745.615.045.13.984.585.234.94.334.685.454.494.82024/12/68計(jì)量資料的統(tǒng)計(jì)描述1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)。(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。2024/12/69計(jì)量資料的統(tǒng)計(jì)描述622.8130合計(jì)5.85.81–5.7~5.922.45.645.5~48.65.49正5.3~88.45.217正正正5.1~1055.021正正正正–4.9~1204.825正正正正正4.7~101.24.622正正正正4.5~70.44.416正正正–4.3~37.84.29正4.1~16.04.043.9~7.23.82

3.7~fX(5)=(3)×(4)

組中值,X(4)

頻數(shù),f(3)

劃記(2)

組段(1)表2某地130名正常成年男子紅細(xì)胞數(shù)頻數(shù)分布2024/12/610計(jì)量資料的統(tǒng)計(jì)描述2024/12/611計(jì)量資料的統(tǒng)計(jì)描述2.頻數(shù)表的分布特征①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~4.9”。

——平均水平指標(biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。本例4.3~5.1,共有101人,占77.7%;離“中心”位置越遠(yuǎn),頻數(shù)越小;且圍繞“中心”左右對(duì)稱?!儺愃街笜?biāo)2024/12/612計(jì)量資料的統(tǒng)計(jì)描述二、平均指標(biāo)總稱為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency

)。常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

2024/12/613計(jì)量資料的統(tǒng)計(jì)描述1.均數(shù)(mean)Σ為求和符號(hào),讀成sigma適用條件:資料呈正態(tài)或近似正態(tài)。(1)直接法(2)加權(quán)法(頻數(shù)表法)基本思想:以組中值代表組內(nèi)的變量值(近似法),簡(jiǎn)化計(jì)算2024/12/614計(jì)量資料的統(tǒng)計(jì)描述紅細(xì)胞數(shù)(1)組中值X(2)頻數(shù)f(3)fXi(4)=(2)(3)fXi2(5)=(2)(4)3.70~3.8027.6028.883.90~4.00416.0064.004.10~4.20937.80158.764.30~4.401670.40309.764.50~4.6022101.20465.224.70~4.8025120.00576.004.90~5.0021105.00525.005.10~5.201788.40459.685.30~5.40948.60262.445.50~5.60422.40125.445.70~5.905.8015.8033.64合計(jì)-130623.03009.12表2某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)的均數(shù)和標(biāo)準(zhǔn)差的加權(quán)計(jì)算均數(shù)=623.0/130=4.7942024/12/615計(jì)量資料的統(tǒng)計(jì)描述2.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。2024/12/616計(jì)量資料的統(tǒng)計(jì)描述幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)2024/12/617計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:2.5

1:101:401:1601:640

合計(jì)141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.10322024/12/618計(jì)量資料的統(tǒng)計(jì)描述3.中位數(shù)(median)

百分位數(shù)(percentile)中位數(shù):一組觀察值按大小順序排列,位置居中的那個(gè)數(shù)值稱為中位數(shù),記為M。百分位數(shù):一組數(shù)據(jù)從小到大排列,并分成100等份,第x等份之分割位置的數(shù)值稱為第x百分位數(shù),記為Px

例如:x=50,記為P50,讀作“第五十百分位數(shù)”(即中位數(shù))2024/12/619計(jì)量資料的統(tǒng)計(jì)描述

適用情形:適用于任意分布,常用于

①偏態(tài)分布(如發(fā)汞、尿鉛);

②一端或兩端無確定數(shù)值;

③分布情況不明。2024/12/620計(jì)量資料的統(tǒng)計(jì)描述

常用百分位數(shù):P50,P25,P75,,P5,P95,P2.5,P97.5怎樣求解中位數(shù)和百分位數(shù)?2024/12/621計(jì)量資料的統(tǒng)計(jì)描述(1)中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)2024/12/622計(jì)量資料的統(tǒng)計(jì)描述例題某患病者5人的潛伏期分別為2,3,4,5,3天,求其中位數(shù)?若再加一名患者,其潛伏期為9天,又如何計(jì)算?2024/12/623計(jì)量資料的統(tǒng)計(jì)描述(2)中位數(shù)和百分位數(shù)的頻數(shù)表法:

L為百分位數(shù)對(duì)應(yīng)組段的下限值,i為該組段的組距,fx為該組段頻數(shù),

fL為前一組累計(jì)頻數(shù)2024/12/624計(jì)量資料的統(tǒng)計(jì)描述紅細(xì)胞數(shù)(1)頻數(shù)f(3)累計(jì)頻數(shù)(4)累計(jì)百分率(5)3.70~221.5(0.0~1.5)3.90~464.6(1.5-4.6)4.10~91511.5(4.6-11.5)4.30~163123.8(11.5-23.8)4.50~225340.8(23.8-40.8)4.70~257860.0(40.8-60.0)4.90~219976.2(60.0-76.2)5.10~1711689.2(76.2-89.2)5.30~912596.2(89.2-96.2)5.50~412999.2(96.2-99.2)5.70~5.901130100(99.2-100.0)合計(jì)130--表2某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)中位數(shù)的加權(quán)計(jì)算中位數(shù)=4.7+0.2x[(130x50%-53)/25]=4.7962024/12/625計(jì)量資料的統(tǒng)計(jì)描述例題某校70例急性食物中毒患者潛伏期見下表,求急性食物中毒的平均潛伏期?該資料能否計(jì)算均數(shù)、幾何均數(shù),為什么?2024/12/626計(jì)量資料的統(tǒng)計(jì)描述潛伏期(天)人數(shù)累計(jì)頻數(shù)累計(jì)頻率%0~11~72~323~114~115~46~27~18~1合計(jì)702024/12/627計(jì)量資料的統(tǒng)計(jì)描述均數(shù)、中位數(shù)的關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)2024/12/628計(jì)量資料的統(tǒng)計(jì)描述三、變異(variation)指標(biāo)

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距(PercentileandQuartilerange)

3.方差

(Variance)

4.標(biāo)準(zhǔn)差(StandardDeviation)

5.變異系數(shù)(CoefficientofVariation)

2024/12/629計(jì)量資料的統(tǒng)計(jì)描述盤編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬/mm3)甲乙丙2024/12/630計(jì)量資料的統(tǒng)計(jì)描述1.極差(Range)(全距)優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)極端值2.n大,R也會(huì)大3.不穩(wěn)定12040202024/12/631計(jì)量資料的統(tǒng)計(jì)描述2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px2024/12/632計(jì)量資料的統(tǒng)計(jì)描述(2)中位數(shù)和百分位數(shù)的頻數(shù)表法:

L為百分位數(shù)對(duì)應(yīng)組段的下限值,i為該組段的組距,fx為該組段頻數(shù),

fL為前一組累計(jì)頻數(shù)2024/12/633計(jì)量資料的統(tǒng)計(jì)描述紅細(xì)胞數(shù)(1)頻數(shù)f(3)累計(jì)頻數(shù)(4)累計(jì)百分率(5)3.70~221.5(0.0~1.5)3.90~464.6(1.5-4.6)4.10~91511.5(4.6-11.5)4.30~163123.8(11.5-23.8)4.50~225340.8(23.8-40.8)4.70~257860.0(40.8-60.0)4.90~219976.2(60.0-76.2)5.10~1711689.2(76.2-89.2)5.30~912596.2(89.2-96.2)5.50~412999.2(96.2-99.2)5.70~5.901130100(99.2-100.0)合計(jì)130--表2某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)中位數(shù)的加權(quán)計(jì)算P25=4.5+0.2x[(130x25%-31)/22]=4.51P75=4.9+0.2x[(130x75%-78)/21]=5.09QR=5.09-4.51=0.582024/12/634計(jì)量資料的統(tǒng)計(jì)描述潛伏期(天)人數(shù)累計(jì)頻數(shù)累計(jì)頻率%0~11~72~323~114~115~46~27~18~1合計(jì)702024/12/635計(jì)量資料的統(tǒng)計(jì)描述百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍

(referencerange)

如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征2024/12/636計(jì)量資料的統(tǒng)計(jì)描述3.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。2024/12/637計(jì)量資料的統(tǒng)計(jì)描述4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。2024/12/638計(jì)量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的計(jì)算盤編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500標(biāo)準(zhǔn)差50.9915.817.912024/12/639計(jì)量資料的統(tǒng)計(jì)描述紅細(xì)胞數(shù)(1)組中值X(2)頻數(shù)f(3)fiXi(4)=(2)(3)fiXi2(5)=(2)(4)3.70~3.8027.6028.883.90~4.00416.0064.004.10~4.20937.80158.764.30~4.401670.40309.764.50~4.6022101.20465.524.70~4.8025120.00576.004.90~5.0021105.00525.005.10~5.201788.40459.685.30~5.40948.60262.445.50~5.60422.40125.445.70~5.905.8015.8033.64合計(jì)-130623.03009.12表2某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)的均數(shù)和標(biāo)準(zhǔn)差的加權(quán)計(jì)算2024/12/640計(jì)量資料的統(tǒng)計(jì)描述5.變異系數(shù)(coefficientofvariation,CV)適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%2024/12/641計(jì)量資料的統(tǒng)計(jì)描述【例】

某地40名7歲兒童身高均數(shù)為121.48cm,標(biāo)準(zhǔn)差為4.65cm;體重均數(shù)為22.18kg,標(biāo)準(zhǔn)差2.35kg。試比較其身高和體重的變異程度。身高CV=3.83%,體重CV=10.60%2024/12/642計(jì)量資料

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論