計(jì)量資料的統(tǒng)計(jì)描述(2.18)_第1頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述(2.18)_第2頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述(2.18)_第3頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述(2.18)_第4頁(yè)
計(jì)量資料的統(tǒng)計(jì)描述(2.18)_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(計(jì)量資料)

email

統(tǒng)計(jì)描述

DescriptiveStatistics

162名健康男性血清總膽固醇(mmol/L)5.534.345.603.554.133.934.204.354.314.815.804.084.904.923.946.344.894.163.054.504.483.624.523.974.114.375.264.982.725.393.753.704.943.906.104.564.394.093.764.824.694.024.543.785.334.444.534.503.794.284.534.555.204.495.574.214.884.444.964.704.574.454.333.534.844.103.845.114.455.654.475.014.214.563.894.734.865.104.675.403.224.983.524.113.823.595.024.665.235.054.234.684.905.004.752.964.744.354.714.855.254.255.144.293.394.723.435.085.174.965.214.276.124.915.434.934.874.464.264.764.694.795.224.614.784.244.514.714.563.864.455.294.504.724.004.544.205.305.185.734.974.665.494.375.344.683.664.385.414.535.074.784.694.715.035.375.685.835.934.626.015.77計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表與頻數(shù)分布描述幾種趨勢(shì)的指標(biāo)

算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)描述變異程度的指標(biāo)極差、百分位數(shù)與四分位間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)

頻數(shù)

(frequency)

某個(gè)測(cè)量值的個(gè)(例)數(shù)。

頻數(shù)分布表(frequencydistributiontable):

又稱頻數(shù)表。是將原始數(shù)據(jù)值適當(dāng)分組后得到各組的頻數(shù),

用于描述資料的分布特征,適用樣本量較大的資料進(jìn)行統(tǒng)計(jì)描述的常用方法。通過頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)。一、頻數(shù)與頻數(shù)分布

離散型定量變量的頻數(shù)分布

例1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7等共96個(gè)數(shù)值.96名婦女產(chǎn)前檢查次數(shù)分布的頻數(shù)分布表表

1998年某地96名婦女產(chǎn)前檢查次數(shù)分布檢查次數(shù)頻數(shù)頻率(%)累計(jì)人數(shù)累計(jì)頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合計(jì)96100

連續(xù)型定量變量的頻數(shù)分布

抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),將數(shù)據(jù)適當(dāng)分組,計(jì)數(shù)每組的頻數(shù),根據(jù)這些數(shù)據(jù)編制成的頻數(shù)分布表,則能顯示出這組數(shù)據(jù)分布的特點(diǎn)。160名正常成年女子的血清甘油三酯(mmol/L)

編號(hào)血清甘油三脂編號(hào)血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77手工編制表步驟。(1)計(jì)算全距(range,R),也稱為極

R=最大值-最小值本例極差:R=1.77-0.51=1.26(mmol/L)(2)確定組段數(shù)與組距:組段數(shù)一般可在10~15之間選擇組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=1.26/10=0.126≈0.1。(3)列表做出表格,將選好的組段順序地列在(1)列。按照“下限≤x<上限”的原則確定每一例數(shù)據(jù)x應(yīng)歸屬的組段。(4)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(5)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。

組段(1)

劃記(2)

頻數(shù),f(3)

組中值,X(4)fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5512.401.6~正81.6514.851.7~1.8

合計(jì)

31.755.25160182.30頻數(shù)分布圖:在表的基礎(chǔ)上,可以繪制出圖稱為直方圖(頻率直方圖)。

橫軸:血清甘油三酯

縱軸:頻率密度,即頻率/組距(直條面積等于相應(yīng)組段的頻率)。在組距相等時(shí),直方圖中矩形直條的高度與相應(yīng)組段的頻率成正比。對(duì)稱分布:頻數(shù)最多的組段在中央,正偏峰分布:峰向左側(cè)偏移的分布,右側(cè)的組段數(shù)多于左側(cè),為右偏峰分布。負(fù)偏峰分布:峰向右側(cè)偏移的分布,左側(cè)的組段數(shù)多于右側(cè),稱為左偏峰分布。正態(tài)分布與偏態(tài)分布1.頻數(shù)表——正態(tài)分布normaldistribution

2.頻數(shù)表——右偏態(tài)(skewedtotheright),也稱正偏態(tài)(positiveskewed)

3.頻數(shù)表——左偏態(tài)(skewedtotheleft),也稱負(fù)偏態(tài)(negativeskewed)正態(tài)分布:中間高、兩邊低、左右對(duì)稱正偏態(tài)分布:長(zhǎng)尾向右延伸負(fù)偏態(tài)分布:長(zhǎng)尾向左延伸頻數(shù)分布①集中趨勢(shì)(centraltendency):變量值集中位置?!骄街笜?biāo)②離散趨勢(shì)(tendency

of

dispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越小;且圍繞“中心”左右對(duì)稱。——變異水平指標(biāo)

頻數(shù)表的用途1.揭示頻數(shù)分布的類型和特征;分布類型:對(duì)稱分布(正態(tài))偏態(tài)分布分布特征:中心位置分布范圍對(duì)稱性變動(dòng)趨勢(shì)2.便于進(jìn)一步計(jì)算指標(biāo)和分析處理;3.發(fā)現(xiàn)某些特大特小的可疑值;

4.進(jìn)行正態(tài)性判定等集中趨勢(shì)指標(biāo)

總稱為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency

)。

常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)

(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

4.眾數(shù)(mode)1.均數(shù)(mean)Σ為求和符號(hào),讀成sigma適用條件:資料呈正態(tài)或近似正態(tài)。

組段(1)

劃記(2)

頻數(shù),f(3)

組中值,X(4)fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5513.951.6~正81.6513.201.7~1.8

合計(jì)

31.755.25160182.30例:均數(shù)=182.3/160=1.142.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

例:血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:2.5

1:101:401:1601:640

合計(jì)141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.1032例:幾何均數(shù)=反對(duì)數(shù)(102.1/72)=26.193.中位數(shù)(median)

中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號(hào)為Md,反映一批觀察值在位次上的平均水平。

適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)例:9名病人潛伏期:2,3,3,3,4,5,6,9,16頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md

組段(1)

劃記(2)

頻數(shù),f(3)

累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8

合計(jì)

3160100.0(98.1~100)160中位數(shù)=1.1+0.1x[(160x50%-72)/20]

=1.14微克/毫升4.眾數(shù)(mode)

出現(xiàn)次數(shù)(或頻數(shù))最多的觀察值;在頻數(shù)分布圖中對(duì)應(yīng)于高峰所在位置的觀察值。適用于大樣本;較粗糙。從分布的角度看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的變量值即為眾數(shù)。如果數(shù)據(jù)的分布沒有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)也可以不存在;如果有多個(gè)高峰點(diǎn),也就有多個(gè)眾數(shù)特點(diǎn):1.集中趨勢(shì)的測(cè)度值之一;2.出現(xiàn)次數(shù)最多的變量值;3.不受極端值的影響;4.可能沒有眾數(shù)或有幾個(gè)眾數(shù);5.適用于定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)。眾數(shù)的不唯一性:無(wú)眾數(shù)原始數(shù)據(jù):10591268一個(gè)眾數(shù)原始數(shù)據(jù):659855多于一個(gè)眾數(shù)原始數(shù)據(jù):252828364242均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)=眾數(shù)右偏態(tài)分布時(shí):均數(shù)>中位數(shù)>眾數(shù)左偏態(tài)分布時(shí):均數(shù)<中位數(shù)<眾數(shù)三、變異(variation)指標(biāo)

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

盤編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬(wàn)/mm3)甲乙丙1.極差(Range)(全距)優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定12040202.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px

組段(1)

劃記(2)

頻數(shù),f(3)

累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8

合計(jì)

3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36QR=1.36-0.92=0.44;QD=0.22百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征3.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。樣本方差為什么要除以(n-1)小樣本分母為n-1,稱為自由度。4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。標(biāo)準(zhǔn)差的計(jì)算盤編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500標(biāo)準(zhǔn)差50.9915.817.91()155/25001222甲的標(biāo)準(zhǔn)差--=--=??nnXX

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論