第3講 資料描述性統(tǒng)計(二) 2學時_第1頁
第3講 資料描述性統(tǒng)計(二) 2學時_第2頁
第3講 資料描述性統(tǒng)計(二) 2學時_第3頁
第3講 資料描述性統(tǒng)計(二) 2學時_第4頁
第3講 資料描述性統(tǒng)計(二) 2學時_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

預防系衛(wèi)生統(tǒng)計學教研室劉嶺

Tel:68752343第二章資料描述性統(tǒng)計

DescriptiveStatistics教學內(nèi)容

第一節(jié)相對數(shù)指標第二節(jié)平均數(shù)指標第三節(jié)變異指標教學目的

1.掌握相對數(shù)指標的意義,率與構(gòu)成比的計算及區(qū)別;2.了解頻數(shù)表的編制過程和用途;3.掌握平均數(shù)指標的意義,算數(shù)均數(shù)、幾何均數(shù);4.掌握中位數(shù)、眾數(shù)、百分位數(shù)的計算及應用5.掌握變異指標的意義,四分位數(shù)間距、方差、標準差變異系數(shù)的計算及應用。

第二節(jié)平均數(shù)指標AverageNumber

*4眾數(shù)是指在一群觀察值中,出現(xiàn)頻率最高(即次數(shù)最多)的數(shù)據(jù),用符號Mo表示。(三)眾數(shù)(mode)眾數(shù)主要應用在對小樣本的探索性數(shù)據(jù)進行分析特點:它不受變量數(shù)列極端數(shù)值的影響,但眾值的計算只有在總體單位數(shù)足夠多,而且又具有明顯的集中趨勢時,才有意義。*5將一組變量值按大小順序排列,位次居中的變量值即為中位數(shù)。中位數(shù)將變量值一分為二,一半比它小,一半比它大。符號為M、Md。1.中位數(shù)的計算(四)中位數(shù)(median)(1)小樣本資料中位數(shù)的計算例2-8

先將10個數(shù)據(jù)由小而大排列如下:順序號(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)數(shù)據(jù)值17.318.019.420.621.221.822.523.224.025.5*7下限值L上限值Ui;fm中位數(shù)Md(2)頻數(shù)表上中位數(shù)的計算某市192例健康成人尿汞值

尿汞值(μg/L)(1)組中值x頻數(shù)f(2)

fx累計頻數(shù)(3)0.0-0.2541.0040.5-0.753022.50341.0-1.253746.25711.5-1.7559103.25130962.0-2.252351.751532.5-2.751335.751663.0-3.25826.001743.5-3.75933.751834.0-4.25417.001874.5-4.7514.751885.0-5.2515.251895.5-5.7500.001896.0-6.2516.251906.5-6.7516.751917.0-7.2517.25192合計

-LUMd實例*9計算步驟:⑴計算n/2,作為數(shù)據(jù)按大小排列后居中數(shù)據(jù)的順序號;

n/2=192/2=96;即中位數(shù)為⑵由大至小計算累積頻數(shù),以確定中位數(shù)所在組段;在“1.5-”組段內(nèi)⑶代入公式求中位數(shù);

=1.5+0.5/59(96-71)=1.71(ug/L)式中為中位數(shù)所在組段的下限,為組距,為中位數(shù)所在組段的頻數(shù),為由小至大累積時小于各組段的累積頻數(shù);中位數(shù)的應用與特點適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;

②資料有不確定數(shù)值;③資料分布不明等。特點:由于中位數(shù)總處在居中的位置上,將頻數(shù)等分為二,它不受特大或特小值的影響,僅僅利用了中間的1~2個數(shù)據(jù)均數(shù)、中位數(shù)、眾數(shù)三者關系正態(tài)分布時:均數(shù)=中位數(shù)=眾數(shù)正偏態(tài)分布時:均數(shù)>中位數(shù)>眾數(shù)負偏態(tài)分布時:均數(shù)<中位數(shù)<眾數(shù)*12百分位數(shù)是一種位置指標,它將一組變量值排列后劃分為若干相等部分的分割點數(shù)值。符號為Px,常用的有四分位數(shù)。分割點1分割點2分割點3四分位值1(Q1)四分位值2(Q2)四分位值3(Q3)(五)百分位數(shù)(percentile)*13例如:含量為n的樣本,取第5百分位數(shù)P5,理論上有n×5%的觀察值比P5小,有n×(100-5)%個觀察值比P5大,由此可知百分位數(shù)是一個界值。*14(1)計算n?x%;(2)計算累計頻數(shù);(3)代入公式1.百分位數(shù)的計算*15下限值L上限值Ui;fm百分位數(shù)Px*16實例

計算192例健康成人血鉛值的與。

根據(jù)192×25%=48,192×75%=144,確定與所在組段分別為:“1.0-”和“2.0-”。*17某市110名健康男性工人血紅蛋白量(g/L)百分位數(shù)*182.百分位數(shù)的應用與特點

百分位數(shù)不論資料分布類型均可計算,在實際工作中常用于確定醫(yī)學參考值范圍;在假設檢驗中用作拒絕或不拒絕檢驗假設的界值。百分位數(shù)并非由全部觀察值綜合計算得來,因此,它不如均數(shù)和標準差精確;然而中間部分的百分位數(shù)因不受資料中個別極端數(shù)據(jù)的影響,具有較好的穩(wěn)定性。

調(diào)和平均數(shù)是觀察值倒數(shù)均數(shù)的倒數(shù),又稱為倒數(shù)平均數(shù),符號為H。(六)調(diào)和均數(shù)(harmonicaverage)1、調(diào)和平均數(shù)的計算式中為變量值,為變量值的個數(shù)。用一定劑量的環(huán)己巴比妥使7只大鼠的睡眠持續(xù)時間(min)分別為25、26、30、35、50、55、>120,求調(diào)和均數(shù)。

7只大鼠的睡眠時間為39.2min。實例

調(diào)和均數(shù)可用于明顯正偏態(tài)資料,當數(shù)據(jù)兩端波動大以及計算某些率的平均率時,適宜計算調(diào)和均數(shù)。

2、調(diào)和均數(shù)的應用*22同質(zhì)事物或現(xiàn)象才能求平均數(shù);要根據(jù)數(shù)據(jù)分布類型正確選用平均數(shù);要與下一節(jié)的離散趨勢分析相結(jié)合,以彌補反映不出差異和易受極端值影響的缺陷。

在計算和應用平均數(shù)指標時的注意事項

第三節(jié)變異指標VariationNumber

*24變異指標——又稱離散指標,用以描述一組計量資料各觀察值之間參差不齊的程度。變異指標越大,觀察值之間差異愈大,說明平均數(shù)的代表性就越差;反之亦然。三組同性別、同年齡兒童體重甲組2628303234乙組2427303336丙組2629303124丙組乙組甲組極差(Range)意義:是一批數(shù)據(jù)中最大值與最小值之差,反映了數(shù)據(jù)散布范圍。符號及計算:優(yōu)點:簡便。缺點:①不能反映在該范圍以內(nèi)的其它數(shù)據(jù)的離散度;②各樣本含量大小懸殊時,不宜比較其極差;③極差的抽樣誤差較大,樣本的例數(shù)越多,極差越大,不夠穩(wěn)定。

適用條件:極差僅適用于對未知分布的小樣本資料作粗略的分析。樣本量增大,極差會增大。通常與眾數(shù)結(jié)合使用。極差(Range)四分位數(shù)間距(Quartilerange)意義:包括了全部變量值中居于中間水平的一半數(shù)據(jù)的分布范圍。Q=P25

–P75符號及計算:特點:比較穩(wěn)定,但不能反映其余數(shù)據(jù)的變異情況,沒有充分利用每個變量值的信息。適用條件:四分位數(shù)間距用來描述大樣本偏態(tài)資料的變異情況。通常與中位數(shù)結(jié)合使用。四分位數(shù)間距(Quartilerange)

符號及計算:方差分為樣本方差和總體方差。樣本方差符號為,相應的總體方差符號為。

方差(Variance)意義:樣本觀察值的離均差平方和(sumofsquare,SS)的均值。表示一組數(shù)據(jù)的平均離散情況。方差(Variance)樣本方差為什么要除以(n-1)?數(shù)理統(tǒng)計證明,n代替N后,計算出的樣本方差對總體方差的估計偏小。對于樣本資料,對離均差平方和取平均時分母用n-1代替n。分母為n-1,稱為自由度(degreesoffreedom)指隨機變量能自由取值的個數(shù)。自由度是數(shù)學名詞,在統(tǒng)計學中,n個數(shù)據(jù)如不受任何條件的限制,則n個數(shù)據(jù)可取任意值,稱為有n個自由度。若受到k個條件的限制,就只有(n-k)個自由度了。計算方差時,n個變量值本身有n個自由度。但受到樣本均數(shù)的限制,任何一個“離均差”均可以用另外的(n-1)個“離均差”表示,所以只有(n-1)個獨立的“離均差”。因此只有(n-1)個自由度。

小知識標準差(standarddeviation)意義:標準差即為方差的平方根。其單位與原變量X的單位相同。

符號及計算:樣本標準差符號為s,相應的總體標準差符號為σ頻數(shù)表上計算:三組同性別、同年齡兒童體重甲組2628303234乙組2427303336丙組2629303134丙組乙組甲組方差與標準差的應用方差或標準差屬同類變異指標,它們多用來描述均勻分布或近似正態(tài)分布的資料,大、小樣本均可,其中以標準差的應用最廣,通常與均數(shù)結(jié)合使用。比如在許多醫(yī)學研究報告中常用的形式表達資料。方差與標準差的應用方差是樣本觀察值的離均差平方的平均值,它全面地反映了數(shù)據(jù)的變異大??;方差越大,觀察值與均數(shù)間的差異就越大,數(shù)據(jù)的變異程度就越大,反之亦然;標準差的量綱與原始數(shù)據(jù)一致,適用于對稱分布的資料;標準差保持了方差的優(yōu)點,其單位與觀察值單位一致;在同質(zhì)條件下,當樣本含量逐漸增多時,標準差將趨于相應的總體標準差,故同類事物的標準差常有一定的實用范圍。變異系數(shù)(coefficientofvariation,CV)變異系數(shù)可用于不同類型資料間變異程度的比較,變異系數(shù)也可用于均數(shù)相差懸殊時同單位資料間變異程度的比較,如不同年齡段同性別兒童的體重變異大小比較等。符號及計算:適用條件:均數(shù)標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論