數值變量資料的統(tǒng)計分析變異程的描述_第1頁
數值變量資料的統(tǒng)計分析變異程的描述_第2頁
數值變量資料的統(tǒng)計分析變異程的描述_第3頁
數值變量資料的統(tǒng)計分析變異程的描述_第4頁
數值變量資料的統(tǒng)計分析變異程的描述_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

離散趨勢(dispersiontendency)指標三組同年齡、同性別兒童的體重(kg)

甲組2628303234乙組2427303336丙組2629303134

303030當前第1頁\共有28頁\編于星期四\18點標準差的意義

標準差是表示一組觀察者離散程度或變異程度的統(tǒng)計指標;描述一個變量的所有觀察值與均數的平均離散程度的指標。

當前第2頁\共有28頁\編于星期四\18點

全距表示一群變量值的最大值與最小值之差,反映個體差異的范圍,用R表示。全距大,說明變異度大;反之,說明變異度小。甲組2628303234

乙組2427303336R=8R=12一、全距(range)當前第3頁\共有28頁\編于星期四\18點1.不能全面反映資料的離散程度;2.不穩(wěn)定,易受極端值的影響,抽樣誤差大。優(yōu)點缺點1.表示變異范圍,簡單明了、容易使用,如用于說明傳染病、食物中毒等的最短、最長潛伏期等;2.各種分布類型的資料均可用。全距(range)當前第4頁\共有28頁\編于星期四\18點二、四分位數間距(quartileinterval)

四分位數間距是上四分位數(QU=P75)和下四分位數(QL=P25)之差,用Q表示(QU-QL)。該數值越大,說明變異度越大;反之,說明變異度越小。當前第5頁\共有28頁\編于星期四\18點某地630名正常女性血清甘油三脂含量(mg/dl)當前第6頁\共有28頁\編于星期四\18點L:組段的下限;iM:組距;fx:頻數;

fL:Px所在組段之前的累積頻數。

當前第7頁\共有28頁\編于星期四\18點1.與中位數配套,用于偏態(tài)分布資料及分布的一端或兩端無確切數值的資料;2.比全距穩(wěn)定。未考慮到每個觀察值的變異度。優(yōu)點缺點

四分位數間距(quartileinterval)當前第8頁\共有28頁\編于星期四\18點

三、平均差距指標(一)平均偏差(MeanDifference)

甲班:

乙班:

特點:直觀,易理解;但由于用了絕對值,不便于數學處理,實際中很少使用。

當前第9頁\共有28頁\編于星期四\18點(二)離均差平方和(SumofSquare,SS)

為了克服平均偏差的缺點,可以不通過取絕對值,而是通過取平方來避免正負抵消,即使用離均差平方和,其計算公式為

SS通常作為一個中間統(tǒng)計量使用。當前第10頁\共有28頁\編于星期四\18點(三)方差(Variance)方差是將離均差平方和再取平均,即

注意:對于樣本資料,分母用的是n-1,稱為自由度(degreeoffreedom,df)。方差的特點:便于數學上的處理,但由于有平方,度量衡發(fā)生變化,不便于實際應用。當前第11頁\共有28頁\編于星期四\18點方差(variance)自由度=n-限制條件的個數,用ν表示。(n-1):當選定時,n個變量值中能自由變動的變量值的個數。當前第12頁\共有28頁\編于星期四\18點

方差越大,資料的離散程度越大(全面考慮了每個觀察值);不受觀察值個數的影響。優(yōu)點缺點

一些資料不適用于以平方表示。方差(variance)當前第13頁\共有28頁\編于星期四\18點

四、標準差(StandardDeviation)

將方差取平方根,還原成與原始觀察值單位相同的變異量度即為標準差:

例如對于例3.1經計算有甲患者:

同理乙患者:當前第14頁\共有28頁\編于星期四\18點例三組同年齡、同性別兒童的體重(kg)甲組2628303234乙組2427303336丙組2629303134標準差直接法當前第15頁\共有28頁\編于星期四\18點標準差加權法當前第16頁\共有28頁\編于星期四\18點當前第17頁\共有28頁\編于星期四\18點標準差應用1.表示觀察值分布的離散程度。均數相近、度量單位相同的條件下,S越大,觀察值的變異程度越大,均數的代表性越差。2.結合均數計算CV。3.結合均數描述正態(tài)分布資料的分布特征和估計醫(yī)學參考值范圍4.結合樣本含量計算標準誤。當前第18頁\共有28頁\編于星期四\18點

五、變異系數(CoefficientofVariation

)

主要用于對均數相差較大或單位不同的幾組觀察值的變異程度進行比較。例3.3測得某地成年人舒張壓均數為77.5mmHg,標準差為10.7mmHg;收縮壓均數為122.9mmHg,標準差為17.1mmHg。試比較舒張壓和收縮壓的變異程度。當前第19頁\共有28頁\編于星期四\18點變異系數

Coefficientofvariation(CV)應用1.表示數據分布的相對離散程度2.比較均數相差懸殊的兩組或多組資料的離散程度3.比較度量衡單位不同的兩組或多組資料的變異程度當前第20頁\共有28頁\編于星期四\18點

某地20歲男子160人,身高均數為166.06cm,標準差為4.95cm;體重均數為53.72kg,標準差為4.96kg。比較身高與體重的變異程度。20歲男子體重的變異程度比身高的變異程度大。當前第21頁\共有28頁\編于星期四\18點

某地不同年齡女童的身高(cm)資料如下表所示。試比較不同年齡身高的變異程度。某地不同年齡女童身高的變異程度年齡組人數均數標準差CV(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.1當前第22頁\共有28頁\編于星期四\18點小結全距與四分位數間距:后者較穩(wěn)定,但均不能綜合反映各觀察值的變異程度。標準差:最為常用,對正態(tài)分布尤為重要變異系數:可用于多組資料間度量衡單位不同或均數相差懸殊時作變異度的比較。以上指標都是數值越小,說明觀察值的變異度越小,均數的代表性越好。平均指標和變異指標常配套使用

如正態(tài)分布:均數、標準差;偏態(tài)分布:中位數、四分位間距當前第23頁\共有28頁\編于星期四\18點練習:

某市1974年為了解該地居民發(fā)汞的基礎水平,為汞污染的環(huán)境監(jiān)測積累資料,調查了留住該市一年以上,無明顯肝、腎疾病,無汞作業(yè)接觸史的居民238人的發(fā)汞含量(μmol/kg)如下:

用何種指標說明本資料的集中位置和變異程度較好?并計算之。發(fā)汞值1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~人數2066604818166103當前第24頁\共有28頁\編于星期四\18點

某檢驗師測定了10名正常成年鋼鐵工人的血紅蛋白值(g/dl)和紅細胞數(萬/mm3)如下,試比較這兩個檢測項目的結果哪個變異性大?血紅蛋白(g/dL)13.013.614.014.514.614.715.215.515.816.0血細胞數(萬/mm3)510515517518520522524525528530當前第25頁\共有28頁\編于星期四\18點當前第26頁\共有28頁\編于星期四\18點小結1.描述一組觀察

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論