變異程度的統(tǒng)計描述課件_第1頁
變異程度的統(tǒng)計描述課件_第2頁
變異程度的統(tǒng)計描述課件_第3頁
變異程度的統(tǒng)計描述課件_第4頁
變異程度的統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

變異程度的統(tǒng)計描述(MeasuresofDispersion

)離散趨勢(dispersiontendency)指標(biāo)三組同年齡、同性別兒童的體重(kg)

甲組2628303234

乙組2427303336

丙組2629303134

303030

全距表示一群變量值的最大值與最小值之差,反映個體差異的范圍,用R表示。全距大,說明變異度大;反之,說明變異度小。甲組2628303234

乙組2427303336R=8R=12全距(range)1.不能全面反映資料的離散程度;2.不穩(wěn)定,易受極端值的影響,抽樣誤差大。優(yōu)點缺點1.表示變異范圍,簡單明了、容易使用,如用于說明傳染病、食物中毒等的最短、最長潛伏期等;2.各種分布類型的資料均可用。全距(range)四分位數(shù)間距(quartileinterval)

四分位數(shù)間距是上四分位數(shù)(QU=P75)和下四分位數(shù)(QL=P25)之差,用Q表示(QU-QL)。該數(shù)值越大,說明變異度越大;反之,說明變異度越小。某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數(shù)累計頻數(shù)累計頻率(%)0.10~27274.30.40~16919631.10.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0合計630--L:組段的下限;iM:組距;fx:頻數(shù);

fL:Px所在組段之前的累積頻數(shù)。

1.與中位數(shù)配套,用于偏態(tài)分布資料及分布的一端或兩端無確切數(shù)值的資料;2.比全距穩(wěn)定。未考慮到每個觀察值的變異度。優(yōu)點缺點

四分位數(shù)間距(quartileinterval)方差(variance)自由度=n-限制條件的個數(shù),用ν表示。(n-1):當(dāng)選定時,n個變量值中能自由變動的變量值的個數(shù)。二、平均差距指標(biāo)(一)平均偏差(MeanDifference)

如對于例3.1:甲患者:

乙患者:

特點:直觀,易理解;但由于用了絕對值,不便于數(shù)學(xué)處理,實際中很少使用。

(二)離均差平方和(SumofSquare,SS)

為了克服平均偏差的缺點,可以不通過取絕對值,而是通過取平方來避免正負(fù)抵消,即使用離均差平方和,其計算公式為

SS通常作為一個中間統(tǒng)計量使用。(三)方差(Variance)

方差是將離均差平方和再取平均,即

注意:對于樣本資料,分母用的是n-1,稱為自由度(degreeoffreedom,df)。方差的特點:便于數(shù)學(xué)上的處理,但由于有平方,度量衡發(fā)生變化,不便于實際應(yīng)用。

方差越大,資料的離散程度越大(全面考慮了每個觀察值);不受觀察值個數(shù)的影響。優(yōu)點缺點

一些資料不適用于以平方表示。方差(variance)(四)標(biāo)準(zhǔn)差

(StandardDeviation)

將方差取平方根,還原成與原始觀察值單位相同的變異量度即為標(biāo)準(zhǔn)差:

例如對于例3.1經(jīng)計算有甲患者:

同理乙患者:例三組同年齡、同性別兒童的體重(kg)甲組2628303234乙組2427303336丙組2629303134標(biāo)準(zhǔn)差直接法標(biāo)準(zhǔn)差加權(quán)法14歲女孩身高平均值與標(biāo)準(zhǔn)差(cm)加權(quán)法計算用表身高(cm)頻數(shù)(fi)組中值(X)fiXifiXi2124~212625231752128~313039050700132~111341474197516136~221383036418968140~391425538786396144~271463942575532148~161502400360000152~5154770118580156~315847474892160~164216232452488合計130(Σfi)18600(ΣfiXi)2666824(ΣfiXi2)標(biāo)準(zhǔn)差應(yīng)用1.表示觀察值分布的離散程度。均數(shù)相近、度量單位相同的條件下,S越大,觀察值的變異程度越大,均數(shù)的代表性越差。2.結(jié)合均數(shù)計算CV。3.結(jié)合均數(shù)描述正態(tài)分布資料的分布特征和估計醫(yī)學(xué)參考值范圍4.結(jié)合樣本含量計算標(biāo)準(zhǔn)誤。(五)變異系數(shù)(CoefficientofVariation

)

主要用于對均數(shù)相差較大或單位不同的幾組觀察值的變異程度進(jìn)行比較。例3.3測得某地成年人舒張壓均數(shù)為77.5mmHg,標(biāo)準(zhǔn)差為10.7mmHg;收縮壓均數(shù)為122.9mmHg,標(biāo)準(zhǔn)差為17.1mmHg。試比較舒張壓和收縮壓的變異程度。變異系數(shù)

Coefficientofvariation(CV)應(yīng)用1.表示數(shù)據(jù)分布的相對離散程度2.比較均數(shù)相差懸殊的兩組或多組資料的離散程度3.比較度量衡單位不同的兩組或多組資料的變異程度

某地20歲男子160人,身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg。比較身高與體重的變異程度。20歲男子體重的變異程度比身高的變異程度大。

某地不同年齡女童的身高(cm)資料如下表所示。試比較不同年齡身高的變異程度。某地不同年齡女童身高的變異程度年齡組人數(shù)均數(shù)標(biāo)準(zhǔn)差CV(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.1小結(jié)全距與四分位數(shù)間距:后者較穩(wěn)定,但均不能綜合反映各觀察值的變異程度。標(biāo)準(zhǔn)差:最為常用,對正態(tài)分布尤為重要變異系數(shù):可用于多組資料間度量衡單位不同或均數(shù)相差懸殊時作變異度的比較。以上指標(biāo)都是數(shù)值越小,說明觀察值的變異度越小,均數(shù)的代表性越好。平均指標(biāo)和變異指標(biāo)常配套使用

如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;偏態(tài)分布:中位數(shù)、四分位間距練習(xí):

某市1974年為了解該地居民發(fā)汞的基礎(chǔ)水平,為汞污染的環(huán)境監(jiān)測積累資料,調(diào)查了留住該市一年以上,無明顯肝、腎疾病,無汞作業(yè)接觸史的居民238人的發(fā)汞含量(μmol/kg)如下:

用何種指標(biāo)說明本資料的集中位置和變異程度較好?并計算之。

發(fā)汞值1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~人數(shù)2066604818166103

某檢驗師測定了10名正常成年鋼鐵工人的血紅蛋白值(g/dl)和紅細(xì)胞數(shù)(萬/mm3)如下,試比較這兩個檢測項目的結(jié)果哪個變異性大?血紅蛋白(g/dL)13.013.614.014.514.614.715.215.515.816.0血細(xì)胞數(shù)(萬/mm3)510515517518520522524525528530238名正常人發(fā)汞值(μg/g)的頻數(shù)表發(fā)汞值頻數(shù)累計頻數(shù)累計頻率(%)0.3~20208.40.7~668636.11.1~6014661.31.5~4819481.51.9~1821289.12.3~1622895.82.7~623498.33.1~123598.73.5~023598.73.9~4.33238100.0正態(tài)分布和醫(yī)學(xué)參考值范圍要求:掌握:正態(tài)分布及其特征,正態(tài)曲線下面積分布的規(guī)律。熟悉:醫(yī)學(xué)參考值范圍,參考值范圍估計的步驟,參考值范圍估計的正態(tài)分布法和百分位數(shù)法。標(biāo)準(zhǔn)正態(tài)分布。了解:參考值范圍估計的對數(shù)正態(tài)分布法。圖3-1某地成年男子紅細(xì)胞數(shù)的分布逐漸接近正態(tài)分布示意圖一、正態(tài)分布(NormalDistribution)正態(tài)分布曲線:高峰位于中央,兩側(cè)逐漸下降、低平,左右完全對稱、兩端不與橫軸相交的鐘型曲線。正態(tài)分布:以均數(shù)為中心,中間多,兩側(cè)呈對稱性逐漸減少的鐘型分布。正態(tài)分布的密度函數(shù)f(x)為:

由上式可見,正態(tài)分布的圖形由

所決定,X~N(

,

2)主要特征:

1.以為中心的對稱分布

2.鐘型曲線

3.曲線下面積分布有規(guī)律

4.兩個參數(shù)決定位置和變異

圖3-2正態(tài)分布曲線下的面積

圖3-3三種不同均值的正態(tài)分布圖3-4三種不同標(biāo)準(zhǔn)差的正態(tài)分布正態(tài)曲線下的面積F(x)的計算:標(biāo)準(zhǔn)正態(tài)變換(u變換)u為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差u變換的特點:若X服從正態(tài)分布,則u服從標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布:指均數(shù)為0、標(biāo)準(zhǔn)差為1的正態(tài)分布,記為N(0,1)二、標(biāo)準(zhǔn)正態(tài)分布

(StandardNormalDistribution)表中曲線下面積為-~u的面積;即P(u)可以利用標(biāo)準(zhǔn)正態(tài)分布表求出與原始變量X有關(guān)的概率值。1.標(biāo)準(zhǔn)正態(tài)分布:求曲線下(u1,u2)范圍內(nèi)的面積。

u≤0:①查表,分別求從-∞到u2與從-∞到u1的面積;

②兩者之差為所求面積。u2u1u1u2例:u1=-1.50,u2=-0.31則(-1.50,-0.31)范圍內(nèi)的面積(2)u>0:利用正態(tài)分布的對稱性求曲線下從-∞到u范圍的面積。例:從-∞到u=1.76范圍內(nèi)的面積。1.76-1.760.03921-0.0392=0.96080.03922.非標(biāo)準(zhǔn)正態(tài)分布:求曲線下任意(x1,x2)范圍內(nèi)的面積。先作標(biāo)準(zhǔn)正態(tài)變換;再查標(biāo)準(zhǔn)正態(tài)分布表求得面積。例:已知110名7歲男童身高。現(xiàn)欲估計該地身高界于116.5cm到119.0cm范圍內(nèi)7歲男童比例及110名7歲男童中身高界于此值范圍內(nèi)的人數(shù)。(1)標(biāo)準(zhǔn)正態(tài)分布變換:(2)查表得:(3)求D:

估計該地身高界于116.5~119.0cm范圍內(nèi)的7歲男童比例為13.92%;估計110名7歲男童中有15名男童的身高界于116.5~119.0cm范圍內(nèi)。110×13.92%=15思考題:該地80%的男孩身高集中的范圍?三、正態(tài)分布的應(yīng)用1.估計頻數(shù)分布例:出生體重低于2500g為低體重兒。若由某項研究得某地嬰兒出生體重均數(shù)為3200g,標(biāo)準(zhǔn)差為350g,估計該地當(dāng)年低體重兒所占的比例。查表,即從-∞到2500的比例為2.28%,故估計該地當(dāng)年低體重兒所占的比例為2.28%。2.制定醫(yī)學(xué)參考值范圍(ReferenceValueRange)3.質(zhì)量控制為了控制實驗中的誤差,實驗室的質(zhì)量控制中,常以作為上、下警戒限;以作為上、下控制限。(2s和3s是1.96s與2.58s的近似值)。4.統(tǒng)計處理方法的基礎(chǔ)μ+3σμ+2σμ+σμμ-σμ-2σμ-3σ

一、基本概念通常指正常人(排除了對所研究指標(biāo)有影響的疾病和有關(guān)因素的特定人群)的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動范圍。主要目的:用于臨床疾病診斷。最常用的是95%參考值范圍。

第三節(jié)醫(yī)學(xué)參考值范圍

(ReferenceValueRange)

確定95%參考值范圍示意圖

二、醫(yī)學(xué)參考值范圍的制定方法

(一)選擇足夠數(shù)量的正常人作為參照樣本

選擇參照樣本必須要考慮可能影響所要制定參考值范圍指標(biāo)的各種疾病及干擾因素,將這些人排除在外。例如在制定血清谷-丙轉(zhuǎn)氨酶活性正常值時,選取正常人的條件為肝、腎、心、腦、肌肉等無器質(zhì)性疾患,近期無特殊用藥史等。同時可能需要考慮性別、年齡、民族、地理位置等因素。樣本含量一般要較大,如n>120。(二)對選定的參照樣本進(jìn)行準(zhǔn)確的測定為保證原始數(shù)據(jù)可靠,要嚴(yán)格控制檢測誤差,包括分析儀器的靈敏度、試劑的純度、操作技術(shù)及標(biāo)準(zhǔn)的掌握等,同時必須對測量條件做出統(tǒng)一的規(guī)定和說明,如臨床化驗參考值范圍的制定,應(yīng)對收集樣本時的環(huán)境和生理條件(溫度、季節(jié)、體育活動強(qiáng)度、飲食、妊娠等),收集、轉(zhuǎn)運和儲藏樣品的方法及時間有明確的規(guī)定。(三)決定取單側(cè)范圍還是雙側(cè)范圍值

有些指標(biāo)如白細(xì)胞數(shù)過高或過低均屬異常(a),故其參考值范圍需要分別確定下限和上限,稱作雙側(cè)。有些指標(biāo)如24小時尿糖含量僅在過高(b)、肺活量僅在過低時為異常(c),只需確定其上限或下限,稱作單側(cè)參考值范圍。(a)白細(xì)胞數(shù)參考值范圍(b)24小時尿糖參考值范圍(c)肺活量參考值范圍(四)選擇適當(dāng)?shù)陌俜址秶鷧⒖贾档陌俜址秶鷳?yīng)根據(jù)資料的性質(zhì)和研究目的選擇,它與診斷閾值有確定的關(guān)系。百分范圍的不同將導(dǎo)致不同的假陽性率和假陰性率。

若主要目的為減少假陽性(如確診病人)→大減少假陰性(如初篩病人)→小圖3-6正常人和病人數(shù)據(jù)分布重疊(五)估計參考值范圍的界限參考值范圍估計主要有百分位數(shù)法和正態(tài)分布法。

百分范圍(%)

單側(cè)

雙側(cè)

下限

上限

下限

上限95

P5

P95

P2.5

P97.599

P1

P99

P0.5

P99.5百分范圍(%)

單側(cè)

雙側(cè)

下限

上限

下限

上限95

99

表3-2參考值范圍所對應(yīng)的百分位數(shù)表3-3參考值范圍所對應(yīng)的正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論