九章1節(jié)-計(jì)量統(tǒng)計(jì)描述課件_第1頁(yè)
九章1節(jié)-計(jì)量統(tǒng)計(jì)描述課件_第2頁(yè)
九章1節(jié)-計(jì)量統(tǒng)計(jì)描述課件_第3頁(yè)
九章1節(jié)-計(jì)量統(tǒng)計(jì)描述課件_第4頁(yè)
九章1節(jié)-計(jì)量統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章數(shù)值變量資料的

統(tǒng)計(jì)分析第一節(jié)數(shù)值變量資料的統(tǒng)計(jì)描述第九章數(shù)值變量資料的

統(tǒng)計(jì)分析第一節(jié)1

對(duì)數(shù)值變量資料進(jìn)行統(tǒng)計(jì)分析的一般步驟,是先對(duì)觀察測(cè)量得到的變量值(即觀察值)進(jìn)行統(tǒng)計(jì)描述,再在此基礎(chǔ)上進(jìn)行深入的統(tǒng)計(jì)推斷。統(tǒng)計(jì)描述的工作主要是在編制頻數(shù)表的基礎(chǔ)上描述資料的集中位置和離散程度。對(duì)數(shù)值變量資料進(jìn)行統(tǒng)計(jì)分析的一般步2一、數(shù)值變量資料的頻數(shù)分布二、平均水平指標(biāo)三、離散程度指標(biāo)一、數(shù)值變量資料的頻數(shù)分布3一、數(shù)值變量資料的頻數(shù)分布頻數(shù)分布表:

頻數(shù):不同組別內(nèi)的觀察值個(gè)數(shù)稱為頻數(shù),表示觀察值在各組內(nèi)出現(xiàn)的頻繁程度

頻數(shù)表:將分組標(biāo)志和相應(yīng)的頻數(shù)列成表格,即為頻數(shù)分布表,簡(jiǎn)稱頻數(shù)表頻數(shù)分布圖:

根據(jù)頻數(shù)分布表可以繪制頻數(shù)分布圖

一、數(shù)值變量資料的頻數(shù)分布頻數(shù)分布表:4(一)編制頻數(shù)分布表和繪制頻數(shù)分布圖6.005.283.905.304.203.905.605.664.104.004.503.774.344.304.225.305.133.794.805.204.702.945.904.502.105.605.902.854.904.225.633.214.663.005.963.453.504.233.903.884.244.434.882.483.403.263.213.602.734.154.604.354.965.615.875.014.335.744.873.963.003.933.155.003.443.502.854.874.603.404.793.026.234.982.895.826.305.205.403.002.804.434.505.526.404.865.904.703.474.664.785.702.664.103.705.403.704.374.206.104.805.105.552.975.113.263.046.015.074.225.395.344.473.585.264.544.073.833.976.054.022.692.525.216.554.284.455.154.455.373.803.734.492.442.763.333.016.433.552.63表9-1某地140名健康成年男性血清尿素氮濃度(mmol/L)(一)編制頻數(shù)分布表和繪制頻數(shù)分布圖6.005.283.905頻數(shù)表的編制步驟1、求全距:R=6.55-2.10=4.45(mmol/L)2、按全距的大小決定組數(shù),組段和組段。習(xí)慣上分10~15組,組距i=R/10=4.45/10=0.445將i取整,i=0.4(mmol/L)

頻數(shù)表的編制步驟1、求全距:R=6.55-2.10=4.46劃分組段:第一組段(2.00~)包含最小值。最后一個(gè)組段(6.40~6.80)包含最大值。除最后一個(gè)組段外,其余各組段均不標(biāo)出上限。Min=2.10Max=6.55劃分組段:Min=2.10Max=6.5573、列表劃記:統(tǒng)計(jì)各組段內(nèi)的數(shù)據(jù)頻數(shù)得出表的“頻數(shù)”欄,該表稱之為頻數(shù)表。3、列表劃記:統(tǒng)計(jì)各組段內(nèi)的數(shù)據(jù)頻數(shù)得出表的“頻數(shù)”欄,該表8尿素氮濃度劃記頻數(shù)累計(jì)頻數(shù)頻率(%)累計(jì)頻率(%)2.00~┳22

1.43

1.432.40~正┳79

5.00

6.432.80~正正1322

9.2915.713.20~正正143610.0025.713.60~正正正155110.7136.434.00~正正正197013.5750.004.40~正正正188812.8662.864.80~正正正-1610411.4374.295.20~正正1411810.0084.295.60~正正13131

9.2993.576.00~正-6137

4.2897.866.40~6.803140

2.14100.00合計(jì)—140—100.00—表9-2140名健康成年男性血清尿素氮濃度(mmol/L)頻數(shù)表尿素氮濃度劃記頻數(shù)累計(jì)頻數(shù)頻率(%)累計(jì)頻率(%)2.009頻數(shù)分布圖(直方圖)頻數(shù)分布圖(直方圖)10(二)頻數(shù)表和頻數(shù)分布圖用途1.揭示頻數(shù)的分布特征。2.揭示頻數(shù)的分布類型。3.便于發(fā)現(xiàn)可疑值。4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析。(二)頻數(shù)表和頻數(shù)分布圖用途1.揭示頻數(shù)的分布特征。11(1)、集中趨勢(shì):頻數(shù)向中央部分集中。(2)、離散趨勢(shì):從中央部分到兩側(cè)頻數(shù)分布逐漸減少。(1)、集中趨勢(shì):頻數(shù)向中央部分集中。122.描述頻數(shù)分布的類型

(1)對(duì)稱分布:若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布

2.描述頻數(shù)分布的類型13九章1節(jié)-計(jì)量統(tǒng)計(jì)描述ppt課件14

(2)偏峰分布:1)正偏峰分布(skewed

positivedistribution):頻數(shù)分布的高峰向左偏移,右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾

(2)偏峰分布:15

2)負(fù)偏峰分布(negativeskewnessdistribution):頻數(shù)分布的高峰向右偏移,左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾2)負(fù)偏峰分布(negativeskewnessdis16對(duì)稱分布:集中位置居中頻數(shù)分布正偏峰偏峰分布負(fù)偏峰頻數(shù)分布的類型對(duì)稱分布:集中位置17

3.便于發(fā)現(xiàn)一些特大或特小的可疑值

3.便于發(fā)現(xiàn)一些特大或特小的可疑值18

4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)處理4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)處理19二、計(jì)量資料集中趨勢(shì)的描述平均數(shù)(average):是一類描述數(shù)據(jù)分布集中趨勢(shì)或平均水平的統(tǒng)計(jì)指標(biāo)。二、計(jì)量資料集中趨勢(shì)的描述平均數(shù)(average):是一類描20平均水平指標(biāo)常用的描述指標(biāo):一、算術(shù)均數(shù)(arithmeticmean),二、幾何均數(shù)(geometricmean)G三、中位數(shù)(median)M平均數(shù)平均水平指標(biāo)常用的描述指標(biāo):平均數(shù)21(一)、算術(shù)均數(shù)算術(shù)均數(shù)簡(jiǎn)稱均數(shù)(mean),描述一組同質(zhì)資料的平均水平??傮w均數(shù):樣本均數(shù):(一)、算術(shù)均數(shù)22應(yīng)用

適用于對(duì)稱分布,特別是正態(tài)分布資料。應(yīng)用適用于對(duì)稱分布,特別是正態(tài)分布資料。23計(jì)算方法(1)直接計(jì)算法

:適用于觀察單位較少時(shí)公式:計(jì)算方法(1)直接計(jì)算法:適用于觀察單位較少時(shí)24例:有8名正常成年女子的血清甘油三酯(mmol/L)的測(cè)定值分別為1.34,0.96,1.11,1.52,1.12,0.91,1.33,1.24,求其算術(shù)均數(shù)。例:有8名正常成年女子的血清甘油三酯(mmol/L)的測(cè)定25

(2)加權(quán)法:頻數(shù)表資料公式:(2)加權(quán)法:頻數(shù)表資料26組段頻數(shù)(fi)組中值(xi)fixifixi22.00~22.204.409.682.40~72.6018.2047.322.80~133.0039.00117.003.20~143.4047.60161.843.60~153.8057.00216.604.00~194.2079.80335.164.40~184.6082.80380.884.80~165.0080.00400.005.20~145.4075.60408.245.60~135.8075.40437.326.00~66.2037.20230.646.40~6.8036.6019.80130.68合計(jì)140(∑fi

)-616.80(∑fixi

)2875.36(∑fixi2)140名成年男子的BUN濃度(mmol/L)均數(shù)與標(biāo)準(zhǔn)差計(jì)算用表組段頻數(shù)(fi)組中值(xi)fixifixi22.00~27(2)加權(quán)法(適用于大樣本,頻數(shù)表資料)

(2)加權(quán)法(適用于大樣本,頻數(shù)表資料)28(二)、幾何均數(shù)(geometricmean,G)適用于等比資料或?qū)?shù)正態(tài)分布資料,如血清抗體滴度、細(xì)菌計(jì)數(shù)等。(二)、幾何均數(shù)(geometricmean,G)適用于等29(二)、幾何均數(shù)(geometricmean,G)計(jì)算方法

1.直接法:適用于樣本量較小的計(jì)量資料?;?/p>

(二)、幾何均數(shù)(geometricmean,G)30例9-3有8份血清的某種抗體效價(jià)分別為1:200、1:25、1:400、1:800、1:50、1:100、1:50、1:25,求平均抗體效價(jià)。將各抗體效價(jià)取倒數(shù),代入公式9-3這8份血清的抗體平均效價(jià)為1:100例9-3有8份血清的某種抗體效價(jià)分別為1:200、1:2312.加權(quán)法:適用于樣本量較大的計(jì)量資料,如頻數(shù)表資料。2.加權(quán)法:適用于樣本量較大的計(jì)量資料,如頻數(shù)表資料。32例9-4某地對(duì)112名兒童接種某種疫苗一個(gè)月后,測(cè)定了各兒童血清抗體的滴度,結(jié)果如表9-4第(1)、(2)欄,試求平均滴度。

112名兒童接種疫苗后血清抗體滴度為1:48例9-4某地對(duì)112名兒童接種某種疫苗一個(gè)月后,測(cè)定了各33(二)幾何均數(shù)的應(yīng)用注意事項(xiàng)

1.幾何均數(shù)常用于等比資料或?qū)?shù)正態(tài)分布資料,如血清抗體滴度、細(xì)菌計(jì)數(shù)等。2.觀察值中不能有0。3.觀察值一般不能同時(shí)有正值和負(fù)值。若全是負(fù)值,計(jì)算時(shí)可先將負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。(二)幾何均數(shù)的應(yīng)用注意事項(xiàng)34(三)、中位數(shù)(M)與百分位數(shù)1、M:是指將一組觀察值從小到大排列,位次居中的觀察值就是中位數(shù)。小大(三)、中位數(shù)(M)與百分位數(shù)1、M:是指將一組觀察值從小到35計(jì)算公式:n為奇數(shù)時(shí)

n為偶數(shù)時(shí)

計(jì)算公式:36例9-58名患者食物中毒的潛伏期分別為1,2,3,3,4,5,8,16小時(shí),求其中位數(shù)。本例n=8,為偶數(shù),該8名食物中毒患者潛伏期的中位數(shù)為3.5小時(shí)例9-58名患者食物中毒的潛伏期分別為1,2,3,3,437例9-6某傳染病11名患者的潛伏期(天)分別為1、2、2、3、3、4、5、6、7、7、9,求中位數(shù)。本例n=11,為奇數(shù),該11名傳染病患者潛伏期的中位數(shù)為4天例9-6某傳染病11名患者的潛伏期(天)分別為1、2、38中位數(shù)的應(yīng)用注意事項(xiàng)1.中位數(shù)可用于各種分布的資料。2.中位數(shù)不受極端值的影響,因此,實(shí)際工作中主要用于:(1)偏峰分布資料(2)端點(diǎn)無(wú)確切值的資料(3)分布不明確的資料中位數(shù)的應(yīng)用注意事項(xiàng)392.百分位數(shù)定義:百分位數(shù)(percentile)是指將觀察值從小到大排列后處于第x百分位置上的數(shù)值。用符號(hào)表示為,它是個(gè)位置指標(biāo)。計(jì)算公式:

2.百分位數(shù)定義:百分位數(shù)(percentile)是指將觀察40

PX

X%(100-X)%

41308名6歲以下兒童的尿鉛值中位數(shù)及百分位數(shù)的計(jì)算表P25=25+(25/54)×(308×25%-27)=48.15(mmol/L)尿鉛值(mmol/L)(1)例數(shù)f

(2)累計(jì)頻數(shù)Σf

(3)累計(jì)頻率(%)(4)=(3)/n0~27

27

8.7725~54

81

26.3050~95176

57.1475~55231

75.00100~39270

87.66125~21291

94.48150~12303

98.38175~

5308100.00合計(jì)308(Σf)--求:P25、P50、P95308名6歲以下兒童的尿鉛值中位數(shù)及百分位數(shù)的計(jì)算表P25=42三、計(jì)量資料離散趨勢(shì)

的描述三、計(jì)量資料離散趨勢(shì)

的描述43三、離散趨勢(shì)的指標(biāo)(一)全距(二)四分位數(shù)間距(三)方差(四)標(biāo)準(zhǔn)差(五)變異系數(shù)三、離散趨勢(shì)的指標(biāo)(一)全距(二)四分位數(shù)間距(三)方差(四44

盤編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500例:設(shè)甲、乙、丙三人,采某人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬(wàn)/mm3)甲乙丙盤編號(hào)甲乙丙144048049024604904953545(一)全距(Range)優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)端點(diǎn)值

2.n大,R也會(huì)大

3.不穩(wěn)定1204020(一)全距(Range)優(yōu)點(diǎn):簡(jiǎn)便120402046(二)四分位數(shù)間距(quartilerange)四分位間距:Q=P75-P25P100(max)P75P50(中位數(shù))P25P0(min)Px(二)四分位數(shù)間距(quartilerange)四分位間470P25P50P75100%0P2548(三)方差(variance)

方差

:樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。(三)方差(variance)方差:樣本觀察值的離均差49

方差性質(zhì):方差越大說明數(shù)據(jù)的變異越大

自由度(degreeoffreedom,簡(jiǎn)記為df或υ)(1)定義:隨機(jī)變量能自由取值的個(gè)數(shù)(2)計(jì)算公式:υ=n-限制條件個(gè)數(shù)

50例:有一四個(gè)(n=4)數(shù)據(jù)樣本,受到的條件限制,在自由確定4,2,5三個(gè)數(shù)據(jù)后,第四個(gè)數(shù)只能是9,因而υ=n-1=3。例:有一四個(gè)(n=4)數(shù)據(jù)樣本,受到51

公式:樣本標(biāo)準(zhǔn)差用表示公式:(四)標(biāo)準(zhǔn)差(standarddeviation)為方差的正平方根,其單位與X一致

(四)標(biāo)準(zhǔn)差(standarddeviation)52

標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計(jì)算標(biāo)準(zhǔn)差的公式為標(biāo)準(zhǔn)差的公式還可以寫成:53

盤編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500例:設(shè)甲、乙、丙三人,采某人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬(wàn)/mm3)甲乙丙盤編號(hào)甲乙丙144048049024604904953554標(biāo)準(zhǔn)差的計(jì)算盤編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91標(biāo)準(zhǔn)差的計(jì)算盤編號(hào)甲乙丙甲2乙2丙21440480490155例:

三組同齡男孩的身高值(cm)

例:三組同齡男孩的身高值(cm)56例,計(jì)算三組資料的標(biāo)準(zhǔn)差。

甲組:

例,計(jì)算三組資料的標(biāo)準(zhǔn)差。

甲組:57標(biāo)準(zhǔn)差的用途:⑴描述數(shù)據(jù)的離散程度⑵用于計(jì)算變異系數(shù)⑶用于計(jì)算標(biāo)準(zhǔn)誤⑷估計(jì)參考值范圍標(biāo)準(zhǔn)差的用途:58(五)

變異系數(shù)

變異系數(shù)(coefficientofvariation)記為CV,多用于觀察指標(biāo)單位不同時(shí),如身高與體重的變異程度的比較;或均數(shù)相差較大時(shí),如兒童身高與成人身高變異程度的比較。

(五)變異系數(shù)

變異系數(shù)(coefficientofv59某地40名7歲男孩身高的均數(shù)為121.48cm,標(biāo)準(zhǔn)差為4.65cm;體重均數(shù)為22.18kg,標(biāo)準(zhǔn)差為2.35kg,

比較其該40名男童身高和體重的變異程度?

(觀察指標(biāo)單位不同)某地40名7歲男孩身高的均數(shù)為121.48cm,標(biāo)準(zhǔn)60均數(shù)相差較大時(shí):九章1節(jié)-計(jì)量統(tǒng)計(jì)描述ppt課件61離散程度指標(biāo)總結(jié)1.全距,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論