衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)計描述PPT學習教案_第1頁
衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)計描述PPT學習教案_第2頁
衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)計描述PPT學習教案_第3頁
衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)計描述PPT學習教案_第4頁
衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)計描述PPT學習教案_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、會計學1衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)衛(wèi)生統(tǒng)計學第方積乾主編定量資料的統(tǒng)計描述計描述 學習要求學習要求 了解:了解:應用應用SASSAS程序編制頻率表的方法和程序編制頻率表的方法和meansmeans、univariateunivariate過程對定量資料的描述。過程對定量資料的描述。 熟悉:熟悉:定量資料頻率表的編制方法和用途。定量資料頻率表的編制方法和用途。 掌握:掌握:算術均數(shù)、幾何均數(shù)、中位數(shù)的計算方法和算術均數(shù)、幾何均數(shù)、中位數(shù)的計算方法和使用條件;四分位間距、方差、標準差、變異系數(shù)的使用條件;四分位間距、方差、標準差、變異系數(shù)的計算方法和使用條件。計算方法和使用條件。 2021

2、-10-152第1頁/共69頁 統(tǒng)計描述是用統(tǒng)計圖表、統(tǒng)計指標來描述資料的分布統(tǒng)計描述是用統(tǒng)計圖表、統(tǒng)計指標來描述資料的分布規(guī)律及其數(shù)量特征的。規(guī)律及其數(shù)量特征的。 第一節(jié)第一節(jié) 頻率分布表與頻率分布圖頻率分布表與頻率分布圖 醫(yī)學研究資料變量值的個數(shù)較多時醫(yī)學研究資料變量值的個數(shù)較多時,對個變量值出現(xiàn)的對個變量值出現(xiàn)的頻數(shù)或頻率列表即為頻數(shù)分布表或頻率分布表(頻數(shù)或頻率列表即為頻數(shù)分布表或頻率分布表(frequency distribution table),簡稱),簡稱頻數(shù)表頻數(shù)表或或頻率表頻率表。 2021-10-153第2頁/共69頁 一、離散型定量變量的頻率分布一、離散型定量變量的頻率

3、分布 例例2-1 1998年某山區(qū)年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料,編制頻率表。名孕婦產(chǎn)前檢查次數(shù)資料,編制頻率表。 表表2-1 1998年某地年某地96名孕婦產(chǎn)前檢查次數(shù)頻率分布名孕婦產(chǎn)前檢查次數(shù)頻率分布0123455 4 71113262312 4.2 7.311.513.527.124.012.5 4112235618496 4.211.522.936.563.587.5 100.0合計合計961002021-10-154第3頁/共69頁 圖2-1 1998年某地年某地96名孕婦產(chǎn)前檢查次數(shù)頻率分布名孕婦產(chǎn)前檢查次數(shù)頻率分布 離散型定量變量的頻率分布圖可用直條圖表達,以等離散型定量變量

4、的頻率分布圖可用直條圖表達,以等寬直條的高度表示各組頻率的多少寬直條的高度表示各組頻率的多少2021-10-155第4頁/共69頁二、連續(xù)型定量變量的頻率分布二、連續(xù)型定量變量的頻率分布 例例2-2 抽樣調(diào)查某地抽樣調(diào)查某地120名名1835歲健康男性居民血清鐵含量歲健康男性居民血清鐵含量(mmo/L),數(shù)據(jù)如下。試編制血清鐵含量的頻率分布表。數(shù)據(jù)如下。試編制血清鐵含量的頻率分布表。2021-10-156第5頁/共69頁頻率表的編制步驟如下:頻率表的編制步驟如下: 1. 計算極差計算極差 (range, R),亦稱全距,即最大值與最小值之差。本例,亦稱全距,即最大值與最小值之差。本例最大值為最

5、大值為29.64,最小值為,最小值為7.42,故,故R=29.64-7.42=22.22 (mmo/L)。 2. 確定組段數(shù)與組距確定組段數(shù)與組距(class interval) 組段數(shù)一般取組段數(shù)一般取10組左右。組距組左右。組距用用i表示,組距表示,組距=極差極差/組段數(shù),本例擬分組段數(shù),本例擬分10組,組,i=22.22/10=2.22,一般取,一般取靠近的整數(shù)作為組距,本例取靠近的整數(shù)作為組距,本例取i2。 3. 確定各組段的上、下限確定各組段的上、下限 每個組段的起點稱為組段的下限,終點每個組段的起點稱為組段的下限,終點稱為組段的上限。第一組段要包括最小值,其下限取小于或等于最小值稱

6、為組段的上限。第一組段要包括最小值,其下限取小于或等于最小值的整數(shù),本例取的整數(shù),本例取6最為第一組段的下限(也可取最為第一組段的下限(也可取7),最后一個組段要包),最后一個組段要包括最大值。注意各組段不能重合,每組段只寫出下限,如括最大值。注意各組段不能重合,每組段只寫出下限,如6,8,最最后一個組段可包括其上限值,如本例后一個組段可包括其上限值,如本例2830。 4. 列表列表 清點各組的頻數(shù),計算頻率、累積頻率數(shù)和累計頻率。清點各組的頻數(shù),計算頻率、累積頻率數(shù)和累計頻率。 2021-10-157第6頁/共69頁組段(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)681

7、0121416 18 20 22 24 26 2830 1 3 6 81220271812 8 4 1 0.83 2.50 5.00 6.6710.0016.6722.5015.0010.00 6.67 3.33 0.83 1 4 10 18 30 50 77 95107115119120 0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17100.00合計120100.00表2-2 120名正常成年男子血清鐵含量(mmo/L)頻率分布2021-10-158第7頁/共69頁圖圖2-2 120名健康成年男子血清鐵含量(名健康

8、成年男子血清鐵含量(mol/L)分布分布2021-10-159第8頁/共69頁2-2 1202-2 120名健康成年男子血清鐵含量名健康成年男子血清鐵含量(mmo/L)(mmo/L)分布分布2021-10-1510第9頁/共69頁三、頻率分布表(圖)的用途三、頻率分布表(圖)的用途 1.1.揭示資料的分布類型揭示資料的分布類型 2021-10-1511第10頁/共69頁 正偏態(tài)(右偏態(tài)) 負偏態(tài)(左偏態(tài)) 2.2.觀察資料的集中趨勢和離散趨勢觀察資料的集中趨勢和離散趨勢 3.3.便于發(fā)現(xiàn)某些特大或特小的可疑值便于發(fā)現(xiàn)某些特大或特小的可疑值 4.4.便于進一步計算統(tǒng)計指標和作統(tǒng)計處理便于進一步計

9、算統(tǒng)計指標和作統(tǒng)計處理2021-10-1512第11頁/共69頁第二節(jié)第二節(jié) 描述集中趨勢的統(tǒng)計指標描述集中趨勢的統(tǒng)計指標 醫(yī)學定量資料中,描述集中趨勢的統(tǒng)計指標主要有醫(yī)學定量資料中,描述集中趨勢的統(tǒng)計指標主要有算術均數(shù)、幾何均數(shù)和中位數(shù)。算術均數(shù)、幾何均數(shù)和中位數(shù)。一、算術均數(shù)一、算術均數(shù)(arithmetic mean)(arithmetic mean) 簡稱均數(shù)。均數(shù)適用于對稱分布或近似對稱分布的簡稱均數(shù)。均數(shù)適用于對稱分布或近似對稱分布的資料。習慣上以希臘字母資料。習慣上以希臘字母 表示總體均數(shù)表示總體均數(shù)(population (population mean)mean),以表示樣本

10、均數(shù),以表示樣本均數(shù) (sample mean)(sample mean)。常用計算。常用計算方法有直接法和頻率表法(亦稱加權法)。方法有直接法和頻率表法(亦稱加權法)。X2021-10-1513第12頁/共69頁1.1.直接法直接法nXX 例例2-32-3 測得測得8至正常大白鼠血清總酸性磷酸酶(至正常大白鼠血清總酸性磷酸酶(TACP)含量含量 (U/L)為)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試。試求其算術均數(shù)。求其算術均數(shù)。 本例本例9075. 3826.31nXX(U/L)2021-10-1514第13頁/共69頁 2.頻率表法頻率表法 當

11、變量值的個數(shù)較多時,在編制頻率表當變量值的個數(shù)較多時,在編制頻率表的基礎上,應用加權法計算均數(shù)的近似值。的基礎上,應用加權法計算均數(shù)的近似值。nfXffXX00 公式中,公式中,f 為各組段的頻數(shù),為各組段的頻數(shù),X0為各組段的組中值為各組段的組中值, X0=(組段上限(組段上限+組段下限)組段下限)/2。 例例2-4 57.1812022280ffXX(mmo/L)如用直接法計算如用直接法計算, =18.61(mmo/L)X2021-10-1515第14頁/共69頁 表表2-3 2-3 頻數(shù)表法計算均數(shù)頻數(shù)表法計算均數(shù)組段組段(1)組中值組中值(X0)(2)頻數(shù)頻數(shù)(f)(3)fX0(4)=

12、(2)(3) 6 8 10 12 14 16 18 20 22 24 26 28 30 7 911131517192123252729 1 3 6 81220271812 8 4 1 7 27 66104180340513378276200108 29合計合計 120 22282021-10-1516第15頁/共69頁二、幾何均數(shù)(geometric mean,) 幾何均數(shù)使用于原始變量不呈對稱分布幾何均數(shù)使用于原始變量不呈對稱分布,但對變量經(jīng)對但對變量經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料,又稱對數(shù)正態(tài)分布資料。常數(shù)轉(zhuǎn)換后呈對稱分布的資料,又稱對數(shù)正態(tài)分布資料。常見于正偏態(tài)分布資料,如抗體滴度,某些傳

13、染病的潛伏期見于正偏態(tài)分布資料,如抗體滴度,某些傳染病的潛伏期,細菌計數(shù)等。計算公式亦可用直接法和頻數(shù)表法。,細菌計數(shù)等。計算公式亦可用直接法和頻數(shù)表法。 1.1.直接法直接法 對數(shù)的形式為對數(shù)的形式為 nnXXXXG321nXnXXXGnlglglglglglg12112021-10-1517第16頁/共69頁 例例2-5 7名慢性遷延型肝炎患者的名慢性遷延型肝炎患者的HBsAg滴度資料為滴度資料為: 1:16,1:32,1:32,1:64,1:64,1:128,1:512。試計算其幾何均數(shù)。試計算其幾何均數(shù)。 本例先求平均滴度的倒數(shù)本例先求平均滴度的倒數(shù)645121286464323216

14、7G648062. 1lg7512lg128lg64lg64lg32lg32lg16lglg11G7 7名慢性遷延型肝炎患者的名慢性遷延型肝炎患者的HBsAgHBsAg滴度幾何均數(shù)為滴度幾何均數(shù)為1:641:64。2021-10-1518第17頁/共69頁 2.2.頻率表法:頻率表法:當資料中相同變量值的個數(shù)當資料中相同變量值的個數(shù)f(即頻數(shù))(即頻數(shù))較多時,可通過頻率表法計算幾何均數(shù),公式為較多時,可通過頻率表法計算幾何均數(shù),公式為fXfGlglg1 表表2-4 52例慢性肝炎患者的例慢性肝炎患者的 HBsAg滴度資料滴度資料抗體滴度抗體滴度頻數(shù)(頻數(shù)(f)滴度倒數(shù)滴度倒數(shù)(X)logXf

15、logX1:161:321:641:1281:2561:5122711131271632641282565121.204121.505151.806182.107212.408242.709272.4082410.5360519.8679827.3937328.8988818.96489合計合計52108.069772021-10-1519第18頁/共69頁本例本例f lgX= 108.06977 , f=52,代入公式得代入公式得 74705.1190783. 2lg5206977.108lg11G52例慢性肝炎患者的例慢性肝炎患者的 HBsAg滴度的幾何均數(shù)為滴度的幾何均數(shù)為1:119.7

16、5 計算幾何均數(shù)應注意:計算幾何均數(shù)應注意:變量值中不能有變量值中不能有0 0;不能同時;不能同時有正值和負值;若全是負值,計算時可先把負號去掉,得有正值和負值;若全是負值,計算時可先把負號去掉,得出結果后再加上負號。出結果后再加上負號。2021-10-1520第19頁/共69頁滴度倒數(shù)滴度倒數(shù)XlgX頻數(shù)頻數(shù) f20.3010440.6021780.903115161.204120321.505116641.806271282.107232021-10-1521第20頁/共69頁2021-10-1522第21頁/共69頁2021-10-1523第22頁/共69頁三、中位數(shù)及百分位數(shù)三、中位數(shù)

17、及百分位數(shù) 1.1.中位數(shù)(中位數(shù)(median ,median , M M) 將一組變量值從小到大按順序排列,位次居中的變量值將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)。在全部變量值中,大于和小于中位數(shù)的變量稱為中位數(shù)。在全部變量值中,大于和小于中位數(shù)的變量值的個數(shù)相等。值的個數(shù)相等。 用中位數(shù)表示平均水平主要適用于:變量值中出現(xiàn)個用中位數(shù)表示平均水平主要適用于:變量值中出現(xiàn)個別特小或特大的數(shù)值別特小或特大的數(shù)值; ;資料的分布呈明顯偏態(tài),即大部分資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè)的變量值偏向一側(cè); ;變量值分布一端或兩端無確定數(shù)值,變量值分布一端或兩端無確定數(shù)值

18、,只有小于或大于某個數(shù)值只有小于或大于某個數(shù)值; ;資料的分布不清。資料的分布不清。2021-10-1524第23頁/共69頁 (1 1)直接法)直接法 當例數(shù)較少時,先將變量值由小到大當例數(shù)較少時,先將變量值由小到大順序排列,再按以下公式計算。順序排列,再按以下公式計算。n為奇數(shù)時為奇數(shù)時 )21(nXMn為偶數(shù)時為偶數(shù)時 2/ )12()2(nnXXM式中式中X的下標為變量值的位置。的下標為變量值的位置。2021-10-1525第24頁/共69頁 例例2-7 某藥廠觀察某藥廠觀察9只小鼠口服高山紅景天醇提物后在只小鼠口服高山紅景天醇提物后在乏氧條件下的生存時間(乏氧條件下的生存時間(min

19、)如下:如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.9,69.0。試求其中位數(shù)。試求其中位數(shù)。 本例本例n=9,為奇數(shù),為奇數(shù)6 .635219XXM如果如果n=10例,生存時間為例,生存時間為69.6,則中位數(shù)為,則中位數(shù)為6 .642/ )6 .656 .63(2/ )(2/ )(651210210XXXXM2021-10-1526第25頁/共69頁 (2 2)頻率表法)頻率表法 當例數(shù)較多時,先將變量值從小到大編當例數(shù)較多時,先將變量值從小到大編制頻率表,并分別計算累計頻數(shù)和累計頻率(見表制頻率表,并分別計算累計頻數(shù)和累計頻率(見表2-52-5)。)

20、。先從累計頻率找出先從累計頻率找出M M所在的組段,然后按下式計算。所在的組段,然后按下式計算。)2(LmfnfiLM 式中式中L為中位數(shù)所在組段的下限,為中位數(shù)所在組段的下限,i為該組段的組距,為該組段的組距,fm為為該組段的頻數(shù),該組段的頻數(shù),fL為小于為小于L的各組段累計頻數(shù)。的各組段累計頻數(shù)。 例例2-8 50例鏈球菌咽頰炎患者的潛伏期(小時)如表例鏈球菌咽頰炎患者的潛伏期(小時)如表2-5,試計算潛伏期的中位數(shù)。試計算潛伏期的中位數(shù)。2021-10-1527第26頁/共69頁表表2-52-5 50例鏈球菌咽頰炎患者的潛伏期(小時)的頻率分布表例鏈球菌咽頰炎患者的潛伏期(小時)的頻率分

21、布表 組段組段組中值組中值(X0)頻數(shù)(頻數(shù)(f)累計頻數(shù)累計頻數(shù)累計頻率(累計頻率(%)122436486072849610812018304254667890102114 1 71111 7 5 4 2 2 1 819303742464850 2 16 38 60 74 84 92 96100合計合計- -5050- - -本例從累計頻率看,本例從累計頻率看,M位于位于48組段,即組段,即L=48,i=12,fm=11, fL=19,55.54)19250(111248)2(LmfnfiLM(小時)(小時)2021-10-1528第27頁/共69頁fLMfm)2(LmfnfiLfn2202

22、1-10-1529第28頁/共69頁 1.1.百分位數(shù)百分位數(shù) 百分位數(shù)百分位數(shù)(percentile,P)是一種位置指標,以是一種位置指標,以Px表示。表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有到大按順序排列,理論上有x%的變量值比的變量值比Px小,有小,有(100 x)%的變量值比的變量值比Px大。故大。故P50分位數(shù)也就是中位數(shù),即分位數(shù)也就是中位數(shù),即P50=M 。百分位數(shù)的計算公式為。百分位數(shù)的計算公式為)%(LxxfxnfiLP 式中式中L為為Px所在組段的下限,所在組段的下限,i為該組段的組距

23、,為該組段的組距,fx為該組為該組段的頻數(shù),段的頻數(shù),fL為小于為小于L的各組段累計頻數(shù)。的各組段累計頻數(shù)。2021-10-1530第29頁/共69頁 如如 試求表試求表2-5資料中百分位數(shù)資料中百分位數(shù)P25、P75 。 由表由表2-5累計頻數(shù)欄可見累計頻數(shù)欄可見P25在在“36”組段,組段,L=36,i=12, fx=11, fL=8,代入公式得代入公式得91.40)8%2550(11123625P(小時(小時) 同理可知同理可知 P75在在“72”組段,組段,L=72,i=12, fx=5, fL=74,代入公式得代入公式得2 .73)37%7550(5127275P(小時(小時) 百分

24、位數(shù)的使用條件同中位數(shù)一樣。主要用途為:描百分位數(shù)的使用條件同中位數(shù)一樣。主要用途為:描述一組資料在某百分位置上的水平;用于確定正常值范述一組資料在某百分位置上的水平;用于確定正常值范圍;計算四分位數(shù)間距。圍;計算四分位數(shù)間距。 2021-10-1531第30頁/共69頁四、眾數(shù)(四、眾數(shù)( mode) 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù)。眾數(shù)在頻率一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù)。眾數(shù)在頻率分布表中是頻數(shù)最多的那一組的組中值,有時眾數(shù)在一組分布表中是頻數(shù)最多的那一組的組中值,有時眾數(shù)在一組數(shù)中有好幾個或者沒有眾數(shù)。數(shù)中有好幾個或者沒有眾數(shù)。 例如:例如:1,2,3,3,4的眾數(shù)是的眾數(shù)

25、是3 ;1,2,2,3,3,4的眾數(shù)是的眾數(shù)是2和和3;1,2,3,4,5沒有眾數(shù);表沒有眾數(shù);表2-5眾數(shù)為眾數(shù)為42和和54。 2021-10-1532第31頁/共69頁第三節(jié)第三節(jié) 描述離散趨勢的統(tǒng)計指標描述離散趨勢的統(tǒng)計指標 例例2-10 是觀察三組數(shù)據(jù)的離散狀況。是觀察三組數(shù)據(jù)的離散狀況。A組:組:26,28,30,32,34;B組:組:24,27,30,33,36;C組:組:26,29,30,31,34。三組均數(shù)都是。三組均數(shù)都是30。 A組組 . . . . . B組組 . . . . . C組組 . . . . . 常用的離散指標有:常用的離散指標有: 極差、四分位數(shù)間距、方差

26、、標準差和變異系數(shù),最常極差、四分位數(shù)間距、方差、標準差和變異系數(shù),最常用的指標為標準差。用的指標為標準差。 2021-10-1533第32頁/共69頁一、極差和四分位數(shù)間距一、極差和四分位數(shù)間距 1.極差極差 極差極差(range,R)亦稱全距,即一組變量值中最大值與最亦稱全距,即一組變量值中最大值與最小值之差。小值之差。R值大,離散度就大;值大,離散度就大;R值小,離散度就小。值小,離散度就小。 A組組: R=34-26=8 B組:組:R=36-24=12 C組:組:R=34-26=8 極差的特點是計算簡單,但只考慮最大值和最小值,極差的特點是計算簡單,但只考慮最大值和最小值,容易受個別極

27、端值的影響,且不能反映組內(nèi)其他變量值容易受個別極端值的影響,且不能反映組內(nèi)其他變量值的離散情況。另外,當調(diào)查例數(shù)增多時,遇到較大或較的離散情況。另外,當調(diào)查例數(shù)增多時,遇到較大或較小變量值的機會就大,極差就可能增大。小變量值的機會就大,極差就可能增大。2021-10-1534第33頁/共69頁 2.2.四分位數(shù)間距四分位數(shù)間距(quartile interval,Q) 極差的不穩(wěn)定主要受兩端值的影響,如將兩端數(shù)據(jù)各去掉極差的不穩(wěn)定主要受兩端值的影響,如將兩端數(shù)據(jù)各去掉一部分,這樣所得的數(shù)據(jù)就比較穩(wěn)定了。例如兩端各去掉一部分,這樣所得的數(shù)據(jù)就比較穩(wěn)定了。例如兩端各去掉2525,取中間,取中間50

28、50的數(shù)據(jù)的極差,這樣可先計算的數(shù)據(jù)的極差,這樣可先計算P P2525和和P P7575,求出,求出P P7575與與P P2525之差,即為四分位數(shù)間距。之差,即為四分位數(shù)間距。 Q= P75P25 P75又稱為上四分位數(shù)又稱為上四分位數(shù)(upper quartile ); P25又稱為下四分又稱為下四分位數(shù)位數(shù)(lower quartile )。2021-10-1535第34頁/共69頁 例例2-12 試計算表試計算表2-5中中 50例鏈球菌咽頰炎患者的潛例鏈球菌咽頰炎患者的潛伏期(小時)的四分位間距。伏期(小時)的四分位間距。 已知已知P75=73.20小時,小時,P25=40.91小時

29、,代入公式得小時,代入公式得 Q=73.2040.91=32.29(小時)(小時) 由以上的結果可以看出:鏈球菌咽頰炎患者的潛伏由以上的結果可以看出:鏈球菌咽頰炎患者的潛伏期在期在40.9173.20小時之間,其四分位數(shù)間距為小時之間,其四分位數(shù)間距為32.29小小時。時。 四分位數(shù)間距可用于各種分布資料,特別是偏態(tài)分四分位數(shù)間距可用于各種分布資料,特別是偏態(tài)分布資料,經(jīng)常把布資料,經(jīng)常把中位數(shù)和四分位間結合起來描述資料的中位數(shù)和四分位間結合起來描述資料的集中趨勢和離散趨勢集中趨勢和離散趨勢。2021-10-1536第35頁/共69頁二、方差和標準差二、方差和標準差 方差方差(variance

30、)和標準差和標準差(standard deviation)是描述對稱是描述對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料離散趨勢(變分布,特別是正態(tài)分布或近似正態(tài)分布資料離散趨勢(變異程度)的常用指標。異程度)的常用指標。 1.方差方差 總體方差用總體方差用 表示,樣本方差用表示,樣本方差用S2表示。表示。2NX22)(1/)(1)(2222nnXXnXXS2021-10-1537第36頁/共69頁 式中式中: n-1是自由度是自由度(degree of freedom),用希臘小寫字,用希臘小寫字母表示。它描述了當母表示。它描述了當 不變的情況下,不變的情況下,n個變量值(個變量值(X)中能)中

31、能自由變動的變量值的個數(shù)。用自由變動的變量值的個數(shù)。用n-1作分母,作分母,S2可作為可作為 的無的無偏估計。偏估計。 對于頻率表資料對于頻率表資料1015303430323030302830262222221SX21/)(20202nnfXfXS如例如例2-10三組數(shù)據(jù)其方差為三組數(shù)據(jù)其方差為5 .2215303630333030302730242222222S5 . 815303430313030302930262222223S2021-10-1538第37頁/共69頁 2.2.標準差標準差 標準差為方差的開方根,它與原始變量值單位相同??倶藴什顬榉讲畹拈_方根,它與原始變量值單位相同??傮w

32、標準差用體標準差用 表示表示 ,樣本標準差用,樣本標準差用S表示。表示。 總體標準差計算公式為總體標準差計算公式為 NX2)( 樣本標準差計算公式為樣本標準差計算公式為 1/)(1)(222nnXXnXXS2021-10-1539第38頁/共69頁 對于頻率表資料對于頻率表資料37. 41120120/22284364022S例例 2-14 計算例計算例2-2數(shù)據(jù)的標準差。數(shù)據(jù)的標準差。 已算得已算得fX0=2228, n=f=120, =4364020fX1/)(20202nnfXfXS(mol/L) 對于正態(tài)分布資料,研究報告中經(jīng)常用對于正態(tài)分布資料,研究報告中經(jīng)常用 的形式來描述資料的集

33、中趨勢和離散趨勢。的形式來描述資料的集中趨勢和離散趨勢。SX 2021-10-1540第39頁/共69頁三、變異系數(shù)三、變異系數(shù)(coefficient of variation, CV) 當兩組或多組變量值的單位不同或均數(shù)相差較大時當兩組或多組變量值的單位不同或均數(shù)相差較大時,不能或不宜用兩個或多個標準差的大小來比較其離,不能或不宜用兩個或多個標準差的大小來比較其離散程度的大小。散程度的大小。此時可用變異系數(shù)反映變量值的相對此時可用變異系數(shù)反映變量值的相對離散程度。樣本變異系數(shù)離散程度。樣本變異系數(shù)CV的計算公式的計算公式%100XSCV 由上式可以看出:變異系數(shù)為無量綱單位,可以由上式可以

34、看出:變異系數(shù)為無量綱單位,可以比較不同單位指標間的變異度;變異系數(shù)消除了均比較不同單位指標間的變異度;變異系數(shù)消除了均數(shù)的大小對標準差的影響,所以可以比較兩均數(shù)相差數(shù)的大小對標準差的影響,所以可以比較兩均數(shù)相差較大時指標間的變異度。較大時指標間的變異度。2021-10-1541第40頁/共69頁 例例2.14 1985年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為童體重均數(shù)為8.42kg,標準差為,標準差為0.98kg,身高均數(shù)為,身高均數(shù)為72.4cm,標準差為,標準差為3.0cm。試計算周歲女童身高與均數(shù)變。試計算周歲女童身高與均數(shù)變異系數(shù)。異系數(shù)。

35、身高身高 %64.11%10042. 898. 0CV體重體重 %14. 4%1004 .720 . 3CV 周歲女童體重的變異程度比身高的變異程度大。周歲女童體重的變異程度比身高的變異程度大。 2021-10-1542第41頁/共69頁 第四節(jié)第四節(jié) 描述分布形態(tài)的統(tǒng)計指標描述分布形態(tài)的統(tǒng)計指標 1.1.偏度系數(shù)(偏度系數(shù)(coefficient of skewness ,coefficient of skewness ,SKEWSKEW) 偏度系數(shù)(偏度系數(shù)(G G1 1)按照以下公式計算)按照以下公式計算31)2)(1(SXXnnnGG1=0為正態(tài)分布;為正態(tài)分布;G10為正偏態(tài)分布;為

36、正偏態(tài)分布;G10負偏態(tài)負偏態(tài)G1MX0,為尖峭峰;,為尖峭峰;G2 |t| = |M| = |S| .0001 Tests for Normality Test -Statistic- -p Value- Shapiro-Wilk (W檢驗)檢驗) W 0.992187 Pr D 0.1500 Cramer-von Mises W-Sq 0.060468 Pr W-Sq 0.2500 Anderson-Darling A-Sq 0.343631 Pr A-Sq 0.25002021-10-1560第59頁/共69頁Quantiles (Definition 5) Quantile Estimate 10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論