醫(yī)學(xué)統(tǒng)計(jì)學(xué):統(tǒng)計(jì)資料的整理與描述_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué):統(tǒng)計(jì)資料的整理與描述_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué):統(tǒng)計(jì)資料的整理與描述_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué):統(tǒng)計(jì)資料的整理與描述_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué):統(tǒng)計(jì)資料的整理與描述_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Medicalstatistics醫(yī)學(xué)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)資料的整理與描述數(shù)值變量資料2023/9/212主要內(nèi)容

個(gè)體變異頻數(shù)分布表(圖)

定量指標(biāo)的描述集中位置離散趨勢(shì)總結(jié)2023/9/213個(gè)體變異(individualvariation)是同質(zhì)觀察對(duì)象間表現(xiàn)出的差異。變異是生物體在一種或多種、已知或未知的不可控因素作用下所產(chǎn)生的綜合反映。就個(gè)體而言:變異是隨機(jī)的(random)。就總體而言:個(gè)體變異是有規(guī)律的。2023/9/214原始數(shù)據(jù)4.095.335.624.635.184.275.073.603.315.324.884.314.125.334.404.793.925.464.815.094.204.133.944.415.264.665.295.235.583.534.544.684.484.404.764.814.574.973.945.484.275.105.785.123.604.014.755.806.015.505.364.184.334.844.744.604.764.584.344.724.813.844.174.853.294.914.454.434.994.494.355.265.045.384.935.414.523.864.994.244.504.924.135.055.145.055.174.555.425.704.676.184.375.404.154.084.714.124.794.89100名成年男性血紅細(xì)胞計(jì)數(shù)(1012/L)資料如下:頻數(shù)分布表和頻數(shù)分布圖原因:由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。解決:頻數(shù)分布表的基本思想:將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計(jì)各組的頻數(shù),得到頻數(shù)分布表;在將頻數(shù)表繪制成頻數(shù)分布圖。

2023/9/216頻數(shù)表編制步驟

求極差選定適當(dāng)?shù)慕M段數(shù)后估計(jì)組距列出組段劃記歸組獲得頻數(shù)求頻率,完成頻數(shù)表

2023/9/217頻數(shù)分布表的編制求極差或全距(Range):R=Xmax-XminR=6.18-3.29=2.89選定適當(dāng)?shù)慕M段數(shù)后估計(jì)組距(i)組段數(shù)的選取以能反映資料的分布特征為宜一般取8~15組

i=2.89/10=0.289≈0.32023/9/218頻數(shù)分布表的編制列出組段組段的含義:包括組段的下限而不含組段的上限。如:3.20~等價(jià)于[3.20,3.50)第一個(gè)組段應(yīng)包含最小值

最后一個(gè)組段應(yīng)包含最大值2023/9/219頻數(shù)分布表的編制劃記歸組獲得頻數(shù)常用的劃記方法:“正”;“||||”求頻率,完成頻數(shù)表相應(yīng)的頻數(shù)除以總數(shù)即為頻率各組段的頻率總和為1或者100%100名成年男性血紅細(xì)胞計(jì)數(shù)頻數(shù)表組段(1)頻數(shù)(2)頻率(%)(3)3.20~22.003.50~33.003.80~88.004.10~1616.004.40~1818.004.70~2121.005.00~1414.005.30~1212.005.60~44.005.90~6.2022.00合計(jì)100100.0011100名成年男子紅細(xì)胞計(jì)數(shù)頻數(shù)圖圖2.1100名成年男性的血紅細(xì)胞計(jì)數(shù)的頻數(shù)分布

人數(shù)血紅細(xì)胞(1012個(gè)/L)3.2

3.5

3.8

4.1

4.4

4.7

5.0

5.3

5.6

5.9

6.2

0

5

10

15

20

2023/9/2112頻數(shù)分布表和頻數(shù)分布圖的用途

描述分布類型描述分布的特征便于發(fā)現(xiàn)特大、特小的可疑值便于計(jì)算有關(guān)指標(biāo)、統(tǒng)計(jì)分析與處理2023/9/2113頻數(shù)分布類型對(duì)稱分布:以正態(tài)分布較為常見非對(duì)稱分布:偏態(tài)分布正偏態(tài):右側(cè)>左側(cè)向右側(cè)拖尾 負(fù)偏態(tài):左側(cè)>右側(cè)向左側(cè)拖尾

2023/9/2114頻數(shù)分布特征

數(shù)據(jù)分布的范圍:3.29~6.18

集中位置:中等大小人數(shù)居多,向中間集中數(shù)據(jù)最集中的區(qū)間:4.70~5.00

離散趨勢(shì):以中等大小的區(qū)間為中心,向兩側(cè)逐漸減少分布形態(tài):基本對(duì)稱2023/9/2115圖239人發(fā)汞含量的頻數(shù)分布13579111315171921發(fā)汞含量(umol/kg)706050403020100人數(shù)2023/9/2116圖某城市892名老年人生存質(zhì)量自評(píng)分的頻數(shù)分布0102030405060708090100自評(píng)分4003002001000人數(shù)2023/9/2117圖102名黑色數(shù)瘤患者的生存時(shí)間頻數(shù)分布151015202530354045生存時(shí)間(月)403020100人數(shù)2023/9/2118圖某地1990~1992年男性死亡年齡分布

0510152025

303540455055606570758085死亡年齡(歲)250020001500100050002023/9/2119數(shù)值變量資料的統(tǒng)計(jì)指標(biāo)集中位置的描述離散趨勢(shì)的描述2023/9/2120集中位置的描述----平均數(shù)(average)均數(shù)(arithmeticmean,mean)總體均數(shù)樣本均數(shù)2023/9/2121平均數(shù)(average)加權(quán)均數(shù)(weightedmean)

均數(shù)是加權(quán)均數(shù)的一個(gè)特例2023/9/2122平均數(shù)(average)幾何均數(shù)(geometricmean)

2023/9/2123幾何均數(shù)例1:10,1:20,1:40,1:80,1:1602023/9/2124平均數(shù)(average)中位數(shù)(median)

將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位數(shù)。2023/9/2125中位數(shù)例9例正常人的發(fā)汞值(

mol/kg):

1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.2

2023/9/2126平均數(shù)(average)LP1P2P3P4HP97P98P991%1%1%1%1%1%1%同樣有十分位數(shù)、四分位數(shù)……百分位數(shù)(percentile)2023/9/2127

M=P50排序數(shù)據(jù):按從小到大順序排列X%(100-X)%PXHL2023/9/2128平均數(shù)應(yīng)用的注意事項(xiàng)同質(zhì)的資料計(jì)算平均數(shù)才有意義根據(jù)資料分布的特征選用適當(dāng)?shù)钠骄鶖?shù)均數(shù):?jiǎn)畏鍖?duì)稱分布的資料幾何均數(shù):各變量值之間成倍數(shù)關(guān)系,分布呈偏態(tài),經(jīng)對(duì)數(shù)變換后呈單峰對(duì)稱分布資料中位數(shù):理論上可用于任何分布資料,但當(dāng)資料適合計(jì)算均數(shù)或幾何均數(shù)時(shí),不宜用中位數(shù)。(偏態(tài)分布、不規(guī)則分布資料、有不確定值的資料)2023/9/2129平均數(shù)應(yīng)用的注意事項(xiàng)計(jì)算幾何均數(shù)時(shí):變量值中不能有0

同一組變量值不能同時(shí)存在正、負(fù)值若變量值全為負(fù)值,可先將負(fù)號(hào)除去,算出結(jié)果后再冠以負(fù)號(hào)樣本含量較少時(shí)不宜計(jì)算靠近兩端的百分位數(shù)

平均數(shù)要與變異指標(biāo)結(jié)合使用2023/9/2130看一個(gè)例子:有甲、乙兩組同性別同年齡兒童體重(kg):甲組26,28,30,32,34=30kgn甲=5

乙組24,27,30,33,36=30kgn乙=5上述兩組數(shù)據(jù)的特點(diǎn):集中位置相同:均為30kg

離散程度不同:各觀察值離均數(shù)的遠(yuǎn)近不同2023/9/2131離散趨勢(shì)的描述全距(Range)

亦稱極差,記為R,是一組變量值中最大值與最小值之差。優(yōu)點(diǎn):簡(jiǎn)單明了缺點(diǎn):不靈敏、不穩(wěn)定

2023/9/2132離散趨勢(shì)的描述四分位數(shù)間距(interquartilerange)

定義為:

QL~QU,即中間一半觀察值的極差。 四分位數(shù)(quartile)是兩個(gè)特定的百分位數(shù):第25%分位數(shù)P25,和第75%分位數(shù)P75,分別記為QL和QU。

四分位數(shù)間距較全距穩(wěn)定,常與中位數(shù)一起,描述不對(duì)稱分布資料的特征。2023/9/213325%25%25%25%排序數(shù)據(jù):按從小到大順序排列MQLQUinter-quartilerangeQ2Q1Q32023/9/2134離散趨勢(shì)的描述方差(Variance)和標(biāo)準(zhǔn)差(StandardDeviation)總體均數(shù)

未知,用樣本均數(shù)估計(jì)

2023/9/2135標(biāo)準(zhǔn)差“離均差平方之和平均后的方根”“均方根”n-1稱為(標(biāo)準(zhǔn)差的)自由度,即“可以自由變異的程度”分子有n項(xiàng)離均差,但只有n-1項(xiàng)獨(dú)立,根據(jù)任一離均差均可以用另外n-1個(gè)離均差表示,所以“只有n-1個(gè)獨(dú)立的離均差”。2023/9/2136標(biāo)準(zhǔn)差大:分布分散、不整齊、波動(dòng)大;標(biāo)準(zhǔn)差小:分布集中、整齊、波動(dòng)較小。2023/9/2137離散趨勢(shì)的描述變異系數(shù)(coefficientofvariation)亦稱離散系數(shù)(coefficientofdispersion),是標(biāo)準(zhǔn)差s與均數(shù)之比,即:

2023/9/2138變異系數(shù)的兩個(gè)特點(diǎn)及相應(yīng)的用途

沒有單位反映標(biāo)準(zhǔn)差占均數(shù)的百分比或標(biāo)準(zhǔn)差是均數(shù)的幾倍可用來比較度量衡單位不同的資料的變異度

不受平均水平的影響反映的是以均數(shù)為基數(shù)的相對(duì)變異的大小比較均數(shù)相差懸殊的資料的變異度

2023/9/2139某地20歲男子100人,身高均數(shù)為171.06cm,標(biāo)準(zhǔn)差為4.95cm;體重均數(shù)為61.54kg,標(biāo)準(zhǔn)差為5.02kg,試比較身高和體重的變異。

身高體重

2023/9/2140絕對(duì)變異受平均水平的影響相對(duì)變異排除了平均水平的影響年齡組人數(shù)均數(shù)標(biāo)準(zhǔn)差變異系數(shù)(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.14個(gè)不同年齡組兒童身高(cm)的變異

2023/9/2141平均數(shù)與變異度的關(guān)系

平均數(shù)表示的集中性與變異度表示的離散性,是從兩個(gè)不同的角度闡明計(jì)量資料的特征變異度越小,平均數(shù)對(duì)各變量值的代表性越好

變異度越大,平均數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論