醫(yī)學統(tǒng)計學-72h分布_第1頁
醫(yī)學統(tǒng)計學-72h分布_第2頁
醫(yī)學統(tǒng)計學-72h分布_第3頁
醫(yī)學統(tǒng)計學-72h分布_第4頁
醫(yī)學統(tǒng)計學-72h分布_第5頁
免費預覽已結束,剩余47頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章數值變量資料的統(tǒng)計描述2.1數值變量資料的頻數表個體變異的規(guī)律性個體變異(individualvariation)是同質觀察對象間表現出的差異。變異是生物體在一種或多種、已知或未知的不可控因素作用下所產生的綜合反映。個體變異的規(guī)律性:分布就每個觀察單位而言,其觀察指標的變異是不可預測的,或者說是隨機的(random)。就總體而言,個體變異是有規(guī)律的。變異規(guī)律的體現:分布(distribution)何為分布?刀魚分布在長江下游水域熊貓分布在溫暖多雨的山區(qū),尤以中國西南部例1:某市某年12歲男童120人的身高(cm)資料如下

142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9原因:由于個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)?,F狀:醫(yī)學研究得到的原始數據(rawdata)往往是龐大的、混亂的。解決:頻數分布表的基本思想:將原始數據按照一定的標準劃分為若干各組,合計各組的頻數,得到頻數分布表;再將頻數表繪制成頻數分布圖:直方圖1.頻數表的編制①找出極大值和極小值,并計算極差R此例R=160.9-125.9=35②依R分組,確定組數組距組段,常取8-15組,用1/10R取整作組距,這里取4③計算頻數表某年某市120名12歲男童的身高(cm)頻數分布組段(1)頻數(3)頻率(4)124~10.0083128~20.0167132~100.0833136~220.1834140~370.3083144~260.2167148~150.1250152~40.0333156~20.0167160~10.0083合計1201.0000

圖某市120名12歲男童身高的頻數分布

124132140148156164010203040人數身高(cm)2.頻數表的用途①可揭示資料的分布特征和分布類型

分布類型:

對稱:均數在正中,左右頻數對稱

偏態(tài):正偏態(tài),如以兒童為主的傳染病的患者年齡負偏態(tài),如一些慢性病的患者年齡120名7歲男童身高的頻數分布圖124132140148156164010203040人數身高(cm)對稱分布70

3

5

7

9

11

13

15

17

19

21

10

20

30

40

50

60

0

1

人數發(fā)汞含量(mol/kg)239人發(fā)汞含量的頻數分布

偏態(tài)分布0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

人數自評分某城市892名老年人生存質量自評分的頻數分布

偏態(tài)分布0

5

10

15

20

25

30

35

40

45

0

10203040

人數生存時間(月)102名黑色素瘤患者的生存時間頻數分布0102030405060708001000200030004000人數死亡年齡(歲)某地某年10000例死亡者年齡分布2.頻數表的用途②進一步計算其它統(tǒng)計指標和統(tǒng)計分析處理③便于發(fā)現某些可疑值

棄卻最大一個數Xn,若r=(Xn-Xn-1)/(Xn-X1)>1/3

棄卻最小一個數X1,若

r=(X2-X1)/(Xn-X1)>1/32.頻數表的用途2.2集中趨勢的描述:平均數(average)

平均數用來說明某種現象或事物數量的中等水平。求平均數必須注意:①同質的事物或現象才能求平均數②由資料的分布選用適當的平均數一.算術均數(arithmeticmean)1.計算方法一:直接法

樣本觀察值X1,X2,…,Xn例10名7歲男童體重(kg)分別為:17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求平均體重。2.計算方法二:加權法加權均數(weightedmean)

均數是加權均數的一個特例均數的特性:各離均差Xi-之和=0即Σ(X-)=0適用于對稱分布資料,尤其是正態(tài)分布資料,對于偏態(tài)資料則不理想二.幾何平均數(geometricmean)1.適用范圍:某些醫(yī)學資料,如抗體的滴度、率或比的變化速度等,頻數分布明顯偏態(tài),尤其適用于一些對數正態(tài)分布資料要求觀察值中不能有0,且不可正負值均有。2.計算方法:直接法

例5人的血清滴度為1:2,1:4,1:8,1:16,1:32,求平均滴度。先求平均滴度的倒數,平均滴度為1:8

加權法(資料中相同觀察值的個數f較多時,如頻數表資料)

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282例

40名麻疹易感兒接種麻疹疫苗后一個月,血凝抑制抗體滴度如下,求平均滴度。

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

G=lg-11.6782=48

平均滴度為1:48

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282

抗體滴度人數f滴度倒數xlgxflgx1:4140.60210.60211:8480.90313.61241:165161.20416.02051:328321.505112.04081:6411641.806219.86711:12861282.107212.64321:25642562.40829.63281:51215122.70932.709340

67.1282三.中位數(median)和百分位數(percentile)

1.將一組觀察值從小到大排列,位次居中的觀察值稱為中位數,記作M。

百分位數(記Px)將總體或樣本的所有觀察值分成兩部分,理論上有x%的觀察值比它小,有(100-x)%的值比它大描述集中位置的指標:百分位數百分位數(percentile)X%

PX(100-X)%50%分位數就是中位數25%,75%分位數稱四分位數(quartile)

2.

適用范圍:1)描述偏態(tài)分布資料的集中位置2)資料有個別特大特小值3)一端或兩端有不確定的數值3.

計算①直接由原始數據計算中位數

將觀察值依順序排列

X(1)、X(2)、…、X(n)

n奇M=X((n+1)/2)

n偶M=(X(n/2)+X(n/2+1))/2中位數例9例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.2

中位數例對于某項風險較高的新手術術后的生存時間進行跟蹤,共調查了7人,6人死亡之前分別生存了5天、6天、10天、16天、25天、29天,還有一人術后30天隨訪時仍存活。本資料屬于“開口”資料。本例數據已經按從小到大的升序排列,n=7,為奇數,其中位數為16天。②用頻數表計算中位數和百分位數

l

按所分組段,由小到大計算累計頻數和累計頻率,找出Px所在的組段

l

求百分位數

其中fx為Px所在組段的頻數

i為該組段的組距,L為其下限

ΣfL為小于L各組段的累計頻數四.眾數(mode)指一組觀察值出現次數最多的值。觀察例數較少時,眾數無實際意義。一組觀察值可能有幾個眾數。2.3

離散程度的描述平均數并不能使我們全面地認識事物只用平均數描述資料的弊病甲組2629303134均數30kg乙組2427303336均數30kg丙組2628303234均數30kg丙乙甲三組兒童體重的離散程度只用平均數描述資料的弊病IthasbeensaidthatafellowwithonelegfrozeniniceandtheotherleginboilingwateriscomfortableONAVERAGE!一.全距(range)極差R=max-min優(yōu)點:簡單缺點:①只用到最大、最小值,樣本信息沒能充分利用②當資料呈明顯偏態(tài)時,最大、最小值不穩(wěn)定③樣本例數越多,R可能越大,2組觀察值例數懸殊時不用R比較。二.

四分位間距(inter-quartilerange)Q

極差不穩(wěn)定,主要是受兩端的極值影響,所以有人建議將兩端數據截去一定比例,如各去掉25%Q=p75-p25=Qu-QL用于偏態(tài)分布三.方差(variance)σ2

總體方差σ2=在樣本中,μ未知,常用替代,S2=四.標準差(standarddeviation)總體標準差σ=樣本標準差

n-1:自由度(degreeoffreedom)例求甲、丙兩組數據的標準差甲組2629303134乙組2427303336丙組2628303234

極差方差標準差甲組88.50 2.92乙組1222.50 4.74丙組8 10.00 3.16五.變異系數(coefficientofvariation)C.V.

適用于各組觀察值單位不同或單位雖同而平均數相差很大的情況。例如1同年齡同性別學生的身高和體重兩組觀察值。2同年齡同性別學生的身高和胸圍兩組觀察值。3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論