




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
公共衛(wèi)生學(xué)系流行病與統(tǒng)計學(xué)教研室郭忠琴醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)要求:1.掌握:描述計量資料集中趨勢、離散趨勢的各統(tǒng)計指標(biāo)的計算方法和適用條件2.熟悉:計量資料的頻數(shù)分布表的編制方法和分布特征
第一節(jié)頻數(shù)分布一、頻數(shù)分布表搜集到原始數(shù)據(jù)后,要了解數(shù)據(jù)分布的范圍、數(shù)據(jù)最集中的區(qū)間以及分布的形態(tài),可通過編制頻數(shù)分布表來實現(xiàn)。頻數(shù):對一個隨機(jī)變量做重復(fù)觀察,其中某變量值出現(xiàn)的次數(shù)。頻數(shù)分布表:將各變量值及其相應(yīng)的頻數(shù)列成表格的形式。
編制頻數(shù)分布的步驟
例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇(mmol/L)的測量結(jié)果如下,試編制頻數(shù)分布表。表2-1某地101名正常成年女子血清總膽固醇資料2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.502.704.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.803.414.123.955.084.533.923.585.353.843.603.514.063.073.554.233.574.833.523.844.503.964.503.274.523.194.593.753.984.134.263.633.875.713.304.734.175.133.784.573.803.933.783.994.484.284.065.265.253.985.033.513.863.023.704.333.293.254.154.364.953.003.26步驟:
(1)
求全距:(極差)
(2)
定組距:以全距的1/10取整作為組距
(3)
劃組段:10~15個組段;以一個稍小于或等于最小值的整數(shù)作為第一個組段的起點數(shù)據(jù)。
下限:每個組段的起點(最小值)。
上限:每個組段的終點(最大值)。
注:最后一個組段應(yīng)同時寫出上限和下限來。
(4)
繪制整理表
注:各組段的頻數(shù)之和應(yīng)等于總的觀察例數(shù)。
組距:相鄰兩組段的下限之差血清膽固醇組段(1)劃記(2)頻數(shù)(3)
2.30~2.60~2.90~3.20~3.50~3.80~4.10~4.40~4.70~5.00~5.30~5.60~
一下正一正下正正正丅正正正正正正正丅正正丅正止正丅一
1368172017129521表2-2某地101名正常成年女子血清總膽固醇的頻數(shù)表合計
140二、頻數(shù)分布圖以橫軸表示被觀察變量,縱軸表示頻數(shù),以各矩形(寬度為組距)的高度代表各組段的頻數(shù)。
各組段的組距必須相等三、頻數(shù)表和頻數(shù)分布圖的用途
1.描述頻數(shù)分布的類型
頻數(shù)分布對稱分布:指集中位置在正中,左右兩側(cè)頻數(shù)分布大體對稱。偏態(tài)分布:指集中位置偏向一側(cè),頻數(shù)分布不對稱。偏態(tài)分布正偏態(tài)分布:集中位置偏向數(shù)值小的一側(cè)。負(fù)偏態(tài)分布:集中位置偏向數(shù)值大的一側(cè)。2.描述頻數(shù)分布的特征
集中趨勢(centraltendency):一組數(shù)據(jù)向某一個位置聚集或集中的傾向。離散趨勢(tendencyofdispersion):一組數(shù)據(jù)的分散性或變異度。變異:遺傳、營養(yǎng)、行為、發(fā)育、心理的各種因素同質(zhì):同一地區(qū)、同一年度、同一民族、同一年齡段、相同的性別、類似健康狀況血清膽固醇組段(1)劃記(2)頻數(shù)(3)
2.30~2.60~2.90~3.20~3.50~3.80~4.10~4.40~4.70~5.00~5.30~5.60~
一下正一正下正正正丅正正正正正正正丅正正丅正止正丅一
1368172017129521表2-2某地101名正常成年女子血清總膽固醇的頻數(shù)表合計
140從中央部分到兩側(cè)的頻數(shù)分布逐漸減少、血清膽固醇的的值參差不齊——離散趨勢血清膽固醇值向中央部分集中,即中等含量者居多—集中趨勢3.便于進(jìn)一步計算統(tǒng)計指標(biāo)和進(jìn)行統(tǒng)計分析處理。
4.便于發(fā)現(xiàn)某些特大或特小的可疑值。
90~192~094~096~098~0100~0110~112~114~116~118~120~122~124~126~128~130~132~134~136139915182114104321110名7歲男童身高(cm)的頻數(shù)分布
第二節(jié)集中趨勢的描述
計量資料的統(tǒng)計描述
統(tǒng)計圖表:頻數(shù)分布表(圖)統(tǒng)計指標(biāo):集中趨勢指標(biāo)離散趨勢指標(biāo)
利用統(tǒng)計表對數(shù)據(jù)進(jìn)行概括,用統(tǒng)計圖對分布形態(tài)及分布間的關(guān)系做直觀的表達(dá),用于描述計量資料的統(tǒng)計指標(biāo)的意義與計算。
平均數(shù)(average):描述一組同質(zhì)定量資料的集中趨勢;反映一組觀察值的平均水平;分布的平均位置。
平均數(shù)算術(shù)均數(shù)(Arithmeticmean)幾何均數(shù)(Geometricmean)中位數(shù)(Median)一、算術(shù)均數(shù)(arithmeticmean):簡稱均數(shù)(mean),總體均數(shù)用希臘字母μ表示,樣本均數(shù)用拉丁字母表示。
計算方法
1)直接法:適用于樣本例數(shù)n較少的資料。
其中x1、x2…xn為各變量值,n為樣本例數(shù)。
例測得8只正常大白鼠總酸性磷酸酶(TACP)
含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。分析:樣本例數(shù)較少,n=8,用直接法計算。8只正常大白鼠總酸性磷酸酶平均含量為3.91(U/L)
2)加權(quán)法(weightmethod):適用于變量值較多的資料。
:各組段的組中值。f1、f2…fn:各組段的頻數(shù),它權(quán)衡了各組中值由于頻數(shù)不同對均數(shù)的影響(式中變量值的頻數(shù)愈大,則該變量值對均數(shù)的影響愈大,因此頻數(shù)也稱為權(quán)數(shù))。組段頻數(shù)(f)組中值()fx2.30~12.452.452.60~32.758.252.90~63.0518.303.20~83.3526.803.50~173.6562.053.80~203.9579.004.10~174.2572.254.40~124.5554.604.70~94.8543.655.00~55.1525.755.30~5.60~5.90215.455.7510.905.75合計101(Σf)409.75(Σfx)本組段下限與相鄰組段下限之和除以2X=(2.30+2.60)/2=2.45X=(2.60+2.90)/2=2.7510,10,10,15,1510有3個,權(quán)數(shù)為3,計算均數(shù)時起3/5的作用——頻數(shù)多,權(quán)數(shù)大,作用大15有2個,權(quán)數(shù)為2,計算均數(shù)時起2/5的作用——頻數(shù)小,權(quán)數(shù)小,作用小
例2-3
根據(jù)表2-1的資料計算101名正常成年女子的血清膽固醇的均數(shù)。分析:樣本例數(shù)較多,n=101,用加權(quán)法計算。101名成年女子血清總膽固醇值均數(shù)計算表(加權(quán)法)組段頻數(shù)(f)組中值()fx2.30~12.452.452.60~32.758.252.90~63.0518.303.20~83.3526.803.50~173.6562.053.80~203.95794.10~174.2572.254.70~94.8543.655.00~55.1525.755.30~25.1510.905.60~5.9015.455.75合計140(Σf)5.75669.8(Σfx)X=(2.30+2.60)/2=2.45
即:140名健康成人的紅細(xì)胞均數(shù)為4.78×1012/L
2.
均數(shù)的兩個重要特性
1.各離均差的總和等于0。(總體中各變量值X與均數(shù)之差稱為離均差)
離均差的平方和小于各觀察值X與任何數(shù)a之差的平方和。即<
2.均數(shù)的應(yīng)用
均數(shù)反映全部觀察值的平均數(shù)量水平。最適用于對稱分布資料,尤其是正態(tài)分布資料。均數(shù)位于對稱(正態(tài))分布的中心,最能反映資料的集中趨勢。均數(shù)的適用條件幾何均數(shù)(geometricmean)即幾何平均數(shù),用G表示適用條件:變量值呈對數(shù)正態(tài)分布或變量值為等比數(shù)列(如血清抗體滴度)的資料。定義式:計算方法:(1)直接法(小樣本)(2)加權(quán)法(大樣本)二、幾何均數(shù)計算方法:二、幾何均數(shù)1)直接法:適用于樣本例數(shù)n較少的資料。將n個觀察值X1,X2,X3…Xn的乘積開n次方
對數(shù)形式:例2-4某地5例溦絲蚴血癥患者治療七年后用間接熒光抗體試驗測得其抗體滴度倒數(shù)分別為10,20,40,40,160,求其平均滴度。平均滴度為1:34.8計算方法:(2)加權(quán)法二、幾何均數(shù)X1,X2…Xn為各組段的滴度或滴度倒數(shù)。f1,f2…fk分別為各組段的頻數(shù)。表2-469例RA患者血清EBV-VCA-IgG抗體滴度的測定結(jié)果抗體滴度人數(shù)f滴度倒數(shù)XlgXflgX(1)(2)(3)(4)(5)1:104101.00004.00003.90301:203201.30101:4010401.602116.02101:8010801.903119.03101:16011602.204124.24511:320153202.505137.57651:640146402.806239.28681:1280212803.10726.2144合計69——150.2778
二)幾何均數(shù)應(yīng)用的注意事項:
1)幾何均數(shù)常用于等比級數(shù)資料或?qū)?shù)正態(tài)分布資料。
2)觀察值中不能有0。
3)觀察值中不能同時有正值和負(fù)值。
三、中位數(shù)與百分位數(shù)(一)中位數(shù)中位數(shù)(median)是一組按大小順序排列的變量值,其位次居中的數(shù)值,用M表示。適用條件:當(dāng)一組變量值呈偏態(tài)分布,或資料的分布情況不清楚,或變量值一端(或兩端)無確定數(shù)值,均可用中位數(shù)表示其集中趨勢。中位數(shù)的計算方法(1)直接法(小樣本)將觀察值按大小順序排列,當(dāng)n為奇數(shù)時,中間那個數(shù)就是中位數(shù)。當(dāng)n為偶數(shù)時,中間兩個數(shù)的平均數(shù)就是中位數(shù)。
定義式:當(dāng)n為奇數(shù)時當(dāng)n為偶數(shù)時
例2-67名患某病的潛伏期分別為2,3,4,5,6,9,16天,求其平均潛伏期。n為奇數(shù),M=5(天)例2-78名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時,求其平均潛伏期。n為偶數(shù),M=1/2(3+5)=4(小時)(二)百分位數(shù)百分位數(shù)(Px):指把數(shù)據(jù)從小到大排列后位于第X%位置的數(shù)值。有n個觀察值X1,X2…Xn,把他們由小到大按順序排列成X1≤X2≤X3…≤Xn,將這n個觀察值平均的分為100等份,對應(yīng)于前面X%個位置的數(shù)值稱為第X百分位數(shù),用Px表示。
一個百分位數(shù)Px將總體或樣本的全部觀察值分為兩部分,理論上,在不包括Px的全部數(shù)據(jù)中有X%的觀察值比它小,有(100-X)%的觀察值比它大。中位數(shù)和百分位數(shù)計算方法2)頻數(shù)表法(大樣本)累計頻數(shù):本組段的頻數(shù)與以前各組段的頻數(shù)相加;
累計頻率:每組段的累計頻數(shù)除以總例數(shù)。
天數(shù)人數(shù)f累計頻數(shù)累計頻率(%)(1)(2)(3)(4)12~443.424~172117.836~325344.948~247765.360~189580.572~1210790.784~511294.996~411698.3108~2118100.0表2-5118名鏈球菌咽喉炎患者的潛伏期例2-9某地118名鏈球菌咽喉炎患者的潛伏期頻數(shù)表見表2-5第(1)、(2)欄,求中位數(shù)及P25、P75。中位數(shù)和百分位數(shù)的應(yīng)用
1)中位數(shù)常用于描述偏態(tài)分布資料的集中趨勢,反映位次居中的觀察值的平均水平。在對稱分布的資料中,中位數(shù)和均數(shù)在理論上是相同的。
2)百分位數(shù)可用于確定醫(yī)學(xué)參考值范圍。
3)分布中部的百分位數(shù)相當(dāng)穩(wěn)定,具有較好的代表性,但靠近兩端的百分位數(shù),只有在樣本例數(shù)足夠多時才比較穩(wěn)定。四、應(yīng)用平均數(shù)的注意事項
1.平均數(shù)的計算和應(yīng)用必須具備同質(zhì)基礎(chǔ),必須先合理分組。
不同質(zhì)的事物要分別求平均數(shù),以便分析比較。
2.根據(jù)資料的分布選用適當(dāng)?shù)钠骄鶖?shù)。對稱分布資料,尤其是正態(tài)分布資料,宜用均數(shù),也可用中位數(shù),而偏態(tài)分布資料則中位數(shù)的代表性較好,對數(shù)正態(tài)分布及等比級數(shù)資料宜用幾何均數(shù)。
二、離散趨勢的統(tǒng)計描述
例2-10試對以下三組同齡男孩身高指標(biāo)進(jìn)行統(tǒng)計描述。甲組9095100105110乙組9698100102104丙組9699100101104變異指標(biāo)又稱離散指標(biāo),用以描述一組同質(zhì)變量值之間參差不齊的程度,即離散度。對一組變量值的描述,除了需說明其平均水平外,還要說明其變異程度大小。表示變異程度的指標(biāo)有極差、方差、四分位數(shù)間距、標(biāo)準(zhǔn)差及變異系數(shù)一、極差
也稱為全距,用R表示,即一組資料中,最大值與最小值之差。
缺點:1)除了最大、最小值外,不能反映組內(nèi)其他數(shù)據(jù)的變異度。2)樣本例數(shù)越多,抽到較大或較小變量值的可能性越大,因而極差可能越大。3)樣本例數(shù)相同,極差的抽樣誤差也較大。R甲=110-90=20(cm)R乙=104-96=8(cm)R丙=104-96=8(cm)二、四分位數(shù)間距(quartilerange,Q)
P25表示全部觀察值中有25%(1/4)的觀察值比它小,記為下四分位數(shù)QL,P75表示全部觀察值中有25%(1/4)的觀察值比它大,記為上四分位數(shù)QU。
Q適用于各種類型的連續(xù)型變量,特別是偏態(tài)分布的資料的離散趨勢的描述。
天數(shù)人數(shù)f累計頻數(shù)累計頻率(%)(1)(2)(3)(4)12~443.424~172117.836~325344.948~247765.360~189580.572~1210790.784~511294.996~411698.3108~2118100.0表2-5118名鏈球菌咽喉炎患者的潛伏期例2-11某地118名鏈球菌咽喉炎患者的潛伏期頻數(shù)表見表2-5第(1)、(2)欄,求P25、P75及四分位數(shù)間距。
三、方差(variance)和標(biāo)準(zhǔn)差
乙組9698100102104丙組9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 南大版一年級心理健康第11課《我要舉手發(fā)言》課件
- 6.2多彩的職業(yè)課件- -2024-2025學(xué)年統(tǒng)編版道德與法治九年級下冊
- 6.1學(xué)無止境課件- -2024-2025學(xué)年統(tǒng)編版道德與法治九年級下冊
- 建筑工程安全管理模板工程坍塌案例課件
- APx515音頻分析儀儀器AP培訓(xùn)資料
- 湖北警官學(xué)院《大數(shù)據(jù)平臺核心技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北省唐山市玉田縣2024-2025學(xué)年四下數(shù)學(xué)期末教學(xué)質(zhì)量檢測試題含解析
- 昌吉學(xué)院《人工智能專業(yè)導(dǎo)論與研討》2023-2024學(xué)年第二學(xué)期期末試卷
- 無錫太湖學(xué)院《副教學(xué)訓(xùn)練理論與實踐(1)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024-2025學(xué)年安徽省宣城市郎溪縣數(shù)學(xué)三下期末考試試題含解析
- 華東師范大學(xué)《社會學(xué)概論》2023-2024學(xué)年第一學(xué)期期末試卷
- 建筑工程財務(wù)流程制度(6篇)
- 閥門培訓(xùn)課件
- 2024年四川省公務(wù)員錄用考試《行測》真題及答案解析
- 2024全新醫(yī)務(wù)人員手衛(wèi)生課件
- 高考英語一輪復(fù)習(xí)知識清單(全國版)專題01++定語從句十大考點歸納(清單)+含答案及解析
- 培訓(xùn)機(jī)構(gòu)收費退費管理規(guī)定
- 愛學(xué)習(xí)平臺登錄入口
- 臨床癲癇MR成像與常見疾病
- 《基巖標(biāo)建設(shè)技術(shù)導(dǎo)則》
- 《管理研究方法》教學(xué)大綱
評論
0/150
提交評論