第02章 數(shù)值變量的描述_第1頁(yè)
第02章 數(shù)值變量的描述_第2頁(yè)
第02章 數(shù)值變量的描述_第3頁(yè)
第02章 數(shù)值變量的描述_第4頁(yè)
第02章 數(shù)值變量的描述_第5頁(yè)
已閱讀5頁(yè),還剩68頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章計(jì)量資料的統(tǒng)計(jì)描述第一節(jié)頻數(shù)分布第二節(jié)集中趨勢(shì)的描述第三節(jié) 離散趨勢(shì)的描述第四節(jié)正態(tài)分布第五節(jié)醫(yī)學(xué)參考值范圍的制定第一節(jié)頻數(shù)分布

一、頻數(shù)分布表(frequencytable)

例2-1測(cè)得130名健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876(1)求極差(range):即最大值與最小值之差,又稱為全距。R=84–57=27(次/分)(2)決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個(gè)組。組距=極差/組數(shù),為方便計(jì),組距為極差的十分之一,再略加調(diào)整。27/10=2.7≈3

(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值。56~59~……80~83~85(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。頻數(shù)表的編制步驟表2-1130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f

二、頻數(shù)分布圖三、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類型(對(duì)稱分布、偏態(tài)分布)

(1)對(duì)稱分布:若各組段的頻數(shù)以中心位置左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布(2)偏態(tài)分布:

1)右偏態(tài)分布(正偏態(tài)分布):右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。

表2-2115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布

2)左偏態(tài)分布(負(fù)偏態(tài)分布):

左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。

表2-3101名正常人的血清肌紅蛋白含量分布2.描述頻數(shù)分布的特征表2-1數(shù)據(jù)的頻數(shù)分布特征:①數(shù)據(jù)變異(離散)的范圍在57~84(次/分)②數(shù)據(jù)集中(平均)的組段在68~73(次/分)之間,尤以組段的人數(shù)71~(次/分)最多。且上下組段的頻數(shù)分布基本對(duì)稱。3.便于發(fā)現(xiàn)一些特大或特小的可疑值

4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)

集中趨勢(shì)的描述

統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體系來(lái)描述一組變量值的集中位置或平均水平。常用的平均數(shù)有:

算術(shù)均數(shù)(均數(shù))(mean)幾何均數(shù)(geometricmean)中位數(shù)(median)與百分位數(shù)(percentile)

眾數(shù)(mode)

一、算術(shù)均數(shù)算術(shù)均數(shù):簡(jiǎn)稱均數(shù)(mean)

可用于反映一組呈對(duì)稱分布的變量值在數(shù)量上的平均水平或者說(shuō)是集中位置的特征值。1、計(jì)算方法(1)直接計(jì)算法

公式:舉例:試計(jì)算4,4,4,6,6,8,8,8,10的均數(shù)?例2-1測(cè)得130健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876(2)加權(quán)法(利用頻數(shù)表):公式:k:頻數(shù)表的組段數(shù),f:頻數(shù),X:組中值。表2-2130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f∑fX∑fX22、應(yīng)用

均數(shù)適用于對(duì)稱分布,特別是正態(tài)分布資料。二、幾何均數(shù)(geometricmean)

可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

其他對(duì)數(shù)(如自然對(duì)數(shù))變換獲得相同的幾何均數(shù)例2-5有8份血清的抗體效價(jià)分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價(jià)。平均抗體效價(jià)為:1:57(2)加權(quán)法公式:

例2-669例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見(jiàn)表2-4第(1)、(2)欄,求其平均抗體滴度。2、應(yīng)用:

適用于成等比數(shù)列的資料,特別是服從對(duì)數(shù)正態(tài)分布資料。三、

中位數(shù)與百分位數(shù)11個(gè)大鼠存活天數(shù):4,10,7,50,3,15,2,9,13,>60,>60平均存活天數(shù)?(一)中位數(shù)(median)是將每個(gè)變量值從小到大排列,位置居于中間的那個(gè)變量值。

計(jì)算公式:

n為奇數(shù)時(shí)

n為偶數(shù)時(shí)

例2-39名中學(xué)生甲型肝炎的潛伏期分別為12,13,14,14,15,15,15,17,19天,求其中位數(shù)。頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)M例2-1頻數(shù)表中位數(shù)的計(jì)算N=∑f中位數(shù)=71+3x[(130x50%-59)/26]=71.69應(yīng)用1、各種分布類型的資料2、特別適合大樣本偏態(tài)分布資料或者一端或兩端無(wú)確切數(shù)值的資料。

百分位數(shù)示意圖(二)百分位數(shù)(percentile)1.直接計(jì)算法

設(shè)有n個(gè)原始數(shù)據(jù)從小到大排列,第X百分位數(shù)的計(jì)算公式為:當(dāng)為帶有小數(shù)位時(shí):

當(dāng)為整數(shù)時(shí):Trunc()取整函數(shù)

例對(duì)某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),120名患者的住院天數(shù)從小到大排列如下,試求第5百分位數(shù)和第99百分位數(shù)。患者:住院天數(shù):

(1)n=120,

,為整數(shù):

(2),帶有小數(shù),故取整trunc(118.8)=118患者:住院天數(shù):2.頻數(shù)表法

公式:

當(dāng)時(shí),公式(2-9)即為中位數(shù)的計(jì)算公式

例2-9試分別求例2-1頻數(shù)表的第25、第75百分位數(shù)。P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66正態(tài)分布時(shí):均數(shù)=中位數(shù)

正偏態(tài)分布時(shí):均數(shù)>中位數(shù)

負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)設(shè)有甲、乙、丙三名醫(yī)生,分別對(duì)相同的5份血樣進(jìn)行紅細(xì)胞計(jì)數(shù)(萬(wàn)/mm3):甲:560、540、500、460、440乙:520、510、500、490、480丙:510、505、500、495、490三名醫(yī)生的計(jì)數(shù)結(jié)果得到的均數(shù)均為500,5個(gè)數(shù)值之和均為2500。

第三節(jié)離散趨勢(shì)的描述甲醫(yī)生得出的5個(gè)觀察值間的差異(離散程度)較大,而丙醫(yī)生得出的5個(gè)觀察值間的差異(離散程度)較小。常用統(tǒng)計(jì)指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。一、極差(Range)極差,用R表示:即一組變量值最大值與最小值之差。對(duì)于書(shū)中例2-1數(shù)據(jù),有簡(jiǎn)單,但僅利用了兩端點(diǎn)值,穩(wěn)定性差。二、四分位數(shù)間距

(quartilerange)

四分位數(shù)間距,用Q表示:

Q=下四分位數(shù):上四分位數(shù):例2-1數(shù)據(jù)P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66三、方差與標(biāo)準(zhǔn)差

1.方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。

總體方差

樣本方差

離均差平方和SS

2、公式:樣本標(biāo)準(zhǔn)差用表示,其度量單位與均數(shù)一致,所以最常用。公式:離均差平方和SS

標(biāo)準(zhǔn)差的公式還可以寫(xiě)成:利用頻數(shù)表計(jì)算標(biāo)準(zhǔn)差的公式為例2-11對(duì)例2-1的前10個(gè)數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計(jì)算標(biāo)準(zhǔn)差。例2-12利用表2-2中的數(shù)據(jù)和頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差。N=∑f∑fX∑fX2標(biāo)準(zhǔn)差的意義和用途說(shuō)明資料的離散趨勢(shì)(或變異程度),標(biāo)準(zhǔn)差的值越大,說(shuō)明變異程度越大,均數(shù)的代表性越差;...。標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報(bào)告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來(lái)描述資料的集中趨勢(shì)與離散趨勢(shì)。用于計(jì)算變異系數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論