2、-第二章 數(shù)值變量統(tǒng)計描述課件_第1頁
2、-第二章 數(shù)值變量統(tǒng)計描述課件_第2頁
2、-第二章 數(shù)值變量統(tǒng)計描述課件_第3頁
2、-第二章 數(shù)值變量統(tǒng)計描述課件_第4頁
2、-第二章 數(shù)值變量統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Schoolofpublichealth,ShandongUniversity數(shù)值變量資料的統(tǒng)計描述

DescriptiveStatistics

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述統(tǒng)計描述統(tǒng)計推斷指標(biāo)描述圖表描述參數(shù)估計假設(shè)檢驗變量關(guān)系統(tǒng)計設(shè)計統(tǒng)計分析實驗設(shè)計調(diào)查設(shè)計研究內(nèi)容統(tǒng)計描述:利用統(tǒng)計圖、統(tǒng)計表、統(tǒng)計指標(biāo)等來描述樣本資料的特征。

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述頻數(shù)分布表(frequencytable)

離散型資料(discretedata):是指變量取值可以一一列舉的資料。例如,每個育齡婦女現(xiàn)有的子女?dāng)?shù)。

如1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7。

連續(xù)型資料(continuitydata):是指變量取值不能一一列舉(即變量取值為一定范圍內(nèi)的任意值)的資料。例如,人體的身高(cm)、體重(kg)等。

數(shù)值變量資料的分類:

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述表2-11998年某地96名孕婦產(chǎn)前檢查次數(shù)分布檢查次數(shù)(1)頻數(shù)(2)頻率(%)(3)0

4

4.21

7

7.321111.531313.542627.152324.0>51212.5合計96

100.0

離散型資料(discretedata)

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述根據(jù)表2-1頻數(shù)的分布可繪出頻數(shù)分布圖。

DescriptiveStatistics頻數(shù)分布表(frequencytable)

離散型資料(discretedata)2、-第二章數(shù)值變量統(tǒng)計描述1998年某校100名18歲健康女大學(xué)生(cm)資料

DescriptiveStatistics頻數(shù)分布表(frequencytable)

連續(xù)型資料(continuitydata)2、-第二章數(shù)值變量統(tǒng)計描述1998年某校100名18歲健康女大學(xué)生(cm)資料

DescriptiveStatistics頻數(shù)分布表(frequencytable)

連續(xù)型資料(continuitydata)2、-第二章數(shù)值變量統(tǒng)計描述例1測得130名健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876

頻數(shù)表的編制:

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述(1)求極差(range):即最大值與最小值之差,又稱為全距。R=84–57=27(次/分)(2)決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個組。組距=極差/組數(shù),為方便計,組距為極差的十分之一,再略加調(diào)整。27/10=2.7≈3

(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值。56-59-……80-83-85(4)劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。

DescriptiveStatistics頻數(shù)分布表(frequencytable)

頻數(shù)表的編制:2、-第二章數(shù)值變量統(tǒng)計描述表2-3130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f

DescriptiveStatistics頻數(shù)分布表(frequencytable)

頻數(shù)表的編制:2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)分布圖

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表的編制:表2-4160名正常成年女子的血清甘油三酯(mmol/L)編號血清甘油三脂編號血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表的編制:(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=1.77-0.51=1.26(mmol/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=1.26/10=0.126≈0.1。(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表的編制:組段(1)劃記(2)頻數(shù),f(3)組中值,X(4)

fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5512.401.6~正81.6514.851.7~1.8

合計

31.755.25160182.30

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述

編制頻數(shù)表的基本步驟:頻數(shù)分布表(frequencytable)

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表的用途:頻數(shù)分布表(frequencytable)

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表的用途:1.描述頻數(shù)分布的類型和特征

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述(1)對稱分布:若各組段的頻數(shù)以中心位置左右兩側(cè)大體對稱,就認為該資料是對稱分布

頻數(shù)表的用途:1.描述頻數(shù)分布的類型和特征是否為對稱分布?

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述(2)偏態(tài)分布:1)正偏態(tài)分布:右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。2)負偏態(tài)分布:左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。

頻數(shù)表的用途:1.描述頻數(shù)分布的類型和特征

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述表2-3數(shù)據(jù)的頻數(shù)分布特征:①數(shù)據(jù)變異(離散)的范圍在57~84(次/分)②數(shù)據(jù)集中(平均)的組段在68~73(次/分)之間,尤以組段的人數(shù)71~(次/分)最多。且上下組段的頻數(shù)分布基本對稱。

頻數(shù)表的用途:1.描述頻數(shù)分布的類型和特征

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表的用途:2.便于發(fā)現(xiàn)一些特大或特小的可疑值3.便于進一步做統(tǒng)計分析和處理

DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計描述描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)統(tǒng)計上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的集中位置或平均水平。常用的平均數(shù)有:

算術(shù)均數(shù)(均數(shù))(mean)幾何均數(shù)(geometricmean)中位數(shù)(median)與百分位數(shù)(percentile)

眾數(shù)(mode)

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述

算術(shù)均數(shù)(arithmeticmean:簡稱均數(shù)(mean)

可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。

計算方法:直接法:例2.2某地隨機抽取10名18歲健康男大學(xué)生身高(cm)分別為168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7,求平均身高。(cm)

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例:測得130健康成年男子脈搏資料(次/分)如下,計算平均水平。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876

算術(shù)均數(shù)(arithmeticmean:簡稱均數(shù)(mean)直接法:

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述公式:k:頻數(shù)表的組段數(shù),f:頻數(shù),X:組中值。

算術(shù)均數(shù)(arithmeticmean:簡稱均數(shù)(mean)加權(quán)法:權(quán)數(shù):各組次數(shù)(頻數(shù))的大小所對應(yīng)的標(biāo)志值對平均數(shù)的影響具有權(quán)衡輕重的作用。當(dāng)各組的次數(shù)都相同時,即當(dāng)f1=f2=f3=…=fn時:加權(quán)算術(shù)平均數(shù)就等于簡單算術(shù)平均數(shù)。

描述數(shù)值變量資料的集中趨勢(centraltendency)

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述表2-2130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f∑fX∑fX2

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述

算術(shù)均數(shù)(arithmeticmean:簡稱均數(shù)(mean)各個標(biāo)志值與其算術(shù)平均數(shù)的離差之和等于零。簡單算術(shù)平均數(shù):加權(quán)算術(shù)平均數(shù):

特點:

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

算術(shù)均數(shù)(arithmeticmean:簡稱均數(shù)(mean)

特點:各標(biāo)志值與算術(shù)平均數(shù)離差的平方和為最小值。對于任意兩個變量x和y,它們的代數(shù)和的算術(shù)平均數(shù)等于兩個變量的算術(shù)平均數(shù)的代數(shù)和。

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

算術(shù)均數(shù)(arithmeticmean:簡稱均數(shù)(mean)

適用條件:1.均數(shù)反映一組同質(zhì)觀察值的平均水平,并可作為樣本的代表值與其他樣本進行比較。2.均數(shù)適用于描述單峰對稱分布,特別是正態(tài)或近似正態(tài)分布資料的集中趨勢。意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示(總體)X(樣本)計算:直接法、間接法、計算機特征:∑(X-X)=0估計誤差之和為0。應(yīng)用:正態(tài)分布或近似正態(tài)分布注意:合理分組,才能求均數(shù),否則沒有意義。小結(jié):

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

幾何均數(shù)(geometricmean

)例題:血清的抗體效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。

其他對數(shù)(如自然對數(shù))變換獲得相同的幾何均數(shù)

幾何均數(shù)(geometricmean

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例

有8份血清的抗體效價分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價。平均抗體效價為:1:57

幾何均數(shù)(geometricmean

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

例69例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見表2-4第(1)、(2)欄,求其平均抗體滴度。

幾何均數(shù)(geometricmean

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述適用于成等比數(shù)列的資料,特別是服從對數(shù)正態(tài)分布資料。

幾何均數(shù)(geometricmean

適用條件:①變量值中不能有0;

②不能同時有正值和負值;

③若全是負值,計算時可先把負號去掉,得出結(jié)果后再加上負號。

注意事項:

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

幾何均數(shù)(geometricmean

)小結(jié)意義:N個數(shù)值的乘積開N次方即為這N個數(shù)的幾何均數(shù)表示:G

計算:應(yīng)用:原始數(shù)據(jù)分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如:抗體滴度

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例題:11個大鼠存活天數(shù):4,10,7,50,3,15,2,9,13,>60,>60平均存活天數(shù)?

中位數(shù)(median

)和百分位數(shù)(

percentile

)㈠中位數(shù)

定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡記為M)。1.直接法:用于例數(shù)較少時

n為奇數(shù)時

n為偶數(shù)時

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例:9名中學(xué)生甲型肝炎的潛伏期分別為12,13,14,14,15,15,15,17,19天,求其中位數(shù)。

中位數(shù)(median

)和百分位數(shù)(

percentile

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述下限值L上限值U中位數(shù)M

中位數(shù)(median

)和百分位數(shù)(

percentile

)描述數(shù)值變量資料的集中趨勢(centraltendency)

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例2.7某疾病控制中心記錄了199名沙門氏菌屬食物中毒患者發(fā)病的潛伏期,并整理成表2-3中(1)、(2)欄,試計算其平均發(fā)病潛伏期。

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

中位數(shù)(median

)和百分位數(shù)(

percentile

)中位數(shù)適用條件:①變量值中出現(xiàn)個別特小或特大的數(shù)值;②資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);③變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;④資料的分布不清。

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述(二)百分位數(shù)(percentile)

中位數(shù)(median

)和百分位數(shù)(

percentile

)百分位數(shù)(percentile)是一種位置指標(biāo),以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M

。

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述設(shè)有n個原始數(shù)據(jù)從小到大排列,第X百分位數(shù)的計算公式為:當(dāng)為帶有小數(shù)位時:

當(dāng)為整數(shù)時:Trunc()取整函數(shù)

中位數(shù)(median

)和百分位數(shù)(

percentile

直接法:

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例對某醫(yī)院細菌性痢疾治愈者的住院天數(shù)統(tǒng)計,120名患者的住院天數(shù)從小到大排列如下,試求第5百分位數(shù)和第99百分位數(shù)?;颊撸鹤≡禾鞌?shù):

(1)n=120,為整數(shù):

(2),帶有小數(shù),故取整trunc(118.8)=118

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

頻數(shù)表法:

中位數(shù)(median

)和百分位數(shù)(

percentile

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例2.7某疾病控制中心記錄了199名沙門氏菌屬食物中毒患者發(fā)病的潛伏期,并整理成表2-3中(1)、(2)欄,試計算其平均發(fā)病潛伏期。

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

試分別求頻數(shù)表的第25、第75百分位數(shù)。P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述眾數(shù)是一組觀察值中出現(xiàn)頻率最高的那個觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個組段的組中值。適用于大樣本;較粗糙。例2-7有16例高血壓病人的發(fā)病年齡(歲)為:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,試求眾數(shù)。

眾數(shù)(

mode

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述正態(tài)分布時:均數(shù)=中位數(shù)=眾數(shù)

正偏態(tài)分布時:均數(shù)>中位數(shù)>眾數(shù)

負偏態(tài)分布時:均數(shù)<中位數(shù)<眾數(shù)

均數(shù)、中位數(shù)、眾數(shù)之間的關(guān)系

DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(centraltendency)描述數(shù)值變量資料的集中趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述盤編號甲乙丙14404804902460490495350050050045405105055560520510合計250025002500均數(shù)500500500例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細胞計數(shù),每人數(shù)5個計數(shù)盤,得結(jié)果如下(萬/mm3)

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述變異(variation)指標(biāo)反映數(shù)據(jù)的離散度(Dispersion

)。即個體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述優(yōu)點:簡便缺點:1.只利用了兩個極端值

2.n大,R也會大

3.不穩(wěn)定1204020

極差(Range

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對應(yīng)的值。記為Px。四分位間距:QR=P75-P25

四分位數(shù)間距(quartilerange)特點:比極差穩(wěn)定,只反映中間兩端值的差異。計算不太方便??捎糜诟鞣N分布的資料。

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

方差(variance

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。

總體方差

樣本方差離均差平方和SS

方差(variance

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

標(biāo)準(zhǔn)差(

StandardDeviation

)樣本方差為什么要除以(n-1)與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計學(xué)中,n個數(shù)據(jù)如不受任何條件的限制,則n個數(shù)據(jù)可取任意值,稱為有n個自由度。若受到k個條件的限制,就只有(n-k)個自由度了。計算標(biāo)準(zhǔn)差時,n個變量值本身有n個自由度。但受到樣本均數(shù)的限制,任何一個“離均差”均可以用另外的(n-1)個“離均差”表示,所以只有(n-1)個獨立的“離均差”。因此只有(n-1)個自由度。

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計算標(biāo)準(zhǔn)差的公式為

標(biāo)準(zhǔn)差(

StandardDeviation

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例2-11對例2-1的前10個數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計算標(biāo)準(zhǔn)差。

標(biāo)準(zhǔn)差(

StandardDeviation

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例2-11對例2-1的前10個數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計算標(biāo)準(zhǔn)差。

標(biāo)準(zhǔn)差(

StandardDeviation

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述例2-12利用表2-2中的數(shù)據(jù)和頻數(shù)表法計算標(biāo)準(zhǔn)差N=∑f∑fX∑fX2

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述標(biāo)準(zhǔn)差的意義和用途說明資料的離散趨勢(或變異程度),標(biāo)準(zhǔn)差的值越大,說明變異程度越大,均數(shù)的代表性越差;...。標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時用來描述資料的集中趨勢與離散趨勢。用于計算變異系數(shù)用于計算標(biāo)準(zhǔn)誤(見第四章)結(jié)合均值與正態(tài)分布的規(guī)律,估計參考值的范圍(見第五節(jié))。

標(biāo)準(zhǔn)差(

StandardDeviation

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述變異系數(shù)(coefficientofvariation,CV)常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。

變異系數(shù)(

coefficientofvariation,CV

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,

比較其變異度?

變異系數(shù)(

coefficientofvariation,CV

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述

變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距

DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(centraltendency)描述數(shù)值變量資料的離散趨勢(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計描述正態(tài)分布的通俗概念:如果把數(shù)值變量資料編制頻數(shù)表后繪制頻數(shù)分布圖(又稱直方圖,它用矩形面積表示數(shù)值變量資料的頻數(shù)分布,每條直條的寬表示組距,直條的面積表示頻數(shù)(或頻率)大小,直條與直條之間不留空隙。),若頻數(shù)分布呈現(xiàn)中間為最多,左右兩側(cè)基本對稱,越靠近中間頻數(shù)越多,離中間越遠,頻數(shù)越少,形成一個中間頻數(shù)多,兩側(cè)頻數(shù)逐漸減少且基本對稱的分布,那我們一般認為該數(shù)值變量服從或近似服從數(shù)學(xué)上的正態(tài)分布。正態(tài)分布的概念

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述以某地13歲女孩118人的身高(cm)資料,來說明身高變量服從正態(tài)分布。頻數(shù)分布表:

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述頻數(shù)分布圖一(又稱直方圖)

從頻數(shù)表及頻數(shù)分布圖上可得知:

該數(shù)值變量資料頻數(shù)分布呈現(xiàn)中間頻數(shù)多,左右兩側(cè)基本對稱的分布。所以我們通俗地認為該資料服從正態(tài)分布。

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述頻數(shù)分布圖二

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述頻數(shù)分布圖三

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述正態(tài)分布圖四

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述醫(yī)學(xué)研究中的某些觀察指標(biāo)服從或近似服從正態(tài)分布;很多統(tǒng)計方法是建立在正態(tài)分布的基礎(chǔ)之上的;很多其他分布的極限為正態(tài)分布。因此,正態(tài)分布是統(tǒng)計分析方法的重要基礎(chǔ)。

正態(tài)分布的重要性

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述正態(tài)曲線(normalcurve)的發(fā)現(xiàn)

deMoivre(1667-1754),publishedin1733

Laplace(1749-1827)

Gauss(1777-1855)正態(tài)分布:又稱高斯分布(Gaussiandistribution)

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述1.正態(tài)分布曲線的數(shù)學(xué)表達式(概率密度函數(shù),probabilitydensityfunction,pdf

)

正態(tài)分布的概念和特征:

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述正態(tài)曲線下面積分布有一定的規(guī)律,總面積=1。

正態(tài)分布的概念和特征:

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述累積面積可通過對概率密度函數(shù)f(X)積分求得(累積)分布函數(shù):

正態(tài)分布的概念和特征:

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計描述圖2-7正態(tài)曲線面積分布示意圖

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述圖2-7正態(tài)曲線面積分布示意圖

DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計描述

標(biāo)準(zhǔn)正態(tài)分布的概念和特征:

DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論