版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Schoolofpublichealth,ShandongUniversity數(shù)值變量資料的統(tǒng)計(jì)描述
DescriptiveStatistics
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷指標(biāo)描述圖表描述參數(shù)估計(jì)假設(shè)檢驗(yàn)變量關(guān)系統(tǒng)計(jì)設(shè)計(jì)統(tǒng)計(jì)分析實(shí)驗(yàn)設(shè)計(jì)調(diào)查設(shè)計(jì)研究?jī)?nèi)容統(tǒng)計(jì)描述:利用統(tǒng)計(jì)圖、統(tǒng)計(jì)表、統(tǒng)計(jì)指標(biāo)等來(lái)描述樣本資料的特征。
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述頻數(shù)分布表(frequencytable)
離散型資料(discretedata):是指變量取值可以一一列舉的資料。例如,每個(gè)育齡婦女現(xiàn)有的子女?dāng)?shù)。
如1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7。
連續(xù)型資料(continuitydata):是指變量取值不能一一列舉(即變量取值為一定范圍內(nèi)的任意值)的資料。例如,人體的身高(cm)、體重(kg)等。
數(shù)值變量資料的分類(lèi):
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述表2-11998年某地96名孕婦產(chǎn)前檢查次數(shù)分布檢查次數(shù)(1)頻數(shù)(2)頻率(%)(3)0
4
4.21
7
7.321111.531313.542627.152324.0>51212.5合計(jì)96
100.0
離散型資料(discretedata)
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述根據(jù)表2-1頻數(shù)的分布可繪出頻數(shù)分布圖。
DescriptiveStatistics頻數(shù)分布表(frequencytable)
離散型資料(discretedata)2、-第二章數(shù)值變量統(tǒng)計(jì)描述1998年某校100名18歲健康女大學(xué)生(cm)資料
DescriptiveStatistics頻數(shù)分布表(frequencytable)
連續(xù)型資料(continuitydata)2、-第二章數(shù)值變量統(tǒng)計(jì)描述1998年某校100名18歲健康女大學(xué)生(cm)資料
DescriptiveStatistics頻數(shù)分布表(frequencytable)
連續(xù)型資料(continuitydata)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例1測(cè)得130名健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876
頻數(shù)表的編制:
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述(1)求極差(range):即最大值與最小值之差,又稱為全距。R=84–57=27(次/分)(2)決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個(gè)組。組距=極差/組數(shù),為方便計(jì),組距為極差的十分之一,再略加調(diào)整。27/10=2.7≈3
(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值。56-59-……80-83-85(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。
DescriptiveStatistics頻數(shù)分布表(frequencytable)
頻數(shù)表的編制:2、-第二章數(shù)值變量統(tǒng)計(jì)描述表2-3130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f
DescriptiveStatistics頻數(shù)分布表(frequencytable)
頻數(shù)表的編制:2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)分布圖
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表的編制:表2-4160名正常成年女子的血清甘油三酯(mmol/L)編號(hào)血清甘油三脂編號(hào)血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表的編制:(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=1.77-0.51=1.26(mmol/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=1.26/10=0.126≈0.1。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表的編制:組段(1)劃記(2)頻數(shù),f(3)組中值,X(4)
fX(5)=(3)×(4)0.5~
30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5512.401.6~正81.6514.851.7~1.8
合計(jì)
31.755.25160182.30
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
編制頻數(shù)表的基本步驟:頻數(shù)分布表(frequencytable)
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表的用途:頻數(shù)分布表(frequencytable)
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表的用途:1.描述頻數(shù)分布的類(lèi)型和特征
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述(1)對(duì)稱分布:若各組段的頻數(shù)以中心位置左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布
頻數(shù)表的用途:1.描述頻數(shù)分布的類(lèi)型和特征是否為對(duì)稱分布?
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述(2)偏態(tài)分布:1)正偏態(tài)分布:右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。2)負(fù)偏態(tài)分布:左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。
頻數(shù)表的用途:1.描述頻數(shù)分布的類(lèi)型和特征
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述表2-3數(shù)據(jù)的頻數(shù)分布特征:①數(shù)據(jù)變異(離散)的范圍在57~84(次/分)②數(shù)據(jù)集中(平均)的組段在68~73(次/分)之間,尤以組段的人數(shù)71~(次/分)最多。且上下組段的頻數(shù)分布基本對(duì)稱。
頻數(shù)表的用途:1.描述頻數(shù)分布的類(lèi)型和特征
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表的用途:2.便于發(fā)現(xiàn)一些特大或特小的可疑值3.便于進(jìn)一步做統(tǒng)計(jì)分析和處理
DescriptiveStatistics頻數(shù)分布表(frequencytable)2、-第二章數(shù)值變量統(tǒng)計(jì)描述描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體系來(lái)描述一組變量值的集中位置或平均水平。常用的平均數(shù)有:
算術(shù)均數(shù)(均數(shù))(mean)幾何均數(shù)(geometricmean)中位數(shù)(median)與百分位數(shù)(percentile)
眾數(shù)(mode)
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述
算術(shù)均數(shù)(arithmeticmean:簡(jiǎn)稱均數(shù)(mean)
可用于反映一組呈對(duì)稱分布的變量值在數(shù)量上的平均水平或者說(shuō)是集中位置的特征值。
計(jì)算方法:直接法:例2.2某地隨機(jī)抽取10名18歲健康男大學(xué)生身高(cm)分別為168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7,求平均身高。(cm)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例:測(cè)得130健康成年男子脈搏資料(次/分)如下,計(jì)算平均水平。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876
算術(shù)均數(shù)(arithmeticmean:簡(jiǎn)稱均數(shù)(mean)直接法:
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述公式:k:頻數(shù)表的組段數(shù),f:頻數(shù),X:組中值。
算術(shù)均數(shù)(arithmeticmean:簡(jiǎn)稱均數(shù)(mean)加權(quán)法:權(quán)數(shù):各組次數(shù)(頻數(shù))的大小所對(duì)應(yīng)的標(biāo)志值對(duì)平均數(shù)的影響具有權(quán)衡輕重的作用。當(dāng)各組的次數(shù)都相同時(shí),即當(dāng)f1=f2=f3=…=fn時(shí):加權(quán)算術(shù)平均數(shù)就等于簡(jiǎn)單算術(shù)平均數(shù)。
描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述表2-2130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f∑fX∑fX2
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述
算術(shù)均數(shù)(arithmeticmean:簡(jiǎn)稱均數(shù)(mean)各個(gè)標(biāo)志值與其算術(shù)平均數(shù)的離差之和等于零。簡(jiǎn)單算術(shù)平均數(shù):加權(quán)算術(shù)平均數(shù):
特點(diǎn):
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
算術(shù)均數(shù)(arithmeticmean:簡(jiǎn)稱均數(shù)(mean)
特點(diǎn):各標(biāo)志值與算術(shù)平均數(shù)離差的平方和為最小值。對(duì)于任意兩個(gè)變量x和y,它們的代數(shù)和的算術(shù)平均數(shù)等于兩個(gè)變量的算術(shù)平均數(shù)的代數(shù)和。
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
算術(shù)均數(shù)(arithmeticmean:簡(jiǎn)稱均數(shù)(mean)
適用條件:1.均數(shù)反映一組同質(zhì)觀察值的平均水平,并可作為樣本的代表值與其他樣本進(jìn)行比較。2.均數(shù)適用于描述單峰對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布資料的集中趨勢(shì)。意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示(總體)X(樣本)計(jì)算:直接法、間接法、計(jì)算機(jī)特征:∑(X-X)=0估計(jì)誤差之和為0。應(yīng)用:正態(tài)分布或近似正態(tài)分布注意:合理分組,才能求均數(shù),否則沒(méi)有意義。小結(jié):
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
幾何均數(shù)(geometricmean
)例題:血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。
其他對(duì)數(shù)(如自然對(duì)數(shù))變換獲得相同的幾何均數(shù)
幾何均數(shù)(geometricmean
)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例
有8份血清的抗體效價(jià)分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價(jià)。平均抗體效價(jià)為:1:57
幾何均數(shù)(geometricmean
)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
例69例類(lèi)風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見(jiàn)表2-4第(1)、(2)欄,求其平均抗體滴度。
幾何均數(shù)(geometricmean
)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述適用于成等比數(shù)列的資料,特別是服從對(duì)數(shù)正態(tài)分布資料。
幾何均數(shù)(geometricmean
)
適用條件:①變量值中不能有0;
②不能同時(shí)有正值和負(fù)值;
③若全是負(fù)值,計(jì)算時(shí)可先把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。
注意事項(xiàng):
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
幾何均數(shù)(geometricmean
)小結(jié)意義:N個(gè)數(shù)值的乘積開(kāi)N次方即為這N個(gè)數(shù)的幾何均數(shù)表示:G
計(jì)算:應(yīng)用:原始數(shù)據(jù)分布不對(duì)稱,經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料。例如:抗體滴度
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例題:11個(gè)大鼠存活天數(shù):4,10,7,50,3,15,2,9,13,>60,>60平均存活天數(shù)?
中位數(shù)(median
)和百分位數(shù)(
percentile
)㈠中位數(shù)
定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡(jiǎn)記為M)。1.直接法:用于例數(shù)較少時(shí)
n為奇數(shù)時(shí)
n為偶數(shù)時(shí)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例:9名中學(xué)生甲型肝炎的潛伏期分別為12,13,14,14,15,15,15,17,19天,求其中位數(shù)。
中位數(shù)(median
)和百分位數(shù)(
percentile
)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述下限值L上限值U中位數(shù)M
中位數(shù)(median
)和百分位數(shù)(
percentile
)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例2.7某疾病控制中心記錄了199名沙門(mén)氏菌屬食物中毒患者發(fā)病的潛伏期,并整理成表2-3中(1)、(2)欄,試計(jì)算其平均發(fā)病潛伏期。
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
中位數(shù)(median
)和百分位數(shù)(
percentile
)中位數(shù)適用條件:①變量值中出現(xiàn)個(gè)別特小或特大的數(shù)值;②資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);③變量值分布一端或兩端無(wú)確定數(shù)值,只有小于或大于某個(gè)數(shù)值;④資料的分布不清。
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述(二)百分位數(shù)(percentile)
中位數(shù)(median
)和百分位數(shù)(
percentile
)百分位數(shù)(percentile)是一種位置指標(biāo),以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M
。
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述設(shè)有n個(gè)原始數(shù)據(jù)從小到大排列,第X百分位數(shù)的計(jì)算公式為:當(dāng)為帶有小數(shù)位時(shí):
當(dāng)為整數(shù)時(shí):Trunc()取整函數(shù)
中位數(shù)(median
)和百分位數(shù)(
percentile
)
直接法:
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例對(duì)某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),120名患者的住院天數(shù)從小到大排列如下,試求第5百分位數(shù)和第99百分位數(shù)?;颊撸鹤≡禾鞌?shù):
(1)n=120,為整數(shù):
(2),帶有小數(shù),故取整trunc(118.8)=118
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
頻數(shù)表法:
中位數(shù)(median
)和百分位數(shù)(
percentile
)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例2.7某疾病控制中心記錄了199名沙門(mén)氏菌屬食物中毒患者發(fā)病的潛伏期,并整理成表2-3中(1)、(2)欄,試計(jì)算其平均發(fā)病潛伏期。
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
例
試分別求頻數(shù)表的第25、第75百分位數(shù)。P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述眾數(shù)是一組觀察值中出現(xiàn)頻率最高的那個(gè)觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個(gè)組段的組中值。適用于大樣本;較粗糙。例2-7有16例高血壓病人的發(fā)病年齡(歲)為:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,試求眾數(shù)。
眾數(shù)(
mode
)
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述正態(tài)分布時(shí):均數(shù)=中位數(shù)=眾數(shù)
正偏態(tài)分布時(shí):均數(shù)>中位數(shù)>眾數(shù)
負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)<眾數(shù)
均數(shù)、中位數(shù)、眾數(shù)之間的關(guān)系
DescriptiveStatistics描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)描述數(shù)值變量資料的集中趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述變異(variation)指標(biāo)反映數(shù)據(jù)的離散度(Dispersion
)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差(Range)
(全距)
2.百分位數(shù)與四分位數(shù)間距PercentileandQuartilerange
3.方差
Variance
4.標(biāo)準(zhǔn)差StandardDeviation
5.變異系數(shù)
CoefficientofVariation
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.不穩(wěn)定1204020
極差(Range
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:QR=P75-P25
四分位數(shù)間距(quartilerange)特點(diǎn):比極差穩(wěn)定,只反映中間兩端值的差異。計(jì)算不太方便??捎糜诟鞣N分布的資料。
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
方差(variance
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。
總體方差
樣本方差離均差平方和SS
方差(variance
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
標(biāo)準(zhǔn)差(
StandardDeviation
)樣本方差為什么要除以(n-1)與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計(jì)學(xué)中,n個(gè)數(shù)據(jù)如不受任何條件的限制,則n個(gè)數(shù)據(jù)可取任意值,稱為有n個(gè)自由度。若受到k個(gè)條件的限制,就只有(n-k)個(gè)自由度了。計(jì)算標(biāo)準(zhǔn)差時(shí),n個(gè)變量值本身有n個(gè)自由度。但受到樣本均數(shù)的限制,任何一個(gè)“離均差”均可以用另外的(n-1)個(gè)“離均差”表示,所以只有(n-1)個(gè)獨(dú)立的“離均差”。因此只有(n-1)個(gè)自由度。
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
標(biāo)準(zhǔn)差的公式還可以寫(xiě)成:利用頻數(shù)表計(jì)算標(biāo)準(zhǔn)差的公式為
標(biāo)準(zhǔn)差(
StandardDeviation
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例2-11對(duì)例2-1的前10個(gè)數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計(jì)算標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)差(
StandardDeviation
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例2-11對(duì)例2-1的前10個(gè)數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計(jì)算標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)差(
StandardDeviation
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述例2-12利用表2-2中的數(shù)據(jù)和頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差N=∑f∑fX∑fX2
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的意義和用途說(shuō)明資料的離散趨勢(shì)(或變異程度),標(biāo)準(zhǔn)差的值越大,說(shuō)明變異程度越大,均數(shù)的代表性越差;...。標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報(bào)告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來(lái)描述資料的集中趨勢(shì)與離散趨勢(shì)。用于計(jì)算變異系數(shù)用于計(jì)算標(biāo)準(zhǔn)誤(見(jiàn)第四章)結(jié)合均值與正態(tài)分布的規(guī)律,估計(jì)參考值的范圍(見(jiàn)第五節(jié))。
標(biāo)準(zhǔn)差(
StandardDeviation
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述變異系數(shù)(coefficientofvariation,CV)常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。
變異系數(shù)(
coefficientofvariation,CV
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,
比較其變異度?
變異系數(shù)(
coefficientofvariation,CV
)
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;
偏態(tài)分布:中位數(shù)、四分位半間距
DescriptiveStatistics描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)描述數(shù)值變量資料的離散趨勢(shì)(centraltendency)指標(biāo)2、-第二章數(shù)值變量統(tǒng)計(jì)描述正態(tài)分布的通俗概念:如果把數(shù)值變量資料編制頻數(shù)表后繪制頻數(shù)分布圖(又稱直方圖,它用矩形面積表示數(shù)值變量資料的頻數(shù)分布,每條直條的寬表示組距,直條的面積表示頻數(shù)(或頻率)大小,直條與直條之間不留空隙。),若頻數(shù)分布呈現(xiàn)中間為最多,左右兩側(cè)基本對(duì)稱,越靠近中間頻數(shù)越多,離中間越遠(yuǎn),頻數(shù)越少,形成一個(gè)中間頻數(shù)多,兩側(cè)頻數(shù)逐漸減少且基本對(duì)稱的分布,那我們一般認(rèn)為該數(shù)值變量服從或近似服從數(shù)學(xué)上的正態(tài)分布。正態(tài)分布的概念
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述以某地13歲女孩118人的身高(cm)資料,來(lái)說(shuō)明身高變量服從正態(tài)分布。頻數(shù)分布表:
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述頻數(shù)分布圖一(又稱直方圖)
從頻數(shù)表及頻數(shù)分布圖上可得知:
該數(shù)值變量資料頻數(shù)分布呈現(xiàn)中間頻數(shù)多,左右兩側(cè)基本對(duì)稱的分布。所以我們通俗地認(rèn)為該資料服從正態(tài)分布。
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述頻數(shù)分布圖二
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述頻數(shù)分布圖三
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述正態(tài)分布圖四
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述醫(yī)學(xué)研究中的某些觀察指標(biāo)服從或近似服從正態(tài)分布;很多統(tǒng)計(jì)方法是建立在正態(tài)分布的基礎(chǔ)之上的;很多其他分布的極限為正態(tài)分布。因此,正態(tài)分布是統(tǒng)計(jì)分析方法的重要基礎(chǔ)。
正態(tài)分布的重要性
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述正態(tài)曲線(normalcurve)的發(fā)現(xiàn)
deMoivre(1667-1754),publishedin1733
Laplace(1749-1827)
Gauss(1777-1855)正態(tài)分布:又稱高斯分布(Gaussiandistribution)
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述1.正態(tài)分布曲線的數(shù)學(xué)表達(dá)式(概率密度函數(shù),probabilitydensityfunction,pdf
)
正態(tài)分布的概念和特征:
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述正態(tài)曲線下面積分布有一定的規(guī)律,總面積=1。
正態(tài)分布的概念和特征:
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述累積面積可通過(guò)對(duì)概率密度函數(shù)f(X)積分求得(累積)分布函數(shù):
正態(tài)分布的概念和特征:
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2、-第二章數(shù)值變量統(tǒng)計(jì)描述圖2-7正態(tài)曲線面積分布示意圖
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述圖2-7正態(tài)曲線面積分布示意圖
DescriptiveStatistics2、-第二章數(shù)值變量統(tǒng)計(jì)描述
標(biāo)準(zhǔn)正態(tài)分布的概念和特征:
DescriptiveStatistics正態(tài)分布(Gaussiandistribution)2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南華大學(xué)船山學(xué)院《英語(yǔ)經(jīng)典閱讀與背誦》2023-2024學(xué)年第二學(xué)期期末試卷
- 菏澤學(xué)院《硬筆書(shū)寫(xiě)》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川城市職業(yè)學(xué)院《設(shè)計(jì)實(shí)訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 六盤(pán)水職業(yè)技術(shù)學(xué)院《材料特性表征》2023-2024學(xué)年第二學(xué)期期末試卷
- 北京印刷學(xué)院《基于財(cái)務(wù)共享平臺(tái)的財(cái)務(wù)決策沙盤(pán)模擬》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西工商職業(yè)技術(shù)學(xué)院《自動(dòng)控制原理B》2023-2024學(xué)年第二學(xué)期期末試卷
- 北京中醫(yī)藥大學(xué)《教師教育基礎(chǔ)與教師專(zhuān)業(yè)發(fā)展》2023-2024學(xué)年第二學(xué)期期末試卷
- 畢節(jié)幼兒師范高等專(zhuān)科學(xué)校《發(fā)電廠電氣工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北經(jīng)濟(jì)學(xué)院法商學(xué)院《護(hù)理基本技能(Ⅰ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年度智能門(mén)禁系統(tǒng)售后服務(wù)合同
- 中央2025年交通運(yùn)輸部所屬事業(yè)單位招聘261人筆試歷年參考題庫(kù)附帶答案詳解
- 2025年上半年上半年重慶三峽融資擔(dān)保集團(tuán)股份限公司招聘6人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 特殊教育學(xué)校2024-2025學(xué)年度第二學(xué)期教學(xué)工作計(jì)劃
- 2025年技術(shù)員個(gè)人工作計(jì)劃例文(四篇)
- 勞保穿戴要求培訓(xùn)
- 2024年物聯(lián)網(wǎng)安裝調(diào)試員(初級(jí)工)職業(yè)資格鑒定考試題庫(kù)(含答案)
- 工業(yè)控制系統(tǒng)應(yīng)用與安全防護(hù)技術(shù)(微課版)課件 第1章 緒論
- 《設(shè)備科安全培訓(xùn)》課件
- 藍(lán)色插畫(huà)風(fēng)徽州印象旅游景點(diǎn)景區(qū)文化宣傳
- 2024年形勢(shì)與政策課件及講稿合集
- 無(wú)人機(jī)運(yùn)營(yíng)方案
評(píng)論
0/150
提交評(píng)論