




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
以數(shù)值特征,對統(tǒng)計數(shù)據(jù)分布進(jìn)行量化描述。主要包括三方面:集中趨勢用平均指標(biāo)描述(位置特征);離中趨勢用變異指標(biāo)描述(離散特征);偏斜程度用偏度和峰度描述(偏斜特征、峰度特征)。
本章學(xué)習(xí)任務(wù)以數(shù)值特征,對統(tǒng)計數(shù)據(jù)分布進(jìn)行量化描述。本章學(xué)習(xí)任務(wù)0學(xué)習(xí)要求:理解測度統(tǒng)計數(shù)據(jù)集中趨勢、離散程度的概念、指標(biāo)、相互關(guān)系;
掌握主要分析指標(biāo)的計算方法和應(yīng)用場合,并能熟練進(jìn)行相關(guān)計算分析。學(xué)習(xí)要求:1數(shù)據(jù)分布特征與測度:概覽集中趨勢(位置)偏態(tài)和峰態(tài)(形狀)離中趨勢
(分散程度)數(shù)據(jù)分布特征與測度:概覽集中趨勢偏態(tài)和峰態(tài)離中趨勢2數(shù)據(jù)分布特征測度分布形狀集中趨勢離散程度冪平均數(shù)中位數(shù)眾數(shù)異眾比率方差、標(biāo)準(zhǔn)差峰度平均差極差偏度
變異系數(shù)數(shù)據(jù)分布特征測度分布形狀集中趨勢離散程度冪平均數(shù)中位數(shù)眾3第一節(jié)統(tǒng)計變量集中趨勢測定一集中趨勢指標(biāo)及作用二數(shù)值平均數(shù)三眾數(shù)與中位數(shù)(位置平均數(shù))第一節(jié)統(tǒng)計變量集中趨勢測定一集中趨勢指標(biāo)及作用4一、集中趨勢指標(biāo)及作用集中趨勢(Centraltendency)集中趨勢即一組數(shù)據(jù)向其中心值聚集或靠攏的傾向和程度。用平均指標(biāo)表示,代表數(shù)據(jù)的一般水平。測定集中趨勢是認(rèn)識數(shù)據(jù)分布特征的基本內(nèi)容。一、集中趨勢指標(biāo)及作用集中趨勢(Centraltenden5集中趨勢指標(biāo)有兩類:數(shù)值平均數(shù)根據(jù)全部數(shù)據(jù)計算得到的代表值。優(yōu)點:數(shù)學(xué)性質(zhì)良好,可用于統(tǒng)計推斷
缺點:易受極端值影響。主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)及幾何平均數(shù),三者均為冪平均數(shù)特例。集中趨勢指標(biāo)有兩類:6位置平均數(shù)根據(jù)對總體中處于特定位置的單個或部分單位標(biāo)志值直接觀察或推算確定的代表值。優(yōu)點:不易受極端值影響,具有較好穩(wěn)健性。
缺點:不宜用作統(tǒng)計推斷。主要包括眾數(shù)和中位數(shù)。位置平均數(shù)7集中趨勢指標(biāo)作用1.反映變量分布的集中趨勢和一般水平。如用平均工資了解職工工資分布的中心,反映職工工資的一般水平。2.比較同一現(xiàn)象在不同空間或不同階段的發(fā)展水平,反映現(xiàn)象變化特征、趨勢和規(guī)律性。能消除總體規(guī)模差異造成的不利影響;在一定程度上減弱偶然因素的影響。一、集中趨勢指標(biāo)及作用集中趨勢指標(biāo)作用一、集中趨勢指標(biāo)及作用83.分析現(xiàn)象之間的依存關(guān)系。如研究勞動者文化程度與收入的關(guān)系。4.(數(shù)值)平均指標(biāo)是推斷統(tǒng)計中的重要統(tǒng)計量,是進(jìn)行統(tǒng)計推斷的基礎(chǔ)。3.分析現(xiàn)象之間的依存關(guān)系。9幾種常見的位置特征數(shù)數(shù)據(jù)分布的位置特征數(shù)實際上也是數(shù)據(jù)的代表值,代表了數(shù)據(jù)的一般水平。在不同場合,可以適當(dāng)選用平均數(shù)、中位數(shù)、眾數(shù)充當(dāng)位置特征數(shù)(代表值)其中平均數(shù)不同于中位數(shù)、眾數(shù)的特點在于:平均數(shù)是由所研究的全體數(shù)據(jù)參加計算所得。平均數(shù)的一般形式叫做冪平均數(shù)。常見的有算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)。幾種常見的位置特征數(shù)數(shù)據(jù)分布的位置特征數(shù)實際上也是數(shù)據(jù)的代表10二、數(shù)值平均數(shù)(一)冪平均數(shù)冪,power變量X取N個值:。權(quán)數(shù)為一組正數(shù):。加權(quán)冪平均數(shù)一般形式為:其中,k為任意實數(shù)。二、數(shù)值平均數(shù)(一)冪平均數(shù)11權(quán)數(shù)w均相等時,加權(quán)平均數(shù)退化為簡單平均數(shù):
權(quán)數(shù)w均相等時,加權(quán)平均數(shù)退化為簡單平均數(shù):12特例情況
冪平均數(shù)算術(shù)平均數(shù)(冪指數(shù)k=1)
調(diào)和平均數(shù)(冪指數(shù)k=-1)幾何平均數(shù)(冪指數(shù)k0)
其他冪平均數(shù)特例情況冪平均數(shù)算術(shù)平均數(shù)(冪指數(shù)k=1)調(diào)和平均數(shù)(13k=1:算術(shù)平均數(shù)加權(quán)簡單k=1:算術(shù)平均數(shù)14k=-1:調(diào)和平均數(shù)加權(quán)簡單k=-1:調(diào)和平均數(shù)15k0:幾何平均數(shù)加權(quán)簡單k0:幾何平均數(shù)16關(guān)于加權(quán)問題權(quán)數(shù)確定方式:客觀權(quán)數(shù):權(quán)數(shù)由實際統(tǒng)計資料獲得或推算。主觀權(quán)數(shù):根據(jù)研究問題,由研究者主觀賦值。權(quán)數(shù)作用:權(quán)衡變量的各種取值在計算平均數(shù)時的重要性。權(quán)數(shù)作用,根本上是通過權(quán)數(shù)結(jié)構(gòu)實現(xiàn)。關(guān)于加權(quán)問題17權(quán)數(shù)作用:即使不改變被平均的數(shù)值,僅改變權(quán)數(shù)結(jié)構(gòu),即可改變平均數(shù)水平。例如,改變教師職稱結(jié)構(gòu),而不改變各種職稱教師課時費(fèi)標(biāo)準(zhǔn),會改變平均課時費(fèi)水平。權(quán)數(shù)實質(zhì)權(quán)數(shù)的實質(zhì)在于其結(jié)構(gòu),即結(jié)構(gòu)比例形式(比重權(quán)數(shù))。其更能清晰表明權(quán)數(shù)之權(quán)衡輕重的作用。權(quán)數(shù)作用:18權(quán)數(shù)形式有2種:絕對數(shù)形式結(jié)構(gòu)比例形式
權(quán)數(shù)形式有2種:19(二)算術(shù)平均數(shù)算術(shù)平均數(shù)(Arithmeticmean),也稱均值(mean)。由一組數(shù)據(jù)的總和(總體標(biāo)志總量)除以該組數(shù)據(jù)的項數(shù)(總體單位總量)得到;算術(shù)平均數(shù)=總體標(biāo)志總量/總體單位總量是最常用的數(shù)值平均數(shù);根據(jù)掌握資料不同,其有多種計算公式。
(二)算術(shù)平均數(shù)201.簡單算術(shù)平均數(shù)對未分組數(shù)據(jù),采用簡單算術(shù)平均數(shù)公式。即把各項數(shù)據(jù)直接加總,然后除以總項數(shù)。計算公式:1.簡單算術(shù)平均數(shù)21分組舉例解:采用簡單算術(shù)平均法計算,即全體隊員的平均年齡為(單位:周歲)分組數(shù)據(jù)不能簡單平均!因為各組變量值的次數(shù)(權(quán)數(shù))不等!若采用簡單平均:應(yīng)采用加權(quán)平均。兩種計算公式結(jié)果相同!分組舉例解:采用簡單算術(shù)平均法計算,即全體隊員的平均年齡為(222.加權(quán)算術(shù)平均數(shù)對單項式分組資料,應(yīng)以各標(biāo)志值出現(xiàn)次數(shù)為權(quán)數(shù)加權(quán)平均。加權(quán)算術(shù)平均數(shù)計算公式:例3-1單項式分組資料(表3-2)計算方法為:2.加權(quán)算術(shù)平均數(shù)233.由組距分組資料計算組距分組資料中,各組變量值不唯一,是一個區(qū)間;計算時,各組變量值通常用組中值(近似)代表;用組中值代替實際值,其假定條件是各組內(nèi)數(shù)據(jù)呈均勻分布或?qū)ΨQ分布。由于實際情況中該條件未必滿足,故計算結(jié)果是近似值;與單項式分組資料一樣,采用加權(quán)算術(shù)平均數(shù)計算。3.由組距分組資料計算24舉例解:平均使用壽命為舉例解:平均使用壽命為254.比率類型統(tǒng)計變量求平均數(shù)(1)比率類型統(tǒng)計變量,指平均指標(biāo)和相對指標(biāo)。(2)對比率類型變量求平均,涉及個體比率和總比率兩個概念。(3)對比率類型變量計算平均數(shù),基本要求是:比率類型變量平均值M,等于個體比率的總比率。簡言之:先求和,再對比。(4)根據(jù)掌握資料不同,可采用三種等價形式:
總比率,加權(quán)算術(shù)平均,加權(quán)調(diào)和平均4.比率類型統(tǒng)計變量求平均數(shù)26例如:對相對數(shù)求算術(shù)平均數(shù)對相對數(shù)而言,由于各個相對數(shù)的對比基礎(chǔ)不同,采用簡單算術(shù)平均不合理,必須加權(quán)平均。權(quán)數(shù)選擇必須符合該相對數(shù)本身的計算公式,通常為該相對數(shù)的分母指標(biāo)。對表3-4的分組資料:其中,分母b為權(quán)數(shù)f例如:對相對數(shù)求算術(shù)平均數(shù)27又如:對平均數(shù)求算術(shù)平均數(shù)某商貿(mào)公司購入一批水果,分等級收購價格和收購金額如下表。試求這批水果的平均收購價格。解:又如:對平均數(shù)求算術(shù)平均數(shù)285.算術(shù)平均數(shù)主要數(shù)學(xué)性質(zhì)(1)算術(shù)平均數(shù)與變量值個數(shù)乘積,等于各變量值總和。(2)各變量值與算術(shù)平均數(shù)的離差之總和,等于零。(3)各變量值與算術(shù)平均數(shù)的離差平方之總和最小。(從全部數(shù)據(jù)看,算術(shù)平均數(shù)最接近所有變量值)5.算術(shù)平均數(shù)主要數(shù)學(xué)性質(zhì)29性質(zhì)(3)證明:性質(zhì)(3)證明:30(三)調(diào)和平均數(shù)(Harmonicmean)調(diào)和平均數(shù),也稱倒數(shù)平均數(shù)。各變量值倒數(shù)(1/xi)的算術(shù)平均數(shù)的倒數(shù)。計算公式為:(三)調(diào)和平均數(shù)(Harmonicmean)31社會經(jīng)濟(jì)統(tǒng)計中所應(yīng)用的調(diào)和平均數(shù),通常是加權(quán)算術(shù)平均數(shù)的變形。已知各組變量值xi和(xi
fi)而缺乏fi時,加權(quán)算術(shù)平均數(shù)通??勺冃螢檎{(diào)和平均數(shù)形式來計算?;貞?-4求解:社會經(jīng)濟(jì)統(tǒng)計中所應(yīng)用的調(diào)和平均數(shù),通常是加權(quán)算術(shù)平均數(shù)的變形32(四)幾何平均數(shù)(Geometricmean)簡單幾何平均數(shù)—n個變量值連乘積的n次方根。加權(quán)幾何平均數(shù)適用于各個變量值之間存在連乘積關(guān)系的場合。主要用于計算現(xiàn)象的平均發(fā)展速度(第九章);也適用于對某些具有環(huán)比性質(zhì)的比率求平均(下例)。(四)幾何平均數(shù)(Geometricmean)33舉例例3-5。某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。本月該企業(yè)各加工工序的合格率分別為88%、85%、90%、92%、96%,試求這五道工序的平均合格率。解:本例中各工序的合格率具有環(huán)比的性質(zhì),企業(yè)產(chǎn)品的總合格率等于各工序合格率之連乘積。所以,所求平均合格率應(yīng)為:舉例例3-5。某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。34(五)幾種平均數(shù)大小關(guān)系對同一批數(shù)據(jù)和權(quán)數(shù),三種平均數(shù)關(guān)系:
調(diào)和平均幾何平均算術(shù)平均當(dāng)且僅當(dāng)所有觀察值全部相等時,等號成立;否則不等式嚴(yán)格成立。證明思路:首先證明冪平均數(shù)隨冪值k單調(diào)遞增變化(可由微分方法證明)。根據(jù)三類平均數(shù)k取值關(guān)系,調(diào)和平均數(shù)(k=-1)、幾何平均數(shù)(k→0)、算術(shù)平均數(shù)(k=1)可得到以上結(jié)論。(五)幾種平均數(shù)大小關(guān)系35平均數(shù)的應(yīng)用場合常見的應(yīng)用場合有:作為統(tǒng)計指標(biāo)的一種表現(xiàn)形式作為統(tǒng)計總體分布的位置特征數(shù)反映一個統(tǒng)計變量所有觀察值的一般水平抵消掉隨機(jī)試驗中的偶然因素影響,顯示出試驗的規(guī)律性水平。
平均數(shù)的應(yīng)用場合常見的應(yīng)用場合有:36數(shù)據(jù)是隨機(jī)試驗的結(jié)果。隨機(jī)試驗的個別結(jié)果會呈現(xiàn)出或高或低的起伏波動,實際上這是由偶然因素影響造成的。在進(jìn)行大量重復(fù)試驗,將試驗結(jié)果簡單算術(shù)平均,那么隨著試驗次數(shù)的增加,算術(shù)平均值就會越來越逼近一個穩(wěn)定值,而這個穩(wěn)定值就是試驗的規(guī)律性水平(數(shù)學(xué)期望值)。因此,在統(tǒng)計分析中,常常采用算術(shù)平均的手法去抵消現(xiàn)象中的偶然影響,以期近似地認(rèn)識現(xiàn)象的規(guī)律性水平。數(shù)據(jù)是隨機(jī)試驗的結(jié)果。37三、眾數(shù)與中位數(shù)(一)眾數(shù)(Mode)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多、頻率最高的變量值,常用Mo
表示。眾數(shù)代表最常見、最普遍的狀況,可度量現(xiàn)象集中趨勢。可測度定性變量集中趨勢,也可度量定量變量集中趨勢。在社會經(jīng)濟(jì)現(xiàn)象的管理決策中具有廣泛應(yīng)用。三、眾數(shù)與中位數(shù)(一)眾數(shù)(Mode)38對分布數(shù)列求眾數(shù),具有條件性。存在性:若分布數(shù)列沒有明顯集中趨勢,則不存在眾數(shù);唯一性:若分布數(shù)列有多個相對集中趨勢,則有多個眾數(shù)。從分布曲線上看,眾數(shù)就是一個變量分布曲線的最高峰所對應(yīng)的變量值。(見課本55頁圖3-1)為確定眾數(shù),通常要編制分布數(shù)列。眾數(shù)是分布曲線最高點對應(yīng)的標(biāo)志值。單項式分布數(shù)列中,眾數(shù)是具有最多次數(shù)的標(biāo)志值,可觀察得到。如表3-2中,眾數(shù)值Mo=25,組距式分布數(shù)列中,眾數(shù)需要推算。對分布數(shù)列求眾數(shù),具有條件性。39組距分布數(shù)列中,眾數(shù)推算方法:先找到眾數(shù)組。等距數(shù)列中,眾數(shù)組是頻數(shù)最多的組;異距數(shù)列中,眾數(shù)組是頻數(shù)密度最大的組。根據(jù)眾數(shù)組與其相鄰兩組的次數(shù)差推算(假定性)。其公式有2,結(jié)果完全一致:具體計算:見教材例3-7(P55)下限公式:上限公式:組距分布數(shù)列中,眾數(shù)推算方法:下限公式:上限公式:40統(tǒng)計學(xué)-第3章--數(shù)據(jù)分布特征描述課件414050607080901005040302010AGFBCED頻數(shù)xy(L)(U)Mo=L+x=U-yO40506042(二)中位數(shù)(Median)中位數(shù)是將數(shù)據(jù)由小到大排列后位置居中的數(shù)值。標(biāo)志值小于或等于中位數(shù)的單位占一半;標(biāo)志值大于或等于中位數(shù)的單位也占一半。用中位數(shù)代表總體標(biāo)志值的一般水平,可以避免極端值影響,有時更具代表性。Me50%50%(二)中位數(shù)(Median)Me50%50%43未分組數(shù)據(jù)計算中位數(shù)若數(shù)據(jù)項數(shù)是奇數(shù),則位于中間的數(shù)值為中位數(shù);如5人收入為:1200,1450,1500,1600,2000元,則其收入中位數(shù)Me=1500。若數(shù)據(jù)項數(shù)是偶數(shù),則取居中兩個數(shù)值的平均數(shù)為中位數(shù)。如6人收入為:1200,1450,1500,1600,1800,2000元,則收入中位數(shù)Me=1550。未分組數(shù)據(jù)計算中位數(shù)44分組數(shù)據(jù)推算中位數(shù)先確定中位數(shù)組,即中間位置(Σf/2)所在的組。對單項式分組,可直接得到中位數(shù)。對組距式分組,假定中位數(shù)組內(nèi)次數(shù)均勻分布,近似推算中位數(shù)。計算公式有2,結(jié)果完全一致:分組數(shù)據(jù)推算中位數(shù)45下限公式上限公式下限公式46分組數(shù)據(jù)推算中位數(shù)先確定中位數(shù)組,即中間位置(Σf/2)所在的組。對單項式分組,可直接得到中位數(shù)。對組距式分組,假定中位數(shù)組內(nèi)次數(shù)均勻分布,近似推算中位數(shù)。計算公式有2,結(jié)果完全一致。見下例:下限公式:上限公式:分組數(shù)據(jù)推算中位數(shù)下限公式:上限公式:47可由累計分布數(shù)列或累計分布圖確定中位數(shù)。以累計頻率分布曲線圖為例(該例與前面直方圖數(shù)據(jù)一致)此例中,與累計頻率50%相對應(yīng)的成績76分,即為中位數(shù)。向上累計圖:60分以下有16.7%向下累計圖:80分以上有38.9%可由累計分布數(shù)列或累計分布圖確定中位數(shù)。向上累計圖:向下累計48中位數(shù)與分位數(shù)四分位數(shù)、十分位數(shù)、百分位數(shù)分別是將數(shù)據(jù)由小到大排序后,位于全部數(shù)據(jù)1/4、1/10、1/100位置上的數(shù)值。中位數(shù)實際上是第2個四分位數(shù)、第5個十分位數(shù)、第50個百分位數(shù)。分位數(shù)與其它指標(biāo)結(jié)合,可以更詳細(xì)地反映數(shù)據(jù)分布特征。中位數(shù)使用場合與作用在較明顯的偏斜分布情形下,用中位數(shù)來說明次數(shù)分布位置特征較為適中。因為眾數(shù)忽略了偏斜一側(cè)的大量數(shù)值,而算術(shù)平均數(shù)又過分強(qiáng)調(diào)了這些數(shù)值。算術(shù)平均數(shù)對特異值的反應(yīng)十分靈敏,而中位數(shù)對特異值反應(yīng)不靈敏。常常把中位數(shù)(與算術(shù)平均數(shù)的差異大?。┳鳛樘剿靼l(fā)現(xiàn)特異值的標(biāo)準(zhǔn)。中位數(shù)與分位數(shù)49箱線圖(boxplot)箱線圖由一組數(shù)據(jù)的最小值(xmin)、第一四分位數(shù)(Q1)、中位數(shù)(Me)、第三四分位數(shù)(Q3)、最大值(xmax)等五個數(shù)值來繪成。利用箱線圖可以觀察數(shù)據(jù)分布的范圍、中心位置和對稱性等特征,還可進(jìn)行多組數(shù)據(jù)分布的比較。xminQ1MeQ3
xmax箱線圖(boxplot)xminQ150(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)比較0.三者均測度數(shù)據(jù)的集中趨勢和一般水平。1.算術(shù)平均數(shù)屬于數(shù)值平均數(shù),其綜合利用全部數(shù)據(jù)信息;眾數(shù)和中位數(shù)則由數(shù)據(jù)分布的特定位置確定。2.算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在,且具有惟一性;眾數(shù)則不然,其計算和應(yīng)用有兩個前提條件:數(shù)據(jù)項數(shù)眾多,且具有明顯的集中趨勢。(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)比較513.算術(shù)平均數(shù)只能用于定量(數(shù)值型)數(shù)據(jù);中位數(shù)適用于定序數(shù)據(jù)和定量數(shù)據(jù);眾數(shù)適用于所有形式(各種類型及計量層次)的數(shù)據(jù)。4.算術(shù)平均數(shù)受數(shù)據(jù)極端值影響,而眾數(shù)和中位數(shù)都不受極端值的影響。為排除極端值干擾,可計算切尾均值,即去掉數(shù)據(jù)中最大和最小的若干數(shù)值后計算的均值。該思路常用于某些比賽計分規(guī)則中,如體操、跳水等。切尾均值是將算術(shù)平均數(shù)與中位數(shù)互相結(jié)合的結(jié)果。3.算術(shù)平均數(shù)只能用于定量(數(shù)值型)數(shù)據(jù);525.算術(shù)平均數(shù)可用于推算總體的有關(guān)總量指標(biāo),而中位數(shù)和眾數(shù)則不宜用作此類推算。6.算術(shù)平均數(shù)和眾數(shù)、中位數(shù)的數(shù)量關(guān)系,取決于數(shù)據(jù)分布的偏斜程度。對單峰鐘形分布而言,三者數(shù)量大小有如下關(guān)系:統(tǒng)計學(xué)-第3章--數(shù)據(jù)分布特征描述課件53據(jù)例3-2,3-7,3-8結(jié)果,表3-3的燈泡壽命數(shù)據(jù)服從右偏分布。皮爾遜(K.Pearson)經(jīng)驗公式:在輕微偏態(tài)時,三者的近似關(guān)系為對稱分布右偏分布上偏分布正偏分布左偏分布下偏分布負(fù)偏分布據(jù)例3-2,3-7,3-8結(jié)果,表3-3的燈泡壽命數(shù)據(jù)服從右54第二節(jié)統(tǒng)計變量離散程度測定一、離散程度指標(biāo)及其作用二、極差、四分位差和平均差三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)五、異眾比率第二節(jié)統(tǒng)計變量離散程度測定一、離散程度指標(biāo)及其作用55一、離散程度指標(biāo)及作用測度離散程度的指標(biāo),稱為變異指標(biāo),分為兩類:絕對數(shù):極差、四分位差、平均差、方差和標(biāo)準(zhǔn)差。相對數(shù):離散系數(shù)、異眾比率。離散程度指標(biāo)作用:
1.說明數(shù)據(jù)分散程度,反映變量的穩(wěn)定性、均衡性。數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。
2.衡量平均數(shù)的代表性。離散程度越大,平均數(shù)的代表性就越小。
3.統(tǒng)計推斷的重要依據(jù)判別統(tǒng)計推斷前提條件是否成立;衡量推斷效果好壞的重要尺度。一、離散程度指標(biāo)及作用測度離散程度的指標(biāo),稱為變異指標(biāo),分為56二、極差、四分位差和平均差(一)極差(Range)極差(極值之差)是一組數(shù)據(jù)的最大值與最小值之差,常用R表示。對總體數(shù)據(jù)而言,極差能界定變量變化范圍與幅度大小,也稱全距。組距數(shù)列中,極差≈最高組上限-最低組下限。優(yōu)缺點:優(yōu)點:計算簡便、含義直觀、容易理解。缺點:代表性差、穩(wěn)健性差(僅利用尾端信息,未考慮數(shù)據(jù)中間分布情況,不能充分說明全部數(shù)據(jù)的差異程度)。二、極差、四分位差和平均差(一)極差(Range)57(二)四分位差第3四分位數(shù)(Q3)與第1四分位數(shù)(Q1)之差,常用Qd表示。計算公式為:實質(zhì)是兩端各去掉1/4數(shù)據(jù)以后的極差,表示占全部數(shù)據(jù)一半的中間數(shù)據(jù)的離散程度。四分位差越大,表示數(shù)據(jù)離散程度越大。在一定程度上改進(jìn)極差,避免了極端值干擾。但對數(shù)據(jù)差異的反映,仍然不充分。使用場合:當(dāng)用中位數(shù)測度數(shù)據(jù)集中趨勢時,使用四分位差反映離散程度效果最好(匹配性)。(二)四分位差58(三)平均差(AverageDeviation)定義:平均差是各數(shù)據(jù)與其均值(算術(shù)平均數(shù))的離差絕對值的算術(shù)平均數(shù)。反映全部數(shù)據(jù)與其均值的平均差距,以A.D表示。計算公式:優(yōu)缺點:含義清晰,能全面反映數(shù)據(jù)離散程度。取離差絕對值進(jìn)行平均,數(shù)學(xué)處理不方便,數(shù)學(xué)性質(zhì)也非最優(yōu)。分組數(shù)據(jù):xi為各組組中值未分組數(shù)據(jù):xi為原始數(shù)據(jù)(三)平均差(AverageDeviation)分組數(shù)據(jù):59三、方差和標(biāo)準(zhǔn)差(一)方差(Variance)概念和計算方差是全部數(shù)據(jù)與其均值的離差平方的算術(shù)平均數(shù).總體方差(
2)計算公式:樣本方差(常用S2表示)分母應(yīng)改為(n-1)。只有如此,才能保證s2是σ2的無偏估計量。分組數(shù)據(jù):未分組數(shù)據(jù):三、方差和標(biāo)準(zhǔn)差(一)方差(Variance)概念和計算分60標(biāo)準(zhǔn)差(standardDeviation):方差的算術(shù)平方根??傮w標(biāo)準(zhǔn)差一般用表示。計算公式為:未分組數(shù)據(jù):樣本標(biāo)準(zhǔn)差(S),分母應(yīng)為(n-1)。特點:方差和標(biāo)準(zhǔn)差均利用全部數(shù)據(jù)計算,能全面反映數(shù)據(jù)離散程度;且其靈敏性通常高于平均差。標(biāo)準(zhǔn)差比方差更容易理解(計量單位與均值一致)。在社會經(jīng)濟(jì)現(xiàn)象的統(tǒng)計分析中,標(biāo)準(zhǔn)差比方差應(yīng)用普遍,經(jīng)常被用作測度數(shù)據(jù)與均值差距的標(biāo)準(zhǔn)尺度。分組數(shù)據(jù):標(biāo)準(zhǔn)差(standardDeviation):方差的算術(shù)平61例3-9計算平均差、方差、標(biāo)準(zhǔn)差由例3-2,已知該組數(shù)據(jù)算術(shù)平均數(shù)為1542。例3-9計算平均差、方差、標(biāo)準(zhǔn)差62統(tǒng)計學(xué)-第3章--數(shù)據(jù)分布特征描述課件63(二)方差主要數(shù)學(xué)性質(zhì)常數(shù)方差等于零。如a為常數(shù),則變量線性函數(shù)的方差,等于變量系數(shù)的平方乘以變量的方差。設(shè)a,b為常數(shù),y=a+bx,則有:分組條件下,總體方差可以分解為組間方差與各組方差平均數(shù)之和。(該結(jié)論可用于第六章方差分析)組間方差各組方差平均數(shù)(二)方差主要數(shù)學(xué)性質(zhì)組間方差各組方差平均數(shù)64(三)標(biāo)準(zhǔn)化值(Z-score)對于兩組數(shù)據(jù),如果其均值和標(biāo)準(zhǔn)差均有明顯差異,則往往不能直接對比。需要首先將其轉(zhuǎn)化為可比的數(shù)據(jù)。通??梢詫ζ溥M(jìn)行無量綱化處理,得到標(biāo)準(zhǔn)化值,也稱為Z值。標(biāo)準(zhǔn)化值,實際是將不同均值和標(biāo)準(zhǔn)差的總體轉(zhuǎn)換為均值為0、標(biāo)準(zhǔn)差為1的總體,將原始數(shù)據(jù)轉(zhuǎn)換為其在總體中的相對位置。標(biāo)準(zhǔn)化值比較具有相對意義,沒有絕對意義。(三)標(biāo)準(zhǔn)化值(Z-score)65例3-10假定某班學(xué)生先后兩次進(jìn)行難度不同的綜合考試。第一次考試成績的均值和標(biāo)準(zhǔn)差分別為80分和10分,第二次考試成績的均值和標(biāo)準(zhǔn)差分別為70分和7分。某同學(xué)第一、二次考試的成績分別為92分和80分,那么全班相比較而言,他哪一次考試的成績更好呢?解:由于兩次考試成績的均值和標(biāo)準(zhǔn)差不同,該學(xué)生兩次考試的成績不宜直接比較。直接比較,第一次成績更好;利用標(biāo)準(zhǔn)化值比較,表明第二次考試成績更好一些。例3-10假定某班學(xué)生先后兩次進(jìn)行難度不同的綜合考試。第一次66(四)對稱鐘形分布的3法則3法則——關(guān)于對稱鐘形分布的近似經(jīng)驗法則:變量值落在[-3,+3]范圍以外的情況極為少見。通常將落在區(qū)間[-3,+3]之外的數(shù)據(jù),稱為異常數(shù)據(jù)或離群點。x99.73%68.27%95.45%正態(tài)分布(四)對稱鐘形分布的3法則x99.73%68.27%9567四、離散系數(shù)絕對值變異指標(biāo)有計量單位。其數(shù)值大小不僅取決于數(shù)據(jù)離散程度,還受數(shù)據(jù)本身水平高低和計量單位的影響。對不同變量(或不同數(shù)據(jù)組)的離散程度進(jìn)行比較時,只有當(dāng)它們的平均水平和計量單位都相同時,才能利用絕對值變異指標(biāo)分析;否則,須利用離散系數(shù)比較其離散程度。例如,哪個變量差異較大:體重,還是身高?例如,那組人群體重差異較大:成人,還是嬰兒?成人:平均體重=70kg,標(biāo)準(zhǔn)差=5kg嬰兒:5kg,1kg四、離散系數(shù)絕對值變異指標(biāo)有計量單位。其數(shù)值大小不僅取決于數(shù)68例:觀察7個人的體重和身高如下:體重(公斤)xi:62,67,65,69,70,73,74身高(厘米)yi:165,166,168,170,174,178,180判斷體重與身高哪個離散較為嚴(yán)重。注:兩組計量單位不同,不能用極差、平均差、標(biāo)準(zhǔn)差等絕對離散特征數(shù)直接進(jìn)行比較。適合采用離散系數(shù)比較。例:觀察7個人的體重和身高如下:體重(公斤)xi:69離散系數(shù)是極差、四分位差、平均差或標(biāo)準(zhǔn)差等變異指標(biāo)與算術(shù)平均數(shù)的比率,以相對數(shù)形式表示變異程度。將極差與算術(shù)平均數(shù)對比得到極差系數(shù),將平均差與算術(shù)平均數(shù)對比得到平均差系數(shù)。最常用的離散系數(shù)是以標(biāo)準(zhǔn)差計算的,稱為標(biāo)準(zhǔn)差系數(shù):離散系數(shù)大,說明數(shù)據(jù)的離散程度大,其平均數(shù)的代表性就差;反之亦反。離散系數(shù)是極差、四分位差、平均差或標(biāo)準(zhǔn)差等變異指標(biāo)與算術(shù)平均70五、異眾比率異眾比率是指非眾數(shù)值的次數(shù)之和在總次數(shù)中所占比重,其公式為:主要用于衡量一組數(shù)據(jù)以眾數(shù)為分布中心的集中程度,即衡量眾數(shù)對一組數(shù)據(jù)一般水平的代表性。其值越小,數(shù)據(jù)集中程度越高,眾數(shù)代表性越大;反之,亦反。其既可用于定量變量,也可用于定性變量。五、異眾比率異眾比率是指非眾數(shù)值的次數(shù)之和在總次數(shù)中所占比71第三節(jié)變量分布的偏度與峰度一、矩(動差)二、偏度三、峰度要全面了解數(shù)據(jù)的分布特點,還要知道數(shù)據(jù)偏斜狀況以及尖峭程度,分別由偏度和峰度來反映。與均值和方差一樣,均為矩的特例。第三節(jié)變量分布的偏度與峰度一、矩(動差)72一、矩(動差)矩(動差)——一系列刻畫數(shù)據(jù)分布特征的指標(biāo)的統(tǒng)稱(該概念引自物理學(xué))。變量值與數(shù)值a之離差的k次方的平均數(shù),稱為變量x關(guān)于a的k階矩,即:一、矩(動差)矩(動差)——一系列刻畫數(shù)據(jù)分布特征的指73K階原點矩(當(dāng)a=0時)是數(shù)據(jù)的k次方的平均數(shù)一階原點矩即算術(shù)平均數(shù);二階原點矩即平方平均數(shù)。K階中心矩矩(當(dāng)a=均值時)是以均值為中心計算的離差k次方的平均數(shù)k=1時,稱為一階中心矩,它恒等于0,即
m1=0;k=2時,稱為二階中心矩,也就是方差,即m2=
2。K階原點矩(當(dāng)a=0時)是數(shù)據(jù)的k次方的平均數(shù)74二、偏度(Skewness)偏度——指數(shù)據(jù)分布的不對稱程度或偏斜程度。以對稱分布為標(biāo)準(zhǔn)來區(qū)分偏態(tài)分布又分左偏(負(fù)偏)和右偏(正偏).左偏分布(負(fù)偏)右偏分布(正偏)二、偏度(Skewness)偏度——指數(shù)據(jù)分布的不對稱程度或75偏態(tài)的測度方法(一)由均值與眾數(shù)之間的關(guān)系求偏態(tài)系數(shù) 一般有:-30+3
極左偏態(tài)對稱分布極右偏態(tài)偏態(tài)的測度方法-376(二)由三個四分位數(shù)之間的關(guān)系求偏態(tài)系數(shù)值域:-1Sk1-10+1
極左偏態(tài)對稱分布極右偏態(tài)(二)由三個四分位數(shù)之間的關(guān)系求偏態(tài)系數(shù)值域:-1Sk77(三)利用3階中心矩來計算偏度系數(shù)。測定偏度最常用的方法原理:若分布不對稱,則3階中心矩不為0。不對稱程度愈嚴(yán)重,3階中心矩的絕對值愈大。為消除量綱的影響,可除以
3。0
對稱分布
左偏分布
右偏分布(三)利用3階中心矩來計算偏度系數(shù)。078三、峰度(Kurtosis)峰度——是指變量的集中程度和分布曲線的陡峭(或平坦)的程度。對峰度的度量通常以正態(tài)分布曲線為比較標(biāo)準(zhǔn),分為正態(tài)峰度、尖頂峰度和平頂峰度.平頂分布尖峰分布尖頂峰度的分布曲線比正態(tài)分布曲線更加尖峭、更高更窄;平頂峰度的分布曲線比正態(tài)分配曲線更為平緩、更低更扁平。三、峰度(Kurtosis)峰度——是指變量的集中程度和分布79峰度系數(shù)原理:分布曲線尖峭程度與偶數(shù)階中心矩數(shù)值大小直接有關(guān)。以四階中心矩m4為基礎(chǔ),除以標(biāo)準(zhǔn)差的四次方σ4(消除量綱影響),得到的相對數(shù)即可衡量峰度。對正態(tài)分布曲線有:m4/σ4=3當(dāng)K=0時,分布曲線為正態(tài)曲線;當(dāng)K>0時,為尖頂曲線,表示數(shù)據(jù)比正態(tài)分布更集中在均值附近;K的數(shù)值越大,則變量分布曲線之頂端越尖峭;當(dāng)K<0時,為平頂曲線,表示數(shù)據(jù)比正態(tài)分布更分散;K的數(shù)值越小,則變量分布曲線之頂端越平坦。峰度系數(shù)80例3-13根據(jù)表3-3的數(shù)據(jù),計算使用壽命分布的偏度系數(shù)和峰度系數(shù)。解:計算結(jié)果表明,偏度系數(shù)幾乎為0,峰度系數(shù)略小于0,說明該產(chǎn)品使用壽命的分布十分接近對稱分布,分布曲線頂峰略比正態(tài)分布平坦一些??偟恼f來,該產(chǎn)品的使用壽命的分布非常接近正態(tài)分布。例3-13根據(jù)表3-3的數(shù)據(jù),計算使用壽命分布的偏度系數(shù)和峰81以數(shù)值特征,對統(tǒng)計數(shù)據(jù)分布進(jìn)行量化描述。主要包括三方面:集中趨勢用平均指標(biāo)描述(位置特征);離中趨勢用變異指標(biāo)描述(離散特征);偏斜程度用偏度和峰度描述(偏斜特征、峰度特征)。
本章學(xué)習(xí)任務(wù)以數(shù)值特征,對統(tǒng)計數(shù)據(jù)分布進(jìn)行量化描述。本章學(xué)習(xí)任務(wù)82學(xué)習(xí)要求:理解測度統(tǒng)計數(shù)據(jù)集中趨勢、離散程度的概念、指標(biāo)、相互關(guān)系;
掌握主要分析指標(biāo)的計算方法和應(yīng)用場合,并能熟練進(jìn)行相關(guān)計算分析。學(xué)習(xí)要求:83數(shù)據(jù)分布特征與測度:概覽集中趨勢(位置)偏態(tài)和峰態(tài)(形狀)離中趨勢
(分散程度)數(shù)據(jù)分布特征與測度:概覽集中趨勢偏態(tài)和峰態(tài)離中趨勢84數(shù)據(jù)分布特征測度分布形狀集中趨勢離散程度冪平均數(shù)中位數(shù)眾數(shù)異眾比率方差、標(biāo)準(zhǔn)差峰度平均差極差偏度
變異系數(shù)數(shù)據(jù)分布特征測度分布形狀集中趨勢離散程度冪平均數(shù)中位數(shù)眾85第一節(jié)統(tǒng)計變量集中趨勢測定一集中趨勢指標(biāo)及作用二數(shù)值平均數(shù)三眾數(shù)與中位數(shù)(位置平均數(shù))第一節(jié)統(tǒng)計變量集中趨勢測定一集中趨勢指標(biāo)及作用86一、集中趨勢指標(biāo)及作用集中趨勢(Centraltendency)集中趨勢即一組數(shù)據(jù)向其中心值聚集或靠攏的傾向和程度。用平均指標(biāo)表示,代表數(shù)據(jù)的一般水平。測定集中趨勢是認(rèn)識數(shù)據(jù)分布特征的基本內(nèi)容。一、集中趨勢指標(biāo)及作用集中趨勢(Centraltenden87集中趨勢指標(biāo)有兩類:數(shù)值平均數(shù)根據(jù)全部數(shù)據(jù)計算得到的代表值。優(yōu)點:數(shù)學(xué)性質(zhì)良好,可用于統(tǒng)計推斷
缺點:易受極端值影響。主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)及幾何平均數(shù),三者均為冪平均數(shù)特例。集中趨勢指標(biāo)有兩類:88位置平均數(shù)根據(jù)對總體中處于特定位置的單個或部分單位標(biāo)志值直接觀察或推算確定的代表值。優(yōu)點:不易受極端值影響,具有較好穩(wěn)健性。
缺點:不宜用作統(tǒng)計推斷。主要包括眾數(shù)和中位數(shù)。位置平均數(shù)89集中趨勢指標(biāo)作用1.反映變量分布的集中趨勢和一般水平。如用平均工資了解職工工資分布的中心,反映職工工資的一般水平。2.比較同一現(xiàn)象在不同空間或不同階段的發(fā)展水平,反映現(xiàn)象變化特征、趨勢和規(guī)律性。能消除總體規(guī)模差異造成的不利影響;在一定程度上減弱偶然因素的影響。一、集中趨勢指標(biāo)及作用集中趨勢指標(biāo)作用一、集中趨勢指標(biāo)及作用903.分析現(xiàn)象之間的依存關(guān)系。如研究勞動者文化程度與收入的關(guān)系。4.(數(shù)值)平均指標(biāo)是推斷統(tǒng)計中的重要統(tǒng)計量,是進(jìn)行統(tǒng)計推斷的基礎(chǔ)。3.分析現(xiàn)象之間的依存關(guān)系。91幾種常見的位置特征數(shù)數(shù)據(jù)分布的位置特征數(shù)實際上也是數(shù)據(jù)的代表值,代表了數(shù)據(jù)的一般水平。在不同場合,可以適當(dāng)選用平均數(shù)、中位數(shù)、眾數(shù)充當(dāng)位置特征數(shù)(代表值)其中平均數(shù)不同于中位數(shù)、眾數(shù)的特點在于:平均數(shù)是由所研究的全體數(shù)據(jù)參加計算所得。平均數(shù)的一般形式叫做冪平均數(shù)。常見的有算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)。幾種常見的位置特征數(shù)數(shù)據(jù)分布的位置特征數(shù)實際上也是數(shù)據(jù)的代表92二、數(shù)值平均數(shù)(一)冪平均數(shù)冪,power變量X取N個值:。權(quán)數(shù)為一組正數(shù):。加權(quán)冪平均數(shù)一般形式為:其中,k為任意實數(shù)。二、數(shù)值平均數(shù)(一)冪平均數(shù)93權(quán)數(shù)w均相等時,加權(quán)平均數(shù)退化為簡單平均數(shù):
權(quán)數(shù)w均相等時,加權(quán)平均數(shù)退化為簡單平均數(shù):94特例情況
冪平均數(shù)算術(shù)平均數(shù)(冪指數(shù)k=1)
調(diào)和平均數(shù)(冪指數(shù)k=-1)幾何平均數(shù)(冪指數(shù)k0)
其他冪平均數(shù)特例情況冪平均數(shù)算術(shù)平均數(shù)(冪指數(shù)k=1)調(diào)和平均數(shù)(95k=1:算術(shù)平均數(shù)加權(quán)簡單k=1:算術(shù)平均數(shù)96k=-1:調(diào)和平均數(shù)加權(quán)簡單k=-1:調(diào)和平均數(shù)97k0:幾何平均數(shù)加權(quán)簡單k0:幾何平均數(shù)98關(guān)于加權(quán)問題權(quán)數(shù)確定方式:客觀權(quán)數(shù):權(quán)數(shù)由實際統(tǒng)計資料獲得或推算。主觀權(quán)數(shù):根據(jù)研究問題,由研究者主觀賦值。權(quán)數(shù)作用:權(quán)衡變量的各種取值在計算平均數(shù)時的重要性。權(quán)數(shù)作用,根本上是通過權(quán)數(shù)結(jié)構(gòu)實現(xiàn)。關(guān)于加權(quán)問題99權(quán)數(shù)作用:即使不改變被平均的數(shù)值,僅改變權(quán)數(shù)結(jié)構(gòu),即可改變平均數(shù)水平。例如,改變教師職稱結(jié)構(gòu),而不改變各種職稱教師課時費(fèi)標(biāo)準(zhǔn),會改變平均課時費(fèi)水平。權(quán)數(shù)實質(zhì)權(quán)數(shù)的實質(zhì)在于其結(jié)構(gòu),即結(jié)構(gòu)比例形式(比重權(quán)數(shù))。其更能清晰表明權(quán)數(shù)之權(quán)衡輕重的作用。權(quán)數(shù)作用:100權(quán)數(shù)形式有2種:絕對數(shù)形式結(jié)構(gòu)比例形式
權(quán)數(shù)形式有2種:101(二)算術(shù)平均數(shù)算術(shù)平均數(shù)(Arithmeticmean),也稱均值(mean)。由一組數(shù)據(jù)的總和(總體標(biāo)志總量)除以該組數(shù)據(jù)的項數(shù)(總體單位總量)得到;算術(shù)平均數(shù)=總體標(biāo)志總量/總體單位總量是最常用的數(shù)值平均數(shù);根據(jù)掌握資料不同,其有多種計算公式。
(二)算術(shù)平均數(shù)1021.簡單算術(shù)平均數(shù)對未分組數(shù)據(jù),采用簡單算術(shù)平均數(shù)公式。即把各項數(shù)據(jù)直接加總,然后除以總項數(shù)。計算公式:1.簡單算術(shù)平均數(shù)103分組舉例解:采用簡單算術(shù)平均法計算,即全體隊員的平均年齡為(單位:周歲)分組數(shù)據(jù)不能簡單平均!因為各組變量值的次數(shù)(權(quán)數(shù))不等!若采用簡單平均:應(yīng)采用加權(quán)平均。兩種計算公式結(jié)果相同!分組舉例解:采用簡單算術(shù)平均法計算,即全體隊員的平均年齡為(1042.加權(quán)算術(shù)平均數(shù)對單項式分組資料,應(yīng)以各標(biāo)志值出現(xiàn)次數(shù)為權(quán)數(shù)加權(quán)平均。加權(quán)算術(shù)平均數(shù)計算公式:例3-1單項式分組資料(表3-2)計算方法為:2.加權(quán)算術(shù)平均數(shù)1053.由組距分組資料計算組距分組資料中,各組變量值不唯一,是一個區(qū)間;計算時,各組變量值通常用組中值(近似)代表;用組中值代替實際值,其假定條件是各組內(nèi)數(shù)據(jù)呈均勻分布或?qū)ΨQ分布。由于實際情況中該條件未必滿足,故計算結(jié)果是近似值;與單項式分組資料一樣,采用加權(quán)算術(shù)平均數(shù)計算。3.由組距分組資料計算106舉例解:平均使用壽命為舉例解:平均使用壽命為1074.比率類型統(tǒng)計變量求平均數(shù)(1)比率類型統(tǒng)計變量,指平均指標(biāo)和相對指標(biāo)。(2)對比率類型變量求平均,涉及個體比率和總比率兩個概念。(3)對比率類型變量計算平均數(shù),基本要求是:比率類型變量平均值M,等于個體比率的總比率。簡言之:先求和,再對比。(4)根據(jù)掌握資料不同,可采用三種等價形式:
總比率,加權(quán)算術(shù)平均,加權(quán)調(diào)和平均4.比率類型統(tǒng)計變量求平均數(shù)108例如:對相對數(shù)求算術(shù)平均數(shù)對相對數(shù)而言,由于各個相對數(shù)的對比基礎(chǔ)不同,采用簡單算術(shù)平均不合理,必須加權(quán)平均。權(quán)數(shù)選擇必須符合該相對數(shù)本身的計算公式,通常為該相對數(shù)的分母指標(biāo)。對表3-4的分組資料:其中,分母b為權(quán)數(shù)f例如:對相對數(shù)求算術(shù)平均數(shù)109又如:對平均數(shù)求算術(shù)平均數(shù)某商貿(mào)公司購入一批水果,分等級收購價格和收購金額如下表。試求這批水果的平均收購價格。解:又如:對平均數(shù)求算術(shù)平均數(shù)1105.算術(shù)平均數(shù)主要數(shù)學(xué)性質(zhì)(1)算術(shù)平均數(shù)與變量值個數(shù)乘積,等于各變量值總和。(2)各變量值與算術(shù)平均數(shù)的離差之總和,等于零。(3)各變量值與算術(shù)平均數(shù)的離差平方之總和最小。(從全部數(shù)據(jù)看,算術(shù)平均數(shù)最接近所有變量值)5.算術(shù)平均數(shù)主要數(shù)學(xué)性質(zhì)111性質(zhì)(3)證明:性質(zhì)(3)證明:112(三)調(diào)和平均數(shù)(Harmonicmean)調(diào)和平均數(shù),也稱倒數(shù)平均數(shù)。各變量值倒數(shù)(1/xi)的算術(shù)平均數(shù)的倒數(shù)。計算公式為:(三)調(diào)和平均數(shù)(Harmonicmean)113社會經(jīng)濟(jì)統(tǒng)計中所應(yīng)用的調(diào)和平均數(shù),通常是加權(quán)算術(shù)平均數(shù)的變形。已知各組變量值xi和(xi
fi)而缺乏fi時,加權(quán)算術(shù)平均數(shù)通常可變形為調(diào)和平均數(shù)形式來計算?;貞?-4求解:社會經(jīng)濟(jì)統(tǒng)計中所應(yīng)用的調(diào)和平均數(shù),通常是加權(quán)算術(shù)平均數(shù)的變形114(四)幾何平均數(shù)(Geometricmean)簡單幾何平均數(shù)—n個變量值連乘積的n次方根。加權(quán)幾何平均數(shù)適用于各個變量值之間存在連乘積關(guān)系的場合。主要用于計算現(xiàn)象的平均發(fā)展速度(第九章);也適用于對某些具有環(huán)比性質(zhì)的比率求平均(下例)。(四)幾何平均數(shù)(Geometricmean)115舉例例3-5。某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。本月該企業(yè)各加工工序的合格率分別為88%、85%、90%、92%、96%,試求這五道工序的平均合格率。解:本例中各工序的合格率具有環(huán)比的性質(zhì),企業(yè)產(chǎn)品的總合格率等于各工序合格率之連乘積。所以,所求平均合格率應(yīng)為:舉例例3-5。某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。116(五)幾種平均數(shù)大小關(guān)系對同一批數(shù)據(jù)和權(quán)數(shù),三種平均數(shù)關(guān)系:
調(diào)和平均幾何平均算術(shù)平均當(dāng)且僅當(dāng)所有觀察值全部相等時,等號成立;否則不等式嚴(yán)格成立。證明思路:首先證明冪平均數(shù)隨冪值k單調(diào)遞增變化(可由微分方法證明)。根據(jù)三類平均數(shù)k取值關(guān)系,調(diào)和平均數(shù)(k=-1)、幾何平均數(shù)(k→0)、算術(shù)平均數(shù)(k=1)可得到以上結(jié)論。(五)幾種平均數(shù)大小關(guān)系117平均數(shù)的應(yīng)用場合常見的應(yīng)用場合有:作為統(tǒng)計指標(biāo)的一種表現(xiàn)形式作為統(tǒng)計總體分布的位置特征數(shù)反映一個統(tǒng)計變量所有觀察值的一般水平抵消掉隨機(jī)試驗中的偶然因素影響,顯示出試驗的規(guī)律性水平。
平均數(shù)的應(yīng)用場合常見的應(yīng)用場合有:118數(shù)據(jù)是隨機(jī)試驗的結(jié)果。隨機(jī)試驗的個別結(jié)果會呈現(xiàn)出或高或低的起伏波動,實際上這是由偶然因素影響造成的。在進(jìn)行大量重復(fù)試驗,將試驗結(jié)果簡單算術(shù)平均,那么隨著試驗次數(shù)的增加,算術(shù)平均值就會越來越逼近一個穩(wěn)定值,而這個穩(wěn)定值就是試驗的規(guī)律性水平(數(shù)學(xué)期望值)。因此,在統(tǒng)計分析中,常常采用算術(shù)平均的手法去抵消現(xiàn)象中的偶然影響,以期近似地認(rèn)識現(xiàn)象的規(guī)律性水平。數(shù)據(jù)是隨機(jī)試驗的結(jié)果。119三、眾數(shù)與中位數(shù)(一)眾數(shù)(Mode)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多、頻率最高的變量值,常用Mo
表示。眾數(shù)代表最常見、最普遍的狀況,可度量現(xiàn)象集中趨勢??蓽y度定性變量集中趨勢,也可度量定量變量集中趨勢。在社會經(jīng)濟(jì)現(xiàn)象的管理決策中具有廣泛應(yīng)用。三、眾數(shù)與中位數(shù)(一)眾數(shù)(Mode)120對分布數(shù)列求眾數(shù),具有條件性。存在性:若分布數(shù)列沒有明顯集中趨勢,則不存在眾數(shù);唯一性:若分布數(shù)列有多個相對集中趨勢,則有多個眾數(shù)。從分布曲線上看,眾數(shù)就是一個變量分布曲線的最高峰所對應(yīng)的變量值。(見課本55頁圖3-1)為確定眾數(shù),通常要編制分布數(shù)列。眾數(shù)是分布曲線最高點對應(yīng)的標(biāo)志值。單項式分布數(shù)列中,眾數(shù)是具有最多次數(shù)的標(biāo)志值,可觀察得到。如表3-2中,眾數(shù)值Mo=25,組距式分布數(shù)列中,眾數(shù)需要推算。對分布數(shù)列求眾數(shù),具有條件性。121組距分布數(shù)列中,眾數(shù)推算方法:先找到眾數(shù)組。等距數(shù)列中,眾數(shù)組是頻數(shù)最多的組;異距數(shù)列中,眾數(shù)組是頻數(shù)密度最大的組。根據(jù)眾數(shù)組與其相鄰兩組的次數(shù)差推算(假定性)。其公式有2,結(jié)果完全一致:具體計算:見教材例3-7(P55)下限公式:上限公式:組距分布數(shù)列中,眾數(shù)推算方法:下限公式:上限公式:122統(tǒng)計學(xué)-第3章--數(shù)據(jù)分布特征描述課件1234050607080901005040302010AGFBCED頻數(shù)xy(L)(U)Mo=L+x=U-yO405060124(二)中位數(shù)(Median)中位數(shù)是將數(shù)據(jù)由小到大排列后位置居中的數(shù)值。標(biāo)志值小于或等于中位數(shù)的單位占一半;標(biāo)志值大于或等于中位數(shù)的單位也占一半。用中位數(shù)代表總體標(biāo)志值的一般水平,可以避免極端值影響,有時更具代表性。Me50%50%(二)中位數(shù)(Median)Me50%50%125未分組數(shù)據(jù)計算中位數(shù)若數(shù)據(jù)項數(shù)是奇數(shù),則位于中間的數(shù)值為中位數(shù);如5人收入為:1200,1450,1500,1600,2000元,則其收入中位數(shù)Me=1500。若數(shù)據(jù)項數(shù)是偶數(shù),則取居中兩個數(shù)值的平均數(shù)為中位數(shù)。如6人收入為:1200,1450,1500,1600,1800,2000元,則收入中位數(shù)Me=1550。未分組數(shù)據(jù)計算中位數(shù)126分組數(shù)據(jù)推算中位數(shù)先確定中位數(shù)組,即中間位置(Σf/2)所在的組。對單項式分組,可直接得到中位數(shù)。對組距式分組,假定中位數(shù)組內(nèi)次數(shù)均勻分布,近似推算中位數(shù)。計算公式有2,結(jié)果完全一致:分組數(shù)據(jù)推算中位數(shù)127下限公式上限公式下限公式128分組數(shù)據(jù)推算中位數(shù)先確定中位數(shù)組,即中間位置(Σf/2)所在的組。對單項式分組,可直接得到中位數(shù)。對組距式分組,假定中位數(shù)組內(nèi)次數(shù)均勻分布,近似推算中位數(shù)。計算公式有2,結(jié)果完全一致。見下例:下限公式:上限公式:分組數(shù)據(jù)推算中位數(shù)下限公式:上限公式:129可由累計分布數(shù)列或累計分布圖確定中位數(shù)。以累計頻率分布曲線圖為例(該例與前面直方圖數(shù)據(jù)一致)此例中,與累計頻率50%相對應(yīng)的成績76分,即為中位數(shù)。向上累計圖:60分以下有16.7%向下累計圖:80分以上有38.9%可由累計分布數(shù)列或累計分布圖確定中位數(shù)。向上累計圖:向下累計130中位數(shù)與分位數(shù)四分位數(shù)、十分位數(shù)、百分位數(shù)分別是將數(shù)據(jù)由小到大排序后,位于全部數(shù)據(jù)1/4、1/10、1/100位置上的數(shù)值。中位數(shù)實際上是第2個四分位數(shù)、第5個十分位數(shù)、第50個百分位數(shù)。分位數(shù)與其它指標(biāo)結(jié)合,可以更詳細(xì)地反映數(shù)據(jù)分布特征。中位數(shù)使用場合與作用在較明顯的偏斜分布情形下,用中位數(shù)來說明次數(shù)分布位置特征較為適中。因為眾數(shù)忽略了偏斜一側(cè)的大量數(shù)值,而算術(shù)平均數(shù)又過分強(qiáng)調(diào)了這些數(shù)值。算術(shù)平均數(shù)對特異值的反應(yīng)十分靈敏,而中位數(shù)對特異值反應(yīng)不靈敏。常常把中位數(shù)(與算術(shù)平均數(shù)的差異大?。┳鳛樘剿靼l(fā)現(xiàn)特異值的標(biāo)準(zhǔn)。中位數(shù)與分位數(shù)131箱線圖(boxplot)箱線圖由一組數(shù)據(jù)的最小值(xmin)、第一四分位數(shù)(Q1)、中位數(shù)(Me)、第三四分位數(shù)(Q3)、最大值(xmax)等五個數(shù)值來繪成。利用箱線圖可以觀察數(shù)據(jù)分布的范圍、中心位置和對稱性等特征,還可進(jìn)行多組數(shù)據(jù)分布的比較。xminQ1MeQ3
xmax箱線圖(boxplot)xminQ1132(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)比較0.三者均測度數(shù)據(jù)的集中趨勢和一般水平。1.算術(shù)平均數(shù)屬于數(shù)值平均數(shù),其綜合利用全部數(shù)據(jù)信息;眾數(shù)和中位數(shù)則由數(shù)據(jù)分布的特定位置確定。2.算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在,且具有惟一性;眾數(shù)則不然,其計算和應(yīng)用有兩個前提條件:數(shù)據(jù)項數(shù)眾多,且具有明顯的集中趨勢。(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)比較1333.算術(shù)平均數(shù)只能用于定量(數(shù)值型)數(shù)據(jù);中位數(shù)適用于定序數(shù)據(jù)和定量數(shù)據(jù);眾數(shù)適用于所有形式(各種類型及計量層次)的數(shù)據(jù)。4.算術(shù)平均數(shù)受數(shù)據(jù)極端值影響,而眾數(shù)和中位數(shù)都不受極端值的影響。為排除極端值干擾,可計算切尾均值,即去掉數(shù)據(jù)中最大和最小的若干數(shù)值后計算的均值。該思路常用于某些比賽計分規(guī)則中,如體操、跳水等。切尾均值是將算術(shù)平均數(shù)與中位數(shù)互相結(jié)合的結(jié)果。3.算術(shù)平均數(shù)只能用于定量(數(shù)值型)數(shù)據(jù);1345.算術(shù)平均數(shù)可用于推算總體的有關(guān)總量指標(biāo),而中位數(shù)和眾數(shù)則不宜用作此類推算。6.算術(shù)平均數(shù)和眾數(shù)、中位數(shù)的數(shù)量關(guān)系,取決于數(shù)據(jù)分布的偏斜程度。對單峰鐘形分布而言,三者數(shù)量大小有如下關(guān)系:統(tǒng)計學(xué)-第3章--數(shù)據(jù)分布特征描述課件135據(jù)例3-2,3-7,3-8結(jié)果,表3-3的燈泡壽命數(shù)據(jù)服從右偏分布。皮爾遜(K.Pearson)經(jīng)驗公式:在輕微偏態(tài)時,三者的近似關(guān)系為對稱分布右偏分布上偏分布正偏分布左偏分布下偏分布負(fù)偏分布據(jù)例3-2,3-7,3-8結(jié)果,表3-3的燈泡壽命數(shù)據(jù)服從右136第二節(jié)統(tǒng)計變量離散程度測定一、離散程度指標(biāo)及其作用二、極差、四分位差和平均差三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)五、異眾比率第二節(jié)統(tǒng)計變量離散程度測定一、離散程度指標(biāo)及其作用137一、離散程度指標(biāo)及作用測度離散程度的指標(biāo),稱為變異指標(biāo),分為兩類:絕對數(shù):極差、四分位差、平均差、方差和標(biāo)準(zhǔn)差。相對數(shù):離散系數(shù)、異眾比率。離散程度指標(biāo)作用:
1.說明數(shù)據(jù)分散程度,反映變量的穩(wěn)定性、均衡性。數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。
2.衡量平均數(shù)的代表性。離散程度越大,平均數(shù)的代表性就越小。
3.統(tǒng)計推斷的重要依據(jù)判別統(tǒng)計推斷前提條件是否成立;衡量推斷效果好壞的重要尺度。一、離散程度指標(biāo)及作用測度離散程度的指標(biāo),稱為變異指標(biāo),分為138二、極差、四分位差和平均差(一)極差(Range)極差(極值之差)是一組數(shù)據(jù)的最大值與最小值之差,常用R表示。對總體數(shù)據(jù)而言,極差能界定變量變化范圍與幅度大小,也稱全距。組距數(shù)列中,極差≈最高組上限-最低組下限。優(yōu)缺點:優(yōu)點:計算簡便、含義直觀、容易理解。缺點:代表性差、穩(wěn)健性差(僅利用尾端信息,未考慮數(shù)據(jù)中間分布情況,不能充分說明全部數(shù)據(jù)的差異程度)。二、極差、四分位差和平均差(一)極差(Range)139(二)四分位差第3四分位數(shù)(Q3)與第1四分位數(shù)(Q1)之差,常用Qd表示。計算公式為:實質(zhì)是兩端各去掉1/4數(shù)據(jù)以后的極差,表示占全部數(shù)據(jù)一半的中間數(shù)據(jù)的離散程度。四分位差越大,表示數(shù)據(jù)離散程度越大。在一定程度上改進(jìn)極差,避免了極端值干擾。但對數(shù)據(jù)差異的反映,仍然不充分。使用場合:當(dāng)用中位數(shù)測度數(shù)據(jù)集中趨勢時,使用四分位差反映離散程度效果最好(匹配性)。(二)四分位差140(三)平均差(AverageDeviation)定義:平均差是各數(shù)據(jù)與其均值(算術(shù)平均數(shù))的離差絕對值的算術(shù)平均數(shù)。反映全部數(shù)據(jù)與其均值的平均差距,以A.D表示。計算公式:優(yōu)缺點:含義清晰,能全面反映數(shù)據(jù)離散程度。取離差絕對值進(jìn)行平均,數(shù)學(xué)處理不方便,數(shù)學(xué)性質(zhì)也非最優(yōu)。分組數(shù)據(jù):xi為各組組中值未分組數(shù)據(jù):xi為原始數(shù)據(jù)(三)平均差(AverageDeviation)分組數(shù)據(jù):141三、方差和標(biāo)準(zhǔn)差(一)方差(Variance)概念和計算方差是全部數(shù)據(jù)與其均值的離差平方的算術(shù)平均數(shù).總體方差(
2)計算公式:樣本方差(常用S2表示)分母應(yīng)改為(n-1)。只有如此,才能保證s2是σ2的無偏估計量。分組數(shù)據(jù):未分組數(shù)據(jù):三、方差和標(biāo)準(zhǔn)差(一)方差(Variance)概念和計算分142標(biāo)準(zhǔn)差(standardDeviation):方差的算術(shù)平方根??傮w標(biāo)準(zhǔn)差一般用表示。計算公式為:未分組數(shù)據(jù):樣本標(biāo)準(zhǔn)差(S),分母應(yīng)為(n-1)。特點:方差和標(biāo)準(zhǔn)差均利用全部數(shù)據(jù)計算,能全面反映數(shù)據(jù)離散程度;且其靈敏性通常高于平均差。標(biāo)準(zhǔn)差比方差更容易理解(計量單位與均值一致)。在社會經(jīng)濟(jì)現(xiàn)象的統(tǒng)計分析中,標(biāo)準(zhǔn)差比方差應(yīng)用普遍,經(jīng)常被用作測度數(shù)據(jù)與均值差距的標(biāo)準(zhǔn)尺度。分組數(shù)據(jù):標(biāo)準(zhǔn)差(standardDeviation):方差的算術(shù)平143例3-9計算平均差、方差、標(biāo)準(zhǔn)差由例3-2,已知該組數(shù)據(jù)算術(shù)平均數(shù)為1542。例3-9計算平均差、方差、標(biāo)準(zhǔn)差144統(tǒng)計學(xué)-第3章--數(shù)據(jù)分布特征描述課件145(二)方差主要數(shù)學(xué)性質(zhì)常數(shù)方差等于零。如a為常數(shù),則變量線性函數(shù)的方差,等于變量系數(shù)的平方乘以變量的方差。設(shè)a,b為常數(shù),y=a+bx,則有:分組條件下,總體方差可以分解為組間方差與各組方差平均數(shù)之和。(該結(jié)論可用于第六章方差分析)組間方差各組方差平均數(shù)(二)方差主要數(shù)學(xué)性質(zhì)組間方差各組方差平均數(shù)146(三)標(biāo)準(zhǔn)化值(Z-score)對于兩組數(shù)據(jù),如果其均值和標(biāo)準(zhǔn)差均有明顯差異,則往往不能直接對比。需要首先將其轉(zhuǎn)化為可比的數(shù)據(jù)。通常可以對其進(jìn)行無量綱化處理,得到標(biāo)準(zhǔn)化值,也稱為Z值。標(biāo)準(zhǔn)化值,實際是將不同均值和標(biāo)準(zhǔn)差的總體轉(zhuǎn)換為均值為0、標(biāo)準(zhǔn)差為1的總體,將原始數(shù)據(jù)轉(zhuǎn)換為其在總體中的相對位置。標(biāo)準(zhǔn)化值比較具有相對意義,沒有絕對意義。(三)標(biāo)準(zhǔn)化值(Z-score)147例3-10假定某班學(xué)生先后兩次進(jìn)行難度不同的綜合考試。第一次考試成績的均值和標(biāo)準(zhǔn)差分別為80分和10分,第二次考試成績的均值和標(biāo)準(zhǔn)差分別為70分和7分。某同學(xué)第一、二次考試的成績分別為92分和80分,那么全班相比較而言,他哪一次考試的成績更好呢?解:由于兩次考試成績的均值和標(biāo)準(zhǔn)差不同,該學(xué)生兩次考試的成績不宜直接比較。直接比較,第一次成績更好;利用標(biāo)準(zhǔn)化值比較,表明第二次考試成績更好一些。例3-10假定某班學(xué)生先后兩次進(jìn)行難度不同的綜合考試。第一次148(四)對稱鐘形分布的3法則3法則——關(guān)于對稱鐘形分布的近似經(jīng)驗法則:變量值落在[-3,+3]范圍以外的情況極為少見。通常將落在區(qū)間[-3,+3]之外的數(shù)據(jù),稱為異常數(shù)據(jù)或離群點。x99.73%68.27%95.45%正態(tài)分布(四)對稱鐘形分布的3法則x99.73%68.27%95149四、離散系數(shù)絕對值變異指標(biāo)有計量單位。其數(shù)值大小不僅取決于數(shù)據(jù)離散程度,還受數(shù)據(jù)本身水平高低和計量單位的影響。對不同變量(或不同數(shù)據(jù)組)的離散程度進(jìn)行比較時,只有當(dāng)它們的平均水平和計量單位都相同時,才能利用絕對值變異指標(biāo)分析;否則,須利用離散系數(shù)比較其離散程度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年統(tǒng)計學(xué)期末考試:抽樣調(diào)查方法與結(jié)構(gòu)方程模型試題集
- 2025年農(nóng)村衛(wèi)生人才考試:農(nóng)村居民健康檔案管理實務(wù)知識試題集
- 2025年成人高等學(xué)校招生考試《語文》高頻考點速記題庫(作文開頭結(jié)尾寫作技巧實戰(zhàn)解析實戰(zhàn))
- 2025年專升本藝術(shù)概論考試模擬卷(藝術(shù)審美心理)-藝術(shù)作品鑒賞能力測試試題
- 旅游電商活動全策略
- 托班安全講解課件
- 科研成果展望
- 特殊教育教師培訓(xùn)
- 化工領(lǐng)域季度回顧
- 咖啡調(diào)制技能指導(dǎo)(第二版) 題庫 -卡布奇諾咖啡調(diào)制
- 復(fù)調(diào)音樂巡禮-巴赫勃蘭登堡協(xié)奏曲 課件-2023-2024學(xué)年高中音樂人音版(2019)必修音樂鑒賞
- 《3-6歲兒童學(xué)習(xí)與發(fā)展指南》考試參考題庫120題(含答案)
- 2024新人教版初中英語單詞表匯總(七-九年級)中考復(fù)習(xí)必背
- 汽車維修保養(yǎng)工作質(zhì)量考核表
- 應(yīng)急救援專項方案
- 有機(jī)化學(xué)(馮駿材編)課后習(xí)題答案
- 東北三省三校2024年高三一模(第一次聯(lián)合模擬考試)語文試卷(含答案)
- 無人機(jī)的傳感器系統(tǒng)
- 圖文解讀中小學(xué)教育懲戒規(guī)則(試行)全文內(nèi)容課件模板
- 2024年廣西旅發(fā)置業(yè)集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 《無塵室基礎(chǔ)知識》課件
評論
0/150
提交評論