統(tǒng)計(jì)分布特征的描述集中趨勢(shì)和離散趨勢(shì)課件_第1頁(yè)
統(tǒng)計(jì)分布特征的描述集中趨勢(shì)和離散趨勢(shì)課件_第2頁(yè)
統(tǒng)計(jì)分布特征的描述集中趨勢(shì)和離散趨勢(shì)課件_第3頁(yè)
統(tǒng)計(jì)分布特征的描述集中趨勢(shì)和離散趨勢(shì)課件_第4頁(yè)
統(tǒng)計(jì)分布特征的描述集中趨勢(shì)和離散趨勢(shì)課件_第5頁(yè)
已閱讀5頁(yè),還剩109頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 統(tǒng)計(jì)分布特征的描述:平均指標(biāo)和變異指標(biāo)安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院第五章 統(tǒng)計(jì)分布特征的描述第一節(jié) 集中趨勢(shì)的測(cè)度:平均指標(biāo)第二節(jié) 離散趨勢(shì)的測(cè)度:變異指標(biāo)第一節(jié) 集中趨勢(shì)的測(cè)定:平均指標(biāo)一、平均指標(biāo)的概念和作用 二、算術(shù)平均數(shù)三、調(diào)和平均數(shù)四、幾何平均數(shù)五、眾數(shù)六、中位數(shù)七、各種平均數(shù)之間的相互關(guān)系上一頁(yè)下一頁(yè)返回本章首頁(yè)一、平均指標(biāo)的概念和作用概念:平均指標(biāo)是指將同質(zhì)總體內(nèi)各單位的數(shù)量差異抽象化,反映總體一般水平或集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)所謂集中趨勢(shì),指一組數(shù)據(jù)向某一中心值靠攏的傾向,測(cè)度集中趨勢(shì),也就是尋找數(shù)據(jù)的一般水平的代表值或中心值。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)2、作用(1)使范圍不

2、同的總體具有可比性。(2)反映總體各單位的一般水平這一綜合特征,抽象掉了個(gè)體差異。(3) 反映總體分布的集中趨勢(shì)。 即如果以總體單位某一標(biāo)志的平均數(shù)為中心線,則總體各單位的標(biāo)志值主要分布于中心線及其上下附近,而遠(yuǎn)離中心線的標(biāo)志值較少。(三)平均指標(biāo)的種類 數(shù)值平均數(shù):根據(jù)統(tǒng)計(jì)數(shù)列中的各項(xiàng)數(shù)據(jù)計(jì)算出的平均數(shù)。主要有:算術(shù)平均數(shù)、 調(diào)和平均數(shù)、幾何平均數(shù)。位置平均數(shù):將各單位標(biāo)志值排序后,取得某一位置的標(biāo)志值作為反映一般水平的代表值。有:眾數(shù)、中位數(shù)。二、算術(shù)平均數(shù)(Arithmetic Mean)上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)基本公式例如:平均工資=企業(yè)工資總額/工人數(shù),平均成績(jī)=成績(jī)總分/學(xué)生人數(shù)注

3、意區(qū)分算術(shù)平均數(shù)和強(qiáng)度相對(duì)數(shù);算術(shù)平均數(shù)和強(qiáng)度相對(duì)指標(biāo)的區(qū)別:(1)含義和作用不同:強(qiáng)度相對(duì)指標(biāo)表明現(xiàn)象程度發(fā)展的強(qiáng)度、密度或普遍程度;而平均指標(biāo)則表明同類現(xiàn)象在一定時(shí)間、地點(diǎn)條件下所達(dá)到的一般水平。(2)計(jì)算方法不同。強(qiáng)度相對(duì)指標(biāo)的分子與分母分別來自不同的總體,一般沒有直接的依存關(guān)系,且有的強(qiáng)度相對(duì)指標(biāo)分子分母可以對(duì)換,即強(qiáng)度相對(duì)指標(biāo)可以計(jì)算正指標(biāo)或逆指標(biāo);而平均指標(biāo)的分子是總體總量指標(biāo),分母則是同一總體內(nèi)的總體單位總量,兩者具有密切的關(guān)系,且平均指標(biāo)的分子分母不能互換。(3)計(jì)量單位表示不同。強(qiáng)度相對(duì)指標(biāo)一般為復(fù)名數(shù),有時(shí)為無名數(shù);平均指標(biāo)則為單名數(shù)。(二)、算術(shù)平均數(shù)的計(jì)算1.簡(jiǎn)單算術(shù)平

4、均數(shù)計(jì)算公式:適用條件:未分組的原始資料例1: 某企業(yè)一生產(chǎn)班組共5人,他們?cè)?000年9月的月工資分別為1700元,1900元,1500元,1850元,2200元。則他們的月平均工資為: 例2:班級(jí)平均年齡:班級(jí)平均身高:加權(quán)算術(shù)平均數(shù)計(jì)算公式:式中: 為算術(shù)平均數(shù); 為第 組的次數(shù); 為組數(shù); 為第 組的標(biāo)志值或組中值。適用條件: 分組資料例1:?jiǎn)雾?xiàng)式數(shù)列 某班學(xué)生年齡情況表按年齡分組(歲)人數(shù)(人)比重()20212223552825251040合計(jì)20100分組頻數(shù)頻率求學(xué)生的平均年齡解:(1)絕對(duì)權(quán)數(shù)(2)相對(duì)權(quán)數(shù)例2:組距式數(shù)列(等距數(shù)列) 某班學(xué)生身高情況表按身高分組(米)組中值

5、人數(shù)(人)比重()1.41.51.51.61.61.71.71.81.81.91.451.551.651.751.85464422030202010合計(jì)20100分組頻數(shù)頻率組中值求學(xué)生的平均身高解:(1)絕對(duì)權(quán)數(shù)(2)相對(duì)權(quán)數(shù)例3:某班英語成績(jī)整理如下,求學(xué)生英語平均成績(jī).解(1)絕對(duì)權(quán)數(shù)(2)相對(duì)權(quán)數(shù)分析如下: (1)平均什么什么就是標(biāo)志值,標(biāo)志值出現(xiàn)的次數(shù)即為權(quán)數(shù) (2)影響算術(shù)平均數(shù)大小的因素有二:變量值x的大小。變量值越大平均數(shù)越大各組次數(shù)或頻率,又稱權(quán)數(shù)。權(quán)數(shù)越大的標(biāo)志值對(duì)平均數(shù)影響越大,實(shí)際上權(quán)數(shù)的大小反映了標(biāo)志值的重要性,因此權(quán)數(shù)也稱為權(quán)重系數(shù)。各組頻率也即相對(duì)權(quán)數(shù)更能體現(xiàn)權(quán)衡

6、輕重的本質(zhì)。加權(quán)算術(shù)平均數(shù)有兩種變形:當(dāng)權(quán)數(shù)用相對(duì)數(shù)時(shí) 當(dāng)f1=f2=f3=fn時(shí),權(quán)數(shù)的作用消失,加權(quán)平均數(shù) = 簡(jiǎn)單平均數(shù)(3)組距數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)時(shí),假定該組標(biāo)志值是完全均勻分布的,以各組的組中值為各組變量值,計(jì)算的平均數(shù)是近似值。(四).算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì):變量值與其算術(shù)平均數(shù)的離差之和衡等于零,即:變量值與其算術(shù)平均數(shù)的離差平方和為最小,即:算術(shù)平均數(shù)的缺點(diǎn):易受極端值的影響張莊有個(gè)張千萬,九個(gè)鄰居窮光蛋;平均起來算一算,個(gè)個(gè)都是張百萬。 去掉一個(gè)最高分去掉一個(gè)最低分三號(hào)選手最后得分. 三、調(diào)和平均數(shù)(Harmonic Mean)調(diào)和平均數(shù):是總體各單位標(biāo)志值倒數(shù)的算術(shù)平均數(shù)

7、的倒數(shù),又叫倒數(shù)平均數(shù). (二)簡(jiǎn)單調(diào)和平均數(shù)計(jì)算公式:式中: 為調(diào)和平均數(shù); 為變量值 的個(gè)數(shù); 為第 個(gè)變量值。適用條件:已知各組的代表變量值x和標(biāo)志總量xf,且各組的標(biāo)志總量恰好相等.計(jì)算舉例1:某種蔬菜價(jià)格早上為0.5元/斤、中午為0.4元/斤、晚上為0.25元/斤?,F(xiàn)早、中、晚各買1斤,求平均價(jià)格。例2:某種蔬菜價(jià)格早上為0.5元/斤、中午為0.4元/斤、晚上為0.25元/斤?,F(xiàn)早、中、晚各買1元,求平均價(jià)格。在例1中,用簡(jiǎn)單算術(shù)平均數(shù)在例2中,先求早、中、晚購(gòu)買的斤數(shù)。早 1/0.5=2(斤)中 1/0.4=2.5(斤)晚 1/0.25=4(斤) 實(shí)際上,例2是用下列公式計(jì)算:這就

8、是簡(jiǎn)單調(diào)和平均數(shù)的公式。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)(三)加權(quán)調(diào)和平均數(shù)計(jì)算公式:適用條件:分組資料,且已知各組的代表變量值(x)和標(biāo)志總量(xf).上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)式中: 為第 組的變量值; 為第 組的標(biāo)志總量。計(jì)算舉例:例3:某種蔬菜價(jià)格早上為0.5元/斤、中午為0.4元/斤、晚上為0.25元/斤?,F(xiàn)早、中、晚各買2元、3元、4元,求平均價(jià)格。說明(1)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中所應(yīng)用的調(diào)和平均數(shù)通常是加權(quán)算術(shù)平均數(shù)的變形,已知各組變量值 xi 和(xi fi)而缺乏 fi 時(shí),加權(quán)算術(shù)平均數(shù)通常可變形為調(diào)和平均數(shù)形式來計(jì)算。在已知每種價(jià)格x、銷售量f時(shí),求平均價(jià)格用加權(quán)算術(shù)平均數(shù)。在已知每種價(jià)格

9、x、銷售額m時(shí),求平均價(jià)格用加權(quán)調(diào)和平均數(shù)。(2)簡(jiǎn)單調(diào)和平均數(shù)實(shí)際上是加權(quán)調(diào)和平均數(shù)的一種特例,即各組標(biāo)志總量相等時(shí)出現(xiàn)階的一種特殊情況. 上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)(四)相對(duì)指標(biāo)的平均數(shù)算術(shù)平均數(shù)與調(diào)和平均數(shù)不僅可以用于計(jì)算嚴(yán)格意義上的靜態(tài)平均指標(biāo)(單位標(biāo)志平均數(shù)),而且??捎脕碛?jì)算其它相對(duì)指標(biāo)或時(shí)間數(shù)列的平均數(shù)。這時(shí)平均數(shù)僅僅是種計(jì)算形式,計(jì)算的結(jié)果并不要求它們符合平均指標(biāo)的基本規(guī)定(總體標(biāo)志總量/總體單位總量)。相對(duì)指標(biāo)平均數(shù)的計(jì)算形式應(yīng)該根據(jù)相對(duì)指標(biāo)的對(duì)比關(guān)系來確定。例1,設(shè)有某行業(yè)150個(gè)企業(yè)一季度的有關(guān)產(chǎn)值和利潤(rùn)資料如下表:求該行業(yè)平均產(chǎn)值利潤(rùn)率。某行業(yè)150個(gè)企業(yè)二季度的有關(guān)產(chǎn)值

10、和利潤(rùn)資料如下表:四、幾何平均數(shù)(Geometric Mean )幾何平均數(shù) n個(gè)變量值連乘積的n次方根。簡(jiǎn)單幾何平均數(shù)加權(quán)幾何平均數(shù)適用于計(jì)算現(xiàn)象的平均比率或平均速度。各個(gè)比率或速度的連乘積等于總比率或總速度;相乘的各個(gè)比率或速度不為零或負(fù)值。例1某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。本月該企業(yè)各加工工序的合格率分別為88、85、90、92、96,試求這五道工序的平均合格率。解:本例中各工序的合格率具有環(huán)比的性質(zhì),企業(yè)產(chǎn)品的總合格率等于各工序合格率之連乘積。所以,所求的平均合格率應(yīng)為: 例2:銀行對(duì)某筆投資的年利率按復(fù)利計(jì)算,25年利率如下,問該筆投資的25的平均年利率為多少?解:

11、=1.086結(jié)論:25年的平均利率為8.6%五、眾數(shù)(Mode)和中位數(shù)(Median)(一)眾數(shù) (Mode)1.概念: 眾數(shù)是總體中出現(xiàn)次數(shù)最多的標(biāo)志值(或?qū)傩员憩F(xiàn))。有關(guān)購(gòu)買軟飲料的頻數(shù)分布軟飲料購(gòu)買數(shù)量可口可樂百事可樂非常可樂雪碧鮮橙多娃哈哈19(最頻繁購(gòu)買的軟飲料)851373總計(jì)55眾數(shù)的不惟一性眾數(shù)無眾數(shù)眾數(shù) 1眾數(shù)22.眾數(shù)的特點(diǎn):是一種位置平均數(shù),不受極端值的影響.眾數(shù)具有不惟一性:它可能為一個(gè),也可能為多個(gè),也可能沒有眾數(shù).眾數(shù)可以用于各種計(jì)量尺度(定類、定序、定距和定比)的數(shù)據(jù)。3、眾數(shù)的確定(1)單項(xiàng)數(shù)列眾數(shù)的確定。在單項(xiàng)式數(shù)列中,確定眾數(shù)的方法比較簡(jiǎn)單,可以用觀察法直

12、接確定眾數(shù),即指出次數(shù)最多的標(biāo)志值即為眾數(shù)。例如,某企業(yè)工人日產(chǎn)量資料如下表:例1.已知某企業(yè)某日工人的日產(chǎn)量資料如下:日產(chǎn)量(件)工人人數(shù)(人)101112131470100380150100合計(jì)800計(jì)算該企業(yè)該日全部工人日產(chǎn)量的眾數(shù)。 先確定眾數(shù)組,然后推算出眾數(shù)的近似值。計(jì)算眾數(shù)的近似值主要有兩種方法。 當(dāng)組距式數(shù)列次數(shù)分布對(duì)稱時(shí),可以用眾數(shù)組的組中值作為眾數(shù)的近似值。 當(dāng)組距式數(shù)列次數(shù)分布不對(duì)稱時(shí),可以利用相應(yīng)的計(jì)算公式計(jì)算眾數(shù)的近似值。 (2)組距數(shù)列眾數(shù)的確定其近似公式推導(dǎo)下限公式: 上限公式: 例如,某企業(yè)職工月工資資料如下表: (二)中位數(shù)(Median)1.概念: 將總體各

13、單位按其標(biāo)志值大小排列,居于中間位置的那個(gè)標(biāo)志值就是中位數(shù)。2.作用:對(duì)對(duì)分布數(shù)列的總次數(shù)進(jìn)行二等分,標(biāo)志值小于中位數(shù)和大于中位數(shù)的次數(shù)各一半。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)(1)根據(jù)原始數(shù)據(jù)計(jì)算中位數(shù)先將數(shù)據(jù)排序(特別重要!)n為奇數(shù)時(shí)等于第(n+1)/2個(gè)數(shù)。n為偶數(shù)時(shí)等于第n/2和n/2+1個(gè)數(shù)的平均值1,2 ,5,9 ,11中位數(shù)=51,2 ,5 , 9,11,18中位數(shù)=(5+9)/2=7(2)單項(xiàng)式分組資料中位數(shù)的確定先計(jì)算向上累計(jì)次數(shù)(或向下累計(jì)次數(shù))當(dāng)f為奇數(shù)時(shí),中位數(shù)在第 項(xiàng),該項(xiàng)所對(duì)應(yīng)的標(biāo)志值即為中位數(shù)。當(dāng)f為偶數(shù)時(shí),中位數(shù)在第 項(xiàng),該項(xiàng)所對(duì)應(yīng)的標(biāo)志值即為中位數(shù)。假定某企業(yè)職工生

14、產(chǎn)一產(chǎn)品的日產(chǎn)量資料如下表: Me=163) 組距式分組資料確定中位數(shù)第一步:計(jì)算向上累計(jì)次數(shù)(或向下累計(jì)次數(shù))第二步:確定中位數(shù)所在組,第三步:計(jì)算中位數(shù)【例D】某車間50名工人月產(chǎn)量的資料如下:月產(chǎn)量(件)工人人數(shù)(人)向上累計(jì)次數(shù)(人)200以下200400400600600以上373283104250合計(jì)50計(jì)算該車間工人月產(chǎn)量的中位數(shù)?!纠鼶】某車間50名工人月產(chǎn)量的資料如下:月產(chǎn)量(件)工人人數(shù)(人)向下累計(jì)次數(shù)(人)200以下200400400600600以上373285047408合計(jì)50計(jì)算該車間工人月產(chǎn)量的中位數(shù)。中位數(shù)的特點(diǎn):是位置平均數(shù),可以避免數(shù)列中極端值的影響。具有

15、惟一性。中位數(shù)的適用場(chǎng)合:要求數(shù)據(jù)至少是定序數(shù)據(jù)。對(duì)于明顯呈偏態(tài)分布的變量數(shù)列,也適于用中位數(shù)代表其一般水平。小案例:揭秘工資被增長(zhǎng)原因:平均工資不能反映個(gè)體水平“其實(shí),平均工資只是宏觀經(jīng)濟(jì)發(fā)展的參考,并不能反映個(gè)體工資水平,這也是很多人感覺工資被增長(zhǎng)的原因”,昨日,在四川省統(tǒng)計(jì)局舉行的“中國(guó)統(tǒng)計(jì)開放日”上,省統(tǒng)計(jì)局相關(guān)負(fù)責(zé)人表示。解放軍信息工程大學(xué)魏振軍教授認(rèn)為,用“中位數(shù)”反映工資平均水平更為恰當(dāng)。省統(tǒng)計(jì)局相關(guān)負(fù)責(zé)人以“統(tǒng)計(jì)數(shù)據(jù)背后的故事”為題,闡述了統(tǒng)計(jì)數(shù)據(jù)產(chǎn)生的來源、流程以及容易被社會(huì)公眾誤解的地方,同時(shí)還對(duì)“被增長(zhǎng)”的平均工資專門做出解釋。社會(huì)平均工資統(tǒng)計(jì)的組成通常分為5大類:國(guó)有單

16、位職工工資、城鎮(zhèn)集體單位職工工資、三資企業(yè)職工工資、私營(yíng)單位員工工資和有雇傭關(guān)系的勞動(dòng)個(gè)體工資,平均工資的計(jì)算原理基本上是這5大類的工資總和除以總?cè)藬?shù)。省統(tǒng)計(jì)局相關(guān)負(fù)責(zé)人表示,如此一來,由于是相對(duì)的簡(jiǎn)單平均,導(dǎo)致了這個(gè)數(shù)據(jù)與很多人的真實(shí)收入有些差距。“以往公布的社會(huì)平均工資只有前3類,今年國(guó)家統(tǒng)計(jì)局將私營(yíng)單位員工工資計(jì)入其中?!庇捎诮y(tǒng)計(jì)口徑的改變,也導(dǎo)致了去年的全省社會(huì)平均工資比2008年社會(huì)平均工資有所降低。盡管如此,魏振軍認(rèn)為,采用平均值的方式反映工資收入水平仍不合理,“如一個(gè)單位有23個(gè)人工作,其中10個(gè)人每個(gè)月100元收入,5個(gè)人200元,6個(gè)人250元,1個(gè)人1000元,領(lǐng)導(dǎo)2400

17、元,平均值就是300元,但絕大部分人沒有達(dá)到平均水平”。她引入了另兩個(gè)概念眾數(shù)和中位數(shù)。眾數(shù)就是“出現(xiàn)最多的月收入,如例子中的100元”,而中位數(shù)就是處于中間水平的那個(gè)數(shù),“例子中的250元就是中位數(shù)”。她說,從中可以看出,眾數(shù)最能反映大多數(shù)工資水平,而中位數(shù)反映平均工資水平更為恰當(dāng),“因?yàn)楹芏嗳岁P(guān)心的是眾數(shù)或者中位數(shù),被扭曲的平均值工資則毫無價(jià)值”。小案例:香港工資統(tǒng)計(jì)公布根據(jù)政府統(tǒng)計(jì)處今日(三月十八日)公布的數(shù)字,二零零九年第二季本港的雇員人數(shù)(不包括留宿家庭傭工、政府雇員、雇主及自營(yíng)作業(yè)者)為2 776 600人,而這些雇員的每小時(shí)工資中位數(shù)為$58.5(港元)。在二零零九年第二季,本港

18、雇員每小時(shí)工資的第10個(gè)百分位數(shù)、第25個(gè)百分位數(shù)、第75個(gè)百分位數(shù)及第90個(gè)百分位數(shù)分別為$27.0、$38.9、$96.0及 $171.8。把所有雇員的每小時(shí)工資按數(shù)值從小至大排列,每小時(shí)工資中位數(shù)是指排列在中間位置的雇員的每小時(shí)工資。換言之,每小時(shí)工資中位數(shù)即是把所有雇員中每小時(shí)工資水平最低的50%劃分出來的每小時(shí)工資數(shù)值。每小時(shí)工資百分位數(shù)對(duì)描述雇員的每小時(shí)工資分布非常有用。每小時(shí)工資的第p個(gè)百分位數(shù)即指把所有雇員中每小時(shí)工資水平最低的p%劃分出來的每小時(shí)工資數(shù)值,而p可以是1至99之間任何一個(gè)整數(shù)值。舉例說,每小時(shí)工資的第10個(gè)百分位數(shù)就是把所有雇員中每小時(shí)工資水平最低的10%劃分出

19、來的每小時(shí)工資數(shù)值。每小時(shí)工資的第25個(gè)、50個(gè)及75個(gè)百分位數(shù),分別稱為每小時(shí)工資下四分位數(shù)、中位數(shù)及上四分位數(shù)。*知識(shí)拓展:分位數(shù)(Quantile)把順序排列的一組數(shù)據(jù)分割為若干相等部分的分割點(diǎn)的數(shù)值 。分位數(shù)可以反映數(shù)據(jù)分布的相對(duì)位置(而不單單是中心位置)。四分位數(shù):將按大小順序排列的觀測(cè)值劃分為4個(gè)等分,位于全部數(shù)據(jù)1/4、2/4和3/4位置上的3個(gè)數(shù)值就稱為四分位數(shù),分別以Q1,Q2,Q3代表第1個(gè),第2個(gè),第3個(gè)四分位數(shù) 。十分位數(shù):將按大小順序排列的觀測(cè)值劃分為10個(gè)等分,位于全部數(shù)據(jù)1/10、2/10 , 9/10位置上的9個(gè)數(shù)值就稱為十分位數(shù),分別以D1,D2,D9代表第1

20、個(gè),第2個(gè),第9個(gè)十分位數(shù) 。 。百分位數(shù):將按大小順序排列的觀測(cè)值劃分為100個(gè)等分,位于全部數(shù)據(jù)1/100、2/100 , 99/100位置上的99個(gè)數(shù)值就稱為十分位數(shù),就稱為百分位數(shù),分別以P1,P2,P99代表第1個(gè),第2個(gè),第99個(gè)百分位數(shù) 。幾個(gè)關(guān)系:Me=Q2=D5=P50。Q1=P25Q3=P75分位數(shù)與其它指標(biāo)結(jié)合,可以更詳細(xì)地反映數(shù)據(jù)的分布特征。四分位數(shù)(Quartile) 數(shù)據(jù)按大小順序排序后把分割成四等分的三個(gè)分割點(diǎn)上的數(shù)值 。在實(shí)際應(yīng)用中四分位數(shù)的計(jì)算方法并不統(tǒng)一(數(shù)據(jù)量大時(shí)這些方法差別不大)。對(duì)原始數(shù)據(jù):SPSS中四分位數(shù)的位置為(n+1)/4, 2(n+1)/4,

21、 3 (n+1)/4。Excel中四分位數(shù)的位置分別為(n+3)/4, 2(n+1)/4,(3 n+1)/4。如果四分位數(shù)的位置不是整數(shù),則四分位數(shù)等于前后兩個(gè)數(shù)的加權(quán)平均。四分位數(shù)計(jì)算(例子)排序后的數(shù)據(jù): 2,5,6,7,8,9, 10,12,15,16不能整除時(shí)需加權(quán)平均:位置 2 2.75 3 數(shù)值 5 60.75(6-5)=0.75拓展:五數(shù)概括法五數(shù)概括法即用下面的五個(gè)數(shù)來概括數(shù)據(jù) :最小值(minimum) 第1四分位數(shù)(Q1); 中位數(shù)(Q2); 第3四分位數(shù)(Q3); 最大值(maximum) 利用箱線圖可以觀察數(shù)據(jù)分布的范圍、中心位置和對(duì)稱性等特征,還可以進(jìn)行多組數(shù)據(jù)分布的

22、比較。xmin Q1 Me Q3 xmax例:某班學(xué)生成績(jī)盒式圖眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系對(duì)稱分布 均值= 中位數(shù)= 眾數(shù)分配為鐘形、輕微不對(duì)稱的經(jīng)驗(yàn)公式:左偏分布均值 中位數(shù) 眾數(shù)右偏分布眾數(shù) 中位數(shù)均值小結(jié):平均數(shù)、中位數(shù)、眾數(shù)的特點(diǎn)1.算術(shù)平均數(shù)綜合反映了全部數(shù)據(jù)的信息,眾數(shù)和中位數(shù)由數(shù)據(jù)分布的特定位置所確定。2.算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在而且具有惟一性,但計(jì)算和應(yīng)用眾數(shù)有兩個(gè)前提條件:(1)數(shù)據(jù)項(xiàng)數(shù)眾多;(2)數(shù)據(jù)具有明顯的集中趨勢(shì)。 3.算術(shù)平均數(shù)只能用于定量(定距和定比)數(shù)據(jù),中位數(shù)適用于定序數(shù)據(jù)和定量數(shù)據(jù),眾數(shù)適用于所有形式(類型、計(jì)量層次)的數(shù)據(jù)。4.算術(shù)平均

23、數(shù)要受數(shù)據(jù)中極端值的影響。而眾數(shù)和中位數(shù)都不受極端值的影響。為了排除極端值的干擾,可計(jì)算切尾均值,即去掉數(shù)據(jù)中最大和最小的若干項(xiàng)數(shù)值后計(jì)算的均值.切尾均值是將均值與中位數(shù)取長(zhǎng)補(bǔ)短的結(jié)果。5. 算術(shù)平均數(shù)可以推算總體的有關(guān)總量指標(biāo),而中位數(shù)和眾數(shù)則不宜用作此類推算。第四節(jié) 變異指標(biāo)一、變異指標(biāo)的概念和作用二、全距三、平均差四、標(biāo)準(zhǔn)差五、離散系數(shù)六、用EXCEL計(jì)算描述統(tǒng)計(jì)量 上一頁(yè)下一頁(yè)返回本章首頁(yè)一、變異指標(biāo)的概念和作用1.概念變異指標(biāo)又稱標(biāo)志變動(dòng)度,是度量總體各單位標(biāo)志值分散程度或離中趨勢(shì)的指標(biāo),是表明總體分布狀況的另一重要特征值。例某車間兩個(gè)生產(chǎn)小組各人日產(chǎn)量如下:甲組:20,40,60,

24、70,80,100,120乙組:67,68,69,70,71,72,73從下圖可以看出甲組離散程度大,乙組離散程度小。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)7070上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)2.變異指標(biāo)的作用(1)說明數(shù)據(jù)的分散程度,反映變量的穩(wěn)定性、均衡性。 數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。 (2)衡量平均數(shù)的代表性。離散程度越大,平均數(shù)的代表性就越小。(3) 統(tǒng)計(jì)推斷的重要依據(jù)判別統(tǒng)計(jì)推斷前提條件是否成立,衡量推斷效果好壞的重要尺度 上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)3.變異指標(biāo)的種類:常見的變異指標(biāo)有:全距(極差),四分位差、平均差,標(biāo)準(zhǔn)差,方差等,其中標(biāo)準(zhǔn)差是最為重要的變異指標(biāo)。二、全距(Range

25、 極差)1.全距的概念與計(jì)算全距是總體各單位標(biāo)志的最大值和最小值之差。 R=Xmax-Xmin若是組距式數(shù)列計(jì)算極差,這時(shí)可用最大組的上限和最小組的下限計(jì)算極差的近似值。即:RUmaxLmin優(yōu)缺點(diǎn):計(jì)算簡(jiǎn)便、含義直觀、容易理解。它未考慮數(shù)據(jù)的中間分布情況,不能充分說明全部數(shù)據(jù)的差異程度。上一頁(yè)下一頁(yè)返回本節(jié)首頁(yè)三、四分位差第3四分位數(shù)(Q3)與第1四分位數(shù)(Q1)之差,常用Qd表示。計(jì)算公式為:實(shí)質(zhì)上是兩端各去掉四分之一的數(shù)據(jù)以后的極差,表示占全部數(shù)據(jù)一半的中間數(shù)據(jù)的離散程度。四分位差越大,表示數(shù)據(jù)離散程度越大。優(yōu)缺點(diǎn):是在一定程度上對(duì)極差的一種改進(jìn),避免了極端值的干擾。但它去頭棄尾,丟失大

26、量的原始數(shù)據(jù),對(duì)數(shù)據(jù)差異的反映仍然是不充分的。四分位差是一種順序統(tǒng)計(jì)量,適用于定序數(shù)據(jù)和定量數(shù)據(jù)。尤其是當(dāng)用中位數(shù)來測(cè)度數(shù)據(jù)集中趨勢(shì)時(shí).四、平均差(Average Deviation)平均差各個(gè)數(shù)據(jù)與其均值的離差絕對(duì)值的算術(shù)平均數(shù),反映各個(gè)數(shù)據(jù)與其均值的平均差距,通常以A.D表示。計(jì)算公式為:未分組數(shù)據(jù):平均差含義清晰,能全面地反映數(shù)據(jù)的離散程度。但取離差絕對(duì)值進(jìn)行平均,數(shù)學(xué)處理上不夠方便,在數(shù)學(xué)性質(zhì)上也不是最優(yōu)的。已分組數(shù)據(jù):計(jì)算舉例:例1.未分組資料:某宿舍6名同學(xué)統(tǒng)計(jì)成績(jī)分別為:73,75,80,86,88,84,則例2.已知分組資料,求成績(jī)的平均差成績(jī)組中值x人數(shù)fxf90100955

27、19.698809085139.6124.8708075160.46.46070651110.4114.460以下55520.4102合計(jì)50445.6475110512007152753770五、方差和標(biāo)準(zhǔn)差1. 方差(Variance)的概念和計(jì)算方差是各個(gè)數(shù)據(jù)與其均值的離差平方的算術(shù)平均數(shù).總體方差(2)的計(jì)算公式為:未分組數(shù)據(jù):分組數(shù)據(jù):樣本方差(通常用 S2 表示)分母應(yīng)為(n -1)。標(biāo)準(zhǔn)差(standard Deviation)標(biāo)準(zhǔn)差方差的算術(shù)平方根。總體標(biāo)準(zhǔn)差一般用表示。其計(jì)算公式為:未分組數(shù)據(jù):分組數(shù)據(jù):標(biāo)準(zhǔn)差比方差更容易理解。在社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)分析中,標(biāo)準(zhǔn)差比方差的應(yīng)用更

28、為普遍,經(jīng)常被用作測(cè)度數(shù)據(jù)與均值差距的標(biāo)準(zhǔn)尺度。樣本標(biāo)準(zhǔn)差(S)分母應(yīng)為(n-1)。2.標(biāo)準(zhǔn)差的特點(diǎn):標(biāo)準(zhǔn)差和方差的計(jì)算過程比平均差簡(jiǎn)便,數(shù)學(xué)性質(zhì)也較為理想,是統(tǒng)計(jì)分析中最常用的變異指標(biāo)。3.計(jì)算舉例: (注:使用計(jì)算器計(jì)算)a.未分組資料例:未分組資料:某宿舍6名同學(xué)統(tǒng)計(jì)成績(jī)分別為:73,75,80,86,88,84,則統(tǒng)計(jì)成績(jī)的標(biāo)準(zhǔn)差為:b.分組資料例:成績(jī)組中值x人數(shù)fxf90100955475384.16 1920.80 80908513110592.16 1198.08 7080751612000.16 2.56 60706511715108.16 1189.76 60以下55527

29、5416.16 2080.80 合計(jì)5037706392【例】計(jì)算平均差和方差、標(biāo)準(zhǔn)差使用壽命(小時(shí)) 組中值 (x)試驗(yàn)數(shù)量(只)f 頻率 (f/f)(x1542)|x1542|f(X1542)2*f1000以下90020.020 -64212848243281000-1200110080.080 -442353615629121200160 -24238729370241400-16001500350.350 -421470617401600230 15836345741721800-20001900120.120 35842961537

30、9682000以上210040.040 55822321245456合計(jì)1001.000 2032467436002.方差的主要數(shù)學(xué)性質(zhì)(3)分組條件下,總體的方差等于組間方差與各組方差平均數(shù)之和。(1)常數(shù)的方差等于零。a為常數(shù),則 (2)變量的線性函數(shù)的方差等于變量系數(shù)的平方乘以變量的方差。設(shè)a,b為常數(shù),y=a+bx,則有:組間方差各組方差平均數(shù)標(biāo)準(zhǔn)差和方差的簡(jiǎn)易計(jì)算標(biāo)準(zhǔn)差的一個(gè)應(yīng)用:標(biāo)準(zhǔn)化值(Z-score)標(biāo)準(zhǔn)化值或標(biāo)準(zhǔn)得分也稱為Z值。對(duì)于來自不同均值和標(biāo)準(zhǔn)差的個(gè)體的數(shù)據(jù),往往不能直接對(duì)比。這就需要將它們轉(zhuǎn)化為同一規(guī)格、尺度的數(shù)據(jù)后再比較。標(biāo)準(zhǔn)化值實(shí)際上是將不同均值和標(biāo)準(zhǔn)差的總體都轉(zhuǎn)

31、換為均值為0、標(biāo)準(zhǔn)差為1的總體,將各個(gè)體的數(shù)據(jù)轉(zhuǎn)換為它在其總體中的相對(duì)位置?!纠拷猓河捎趦纱慰荚嚦煽?jī)的均值和標(biāo)準(zhǔn)差不同,每個(gè)學(xué)生兩次考試的成績(jī)不宜直接比較。利用標(biāo)準(zhǔn)化值進(jìn)行對(duì)比,表明第二次考試的成績(jī)更好一些。 假定某班學(xué)生先后兩個(gè)兩次進(jìn)行了難度不同的綜合考試,第一次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為80分和10分,而第二次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為70分和7分。張三第一、二次考試的成績(jī)分別為92分和80分,那么全班相比較而言,他哪一次考試的成績(jī)更好呢?對(duì)稱鐘形分布中的3法則3 法則關(guān)于鐘形分布的一個(gè)近似的或經(jīng)驗(yàn)的法則:變量值落在 -3,+3范圍以外的情況極為少見。因此通常將落在區(qū)間-3,+3之外

32、的數(shù)據(jù)稱為異常數(shù)據(jù)或稱為離群點(diǎn)。x99.73%68.27%95.45%六、離散系數(shù)(或變異系數(shù),Coefficient of Variation) 前面的各變異指標(biāo)都是有計(jì)量單位的,它們的數(shù)值大小不僅取決于數(shù)據(jù)的離散程度,還要受數(shù)據(jù)本身水平高低和計(jì)量單位的影響。對(duì)不同變量(或不同數(shù)據(jù)組)的離散程度進(jìn)行比較時(shí),只有當(dāng)它們的平均水平和計(jì)量單位都相同時(shí),才能利用上述變異指標(biāo)來分析;否則,須利用離散系數(shù)來比較它們的離散程度。例如,哪個(gè)變量的差異較大:體重,還是身高?例如,體重的差異哪個(gè)較大:父親,還是嬰兒? 父親:平均體重=70 kg,標(biāo)準(zhǔn)差=5 kg 嬰兒: 5 kg, 1 kg變異系數(shù)是一類相對(duì)數(shù)

33、形式的變異指標(biāo),排除了平均水平和計(jì)量單位對(duì)計(jì)算結(jié)果的影響,便于不同計(jì)量單位或不同平均水平的總體間離散程度的對(duì)比。離散系數(shù)是極差、平均差或標(biāo)準(zhǔn)差等變異指標(biāo)與算術(shù)平均數(shù)的比率,以相對(duì)數(shù)的形式表示變異程度。將極差與算術(shù)平均數(shù)對(duì)比得到極差系數(shù),將平均差與算術(shù)平均數(shù)對(duì)比得到平均差系數(shù)。最常用的離散系數(shù)是就標(biāo)準(zhǔn)差來計(jì)算的,稱之為標(biāo)準(zhǔn)差系數(shù):離散系數(shù)大,說明數(shù)據(jù)的離散程度大,其平均數(shù)的代表性就差;反之亦然.計(jì)算公式:4.舉例:例1.現(xiàn)有內(nèi)地和沿海兩個(gè)城市的居民人均收資料如下表,比較兩地的收入差距:人均年收入(元)收入標(biāo)準(zhǔn)差(元)標(biāo)準(zhǔn)差系數(shù) (%)甲市60001502.5乙市120001801.5從標(biāo)準(zhǔn)差系數(shù)

34、來看,乙地收入差距要小于甲地。例2,有甲乙兩個(gè)學(xué)習(xí)小組,其成績(jī)?nèi)缦卤硭?,比較哪個(gè)小組平均成績(jī)的代表性大。甲組的平均成績(jī)?yōu)椋杭捉M成績(jī)的標(biāo)準(zhǔn)差為:甲組成績(jī)的標(biāo)準(zhǔn)差系數(shù)為:乙組成績(jī)的標(biāo)準(zhǔn)差為:乙組的平均成績(jī)?yōu)椋阂医M成績(jī)的標(biāo)準(zhǔn)系數(shù)為:五、異眾比率 異眾比率是指非眾數(shù)值的次數(shù)之和在總次數(shù)中所占比重,其公式為:主要用于衡量一組數(shù)據(jù)以眾數(shù)為分布中心的集中程度,即衡量眾數(shù)代表一組數(shù)據(jù)一般水平的代表性。其值越小,數(shù)據(jù)集中程度越高,眾數(shù)代表性越大.第五節(jié) 變量分布的偏度與峰度一、矩(動(dòng)差 )二、偏度(Skewness) 三、峰度(Kurtosis)一、矩(動(dòng)差 )矩(動(dòng)差 ) 一系列刻畫數(shù)據(jù)分布特征的指標(biāo)的統(tǒng)稱。變量值與數(shù)值 a 之離差的 K 次方的平均數(shù)稱為變量 x 關(guān)于 a 的K 階矩,即: K 階原點(diǎn)矩(當(dāng)a = 0 時(shí))是數(shù)據(jù)的K次方的平均數(shù).一階原點(diǎn)矩即算術(shù)平均數(shù);二階原點(diǎn)矩即平方平均數(shù)。 K 階中心矩矩(當(dāng)a =均值 時(shí))是以均值為中心計(jì)算的離差 K 次方的平均數(shù)k=1時(shí),稱為一階中心矩,它恒等于0,即 m1=0;k=2時(shí),稱為二階中心矩,也就是方差,即m2=2。 二、偏度(Skewness)偏度指數(shù)據(jù)分布的不對(duì)稱程度或偏斜程度。以 對(duì)稱分布 為標(biāo)準(zhǔn)來區(qū)分偏態(tài)分布又分左偏(負(fù)偏)和右偏(正偏).左偏分布(負(fù)偏)右偏分布(正偏)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論