《統(tǒng)計學》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第1頁
《統(tǒng)計學》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第2頁
《統(tǒng)計學》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第3頁
《統(tǒng)計學》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第4頁
《統(tǒng)計學》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章

數(shù)據(jù)分布特征描述統(tǒng)計變量集中趨勢的測定統(tǒng)計變量離散程度的測定變量分布偏度與峰度的描述第一節(jié)

統(tǒng)計變量集中趨勢的測定測定集中趨勢的意義位置代表值數(shù)值平均數(shù)一、測定集中趨勢的意義測定集中趨勢的指標有:位置代表值和數(shù)值平均數(shù)。

位置代表值:在總體中將變量值按順序排列后得到的數(shù)列中某個特殊位置的值。常用的反應集中趨勢的位置代表值有眾數(shù)、中位數(shù)等。

數(shù)值平均數(shù)就是均值,它是對總體中的所有數(shù)據(jù)計算平均值,用以反映所有數(shù)據(jù)的一般水平。由于計算方法不同,數(shù)值平均數(shù)有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)和冪平均數(shù)。測定集中趨勢的作用1、反映總體各單位變量分布的集中趨勢和一般水平。

2、比較同類現(xiàn)象在不同單位的發(fā)展水平。3、比較同類現(xiàn)象在不同時期的發(fā)展變化趨勢或規(guī)律。

4、分析現(xiàn)象之間的依存關(guān)系。二、位置代表值(一)眾數(shù)(Mode)眾數(shù)是總體中出現(xiàn)次數(shù)最多的那個數(shù)據(jù)值,在頻數(shù)分布中,眾數(shù)指頻數(shù)或頻率最大的標志值用

表示。

(a)單眾數(shù)(b)雙眾數(shù)(c)五種無眾數(shù)的情形圖3-1眾數(shù)示意圖眾數(shù)的確定1.由品質(zhì)數(shù)列和單項式數(shù)量數(shù)列確定眾數(shù)2.由組距數(shù)量數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù),首先應當確定眾數(shù)組,然后通過比例插值法計算眾數(shù)。在等距分組條件下,眾數(shù)組就是次數(shù)最多的那一組;在不等距分組的條件下,眾數(shù)組則是頻數(shù)密度或頻率密度最高的那一組。

fMo

LMOMOUMOfMo-fMo+1fMo-fMo-1

3-2眾數(shù)與相鄰兩組的關(guān)系比例插值法圖示上限公式:

(3.1)下限公式:

(3.2)

MO代表眾數(shù);代表眾數(shù)組的下限;

代表眾數(shù)組的上限;

代表眾數(shù)組的次數(shù);

代表眾數(shù)組前一組的次數(shù);

代表眾數(shù)組后一組的次數(shù);

代表眾數(shù)組的組距。[例3-3]某地區(qū)農(nóng)民收入情況如表3-3,計算其人均純收入的眾數(shù)。表3-3農(nóng)民家庭年人均純收入情況表按年人均純收入分組(元)農(nóng)民家庭數(shù)(戶)1000~1200240120016001050160020002702000~22002102200~24001202400~260030合

計3000例3-3(續(xù))或(二)中位數(shù)(Median)

中位數(shù)和眾數(shù)一樣,也是一種位置代表值,但是,它不能用于定類數(shù)據(jù),只能在順序及以上的數(shù)據(jù)中使用,所以又稱為次序統(tǒng)計量,用Me表示。

中位數(shù)是將總體中的數(shù)據(jù)按順序排列后,處于數(shù)列中點位置上的那個數(shù)據(jù)值或變量值,或者說中位數(shù)是累計頻率數(shù)列中,累計頻率為0.50所對應的變量值。

1、由順序數(shù)據(jù)和未分組的數(shù)量數(shù)據(jù)確定中位數(shù)。順序數(shù)據(jù)中位數(shù)的位置:中位數(shù)位置=(3.3)未分組的數(shù)量數(shù)據(jù)中位數(shù)的位置:中位數(shù)位置=(3.4)

(3.5)

(3.6)[例3-4]某高校一次對食堂伙食滿意度的調(diào)查數(shù)據(jù)如表3-4所示。表3-4調(diào)查數(shù)據(jù)次數(shù)分布回答類別學生人數(shù)(人)累計學生數(shù)(向上累計)非常不滿意240240不滿意10801320一般9302250滿意4502700非常滿意3003000合計3000—中位數(shù)位置=3000/2=1500從累計學生數(shù)看,中位數(shù)在第三組,所以:Me=一般。[例3-5]有8名工人,每人日產(chǎn)零件數(shù)按從底到高的順序排列如下:17、19、20、22、23、23、24、25(件/人)。則

中位數(shù)為22.5件/人,這個數(shù)字反映了工人總體日產(chǎn)零件數(shù)的一般水平。

2、由單項式分組數(shù)量數(shù)據(jù)確定中位數(shù)單項式數(shù)量數(shù)據(jù)分組已經(jīng)將數(shù)據(jù)順序化,這時數(shù)據(jù)個數(shù)即總體單位數(shù)n=∑f,確定中位數(shù)位置的方法要通過累計次數(shù)計算。

3、由組距式分組的數(shù)量數(shù)據(jù)確定中位數(shù)

在假定中位數(shù)組內(nèi)的各數(shù)據(jù)均勻分布的前提下,利用下面的公式計算中位數(shù)的近似值:下限公式:(3.7)

上限公式:

(3.8)

表示中位數(shù);

表示中位數(shù)所在組的下限;

表示中位數(shù)所在組的上限;

表示向上累計至中位數(shù)所在組前一組的次數(shù);

表示向下累計至中位數(shù)所在組后一組的次數(shù);

表示中位數(shù)所在組的次數(shù);

表示中位數(shù)所在組的組距。[例3-7]根據(jù)表3-3數(shù)據(jù)計算農(nóng)民家庭年人均純收入中位數(shù)表3-6農(nóng)民家庭年人均純收入累計次數(shù)表按年人均純收入分

(元)農(nóng)民家庭數(shù)(戶)累計戶數(shù)(戶)(向上累計)累計戶數(shù)(戶)(向下累計)1000~120024024030001200~140048072027601400~16001050177022801600~1800600237012301800~200027026406302000~220021028503602200~240012029701502400~260030300030合

計3000——[例3-7]續(xù)計算表明,這3000戶農(nóng)民家庭年人均純收入的中位數(shù)是1548.57元,也就是說,人均純收入在1548.57元以上的農(nóng)民家庭有1500戶,在1547.57元以下的也有1500戶。(三)其它分位數(shù)

1.四分位數(shù)(Quartile)

(1)順序數(shù)據(jù)中四分位數(shù)位置的確定。

(i=1,2,3)

(3.9)式中,Qi是第i個四分位數(shù),n是數(shù)據(jù)個數(shù)即總體單位數(shù)。[例3-8]利用例3-4的數(shù)據(jù)確定四分位數(shù)。=不滿意

=一般

=滿意(2)未分組和單項式分組的數(shù)量數(shù)據(jù)中四分位數(shù)位置的確定:

(i=1,2,3)

(3.10)第一個四分位數(shù)的位置:

(3.11)第二個四分位數(shù)的位置:

(3.12)第三個四分位數(shù)的位置:

(3.13)(3)組距式分組數(shù)量數(shù)據(jù)中四分位數(shù)位置的確定

(3.14)式中,

表示第i個分位數(shù)所在組的下限;數(shù)據(jù)個數(shù),即整體單位數(shù);向上累計至第i個分位數(shù)所在組前一組的次數(shù);表示第i個分位數(shù)所在組的次數(shù);表示第i個分位數(shù)所在組的組距。2、百分位數(shù)(Percentile)百分位數(shù)是數(shù)據(jù)順序排列后,將數(shù)據(jù)100等分,位于i(i=1,2,…,99)個等分點位置的數(shù)據(jù)值。

對第i百分位數(shù),嚴格的定義如下:

第i百分位數(shù)是這樣一個值,它使得至少有i%的數(shù)據(jù)項小于或等于這個值,且至少有(100-i)%的數(shù)據(jù)項大于或等于這個值。三、數(shù)值平均數(shù)(一)算術(shù)平均數(shù)(均值)

ArithmeticMean(Mean)1.基本形式

(3.15)2.簡單算術(shù)平均數(shù)(simplearithmeticmean)簡單算術(shù)平均數(shù)主要用于未分組數(shù)據(jù),計算公式如下:

(3.16)式中:

代表算術(shù)平均數(shù)xi表各單位標志值n

代表總體單位數(shù)。3.加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)計算公式為:

(3.17)加權(quán)算術(shù)平均數(shù)主要用于數(shù)據(jù)已經(jīng)分組,并編制出次數(shù)分布的條件下。計算加權(quán)算術(shù)平均數(shù)需要注意的問題(1)加權(quán)算術(shù)平均數(shù)的大小受兩個因素的影響:一是變量值大?。欢歉鹘M次數(shù)占總次數(shù)比重即頻率的影響。(2)在分組數(shù)列的條件下,當各組標志值出現(xiàn)的次數(shù)或各組次數(shù)所占比重均相等時,權(quán)數(shù)就失去了權(quán)衡輕重的作用,這時用加權(quán)算術(shù)平均數(shù)計算的結(jié)果與用簡單算術(shù)平均數(shù)計算的結(jié)果相同,因此可以把簡單算術(shù)平均數(shù)理解為加權(quán)算術(shù)平均數(shù)當f1=f2=…=fn時的特例。(3)關(guān)于加權(quán)算術(shù)平均數(shù)的權(quán)數(shù)選擇原則:各組標志值×各組單位數(shù)=各組標志總量.4、是非標志的平均數(shù)通過給品質(zhì)數(shù)據(jù)賦值的方式,把品質(zhì)數(shù)據(jù)過渡為數(shù)量上的變異,然后計算平均數(shù)。

(3.18)p也稱為總體中具有某種屬性的單位成數(shù),所以成數(shù)是一種特殊的平均數(shù)——是非標志的平均數(shù)。5、算術(shù)平均數(shù)的數(shù)學性質(zhì)(1)算術(shù)平均數(shù)與標志值個數(shù)的乘積等于各標志值的總和。(2)各個標志值與算術(shù)平均數(shù)離差之和等于零。(3)各標志值與算術(shù)平均數(shù)離差的平方和為最小值。

(3.21)(二)調(diào)和平均數(shù)harmean(HarmonicMean)調(diào)和平均數(shù)是總體中各單位標志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又稱“倒數(shù)平均數(shù)”。1、簡單調(diào)和平均數(shù)(3.22)應用場合

各標志值對應的標志總量相等。2、加權(quán)調(diào)和平均數(shù)

計算公式:(3.23)式中,m表示各單位或各組的標志值對應的標志總量。當各標志值對應的標志總量不相等時,就要用加權(quán)調(diào)和平均數(shù)。[例3-17]某種蔬菜價格和成交量資料如表3-10,求該種蔬菜一天平均價格。表3-10蔬菜價格和成交量資料時間批發(fā)價(元)成交量(公斤)成交額(元)

早市午市晚市0.700.680.74400020003000280013602220

合計

—70006380分析:如果已知資料是批發(fā)價和成交量采用算術(shù)平均數(shù)方法:如果已知資料是批發(fā)價和成交額,則要采用調(diào)和平均數(shù)方法:(三)幾何平均數(shù)Geomean(GeomatricMean)幾何平均數(shù)也稱幾何均值或?qū)?shù)平均數(shù),是一種有特定作用的平均數(shù)。幾何平均數(shù)是N個變量值(比率)連乘積的N次方根,通常用于時間上有聯(lián)系或有先后順序關(guān)系的比率求平均,凡是度量值的連乘積等于總比率或總速度的現(xiàn)象都必須使用幾何平均法計算均值。

1、簡單幾何平均數(shù)

(3.24)式中:G表示幾何平均數(shù)xi表示各項標志值

簡單幾何平均數(shù)適用于計算未分組數(shù)列的平均比率或平均速度。[例3-18]某產(chǎn)品需經(jīng)四個工序的加工,已知第一工序加工合格率為97%,第二個工序加工合格率為95%,第三個工序加工合格率為96%,第四三個工序加工合格率為94%,求四個工序平均加工合格率。2、加權(quán)幾何平均數(shù)當計算幾何平均數(shù)的各個標志值的次數(shù)不相同時,應采用加權(quán)幾何平均數(shù)。加權(quán)幾何平均數(shù)是各標志值fi次方的連乘積的

次方根,計算公式為:(3.26)適合于反映特定現(xiàn)象的平均水平——現(xiàn)象的總標志值是各單位標志值的連乘積。但是,如果數(shù)列中有一個標志值等于0,或者數(shù)列中有一個標志值是負值,又要開偶次方根,就都無法計算幾何平均數(shù)。[例3-19]某2企業(yè)2000~2002年增加值發(fā)展速度如表3-11,試計算其2000~2002年增加值平均發(fā)展速度。表3-11環(huán)比發(fā)展速(%)時

期次數(shù)f1021990年~1993年31041993年~1998年5981998年~1999年11031999年~2001年2(四)冪平均數(shù)冪平均數(shù)是標志值K次方的平均數(shù)的K次方根。

(3.27)當k=1時,冪平均數(shù)

為算術(shù)平均數(shù)。當k=-1時,冪平均數(shù)

為調(diào)和平均數(shù)。當

時,

冪平均數(shù)趨于幾何平均數(shù)。注意:當K=0時,平均數(shù)

為不定式。因為算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)都是或近似冪平均數(shù)的k階數(shù)由1遞減為0又減為-1的特例,由此可知它們的一般數(shù)量關(guān)系為:

·調(diào)和平均數(shù)小于幾何平均數(shù)小于算術(shù)平均數(shù);

·當各變量相等

時,調(diào)和平均數(shù)等于幾何平均數(shù)等于算術(shù)平均數(shù)。(五)集中趨勢測定指標的關(guān)系

1.眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系Mo<Me<

Mo=Me=右偏(正偏)分布

對稱分布

左偏(負偏)分布圖3-3中位數(shù)、眾數(shù)和平均數(shù)的位置2、算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的關(guān)系

在相同的數(shù)據(jù)中,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)在數(shù)值是的關(guān)系如下:計算和應用集中趨勢測定指標應注意的問題1、集中趨勢的測定指標只能應用于同質(zhì)總體;2、用組平均數(shù)和分配數(shù)列補充說明總平均數(shù);3、集中趨勢指標與離散程度指標及具體分析相結(jié)合。第二節(jié)

統(tǒng)計變量離散程度的測定測定離散程度的意義極差、四分位差和平均差方差與標準差離散系數(shù)與異眾比率一、測定離散程度的意義1、反映現(xiàn)象總體中變量分布的離散程度。2、衡量均值的代表性。3、測定現(xiàn)象變動的均勻性或穩(wěn)定性程度。二、極差、四分位差和平均差1、極差(Range,R)又稱全距,離散程度的最簡單測度值,是最大和最小觀測值之間的距離。

(3.30)

式中:

Umax代表最高組的上限;

Lmin代表最低組的下限。

2、四分位差(QuartileDeviation)四分位差是在數(shù)列中剔除最大和最小各四分之一的數(shù)據(jù),是第一和第三個

四分位數(shù)之間的差,也稱為四分位點內(nèi)距。

四分位差計算公式為:(3.31)式中:

QD表示四分位差,

Q3、Q1分別為第三個、第一個四分位數(shù)。

3、平均差(MeanAbsoluteDeviation)平均差是分配數(shù)列中各單位標志值與其算術(shù)平均數(shù)之間離差絕對值的平均數(shù),一般用MD表示。(1)未分組數(shù)列:

(3.32)(2)分組數(shù)列:

(3.33)三、方差與標準差1、數(shù)量標志的方差與標準差未分組數(shù)列的計算公式:

(3.34)分組數(shù)列的計算公式:

(3.35)式中,

表示方差;

表示標準差。方差和標準差一般用于定序數(shù)據(jù)和定比數(shù)據(jù)。2、是非標志的方差和標準差用“1”表示“是”的變量值,用“0”表示“非”的變量值,則:

(3.37)(3.36)3、方差與標準差的數(shù)學性質(zhì)(1)變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方。即:

(3.38)(2)變量對算術(shù)平均數(shù)的方差小于對任意常數(shù)的方差。(3)n個同性質(zhì)獨立變量和的方差等于各個變量方差的和。(4)n個同性質(zhì)獨立變量平均數(shù)的方差等于各變量方差平均數(shù)的

。(5)變量線性變換的方差等于變量的方差乘以變量系數(shù)的平方。四、離散系數(shù)與異眾比率1.離散系數(shù)

(3.44)最常用的變異系數(shù)是標準差系數(shù):(3.43)

[例3-24]在例3-23中,假定生產(chǎn)條件相同,確定哪一品種具有較大穩(wěn)定性,宜于推廣?

計算結(jié)果說明,乙品種的平均畝產(chǎn)量高于甲品種,離散系數(shù)低于甲品種,所以乙品種較高產(chǎn)且具有較大的穩(wěn)定性,宜于推廣。2、異眾比率異眾比率又稱離異比率或變差比,是指非眾數(shù)的次數(shù)與全部變量值總次數(shù)的比率。計算公式為:

(3.4)

第三節(jié)

變量分布偏度與峰度的描述矩偏度峰度一、矩矩也稱為動差。它是總體中所有變量值與任意常數(shù)離差K次方的算術(shù)平均數(shù)。1、基本形式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論