統(tǒng)計學第四章 數(shù)據(jù)分布的特征和度量_第1頁
統(tǒng)計學第四章 數(shù)據(jù)分布的特征和度量_第2頁
統(tǒng)計學第四章 數(shù)據(jù)分布的特征和度量_第3頁
統(tǒng)計學第四章 數(shù)據(jù)分布的特征和度量_第4頁
統(tǒng)計學第四章 數(shù)據(jù)分布的特征和度量_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第四章數(shù)據(jù)分布的特征和度量第一節(jié)分布的集中趨勢——數(shù)值平均數(shù)主要內(nèi)容算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)和調(diào)和平均數(shù)下面是一個小故事:一個人到某公司求職,經(jīng)過調(diào)查,得出關(guān)于該公司工資的一些數(shù)據(jù),如果是你,應該如何選擇?撓頭的數(shù)值公司員工的月薪如下:我們有三種方法選擇集中趨勢:(1)根據(jù)頻數(shù):哪個變量值出現(xiàn)次數(shù)越多,就選擇哪個變量值,比如民主決策的表決機制。(2)根據(jù)居中:比如一個城鎮(zhèn)居民的生活水平,居中的是小康家庭,那么就用小康家庭來代表該城鎮(zhèn)的生活水平。(3)根據(jù)平均:用平均數(shù)來代表變量的平均水平。關(guān)于集中趨勢的一個故事吉斯莫先生有一個小工廠,生產(chǎn)超級小玩意兒。管理人員由吉斯莫先生、他的弟弟、六個親戚組成。工作人員由5個領工和10個工人組成。工廠經(jīng)營得很順利,現(xiàn)在需要一個新工人?,F(xiàn)在吉斯莫先生正在接見薩姆,談工作問題。吉斯莫:我們這里報酬不錯。平均薪金是每周300美元。你在學徒期間每周得75美元,不過很快就可以加工資。薩姆工作了幾天之后,要求見廠長。薩姆;你欺騙我!我已經(jīng)找其他工人核對過了,沒有一個人的工資超過每周100元。平均工資怎么可能是一周300元呢?吉斯莫:啊,薩姆,不要激動。平均工資是300元。我要向你證明這一點。吉斯莫:這是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六個親戚每人得250元,五個領工每人得200元,10個工人每人100元。總共是每周6900元,付給23個人,對吧?薩姆:對,對,對!你是對的,平均工資是每周300元??赡氵€是蒙騙了我。吉斯莫;我不同意!你實在是不明白。我已經(jīng)把工資列了個表,并告訴了你,工資的中位數(shù)是200元,可這不是平均工資,而是中等工資。薩姆:每周100元又是怎么回事呢?吉斯莫:那稱為眾數(shù),是大多數(shù)人掙的工資。吉斯莫:老弟,你的問題是出在你不懂平均數(shù)、中位數(shù)和眾數(shù)之間的區(qū)別。薩姆:好,現(xiàn)在我可懂了。我……我辭職!一、統(tǒng)計平均數(shù)的含義與作用

(一)、統(tǒng)計平均數(shù)的含義表示社會經(jīng)濟現(xiàn)象總體各單位某一標志在一定時間、地點條件下所達到的一般水平,亦即總體各單位標志值的差異抽象化,反映在具體條件下各單位標志值達到的一般水平。(二)、統(tǒng)計平均數(shù)的特點將數(shù)量差異抽象化只能用于同類現(xiàn)象的計算能反映總體變量的集中趨勢集中趨勢:總體各單位的次數(shù)分布從兩邊向中間集中的趨勢,也叫趨中性。(三)、平均指標的作用反映總體各單位變量分布的集中趨勢和一般水平比較同類現(xiàn)象在不同單位的發(fā)展水平比較同類現(xiàn)象在不同時期的發(fā)展變化趨勢和規(guī)律可用于分析現(xiàn)象之間的依存關(guān)系和進行數(shù)量的估算(四)、平均指標的兩大類別數(shù)值平均數(shù)(常用的有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)和冪平均數(shù))位置平均數(shù)(常用的有中位數(shù)和眾數(shù))二、算數(shù)平均數(shù)算術(shù)平均數(shù)的統(tǒng)計定義公式計算平均數(shù)的要求:總體標志總量必須是總體各單位標志值的總和,標志值和單位之間一一對應。實際上由于所掌握的統(tǒng)計資料不同,計算平均數(shù)有簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)兩種。(一).簡單算術(shù)平均數(shù)(用于未分組資料或變量分配數(shù)列中,各組次數(shù)都相等的情況)

注意:對求和符號,此時流動腳標的變動范圍是1,2,3,…,N,如果為未分組資料,N為總體單位總數(shù),如為次數(shù)相等的分組數(shù)列,N為組數(shù)。

[例]求74、85、69、9l、87、74、69這些數(shù)字的算術(shù)平均數(shù)。[解]

(二).加權(quán)算術(shù)平均數(shù)(用于分組資料中,各分組次數(shù)不同的情況)

注意:對求和符號,此時流動腳標的變動范圍是1,2,3…,n,n是組數(shù),而不是總體單位數(shù)。很顯然,算術(shù)平均數(shù)不僅受各變量值(X)大小的影響,而且受各組單位數(shù)(頻數(shù))的影響。由于對于總體的影響要由頻數(shù)(f)大小所決定,所以f也被稱為權(quán)數(shù)。值得注意的是,在統(tǒng)計計算中,權(quán)數(shù)不僅用來衡量總體中各標志值在總體中作用,同時反映了指標的結(jié)構(gòu),所以它有兩種表現(xiàn)形式:絕對數(shù)(頻數(shù))和相對數(shù)(頻率)。這樣一來,在統(tǒng)計學中,凡對應于分組資料的計算式,都被稱為加權(quán)式。(1)、權(quán)數(shù)的意義和作用權(quán)數(shù):各組次數(shù)(頻數(shù))的大小所對應的標志值對平均數(shù)的影響具有權(quán)衡輕重的作用。當各組的次數(shù)都相同時,即當f1=f2=f3=…=fn時:加權(quán)算術(shù)平均數(shù)就等于簡單算術(shù)平均數(shù)。

(2)、權(quán)數(shù)的選擇一般來說,次數(shù)就是權(quán)數(shù),但也有不合適的情況對于組距數(shù)列,要用每一組的組中值權(quán)充該組統(tǒng)一的變量值。[例]求下表所示數(shù)據(jù)的的算術(shù)平均數(shù)(三)、是非標志的平均數(shù)

(成數(shù))在總體中,具有某種性質(zhì)的單位占總體的比率為p,P也稱為總體中具有某種屬性的單位成數(shù),是是非標志的平均數(shù)。不具有該種性質(zhì)的單位占總體的比率為q。在總體中,將總體分為兩大類,一類為具有某種性質(zhì)的單位,它的單位數(shù)用表示,另一類為不具有某種性質(zhì)的單位,它的單位數(shù)用表示,他們的和為總體單位總數(shù)N,即,那么P的計算公式如下:是非標志的平均數(shù)主要是針對于品質(zhì)數(shù)據(jù)而言,把品質(zhì)標志性質(zhì)上的差異過度到數(shù)量上的變異。(四)、算術(shù)平均數(shù)的數(shù)學性質(zhì)(1)算術(shù)平均數(shù)與標志值個數(shù)的乘積等于各標志值的總和。簡單算術(shù)平均數(shù):加權(quán)算術(shù)平均數(shù):(2)各個標志值與其算術(shù)平均數(shù)的離差之和等于零。簡單算術(shù)平均數(shù):加權(quán)算術(shù)平均數(shù):(3)各標志值與算術(shù)平均數(shù)離差的平方和為最小值。三、調(diào)和平均數(shù)(不能有標志值為0)1.簡單調(diào)和平均數(shù):標志值的倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。

適用場合:各標志值對應的標志總量為一個單位或是相等的情況。n指標志值的項數(shù)2.加權(quán)調(diào)和平均數(shù)計算公式:在權(quán)數(shù)選擇合適時,加權(quán)調(diào)和平均數(shù)實際上是加權(quán)算術(shù)平均數(shù)的變形:當各組標志總量相等,m1=m2=…=mn時,加權(quán)調(diào)和平均數(shù)可化簡成為簡單調(diào)和平均數(shù)形式。3.平均數(shù)計算方法的選擇設:則:例:某商品在三個市場上的銷售情況四、幾何平均數(shù)G

(geometricmean)N個變量值連乘積的N次方根。(不能有變量值為0)。適用于:(1)計算某種比率的平均數(shù);(2)計算大致具有幾何級數(shù)關(guān)系的一組數(shù)字的平均數(shù),如經(jīng)濟指標的平均發(fā)展速度。1、簡單幾何平均數(shù)(適用于為分組資料)對數(shù)式:(2)加權(quán)幾何平均數(shù)(適用于分組資料)

對數(shù)式:

應該指出,用以計算幾何平均數(shù)的各項數(shù)值必須大于0,否則就不能計算幾何平均數(shù)或計算結(jié)果無實際意義。

例一:某水泥生產(chǎn)企業(yè)1995的水泥為100萬噸,1996年與1995年相比增長9%,1997年比1996年增長16%、1998年比1997增長20%,求各年的平均增長率。

例二:某投資銀行某筆投資的年利率按復利計算,25年的年利率如下:

年利率發(fā)展速度年數(shù)

103%1

105%4

108%8

110%10

115%2五、冪平均數(shù)設有一組變量求各變量k次方的和:根據(jù)算術(shù)平均數(shù)的數(shù)學性質(zhì)1,以冪平均代替各具體變量xi,其數(shù)值總和不變,則稱為k階冪平均數(shù),當k取不同的整數(shù)值時,冪平均數(shù)就給出不同的數(shù)值平均數(shù)計算公式。

當k=1時,冪平均數(shù),為算術(shù)平均數(shù)計算公式。當k=-1時,冪平均數(shù),為調(diào)和平均數(shù)計算公式。當K趨近于0時,為幾何平均數(shù)計算公式。冪平均數(shù)的是關(guān)于k階的遞增函數(shù),即冪平均數(shù)是隨著k的增大而增大,隨著k的減少而減少,當k1<k2時,就有:

因為算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)都是冪平均數(shù)的k階數(shù)由1遞減為0又減為-1的特例,三者之間的一般數(shù)量關(guān)系為:調(diào)和平均數(shù)小于幾何平均數(shù)小于算術(shù)平均數(shù);當各變量相等時,調(diào)和平均數(shù)等于幾何平均數(shù)等于算術(shù)平均數(shù)。第二節(jié)分布的集中趨勢—位置平均數(shù)一、眾數(shù)(Mode

)1.定義:眾數(shù)是指社會現(xiàn)象總體中最普遍出現(xiàn)的標志值。用Mo表示。

眾數(shù)只與次數(shù)有關(guān),可以用于定類、定序、定距、定比資料。2.眾數(shù)的確定

1).對于未分組資料(直接觀察)首先,將所有數(shù)據(jù)順序排列;然后,只要觀察到某些變量值(與相鄰變量值相比較)出現(xiàn)的次數(shù)(或頻數(shù))呈現(xiàn)“峰”值,這些變量值就是眾數(shù)。

2).對于分組資料單項式分配數(shù)列確定眾數(shù):出現(xiàn)次數(shù)最多的標志值就是眾數(shù)。組距式分配數(shù)列確定眾數(shù):由組距數(shù)列確定眾數(shù),先確定眾數(shù)組,再通過一定的公式計算眾數(shù)的近似值。組距式數(shù)列確定眾數(shù)的公式下限公式:

上限公式:

求下表中的眾數(shù)眾數(shù)求下表中的眾數(shù)(1)眾數(shù)僅受上下相鄰兩組頻數(shù)大小的影響,不受極端值影響,對開口組仍可計算眾數(shù);增強了變量數(shù)列的一般水平代表性。(2)受抽樣變動影響大;(3)眾數(shù)不唯一確定。(4)眾數(shù)標示為其峰值所對應的變量值,能很容易區(qū)分出單峰、多峰。因而具有明顯偏態(tài)集中趨勢、且總體單位較多的頻數(shù)分布,用眾數(shù)最合適。3.眾數(shù)的性質(zhì)二、中位數(shù)1.定義:中位數(shù)是將總體各個單位按其標志值的大小順序排列,處于數(shù)列中點的那個單位的標志值,在總體中,標志值小于中位數(shù)的單位占一半;標志值大于中位數(shù)的單位也占一半。2.中位數(shù)的確定1)未分組資料確定中位數(shù)。將總體各單位的標志值按照大小順序排列,當總體單位數(shù)n為奇數(shù)時:當總體單位數(shù)n為偶數(shù)時,:例求54,65,78,66,43這些數(shù)字的中位數(shù)。例、求54,65,78,66,43,38這些數(shù)字的中位數(shù)。你會嗎?2)單項式分組資料確定中位數(shù)當為奇數(shù)時:,

當為偶數(shù)時,3)組距式分組資料確定中位數(shù)

當根據(jù)組距數(shù)列求中位數(shù)時,要采用所謂的比例值法:先根據(jù)N/2在累計頻數(shù)分布中找到中位數(shù)所在組,然后假定該組中各變量值是均勻分布的,再用以下任何一種方法求出中位數(shù)。下限公式:向上累計

上限公式:向下累計[例]某年級學生身高如下,求中位數(shù)3.中位數(shù)的性質(zhì)(1)各變量值對中位數(shù)之差的絕對值總和,小于它們對任何其他數(shù)的絕對值總和。

(2)中位數(shù)不受極端值的影響。對某些不具有數(shù)學特點或不能用數(shù)字測定時可用中位數(shù)。

(3)分組資料有不確定組距時,仍可求得中位數(shù)。

(4)中位數(shù)受抽樣變動的影響較算術(shù)平均數(shù)略大。三.其他分位數(shù)

(一)四分位數(shù)

中位數(shù)所有單位被等分為兩部分,因而被稱為二分位數(shù)。類似于求中位數(shù),我們還可求出四分位數(shù)、十分位數(shù)、百分位數(shù)。將總體中的各單位分割成相等的四部分,則這三個分割的變量值就是四分位數(shù)。若以Q1、Q2、Q3分別代表第一、第二、第三四分位數(shù)。Q2

即中位數(shù),對于未分組數(shù)據(jù),Q1、Q3即為1/4和3/4所對應的標志值;對于單項式分組,求累計頻數(shù),找1/4和3/4位置所對應的Q1、Q3值;對于組距式分組,Q1、Q3的計算方法分別分別是:四、各種平均數(shù)的比較(一)數(shù)值平均數(shù)與位置平均數(shù)的比較

首先,數(shù)值平均數(shù)和位置平均數(shù)都是表明總體數(shù)據(jù)的集中趨勢和一般特征,都是屬于抽象化的代表值,但它們的代表性意義有所不同。數(shù)值平均數(shù)由總體中全部變量值參與計算,反映了所有數(shù)值的代表性水平,但它易受極端數(shù)值的影響,如果其中有若干極大或極小數(shù)值,就把它的平均數(shù)拉高或拉低了,與一般的趨勢產(chǎn)生了若干背離。而位置平均數(shù)是由數(shù)據(jù)在數(shù)列中的位置來決定的,極端數(shù)值的出現(xiàn)并不影響位置平均數(shù)總體的代表性,可能更能夠說明該數(shù)列的一般水平和趨勢。對兩類平均數(shù)的應用,應該根據(jù)統(tǒng)計研究目的和數(shù)據(jù)的特征,分別采用適合的方法加以分析。 其次,兩者所依據(jù)的統(tǒng)計資料屬性不同,各種數(shù)值平均數(shù)對數(shù)據(jù)的量化尺度要求只能應用定距數(shù)據(jù)和定比數(shù)據(jù),而位置平均數(shù)則不同,它們還適用于各種定序尺度的數(shù)據(jù),眾數(shù)甚至還適用于各種定類數(shù)據(jù)。(二).眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系區(qū)別:1)

三者的含義不相同;2)

三者的計算(確定)方法不同;3)

對資料的要求不同,4)對數(shù)據(jù)的“靈敏度”、“抗耐性”和“概括能力”不同。聯(lián)系:(1)

三者都是作為反映總體一般水平(或集中趨勢)的平均指標:(2)

三者之間存在著一定的數(shù)量關(guān)系,A.在對稱的正態(tài)分布條件下:算術(shù)平均數(shù)等于眾數(shù)等于中位數(shù):B.在非對稱正態(tài)分布的情況下,眾數(shù)、中位數(shù)和平均數(shù)三者的差別取決于偏斜的程度,偏斜的程度越大,它們之間的差別越大。(3)、皮爾生經(jīng)驗法則分布在輕微偏斜的情況下,眾數(shù)、中位數(shù)和算術(shù)平均數(shù)數(shù)量關(guān)系的經(jīng)驗公式為:(三)算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的關(guān)系假設有數(shù)據(jù)、,(),對這三者關(guān)系證明如下:令:

則:,即又則:,即由上可得,算術(shù)平均數(shù)≥幾何平均數(shù)≥調(diào)和平均數(shù)。第三節(jié)分布的離散趨勢一、變異指標的含義與作用1.定義:變異指標反映總體內(nèi)部的離中趨勢或變異狀況。變異指標值越大,表明總體各單位標志的變異程度越大。2.作用:(1)衡量平均指標的代表性。(2)反映現(xiàn)象變動的均衡性。(3)研究總體標志值分布偏離正態(tài)的情況。(4)進行抽樣推斷等統(tǒng)計分析的一個基本指標。變異指標如按數(shù)量關(guān)系來分有以下兩類;凡用絕對數(shù)來表達的變異指標,統(tǒng)稱絕對離勢;凡用相對數(shù)來表達的變異指標,統(tǒng)稱相對離勢;主要有極差、平均差、四分位差、標準差等。主要有異眾比率、標準差系數(shù)、平均差系數(shù)和一些常用的偏態(tài)系數(shù)。二、極差1)極差也稱全距,它是統(tǒng)計總體中兩個極端標志值之差,表明總體中標志值變動的范圍。2)計算公式: (未分組及單項式) (分組) 式中:Umax代表最高組的上限;Lmin代表最低組的下限。3)特點:計算簡便,直觀易于理解。三、四分位差1)計算公式:數(shù)列的3/4位次與1/4位次的標志值之差。2)特點:四分位差避免了數(shù)列中極端值的影響,但去頭棄尾,丟失大量的原始數(shù)據(jù)。四、異眾比率() 它是指非眾數(shù)組的頻數(shù)與全部頻數(shù)之比,更多地用來反映定類尺度的眾數(shù)的代表性。其計算公式:

式中:是眾數(shù)組的次數(shù),為變量值的總次數(shù)。五、平均差(A.D)1、定義:平均絕對偏差,總體所有單位的標志值與其平均數(shù)的離差絕對值的算術(shù)平均數(shù)。2、計算公式:3、特點:平均差是根據(jù)全部變量計算出來的,所以對整個變量的離散趨勢有較充分的代表性。因采取離差絕對值的方法來消除正負影響,不適合代數(shù)方法演算,其應用受到限制在實際應用中,平均數(shù)可用中位數(shù)代替,且以中位數(shù)為比較標準,計算出來的平均差為最小值。[例1]試分別以算術(shù)平均數(shù)為基準,求85,69,69,74,87,91,74這些數(shù)字的平均差。[例2]試以算術(shù)平均數(shù)為基準,求下表所示數(shù)據(jù)的平均差。

計算左邊數(shù)列的平均差六、方差與標準差(一)數(shù)量標志的方差與標準差1、數(shù)量標志方差與標準差的計算。其計算公式為:未分組的資料:方差:標準差:用分組資料計算方差:標準差2、總方差、組間方差和組內(nèi)方差。在資料分組的條件下,總體各標志值對平均數(shù)的方差可以分解為組內(nèi)方差和組間方差。其關(guān)系式:式中:代表總體方差;代表組內(nèi)方差的平均數(shù);代表組間方差。3、方差與標準差的數(shù)學性質(zhì):1)變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方。即:2)變量對其算術(shù)平均數(shù)的方差小于對任意常數(shù)的方差。因為,所以,當(x0為任意常數(shù))時,3)n個同性質(zhì)獨立變量和的方差等于各個變量方差的和。設:則:4)n個同性質(zhì)獨立變量平均數(shù)的方差等于各變量方差平均數(shù)的1/n。設:則:

5)變量線性變換的方差等于變量的方差乘以變量系數(shù)的平方。設:則:(二)是非標志的方差與標準差七、變異系數(shù)1、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論