版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)分布特征的描述1第一節(jié)統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定第二節(jié)統(tǒng)計(jì)變量離散趨勢(shì)的測(cè)定第三節(jié)變量分布的偏度與峰度目錄2分類(lèi)分組整理圖示統(tǒng)計(jì)數(shù)據(jù)尋找反映數(shù)據(jù)分布特征的代表值:集中趨勢(shì);離散程度;形狀。
對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行排序、分組、整理、圖示,是對(duì)數(shù)據(jù)的分布特征進(jìn)行描述的一個(gè)基本方面,為進(jìn)一步掌握數(shù)據(jù)的分布特征及其變化規(guī)律,以進(jìn)行深入的分析,還需找出反映數(shù)據(jù)分布特征的各個(gè)代表值。統(tǒng)計(jì)學(xué)中主要從以下三方面刻劃數(shù)據(jù)分布特征:數(shù)據(jù)分布的集中趨勢(shì);數(shù)據(jù)分布的離散程度;數(shù)據(jù)分布的形狀。3數(shù)據(jù)分布的特征集中趨勢(shì):反映數(shù)據(jù)向其中心靠攏或聚集的程度(位置)偏態(tài)和峰態(tài):偏態(tài):數(shù)據(jù)分布對(duì)稱(chēng)性的度量;峰態(tài):數(shù)據(jù)分布的平峰或尖峰程度(形狀)離中趨勢(shì):數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)
(分散程度)4數(shù)據(jù)分布特征和適用的描述統(tǒng)計(jì)量數(shù)據(jù)分布特征集中趨勢(shì)眾數(shù)中位數(shù)平均數(shù)離散程度異眾比率四分位差極差平均差方差或標(biāo)準(zhǔn)差離散系數(shù)分布形狀偏態(tài)系數(shù)峰態(tài)系數(shù)5一、測(cè)定集中趨勢(shì)的指標(biāo)及其作用二、數(shù)值平均數(shù)三、眾數(shù)與中位數(shù)第一節(jié)統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定6一、測(cè)定集中趨勢(shì)的指標(biāo)及其作用集中趨勢(shì):(centraltendency)
較大和較小的觀測(cè)值出現(xiàn)的頻率比較低,大多數(shù)觀測(cè)值密集分布在中心附近,使得全部數(shù)據(jù)呈現(xiàn)出向中心聚集或靠攏的態(tài)勢(shì)。
7測(cè)度數(shù)據(jù)集中趨勢(shì)的指標(biāo)分類(lèi)測(cè)度集中趨勢(shì)的指標(biāo)有兩大類(lèi):數(shù)值平均數(shù)——是根據(jù)全部數(shù)據(jù)計(jì)算得到的代表值,主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)及幾何平均數(shù);位置代表值——根據(jù)數(shù)據(jù)所處位置直接觀察、或根據(jù)與特定位置有關(guān)的部分?jǐn)?shù)據(jù)來(lái)確定的代表值,主要有眾數(shù)和中位數(shù)。8測(cè)定集中趨勢(shì)指標(biāo)的作用1.反映變量分布的集中趨勢(shì)和一般水平。如用平均工資了解職工工資分布的中心,反映職工工資的一般水平。2.可用來(lái)比較同一現(xiàn)象在不同空間或不同階段的發(fā)展水平。不受總體規(guī)模大小的影響,在一定程度上使偶然因素的影響相互抵消。3.可用來(lái)分析現(xiàn)象之間的依存關(guān)系。如研究勞動(dòng)者的文化程度與收入的關(guān)系4.平均指標(biāo)也是統(tǒng)計(jì)推斷中的一個(gè)重要統(tǒng)計(jì)量,是進(jìn)行統(tǒng)計(jì)推斷的基礎(chǔ)。9二、數(shù)值平均數(shù)數(shù)值平均數(shù)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)10(一)算術(shù)平均數(shù)算術(shù)平均數(shù)是計(jì)算平均指標(biāo)最常用的方法,其基本公式是:分子、分母的口徑及包含的內(nèi)容應(yīng)嚴(yán)格一致,即各標(biāo)志值與各單位之間必須一一對(duì)應(yīng)。例:計(jì)算某企業(yè)職工平均工資,是該企業(yè)所有職工工資總額除以職工總?cè)藬?shù)所得。如工資總額150000元,總?cè)藬?shù)300人,平均工資500元。111、簡(jiǎn)單算術(shù)平均數(shù)計(jì)算公式:其中:代表算術(shù)平均數(shù),xi代表各單位標(biāo)志值(變量值),n代表總體單位數(shù)(項(xiàng)數(shù))。適用條件:
原始資料(或資料未分組);
各變量出現(xiàn)次數(shù)相等的情況下應(yīng)用;12表3-1解:采用簡(jiǎn)單算術(shù)平均法計(jì)算,即全體隊(duì)員的平均年齡為(單位:周歲)分組數(shù)據(jù)不能簡(jiǎn)單平均!因?yàn)楦鹘M變量值的次數(shù)不等!若采用簡(jiǎn)單平均:表3-2132、加權(quán)算術(shù)平均數(shù)計(jì)算公式:加權(quán)——為了體現(xiàn)各變量值輕重不同的影響作用,對(duì)各個(gè)變量值賦予不盡相同的權(quán)數(shù)(fi
)其中:代表算術(shù)平均數(shù),x代表各單位標(biāo)志值(變量值),f代表各組單位數(shù)(項(xiàng)數(shù))。14權(quán)數(shù)的含義和表現(xiàn)形式權(quán)數(shù)(fi)也稱(chēng)權(quán)重,計(jì)算總體平均數(shù)或綜合水平的過(guò)程中對(duì)各個(gè)數(shù)據(jù)起著權(quán)衡輕重作用的變量。
權(quán)數(shù)的表現(xiàn)形式:可以是絕對(duì)數(shù)形式,也可以是比重形式(如頻率)來(lái)表示:
事實(shí)上比重權(quán)數(shù)更能夠直接表明權(quán)數(shù)的權(quán)衡輕重作用的實(shí)質(zhì)。15加權(quán)算術(shù)平均數(shù)就成了簡(jiǎn)單算術(shù)平均數(shù),也就是說(shuō)簡(jiǎn)單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)的一種特殊形式。當(dāng)權(quán)數(shù)完全相等時(shí)16例3-1正確的計(jì)算是:由單項(xiàng)數(shù)列計(jì)算算術(shù)平均數(shù)可直接用加權(quán)算術(shù)平均法進(jìn)行計(jì)算。17【例3.6】根據(jù)表3-6中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的均值18權(quán)數(shù)對(duì)算術(shù)平均數(shù)的影響加權(quán)算術(shù)平均數(shù)其數(shù)值的大小,不僅受各組變量值大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)即權(quán)數(shù)大小的影響。如果某一組的權(quán)數(shù)大,說(shuō)明該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對(duì)算術(shù)平均數(shù)的影響就越大,反之,則越小。19甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下:甲組:考試成績(jī)(X): 020100
人數(shù)分布(F):118乙組:考試成績(jī)(X): 020100
人數(shù)分布(F):811X甲0×1+20×1+100×8n
10i=1
Xi
82(分)X乙0×8+20×1+100×1n
10i=1
Xi
12(分)203、由組距數(shù)列計(jì)算算術(shù)平均數(shù)在組距分組的情況下,由于各組的組限只表明各組標(biāo)志值的上下界限,因此由組距數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)時(shí),必須先計(jì)算各組的組中值,以組中值代表該組標(biāo)志值,然后再計(jì)算加權(quán)算術(shù)平均數(shù)。各組變量值用組中值來(lái)表示;假定條件是各組內(nèi)數(shù)據(jù)呈均勻分布或?qū)ΨQ(chēng)分布;計(jì)算結(jié)果是近似值。21某批次節(jié)能燈泡使用壽命的分組數(shù)據(jù)224、對(duì)相對(duì)數(shù)求算術(shù)平均數(shù)由于各個(gè)相對(duì)數(shù)的對(duì)比基礎(chǔ)不同,采用簡(jiǎn)單算術(shù)平均通常不合理,需要加權(quán)。表3-4企業(yè)流通費(fèi)用率(%)商品銷(xiāo)售額(萬(wàn)元)流通費(fèi)用(萬(wàn)元)甲161600256乙104750475丙124000480合計(jì)11.70048103501211權(quán)數(shù)的選擇必須符合該相對(duì)數(shù)本身的計(jì)算公式。權(quán)數(shù)通常為該相對(duì)數(shù)的分母指標(biāo)。235、算術(shù)平均數(shù)的主要數(shù)學(xué)性質(zhì)(1)算術(shù)平均數(shù)與變量值個(gè)數(shù)的乘積等于各個(gè)變量值的總和。(2)各變量值與算術(shù)平均數(shù)的離差之總和等于零。(3)各變量值與算術(shù)平均數(shù)的離差平方之總和為最小。24(二)調(diào)和平均數(shù)概念:調(diào)和平均數(shù)又稱(chēng)倒數(shù)平均數(shù),是變量倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。公式:
A.簡(jiǎn)單調(diào)和平均數(shù)B.加權(quán)調(diào)和平均數(shù)式中:M-—各組的標(biāo)志總量;X—各組的標(biāo)志值。25應(yīng)用調(diào)和平均數(shù)應(yīng)注意問(wèn)題1、變量x的值不能為0。2、調(diào)和平均數(shù)易受極端值的影響。3、要注意其運(yùn)用的條件。(已知各組的標(biāo)志總量和標(biāo)志值,而權(quán)數(shù)未知)26例題例水果甲級(jí)每元1公斤,乙級(jí)每元1.5公斤,丙級(jí)每元2公斤。問(wèn):(1)若各買(mǎi)1公斤,平均每元可買(mǎi)多少公斤?(2)各買(mǎi)6.5公斤,平均每元可買(mǎi)多少公斤?(3)若買(mǎi)甲級(jí)3公斤,乙級(jí)2公斤,丙級(jí)1公斤,平均每元可買(mǎi)幾公斤?(4)甲乙丙三級(jí)各買(mǎi)1元,每元可買(mǎi)幾公斤?27解答:(1)(2)(3)(4)28算術(shù)平均數(shù)與調(diào)和平均數(shù)的關(guān)系1.從數(shù)學(xué)定義角度看算術(shù)平均數(shù)與調(diào)和平均數(shù)是不一樣的,但在社會(huì)經(jīng)濟(jì)應(yīng)用領(lǐng)域,調(diào)和平均數(shù)實(shí)際上只是算術(shù)平均數(shù)的另一種表現(xiàn)形式,二者本質(zhì)上是一致的,惟一的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。2.計(jì)算比率的平均數(shù)時(shí),如果已知比率及其基本計(jì)算式的分母資料,則采用加權(quán)算術(shù)平均法;如果已知比率及其基本計(jì)算式的分子資料,則采用加權(quán)調(diào)和平均法。29例自行車(chē)賽時(shí)速:甲30公里,乙28公里,丙20公里,全程200公里,問(wèn)三人平均時(shí)速是多少?若甲乙丙三人各騎車(chē)2小時(shí),平均時(shí)速是多少?30(三)幾何平均數(shù)概念:幾何平均數(shù)是n個(gè)變量連乘積的n次根。適用于現(xiàn)象各變量值的連乘積等于總體標(biāo)志總量的場(chǎng)合,是計(jì)算平均比率和平均速度常用的一種方法。如:銀行平均利率、各年平均發(fā)展速度、產(chǎn)品平均合格率等計(jì)算公式:(1)簡(jiǎn)單幾何平均數(shù)(2)加權(quán)幾何平均數(shù)31應(yīng)注意的問(wèn)題1、變量數(shù)列中任何一個(gè)變量值不能為0,一個(gè)為0,則幾何平均數(shù)為0。2、幾何平均法主要用于動(dòng)態(tài)平均數(shù)的計(jì)算。3、實(shí)際統(tǒng)計(jì)中,為了計(jì)算上的方便,通常利用對(duì)數(shù)。32【例3.8】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計(jì)算該投資者在這四年內(nèi)的平均收益率。平均收益率=103.84%-1=3.84%33三、眾數(shù)與中位數(shù)(一)眾數(shù)(Mode)
1.概念:眾數(shù)是指變量數(shù)列中出現(xiàn)次數(shù)最多或頻率最大的變量值。
2.適用條件:只有集中趨勢(shì)明顯時(shí),才能用眾數(shù)作為總體的代表值。
34
3.眾數(shù)的計(jì)算方法:(1)單項(xiàng)數(shù)列確定眾數(shù),即出現(xiàn)次數(shù)最多(頻率最大)的標(biāo)志值就是眾數(shù)。(2)組距數(shù)列確定眾數(shù):在等距數(shù)列條件下,先確定眾數(shù)組,然后再通過(guò)公式進(jìn)行具體計(jì)算,找出眾數(shù)點(diǎn)的標(biāo)志值。35定類(lèi)數(shù)據(jù)眾數(shù)的確定【例3.1】根據(jù)表3-1中的數(shù)據(jù),計(jì)算眾數(shù)。解:這里的變量為“廣告類(lèi)型”,這是個(gè)定類(lèi)變量,不同類(lèi)型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類(lèi)別,即
Mo=商品廣告36定序數(shù)據(jù)眾數(shù)的確定【例3.2】根據(jù)表3-2中的數(shù)據(jù),計(jì)算眾數(shù)。解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類(lèi)別”。甲城市中對(duì)住房表示不滿(mǎn)意的戶(hù)數(shù)最多,為108戶(hù),因此眾數(shù)為“不滿(mǎn)意”這一類(lèi)別,即
Mo=不滿(mǎn)意374.計(jì)算公式:公式1(下限公式):用眾數(shù)所在組的下限為起點(diǎn)值計(jì)算公式2(上限公式):用眾數(shù)所在組的上限為起點(diǎn)值計(jì)算U為眾數(shù)所在組組距的上限,L為眾數(shù)所在組組距的下限,為眾數(shù)組的上限,為眾數(shù)組次數(shù)與前一組次數(shù)之差,為眾數(shù)組與后一組之差,i為眾數(shù)組的組距。38數(shù)值型分組數(shù)據(jù)眾數(shù)的確定【例3.3】根據(jù)表3-3中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的眾數(shù)39(二)中位數(shù)1、概念:將總體單位的某一數(shù)量標(biāo)志的各個(gè)數(shù)值按照大小順序排列,居于中間位置的那個(gè)數(shù)值就是中位數(shù)。中位數(shù)是位置平均數(shù),它不受極端值的影響,在具有個(gè)別極大或極小標(biāo)志值的分布數(shù)列中,中位數(shù)比計(jì)算算術(shù)平均數(shù)更具有代表性;從中位數(shù)的概念可以看出,總體中有一半項(xiàng)目的數(shù)值小于中位數(shù),一半項(xiàng)目的數(shù)值大于中位數(shù)。402、計(jì)算方法:(1)由未分組資料確定中位數(shù)①排序:按大小順序排序(某一標(biāo)志值)②確定中位數(shù)位置③計(jì)算(確定)中位數(shù)數(shù)值:分兩種:
奇數(shù):中間位置的標(biāo)志值為中位數(shù)。
偶數(shù):中間位置相鄰兩個(gè)變量值的簡(jiǎn)單平均數(shù)是中位數(shù)。41某組學(xué)生考試成績(jī)(8人):72,75,78,79,81,82,84,90則若9人,成績(jī)分別為:72,73,75,78,79,81,82,84,90則42(2)由分組資料確定中位數(shù)第一步:確定中位數(shù)所處位置,按確定(f為次數(shù))。第二步:確定中位數(shù)組:第三步:采用公式計(jì)算下限法:用“向上累計(jì)”法確定中位數(shù)。上限法:用“向下累計(jì)”法確定中位數(shù)。其中:U是中位數(shù)所在組的上限,L是中位數(shù)所在組的下限,fm是中位數(shù)所在組的次數(shù),Sm+1是中位數(shù)所在組后面各組累計(jì)次數(shù),Sm-1是中位數(shù)所在組前面各組累計(jì)次數(shù),i是中位數(shù)所在組的組距。43例現(xiàn)檢測(cè)某廠生產(chǎn)的一批電子產(chǎn)品的耐用時(shí)間,得到資料如下表所示:4445分位數(shù)二分位數(shù)(中位數(shù))、四分位數(shù)、十分位數(shù)和百分位數(shù)等。其中主要有四分位數(shù)。排位處于25%和75%位置上的值即四分位數(shù)不受極端值的影響要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類(lèi)數(shù)據(jù)(各種分位數(shù)可由spss計(jì)算)QLQMQU25%25%25%25%46四分位數(shù)的位置未分組數(shù)據(jù):組距分組數(shù)據(jù):4下四分位數(shù)(QL)位置=N+1上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N447數(shù)值型未分組數(shù)據(jù)的四分位數(shù)原始數(shù)據(jù):2321 3032 282526QL=23N+17+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30
排序:21232526283032
位置:1 23456748數(shù)值型未分組數(shù)據(jù)的四分位數(shù)
(6個(gè)(N+1不能被4整除)數(shù)據(jù)的算例)原始數(shù)據(jù):2321 30 282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)
=28.5
49數(shù)值型分組數(shù)據(jù)的四分位數(shù)
(計(jì)算公式)上四分位數(shù):
下四分位數(shù):
50數(shù)值型分組數(shù)據(jù)的四分位數(shù)
(計(jì)算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5【例】根據(jù)表3-5中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的四分位數(shù)51(三)眾數(shù)、中位數(shù)和算術(shù)平均值的比較1.算術(shù)平均數(shù)。算術(shù)平均數(shù)應(yīng)用范圍最廣。易受極端值的影響。當(dāng)分布數(shù)列中存在開(kāi)口組時(shí),會(huì)影響平均數(shù)的準(zhǔn)確性。算術(shù)平均數(shù)適用于數(shù)值型數(shù)據(jù)。522.調(diào)和平均數(shù)適用于計(jì)算比率的平均數(shù)。它容易受極端值的影響,數(shù)列中只要有一個(gè)變量值為零,則不能計(jì)算調(diào)和平均數(shù),故其應(yīng)用范圍受到限制。調(diào)和平均數(shù)適用于數(shù)值型數(shù)據(jù)。533.幾何平均數(shù)適用于各比率連乘積等于總比率的條件下計(jì)算比率的平均數(shù)。數(shù)列中若有一項(xiàng)為零或負(fù)數(shù),計(jì)算幾何平均數(shù)無(wú)意義,應(yīng)用范圍較小。幾何平均數(shù)適用于數(shù)值型數(shù)據(jù)。544.眾數(shù)眾數(shù)的意義易于理解,有時(shí)容易計(jì)算,且不受極端值的影響。當(dāng)數(shù)據(jù)分布沒(méi)有明顯的集中趨勢(shì)而趨于均勻分布時(shí),則無(wú)眾數(shù)可言;對(duì)不等距分布數(shù)列,眾數(shù)不易確定。當(dāng)分布數(shù)列中出現(xiàn)雙眾數(shù)或多眾數(shù)時(shí),難以反映所有數(shù)據(jù)的一般水平。變量值的變化反映不靈敏。眾數(shù)適用于分類(lèi)數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。
555.中位數(shù)中位數(shù)不受極端值的影響。當(dāng)分布數(shù)列中存在極端值或組距數(shù)列中存在開(kāi)口組時(shí),計(jì)算中位數(shù)比較好。中位數(shù)缺乏靈敏性,沒(méi)有算術(shù)平均數(shù)可靠,且不易用代數(shù)方法計(jì)算。中位數(shù)適用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。56左偏分布均值
中位數(shù)
眾數(shù)對(duì)稱(chēng)分布
均值=中位數(shù)=
眾數(shù)右偏分布眾數(shù)
中位數(shù)均值對(duì)何種數(shù)據(jù)而言的?均值=中位數(shù)=眾數(shù)均值>中位數(shù)>眾數(shù)均值<中位數(shù)<眾數(shù)57(一)算術(shù)平均數(shù)、幾何平均數(shù)和調(diào)和平均數(shù)三者的關(guān)系(二)算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者的關(guān)系1、當(dāng)總體分布成對(duì)稱(chēng)狀態(tài)時(shí),三者合而為一。2、當(dāng)總體分布呈右偏時(shí),則3、當(dāng)總體分布呈左偏時(shí),則58當(dāng)分布偏態(tài)時(shí),三者之間的數(shù)量關(guān)系是:若則說(shuō)明分布右偏若則說(shuō)明分布左偏若則說(shuō)明分布對(duì)稱(chēng)59第二節(jié)統(tǒng)計(jì)變量離散程度的測(cè)定
對(duì)數(shù)據(jù)分布特征的另一個(gè)測(cè)度指標(biāo)是數(shù)據(jù)分布離散程度。它反映各數(shù)據(jù)遠(yuǎn)離其中心值的程度,因此,也稱(chēng)離中趨勢(shì)。
集中趨勢(shì)反映的是各變量值向其中心值聚集的程度,
離中趨勢(shì)反映各變量值之間的差異狀況。
注意:
集中趨勢(shì)的測(cè)度值概括地反映了數(shù)據(jù)的一般水平,它對(duì)該組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)的離散程度越大,集中趨勢(shì)的測(cè)度值對(duì)該組數(shù)據(jù)的代表性就越差。60測(cè)度離散程度的指標(biāo)稱(chēng)為變異指標(biāo)。變異指標(biāo)的主要作用:1.說(shuō)明數(shù)據(jù)的分散程度,反映變量的穩(wěn)定性、均衡性。數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。2.衡量平均數(shù)的代表性。離散程度越大,平均數(shù)的代表性就越小。3.統(tǒng)計(jì)推斷的重要依據(jù)判別統(tǒng)計(jì)推斷前提條件是否成立,衡量推斷效果好壞的重要尺度。61離散程度的測(cè)度指標(biāo)分類(lèi)數(shù)據(jù):異眾比率(variationratio)順序數(shù)據(jù):四分位差(quartilerange
)數(shù)值型數(shù)據(jù):①極差(range
)②平均差(meandeviation)③方差和標(biāo)準(zhǔn)差(Varianceandstandarddeviation)④相對(duì)位置的度量:標(biāo)準(zhǔn)化值(standard
score)⑤相對(duì)離散程度:離散系數(shù)(CoefficientofVariation
)62極差1.一組數(shù)據(jù)的最大值與最小值之差2.易受極端值影響7891078910未分組數(shù)據(jù)
R=max(Xi)-min(Xi).=組距分組數(shù)據(jù)
R
最高組上限-最低組下限3.計(jì)算公式為63四分位差對(duì)順序數(shù)據(jù)離散程度的測(cè)度也稱(chēng)為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差 反映了中間50%數(shù)據(jù)的離散程度用于衡量中位數(shù)的代表性64定序數(shù)據(jù)的算例【例3.13】根據(jù)第三章表3-13中的數(shù)據(jù),計(jì)算甲城市家庭對(duì)住房滿(mǎn)意狀況評(píng)價(jià)的四分位差解:設(shè)非常不滿(mǎn)意為1,不滿(mǎn)意為2,一般為3,滿(mǎn)意為4,非常滿(mǎn)意為5
已知QL=不滿(mǎn)意=2
QU=
一般=
3四分位差:
QD
=QU
=
QL
=3–2
=1表3-13
甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶(hù)數(shù)(戶(hù))累計(jì)頻數(shù)
非常不滿(mǎn)意
不滿(mǎn)意一般滿(mǎn)意非常滿(mǎn)意2410893453024132225270300合計(jì)300—65數(shù)值型分組數(shù)據(jù)的四分位差表3-12
某車(chē)間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—【例3.12-2】根據(jù)表3-12中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的四分位差。66平均差1.離散程度的測(cè)度值之一2.各變量值與其均值離差絕對(duì)值的平均數(shù)3.能全面反映一組數(shù)據(jù)的離散程度4.數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少
計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)67算例表3-14某車(chē)間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合計(jì)—50—312【例3.14】根據(jù)第三章表3-14中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的平均差68方差和標(biāo)準(zhǔn)差1.離散程度的測(cè)度值之一2.最常用的測(cè)度值3.反映了數(shù)據(jù)的分布4.反映了各變量值與均值的平均差異5.根據(jù)總體數(shù)據(jù)計(jì)算的,稱(chēng)為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱(chēng)為樣本方差或標(biāo)準(zhǔn)差4681012X=8.369總體方差和標(biāo)準(zhǔn)差(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式70總體標(biāo)準(zhǔn)差(計(jì)算過(guò)程及結(jié)果)3100.5739.47572.45259.926.86184.90518.94817.96(Xi-X)2Fi—246.49114.4932.490.4918.4986.49204.49(Xi-X)250—合計(jì)358141064107.5112.5117.5122.5127.5132.5137.5105~110110~115115~120120~125125~130130~135135~140頻數(shù)(Fi)組中值(Xi)按零件數(shù)分組表3-15某車(chē)間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表【例3.15】根據(jù)第三章表3-15中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差71方差的主要數(shù)學(xué)性質(zhì)(3)分組條件下,總體的方差等于組間方差與各組方差平均數(shù)之和。(1)常數(shù)的方差等于零。a為常數(shù),則(2)變量的線性函數(shù)的方差等于變量系數(shù)的平方乘以變量的方差。設(shè)a,b為常數(shù),y=a+bx,則有:組間方差各組方差平均數(shù)72標(biāo)準(zhǔn)化值1)對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量2)可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)3)用于對(duì)變量的標(biāo)準(zhǔn)化處理4)計(jì)算公式為73注意:
z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)據(jù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。
74算例假定某班學(xué)生先后兩個(gè)兩次進(jìn)行了難度不同的綜合考試,第一次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為80分和10分,而第二次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為70分和7分。張三第一、二次考試的成績(jī)分別為92分和80分,那么全班相比較而言,他哪一次考試的成績(jī)更好呢?解:由于兩次考試成績(jī)的均值和標(biāo)準(zhǔn)差不同,每個(gè)學(xué)生兩次考試的成績(jī)不宜直接比較。利用標(biāo)準(zhǔn)化值進(jìn)行對(duì)比,表明第二次考試的成績(jī)更好一些。75離散系數(shù)1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響3.測(cè)度了數(shù)據(jù)的相對(duì)離散程度4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為76全距、四分位差、平均差、標(biāo)準(zhǔn)差都是絕對(duì)指標(biāo),都與平均指標(biāo)有相同的計(jì)量單位。不宜直接來(lái)比較不同水平數(shù)列之間的標(biāo)志離散程度。離散系數(shù)也稱(chēng)為標(biāo)志變動(dòng)系數(shù)。最常用的是根據(jù)標(biāo)準(zhǔn)差與算術(shù)平均數(shù)對(duì)比的離散系數(shù),稱(chēng)作“標(biāo)準(zhǔn)差系數(shù)”。77例如:有兩個(gè)不同水平的工人日產(chǎn)量(件)資料:甲組:60,65,70,75,80乙組:2,5,7,9,12由此計(jì)算得:計(jì)算其離散系數(shù)來(lái)比較:78算例【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷(xiāo)售數(shù)據(jù)如表4.7。試比較產(chǎn)品銷(xiāo)售額與銷(xiāo)售利潤(rùn)的離散程度79X1=536.25(萬(wàn)元)S1=309.19(萬(wàn)元)V1=536.25309.19=0.577S2=23.09(萬(wàn)元)V2=32.521523.09=0.710X2=32.5215(萬(wàn)元)結(jié)論:計(jì)算結(jié)果表明,V1<V2,說(shuō)明產(chǎn)品銷(xiāo)售額的離散程度小于銷(xiāo)售利潤(rùn)的離散程度80異眾比率1. 離散程度的測(cè)度值之一2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 用于衡量眾數(shù)的代表性4.
計(jì)算公式為81算例表3-10
某城市居民關(guān)注廣告類(lèi)型的頻數(shù)分布
廣告類(lèi)型人數(shù)(人)頻率(%)
商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0合計(jì)200100【例3.10】根據(jù)第三章表3-10中的數(shù)據(jù),計(jì)算異眾比率解:
在所調(diào)查的200人當(dāng)中,關(guān)注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來(lái)反映城市居民對(duì)廣告關(guān)注的一般趨勢(shì),其代表性不是很好
Vr=200-112200
=1-
112
200
=0.44=44%82數(shù)據(jù)類(lèi)型與離散程度測(cè)度值數(shù)據(jù)類(lèi)型和所適用的離散程度測(cè)度值數(shù)據(jù)類(lèi)型定類(lèi)數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)或定比數(shù)據(jù)適用的測(cè)度值※異眾比率※四分位差
※方差或標(biāo)準(zhǔn)差—
異眾比率
※離散系數(shù)(比較時(shí)用)——
平均差——
極差——
四分位差——
異眾比率83變量分布的偏度與峰度一、矩(動(dòng)差)矩(動(dòng)差)——一系列刻畫(huà)數(shù)據(jù)分布特征的指標(biāo)的統(tǒng)稱(chēng)。變量值與數(shù)值a之離差的K次方的平均數(shù)稱(chēng)為變量x關(guān)于a的K階矩,即:84K階原點(diǎn)矩(當(dāng)a=0時(shí))是數(shù)據(jù)的K次方的平均數(shù).一階原點(diǎn)矩即算術(shù)平均數(shù);二階原點(diǎn)矩即平方平均數(shù)。
K階中心矩矩(當(dāng)a=均值時(shí))是以均值為中心計(jì)算的離差K次方的平均數(shù)k=1時(shí),稱(chēng)為一階中心矩,它恒等于0,即m1=0;k=2時(shí),稱(chēng)為二階中心矩,也就是方差,即m2=σ2。
85二、偏度(Skewness)偏度——指數(shù)據(jù)分布的不對(duì)稱(chēng)程度或偏斜程度。以對(duì)稱(chēng)分布為標(biāo)準(zhǔn)來(lái)區(qū)分偏態(tài)分布又分左偏(負(fù)偏)和右偏(正偏).左偏分布(負(fù)偏)右偏分布(正偏)86偏態(tài)的測(cè)度方法-30+3
極左偏態(tài)對(duì)稱(chēng)分布極右偏態(tài)一般有:(一)由均值與眾數(shù)(中位數(shù))之間的關(guān)系求偏態(tài)系數(shù):87(二)由三個(gè)四分位數(shù)之間的關(guān)系求偏態(tài)系數(shù)值域:-1Sk1
極左偏態(tài)對(duì)稱(chēng)分布極右偏態(tài)-10+1
88(三)利用3階中心矩來(lái)計(jì)算偏度系數(shù)。測(cè)定偏度最常用的方法原理:若分布不對(duì)稱(chēng),則3階中心矩不為0。不對(duì)此程度愈嚴(yán)重,3階中心矩的絕對(duì)值愈大。為消除量綱的影響,可除以σ3。0
對(duì)稱(chēng)分布左偏分布
右偏分布89三、峰度(Kurtosis)峰度——是指變量的集中程度和分布曲線的陡峭(或平坦)的程度。對(duì)峰度的度量通常以正態(tài)分布曲線為比較標(biāo)準(zhǔn),分為正態(tài)峰度、尖頂峰度和平頂峰度.平頂分布尖峰分布尖頂峰度的分布曲線比正態(tài)分布曲線更加尖峭、更高更窄;平頂峰度的分布曲線比正態(tài)分配曲線更為平緩、更低更扁平。90峰度系數(shù)原理:分布曲線的尖峭程度與偶數(shù)階中心矩的數(shù)值大小有直接關(guān)系。以四階中心矩m4為基礎(chǔ),為了消除量綱的影響,再除以標(biāo)準(zhǔn)差的四次方σ4所得到的相對(duì)數(shù)即可衡量峰度。91當(dāng)K=0時(shí),分布曲線為正態(tài)曲線;當(dāng)K>0時(shí),為尖頂曲線,表示數(shù)據(jù)比正態(tài)分布更集中在均值附近;K的數(shù)值越大,則變量分布曲線之頂端越尖峭;當(dāng)K<0時(shí),為平頂曲線,表示數(shù)據(jù)比正態(tài)分布更分散;K的數(shù)值越小,則變量分布曲線之頂端越平坦。對(duì)于正態(tài)分布曲線有:m4/σ4=3,故峰度系數(shù)為:92算例根據(jù)表3-3的數(shù)據(jù),計(jì)算使用壽命分布的偏度系數(shù)和峰度系數(shù)。解:計(jì)算結(jié)果表明,偏度系數(shù)幾乎為0,峰度系數(shù)略小于0,說(shuō)明該產(chǎn)品使用壽命的分布十分接近對(duì)稱(chēng)分布,分布曲線頂峰略比正態(tài)分布平坦一些??偟恼f(shuō)來(lái),該產(chǎn)品的使用壽命的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 車(chē)庫(kù)出租的合同6篇3
- 辦公樓屋頂綠化養(yǎng)護(hù)合同
- 電力工程翻斗車(chē)租賃協(xié)議
- 科技園區(qū)外墻保溫施工合同模板
- 勞務(wù)服務(wù)市場(chǎng)信息共享平臺(tái)
- 土方作業(yè)挖掘合同
- 國(guó)際航空港硬裝施工合同
- 餐飲場(chǎng)所消防器材檢修服務(wù)承諾書(shū)
- 體育賽事服務(wù)合同執(zhí)行細(xì)則
- 2024年醫(yī)療信息化服務(wù)協(xié)議
- 山東德州財(cái)金投資控股集團(tuán)有限公司招聘考試真題2022
- 《工業(yè)機(jī)器人應(yīng)用與維護(hù)》專(zhuān)業(yè)人才培養(yǎng)方案
- 《馬克思主義發(fā)展史》第二章剩余價(jià)值學(xué)說(shuō)的創(chuàng)立和馬課件
- 高中語(yǔ)文人教版高中必修文言文定語(yǔ)后置
- 傳統(tǒng)孝道人物虞舜
- 確定積極分子會(huì)議記錄范文七篇
- 長(zhǎng)江三峽水利樞紐可行性報(bào)告
- 江蘇省某高速公路結(jié)構(gòu)物臺(tái)背回填監(jiān)理細(xì)則
- 電大護(hù)理本科臨床實(shí)習(xí)手冊(cè)內(nèi)容(原表)
- 當(dāng)代德國(guó)學(xué)校勞動(dòng)教育課程構(gòu)建的經(jīng)驗(yàn)與啟示共3篇
- “小金庫(kù)”治理與防范 習(xí)題及答案
評(píng)論
0/150
提交評(píng)論