




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一、集中趨勢(shì)的測(cè)度
二、離散程度的測(cè)度三、偏態(tài)與峰態(tài)的測(cè)度
第三章數(shù)據(jù)分布特征的測(cè)度
1在一家財(cái)產(chǎn)保險(xiǎn)公司的董事會(huì)上,董事們就加入世界貿(mào)易組織后公司的發(fā)展戰(zhàn)略問(wèn)題展開(kāi)了廣泛討論,其中一個(gè)人引人注目的問(wèn)題就是如何借鑒國(guó)外保險(xiǎn)公司的先進(jìn)管理經(jīng)驗(yàn),提高自身的管理水平。有的董事提出,2002年公司的各項(xiàng)業(yè)務(wù)與前一年相比沒(méi)有太大增長(zhǎng),除經(jīng)濟(jì)環(huán)境和市場(chǎng)競(jìng)爭(zhēng)等因素外,家庭財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)開(kāi)展得不夠,公司的管理方式也存在問(wèn)題。他認(rèn)為,中國(guó)的家庭財(cái)產(chǎn)保險(xiǎn)市場(chǎng)潛力巨大,應(yīng)加大擴(kuò)展這一業(yè)務(wù)的力度,同時(shí),對(duì)公司家庭財(cái)產(chǎn)推銷員實(shí)行目標(biāo)管理,根據(jù)目標(biāo)完成情況建立相應(yīng)的獎(jiǎng)懲制度。董事長(zhǎng)認(rèn)為該董事的建議一定有一定的道理,準(zhǔn)備采納。會(huì)后,他責(zé)成計(jì)劃部經(jīng)理盡快拿出具體的實(shí)施方案。計(jì)劃部經(jīng)理接到任務(wù)很感到有些頭疼,他不知道該從何處下手,不知道如何確定推銷員的具體銷售目標(biāo)。如果目標(biāo)定得過(guò)高,多數(shù)推銷員完不成任務(wù),會(huì)使推銷失去信心;如果定得太低,將不利于充分挖掘員工工作潛力,提高公司的業(yè)績(jī)水平。為此,他從公司幾千名業(yè)務(wù)員中隨機(jī)抽取了160人,對(duì)他們2002年的月銷售額作了統(tǒng)計(jì),結(jié)果如表3-1所示。這些數(shù)據(jù)對(duì)制定銷售目標(biāo)有何幫助?如果你是計(jì)劃部經(jīng)理,你如何根據(jù)這些數(shù)據(jù)制定具體的銷售目標(biāo)?保險(xiǎn)公司的銷售計(jì)劃2數(shù)據(jù)特征值的描述:數(shù)據(jù)分布的集中趨勢(shì)、離散程度和分布的形狀三、分布偏態(tài)和峰態(tài),反映數(shù)據(jù)分布的形狀。一、分布的集中趨勢(shì),反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二、分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離中心值的趨勢(shì);3第1節(jié)集中趨勢(shì)的測(cè)度集中趨勢(shì)(centraltendency)是指一組數(shù)據(jù)向某一中心值靠攏的傾向、它反映了一組數(shù)據(jù)中心點(diǎn)的位置所在。
4幾種常見(jiàn)的集中趨勢(shì)度量指標(biāo)集中趨勢(shì)測(cè)量指標(biāo)特點(diǎn)適用范圍眾數(shù)不受數(shù)據(jù)中極端值的影響分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)等中位數(shù)和分位數(shù)不受數(shù)據(jù)中極端值的影響順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)等均值利用了全部數(shù)據(jù)的信息,有優(yōu)良的數(shù)學(xué)性質(zhì),但易受數(shù)據(jù)中極端值的影響
5一、分類數(shù)據(jù):眾數(shù)眾數(shù)(mode):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值用M0表示。
從分布的角度看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰值點(diǎn)所對(duì)應(yīng)得數(shù)據(jù)即為眾數(shù),當(dāng)然,如果數(shù)據(jù)的分布沒(méi)有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)也不可能存在:如果有兩個(gè)最高峰點(diǎn),也可以有兩個(gè)眾數(shù)。眾數(shù)的特點(diǎn)是不受數(shù)據(jù)中極端值的影響。6[例3-1]根據(jù)第2章表2-5中的數(shù)據(jù),計(jì)算“飲料品牌”的眾數(shù)。解:這里的變量為“飲料品牌”,這個(gè)是分類變量,不同的品牌就是變量值,我們看到,在所調(diào)查的50人當(dāng)中,購(gòu)買(mǎi)可口可樂(lè)的人數(shù)最多,為15人,占總數(shù)調(diào)查人數(shù)的30%,因此眾數(shù)為可口可樂(lè)這一品牌,即M0=可口可樂(lè)。[例3-2]根據(jù)第二章表2-6中的數(shù)據(jù),計(jì)算顧客“評(píng)價(jià)等級(jí)”的眾數(shù)。 解:這里的“回答類別”是一個(gè)順序變量,其變量值為:好、較好、一般、較差、差。我們看到,在所調(diào)查的100人中,回答“一般”的人數(shù)最多,為32人,因此眾數(shù)“一般”這一類別,即M0=一般7例表中給出了20家電視網(wǎng)絡(luò)黃金時(shí)間播出的廣告時(shí)間數(shù)據(jù),求出眾數(shù)。用Excel函數(shù)計(jì)算眾數(shù)常用函數(shù):MODE函數(shù)分類-統(tǒng)計(jì)-“MODE”函數(shù)81.中位數(shù):一組數(shù)據(jù)排序后,處于中間位置上的變量值,用Me表示。中位數(shù)是一個(gè)位置代表值,它主要用于測(cè)度順序數(shù)據(jù)的集中趨勢(shì),當(dāng)然也適用于作為數(shù)值型數(shù)據(jù)的集中趨勢(shì),但不適用于分類數(shù)據(jù)。二、順序數(shù)據(jù):中位數(shù)和分位數(shù)9中位數(shù)位置未分組數(shù)據(jù)計(jì)算中位數(shù)時(shí),要先對(duì)數(shù)據(jù)進(jìn)行排序,然后確定中位數(shù)的位置,其公式為:
中位數(shù)=(n+1)/2分組數(shù)據(jù),中位數(shù)的位置可按照下式確定:中位數(shù)=n/210設(shè)一組數(shù)據(jù)為x1,x2,,…,xn,按從小到大排序后為x(1),x(2),,…,x(n),則中位數(shù)為:
中位數(shù)公式11[例3-3]根據(jù)第2章表2-6的數(shù)據(jù),計(jì)算顧客“評(píng)價(jià)等級(jí)”的中位數(shù)。解:這是一個(gè)順序數(shù)據(jù),變量為顧客對(duì)超市服務(wù)狀況的“評(píng)價(jià)等級(jí)”,其中的五個(gè)選項(xiàng)即為變量值,由于變量值本身就是順序的,根據(jù)中位數(shù)的位置確定公式有:中位數(shù)位置=100/2=50。從表2-6的累積次數(shù)中可以很容易看到,中位數(shù)在“一般”這一類中,因此中位數(shù)是“一般”這一類別,即M0=一般。這就是說(shuō),我們可以用“一般”作為對(duì)超市服務(wù)狀況評(píng)價(jià)的一個(gè)代表值。當(dāng)然,其代表性如何還需要進(jìn)一步分析。12[例3-4]在某城市中隨機(jī)抽取9個(gè)家庭,調(diào)查得到每個(gè)家庭的人均月收入(單位:元)數(shù)據(jù)為:1500、750、780、1080、850、960、2000、1250、1630,計(jì)算人均月收入的中位數(shù)。
假定在例3-4中我們抽取了10個(gè)家庭,每個(gè)家庭的人均收入數(shù)據(jù)排序后為:66075078085096010801250150016302000數(shù)據(jù)排序結(jié)果如下:75078085096010801250150016302000注:中位數(shù)是一個(gè)位置代表值,其特點(diǎn)是不受極端值得影響
132、分位數(shù)中位數(shù)是從中間將全部數(shù)據(jù)分為兩部分。與中位數(shù)類似的還有四分位數(shù)(quartile)、十分位數(shù)(decile)和百分位數(shù)(percentile)等。他們分別是用3個(gè)點(diǎn)、9個(gè)點(diǎn)和99個(gè)點(diǎn)將數(shù)據(jù)4等分、10等分和100等分后各分位點(diǎn)上的值。
25%25%QL
QMQU
下四分位數(shù)為QL中間的四分位數(shù)為QM上四分位數(shù)為QU14四分位數(shù)位置對(duì)于未分組的原始數(shù)據(jù),各分位數(shù)的位置分別為:
QL位置=(n+1)/4;QM位置=2(n+1)/4;QU位置=3(n+1)/4
對(duì)于分組數(shù)據(jù),各四分位數(shù)的位置分別為:
QL位置=n/4;QM位置=2n/4;QU位置=3n/4
QM=Me。當(dāng)四分位數(shù)的位置不在某一個(gè)數(shù)值上時(shí),可根據(jù)四分位數(shù)的位置,按比例分?jǐn)偹姆治粩?shù)位置兩側(cè)數(shù)值的差值。
15[例3-5]根據(jù)第2章表2-6中的數(shù)據(jù),計(jì)算顧客“評(píng)價(jià)等級(jí)”的四分位數(shù)。解:下四分位數(shù)的位置=100/4=25,從累積次數(shù)表可以看出,下四分位數(shù)在“較好”這一類中,因此QL=較好;上四分位數(shù)的位置=(3×100)/4=75,從累積次數(shù)表可以看出,上四分位數(shù)在“較差”這一類中,因此QU=較差。16[例3-6]根據(jù)表3-1中的數(shù)據(jù),計(jì)算保險(xiǎn)業(yè)務(wù)員月銷售額的下四分位數(shù)和上分位數(shù)。 解:QL位置=(n+1)/4=(160+1)/4=40.25,即QL在第40個(gè)數(shù)值(1.57)和第41個(gè)數(shù)值(1.58)0.25的位置上,因此,QL=1.57+0.25×(1.58-1.57)=1.5725(萬(wàn)元)。QU位置=3(n+1)/4=3×
(160+1)/4=120.75,即QU在第120個(gè)數(shù)值(2.15)和第121個(gè)數(shù)值(2.16)0.75的位置上,因此,QU=2.15+0.75×
(2.16-2.15)=2.1575(萬(wàn)元)。QL和QU之間包含50%的數(shù)據(jù),因此,我們可以說(shuō)有一半的營(yíng)業(yè)員銷售額在1.5725萬(wàn)元和2.1575(萬(wàn)元)之間。17用Excel計(jì)算中位數(shù)、四分位數(shù)中位數(shù):函數(shù)分類-統(tǒng)計(jì)-MEDIAN四分位數(shù):函數(shù)分類-統(tǒng)計(jì)-QUARTILE“Array”:存放數(shù)據(jù)的位置“Quart”:決定計(jì)算哪個(gè)四分位數(shù)(0,1,2,3,4)18均值(mean)也稱為算術(shù)平均數(shù)(arithmeticmean),它是全部數(shù)據(jù)的算術(shù)平均。均值在統(tǒng)計(jì)學(xué)中有重要的位置,是集中趨勢(shì)的最主要的測(cè)度值。它主要適用于數(shù)值型數(shù)據(jù),而不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。根據(jù)所掌握數(shù)據(jù)的不同,均值有不同的計(jì)算形式和計(jì)算公式。
三、數(shù)值型數(shù)據(jù):均值19(一)簡(jiǎn)單均值與加權(quán)均值
1簡(jiǎn)單均值(simplemean)2加權(quán)均值(weightedmean)其中,設(shè):原始數(shù)據(jù)分成k組,各組組中值各組變量值出現(xiàn)的頻數(shù)為樣本容量20[例3-7]根據(jù)案例中表3-1的數(shù)據(jù),按組距0.25分組后計(jì)算超市銷售額的均值。21注:簡(jiǎn)單均值,其數(shù)值的大小只與變量值大小有關(guān)。
加權(quán)均值,其數(shù)值的大小不僅受各組組中值(Mi)大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)即權(quán)數(shù)(fi)大小的影響。
22(二)均值得另一種表現(xiàn)形式:調(diào)和平均數(shù)
調(diào)和平均數(shù)是平均數(shù)的一種。但統(tǒng)計(jì)加權(quán)調(diào)和平均數(shù),與數(shù)學(xué)調(diào)和平均數(shù)不同,它是加權(quán)算術(shù)平均數(shù)的變形,附屬于算術(shù)平均數(shù)。數(shù)學(xué)調(diào)和平均數(shù)定義為:數(shù)值倒數(shù)的平均數(shù)的倒數(shù)。23統(tǒng)計(jì)加權(quán)調(diào)和平均數(shù):用平均標(biāo)志值(變量值)的倒數(shù)作為新變量,以標(biāo)志總量為權(quán)數(shù)進(jìn)行加權(quán)的算術(shù)平均數(shù)的倒數(shù)。
數(shù)學(xué)中“調(diào)和”的意思為“對(duì)稱”,故調(diào)和平均數(shù)為算術(shù)平均數(shù)的對(duì)稱變形。第一,變量對(duì)稱變形,即將變量x
對(duì)稱變形為作為新變量(1/x)。第二,權(quán)數(shù)對(duì)稱變形,即將權(quán)數(shù)總體總量對(duì)稱變形為標(biāo)志總量,作為新權(quán)數(shù)。第三,位置對(duì)稱變形,即將1除以用(1/x)為變量,以標(biāo)志總量為權(quán)數(shù),計(jì)算的加權(quán)算術(shù)平均數(shù),使其位置顛倒。經(jīng)過(guò)這三次變形,算術(shù)平均數(shù)就變形為調(diào)和平均數(shù)24加權(quán)調(diào)和平均數(shù)是加權(quán)算術(shù)平均數(shù)的變形。它與加權(quán)算術(shù)平均數(shù)在實(shí)質(zhì)上是相同的,而僅有形式上的區(qū)別,即表現(xiàn)為變量對(duì)稱的區(qū)別、權(quán)數(shù)對(duì)稱的區(qū)別和計(jì)算位置對(duì)稱的區(qū)別。因而其計(jì)算公式為:
式中:(標(biāo)志總量)25蔬菜名稱批發(fā)價(jià)格(元/公斤)(x)成交額(元)(m)成交量(m/x)甲1.21800015000乙0.51250025000丙0.864008000合計(jì)
3690048000[例3-8]某蔬菜批發(fā)市場(chǎng)三種蔬菜的日成交數(shù)據(jù)如表所示,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格。
平均價(jià)格=成交額÷成交量=0.76926(三)一種特殊的均值:幾何平均數(shù)幾何平均數(shù)主要適用于計(jì)算比率的平均。在實(shí)際應(yīng)用中主要用于計(jì)算社會(huì)經(jīng)濟(jì)的年平均增長(zhǎng)率27例3-9某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬(wàn)噸,2000年與1999年相比增長(zhǎng)率為9%,2001年與2000年相比的增長(zhǎng)率為16%,2002年與2001年相比增長(zhǎng)率為20%。求各年的平均增長(zhǎng)率。
19992000200120029%16%20%解:各年與前一年相比的比值(即發(fā)展速度)分別為109%、116%、120%,則平均發(fā)展速度等于:年平均增長(zhǎng)率為114.91%-100%=14.91%。
28設(shè)開(kāi)始的數(shù)值為,逐年增長(zhǎng)率為第n年的數(shù)值為:
若每年的增長(zhǎng)率都相同,這個(gè)增長(zhǎng)率G就是平均增長(zhǎng)率
29[例3-10]一位投資者持有一支股票,在2000年、2001年、2002年和2003年的收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率。
30對(duì)于比率數(shù)據(jù)的平均采用幾何平均要比算術(shù)平均更合理。幾何平均數(shù)也可以看成是均值的一種變形。
幾何平均數(shù)的對(duì)數(shù)是各變量值對(duì)數(shù)的算術(shù)平均。需要注意得是,當(dāng)數(shù)據(jù)中出現(xiàn)零值或負(fù)值時(shí)不宜計(jì)算幾何平均數(shù)。
31用Excel計(jì)算算術(shù)平均、幾何平均值和調(diào)和平均值算術(shù)平均:函數(shù)分類---統(tǒng)計(jì)---AVERAGE幾何平均:函數(shù)分類---統(tǒng)計(jì)---GEOMEAN調(diào)和平均:函數(shù)分類---統(tǒng)計(jì)---HARMEAN32四、眾數(shù)、中位數(shù)和均值得比較
眾數(shù)、中位數(shù)和均值時(shí)集中趨勢(shì)得三個(gè)主要的測(cè)度值
(一)眾數(shù)、中位數(shù)和均值得關(guān)系
從分布得角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,而均值則是全部數(shù)據(jù)的算術(shù)平均值。
33單峰分布的大多數(shù)數(shù)據(jù)而言,眾數(shù)、中位數(shù)和均值之間具有以下關(guān)系:
對(duì)稱分布:左偏分布:
右偏分布
Mo=Me=均值Mo<Me<均值均值<Me<Mo34(二)眾數(shù)、中位數(shù)和均值的特點(diǎn)與應(yīng)用場(chǎng)合
眾數(shù)是一組數(shù)據(jù)分布的均值,它是一種位置代表值,不受極端值的影響。缺點(diǎn):不唯一或沒(méi)有。眾數(shù)適合于作為分類數(shù)據(jù)的集中趨勢(shì)測(cè)度值。
中位數(shù)是一組數(shù)據(jù)中間位置上的代表值。其特點(diǎn)是不受數(shù)據(jù)極端值的影響。中位數(shù)以及其他分位數(shù)主要適合于作為順序數(shù)據(jù)的集中趨勢(shì)測(cè)度值。
均值是數(shù)值型數(shù)據(jù)的集中趨勢(shì)測(cè)度值。它利用了全部數(shù)據(jù)信息。調(diào)和平均數(shù)主要用于不能直接計(jì)算均值的數(shù)據(jù),幾何平均數(shù)則主要用于計(jì)算比率數(shù)據(jù)的平均數(shù)。均值的主要缺點(diǎn)時(shí)易受數(shù)據(jù)極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),均值的代表性較差。
35第2節(jié)離散程度的測(cè)度集中趨勢(shì)只是數(shù)據(jù)分布的一個(gè)特征,它所反映的是各變量值向其中心值聚集的程度。而數(shù)據(jù)的分散程度是數(shù)據(jù)分布的另一個(gè)重要特征,它所反映的是各變量值遠(yuǎn)離其中心值的程度,即離中趨勢(shì)。描述數(shù)據(jù)離散程度采用的測(cè)度值,依據(jù)數(shù)據(jù)類型的不同主要有異眾比率、四分位差、方差和標(biāo)準(zhǔn)差、極差、平均差和離散系數(shù)等36一分類數(shù)據(jù):異眾比率(variationratio)
異眾比率:指非眾數(shù)組的頻數(shù)占總頻數(shù)的比率。它的作用是衡量眾數(shù)對(duì)一組數(shù)據(jù)的代表程度。其中,變量值的總頻數(shù),
眾數(shù)組的頻數(shù)37[例3-11]計(jì)算表2-5中數(shù)據(jù),飲料品牌的異眾比率注:異眾比率越大,眾數(shù)的代表性越差;異眾比率越小,眾數(shù)的代表性越好。利用異眾比率還可以比較不同總體或樣本的離散程度38四分位差:上四分位數(shù)與下四分位數(shù)之差,它反映了中間50%數(shù)據(jù)的離散程度。數(shù)值越小,說(shuō)明中間數(shù)據(jù)越集中;數(shù)值越大,說(shuō)明中間數(shù)據(jù)越分散。它不受極值的影響。它還說(shuō)明了中位數(shù)對(duì)一組數(shù)據(jù)的代表程度。二順序數(shù)據(jù):四分位差(quartiledeviation)[例3-12]根據(jù)表2-6中的數(shù)據(jù),計(jì)算顧客評(píng)價(jià)等級(jí)的四分位差39三數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差
(一)極差(range)一組數(shù)據(jù)的最大值與最小值之差。易受極端值的影響,不能反映中間數(shù)據(jù)的分散程度。40(二)平均差(meandeviation)是各變量值與其均值離差絕對(duì)值的平均數(shù)。平均差以均值為中心,反映了每個(gè)數(shù)據(jù)與均值的平均差異程度,它能全面準(zhǔn)確地反映一組數(shù)據(jù)的離散狀況。平均差越大說(shuō)明數(shù)據(jù)的離散程度就越大,反之則說(shuō)明數(shù)據(jù)的離散程度就越小。
未分組數(shù)據(jù)計(jì)算平均差的公式為:
分組數(shù)據(jù)計(jì)算平均差的公式為:
[例3-13]根據(jù)表3-2中的分組數(shù)據(jù),計(jì)算業(yè)務(wù)員月銷售額的平均差。
41(三)方差和標(biāo)準(zhǔn)差(variance)方差:是各變量值于其均值離差平方的平均數(shù),它是測(cè)度數(shù)值型數(shù)據(jù)離散程度的最主要方法。未分組數(shù)據(jù):
分組數(shù)據(jù):
42標(biāo)準(zhǔn)差(standarddeviation)
未分組數(shù)據(jù):
分組數(shù)據(jù):
[例3-14]根據(jù)表3-2中分組數(shù)據(jù),計(jì)算業(yè)務(wù)員月銷售額的標(biāo)準(zhǔn)差。
方差或標(biāo)準(zhǔn)差是根據(jù)全部數(shù)據(jù)計(jì)算的,他反映了每個(gè)數(shù)據(jù)與其平均值相比平均相差的數(shù)值,它能準(zhǔn)確地反映出數(shù)據(jù)的離散程度。43用Excel計(jì)算離散趨勢(shì)值
平均差:“
AVEDEV”總體方差:“VARP”總體標(biāo)準(zhǔn)差:“
STDEVP”44四相對(duì)位置的測(cè)量:標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)
在對(duì)多個(gè)具有不同量綱的變量進(jìn)行處理時(shí),常常需要對(duì)各變量數(shù)值進(jìn)行標(biāo)準(zhǔn)化處理。
[例3-15]根據(jù)例3-4的數(shù)據(jù),計(jì)算每個(gè)家庭人均月收入的標(biāo)準(zhǔn)分?jǐn)?shù)。
45實(shí)際上,z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,他并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為146用Excel標(biāo)準(zhǔn)化STANDARDIZE(標(biāo)準(zhǔn)化數(shù)據(jù))“X”:需要正態(tài)化的數(shù)值;“Mean”:數(shù)據(jù)分布的算術(shù)平均值;“Standard-dev”:數(shù)據(jù)分布的標(biāo)準(zhǔn)差。47(二)經(jīng)驗(yàn)法則
數(shù)據(jù)為對(duì)稱分布時(shí):約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。
約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。48離群點(diǎn)或離群數(shù)據(jù)(outlier):
通常將在3個(gè)標(biāo)準(zhǔn)差之外的數(shù)據(jù)稱為離群點(diǎn)
離群點(diǎn)的產(chǎn)生的原因:·該觀測(cè)值被錯(cuò)誤的測(cè)量,記錄或輸入計(jì)算機(jī)?!ぴ撚^測(cè)值來(lái)自另一個(gè)總體。·該觀測(cè)值是正確的,不過(guò)它代表一個(gè)稀有(偶然)事件。表一個(gè)稀有(偶然)事件。49(三)切比雪夫不等式(Chebyshev’sinequality)
(一般數(shù)據(jù))·至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)?!ぶ辽儆?9%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)?!ぶ辽儆?4%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。
50五相對(duì)離散程度:離散系數(shù)(變異系數(shù))
極差,平均差,方差和標(biāo)準(zhǔn)差等都是反映數(shù)據(jù)分散程度的絕對(duì)值,其數(shù)值的大小一方面取決于原變量值本身水平高低的影響,也就是與變量的均值大小有關(guān)。另一方面,它們與原變量值的計(jì)算單位相同,采用不同計(jì)量單位的變量值,其離散程度的測(cè)度值也就不同。
離散系數(shù)(變異系數(shù)):它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo)。
離散系數(shù)的作用:主要是用于比較不同總體或樣本數(shù)據(jù)的離散程度。離散系數(shù)大,說(shuō)明數(shù)據(jù)的離散程度也就大;離散系數(shù)小,說(shuō)明數(shù)據(jù)的離散程度也小。
51[例3-16]某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表3-8所示。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度。
反映數(shù)據(jù)離散程度的各個(gè)測(cè)度值,適用于各不同類型的數(shù)據(jù)分類數(shù)據(jù):主要用異眾比率順序數(shù)據(jù):主要用四分位差數(shù)值型數(shù)據(jù):主要用方差和標(biāo)準(zhǔn)差不同總體或樣本數(shù)據(jù)的離散程度比較:變異系數(shù)52第3節(jié)偏態(tài)與峰態(tài)的測(cè)度集中趨勢(shì)和離散程度是數(shù)據(jù)分布的兩個(gè)重要特征,但要全面了解數(shù)據(jù)分布的特點(diǎn),我們還需要知道數(shù)據(jù)分布的形狀是否對(duì)稱、偏斜的程度以及分布的扁平程度等。偏態(tài)和峰態(tài)就是對(duì)分布狀態(tài)的測(cè)度。
53一偏態(tài)及其測(cè)度
偏態(tài)(skewness):數(shù)據(jù)分布對(duì)稱性的測(cè)度。
判別偏態(tài)的方向:利用眾數(shù)、中位數(shù)和均值之間的關(guān)系就可以大體上判斷數(shù)據(jù)分布是對(duì)稱、左偏還是右偏。
測(cè)度偏斜的程度則需要計(jì)算偏態(tài)系數(shù)(SK)。
54未分組的原始數(shù)據(jù)計(jì)算偏態(tài)系數(shù)的公式:
若分布是對(duì)稱的,則偏態(tài)系數(shù)等于0;如果偏態(tài)系數(shù)明顯不同于0,表明分布是非對(duì)稱的。
分組數(shù)據(jù)計(jì)算偏態(tài)系數(shù),可采用下面的公式:
55當(dāng)分布對(duì)稱時(shí),離差三次方后正負(fù)離差可以相互抵消,因而
SK的分子等于0,則SK=0;當(dāng)分布不對(duì)稱時(shí),正負(fù)離差不能相互抵消,就形成了正或負(fù)的偏態(tài)系數(shù)SK。
當(dāng)SK為正值時(shí),表示正偏離差值較大,可以判斷為正偏或右偏;當(dāng)SK為負(fù)值時(shí),表示負(fù)偏離差值較大,可判斷為負(fù)偏或左偏。在計(jì)算SK時(shí),將離差三次方的平均數(shù)除以s3是將偏態(tài)系數(shù)轉(zhuǎn)化為相對(duì)數(shù)。SK的數(shù)值越大,表示偏斜的程度就越大。
56[例3—17]根據(jù)表3—2中的分組數(shù)據(jù),計(jì)算業(yè)務(wù)員月銷售額的平均差。
已知
=1.883,s=0.45
57偏態(tài)系數(shù)為正值,但數(shù)值不是很大,說(shuō)明月銷售額的分布為右偏分布,但偏斜程度不是很大。58二
峰態(tài)及其測(cè)度
峰態(tài)(kurtosis):它是對(duì)數(shù)據(jù)分布平峰或尖峰程度的測(cè)度。
如果一組數(shù)據(jù)服從標(biāo)準(zhǔn)正態(tài)分布,則峰態(tài)系數(shù)的值等于0;若峰態(tài)系數(shù)的值明顯不等于0,表明分布比正態(tài)分布更平或更尖,通常稱為平峰分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人主材合同范本
- 醫(yī)院規(guī)范用工合同范本
- 與物業(yè)簽訂廣告合同范本
- 浠水購(gòu)房合同范本
- 銀行居間付款合同范本
- 修建鄉(xiāng)村公路合同范本
- 醫(yī)院日常裝飾維修合同范本
- 協(xié)調(diào)服務(wù)合同范本
- 公房買(mǎi)給個(gè)人合同范本
- 上海吊車租用合同范本
- 2024年江蘇農(nóng)牧科技職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及參考答案
- 患者轉(zhuǎn)運(yùn)意外應(yīng)急預(yù)案
- 大學(xué)生國(guó)防教育教案第四章現(xiàn)代戰(zhàn)爭(zhēng)
- 人教版初中化學(xué)實(shí)驗(yàn)?zāi)夸?總表)
- AS9100航空航天質(zhì)量管理體系-要求培訓(xùn)教材
- 第2課+古代希臘羅馬【中職專用】《世界歷史》(高教版2023基礎(chǔ)模塊)
- Q-GDW 11711-2017 電網(wǎng)運(yùn)行風(fēng)險(xiǎn)預(yù)警管控工作規(guī)范
- 《桃樹(shù)下的小白兔》課件
- 電工儀表與測(cè)量(第六版)中職技工電工類專業(yè)全套教學(xué)課件
- 強(qiáng)調(diào)句(完整版)-高三英語(yǔ)市公開(kāi)課一等獎(jiǎng)省賽課獲獎(jiǎng)?wù)n件
- 2022年4月自考00277行政管理學(xué)試題及答案含解析
評(píng)論
0/150
提交評(píng)論