版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章統(tǒng)計(jì)數(shù)據(jù)的描述2.1統(tǒng)計(jì)數(shù)據(jù)的整理2.2分布集中趨勢(shì)的測(cè)度2.3分布離散程度的測(cè)度2.4分布偏態(tài)與峰態(tài)的測(cè)度2.5統(tǒng)計(jì)表與統(tǒng)計(jì)圖學(xué)習(xí)目標(biāo)了解數(shù)據(jù)的計(jì)量尺度了解統(tǒng)計(jì)數(shù)據(jù)的來(lái)源和數(shù)據(jù)的質(zhì)量要求掌握數(shù)值型數(shù)據(jù)的整理與顯示方法掌握數(shù)據(jù)集中趨勢(shì)和離散程度的測(cè)度方法掌握莖葉圖和箱線圖的制作方法掌握分布集中趨勢(shì)的測(cè)度方法掌握分布離散程度的測(cè)度方法2.1統(tǒng)計(jì)數(shù)據(jù)的整理一、統(tǒng)計(jì)數(shù)據(jù)的分組
二、次數(shù)分配三、次數(shù)分配直方圖四、洛倫茨曲線統(tǒng)計(jì)數(shù)據(jù)的分組組距分組
(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組
(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即
組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表組距分組
(幾個(gè)概念)1.下限(lowlimit)
:一個(gè)組的最小值2.上限(upperlimit)
:一個(gè)組的最大值3.組距(classwidth)
:上限與下限之差4.組中值(classmidpoint)
:下限與上限之間的中點(diǎn)值下限值+上限值2組中值=次數(shù)分配表的編制
(例題分析)【例】某車(chē)間30名工人每周加工某種零件件數(shù)如下表試對(duì)數(shù)據(jù)進(jìn)行分組。
次數(shù)分配表次數(shù)分配直方圖直方圖
(histogram)用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1分組數(shù)據(jù)的圖示
(直方圖的繪制)某車(chē)間工人周加工零件直方圖
折線圖
(frequencypolygon)折線圖也稱(chēng)頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示
(折線圖的繪制)折線圖與直方圖下的面積相等!某車(chē)間工人周加工零件折線圖
洛倫茨曲線洛倫茨曲線本世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨(M.E.Lorentz)根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特(V.Pareto)提出的收入分配公式繪制成描述收入和財(cái)富分配性質(zhì)的曲線分析該國(guó)家或地區(qū)分配的平均程度
AB累積的人口百分比累積的收入百分比絕對(duì)公平線基尼系數(shù)20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G.Gini)根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標(biāo)
A表示實(shí)際收入曲線與絕對(duì)平均線之間的面積B表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積如果A=0,則基尼系數(shù)=0,表示收入絕對(duì)平均如果B=0,則基尼系數(shù)=1,表示收入絕對(duì)不平均基尼系數(shù)在0和1之間取值一般認(rèn)為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當(dāng)?shù)?,即一個(gè)社會(huì)既有效率又沒(méi)有造成極大的分配不公;基尼系數(shù)在0.4被認(rèn)為是收入分配不公平的警戒線,超過(guò)了0.4應(yīng)該采取措施縮小這一差距。AB2.2分布集中趨勢(shì)的測(cè)度一、眾數(shù)二、中位數(shù)三、分位數(shù)四、均值五、幾何平均數(shù)六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較眾數(shù)眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類(lèi)數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)中位數(shù)中位數(shù)
(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類(lèi)數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即中位數(shù)
(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):數(shù)值型數(shù)據(jù)的中位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排
序:7507808509601080
1250150016302000位置:123456789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)
(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排
序:
660
75078085096010801250150016302000位置:1234
5678910四分位數(shù)四分位數(shù)
(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類(lèi)數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)
(位置的確定)原始數(shù)據(jù):分組數(shù)據(jù):數(shù)值型數(shù)據(jù)的四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排
序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)
(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排
序:
660
75078085096010801250150016302000位置:1234
5678910均值均值
(mean)集中趨勢(shì)的最常用測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)簡(jiǎn)單平均數(shù)
(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體平均數(shù)樣本平均數(shù)加權(quán)平均數(shù)
(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn相應(yīng)的頻數(shù)為:f1,f2,…,fk總體平均數(shù)樣本平均數(shù)加權(quán)平均數(shù)
(例題分析)
平均數(shù)
(數(shù)學(xué)性質(zhì))1. 各變量值與平均數(shù)的離差之和等于零
2.各變量值與平均數(shù)的離差平方和最小幾何平均數(shù)幾何平均數(shù)
(geometricmean)
n個(gè)變量值乘積的
n次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率計(jì)算公式為5.可看作是平均數(shù)的一種變形幾何平均數(shù)
(例題分析)
【例】一位投資者購(gòu)持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:
幾何平均:切尾均值切尾均值
(trimmedMean)
去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為n
表示觀察值的個(gè)數(shù);α表示切尾系數(shù),
切尾均值
(例題分析)
【例】謀次比賽共有11名評(píng)委,對(duì)某位歌手的給分分別是:經(jīng)整理得到順序統(tǒng)計(jì)量值為去掉一個(gè)最高分和一個(gè)最低分,取1/11
眾數(shù)、中位數(shù)和平均數(shù)的比較眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱(chēng)分布或接近對(duì)稱(chēng)分布時(shí)應(yīng)用2.3分布離散程度的測(cè)度一、極差二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)極差
(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布
R
=max(xi)-min(xi)計(jì)算公式為內(nèi)距
(Inter-QuartileRange,IQR)
也稱(chēng)四分位差上四分位數(shù)與下四分位數(shù)之差
內(nèi)距=Q3
–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差
(VarianceandStandarddeviation)1. 離散程度的測(cè)度值之一2. 最常用的測(cè)度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱(chēng)為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱(chēng)為樣本方差或標(biāo)準(zhǔn)差4681012x=8.3總體方差和標(biāo)準(zhǔn)差
(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差
自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為
n
時(shí),若樣本均值x
確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則
x
=5。當(dāng)
x
=5
確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋?zhuān)瑥膶?shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差σ2時(shí),它是σ2的無(wú)偏估計(jì)量離散系數(shù)離散系數(shù)
(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對(duì)不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷(xiāo)售數(shù)據(jù)企業(yè)編號(hào)產(chǎn)品銷(xiāo)售額(萬(wàn)元)x1銷(xiāo)售利潤(rùn)(萬(wàn)元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷(xiāo)售數(shù)據(jù)如表。試比較產(chǎn)品銷(xiāo)售額與銷(xiāo)售利潤(rùn)的離散程度離散系數(shù)
(例題分析)結(jié)論:計(jì)算結(jié)果表明,v1<v2,說(shuō)明產(chǎn)品銷(xiāo)售額的離散程度小于銷(xiāo)售利潤(rùn)的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.7102.4分布偏態(tài)與峰態(tài)的測(cè)度一、偏態(tài)及其測(cè)度二、峰態(tài)及其測(cè)度偏態(tài)
(skewness)統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出數(shù)據(jù)分布偏斜程度的測(cè)度2. 偏態(tài)系數(shù)=0為對(duì)稱(chēng)分布3. 偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)大于1或小于-1,被稱(chēng)為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-0.5~-1之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低偏態(tài)系數(shù)
(coefficientofskewness)根據(jù)分組數(shù)據(jù)計(jì)算峰態(tài)峰態(tài)
(kurtosis)統(tǒng)計(jì)學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測(cè)度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布峰態(tài)系數(shù)
(coefficientofkurtosis)根據(jù)分組數(shù)據(jù)計(jì)算2.5統(tǒng)計(jì)表與統(tǒng)計(jì)圖一、統(tǒng)計(jì)表二、統(tǒng)計(jì)圖要合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W要求數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對(duì)于沒(méi)有數(shù)字的表格單元,一般用“—”表示必要時(shí)可在表的下方加上注釋統(tǒng)計(jì)表的設(shè)計(jì)莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉樹(shù)葉上只保留一位數(shù)字莖葉圖類(lèi)似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息莖葉圖
(例題分析)莖葉圖
(擴(kuò)展的莖葉圖)統(tǒng)計(jì)圖箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接
箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線圖箱線圖
(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)10980859095100105110150120125130周加工零件數(shù)的箱
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年食品原料供貨合同8篇
- 專(zhuān)項(xiàng)運(yùn)營(yíng)維護(hù)服務(wù)協(xié)議范本一
- 福建省南平市武夷山第三中學(xué)高二地理聯(lián)考試題含解析
- 福建省南平市吳屯中學(xué)2020-2021學(xué)年高三英語(yǔ)上學(xué)期期末試卷含解析
- 2024年編:林業(yè)產(chǎn)品購(gòu)銷(xiāo)協(xié)議
- 勞動(dòng)節(jié)銷(xiāo)售提升策略
- 精準(zhǔn)廣告的未來(lái)展望
- 境外成團(tuán)合同(2篇)
- 大學(xué)生創(chuàng)業(yè)競(jìng)賽贊助合同(2篇)
- 2024消防工程消防通道施工組織設(shè)計(jì)服務(wù)合同2篇
- 汽車(chē)保險(xiǎn)與理賠課件 7.3新能源汽車(chē)定損
- 全套教學(xué)課件《工程倫理學(xué)》
- 當(dāng)代青年信仰研究報(bào)告
- 婦科術(shù)后病人飲食護(hù)理
- 腦梗塞后遺癥護(hù)理查房
- 2024至2030年中國(guó)豬肉脯行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及潛力分析研究報(bào)告
- 安裝空調(diào)勞務(wù)合同協(xié)議書(shū)
- 中國(guó)普通食物營(yíng)養(yǎng)成分表(修正版)
- 大學(xué)介紹清華大學(xué)宣傳
- 高速動(dòng)車(chē)組轉(zhuǎn)向架關(guān)鍵結(jié)構(gòu)設(shè)計(jì)及分析
- 2024年導(dǎo)游服務(wù)技能大賽《導(dǎo)游綜合知識(shí)測(cè)試》題庫(kù)及答案
評(píng)論
0/150
提交評(píng)論