




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
安徽工程大學(xué)
第4章集中趨勢(shì)和離中趨勢(shì)數(shù)據(jù)集中趨勢(shì)的數(shù)值描述數(shù)據(jù)離散程度的數(shù)值描述數(shù)據(jù)分布的形態(tài)安徽工程大學(xué)
2通過本章的學(xué)習(xí),要求達(dá)到:①明確平均數(shù)和標(biāo)志變異指標(biāo)的概念和作用;②熟練掌握數(shù)值平均數(shù)和標(biāo)準(zhǔn)差的特點(diǎn)及其計(jì)算方法;③了解眾數(shù)、中位數(shù)的概念、特點(diǎn)及其計(jì)算方法;④能正確區(qū)分?jǐn)?shù)值平均數(shù)和位置平均數(shù),了解幾種平均數(shù)之間的關(guān)系;⑤了解計(jì)算平均數(shù)和離中趨勢(shì)指標(biāo)應(yīng)注意的問題。教學(xué)目的安徽工程大學(xué)
3特別關(guān)注:
各基礎(chǔ)概念經(jīng)濟(jì)背景下的含義安徽工程大學(xué)
41.數(shù)據(jù)描述的數(shù)值方法數(shù)據(jù)描述的數(shù)值方法分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰度四分位距極差偏態(tài)安徽工程大學(xué)
54.1集中趨勢(shì)概念常用的集中趨勢(shì)的測(cè)度指標(biāo):算術(shù)平均數(shù)中位數(shù)眾數(shù)集中趨勢(shì):一組數(shù)據(jù)向其中心值靠攏的傾向和程度。集中趨勢(shì)測(cè)度:尋找數(shù)據(jù)水平的代表值或中心值。安徽工程大學(xué)
6
這種“同質(zhì)性”即某標(biāo)志變化過程的均衡狀態(tài);其存在的基本理論根據(jù)即所謂“大數(shù)定律”;其度量方法又可分為二類:位置平均數(shù)與數(shù)值平均數(shù)。安徽工程大學(xué)
7大數(shù)定律1算術(shù)平均數(shù)(均值,ArithmeticMean)總體均值常用表示。樣本均值常用表示。樣本均值的計(jì)算公式:
簡(jiǎn)單平均數(shù):加權(quán)平均數(shù)(分組數(shù)據(jù)):安徽工程大學(xué)
9算術(shù)平均數(shù)(例子)某企業(yè)的工會(huì)隨機(jī)調(diào)查了20名工人2005
年6月加班的小時(shí)數(shù),結(jié)果如下:該組數(shù)據(jù)算術(shù)平均數(shù)等于
(13+18+…+12)/20=11.6(小時(shí))。1318121571551217712109131219671112安徽工程大學(xué)
10加權(quán)算術(shù)平均數(shù)(例子)在前面的例子中,假設(shè)我們只得到了分組后的資料:該組數(shù)據(jù)算術(shù)平均數(shù)等于
245/20=12.25(小時(shí))。分組人數(shù)5-10610-15915-205合計(jì)20分組人數(shù)組中值xf5-1067.54510-15912.5112.515-20517.587.5合計(jì)20-245安徽工程大學(xué)
11關(guān)于計(jì)算結(jié)果的說明根據(jù)原始數(shù)據(jù)和分組資料計(jì)算的結(jié)果一般不會(huì)完全相等,根據(jù)分組數(shù)據(jù)只能得到近似結(jié)果。只有各組數(shù)據(jù)在組內(nèi)呈對(duì)稱或均勻分布時(shí),根據(jù)分組資料的計(jì)算結(jié)果才會(huì)與原始數(shù)據(jù)的計(jì)算結(jié)果一致。安徽工程大學(xué)
12算術(shù)平均數(shù)的性質(zhì)1、 所有的定量數(shù)據(jù)都有算術(shù)平均數(shù)。2、計(jì)算算術(shù)平均數(shù)時(shí)使用了所有數(shù)據(jù)。3、一組數(shù)只有一個(gè)均值。4、各變量值與均值的離差之和等于零。張村有個(gè)張千萬,九個(gè)鄰居窮光蛋;統(tǒng)計(jì)平均算資產(chǎn),個(gè)個(gè)都是張百萬。
缺點(diǎn):易受極端值的影響。嚴(yán)格來說無法根據(jù)有開口組
的分組數(shù)據(jù)計(jì)算算術(shù)平均數(shù)。安徽工程大學(xué)
13調(diào)和平均數(shù)-Harmonicmean概念:各變量倒數(shù)的算術(shù)平均數(shù)的倒數(shù);場(chǎng)合:統(tǒng)計(jì)的數(shù)據(jù)只有每組的變量值和相應(yīng)的標(biāo)志總量;分為簡(jiǎn)單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。安徽工程大學(xué)
14調(diào)和平均數(shù)-Harmonicmean簡(jiǎn)單調(diào)和平均數(shù):安徽工程大學(xué)
15調(diào)和平均數(shù)-Harmonicmean
加權(quán)調(diào)和平均數(shù):安徽工程大學(xué)
16例子時(shí)間單價(jià)所花錢數(shù)購買量早市中市晚市0.50.40.243287.510合計(jì)-925.5安徽工程大學(xué)
17接上例平均價(jià)格如下:安徽工程大學(xué)
18幾何平均數(shù)-Geometricmean概念:n個(gè)變量連乘積的n次方根;用表示;簡(jiǎn)單幾何平均數(shù):加權(quán)幾何平均數(shù):安徽工程大學(xué)
192中位數(shù)(Median)一組數(shù)據(jù)按大小順序排列后,處在數(shù)列中點(diǎn)位置的數(shù)值。特點(diǎn):對(duì)一組數(shù)據(jù)是唯一的。不受極端值的影響。主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)。安徽工程大學(xué)
20根據(jù)原始數(shù)據(jù)計(jì)算中位數(shù)n為奇數(shù)時(shí)等于第(n+1)/2個(gè)數(shù)。n為偶數(shù)時(shí)等于第n/2和n/2+1個(gè)數(shù)的平均值1,2,5,9,11中位數(shù)=51,2,5,9,11,18中位數(shù)=(5+9)/2=7安徽工程大學(xué)
213眾數(shù)(Mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。主要特點(diǎn):不受極端值的影響。有的數(shù)據(jù)無眾數(shù)或有多個(gè)眾數(shù)。對(duì)未分組定量資料很少使用。安徽工程大學(xué)
22眾數(shù)的不惟一性眾數(shù)無眾數(shù)眾數(shù)1眾數(shù)2眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系對(duì)稱分布
均值=中位數(shù)=眾數(shù)分配為鐘形、輕微不對(duì)稱的經(jīng)驗(yàn)公式:左偏分布均值
中位數(shù)
眾數(shù)<<右偏分布眾數(shù)
中位數(shù)均值<<安徽工程大學(xué)
24小結(jié):平均數(shù)、中位數(shù)、眾數(shù)的特點(diǎn)算術(shù)平均數(shù):易受極端值影響(使用了全部數(shù)據(jù))數(shù)學(xué)性質(zhì)優(yōu)良,主要用于數(shù)值型數(shù)據(jù)數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用中位數(shù):不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用;主要用于順序數(shù)據(jù)眾數(shù):不受極端值影響不具有惟一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用;主要用于分類數(shù)據(jù)安徽工程大學(xué)
254分位數(shù)(Quantile)把順序排列的一組數(shù)據(jù)分割為若干相等部分的分割點(diǎn)的數(shù)值。分位數(shù)可以反映數(shù)據(jù)分布的相對(duì)位置(而不單單是中心位置)。常用的有四分位數(shù)、十分位數(shù)、百分位數(shù)。四分位數(shù)(Quartile):Q1Q2Q3
十分位數(shù)(Decile):D1D2………D9百分位數(shù)(percentile):
P1P2…………P99安徽工程大學(xué)
26四分位數(shù)(Quartile)數(shù)據(jù)按大小順序排序后把分割成四等分的三個(gè)分割點(diǎn)上的數(shù)值。在實(shí)際應(yīng)用中四分位數(shù)的計(jì)算方法并不統(tǒng)一(數(shù)據(jù)量大時(shí)這些方法差別不大)。對(duì)原始數(shù)據(jù):SPSS中四分位數(shù)的位置為(n+1)/4,2(n+1)/4,3(n+1)/4。Excel中四分位數(shù)的位置分別為(n+3)/4,2(n+1)/4,(3n+1)/4。如果四分位數(shù)的位置不是整數(shù),則四分位數(shù)等于前后兩個(gè)數(shù)的加權(quán)平均。四分位數(shù)計(jì)算(例子)排序后的數(shù)據(jù):2,5,6,7,8,9,10,12,15,16不能整除時(shí)需加權(quán)平均:
位置22.753
數(shù)值560.75×(6-5)=0.75安徽工程大學(xué)
282.
數(shù)據(jù)描述的數(shù)值方法數(shù)據(jù)描述的數(shù)值方法分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰度四分位距極差偏態(tài)3.2.13.2.23.2.3安徽工程大學(xué)
294.2離散程度反映各變量值遠(yuǎn)離其中心值的程度(離散
程度),從另一個(gè)側(cè)面說明了集中趨勢(shì)測(cè)
度值的代表程度。不同類型的數(shù)據(jù)有不同的
離散程度測(cè)度指標(biāo)。常用指標(biāo):全距(極差)四分位距方差和標(biāo)準(zhǔn)差離散系數(shù)安徽工程大學(xué)
301全距(Range)全距也稱極差,是一組數(shù)據(jù)的最大值與最
小值之差。R=最大值-最小值組距分組數(shù)據(jù)可根據(jù)最高組上限-最低組下限計(jì)算。受極端值的影響。全距=?2,5,6,7,8,9,10,12,15,16,20安徽工程大學(xué)
31等于上四分位數(shù)與下四分位數(shù)之差反映了中間50%數(shù)據(jù)的離散程度,數(shù)值越小說明中間的數(shù)據(jù)越集中。不受極端值的影響??梢杂糜诤饬恐形粩?shù)的代表性。
2四分位差(Quartiledeviation)2,5,6,7,8,9,10,12,15,16,20Q1=6,Q2=9,Q3=15安徽工程大學(xué)
323平均差(meandeviation)概念:各變量與其平均數(shù)的絕對(duì)值的平均數(shù),用MD表示;簡(jiǎn)單式:加權(quán)式:安徽工程大學(xué)
33方差是一組數(shù)據(jù)中各數(shù)值與其算術(shù)平均數(shù)離差平方的平均數(shù),標(biāo)準(zhǔn)差是方差正的平方根??傮w方差和樣本方差的符號(hào)不同,計(jì)算公式也不一樣。是反映定量數(shù)據(jù)離散程度的最常用的指標(biāo)。方差和標(biāo)準(zhǔn)差
(varianceandstandarddeviation)安徽工程大學(xué)
34方差的計(jì)算公式總體方差樣本方差未分組
數(shù)據(jù)分組數(shù)據(jù)樣本方差用(n-1)去除,從數(shù)學(xué)角度看是因?yàn)樗强傮w方差σ2的無偏估計(jì)量。安徽工程大學(xué)
35標(biāo)準(zhǔn)差(例子)某工會(huì)隨機(jī)調(diào)查了5名工人上月的加班時(shí)間如下表,平均加班時(shí)間為13小時(shí)。計(jì)算數(shù)據(jù)的標(biāo)準(zhǔn)差。加班小時(shí)數(shù)絕對(duì)離差離差平方130018525121115247636合計(jì)1466加班小時(shí)數(shù)131812157安徽工程大學(xué)
364離散系數(shù)(CoefficientofVariation)標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,表示為百分?jǐn)?shù)。特點(diǎn):反映了相對(duì)于均值的相對(duì)離散程度;可用于比較計(jì)量單位不同的數(shù)據(jù)的離散程度;計(jì)量單位相同時(shí),如果兩組數(shù)據(jù)的均值相差懸殊,離散系數(shù)可能比標(biāo)準(zhǔn)差等絕對(duì)指標(biāo)更有意義。安徽工程大學(xué)
37離散系數(shù):例子對(duì)30名經(jīng)理人員的調(diào)查表明年平均收入=$500,000,標(biāo)準(zhǔn)差=$50,000。對(duì)30名工人的調(diào)查表明平均收入=$32,000,標(biāo)準(zhǔn)差=$5,000。離散系數(shù):經(jīng)理人員:工人:雖然經(jīng)理人員收入的絕對(duì)離散程度遠(yuǎn)遠(yuǎn)大于工人,但經(jīng)理人員收入的相對(duì)離散程度小于工人。安徽工程大學(xué)
38總方差、組內(nèi)方差和組間方差原則:對(duì)于收集的數(shù)據(jù),分成k組第i組的平均數(shù)記為總平均數(shù)記為安徽工程大學(xué)
39總方差、組內(nèi)方差和組間方差組內(nèi)方差:各組組內(nèi)方差的平均值:組間方差:
安徽工程大學(xué)
403.
數(shù)據(jù)分布形狀的描述數(shù)據(jù)描述的數(shù)值方法分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰度四分位距極差偏態(tài)3.2.13.2.23.2.3安徽工程大學(xué)
41偏態(tài)和峰度的類型偏態(tài)左偏分布右偏分布正態(tài)分布扁平分布峰態(tài)尖峰分布安徽工程大學(xué)
421原點(diǎn)矩和中心矩K階原點(diǎn)矩:K階中心矩:安徽工程大學(xué)
432偏態(tài)及其測(cè)定(Skewness)
數(shù)據(jù)分布的不對(duì)稱性稱作偏態(tài)。偏態(tài)系數(shù)就是對(duì)數(shù)據(jù)分布的不對(duì)稱性(即偏斜程度)的測(cè)度。
安徽工程大學(xué)
44偏態(tài)及其測(cè)定(Skewness)偏態(tài)系數(shù)為三階中心矩和標(biāo)準(zhǔn)差的三次方比:偏態(tài)系數(shù)有多種計(jì)算方法,在統(tǒng)計(jì)軟件中(如Excel等)通常采用以下公式:安徽工程大學(xué)
45偏態(tài)系數(shù)的含義左偏分布(也稱負(fù)偏分布):偏態(tài)系數(shù)<0;偏態(tài)系數(shù)的絕對(duì)值越大,偏斜越嚴(yán)重?cái)?shù)據(jù)向左邊延伸得更多右偏分布(也稱正偏分布):偏態(tài)系數(shù)>0;偏態(tài)系數(shù)的絕對(duì)值越大,偏斜越嚴(yán)重。數(shù)據(jù)向右邊延伸得更多對(duì)稱分布:偏態(tài)系數(shù)=0。
安徽工程大學(xué)
463峰度及峰度系數(shù)(Kurtosis)峰度:數(shù)據(jù)分布的扁平或尖峰程度。峰度系數(shù):數(shù)據(jù)分布峰度的度量值,對(duì)數(shù)據(jù)分布尖峰或扁平程度的測(cè)度,一般用K表示。統(tǒng)計(jì)軟件(如Excel等)中常用以下公式計(jì)算:安徽工程大學(xué)
47峰度系數(shù)(Kurtosis)為四階中心矩和標(biāo)準(zhǔn)差的四次方比與3的差統(tǒng)計(jì)軟件(如Excel等)中常用以下公式計(jì)算:安徽工程大學(xué)
48峰度系數(shù)的含義扁平分布尖峰分布峰度系數(shù)K<0,與正態(tài)分布相比該分布一般為扁平、瘦尾,肩部較胖。峰度系數(shù)K>0,與正態(tài)分布相比該分布一般為尖峰、肥尾,肩部較瘦。均值和方差相同的正態(tài)分布安徽工程大學(xué)
493、箱線圖(BoxPlot)用于描述數(shù)據(jù)分布特征的一種圖形。最簡(jiǎn)單的箱線圖可以根據(jù)數(shù)據(jù)的最大值、最小值和三個(gè)四分位數(shù)繪制的:先根據(jù)三個(gè)四分位數(shù)Q1、Q2、Q3畫出中間的盒子,然后由盒子兩端分別向最大、最小值連線。在SPSS中標(biāo)準(zhǔn)的箱線圖一般是這樣繪制的:先根據(jù)三個(gè)四分位數(shù)Q1、Q2、Q3畫出中間的盒子;由Q3至Q3+1.5*IQR區(qū)間內(nèi)的最大值向盒子的頂端連線,由Q1至Q1-1.5*IQR區(qū)間內(nèi)的最小值向盒子的底部連線;處于Q3+1.5*IQR至Q3+3*IQR或者Q1-1.5*IQR至Q1-3*IQR范圍內(nèi)的數(shù)據(jù)用圓圈標(biāo)出;大于Q3+3*IQR或者小于Q1-3*IQR的用星號(hào)標(biāo)出。安徽工程大學(xué)
50數(shù)據(jù):2,5,6,7,8,9,10,12,15,20,35箱線圖Q1Q2Q3IQR=91.5*IQR=13.51.5*IQR=13.5離群點(diǎn)安徽工程大學(xué)
51分布的形狀與箱線圖
對(duì)稱分布Q1中位數(shù)
Q3左偏分布Q1中位數(shù)
Q3右偏分布Q1
中位數(shù)
Q3安
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版九年級(jí)歷史與社會(huì)上冊(cè)教學(xué)設(shè)計(jì):第二單元 第五課 開辟革命新道路的艱難歷程 (3份打包)001
- 四年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)及答案
- 初中語文-第三單元《核舟記》教學(xué)設(shè)計(jì)-2024-2025學(xué)年統(tǒng)編版語文八年級(jí)下冊(cè)
- 養(yǎng)殖基地流轉(zhuǎn)合同范例
- 個(gè)人轉(zhuǎn)讓店面合同范例
- 中日本采購合同范本
- iso咨詢合同范例
- 公司運(yùn)輸承包經(jīng)營合同范本
- 大學(xué)生寒假社會(huì)實(shí)踐活動(dòng)總結(jié)
- 三合伙人協(xié)議合同范例
- 臨床試驗(yàn)入組經(jīng)驗(yàn)分享
- 第01課 身邊的算法 課件
- 中國養(yǎng)老產(chǎn)業(yè)發(fā)展報(bào)告
- 機(jī)器人操作系統(tǒng)(ROS)課件 10 ROS 機(jī)器人仿真實(shí)驗(yàn)
- 【MOOC】中國傳統(tǒng)藝術(shù)-篆刻、書法、水墨畫體驗(yàn)與欣賞-哈爾濱工業(yè)大學(xué) 中國大學(xué)慕課MOOC答案
- 寧德新能源verify測(cè)試題庫
- 中國兒童呼吸道合胞病毒感染診療及預(yù)防指南(2024)解讀
- 本科畢業(yè)生登記表自我鑒定范文(8篇)
- 腦梗塞的急救護(hù)理
- 二零二四年度幼兒園學(xué)生午餐配送合同
- 讀后續(xù)寫+摯友離別:不舍與成長交織的瞬間+講義 高一上學(xué)期期中聯(lián)考英語試題
評(píng)論
0/150
提交評(píng)論