第四章 數(shù)據分布特征的測度_第1頁
第四章 數(shù)據分布特征的測度_第2頁
第四章 數(shù)據分布特征的測度_第3頁
第四章 數(shù)據分布特征的測度_第4頁
第四章 數(shù)據分布特征的測度_第5頁
已閱讀5頁,還剩144頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章數(shù)據分布特征的測度第一頁,共一百四十九頁,編輯于2023年,星期五第4章數(shù)據的概括性度量4.1

總規(guī)模度量4.2比較度量

4.3集中趨勢的度量4.4離散程度的度量4.5偏態(tài)與峰態(tài)的度量第二頁,共一百四十九頁,編輯于2023年,星期五學習目標總量指標的種類相對指標的種類及計算方法集中趨勢各測度值的計算方法集中趨勢各測度值的特點及應用場合離散程度各測度值的計算方法離散程度各測度值的特點及應用場合偏態(tài)與峰態(tài)的測度方法用Excel計算描述統(tǒng)計量并進行分析 第三頁,共一百四十九頁,編輯于2023年,星期五一、總量指標概述二、總量指標的種類4.1總規(guī)模度量第四頁,共一百四十九頁,編輯于2023年,星期五一、總量指標概念總量指標:是反映社會經濟現(xiàn)象在一定時間、地點條件下總規(guī)?;蚩偹降慕y(tǒng)計指標。通常用絕對數(shù)來表現(xiàn)的,也稱為絕對指標或絕對數(shù)。

如:2008年我國年末人口數(shù)為132802萬人、國內生產總值(GDP)300670億元、財政收入61330億元、糧食產量52871萬噸第五頁,共一百四十九頁,編輯于2023年,星期五二、總量指標的種類

1、按反映的內容不同,可分為:總體單位總量:表示一個總體中所包含的總體單位總數(shù),表示總體本身的規(guī)模大小??傮w標志總量:反映統(tǒng)計總體中各單位某一數(shù)量標志值的總和,表示總體某一數(shù)量特征的總量。例如:研究某市工業(yè)企業(yè)的經營情況,工業(yè)企業(yè)總數(shù)是總體的單位總量,工業(yè)企業(yè)實現(xiàn)的銷售額、利稅總額、職工人數(shù)等是統(tǒng)計總體的標志總量。

第六頁,共一百四十九頁,編輯于2023年,星期五總量指標的種類2、按反映的時間狀態(tài)不同,分為時期指標:說明總體在一段時間內累積的總量例如:銷售收入、利潤、生產量、工資總額時點指標:說明總體在某一時刻的數(shù)量狀態(tài)例如:職工人數(shù)、設備臺數(shù)、庫存量、固定資產余額、儲蓄存款余額等。第七頁,共一百四十九頁,編輯于2023年,星期五總量指標的種類時期指標和時點指標的區(qū)別:⑴時期指標的數(shù)值是連續(xù)計數(shù)的,時點指標的數(shù)值是間斷計數(shù)的。⑵時期指標具有可加性,時點指標不能直接累加。⑶時期指標數(shù)值的大小與時間長短有直接關系,時間越長,數(shù)值越大;時點指標數(shù)值的大小與時間長短沒有直接關系。第八頁,共一百四十九頁,編輯于2023年,星期五總量指標的種類3、按采用的計量單位不同,分為(1)實物指標:以實物單位計量的總量指標。自然單位:按照被研究現(xiàn)象的自然狀態(tài)計量的單位。如:輛度量衡單位:根據國內或國際上通行的度量衡制度對現(xiàn)象進行計量的單位。例如:千克或噸、米標準實物單位:按照統(tǒng)一的折算標準來度量被研究現(xiàn)象數(shù)量的一種計量單位。如:標準煤復合單位:將兩種計量單位結合在一起對研究現(xiàn)象進行計量的單位。如:噸公里雙重或多重單位:同時采用兩種或兩種以上計量單位對被研究現(xiàn)象進行計量的單位。如:臺/千瓦、艘/馬力/噸位

第九頁,共一百四十九頁,編輯于2023年,星期五總量指標的種類(2)價值指標:以貨幣為單位來計量的總量指標。如:國內生產總值、銷售收入、產品成本等。(3)勞動指標:以勞動單位為計量單位的總量指標。如:“工時”、“工日”等第十頁,共一百四十九頁,編輯于2023年,星期五4.2比較度量一、相對指標概述二、相對指標的種類及計算方法第十一頁,共一百四十九頁,編輯于2023年,星期五一、相對指標概述“對比乃統(tǒng)計方法之母”(一)概念相對指標:又稱相對數(shù),是兩個有聯(lián)系的指標的比值,用以說明兩個相互聯(lián)系的社會經濟現(xiàn)象之間的數(shù)量對比關系和聯(lián)系程度。如:2008年國內生產總值同比增長16.9%,人口自然增長率為5.08‰,居民消費價格指數(shù)105.9%,城鎮(zhèn)居民人均可支配收入15781元,城鎮(zhèn)居民家庭恩格爾系數(shù)為37.9%等

第十二頁,共一百四十九頁,編輯于2023年,星期五一、相對指標概述(二)相對指標的表現(xiàn)形式:1、有名數(shù)(復合單位)如:人/平方公里、元/人、元/件2、無名數(shù)系數(shù)和倍數(shù)、成數(shù)、百分數(shù)、千分數(shù)、翻番數(shù)第十三頁,共一百四十九頁,編輯于2023年,星期五二、相對指標種類及計算方法(一)計劃完成相對數(shù)也稱計劃完成百分比,表明某一現(xiàn)象在一定時間計劃的完成程度,用來檢查、監(jiān)督計劃的執(zhí)行情況,通常用百分數(shù)表示。基本計算公式為:

第十四頁,共一百四十九頁,編輯于2023年,星期五二、相對指標種類及計算方法1、計劃數(shù)是絕對數(shù)水平法:適用于反映生產能力的經濟指標計劃完成情況檢查。如鋼產量、煤產量、發(fā)電量等例如:某鋼鐵公司計劃十一五末達到年產1000萬噸的能力,實際達到1100萬噸,計劃完成相對數(shù)?第十五頁,共一百四十九頁,編輯于2023年,星期五二、相對指標種類及計算方法累計法:以計劃期內各年計劃數(shù)量的累計總和為對象考核。如基本建設投資額、造林面積、住宅建設、開墾荒地等計劃完成情況。例如:某地區(qū)十一五計劃開墾荒地1000公頃,到第五年實際累計開墾960公頃,計劃完成相對數(shù)?第十六頁,共一百四十九頁,編輯于2023年,星期五(一)計劃完成相對數(shù)⑵計劃數(shù)是相對數(shù)例:某企業(yè)產量計劃增長10%,該產品的單位成本計劃下降5%,而實際產量增長15%,實際單位成本下降3%,則產量和單位成本的計劃完成程度指標為:第十七頁,共一百四十九頁,編輯于2023年,星期五(一)計劃完成相對數(shù)例:某企業(yè)計劃要求勞動生產率達到5000元/人,某種產品的計劃單位成本為100元,該企業(yè)實際勞動生產率達到6000元/人,實際單位成本為80元,則計劃完成程度指標為勞動生產率完成相對數(shù)=6000/5000×100%=120%單位成本計劃完成相對數(shù)=80/100×100%=80%正指標:產量、利稅、銷售額等,計劃指標按最低限額規(guī)定。逆指標:單位成本、原材料消耗等,計劃指標按最高限額規(guī)定⑶計劃數(shù)是平均數(shù)第十八頁,共一百四十九頁,編輯于2023年,星期五(二)結構相對數(shù)結構相對數(shù):也稱比重相對數(shù),反映總體構成情況。一般用百分數(shù)或系數(shù)(成數(shù))表示。注意:各組成部分比重之和=1或100%如:年齡構成、性別構成、文化程度構成、國內生產總值構成等。第十九頁,共一百四十九頁,編輯于2023年,星期五恩格爾系數(shù)聯(lián)合國有關組織對恩格爾系數(shù)的評價標準:60%以上貧困;50%-60%為溫飽;40%-50%為小康;30%-40%為富裕;30%以下為最富裕中國城鄉(xiāng)居民恩格爾系數(shù):2001年:城鎮(zhèn)38.2;農村47.7;2002年:城鎮(zhèn)37.7;農村46.2;2003年:城鎮(zhèn)37.1;農村45.6;2004年:城鎮(zhèn)37.7;農村47.2;2005年:城鎮(zhèn)36.7;農村45.5;2006年:城鎮(zhèn)35.8;農村43.0;2007年:城鎮(zhèn)36.3;農村43.1;2008年:城鎮(zhèn)37.9;農村43.7第二十頁,共一百四十九頁,編輯于2023年,星期五結構相對數(shù)

我國國內生產總值構成情況表(%)

第二十一頁,共一百四十九頁,編輯于2023年,星期五(三)比例相對數(shù)比例相對數(shù):表明總體內各組成部分之間的對比關系。常用系數(shù)或倍數(shù)表示。公式為:注意:分子、分母可以互換2008年我國人口男女性別比106:1002008年三大產業(yè)人數(shù)比為40:27:332000年三大產業(yè)人數(shù)比為50:23:271990年三大產業(yè)人數(shù)比為60:21:191980年三大產業(yè)人數(shù)比為69:18:13第二十二頁,共一百四十九頁,編輯于2023年,星期五(四)比較相對數(shù)比較相對數(shù):反映同一時期的同類現(xiàn)象在不同地區(qū)、部門和單位之間數(shù)量對比關系的相對指標

。用倍數(shù)、百分數(shù)表示。注意:分子、分母可以互換,指標涵義、口徑、計算方法必須一致。例如:2008年我國城鎮(zhèn)居民消費水平為13526元,農村居民消費水平為3756元。則:城鎮(zhèn)居民消費水平是農村居民的

3.6倍。第二十三頁,共一百四十九頁,編輯于2023年,星期五(五)強度相對數(shù)強度相對數(shù):兩個性質不同但又互相聯(lián)系的總量指標對比的比值,反映現(xiàn)象的強度、密度或普遍程度。一般用復名數(shù)或百分數(shù)、千分數(shù)表示。如:人均糧食產量“千克/人”、資金周轉率“次”、流動比率%、人口出生率‰、人口自然增長率‰注意:大多數(shù)用復名數(shù)為單位的強度相對指標,分子、分母可互換位置,因而有正指標和逆指標兩種形式。第二十四頁,共一百四十九頁,編輯于2023年,星期五(五)強度相對數(shù)例1:2008年我國人口132802萬人,則人口密度=132802/960≈138人/平方公里例2:某地區(qū)2007年總人口為1200萬人,有60000個零售商業(yè)機構,則該地區(qū)零售網點密度指標為:正指標:該地區(qū)零售網點密度=60000/1200=50(個/萬人)逆指標:該地區(qū)零售網點密度=1200/60000=200(人/個)第二十五頁,共一百四十九頁,編輯于2023年,星期五(六)動態(tài)相對數(shù)動態(tài)相對數(shù)又稱發(fā)展速度,是同一現(xiàn)象在不同時間上的指標數(shù)值的比值

,說明某一總體發(fā)展變化的方向和程度。一般用百分數(shù)表示,或倍數(shù),翻番。例:2008年我國糧食產量為52871萬噸,2007年為50160萬噸,則:動態(tài)相對數(shù)=52871

/50160×100%=105.4%2008年我國糧食產量比上年增長5.4%。第二十六頁,共一百四十九頁,編輯于2023年,星期五三、運用相對指標應遵循的原則⑴可比性原則。遵從可比性是進行對比應把握的總原則。⑵正確選擇對比基數(shù)的原則。同一現(xiàn)象、問題采用不同的對比基數(shù)會有不同的結果。⑶多種相對指標結合運用的原則。多角度、多側面運用多種相對數(shù)和相關指標比較。⑷相對指標與總量指標結合運用的原則。相對數(shù)相同,基數(shù)不同,絕對差很懸殊第二十七頁,共一百四十九頁,編輯于2023年,星期五4.3集中趨勢的度量一、位置平均數(shù)二、數(shù)值平均數(shù)三、各種平均數(shù)之間的關系第二十八頁,共一百四十九頁,編輯于2023年,星期五集中趨勢

(centraltendency)一組數(shù)據向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據水平的代表值或中心值第二十九頁,共一百四十九頁,編輯于2023年,星期五一、眾數(shù)和中位數(shù)第三十頁,共一百四十九頁,編輯于2023年,星期五(一)眾數(shù)

(mode)一組數(shù)據中出現(xiàn)次數(shù)最多的變量值不受極端值的影響適合于數(shù)據量較多時使用可能沒有眾數(shù)或有幾個眾數(shù)mo第三十一頁,共一百四十九頁,編輯于2023年,星期五眾數(shù)

(不唯一性)無眾數(shù)

原始數(shù)據:10591268一個眾數(shù)

原始數(shù)據:6598

55多于一個眾數(shù)

原始數(shù)據:25

2828

36

4242第三十二頁,共一百四十九頁,編輯于2023年,星期五分類數(shù)據的眾數(shù)

(例題分析)例4-1不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值在所調查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即

Mo=可口可樂第三十三頁,共一百四十九頁,編輯于2023年,星期五數(shù)值型數(shù)據的眾數(shù)

(例題分析)【例4-2】在某城市中隨機抽取9個家庭,調查得到每個家庭的人均月收入數(shù)據如下(單位:元)。要求計算人均月收入的眾數(shù)。原始數(shù)據:

108075010801080850960200012501630

Mo=1080Excel統(tǒng)計函數(shù)—MODE第三十四頁,共一百四十九頁,編輯于2023年,星期五數(shù)值型分組數(shù)據的眾數(shù)

(要點及計算公式)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關4.

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內均勻分布2.

相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)3.

相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMof-1f+1f-1f+1Mof第三十五頁,共一百四十九頁,編輯于2023年,星期五數(shù)值型分組數(shù)據的眾數(shù)

(算例)例4-3某電腦公司銷售量數(shù)據分組表按銷售量分組(臺)頻數(shù)(天)累積頻數(shù)150以下150~160160~170170~180180~190190~200200~210210~220220~230230以上49162720171084541329567693103111115120合計120—根據某電腦公司120天銷售量的分組數(shù)據計算眾數(shù)Internet第三十六頁,共一百四十九頁,編輯于2023年,星期五(二)中位數(shù)

(median)一組數(shù)據排序后,處于中間位置上的變量值Me50%50%2.不受極端值的影響第三十七頁,共一百四十九頁,編輯于2023年,星期五中位數(shù)

(位置的確定)分組數(shù)據原始數(shù)據第三十八頁,共一百四十九頁,編輯于2023年,星期五未分組數(shù)據的中位數(shù)

(計算公式)第三十九頁,共一百四十九頁,編輯于2023年,星期五未分組數(shù)據的中位數(shù)

(9個數(shù)據的算例)【例4-4】

9個家庭的人均月收入數(shù)據原始數(shù)據:15007507801080850960200012501630排序:75078085096010801250150016302000位置:

123456789中位數(shù)1080第四十頁,共一百四十九頁,編輯于2023年,星期五未分組數(shù)據的中位數(shù)

(10個數(shù)據的算例)【例4-5】

10個家庭的人均月收入數(shù)據原始數(shù)據:15007507806601080850960200012501630排序:66075078085096010801250150016302000位置:

12345678910

Excel統(tǒng)計函數(shù)—MEDIAN第四十一頁,共一百四十九頁,編輯于2023年,星期五分組數(shù)據的中位數(shù)

(要點及計算公式)根據位置公式(N/2)確定中位數(shù)所在的組采用下列近似公式計算(向上累積):3.假定中位數(shù)組的頻數(shù)在該組內均勻分布第四十二頁,共一百四十九頁,編輯于2023年,星期五數(shù)值型分組數(shù)據的中位數(shù)

(算例)例4-6某電腦公司銷售量數(shù)據分組表按銷售量分組(臺)頻數(shù)(天)累積頻數(shù)150以下150~160160~170170~180180~190190~200200~210210~220220~230230以上49162720171084541329567693103111115120合計120—根據某電腦公司120天銷售量的分組數(shù)據計算中位數(shù)。第四十三頁,共一百四十九頁,編輯于2023年,星期五(三)四分位數(shù)

(quartile)1. 排序后處于25%和75%位置上的值2.

不受極端值的影響QLQMQU25%25%25%25%第四十四頁,共一百四十九頁,編輯于2023年,星期五四分位數(shù)

(位置的確定)未分組數(shù)據:下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4分組數(shù)據:下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4第四十五頁,共一百四十九頁,編輯于2023年,星期五未分組數(shù)據的四分位數(shù)

(9個數(shù)據的算例)【例4-7】

9個家庭的人均月收入數(shù)據原始數(shù)據:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789第四十六頁,共一百四十九頁,編輯于2023年,星期五未分組數(shù)據的四分位數(shù)

(10個數(shù)據的算例)【例4-8】

10個家庭的人均月收入數(shù)據原始數(shù)據15007507806601080850960200012501630排序66075078085096010801250150016302000位置:1234

5678910第四十七頁,共一百四十九頁,編輯于2023年,星期五分組數(shù)據的四分位數(shù)

(計算公式)下四分位數(shù):

上四分位數(shù):

第四十八頁,共一百四十九頁,編輯于2023年,星期五

QL位置=120/4=30例4-9某電腦公司銷售量數(shù)據分組表按銷售量分組(臺)頻數(shù)(天)累積頻數(shù)150以下150~160160~170170~180180~190190~200200~210210~220220~230230以上49162720171084541329567693103111115120合計120—QU位置=3×120/4=90根據某電腦公司120天銷售量的分組數(shù)據計算四分位數(shù)第四十九頁,共一百四十九頁,編輯于2023年,星期五二、平均數(shù)第五十頁,共一百四十九頁,編輯于2023年,星期五(一)算術平均數(shù)

(ArithmeticMean)

也稱為均值(mean)消除了觀測值的隨機波動一組數(shù)據的均衡點所在4.易受極端值的影響5.分為:簡單算術平均數(shù)、加權算術平均數(shù)xxx第五十一頁,共一百四十九頁,編輯于2023年,星期五(一)算術平均數(shù)

(ArithmeticMean)

1、簡單算術平均數(shù)(simplemean)設一組數(shù)據為:x1,x2,…,xn第五十二頁,共一百四十九頁,編輯于2023年,星期五簡單算術平均數(shù)

(例題)【例4-10】一家汽車零售店的15名銷售人員6月份銷售的汽車數(shù)量(單位:臺)為:7、10、10、4、12、14、2、15、10、9、12、5、11、2、3,試計算它們的平均銷售量。

Excel統(tǒng)計函數(shù)—AVERAGE第五十三頁,共一百四十九頁,編輯于2023年,星期五2、加權算術平均數(shù)

(weightedmean)設各組的組中值為:

x1,x2,…,xk相應的頻數(shù)為:

f1,f2,…,fk加權均值計算公式為:第五十四頁,共一百四十九頁,編輯于2023年,星期五已改至此!!例4-11某電腦公司銷售量數(shù)據分組表按銷售量分組組中值(xi)頻數(shù)(fi)xifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計—12022200加權算術平均數(shù)

(例題分析)第五十五頁,共一百四十九頁,編輯于2023年,星期五加權算術平均數(shù)

(權數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據如下

甲組:

考試成績(x): 6080100

人數(shù)分布(f):118

乙組:考試成績(x): 6080100

人數(shù)分布(f):811第五十六頁,共一百四十九頁,編輯于2023年,星期五加權算術平均數(shù)

(權數(shù)對均值的影響)影響加權算術平均數(shù)的因素:一是各組變量值(xi)的大??;二是各組頻數(shù)(fi)占總體單位數(shù)的比重。公式變形:第五十七頁,共一百四十九頁,編輯于2023年,星期五以頻率為權數(shù)計算均值

(算例)【例4-12】某企業(yè)60名工人月工資分組情況如下表,試計算月平均工資

某企業(yè)60名工人月工資分組表月工資分組(元)組中值x人數(shù)f頻率(%)fi/∑fx·(fi/∑f)

600以下

500

6

10

50

600-800

700

14

23.33

163.31

800-1000

900

26

43.33

389.97

1000-1200

1100

10

16.67

183.37

1200以上

1300

4

6.67

86.71合計

--

60

100

873.36第五十八頁,共一百四十九頁,編輯于2023年,星期五3、算術平均數(shù)的數(shù)學性質性質1.各變量值與均值的離差之和等于零第五十九頁,共一百四十九頁,編輯于2023年,星期五均值

(數(shù)學性質)性質2.各變量值與均值的離差平方和最小第六十頁,共一百四十九頁,編輯于2023年,星期五數(shù)學性質證明證明:設X0為不等于均值的任意數(shù),C為常數(shù),

第六十一頁,共一百四十九頁,編輯于2023年,星期五(二)調和平均數(shù)

(harmonicmean)1. 集中趨勢的測度值之一2. 易受極端值的影響分為:簡單調和平均數(shù)、加權調和平均數(shù)第六十二頁,共一百四十九頁,編輯于2023年,星期五1、簡單調和平均數(shù)【例4-14】某種蔬菜的價格,甲集市4.5元/千克,乙集市4元/千克,丙集市5.5元/千克。若在三個集市各買1元,求蔬菜的平均價格。

第六十三頁,共一百四十九頁,編輯于2023年,星期五簡單調和平均數(shù)簡單調和平均數(shù)又稱倒數(shù)平均數(shù)。計算公式為:

第六十四頁,共一百四十九頁,編輯于2023年,星期五2、加權調和平均數(shù)

在上例中,如果在甲集市花費8元,乙集市花費10元,丙集市花費5元,購買這些蔬菜的平均價格是多少?

第六十五頁,共一百四十九頁,編輯于2023年,星期五加權調和平均數(shù)計算公式為:原來只是計算時使用了不同的數(shù)據!第六十六頁,共一百四十九頁,編輯于2023年,星期五調和平均數(shù)

(例題分析)某日三種蔬菜的批發(fā)成交數(shù)據蔬菜名稱批發(fā)價格(元)

xi成交額(元)xifi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例4-15】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據如表,計算三種蔬菜該日的平均批發(fā)價格第六十七頁,共一百四十九頁,編輯于2023年,星期五(三)幾何平均數(shù)

(geometricmean)1.

n

個變量值乘積的n

次方根2.適用于比率數(shù)據的平均3.主要用于計算平均比率4.計算公式為第六十八頁,共一百四十九頁,編輯于2023年,星期五(三)幾何平均數(shù)

(概念要點)6、加權幾何平均數(shù)計算公式為第六十九頁,共一百四十九頁,編輯于2023年,星期五幾何平均數(shù)

(例題分析)

【例4-16】某水泥生產企業(yè)2002年的水泥產量為100萬噸,2003年與2002年相比增長率為9%,2004年與2003年相比增長率為16%,2005年與2004年相比增長率為20%。求各年的年平均增長率。年平均增長率=114.91%-1=14.91%第七十頁,共一百四十九頁,編輯于2023年,星期五簡單幾何平均數(shù)

(算例)【例4-17】某企業(yè)生產某種產品須經過毛坯、粗加工、精加工、裝配四個連續(xù)作業(yè)車間才能完成,若6月份每個車間的產品合格率分別為95%、92%、90%、85%,求該產品的企業(yè)合格率(即四個車間的平均合格率)是多少?第七十一頁,共一百四十九頁,編輯于2023年,星期五幾何平均數(shù)

(例題分析)

【例4-18】一位投資者購持有一種股票,在2005~2008年收益率分別為4.5%、2.1%、5.5%、10.9%。計算該投資者在這四年內的平均收益率。

幾何平均:算術平均:第七十二頁,共一百四十九頁,編輯于2023年,星期五加權幾何平均數(shù)

(算例)【例4-19】某投資銀行某筆投資的年利率是按復利計算的,若將過去25年的利率資料整理如下表所示的變量數(shù)列,求25年的平均年利率。投資年利率分組表年利率(%)本利率(%)x年數(shù)(頻數(shù))f

3481015

103104108110115

148102合計

--

25第七十三頁,共一百四十九頁,編輯于2023年,星期五加權幾何平均數(shù)

(算例)用加權幾何平均法求25年的平均本利率:即25年的平均年利率為8.48%若按單利計算,則用加權算術平均法第七十四頁,共一百四十九頁,編輯于2023年,星期五三、各種平均數(shù)之間的關系第七十五頁,共一百四十九頁,編輯于2023年,星期五數(shù)值平均數(shù)之間的關系(一)算術平均數(shù)、調和平均數(shù)和幾何平均數(shù)之間的關系1、利用同一資料計算,結果為:算術平均數(shù)>幾何平均數(shù)>調和平均數(shù)。2、當一組數(shù)據中所有的變量值都相同時,則三種平均數(shù)相等。

第七十六頁,共一百四十九頁,編輯于2023年,星期五(二)眾數(shù)、中位數(shù)和均值的關系第七十七頁,共一百四十九頁,編輯于2023年,星期五眾數(shù)、中位數(shù)和均值的關系左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=

中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值第七十八頁,共一百四十九頁,編輯于2023年,星期五眾數(shù)、中位數(shù)和均值的特點和應用眾數(shù)不受極端值影響具有不唯一性數(shù)據分布偏斜程度較大且有明顯峰值時代表性較好中位數(shù)不受極端值影響數(shù)據分布偏斜程度較大時代表性較好平均數(shù)易受極端值影響數(shù)學性質優(yōu)良,實際中最常用數(shù)據對稱分布或接近對稱分布時代表性較好第七十九頁,共一百四十九頁,編輯于2023年,星期五4.4離散程度的度量異眾比率四分位差極差和平均差方差及標準差相對位置的測量:標準分數(shù)相對離散程度:離散系數(shù)第八十頁,共一百四十九頁,編輯于2023年,星期五離中趨勢數(shù)據分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側面說明了集中趨勢測度值的代表程度不同類型的數(shù)據有不同的離散程度測度值第八十一頁,共一百四十九頁,編輯于2023年,星期五一、異眾比率第八十二頁,共一百四十九頁,編輯于2023年,星期五異眾比率

(variationratio)非眾數(shù)組的頻數(shù)占總頻數(shù)的比率用于衡量眾數(shù)的代表性3. 計算公式為第八十三頁,共一百四十九頁,編輯于2023年,星期五異眾比率

(例題分析)解:

在所調查的50人當中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好例4-20不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100第八十四頁,共一百四十九頁,編輯于2023年,星期五二、四分位差第八十五頁,共一百四十九頁,編輯于2023年,星期五四分位差

(quartiledeviation)1. 上四分位數(shù)與下四分位數(shù)之差2. 也稱為內距或四分間距3. 計算公式為:

QD

=QU-QL4. 反映了中間50%數(shù)據的離散程度用于衡量中位數(shù)的代表性不受極端值的影響第八十六頁,共一百四十九頁,編輯于2023年,星期五四分位差

(10個數(shù)據的算例)【例4-21】

10個家庭的人均月收入數(shù)據原始數(shù)據

15007507806601080850960200012501630排序

66075078085096010801250150016302000位置:

12345678910

第八十七頁,共一百四十九頁,編輯于2023年,星期五三、極差和平均差第八十八頁,共一百四十九頁,編輯于2023年,星期五(一)極差(全距)

(range)1.

一組數(shù)據的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據的分布7891078910R

=max(xi)-min(xi)5.計算公式為第八十九頁,共一百四十九頁,編輯于2023年,星期五極差(全距)

(range)【例4-22】

9個應屆畢業(yè)生的人均月收入數(shù)據原始數(shù)據:

8007509009801020950200010501000排序:

7508008809009501000102010502000R

=max(xi)-min(xi)=2000-750=1250元第九十頁,共一百四十九頁,編輯于2023年,星期五(二)平均差

(meandeviation)1.

各變量值與其均值離差絕對值的平均數(shù)2.能全面反映一組數(shù)據的離散程度3.數(shù)學性質較差,實際中應用較少4.

計算公式為未分組數(shù)據組距分組數(shù)據第九十一頁,共一百四十九頁,編輯于2023年,星期五平均差

(例題分析)某電腦公司銷售量數(shù)據平均差計算表

按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040第九十二頁,共一百四十九頁,編輯于2023年,星期五平均差

(例題分析)

含義:每一天的銷售量與平均數(shù)相比,平均相差17臺統(tǒng)計函數(shù)—AVEDEV第九十三頁,共一百四十九頁,編輯于2023年,星期五四、方差和標準差第九十四頁,共一百四十九頁,編輯于2023年,星期五方差和標準差

(varianceandstandarddeviation)1. 數(shù)據離散程度最常用的測度值2. 反映了各變量值與均值的平均差異3.根據總體數(shù)據計算的,稱為總體方差(標準差),記為2()

;根據樣本數(shù)據計算的,稱為樣本方差(標準差),記為s2(s)第九十五頁,共一百四十九頁,編輯于2023年,星期五(一)總體方差和標準差

(populationvarianceandstandarddeviation)組距分組數(shù)據:未分組數(shù)據:組距分組數(shù)據:方差的計算公式標準差的計算公式未分組數(shù)據:第九十六頁,共一百四十九頁,編輯于2023年,星期五總體標準差

(例題分析)例4-23某電腦公司銷售量數(shù)據標準差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合計—120—55400第九十七頁,共一百四十九頁,編輯于2023年,星期五總體標準差

(例題分析)

含義:每一天的銷售量與平均數(shù)相比,平均相差21.49臺第九十八頁,共一百四十九頁,編輯于2023年,星期五(二)樣本方差和標準差

(simplevarianceandstandarddeviation)組距分組數(shù)據:未分組數(shù)據:組距分組數(shù)據:方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!未分組數(shù)據:第九十九頁,共一百四十九頁,編輯于2023年,星期五自由度

(degreeoffreedom)自由度:一組數(shù)據中可以自由取值的數(shù)據的個數(shù)當樣本數(shù)據的個數(shù)為n時,若樣本均值x確定后,只有n-1個數(shù)據可以自由取值,其中必有一個數(shù)據不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當x

=5

確定后,x1,x2和x3有兩個數(shù)據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量。第一百頁,共一百四十九頁,編輯于2023年,星期五樣本方差與標準差

(例題分析)例如:計算9名員工的月工資收入的方差和標準差15007507801080850960200012501630Excel統(tǒng)計函數(shù)—STDEV方差標準差第一百零一頁,共一百四十九頁,編輯于2023年,星期五樣本標準差

(例題分析)某電腦公司銷售量數(shù)據平均差計算表

按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合計—120—55400第一百零二頁,共一百四十九頁,編輯于2023年,星期五樣本標準差

(例題分析)某電腦公司銷售量的樣本標準差

含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺第一百零三頁,共一百四十九頁,編輯于2023年,星期五方差簡化公式總體方差樣本方差第一百零四頁,共一百四十九頁,編輯于2023年,星期五標準差的應用標準差是方差的正平方根,是具有量綱的,它與變量值的計量單位相同,其實際意義比方差清楚。因此,在對社會經濟現(xiàn)象進行分析時,更多地使用標準差。標準差度量風險(投資方面)標準差度量產品質量的穩(wěn)定性標準差度量企業(yè)的生產及服務質量標準第一百零五頁,共一百四十九頁,編輯于2023年,星期五(三)是非標志的方差與標準差

有些事物或現(xiàn)象的特征只表現(xiàn)為兩種性質上的差異,稱為是非標志或交替標志。例如:性別表現(xiàn)為男或女;產品質量表現(xiàn)為合格或不合格;學生成績表現(xiàn)為及格或不及格。第一百零六頁,共一百四十九頁,編輯于2023年,星期五比例(或成數(shù))1、比例(成數(shù))

把總體中具有或不具有某種表現(xiàn)的單位數(shù)占全部單位數(shù)的比重稱為比例(成數(shù))。例如:一批產品中,合格品占95%,不合格品占5%。

N1表示總體中具有某種表現(xiàn)的單位數(shù),

N0表示總體中不具有某種表現(xiàn)的單位數(shù),

N表示為總體單位數(shù)總體比例可表示為:π=N1/N或1-π=N0/N樣本比例可表示為:p=n1/n或1-p=n0/n第一百零七頁,共一百四十九頁,編輯于2023年,星期五2、比例的平均數(shù)和方差

1表示具有某種標志表現(xiàn)

0表示不具有某種標志表現(xiàn)是非標志的取值及權數(shù)是非標志取值xi權數(shù)fixifi1N1N10N00合計NN1第一百零八頁,共一百四十九頁,編輯于2023年,星期五是非標志的方差和標準差總體標準差為:同理,樣本方差和標準差為:第一百零九頁,共一百四十九頁,編輯于2023年,星期五比例方差和標準差

(例題)【例4-25】從一批產品中隨機抽取100件產品進行質量測試,測試結果為96件合格,4件不合格,試計算該批產品合格率的方差和標準差。根據資料可得:

P=96/100=96%1-p=4%第一百一十頁,共一百四十九頁,編輯于2023年,星期五五、相對位置的測量:標準分數(shù)第一百一十一頁,共一百四十九頁,編輯于2023年,星期五(一)標準分數(shù)

(standardscore)1.

也稱標準化值2.對某一個值在一組數(shù)據中相對位置的度量3.可用于判斷一組數(shù)據是否有離群點(outlier)4.用于對變量的標準化處理5.計算公式為第一百一十二頁,共一百四十九頁,編輯于2023年,星期五標準分數(shù)1、標準分數(shù)反映各數(shù)據以平均數(shù)為中心的相對位置:

Z>0,即Xi>;

Z<0,即Xi<;

Z=0,即Xi=2、標準分數(shù)不改變原數(shù)據大小的位序,即若Xi>Xj,則必有Zi>Zj第一百一十三頁,共一百四十九頁,編輯于2023年,星期五標準分數(shù)

(性質)標準分數(shù)的均值等于02.標準分數(shù)的方差等于1第一百一十四頁,共一百四十九頁,編輯于2023年,星期五標準分數(shù)

(性質)

z分數(shù)只是將原始數(shù)據進行了線性變換,它并沒有改變一個數(shù)據在該組數(shù)據中的位置,也沒有改變該組數(shù)據分布的形狀,而只是將該組數(shù)據變?yōu)榫禐?,標準差為1。

第一百一十五頁,共一百四十九頁,編輯于2023年,星期五標準化值

(例題分析)例4-269個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996第一百一十六頁,共一百四十九頁,編輯于2023年,星期五(二)經驗法則經驗法則表明:當一組數(shù)據對稱分布時約有68%的數(shù)據在平均數(shù)加減1個標準差的范圍之內約有95%的數(shù)據在平均數(shù)加減2個標準差的范圍之內約有99%的數(shù)據在平均數(shù)加減3個標準差的范圍之內在3個標準差之外的數(shù)據,在統(tǒng)計上稱為異常值或離群點(outlier)第一百一十七頁,共一百四十九頁,編輯于2023年,星期五經驗法則

(例題分析)第一百一十八頁,共一百四十九頁,編輯于2023年,星期五(二)經驗法則【例4-27】液體清潔劑是在生產線上自動填充的,填充的重量呈鐘形分布。如果平均重量為500克,標準差是5克,利用經驗法則可得出下面結論:大約68%的清潔劑填充重量在495克至505克之間大約95%的清潔劑填充重量在490克至510克之間大約99%的清潔劑填充重量在485克至515克之間第一百一十九頁,共一百四十九頁,編輯于2023年,星期五(三)切比雪夫不等式

(Chebyshev’sinequality)切比雪夫不等式適用于任何分布形狀的數(shù)據。切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”。對于任意分布形態(tài)的數(shù)據,根據切比雪夫不等式,至少有(1-1/k2)的數(shù)據落在平均數(shù)k個標準差之內。其中k是大于1的任意值,但不必一定是整數(shù)。第一百二十頁,共一百四十九頁,編輯于2023年,星期五切比雪夫不等式

(Chebyshev’sinequality)對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據落在平均數(shù)加減2個標準差的范圍之內至少有89%的數(shù)據落在平均數(shù)加減3個標準差的范圍之內至少有94%的數(shù)據落在平均數(shù)加減4個標準差的范圍之內第一百二十一頁,共一百四十九頁,編輯于2023年,星期五切比雪夫不等式

(例題)【例4-28】假設100名學生在統(tǒng)計學原理考試中,平均分數(shù)為70分,標準差為5,那么有多少學生的分數(shù)在60~80之間?有多少學生的分數(shù)在58~82之間?(1)k=(60-70)/5=-2k=(80-70)/5=2在100個學生中至少75人的分數(shù)在60~80之間。(2)k=(58-70)/5=-2.4,k=(82-70)/5=2.4根據切比雪夫定理:1-1/k2=1-1/2.42=0.826即至少有82.6%的學生的分數(shù)在58~82之間。第一百二十二頁,共一百四十九頁,編輯于2023年,星期五五、相對離散程度:離散系數(shù)第一百二十三頁,共一百四十九頁,編輯于2023年,星期五離散系數(shù)

(coefficientofvariation)1. 一組數(shù)據的標準差與其相應的均值之比對數(shù)據相對離散程度的測度消除了數(shù)據水平高低和計量單位的影響4. 用于對不同組別數(shù)據離散程度的比較5.計算公式為第一百二十四頁,共一百四十九頁,編輯于2023年,星期五離散系數(shù)

(例題分析)某管理局所屬8家企業(yè)的產品銷售數(shù)據企業(yè)編號產品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例4-29】某管理局抽查了所屬的8家企業(yè),其產品銷售數(shù)據如表。試比較產品銷售額與銷售利潤的離散程度第一百二十五頁,共一百四十九頁,編輯于2023年,星期五離散系數(shù)

(例題分析)結論:計算結果表明,v1<v2,說明產品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710第一百二十六頁,共一百四十九頁,編輯于2023年,星期五離散系數(shù)

(例題分析)【例4-30】評價哪名運動員的發(fā)揮更穩(wěn)定發(fā)揮比較穩(wěn)定的運動員是塞爾維亞的亞斯娜·舍卡里奇和中國的郭文珺,發(fā)揮不穩(wěn)定的運動員蒙古的卓格巴德拉赫·蒙赫珠勒和波蘭的萊萬多夫斯卡·薩貢第一百二十七頁,共一百四十九頁,編輯于2023年,星期五4.5偏態(tài)與峰態(tài)的測度一.偏態(tài)及其測度二.峰態(tài)及其測度第一百二十八頁,共一百四十九頁,編輯于2023年,星期五偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標準正態(tài)分布比較!第一百二十九頁,共一百四十九頁,編輯于2023年,星期五偏態(tài)第一百三十頁,共一百四十九頁,編輯于2023年,星期五偏態(tài)

(skewness)統(tǒng)計學家Pearson于1895年首次提出對數(shù)據分布偏斜程度的測度測度偏態(tài)的統(tǒng)計量是偏態(tài)系數(shù)(SK)第一百三十一頁,共一百四十九頁,編輯于2023年,星期五偏態(tài)系數(shù)

(skewnesscoefficient)1.偏態(tài)系數(shù)=0為對稱分布2.偏態(tài)系數(shù)>0為右偏分布3.偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)>1或<-1,為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-1~-0.5之間,為中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度越低第一百三十二頁,共一百四十九頁,編輯于2023年,星期五偏態(tài)系數(shù)

(coefficientofskewness)根據原始數(shù)據計算根據

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論