版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計學(xué)第二章描述第一頁,共一百零四頁,2022年,8月28日本章重點尺度形態(tài)分位數(shù)箱線圖位置第二頁,共一百零四頁,2022年,8月28日第三頁,共一百零四頁,2022年,8月28日第四頁,共一百零四頁,2022年,8月28日詹姆斯
312527381913211923332829363222312538262522493725612436182718352829152030322428352522384331343230352525223424331830252226731172142271517212532303219222926241317263213233630262130222717173734332139
第五頁,共一百零四頁,2022年,8月28日杜蘭特
3132254342293037182825253827282654333038313327513731363436242536273528263729292015262335422633243333281538302833301727333930282938414832323727362842433221302523403331273636482824333642293441462431191342
第六頁,共一百零四頁,2022年,8月28日詹姆斯第七頁,共一百零四頁,2022年,8月28日杜蘭特第八頁,共一百零四頁,2022年,8月28日詹姆斯第九頁,共一百零四頁,2022年,8月28日分布形態(tài)第十頁,共一百零四頁,2022年,8月28日鐘型分布(bellshaped)鐘型分布中間觀測值分布多,越往兩側(cè)分布越少。因其形狀像鐘而得名。根據(jù)分布的對稱性,鐘型分布又可分為對稱分布、左偏分布和右偏分布第十一頁,共一百零四頁,2022年,8月28日對稱分布(symmetry)對稱分布第十二頁,共一百零四頁,2022年,8月28日左偏(leftskewed)左偏第十三頁,共一百零四頁,2022年,8月28日右偏(rightskewed)右偏第十四頁,共一百零四頁,2022年,8月28日正態(tài)分布(normaldistribution)也叫高斯分布(gaussiandistribution)是一種完美的、對稱的鐘型分布,可以用函數(shù)精確地表達(dá)出來實踐中大量的變量逼近正態(tài)分布,換而言之,一個變量大約成正態(tài)分布才是正常(normal)的第十五頁,共一百零四頁,2022年,8月28日杜蘭特第十六頁,共一百零四頁,2022年,8月28日對比第十七頁,共一百零四頁,2022年,8月28日雙直方圖(bi-histogram)第十八頁,共一百零四頁,2022年,8月28日對比第十九頁,共一百零四頁,2022年,8月28日描述
位置(location):中心(center)尺度(scale):差異(variability)或離散(spread)形態(tài)(shape)第二十頁,共一百零四頁,2022年,8月28日第一節(jié)位置均值(mean)眾數(shù)(mode)中位數(shù)(median)分位數(shù)
(quantile)第二十一頁,共一百零四頁,2022年,8月28日均值
觀測值之和除以觀測值數(shù)目第二十二頁,共一百零四頁,2022年,8月28日中位數(shù)
中間位置上的數(shù)觀測值從小到大排列中間位置:(n-1)/2+1第二十三頁,共一百零四頁,2022年,8月28日中位數(shù)
排序:中間位置:(n-1)/2+1=(101-1)/2+1=51中位數(shù):31第二十四頁,共一百零四頁,2022年,8月28日眾數(shù)
分布次數(shù)(頻數(shù))最多的觀測值次數(shù)分布找到分布最多的觀測值眾數(shù)不一定存在,也不一定唯一事實上,連續(xù)型變量很難精確地找到眾數(shù)第二十五頁,共一百零四頁,2022年,8月28日眾數(shù)位置
分布第二十六頁,共一百零四頁,2022年,8月28日眾數(shù)
位置:最多分布為9眾數(shù):33第二十七頁,共一百零四頁,2022年,8月28日分位數(shù)
q分位數(shù):觀測值從小到大排序后,q等分,處于分界點上的數(shù)二分位數(shù)(中位數(shù))三分位數(shù)(tertiles)四分位數(shù)(quartiles)五分位數(shù)(quintiles)六分位數(shù)(sextiles)十分位數(shù)(deciles)十二分位數(shù)(duo-deciles)二十分位數(shù)(vigintiles)百分位數(shù)(percentiles)千分位數(shù)(permilles)第二十八頁,共一百零四頁,2022年,8月28日四分位數(shù)
觀測值按大小順序排列后,均分為四部分,處于分界點上的數(shù)2/4位置:中位數(shù)1/4位置:下四分位數(shù)3/4位置:上四分位數(shù)
第二十九頁,共一百零四頁,2022年,8月28日四分位數(shù)
詹姆斯:杜蘭特:第三十頁,共一百零四頁,2022年,8月28日月薪
從某公司隨機(jī)抽取13位職工,調(diào)查他們的月薪如下:200026003500180025004800280030002200
3300520046004000第三十一頁,共一百零四頁,2022年,8月28日四分位數(shù)位置176543213121110984710第三十二頁,共一百零四頁,2022年,8月28日十分位數(shù)位置176543213121110982.23.44.65.878.29.410.611.8第三十三頁,共一百零四頁,2022年,8月28日分位數(shù)位置
第k個q分位數(shù)的位置:第三十四頁,共一百零四頁,2022年,8月28日位置匯總
均值:27.13中位數(shù):26眾數(shù):25下四分位數(shù):22上四分位數(shù):32均值:31.62中位數(shù):31眾數(shù):33下四分位數(shù):27上四分位數(shù):36第三十五頁,共一百零四頁,2022年,8月28日練習(xí)求30家經(jīng)銷商銷量均值、中位數(shù)、眾數(shù)、四分位數(shù)、十分位數(shù)524854614736515843396947496843475954684653342820384173475178第三十六頁,共一百零四頁,2022年,8月28日第二節(jié)尺度絕對平均差(averageabsolutedeviation)方差(variance)標(biāo)準(zhǔn)差(standarddeviation)全距(range)四分位距(inter-quartilerange)絕對中位差(medianabsolutedeviation)第三十七頁,共一百零四頁,2022年,8月28日散點圖均值第三十八頁,共一百零四頁,2022年,8月28日差異(
離散)第三十九頁,共一百零四頁,2022年,8月28日中心化(centering)
第四十頁,共一百零四頁,2022年,8月28日中心化
第四十一頁,共一百零四頁,2022年,8月28日合計合計不為0第四十二頁,共一百零四頁,2022年,8月28日絕對值
第四十三頁,共一百零四頁,2022年,8月28日絕對平均差
第四十四頁,共一百零四頁,2022年,8月28日平方第四十五頁,共一百零四頁,2022年,8月28日方差
第四十六頁,共一百零四頁,2022年,8月28日自由度計算樣本方差時應(yīng)除以n-1,而不是n這里n-1叫自由度(degreeoffreedom),表示樣本可自由取值的數(shù)目第四十七頁,共一百零四頁,2022年,8月28日自由度?如果某班只有1位學(xué)生,身高為172如果從某班抽取1位學(xué)生調(diào)查其身高為172總體無差異無法獲知總體差異第四十八頁,共一百零四頁,2022年,8月28日標(biāo)準(zhǔn)差
第四十九頁,共一百零四頁,2022年,8月28日變異系數(shù)(coefficientofvariation)
標(biāo)準(zhǔn)差只能度量絕對差異,而不能度量相對差異變異系數(shù)第五十頁,共一百零四頁,2022年,8月28日全距
第五十一頁,共一百零四頁,2022年,8月28日四分位距
第五十二頁,共一百零四頁,2022年,8月28日絕對中位差
第五十三頁,共一百零四頁,2022年,8月28日尺度匯總
絕對平均差:6.31方差:67.3標(biāo)準(zhǔn)差:8.20變異系數(shù):0.302全距:54四分位距:10絕對中位差:5絕對平均差:5.96方差:59.0標(biāo)準(zhǔn)差:7.68變異系數(shù):0.243全距:41四分位距:9絕對中位差:5第五十四頁,共一百零四頁,2022年,8月28日總體均值和方差
假設(shè)知道總體的數(shù)據(jù),則可計算總體均值和方差因為總體是唯一的,總體均值和方差也是唯一的,故也稱總體參數(shù)(parameter)實際中只能用樣本均值和方差去估計總體第五十五頁,共一百零四頁,2022年,8月28日練習(xí)求10家經(jīng)銷商銷量的絕對平均差、方差、標(biāo)準(zhǔn)差、變異系數(shù)、全距、四分位距、絕對中位差52485461483651584339第五十六頁,共一百零四頁,2022年,8月28日極端值(extremes)也叫離群值(outliers),指明顯偏離主體數(shù)據(jù)的值。極端值應(yīng)給予特別關(guān)注:觀測錯誤特殊情況第五十七頁,共一百零四頁,2022年,8月28日判定3倍標(biāo)準(zhǔn)差1.5倍四分位距第五十八頁,共一百零四頁,2022年,8月28日準(zhǔn)則極小值極大值第五十九頁,共一百零四頁,2022年,8月28日標(biāo)準(zhǔn)化(無尺度化)極小值極大值第六十頁,共一百零四頁,2022年,8月28日準(zhǔn)則極小值極大值第六十一頁,共一百零四頁,2022年,8月28日討論判斷30家經(jīng)銷商銷量的極端值52485461473651584339694749684347595468160533428103841734751278第六十二頁,共一百零四頁,2022年,8月28日月薪正常數(shù)據(jù)有極大值數(shù)據(jù)第六十三頁,共一百零四頁,2022年,8月28日右偏正常右偏第六十四頁,共一百零四頁,2022年,8月28日月薪正常數(shù)據(jù)有極小值數(shù)據(jù)第六十五頁,共一百零四頁,2022年,8月28日左偏正常左偏第六十六頁,共一百零四頁,2022年,8月28日月薪正常數(shù)據(jù)既有極大值,又有極小值數(shù)據(jù)第六十七頁,共一百零四頁,2022年,8月28日尖峰(厚尾)正常尖峰(厚尾)第六十八頁,共一百零四頁,2022年,8月28日銷量正常數(shù)據(jù)有極大值數(shù)據(jù)第六十九頁,共一百零四頁,2022年,8月28日位置描述
均值:50.1中位數(shù):48.5眾數(shù):47均值:63.9中位數(shù):50眾數(shù):47正常極大值第七十頁,共一百零四頁,2022年,8月28日尺度描述
正常極大值絕對平均差:9.87方差:171.4標(biāo)準(zhǔn)差:13.1變異系數(shù):0.26全距:58四分位距:10絕對中位差:6.5絕對平均差:28.85方差:5768.5標(biāo)準(zhǔn)差:76.0變異系數(shù):1.19全距:440四分位距:10絕對中位差:8.5第七十一頁,共一百零四頁,2022年,8月28日穩(wěn)?。╮obust)諸如中位數(shù)、四分位距、絕對中位差的只受主體數(shù)據(jù)影響不受極端值影響的統(tǒng)計量成為穩(wěn)健統(tǒng)計量穩(wěn)健統(tǒng)計量意味著缺乏敏感性
第七十二頁,共一百零四頁,2022年,8月28日調(diào)整均值中間均值(mid-mean):用25%——75%分位數(shù)之間的數(shù)據(jù)計算均值切尾均值(trimmedmean):用5%——95%分位數(shù)之間的數(shù)據(jù)計算均值縮尾均值(winsorizedmean):將5%分位數(shù)之前的數(shù)據(jù)替為5%分位數(shù),95%之后的數(shù)據(jù)替為95%分位數(shù),再計算均值
第七十三頁,共一百零四頁,2022年,8月28日討論求30家經(jīng)銷商銷量均值、中間均值、切尾均值、縮尾均值5248546147365158433969474968434759546846053342820384173475178第七十四頁,共一百零四頁,2022年,8月28日第三節(jié)形態(tài)偏度(skewness)峰度(kurtosis)第七十五頁,共一百零四頁,2022年,8月28日中心化數(shù)據(jù)(一次方)第七十六頁,共一百零四頁,2022年,8月28日二次方第七十七頁,共一百零四頁,2022年,8月28日三次方第七十八頁,共一百零四頁,2022年,8月28日四次方第七十九頁,共一百零四頁,2022年,8月28日匯總圖第八十頁,共一百零四頁,2022年,8月28日中心矩(central
moment)二階中心矩即為方差三階中心矩可度量偏度四階中心矩可度量峰度第八十一頁,共一百零四頁,2022年,8月28日偏度標(biāo)準(zhǔn)化(無尺度化)三階中心矩偏度大于0為右偏,小于0為左偏第八十二頁,共一百零四頁,2022年,8月28日峰度標(biāo)準(zhǔn)化(無尺度化)四階中心矩正態(tài)分布的峰度為3,因此峰度大于3為尖峰(厚尾),小于3為平峰(薄尾)。超額峰度(excesskurtosis):第八十三頁,共一百零四頁,2022年,8月28日形態(tài)
偏度:0.705峰度:4.99超額峰度:1.99偏度:0.249峰度:3.29超額峰度:0.29第八十四頁,共一百零四頁,2022年,8月28日討論求10家經(jīng)銷商銷量的偏度和峰度52485481483651584319第八十五頁,共一百零四頁,2022年,8月28日箱線圖(boxplot)
5點:P1:P2:P3:P4:P5:第八十六頁,共一百零四頁,2022年,8月28日繪圖P1P2P3P4P5第八十七頁,共一百零四頁,2022年,8月28日箱線圖可以看出位置(中心)尺度(差異或離散)偏態(tài)和峰態(tài)極端值
第八十八頁,共一百零四頁,2022年,8月28日對比第八十九頁,共一百零四頁,2022年,8月28日練習(xí)相對濕度(%)月份北京長春南京鄭州武漢廣州成都昆明蘭州西安123456789101112494147505557697468476656706850395654707966595957767177726873828271758282575768676357747167537765777581757174817371727882728080848387868481807275798381797582847875787882656558615872847477767171514149464143585755455352676774705842625565657372第九十頁,共一百零四頁,2022年,8月28日濕度第九十一頁,共一百零四頁,2022年,8月28日第四節(jié)其它
分組數(shù)據(jù)(groupeddata)質(zhì)量變量的描述第九十二頁,共一百零四頁,2022年,8月28日分組數(shù)據(jù)銷量組中值頻數(shù)∑3020—2930—3940—4950—5960—6970—79—2410842第九十三頁,共一百零四頁,2022年,8月28日分組數(shù)據(jù)銷售額組中值頻數(shù)20以下20—3030—4040—5050—6060以上15253545556515111063∑—36第九十四頁,共一百零四頁,2022年,8月28日加權(quán)平均均值方差其中,x為組中值,f為權(quán)數(shù)第九十五頁,共一百零四頁,2022年,8月28日加權(quán)平均銷售額x
f
20以下15115-26.67711.11711.1120—30255125-16.67277.781388.8930—403511385-6.6744.44488.8940—5045104503.3311.11111.1150—6055633013.33177.781066.6760以上65319523.33544.441633.33
—
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川省內(nèi)江市2023-2024學(xué)年高三三模英語試題
- 2019-2025年中國谷物及谷物粉市場前景預(yù)測及投資規(guī)劃研究報告
- 【可行性報告】2024年高純超細(xì)石英粉相關(guān)行業(yè)可行性分析報告
- 煤化工有限責(zé)任公司年產(chǎn)46萬噸合成氨80萬噸尿素工程環(huán)評報告
- 一年級數(shù)學(xué)(上)計算題專項練習(xí)集錦
- 海鰻養(yǎng)殖知識培訓(xùn)課件
- 中醫(yī)藥知識培訓(xùn)
- 車輛檢修工知識培訓(xùn)課件
- 春節(jié)購房 壯志凌云
- 春分市場突圍
- 《論拒不執(zhí)行判決、裁定罪“執(zhí)行能力”之認(rèn)定》
- 工業(yè)設(shè)計基礎(chǔ)知識單選題100道及答案解析
- 山西省晉中市2023-2024學(xué)年高一上學(xué)期期末考試 化學(xué) 含解析
- 過程審核表(產(chǎn)品組評分矩陣評審提問表(評分))-2024年百度過
- 操作手冊模板【范本模板】
- 2025年湖北省武漢市高考數(shù)學(xué)模擬試卷附答案解析
- 【工作總結(jié)】建筑中級職稱專業(yè)技術(shù)工作總結(jié)
- 江蘇省2022年普通高中學(xué)業(yè)水平合格性考試數(shù)學(xué)試題(考試版)
- 2023年二輪復(fù)習(xí)解答題專題三:一次函數(shù)的應(yīng)用方案選取型(原卷版+解析)
- 2024版小學(xué)英語新課程標(biāo)準(zhǔn)測試題及答案
- 2024年村級意識形態(tài)工作計劃
評論
0/150
提交評論