描述統(tǒng)計(jì)補(bǔ)充_第1頁
描述統(tǒng)計(jì)補(bǔ)充_第2頁
描述統(tǒng)計(jì)補(bǔ)充_第3頁
描述統(tǒng)計(jì)補(bǔ)充_第4頁
描述統(tǒng)計(jì)補(bǔ)充_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

描述性統(tǒng)計(jì)

(descriptivestatistics)研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)分支內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105算數(shù)平均數(shù)(Mean)

(計(jì)算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN

簡單均值的計(jì)算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK

相應(yīng)的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權(quán)均值的計(jì)算公式為簡單均值

(算例)原始數(shù)據(jù): 10 5 9 13 6 8加權(quán)均值

(算例)表1某車間50名工人日加工零件均值計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計(jì)—506160.0【例】根據(jù)表1中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的均值加權(quán)均值

(權(quán)數(shù)對均值的影響)

甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下

甲組:考試成績(X): 020100

人數(shù)分布(F):118乙組:考試成績(X): 020100

人數(shù)分布(F):811X甲0×1+20×1+100×8n

10i=1

Xi

82(分)X乙0×8+20×1+100×1n

10i=1

Xi

12(分)均值

(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零

2.各變量值與均值的離差平方和最小均值特點(diǎn):1. 集中趨勢的測度值之一2. 最常用的測度值3. 一組數(shù)據(jù)的均衡點(diǎn)所在4. 易受極端值的影響5.用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)(2)中位數(shù)Me中位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù)的中位數(shù)

(計(jì)算公式)數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(5個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):

2422212620排序: 2021222426位置: 123 45中位數(shù)

22

數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(6個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):105 91268排序: 56891012位置: 123

4

56位置

N+126+123.5中位數(shù)

8+928.5

根據(jù)位置公式確定中位數(shù)所在的組采用下列近似公式計(jì)算:4.

該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布數(shù)值型分組數(shù)據(jù)的中位數(shù)

(要點(diǎn)及計(jì)算公式)數(shù)值型分組數(shù)據(jù)的中位數(shù)

(算例)表4某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—【例】根據(jù)表4中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的中位數(shù)中位數(shù)特點(diǎn):集中趨勢的測度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即(3)分位數(shù)

一般采用四分位數(shù)四分位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計(jì)算公式)上四分位數(shù):

下四分位數(shù):

數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計(jì)算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表6某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—【例】根據(jù)表6中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的四分位數(shù)四分位數(shù)特點(diǎn):1. 集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值3.不受極端值的影響4.主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%(4)眾數(shù)M0眾數(shù)

=出現(xiàn)次數(shù)最多的變量值無眾數(shù)

原始數(shù)據(jù):10591268一個(gè)眾數(shù)

原始數(shù)據(jù):65

9855多于一個(gè)眾數(shù)

原始數(shù)據(jù):252828

364242定類數(shù)據(jù)的眾數(shù)

(算例)表7某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計(jì)2001100【例】根據(jù)表7中的數(shù)據(jù),計(jì)算眾數(shù)解:這里的變量為“廣告類型”,這是個(gè)定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告數(shù)值型分組數(shù)據(jù)的眾數(shù)

(算例)表9某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—【例】根據(jù)表9中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的眾數(shù)數(shù)值型分組數(shù)據(jù)的眾數(shù)

(要點(diǎn)及計(jì)算公式)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4.

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2.相鄰兩組的頻數(shù)相等時(shí),眾數(shù)組的組中值即為眾數(shù)Mo3.相鄰兩組的頻數(shù)不相等時(shí),眾數(shù)采用下列近似公式計(jì)算MoMo眾數(shù)特點(diǎn):集中趨勢的測度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個(gè)眾數(shù)主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值4、標(biāo)志變異指標(biāo)(離中趨勢)(1)極差(2)四分位差(3)平均差(4)方差及標(biāo)準(zhǔn)差(5)標(biāo)準(zhǔn)差系數(shù)(6)均值標(biāo)準(zhǔn)誤(1)全距(Range)1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)

R

=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R

最高組上限-最低組下限5.計(jì)算公式為(2)四分位差四分位差1. 離散程度的測度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差

QD

=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性四分位差

(定序數(shù)據(jù)的算例)【例】根據(jù)表中的數(shù)據(jù),計(jì)算甲城市家庭對住房滿意狀況評(píng)價(jià)的四分位差解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知QL=不滿意=2,

QU=

一般=

3四分位差:

QD

=QU

=

QL

=3–2

=1表甲城市家庭對住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計(jì)300—(3)平均差平均差

(概念要點(diǎn)及計(jì)算公式)1.離散程度的測度值之一2.各變量值與其均值離差絕對值的平均數(shù)3.能全面反映一組數(shù)據(jù)的離散程度4.數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少5.計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差

(計(jì)算過程及結(jié)果)表某車間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合計(jì)—50—312【例】根據(jù)表中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的平均差(4)標(biāo)準(zhǔn)差與方差方差和標(biāo)準(zhǔn)差

(概念要點(diǎn))1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布4.反映了各變量值與均值的平均差異5.根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4681012X=8.3總體方差和標(biāo)準(zhǔn)差

(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式總體標(biāo)準(zhǔn)差

(計(jì)算過程及結(jié)果)表某車間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計(jì)—50—3100.5【例】根據(jù)表中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差樣本方差和標(biāo)準(zhǔn)差

(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!樣本方差

自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為

n

時(shí),若樣本均值

x

確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則

x

=5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論