《管理統(tǒng)計(jì)學(xué)》馬慶國(guó)著-課件_第1頁(yè)
《管理統(tǒng)計(jì)學(xué)》馬慶國(guó)著-課件_第2頁(yè)
《管理統(tǒng)計(jì)學(xué)》馬慶國(guó)著-課件_第3頁(yè)
《管理統(tǒng)計(jì)學(xué)》馬慶國(guó)著-課件_第4頁(yè)
《管理統(tǒng)計(jì)學(xué)》馬慶國(guó)著-課件_第5頁(yè)
已閱讀5頁(yè),還剩74頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章第三章 樣本數(shù)據(jù)特征的樣本數(shù)據(jù)特征的 初步分析初步分析信息在被操縱或處理后并沒(méi)有超出其原有的格式信息在被操縱或處理后并沒(méi)有超出其原有的格式 保留了數(shù)據(jù)的原值保留了數(shù)據(jù)的原值 ,并按數(shù)值的升序或降序顯示數(shù)據(jù)。并按數(shù)值的升序或降序顯示數(shù)據(jù)。 易觀察到:易觀察到: 數(shù)據(jù)集中包含最大觀察值和最小觀察值數(shù)據(jù)集中包含最大觀察值和最小觀察值 確認(rèn)在某個(gè)數(shù)據(jù)集中哪些數(shù)組具有相同的值確認(rèn)在某個(gè)數(shù)據(jù)集中哪些數(shù)組具有相同的值 很容易發(fā)現(xiàn)各個(gè)值之間的差異很容易發(fā)現(xiàn)各個(gè)值之間的差異 3、樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率、樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率一、一些基本概念一、一些基本概念1、頻次(頻數(shù))、頻次(頻

2、數(shù)) 在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值(樣本值)在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值(樣本值)出現(xiàn)的次數(shù)出現(xiàn)的次數(shù) 稱為該樣本值出現(xiàn)的頻次稱為該樣本值出現(xiàn)的頻次。2、頻率、頻率 該樣本值出現(xiàn)的頻次該樣本值出現(xiàn)的頻次 / 該數(shù)據(jù)集合的數(shù)據(jù)總數(shù)。該數(shù)據(jù)集合的數(shù)據(jù)總數(shù)。常用表示方法:常用表示方法: (1)表)表 ; (2)餅圖;)餅圖; (3)條形圖;)條形圖;二、樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率二、樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率 當(dāng)樣本數(shù)據(jù)的測(cè)度在順次級(jí)以上時(shí),把樣本值小于等于當(dāng)樣本數(shù)據(jù)的測(cè)度在順次級(jí)以上時(shí),把樣本值小于等于某個(gè)樣本數(shù)據(jù)某個(gè)樣本數(shù)據(jù)xi的頻率值累加起來(lái),就得到的頻

3、率值累加起來(lái),就得到“小于等于小于等于xi”的累積頻率。的累積頻率。注:名義級(jí)的樣本數(shù)據(jù)集合,不存在累積頻率問(wèn)題。注:名義級(jí)的樣本數(shù)據(jù)集合,不存在累積頻率問(wèn)題。表示法同上。表示法同上。將數(shù)據(jù)值分成幾組將數(shù)據(jù)值分成幾組 顯示各組中有多少數(shù)值顯示各組中有多少數(shù)值很容易發(fā)現(xiàn)數(shù)據(jù)的圖形特點(diǎn)很容易發(fā)現(xiàn)數(shù)據(jù)的圖形特點(diǎn) 無(wú)法保留原始數(shù)據(jù)的值無(wú)法保留原始數(shù)據(jù)的值 某個(gè)變量所有可能值的集合某個(gè)變量所有可能值的集合 顯示了變量的圖形特點(diǎn)顯示了變量的圖形特點(diǎn) 分布分布 P當(dāng)數(shù)據(jù)集為小型時(shí),數(shù)據(jù)之間的變化特點(diǎn)很容易觀察出當(dāng)數(shù)據(jù)集為小型時(shí),數(shù)據(jù)之間的變化特點(diǎn)很容易觀察出來(lái)來(lái) P隨著數(shù)據(jù)集變?yōu)橹行突虼笮?,變量的特性一般?/p>

4、現(xiàn)得越隨著數(shù)據(jù)集變?yōu)橹行突虼笮?,變量的特性一般表現(xiàn)得越來(lái)越不明顯來(lái)越不明顯 頻數(shù)分布的類別頻數(shù)分布的類別 頻數(shù)頻數(shù) 每一組包含的觀察值數(shù)目每一組包含的觀察值數(shù)目 組組 組限組限 每一組的上限和下限每一組的上限和下限 組寬組寬 上限和下限之間的間距上限和下限之間的間距 如何將數(shù)據(jù)轉(zhuǎn)換成表格如何將數(shù)據(jù)轉(zhuǎn)換成表格 ?哪些重要或必要的信息應(yīng)當(dāng)包括在內(nèi)哪些重要或必要的信息應(yīng)當(dāng)包括在內(nèi) ? 確定確定 “組數(shù)組數(shù)”和和“組寬組寬 ” 頻數(shù)分布一般包括與每組有關(guān)的頻數(shù)、累積頻數(shù)、相對(duì)頻數(shù)分布一般包括與每組有關(guān)的頻數(shù)、累積頻數(shù)、相對(duì)頻數(shù)和相對(duì)累積頻數(shù)頻數(shù)和相對(duì)累積頻數(shù)顯示每組范圍內(nèi)或其下有多少觀察值顯示每組范圍

5、內(nèi)或其下有多少觀察值 相對(duì)頻數(shù)描述每組范圍內(nèi)觀察值所占的百分比,相對(duì)頻數(shù)描述每組范圍內(nèi)觀察值所占的百分比,即每組的頻數(shù)除以觀察值的總數(shù)目即每組的頻數(shù)除以觀察值的總數(shù)目 顯示每組范圍內(nèi)或其下觀察值所占的百分比顯示每組范圍內(nèi)或其下觀察值所占的百分比 對(duì)于定性變量而言對(duì)于定性變量而言 -常常根據(jù)變量結(jié)果的種類來(lái)選擇組常常根據(jù)變量結(jié)果的種類來(lái)選擇組 例如,為了研究本班例如,為了研究本班100名學(xué)生的性別名學(xué)生的性別 - 頻數(shù) 累積頻數(shù) 男性 60 60 女性 40 100 100 對(duì)于定量變量而言對(duì)于定量變量而言 -選擇選擇“組數(shù)組數(shù)” 和和“組寬組寬 ”是主要問(wèn)題是主要問(wèn)題應(yīng)當(dāng)遵循哪些基本原則來(lái)確定

6、組應(yīng)當(dāng)遵循哪些基本原則來(lái)確定組 -1.各個(gè)組之間必須是各個(gè)組之間必須是“相互排斥相互排斥”的的 2.各個(gè)組必須將各個(gè)組必須將“所有數(shù)據(jù)均包括在內(nèi)所有數(shù)據(jù)均包括在內(nèi)” 3.組數(shù)組數(shù)K 的經(jīng)驗(yàn)法則的經(jīng)驗(yàn)法則 2K n ,此處此處n代表觀察值的總數(shù)目代表觀察值的總數(shù)目4. 各組之間的寬度最好相等,但這并不是必要條件。各組之間的寬度最好相等,但這并不是必要條件。當(dāng)組寬相等時(shí),當(dāng)組寬相等時(shí), W nW 最小觀察值最大觀察值 5.應(yīng)當(dāng)盡量避免開(kāi)口組應(yīng)當(dāng)盡量避免開(kāi)口組 6.組寬最好是整數(shù)組寬最好是整數(shù) 例如例如,為了研究某班為了研究某班100名學(xué)生的身高名學(xué)生的身高 -我們確定將整個(gè)數(shù)據(jù)分成我們確定將整個(gè)數(shù)

7、據(jù)分成5組,每組寬度相等,組,每組寬度相等,W = 10厘米厘米 身高 (厘米) 頻數(shù) 累積頻數(shù) 相對(duì)頻數(shù) 相對(duì)累積頻數(shù) 140 150 6 6 0.06 0.06 150 160 23 29 0.23 0.29 160 170 36 65 0.36 0.65 170 180 28 93 0.28 0.93 180 190 7 100 0.07 1.00 100 1.00 1. 一張整理有序的表格可以使數(shù)據(jù)中隱藏的信息清楚地表現(xiàn)出一張整理有序的表格可以使數(shù)據(jù)中隱藏的信息清楚地表現(xiàn)出 來(lái)來(lái)2. 有助于采用圖形方式來(lái)匯總數(shù)據(jù)有助于采用圖形方式來(lái)匯總數(shù)據(jù) 3數(shù)據(jù)集表格不具有唯一性數(shù)據(jù)集表格不具有唯一

8、性以下數(shù)據(jù)表示一個(gè)當(dāng)?shù)乜Х瑞^進(jìn)行的以下數(shù)據(jù)表示一個(gè)當(dāng)?shù)乜Х瑞^進(jìn)行的30筆交易筆交易 -確定確定“組數(shù)組數(shù)” 和和“組寬組寬 ”樣本大小樣本大小 n =3025 = 32 305 組組最小觀察值最小觀察值 = 14,最大觀察值最大觀察值 = 83最好采用最好采用“整數(shù)整數(shù)” W = 15 組數(shù)組數(shù) 組寬組寬 8 .1351483 組 別 頻 數(shù) 累 積 頻 數(shù) 相 對(duì) 頻 數(shù) 相對(duì)累積頻數(shù) 10 25 4 4 133. 0304 0.133 25 40 6 4+6=10 200. 0306 0.333 40 55 8 10+8=18 267. 0308 0.600 55 70 7 25 233.

9、 0307 0.833 70 85 5 30 167. 0305 1.000 30 1.000 數(shù)據(jù)必須按照升序排列數(shù)據(jù)必須按照升序排列 為了構(gòu)造圖形,我們將數(shù)值的第一個(gè)數(shù)字作為莖為了構(gòu)造圖形,我們將數(shù)值的第一個(gè)數(shù)字作為莖 莖葉排列使我們可以通過(guò)圖形來(lái)了解數(shù)據(jù)的分布莖葉排列使我們可以通過(guò)圖形來(lái)了解數(shù)據(jù)的分布 例如例如,我們想將我們想將12個(gè)數(shù)據(jù)轉(zhuǎn)換成一張莖葉圖形個(gè)數(shù)據(jù)轉(zhuǎn)換成一張莖葉圖形 : 4.4 3.6 4.4 3.7 7.6 3.9 3.6 3.5 3.0 4.5 3.8 2.22| 23| 0 5 6 6 7 8 94| 4 4 55|6|7| 6 三種最常使用的圖形類型三種最常使用的圖

10、形類型 - 直方圖直方圖 頻數(shù)多邊形頻數(shù)多邊形 分布曲線分布曲線 在構(gòu)造圖形之前,需要用頻數(shù)分布來(lái)顯示數(shù)據(jù)在構(gòu)造圖形之前,需要用頻數(shù)分布來(lái)顯示數(shù)據(jù) 應(yīng)當(dāng)將數(shù)據(jù)轉(zhuǎn)換成頻數(shù)分布表應(yīng)當(dāng)將數(shù)據(jù)轉(zhuǎn)換成頻數(shù)分布表 水平軸代表變量的數(shù)值,核對(duì)符號(hào)代表每一組的中點(diǎn)水平軸代表變量的數(shù)值,核對(duì)符號(hào)代表每一組的中點(diǎn) 垂直軸代表計(jì)數(shù)頻數(shù)或百分比頻數(shù)垂直軸代表計(jì)數(shù)頻數(shù)或百分比頻數(shù) 每個(gè)條形圖的高度與每一組的頻數(shù)或百分比相對(duì)應(yīng)每個(gè)條形圖的高度與每一組的頻數(shù)或百分比相對(duì)應(yīng) 每個(gè)條形圖的寬度與每一組的寬度相對(duì)應(yīng)每個(gè)條形圖的寬度與每一組的寬度相對(duì)應(yīng) 例如,我們?cè)诒締卧邢胪ㄟ^(guò)繪制直方圖來(lái)表示例如,我們?cè)诒締卧邢胪ㄟ^(guò)繪制直方圖

11、來(lái)表示100名學(xué)生的身名學(xué)生的身高分布高分布 身高身高185.0175.0165.0155.0145.0計(jì)數(shù)頻數(shù)計(jì)數(shù)頻數(shù)403020100身高身高190.0180.0170.0160.0150.0計(jì)數(shù)頻數(shù)計(jì)數(shù)頻數(shù)403020100200.0140.0用線段將各組中點(diǎn)和頻數(shù)(或相對(duì)頻數(shù))的交叉點(diǎn)連接起來(lái),用線段將各組中點(diǎn)和頻數(shù)(或相對(duì)頻數(shù))的交叉點(diǎn)連接起來(lái),就可以得到頻數(shù)多邊形圖形就可以得到頻數(shù)多邊形圖形 身高身高.190.0180.0170.0160.0150.0累積計(jì)數(shù)頻數(shù)累積計(jì)數(shù)頻數(shù)806040200140.0100圖形顯示了每一組的累積頻圖形顯示了每一組的累積頻數(shù)或相對(duì)累積頻數(shù)數(shù)或相對(duì)累

12、積頻數(shù) 它可以用它可以用“小于小于”或或“大于大于”來(lái)來(lái)表示表示 定性變量常常用非數(shù)值刻度來(lái)測(cè)量定性變量常常用非數(shù)值刻度來(lái)測(cè)量 對(duì)這些變量可以進(jìn)行分類對(duì)這些變量可以進(jìn)行分類 可以采用兩種最為常見(jiàn)的圖形來(lái)描述定性變量的分布可以采用兩種最為常見(jiàn)的圖形來(lái)描述定性變量的分布 餅圖餅圖 條形圖條形圖 餅圖的圓圈代表了所有觀察值的集合餅圖的圓圈代表了所有觀察值的集合 根據(jù)定性變量的類型數(shù)目將餅圖分成幾個(gè)部分根據(jù)定性變量的類型數(shù)目將餅圖分成幾個(gè)部分 餅圖每一部分的大小與每一類型的相對(duì)頻數(shù)成正比餅圖每一部分的大小與每一類型的相對(duì)頻數(shù)成正比 例如,我們可以用餅圖來(lái)描述某班例如,我們可以用餅圖來(lái)描述某班100名學(xué)

13、生的性別分布狀名學(xué)生的性別分布狀況況 男性男性60%女性女性40% 對(duì)于定性變量而言,條形圖表示每一類型的百分比或?qū)τ诙ㄐ宰兞慷?,條形圖表示每一類型的百分比或 計(jì)數(shù)頻數(shù)計(jì)數(shù)頻數(shù) 每個(gè)條形圖的高度代表每一類型的百分比或比例每個(gè)條形圖的高度代表每一類型的百分比或比例 條形圖的寬度沒(méi)有意義,所有類型的寬度均相同條形圖的寬度沒(méi)有意義,所有類型的寬度均相同 例如,我們用條形圖來(lái)顯示某班例如,我們用條形圖來(lái)顯示某班100名學(xué)生的性別分布狀況名學(xué)生的性別分布狀況020406080男性男性女性女性 餅圖餅圖 :圖形圖形 餅圖餅圖 對(duì)各組情形進(jìn)行總結(jié)對(duì)各組情形進(jìn)行總結(jié) 條形圖條形圖 :圖形圖形 條形圖條形圖

14、對(duì)各組情形進(jìn)行總結(jié)對(duì)各組情形進(jìn)行總結(jié) 直方圖直方圖 :圖形圖形 直方圖直方圖 選擇關(guān)心的變量選擇關(guān)心的變量 莖葉圖形莖葉圖形 :分析分析 描述統(tǒng)計(jì)學(xué)描述統(tǒng)計(jì)學(xué) 尋找尋找 選擇繪圖選項(xiàng)選擇繪圖選項(xiàng) 所有觀察值所有觀察值 的平均值的平均值均值均值 所有觀察值中位于最中心位置的那個(gè)值所有觀察值中位于最中心位置的那個(gè)值 中位數(shù)中位數(shù) 出現(xiàn)最頻繁的數(shù)據(jù)值出現(xiàn)最頻繁的數(shù)據(jù)值 眾數(shù)眾數(shù) 均值均值 -總體均值總體均值 N總體大小總體中所有觀察值之和Nx樣本均值樣本均值 n樣本大小樣本中所有觀察值之和nxxKim 測(cè)驗(yàn)的平均成績(jī)等于測(cè)驗(yàn)的平均成績(jī)等于 在此我們可以看到,在匯總在此我們可以看到,在匯總Kim的測(cè)驗(yàn)

15、成績(jī)時(shí),均值并不能發(fā)揮的測(cè)驗(yàn)成績(jī)時(shí),均值并不能發(fā)揮很好的作用。在大多數(shù)情況下,很好的作用。在大多數(shù)情況下,Kim的測(cè)驗(yàn)成績(jī)低于的測(cè)驗(yàn)成績(jī)低于30分,她只分,她只在一次測(cè)驗(yàn)中意外地獲得了在一次測(cè)驗(yàn)中意外地獲得了98的高分,因此她的平均成績(jī)被提高的高分,因此她的平均成績(jī)被提高到到35分。分。 355261925987 Kim是一名中等學(xué)校的學(xué)生,她上星期進(jìn)行了是一名中等學(xué)校的學(xué)生,她上星期進(jìn)行了5次測(cè)驗(yàn),成次測(cè)驗(yàn),成績(jī)分別如下績(jī)分別如下 7, 98, 25, 19, 和和26均值對(duì)極值表現(xiàn)得非常敏感均值對(duì)極值表現(xiàn)得非常敏感 如果數(shù)據(jù)中存在極值(或者說(shuō)數(shù)據(jù)分布有所偏斜),那么如果數(shù)據(jù)中存在極值(或者

16、說(shuō)數(shù)據(jù)分布有所偏斜),那么均值就不能很好地測(cè)度集中趨勢(shì)均值就不能很好地測(cè)度集中趨勢(shì) 中位數(shù)中位數(shù) (Md) -1.將將n個(gè)觀察值按升序或降序排列個(gè)觀察值按升序或降序排列 2.如果觀察值個(gè)數(shù)是奇數(shù),則中位數(shù)就是位于最中心位置的那個(gè)觀如果觀察值個(gè)數(shù)是奇數(shù),則中位數(shù)就是位于最中心位置的那個(gè)觀察值,即數(shù)據(jù)集中的第察值,即數(shù)據(jù)集中的第 個(gè)觀察值個(gè)觀察值 3.如果觀察值個(gè)數(shù)是偶數(shù),則中位數(shù)就是位于正中心兩個(gè)觀察值的如果觀察值個(gè)數(shù)是偶數(shù),則中位數(shù)就是位于正中心兩個(gè)觀察值的平均值,即數(shù)據(jù)集中的第平均值,即數(shù)據(jù)集中的第 個(gè)和第個(gè)和第 個(gè)觀察值的平均值個(gè)觀察值的平均值 thn)21( thn)2(thn)12(

17、舉例舉例: 有有6名工人組成一個(gè)樣本,請(qǐng)找出他們每周工資的中位名工人組成一個(gè)樣本,請(qǐng)找出他們每周工資的中位數(shù)數(shù) 151179163142180195按升序重新排列每周的工資按升序重新排列每周的工資 142151163179180195 最中心位置的最中心位置的兩個(gè)兩個(gè)數(shù)值數(shù)值 求這兩個(gè)數(shù)值的平均數(shù)求這兩個(gè)數(shù)值的平均數(shù) 中位數(shù)中位數(shù) = 1712179163 Kim的5次測(cè)驗(yàn)成績(jī) 又如何呢?Kim成績(jī)的中位數(shù)為成績(jī)的中位數(shù)為25看來(lái)中位數(shù)能更好地測(cè)度看來(lái)中位數(shù)能更好地測(cè)度Kim測(cè)驗(yàn)成績(jī)的中心位置測(cè)驗(yàn)成績(jī)的中心位置 -中位數(shù)不受中位數(shù)不受“極值極值”的影響的影響 眾數(shù)眾數(shù) (Mo) -并不經(jīng)常用眾

18、數(shù)來(lái)測(cè)度中心位置并不經(jīng)常用眾數(shù)來(lái)測(cè)度中心位置適用于定性變量適用于定性變量 眾數(shù)不具有唯一性眾數(shù)不具有唯一性 舉例舉例: 有有6名工人組成一個(gè)樣本,請(qǐng)找出他們每周工資的眾數(shù)名工人組成一個(gè)樣本,請(qǐng)找出他們每周工資的眾數(shù) 151 179 163 142 180 195 不存在不存在 眾數(shù)眾數(shù) 151 180 163 142 180 195 180 142 180 163 142 180 195 142 和和180 (雙峰雙峰 )對(duì)對(duì)兩個(gè)旅行團(tuán)的小孩年齡進(jìn)行了數(shù)據(jù)調(diào)查,以下是調(diào)兩個(gè)旅行團(tuán)的小孩年齡進(jìn)行了數(shù)據(jù)調(diào)查,以下是調(diào)查結(jié)果:查結(jié)果: -年齡年齡 : 14, 17, 11, 10, 11, 14,

19、9, 12, 8, 10, 9均值均值 36.11119.111714 中位數(shù)中位數(shù) 11眾數(shù)眾數(shù) 9, 10 , 11 和和 14 (有有4 個(gè)眾數(shù)個(gè)眾數(shù) ) age: 9, 14, 8, 10, 13, 7, 9, 11, 16, 10, 12, 9均值均值 67.10129.149 中位數(shù)中位數(shù) 10眾數(shù)眾數(shù) 9均值、中位數(shù)和眾數(shù)之間的關(guān)系均值、中位數(shù)和眾數(shù)之間的關(guān)系 -1. 對(duì)稱分布對(duì)稱分布 (均值均值 = Md = Mo) 均值均值 = Md = Mo均值、中位數(shù)和眾數(shù)之間的關(guān)系均值、中位數(shù)和眾數(shù)之間的關(guān)系 -2.傾向左側(cè)傾向左側(cè) (均值均值 Md Md Mo) MdMo均值均值為了

20、計(jì)算分組數(shù)據(jù)的為了計(jì)算分組數(shù)據(jù)的均值均值 計(jì)算每一組的中點(diǎn)計(jì)算每一組的中點(diǎn) 假設(shè)觀察值都落在各組的中點(diǎn)上假設(shè)觀察值都落在各組的中點(diǎn)上 總體均值總體均值 樣本均值樣本均值 Nfx nfxX 下列頻數(shù)分布顯示了某家公司下列頻數(shù)分布顯示了某家公司50名工人的每周工資名工人的每周工資收入,估計(jì)每周工資的平均水平收入,估計(jì)每周工資的平均水平 每周工資收入 工人人數(shù)(f) 140 149 4 150 159 6 160 169 9 170 179 12 180 189 9 190 199 7 200 209 3 每周工資收入 工人人數(shù)(f) 中中點(diǎn)點(diǎn) (x) fx 140 149 4 144.5 578.

21、0 150 159 6 154.5 927.0 160 169 9 164.5 1480.5 170 179 12 174.5 2094.0 180 189 9 184.5 1660.5 190 199 7 194.5 1361.5 200 209 3 204.5 613.5 50 fN 0 .8715fx 3 .174500 .8715 Nfx 每周的平均工資每周的平均工資為了計(jì)算分組數(shù)據(jù)的為了計(jì)算分組數(shù)據(jù)的中位數(shù)中位數(shù) 計(jì)算每一組的累積頻數(shù)計(jì)算每一組的累積頻數(shù) 包括包括“最中心位置最中心位置” 觀察值的那一組就是觀察值的那一組就是“中位數(shù)組中位數(shù)組” ddMMdfcnwLM 2LMd :中

22、位數(shù)組的下中位數(shù)組的下 限限fMd :中位數(shù)組的頻數(shù)中位數(shù)組的頻數(shù) w :中位數(shù)組的寬度中位數(shù)組的寬度 c :位于中位數(shù)組之前那一組的累位于中位數(shù)組之前那一組的累積頻數(shù)積頻數(shù) 繼續(xù)討論前面的例子,即計(jì)算繼續(xù)討論前面的例子,即計(jì)算50名工人每周工資名工人每周工資收入的中位數(shù)收入的中位數(shù)每周工資收入 實(shí)際組限 工人人數(shù)(f) c.f. 140 149 139.5 149.5 4 4 150 159 149.5 159.5 6 10 160 169 159.5 169.5 9 19 170 179 169.5 179.5 12 31 包括最中心數(shù)值的那一組 180 189 179.5 189.5 9

23、 40 190 199 189.5 199.5 7 47 200 209 199.5 209.5 3 50 LMd = 169.5fMd = 12w = 10c = 19中位數(shù)組中位數(shù)組 170 1795 .17455 .169126105 .1691219250105 .1692 ddMMdfcnwLM每周工資收入的中位數(shù)每周工資收入的中位數(shù)為了計(jì)算分組數(shù)據(jù)的為了計(jì)算分組數(shù)據(jù)的眾數(shù)眾數(shù) 出現(xiàn)最頻繁的那一組就是出現(xiàn)最頻繁的那一組就是“眾數(shù)組眾數(shù)組” 2110dddwLMMo LMo :眾數(shù)組的下限眾數(shù)組的下限 d1 : 眾數(shù)組的頻數(shù)減去眾數(shù)組眾數(shù)組的頻數(shù)減去眾數(shù)組之前之前那那一組的頻數(shù)一組的頻

24、數(shù) w :眾數(shù)組的寬度眾數(shù)組的寬度 d2 : 眾數(shù)組的頻數(shù)減去眾數(shù)組眾數(shù)組的頻數(shù)減去眾數(shù)組之后之后那那一組的頻數(shù)一組的頻數(shù) 繼續(xù)討論前面的例子,即計(jì)算繼續(xù)討論前面的例子,即計(jì)算50名工人每周工資收入的眾數(shù)名工人每周工資收入的眾數(shù)每周工資收入 實(shí)際組限 工人人數(shù)(f) 140 149 139.5 149.5 4 150 159 149.5 159.5 6 160 169 159.5 169.5 9 170 179 169.5 179.5 12 出現(xiàn)最頻繁的那一組 180 189 179.5 189.5 9 190 199 189.5 199.5 7 200 209 199.5 209.5 3 L

25、Mo = 169.5w = 10d1 = 12 9 = 3眾數(shù)組眾數(shù)組 170 1795 .17455 .16963105 .169333105 .169211 dddwLMOMo每周工資收入的眾數(shù)每周工資收入的眾數(shù)d2 = 12 9 = 3 優(yōu)點(diǎn) 缺點(diǎn) 均值 1. 直觀清晰 2. 可用于比較定量 數(shù)據(jù)集 1. 可能會(huì)受極值影響 2. 計(jì)算煩瑣 3. 如果數(shù)據(jù)集有開(kāi)口組,則無(wú)法對(duì)其進(jìn)行計(jì)算 4. 不適用于定性變量 中位數(shù) 1. 不受極值影響 2. 可用于計(jì)算有開(kāi)口組的數(shù)據(jù)集 3. 適用于定量變量和按順序排列的定性變量 1. 很費(fèi)時(shí)間 2. 在進(jìn)行統(tǒng)計(jì)推斷時(shí),可靠性比“均值”要差 眾數(shù) 1. 不

26、受極值影響 2. 可用于計(jì)算有開(kāi)口組的數(shù)據(jù)集 1. 有些數(shù)據(jù)集沒(méi)有 眾數(shù) 2. 可能會(huì)出現(xiàn)多個(gè)眾數(shù) 舉例舉例:A A列數(shù)據(jù)列數(shù)據(jù): : 55 56 57 58 59 60 61 62 63 64 65均值均值 = Md = Mo = 60B B列數(shù)據(jù)列數(shù)據(jù): : 35 40 45 50 55 60 65 70 75 80 85均值均值= Md = Mo = 60測(cè)度離中趨勢(shì)最常用的三種方法測(cè)度離中趨勢(shì)最常用的三種方法 -1.全距全距 2.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 (SD)3.變異系數(shù)變異系數(shù) (CV)全距全距 =最大觀察值最大觀察值 最小觀察值最小觀察值 全距有兩個(gè)主要缺點(diǎn)全距有兩個(gè)主要缺點(diǎn) -1.對(duì)數(shù)據(jù)

27、集中的極值顯得非常敏感對(duì)數(shù)據(jù)集中的極值顯得非常敏感 2. 忽略了位于最大觀察值與最小觀察值之間的數(shù)據(jù)是如忽略了位于最大觀察值與最小觀察值之間的數(shù)據(jù)是如何分布的何分布的有有5名工人組成一個(gè)樣本,請(qǐng)找出他們每周工資的全距名工人組成一個(gè)樣本,請(qǐng)找出他們每周工資的全距 151179163142180X最大值最大值 = 180X最小值最小值 = 142全距全距 = 180 142 = 38標(biāo)準(zhǔn)差可以讓我們大致了解數(shù)據(jù)值距離標(biāo)準(zhǔn)差可以讓我們大致了解數(shù)據(jù)值距離均值有多遠(yuǎn)均值有多遠(yuǎn) 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 , Nx2)( 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 , s1)(2 nXxs計(jì)算標(biāo)準(zhǔn)差的其他公式計(jì)算標(biāo)準(zhǔn)差

28、的其他公式 總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 :222)( NxNx樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 :11)(222 nXnxnXxs舉例:舉例:有有5名工人組成一個(gè)名工人組成一個(gè)總體總體,請(qǐng)找出他們每周工資的標(biāo)準(zhǔn)差,請(qǐng)找出他們每周工資的標(biāo)準(zhǔn)差 151179163142180X X (X )2 151 -12 144 179 16 256 163 0 0 142 -21 441 180 17 289 X = 815 (X )2=1130 1635815 Nx 03.1551130)(2 Nx 數(shù)據(jù)分布的經(jīng)驗(yàn)法則數(shù)據(jù)分布的經(jīng)驗(yàn)法則 -當(dāng)數(shù)據(jù)集接近對(duì)稱分布時(shí)當(dāng)數(shù)據(jù)集接近對(duì)稱分布時(shí) ,則大約,則大約 68.3 %的數(shù)據(jù)落

29、在均值的的數(shù)據(jù)落在均值的1倍標(biāo)準(zhǔn)差范圍內(nèi)倍標(biāo)準(zhǔn)差范圍內(nèi) 95.5 %的數(shù)據(jù)落在均值的的數(shù)據(jù)落在均值的2倍標(biāo)準(zhǔn)差范圍內(nèi)倍標(biāo)準(zhǔn)差范圍內(nèi) 99.7 5%的數(shù)據(jù)落在均值的的數(shù)據(jù)落在均值的3倍標(biāo)準(zhǔn)差范圍內(nèi)倍標(biāo)準(zhǔn)差范圍內(nèi) 測(cè)量數(shù)據(jù)相對(duì)于均值的離中趨勢(shì)測(cè)量數(shù)據(jù)相對(duì)于均值的離中趨勢(shì) 變異系數(shù)變異系數(shù) (CV)%100均值標(biāo)準(zhǔn)差CV? 什么時(shí)候采用變異系數(shù)什么時(shí)候采用變異系數(shù) (CV) 來(lái)測(cè)度離中趨勢(shì)來(lái)測(cè)度離中趨勢(shì) ? 比較具有不同單位的數(shù)據(jù)集比較具有不同單位的數(shù)據(jù)集 比較具有不同幅度的數(shù)據(jù)集比較具有不同幅度的數(shù)據(jù)集 舉例舉例:例如,我們想比較例如,我們想比較1993年年2月至月至1994年年1月期間黃金和鋅塊

30、的月期間黃金和鋅塊的價(jià)格波動(dòng)情況,我們收集了價(jià)格數(shù)據(jù)并得出如下計(jì)算結(jié)果:價(jià)格波動(dòng)情況,我們收集了價(jià)格數(shù)據(jù)并得出如下計(jì)算結(jié)果: 42.364$ X黃金黃金:4592. 0$ X鋅塊鋅塊 :每盎司每盎司 50.21$ s每磅每磅 0247. 0$ sCV表示每種商品相對(duì)于其自身平均價(jià)格的波動(dòng)幅度表示每種商品相對(duì)于其自身平均價(jià)格的波動(dòng)幅度 :黃金黃金:鋅塊鋅塊 :%9 . 5%10042.36250.21 CV%38. 5%1004592. 00247. 0 CV為了計(jì)算分組數(shù)據(jù)的為了計(jì)算分組數(shù)據(jù)的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 計(jì)算每一組的中點(diǎn)計(jì)算每一組的中點(diǎn) 假設(shè)觀察值都落在各組的中點(diǎn)上假設(shè)觀察值都落在各組的中點(diǎn)

31、上 總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 Nxf2)( 1)(2 nXxfs總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 Nxf2)( 1)(2 nXxfs樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 計(jì)算標(biāo)準(zhǔn)差的其他公式計(jì)算標(biāo)準(zhǔn)差的其他公式 舉例舉例:計(jì)算工人每周工資的計(jì)算工人每周工資的總體總體標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 -每周工資收入 工人人數(shù)(f) 140 149 4 150 159 6 160 169 9 170 179 12 180 189 9 190 199 7 200 209 3 每周工資收入 工人人數(shù)( f) 中點(diǎn)中點(diǎn) (x) (x )(x )2 f(x )2 140 149 4 144.5 -29.8 888.04 3552.16

32、 150 159 6 154.5 -19.8 392.04 2352.24 160 169 9 164.5 - 9.8 96.04 864.36 170 179 12 174.5 -0.2 0.04 0.48 180 189 9 184.5 -10.2 104.04 936.36 190 199 7 194.5 20.2 408.05 2856.28 200 209 3 204.5 30.2 912.04 2736.12 N = f = 50 f (x )2 = 13298 31.165013298)(2 Nxf 總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 計(jì)算工人每周工資的計(jì)算工人每周工資的樣本樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差每周工資收入 工人人數(shù)(f) 140 149 4 150 159 6 160 169 9 170 179 12 180 189 9 190 199 7 200 209 3 每周工資收入 工人人數(shù)( f) 中點(diǎn)中點(diǎn) (x) (x )(x )2 f(x )2 140 149 4 144.5 -29.8 888.04 3552.16 150 159 6 154.5 -19.8 392.04 2352

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論