第二章統(tǒng)計(jì)數(shù)據(jù)的描述課件_第1頁(yè)
第二章統(tǒng)計(jì)數(shù)據(jù)的描述課件_第2頁(yè)
第二章統(tǒng)計(jì)數(shù)據(jù)的描述課件_第3頁(yè)
第二章統(tǒng)計(jì)數(shù)據(jù)的描述課件_第4頁(yè)
第二章統(tǒng)計(jì)數(shù)據(jù)的描述課件_第5頁(yè)
已閱讀5頁(yè),還剩121頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、華南理工大學(xué)精品課程統(tǒng)計(jì)學(xué)統(tǒng)計(jì)數(shù)據(jù)的描述第二章華南理工大學(xué)精品課程第二章 統(tǒng)計(jì)數(shù)據(jù)的描述錄取中有無歧視?某高校只有兩個(gè)系,財(cái)經(jīng)系和工程系。該校報(bào)考及錄取的總體情況如下:男生女生錄取350200未錄取450400報(bào)考人數(shù)800600引例:華南理工大學(xué)精品課程第二章 統(tǒng)計(jì)數(shù)據(jù)的描述 如果我們只看該校男女生錄取的比率,即男生350/800=44%, 女生200/600=33%。這時(shí)我們不免會(huì)問,是男同學(xué)的成績(jī)比女同學(xué)好,還是在錄取中存在著性別的歧視?學(xué)過統(tǒng)計(jì)學(xué)的同學(xué)不會(huì)簡(jiǎn)單地做出結(jié)論,而是繼續(xù)搜集數(shù)據(jù)并得到兩個(gè)系各自錄取的男女生數(shù)據(jù):引例:華南理工大學(xué)精品課程第二章 統(tǒng)計(jì)數(shù)據(jù)的描述工程系財(cái)經(jīng)系男生女

2、生男生女生錄取30010050100未錄取300100150300報(bào)考人數(shù)600200200400引例:華南理工大學(xué)精品課程第二章 統(tǒng)計(jì)數(shù)據(jù)的描述 有了分系的錄取數(shù)據(jù),不難看到工程系錄取的人數(shù)比較多,男女生錄取的比率都是50%。 而財(cái)經(jīng)系招生名額較少,男女生錄取的比率都是25%。由于女生報(bào)財(cái)經(jīng)系的人多,男生報(bào)工科的人多,因而導(dǎo)致男生整個(gè)錄取率偏高,而女生偏低。這個(gè)例子告訴我們對(duì)數(shù)據(jù)一是要從不同角度進(jìn)行分析,二是要注意權(quán)數(shù)的影響,這就是本章要討論的問題。引例:華南理工大學(xué)精品課程6引例提問錄取中有無歧視?Q1Q2Q3統(tǒng)計(jì)學(xué)怎樣對(duì)數(shù)據(jù)進(jìn)行有效分析?怎樣理解權(quán)數(shù)對(duì)均值的影響?華南理工大學(xué)精品課程7本

3、章學(xué)習(xí)內(nèi)容1.學(xué)習(xí)如何用數(shù)據(jù)對(duì)客觀事物進(jìn)行計(jì)量, 如何獲取數(shù)據(jù)以及對(duì)數(shù)據(jù)質(zhì)量的評(píng)價(jià)2.如何對(duì)獲取的數(shù)據(jù)進(jìn)行整理3.數(shù)據(jù)分布的集中趨勢(shì)和離散程度4.非正態(tài)總體的分布偏態(tài)和峰度5.莖葉圖和箱線圖的特點(diǎn)和優(yōu)勢(shì)6.統(tǒng)計(jì)表及統(tǒng)計(jì)圖華南理工大學(xué)精品課程8本章學(xué)習(xí)目標(biāo) 了解數(shù)據(jù)的計(jì)量尺度 了解統(tǒng)計(jì)數(shù)據(jù)的來源和數(shù)據(jù)的質(zhì)量要求 掌握數(shù)值型數(shù)據(jù)的整理方法 掌握數(shù)據(jù)集中趨勢(shì)和離散程度的測(cè)度方法 掌握莖葉圖和箱線圖的制作方法 掌握分布偏態(tài)與峰度的測(cè)度方法 掌握統(tǒng)計(jì)表和統(tǒng)計(jì)圖的使用華南理工大學(xué)精品課程9第一節(jié) 數(shù)據(jù)的計(jì)量尺度2.42.5第二章具體章節(jié)結(jié)構(gòu) 第二節(jié) 統(tǒng)計(jì)數(shù)據(jù)的來源第三節(jié) 統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量第

4、四節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理第五節(jié) 分布集中趨勢(shì)的測(cè)度華南理工大學(xué)精品課程10第六節(jié) 分布離散程度的測(cè)度2.9第七節(jié) 分布偏態(tài)與峰度的測(cè)度第八節(jié) 莖葉圖與箱線圖第九節(jié) 統(tǒng)計(jì)表與統(tǒng)計(jì)圖第二章具體章節(jié)結(jié)構(gòu) 華南理工大學(xué)精品課程第一節(jié) 數(shù)據(jù)的計(jì)量尺度 按照計(jì)量學(xué)的一般分類方法,對(duì)數(shù)據(jù)分為四種計(jì)量尺度,即: 一、列名尺度二、順序尺度三、間隔尺度四、比率尺度華南理工大學(xué)精品課程12列名尺度 (Nominal scale)也稱名義尺度或分類尺度計(jì)量層次最低對(duì)事物進(jìn)行平行的分類各類別可以指定數(shù)字代碼表示使用時(shí)必須符合類別窮盡和互斥的要求數(shù)據(jù)表現(xiàn)為“類別”具有=或的數(shù)學(xué)特性華南理工大學(xué)精品課程13順

5、序尺度 (Ordinal scale)也稱定序尺度對(duì)事物分類的同時(shí)給出各類別的順序比定類尺度精確未測(cè)量出類別之間的準(zhǔn)確差值數(shù)據(jù)表現(xiàn)為“類別”,但有序具有或的數(shù)學(xué)特性華南理工大學(xué)精品課程14間隔尺度 (Interval scale)也稱間隔尺度對(duì)事物的準(zhǔn)確測(cè)度比定序尺度精確數(shù)據(jù)表現(xiàn)為“數(shù)值”沒有絕對(duì)零點(diǎn)具有 + 或 - 的數(shù)學(xué)特性華南理工大學(xué)精品課程15比率尺度 (Ratio scale)也稱比率尺度對(duì)事物的準(zhǔn)確測(cè)度與定距尺度處于同一層次數(shù)據(jù)表現(xiàn)為“數(shù)值”有絕對(duì)零點(diǎn)具有 或 的數(shù)學(xué)特性華南理工大學(xué)精品課程16四種計(jì)量尺度的比較定類尺度定序尺度定距尺度定比尺度 分類( = , ) 排序( ) 間距

6、( + ,- ) 比值( , ) “”表示該尺度所具有的特性表2-1 四種計(jì)量尺度的比較華南理工大學(xué)精品課程17本節(jié)提問數(shù)據(jù)的計(jì)量尺度分為哪幾種?Q1Q2Q3不同計(jì)量尺度各有什么特點(diǎn)?間隔尺度和比例尺度有何區(qū)別?華南理工大學(xué)精品課程第二節(jié) 統(tǒng)計(jì)數(shù)據(jù)的來源 統(tǒng)計(jì)數(shù)據(jù)來源于直接組織的調(diào)查、觀察和科學(xué)試驗(yàn),我們稱之為第一手?jǐn)?shù)據(jù)或直接的數(shù)據(jù);或者來源于已有的數(shù)據(jù),我們稱之為第二手?jǐn)?shù)據(jù)或間接的數(shù)據(jù)。一、間接獲取的數(shù)據(jù) 二、直接獲取的數(shù)據(jù)華南理工大學(xué)精品課程19間接取得的數(shù)據(jù)統(tǒng)計(jì)部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計(jì)年鑒各類經(jīng)濟(jì)信息中心、信息咨詢機(jī)構(gòu)、專業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類專業(yè)期刊、報(bào)紙、書籍所提

7、供的資料各種會(huì)議,如博覽會(huì)、展銷會(huì)、交易會(huì)及專業(yè)性、學(xué)術(shù)性研討會(huì)上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料中國(guó)統(tǒng)計(jì)年鑒2001中國(guó)人口統(tǒng)計(jì)年鑒中國(guó)市場(chǎng)統(tǒng)計(jì)年鑒世界發(fā)展報(bào)告世界經(jīng)濟(jì)年檢工業(yè)普查數(shù)據(jù)中國(guó)統(tǒng)計(jì)出版社華南理工大學(xué)精品課程20提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站中國(guó)政府及相關(guān)機(jī)構(gòu) 網(wǎng)址數(shù)據(jù)內(nèi)容國(guó)家統(tǒng)計(jì)局http:/統(tǒng)計(jì)年鑒、統(tǒng)計(jì)月報(bào)等國(guó)務(wù)院發(fā)展研究中心信息網(wǎng)http:/宏觀經(jīng)濟(jì)、財(cái)經(jīng)、貨幣金融等 中國(guó)經(jīng)濟(jì)信息網(wǎng)http:/經(jīng)濟(jì)信息及各類網(wǎng)站華通數(shù)據(jù)中心http:/國(guó)家統(tǒng)計(jì)局授權(quán)的數(shù)據(jù)中心中國(guó)決策信息網(wǎng)http:/決策知識(shí)及案例三農(nóng)數(shù)據(jù)網(wǎng)http:/三農(nóng)信息、論壇及相關(guān)網(wǎng)站表2-2 提供統(tǒng)計(jì)數(shù)

8、據(jù)的部分政府網(wǎng)站華南理工大學(xué)精品課程21提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站美國(guó)政府機(jī)構(gòu) 網(wǎng)址數(shù)據(jù)內(nèi)容人口普查局http:/人口和家庭等聯(lián)邦儲(chǔ)備局http:/www.bog.frb.fed.us貨幣供應(yīng)、信譽(yù)、匯率等預(yù)算編制辦公室http:/omb財(cái)政收入、支出、債券等商務(wù)部http:/商業(yè)、工業(yè)等表2-2 提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站(續(xù)表)華南理工大學(xué)精品課程22普查 (census)為特定目的專門組織的非經(jīng)常性全面調(diào)查通常是一次性或周期性的一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間數(shù)據(jù)的規(guī)范化程度較高應(yīng)用范圍比較狹窄總體華南理工大學(xué)精品課程23抽樣調(diào)查 (sampling survey)1.從總體中隨機(jī)抽取一部

9、分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推斷總體特征的數(shù)據(jù)收集方法 2.具有經(jīng)濟(jì)性、時(shí)效性強(qiáng)、 適應(yīng)面廣、準(zhǔn)確性 高等特點(diǎn)總體隨機(jī)樣本華南理工大學(xué)精品課程24本節(jié)提問簡(jiǎn)要說明統(tǒng)計(jì)數(shù)據(jù)的來源?Q1Q2獲取直接統(tǒng)計(jì)數(shù)據(jù)的渠道主要有哪些?華南理工大學(xué)精品課程第三節(jié) 統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量 統(tǒng)計(jì)數(shù)據(jù)的誤差: 一、抽樣誤差二、非抽樣誤差華南理工大學(xué)精品課程26統(tǒng)計(jì)數(shù)據(jù)的誤差華南理工大學(xué)精品課程27抽樣誤差 (sampling error)由于抽樣的隨機(jī)性所帶來的誤差 所有樣本可能的結(jié)果與總體真值之間的平均性差異 影響抽樣誤差大小的因素樣本量的大小總體的變異性華南理工大學(xué)精品課程28非抽樣誤差 (non-sa

10、mpling error)相對(duì)于抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測(cè)量誤差華南理工大學(xué)精品課程29誤差的控制抽樣誤差可計(jì)算和控制非抽樣誤差的控制 調(diào)查員的挑選 調(diào)查員的培訓(xùn) 督導(dǎo)員的調(diào)查專業(yè)水平 調(diào)查過程控制 調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評(píng)估 現(xiàn)場(chǎng)調(diào)查人員進(jìn)行獎(jiǎng)懲的制度華南理工大學(xué)精品課程30本節(jié)提問簡(jiǎn)要說明抽樣誤差和非抽樣誤差?Q1Q2非抽樣誤差的控制有哪些途徑?華南理工大學(xué)精品課程第四節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理一、統(tǒng)計(jì)數(shù)據(jù)的分組 二、次數(shù)分配三、次數(shù)分配直方圖四、

11、洛倫茨曲線華南理工大學(xué)精品課程32統(tǒng)計(jì)數(shù)據(jù)的分組 統(tǒng)計(jì)分組是統(tǒng)計(jì)整理的第一步,它是按照統(tǒng)計(jì)研究的目的,將數(shù)據(jù)分別分入不同的組內(nèi)。在本章第一節(jié)中,我們將數(shù)據(jù)分成四種計(jì)量尺度,即列名尺度、順序尺度、間隔尺度和比例尺度。其中列名尺度和順序尺度的數(shù)據(jù)是按照事物的性質(zhì)和屬性劃分的,因而又稱為按品質(zhì)標(biāo)志分組;間隔尺度和比例尺度是按照事物的數(shù)量標(biāo)準(zhǔn)劃分的,又稱為數(shù)量標(biāo)志分組。 華南理工大學(xué)精品課程33組距分組(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用 不等距分組華南理工大學(xué)精品課程34組距分組 (步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠

12、顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距:組距(class width)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表華南理工大學(xué)精品課程35組距分組 (幾個(gè)概念)1. 下限(low limit) :一個(gè)組的最小值2. 上限(upper limit) :一個(gè)組的最大值3. 組距(class width) :上限與下限之差4. 組中值(class midpoint) :下限與上限之間的中點(diǎn)值下限值+上限值2組中值 =華南理工大學(xué)精品課程36案例分析 次數(shù)分配表的編制【例】 某車間30名工人每周加工

13、某種零件件數(shù)如右表試對(duì)數(shù)據(jù)進(jìn)行分組。 工人編號(hào)周加工零件數(shù)工人編號(hào)周加工零件數(shù)工人編號(hào)周加工零件數(shù)12345678910106841109110991111107121105111213141516171819209994119881189720310695106212223242526272829308510610110596105107128111101表2-3 某車間30名工人周加工零件數(shù) (單位:件)華南理工大學(xué)精品課程37案例分析 次數(shù)分配表表2-4 某車間30名工人周加工零件數(shù)的頻數(shù)分布按周加工零件數(shù)分組次 數(shù)80 9090 100100 110110 120120 1303713

14、52合計(jì)30華南理工大學(xué)精品課程38使用Excel頻數(shù)函數(shù) (FREQUENCY) Excel的“直方圖”工具的缺陷是:頻數(shù)分布和直方圖沒有與數(shù)據(jù)聯(lián)系起來,這樣,如果你改變?nèi)魏我粋€(gè)數(shù)據(jù),頻數(shù)分布表和直方圖不會(huì)跟著改變 使用Excel中的統(tǒng)計(jì)函數(shù)“FREQUENCY”來創(chuàng)建 頻數(shù)分布表和直方圖,可解決這一問題。華南理工大學(xué)精品課程39使用Excel頻數(shù)函數(shù) (FREQUENCY)創(chuàng)建頻數(shù)分布表的步驟是:選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計(jì)函數(shù)中的“FREQUENCY”函數(shù)在對(duì)話框 Date-array 后輸入數(shù)據(jù)區(qū)域,在Bins-array后輸入接受區(qū)域同時(shí)按下ct

15、rl-shift-Enter組合鍵,即得到頻數(shù)分布統(tǒng)計(jì)函數(shù)FREQUENCY華南理工大學(xué)精品課程40分組數(shù)據(jù)的圖示 (直方圖的繪制)我一眼就看出來了,周加工零件在100110之間的人數(shù)最多!圖2-1 某車間工人周加工零件直方圖華南理工大學(xué)精品課程41分組數(shù)據(jù)的圖示 (折線圖的繪制)折線圖與直方圖下的面積相等!圖2-2 某車間工人周加工零件折線圖 華南理工大學(xué)精品課程42次數(shù)分配的類型對(duì)稱分布右偏分布左偏分布正J型分布反J型分布U型分布圖2-3 幾種常見的頻數(shù)分布華南理工大學(xué)精品課程43洛倫茨曲線20世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨(M.E. Lorentz)根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特(V. P

16、areto)提出的收入分配公式繪制而成描述收入和財(cái)富分配性質(zhì)的曲線分析該國(guó)家或地區(qū)分配的平均程度AB累積的人口百分比 絕對(duì)公平線 累積的收入百分比 華南理工大學(xué)精品課程44基尼系數(shù)20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G. Gini)根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標(biāo)A表示實(shí)際收入曲線與絕對(duì)平均線之間的面積B表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積如果A=0,則基尼系數(shù)=0,表示收入絕對(duì)平均華南理工大學(xué)精品課程45基尼系數(shù)5.如果B=0,則基尼系數(shù)=1,表示收入絕對(duì)不平均6.基尼系數(shù)在0 和1之間取值7.一般認(rèn)為:基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當(dāng)?shù)模?/p>

17、即一個(gè)社會(huì)既有效率又沒有造成極大的分配不公;基尼系數(shù)在0.4被認(rèn)為是收入分配不公平的警戒線,超過了0.4應(yīng)該采取措施縮小這一差距。AB華南理工大學(xué)精品課程46本節(jié)提問描述次數(shù)分配表的編制過程。Q1Q2Q3解釋洛倫茨曲線及其用途。說明基尼系數(shù)的含義和用途。華南理工大學(xué)精品課程第五節(jié) 分布集中趨勢(shì)的測(cè)度一、眾數(shù)二、中位數(shù)三、四分位數(shù)四、均值五、幾何均值六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較華南理工大學(xué)精品課程48眾數(shù) (mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)華南理工大學(xué)精品課程4

18、9眾數(shù) (不惟一性)無眾數(shù)原始數(shù)據(jù): 11 3 7 12 9 8一個(gè)眾數(shù)原始數(shù)據(jù): 7 4 6 13 4 4多于一個(gè)眾數(shù)原始數(shù)據(jù): 17 15 25 33 24 24華南理工大學(xué)精品課程50中位數(shù) (median)1.排序后處于中間位置上的值2.不受極端值的影響3.主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)4.各變量值與中位數(shù)的離差絕對(duì)值之和最小,即Me50%50%華南理工大學(xué)精品課程51中位數(shù) (位置的確定)華南理工大學(xué)精品課程52案例分析 (9個(gè)數(shù)據(jù)的算例)【例】 9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1400 750 760 1050 870 950 2100 1450 154

19、0 排 序: 750 760 870 950 1050 1400 1450 1540 2100位 置: 1 2 3 4 5 6 7 8 9中位數(shù) = 1050華南理工大學(xué)精品課程53案例分析 (10個(gè)數(shù)據(jù)的算例)【例】 10個(gè)家庭的人均月收入數(shù)據(jù) 排 序: 635 690 770 820 930 1078 1230 1450 1690 2150 位 置: 1 2 3 4 5 6 7 8 9 10 華南理工大學(xué)精品課程54四分位數(shù) (quartile)1.排序后處于25%和75%位置上的值2.不受極端值的影響3.主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25

20、%25%華南理工大學(xué)精品課程55四分位數(shù) (位置的確定)華南理工大學(xué)精品課程56案例分析 (四分位數(shù)7個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 77+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QL= 23QU = 30N+1華南理工大學(xué)精品課程57案例分析(四分位數(shù)10個(gè)數(shù)據(jù)的算例)【例】 10個(gè)家庭的人均月收入數(shù)據(jù)排 序: 500 650 760 780 940 1060 1350 1680 1790 1900位 置: 1 2 3 4 5 6 7 8 9

21、 10統(tǒng)計(jì)函數(shù)QUARTILE華南理工大學(xué)精品課程58均值 (mean)集中趨勢(shì)的最常用測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)華南理工大學(xué)精品課程59簡(jiǎn)單均值 (simple mean)設(shè)一組數(shù)據(jù)為: x1 ,x2 , ,xn總體均值樣本均值華南理工大學(xué)精品課程60加權(quán)均值 (weighted mean)設(shè)一組數(shù)據(jù)為: x1 ,x2 , ,xn相應(yīng)的頻數(shù)為: f1 ,f2 , ,fk總體均值樣本均值華南理工大學(xué)精品課程61案例分析 加權(quán)均值按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105110110115115120120

22、125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計(jì)506160.0【例】根據(jù)表中的數(shù)據(jù),計(jì)算50 名工人日加工零件數(shù)的均值 表2-5 某車間50名工人日加工零件均值計(jì)算表華南理工大學(xué)精品課程62均值 (數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零2. 各變量值與均值的離差平方和最小華南理工大學(xué)精品課程63幾何均值 (geometric mean)n 個(gè)變量值乘積的 n 次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率計(jì)算公式為:可看作

23、是均值的一種變形華南理工大學(xué)精品課程64案例分析 幾何均值 【例】 一位投資者購(gòu)持有一種股票,在1997年、1998年、1999年和2000年收益率分別為 4.5%、2.0%、3.5%、5.4%。計(jì)算該投資者在這四年內(nèi)的平均收益率 平均收益率103.84%-1=3.84%華南理工大學(xué)精品課程65切尾均值 (trimmed Mean)去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為:n 表示觀察值的個(gè)數(shù);表示切尾系數(shù),華南理工大學(xué)精品課程66案例分析 切尾均值【例】某次求職面試中共有11名評(píng)委,對(duì)某位求職者的給分分別是:

24、經(jīng)整理得到順序統(tǒng)計(jì)量值為去掉一個(gè)最高分和一個(gè)最低分,取1/11 華南理工大學(xué)精品課程67眾數(shù)、中位數(shù)和均值的關(guān)系左偏分布均值 中位數(shù) 眾數(shù)對(duì)稱分布 均值= 中位數(shù)= 眾數(shù)右偏分布眾數(shù) 中位數(shù)均值圖2-4 眾數(shù)、中位數(shù)和均值的關(guān)系華南理工大學(xué)精品課程68眾數(shù)、中位數(shù)、均值的特點(diǎn)和應(yīng)用眾數(shù) -不受極端值影響 -具有不惟一性 -數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù) -不受極端值影響 -數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用均值 -易受極端值影響 -數(shù)學(xué)性質(zhì)優(yōu)良 -數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用小結(jié)數(shù)據(jù)類型和所適用的集中趨勢(shì)測(cè)度值數(shù)據(jù)類型定類數(shù)據(jù) 定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測(cè)度值眾數(shù)中位數(shù)算術(shù)平均數(shù)算術(shù)平均數(shù)四

25、分位數(shù)眾數(shù)調(diào)和平均數(shù)眾數(shù)中位數(shù)幾何平均數(shù)四分位數(shù) 中位數(shù)四分位數(shù)眾數(shù)紅色為該數(shù)據(jù)類型最適合用的測(cè)度值華南理工大學(xué)精品課程70本節(jié)提問一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測(cè)度?Q1Q2Q3怎樣理解均值在統(tǒng)計(jì)學(xué)中的地位?對(duì)于比率數(shù)據(jù)的平均,為什么采用幾何平均?簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合。Q4華南理工大學(xué)精品課程第六節(jié) 分布離散程度的測(cè)度一、極差二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)華南理工大學(xué)精品課程72極差 (range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910計(jì)算公式為: R = max(xi) - min(xi)華南理工

26、大學(xué)精品課程73內(nèi)距 (Inter-Quartile Range,IQR)也稱四分位差上四分位數(shù)與下四分位數(shù)之差 內(nèi) 距 = Q3 Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性華南理工大學(xué)精品課程74案例分析 四分位差【例】 根據(jù)表中的數(shù)據(jù),計(jì)算甲城市家庭對(duì)住房滿意狀況評(píng)價(jià)的四分位差回答類別甲城市戶數(shù) (戶)累計(jì)頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計(jì)300解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2 QU = 一般 = 3四分位差: QD =

27、 QU = QL = 32 = 1表2-6 甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布華南理工大學(xué)精品課程75方差和標(biāo)準(zhǔn)差(Variance and Standard deviation)1.離散程度的測(cè)度值之一2.最常用的測(cè)度值3.反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4 6 8 10 12 x = 8.3華南理工大學(xué)精品課程76總體方差和標(biāo)準(zhǔn)差 (Population variance and Standard deviation)未分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù):組距分組數(shù):組距分組數(shù):

28、華南理工大學(xué)精品課程77案例分析 總體標(biāo)準(zhǔn)差計(jì)算過程及結(jié)果【例】根據(jù)表中的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差表2-7 某車間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計(jì)503100.5華南理工大學(xué)精品課程

29、78樣本方差和標(biāo)準(zhǔn)差 (simple variance and standard deviation)方差的計(jì)算公式注意:樣本方差用自由度n-1去除!標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):組距分組數(shù)據(jù):華南理工大學(xué)精品課程79樣本方差 自由度(degree of freedom)1.一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)2.當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值x 確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值3.例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自

30、由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值4.樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差2時(shí),它是2的無偏估計(jì)量華南理工大學(xué)精品課程80案例分析 樣本方差 樣本方差與標(biāo)準(zhǔn)差原始數(shù)據(jù): 10 5 9 13 6 8華南理工大學(xué)精品課程81離散系數(shù)(coefficient of variation)1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為:華南理工大學(xué)精品課程82案例分析 離散系數(shù)【例】某公司抽查了所屬的8家超市,其產(chǎn)品銷

31、售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度超市編號(hào)產(chǎn)品銷售額(萬(wàn)元)x1銷售利潤(rùn)(萬(wàn)元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0表2-8 某公司所屬8家超市的產(chǎn)品銷售數(shù)據(jù)華南理工大學(xué)精品課程83案例分析 離散系數(shù)v1=536.25309.19=0.577v2=32.521523.09=0.710結(jié)論: 計(jì)算結(jié)果表明,v10時(shí)為正偏斜;當(dāng) 0)(0時(shí),表示頻數(shù)分布比正態(tài)分布更集中,分布呈尖峰狀態(tài),0)(=0) (0)圖2-8 峰度示意圖華南理工大學(xué)精品課程第八節(jié) 莖葉圖與箱線圖一、莖葉圖二、箱線圖華

32、南理工大學(xué)精品課程97莖葉圖 (stem-and-leaf display)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形由數(shù)字組成以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別:-直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值-莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息華南理工大學(xué)精品課程98案例分析 莖葉圖樹莖樹葉78022347778889001222233334446677789013344579910111213數(shù)據(jù)個(gè)數(shù)31324 10莖葉圖類似橫置的直方圖圖2-9 某車間30

33、名工人周加工零件數(shù)據(jù)的莖葉圖表華南理工大學(xué)精品課程99案例分析 擴(kuò)展的莖葉圖圖2-10 擴(kuò)展的莖葉圖表7 8 80 2 2 3 45 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 90 1 3 3 4 4 5 7 9 9樹莖樹葉10*10.11*11.12*12.13*13.樹莖樹葉10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.78 802 2 34 57 7 78 8 8 90 0 12 2 2 2 3 3 3 34 4 4 5 56 6 7 7 78 8 90 13

34、 34 4 579 9華南理工大學(xué)精品課程100箱線圖 (box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接華南理工大學(xué)精品課程101箱線圖 (箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值圖2-11 簡(jiǎn)單箱線圖華南理工大學(xué)精品課程102案例分析 箱線圖最小值107最大值139中位數(shù)123下四分位數(shù)117.75上四分位數(shù)128105 110 11

35、5 120 125 130 135 140圖2-12 50名工人日加工零件數(shù)的箱線圖華南理工大學(xué)精品課程103分布的形狀與箱線圖對(duì)稱分布QL中位數(shù) QU左偏分布QL中位數(shù) QU右偏分布QL 中位數(shù) QU圖2-13 不同分布的箱線圖華南理工大學(xué)精品課程104案例分析 多批數(shù)據(jù)箱線圖 課程名稱學(xué)生編號(hào)1234567891011英語(yǔ)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營(yíng)銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608781678691837

36、7769070828382928481706972787578918866948085718674687962818155787075687177【例】 從某大學(xué)工商管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績(jī)的批比較箱線圖,并分析各科考試成績(jī)的分布特征表2-11 11名學(xué)生各科的考試成績(jī)數(shù)據(jù)華南理工大學(xué)精品課程105圖2-14 8門課程考試成績(jī)的箱線圖案例分析 多批數(shù)據(jù)箱線圖 華南理工大學(xué)精品課程106圖2-15 11名學(xué)生8門課程考試成績(jī)的箱線圖min-max25%-75%median value455565758595105學(xué)生1

37、學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11案例分析 多批數(shù)據(jù)箱線圖 華南理工大學(xué)精品課程107本節(jié)提問描述莖葉圖和箱線圖的畫法?Q1Q2說明莖葉圖和箱線圖的用途。Q2Q2華南理工大學(xué)精品課程第九節(jié) 統(tǒng)計(jì)表與統(tǒng)計(jì)圖統(tǒng)計(jì)表和統(tǒng)計(jì)圖是顯示統(tǒng)計(jì)數(shù)據(jù)的兩種方式統(tǒng)計(jì)表把雜亂的數(shù)據(jù)有條理地組織在一張簡(jiǎn)明的表格內(nèi);統(tǒng)計(jì)圖把數(shù)據(jù)形象地顯示出來 。華南理工大學(xué)精品課程109統(tǒng)計(jì)表數(shù)字資料行標(biāo)題附加列標(biāo)題 表2-12 19992000年城鎮(zhèn)居民家庭抽樣調(diào)查資料 項(xiàng) 目單位1999年2000年 調(diào)查戶數(shù)戶4004442220 平均每戶家庭人口人3.143.13 平均每戶就業(yè)人口人1.771.68

38、 平均每戶就業(yè)面%56.4353.67 平均每一就業(yè)者負(fù)擔(dān)人數(shù)人1.771.86 平均每人全部年收入元5888.776316.81 可支配收入元5854.026279.98 平均每人消費(fèi)性支出元4615.914998.00表頭 資料來源:中國(guó)統(tǒng)計(jì)年鑒2001,中國(guó)統(tǒng)計(jì)出版社,2001,第305頁(yè)。 注:本表為城鎮(zhèn)居民家庭收支抽樣調(diào)查材料。 華南理工大學(xué)精品課程110統(tǒng)計(jì)表設(shè)計(jì)的一般要求1.要合理安排統(tǒng)計(jì)表的結(jié)構(gòu)2.總標(biāo)題內(nèi)容應(yīng)滿足3W要求3.數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明4.表中的上下兩條橫線一般用粗線,其他線用細(xì)線5.通常情況下,統(tǒng)計(jì)表的左右

39、兩邊不封口華南理工大學(xué)精品課程1116.表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的為數(shù)應(yīng)統(tǒng)一7.對(duì)于沒有小數(shù)點(diǎn)的單元,一般用“-”表示8.必要時(shí)可在表的下方加上注釋統(tǒng)計(jì)表設(shè)計(jì)的一般要求華南理工大學(xué)精品課程112統(tǒng)計(jì)圖常見的統(tǒng)計(jì)圖:直方圖、莖葉圖和箱線圖 折線圖、條形圖和圓形圖、環(huán)行圖、雷達(dá)圖等等華南理工大學(xué)精品課程113定類數(shù)據(jù)的圖示條形圖(條形圖的制作)條形圖是用寬度相同的條形的高度或長(zhǎng)短來表示數(shù)據(jù)變動(dòng)的圖形。條形圖有單式、復(fù)式等形式。在表示定類數(shù)據(jù)的分布時(shí),是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率。繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖。

40、華南理工大學(xué)精品課程114定類數(shù)據(jù)的圖示-條形圖人數(shù)(人)5191610211204080120 商品廣告 服務(wù)廣告 金融廣告 房地產(chǎn)廣告 招生招聘廣告 其他廣告廣告類型 圖2-16 某城市居民關(guān)注不同類型廣告的人數(shù)分布由 Excel 繪制的條形圖定類數(shù)據(jù)的圖示圓形圖(圓形圖的制作)華南理工大學(xué)精品課程1151.也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形。2.主要用于表示總體中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問題十分有用。3.在繪制圓形圖時(shí),總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應(yīng)比例確定的。4.例如,關(guān)注服務(wù)廣告的人數(shù)占總?cè)藬?shù)的百分比為25.5%,那么其扇形的中心角度就應(yīng)為360025.5%91.80,其余類推。定類數(shù)據(jù)的圖示圓形圖華南理工大學(xué)精品課程116 其他廣告1.0% 房地產(chǎn)廣告8.0% 商品廣告56.0% 金融廣告4.5% 服務(wù)廣告25.5% 招生招聘廣告5.8%圖2-17 某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成由 Excel 繪制的圓形圖定序數(shù)據(jù)的圖示環(huán)形圖(環(huán)形圖的制作)華南理工大學(xué)精品課程1171.環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示2.環(huán)形圖與圓形圖類似,但又有區(qū)別圓形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論