統(tǒng)計(jì)學(xué)原理(第二章)_第1頁(yè)
統(tǒng)計(jì)學(xué)原理(第二章)_第2頁(yè)
統(tǒng)計(jì)學(xué)原理(第二章)_第3頁(yè)
統(tǒng)計(jì)學(xué)原理(第二章)_第4頁(yè)
統(tǒng)計(jì)學(xué)原理(第二章)_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 描述統(tǒng)計(jì)是通過(guò)圖表或數(shù)學(xué)方法,對(duì)描述統(tǒng)計(jì)是通過(guò)圖表或數(shù)學(xué)方法,對(duì)數(shù)據(jù)資料進(jìn)行整理、分析,并對(duì)數(shù)據(jù)的分?jǐn)?shù)據(jù)資料進(jìn)行整理、分析,并對(duì)數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)行估計(jì)和描述的方法行估計(jì)和描述的方法 一、數(shù)據(jù)的計(jì)量尺度一、數(shù)據(jù)的計(jì)量尺度 二、數(shù)據(jù)的類(lèi)型二、數(shù)據(jù)的類(lèi)型 一、數(shù)據(jù)的計(jì)量尺度一、數(shù)據(jù)的計(jì)量尺度1.定類(lèi)尺度:定類(lèi)尺度:又稱(chēng)為類(lèi)別尺度或列名尺度,又稱(chēng)為類(lèi)別尺度或列名尺度,它是按照事物的某種屬性對(duì)其進(jìn)行平行的分它是按照事物的某種屬性對(duì)其進(jìn)行平行的分類(lèi)。定類(lèi)尺度是最粗略、計(jì)算層次最低的計(jì)類(lèi)。定類(lèi)尺度是最粗略、計(jì)算層次最低的計(jì)量尺度。量尺度。 性

2、別性別種族種族運(yùn)動(dòng)項(xiàng)目運(yùn)動(dòng)項(xiàng)目 定類(lèi)尺度只能按照事物及其現(xiàn)象的某種屬定類(lèi)尺度只能按照事物及其現(xiàn)象的某種屬性對(duì)其進(jìn)行平行的分類(lèi)或分組。例如車(chē)牌號(hào)、性對(duì)其進(jìn)行平行的分類(lèi)或分組。例如車(chē)牌號(hào)、學(xué)生的學(xué)號(hào)、運(yùn)動(dòng)員號(hào)碼、身份證號(hào)碼、人員學(xué)生的學(xué)號(hào)、運(yùn)動(dòng)員號(hào)碼、身份證號(hào)碼、人員性別、企業(yè)類(lèi)別等等性別、企業(yè)類(lèi)別等等。特征:特征:(1)只能區(qū)分事物的類(lèi)別,無(wú)法比較類(lèi)別)只能區(qū)分事物的類(lèi)別,無(wú)法比較類(lèi)別間大小,定類(lèi)尺度只具有間大小,定類(lèi)尺度只具有“=”和和“”運(yùn)算,運(yùn)算,“=”具有傳遞性。具有傳遞性。(2)對(duì)事物的區(qū)分必須符合窮盡和互斥的)對(duì)事物的區(qū)分必須符合窮盡和互斥的要求。要求。(3)對(duì)定類(lèi)尺度數(shù)據(jù)進(jìn)行分析的

3、統(tǒng)計(jì)量主)對(duì)定類(lèi)尺度數(shù)據(jù)進(jìn)行分析的統(tǒng)計(jì)量主要是頻數(shù)或者頻率,或是眾數(shù)和進(jìn)行列聯(lián)分要是頻數(shù)或者頻率,或是眾數(shù)和進(jìn)行列聯(lián)分析。析。 一、數(shù)據(jù)的計(jì)量尺度一、數(shù)據(jù)的計(jì)量尺度2.定序尺度:定序尺度:又稱(chēng)為順序尺度或有序水平,又稱(chēng)為順序尺度或有序水平,是對(duì)事物之間等級(jí)差或順序差別的一種測(cè)度。是對(duì)事物之間等級(jí)差或順序差別的一種測(cè)度。由其構(gòu)成的量表一般稱(chēng)為順序量表。由其構(gòu)成的量表一般稱(chēng)為順序量表。 定序尺度不僅可以將事物分成不同的類(lèi)別,定序尺度不僅可以將事物分成不同的類(lèi)別,還可以確定這些類(lèi)別的優(yōu)劣或順序,例如軍階、還可以確定這些類(lèi)別的優(yōu)劣或順序,例如軍階、職稱(chēng)、工資級(jí)別、產(chǎn)品質(zhì)量等級(jí)、受教育水平職稱(chēng)、工資級(jí)別

4、、產(chǎn)品質(zhì)量等級(jí)、受教育水平等。等。大學(xué)生大學(xué)生中學(xué)生中學(xué)生小學(xué)生小學(xué)生特征:特征:(1)不僅能區(qū)分事物的類(lèi)型,而且能夠比較各類(lèi))不僅能區(qū)分事物的類(lèi)型,而且能夠比較各類(lèi)型間的優(yōu)劣和順序,不僅可運(yùn)算型間的優(yōu)劣和順序,不僅可運(yùn)算“=”、“ ”,而且可以運(yùn)算而且可以運(yùn)算“ ”或或“”。但不能測(cè)量出類(lèi)但不能測(cè)量出類(lèi)別之間的準(zhǔn)確差距,不能進(jìn)行加減乘除的運(yùn)算。別之間的準(zhǔn)確差距,不能進(jìn)行加減乘除的運(yùn)算。 。(2)對(duì)事物的區(qū)分同樣要求窮盡和互斥。)對(duì)事物的區(qū)分同樣要求窮盡和互斥。(3)對(duì)定序尺度數(shù)據(jù)進(jìn)行分析的統(tǒng)計(jì)量主要是頻)對(duì)定序尺度數(shù)據(jù)進(jìn)行分析的統(tǒng)計(jì)量主要是頻數(shù)和數(shù)和累積累積頻數(shù),或者頻率和頻數(shù),或者頻率和累

5、積累積頻率。頻率。 一、數(shù)據(jù)的計(jì)量尺度一、數(shù)據(jù)的計(jì)量尺度3.定距尺度:定距尺度:又稱(chēng)為間隔尺度或間隔水平,又稱(chēng)為間隔尺度或間隔水平,是對(duì)事物類(lèi)別或者次序之間間距進(jìn)行的一種是對(duì)事物類(lèi)別或者次序之間間距進(jìn)行的一種測(cè)度,由其構(gòu)成的量表一般稱(chēng)為間隔量表或測(cè)度,由其構(gòu)成的量表一般稱(chēng)為間隔量表或間距量表。間距量表。 常見(jiàn)的用定距尺度來(lái)測(cè)度的有考試成績(jī)、常見(jiàn)的用定距尺度來(lái)測(cè)度的有考試成績(jī)、各種心理測(cè)試的得分、某個(gè)地區(qū)的溫度等。各種心理測(cè)試的得分、某個(gè)地區(qū)的溫度等。天氣預(yù)報(bào):南京:最高溫度天氣預(yù)報(bào):南京:最高溫度3 蘇州:最高溫度蘇州:最高溫度6特征:特征:(1)不僅能區(qū)分事物的類(lèi)別、進(jìn)行排序、比較大)不僅能

6、區(qū)分事物的類(lèi)別、進(jìn)行排序、比較大小,而且還可以精確地計(jì)算大小的差異,可以進(jìn)小,而且還可以精確地計(jì)算大小的差異,可以進(jìn)行加減運(yùn)算,但不可以進(jìn)行乘除運(yùn)算。行加減運(yùn)算,但不可以進(jìn)行乘除運(yùn)算。(2)沒(méi)有絕對(duì)零點(diǎn),即可以以任何一個(gè))沒(méi)有絕對(duì)零點(diǎn),即可以以任何一個(gè)0為起點(diǎn),為起點(diǎn),“0”不表示不表示“沒(méi)有沒(méi)有”或或“不存在不存在”。 兩地最高溫度相差兩地最高溫度相差3南京最高溫度較蘇州最高溫度低南京最高溫度較蘇州最高溫度低3蘇州最高溫度是南京最高溫度的蘇州最高溫度是南京最高溫度的2倍倍 一、數(shù)據(jù)的計(jì)量尺度一、數(shù)據(jù)的計(jì)量尺度4.定比尺度:定比尺度:又稱(chēng)為比例尺度或是比較水平,又稱(chēng)為比例尺度或是比較水平,是對(duì)

7、事物之間比值的一種測(cè)度,它是最高層是對(duì)事物之間比值的一種測(cè)度,它是最高層次的測(cè)量,可用于參數(shù)和非參數(shù)統(tǒng)計(jì)推斷。次的測(cè)量,可用于參數(shù)和非參數(shù)統(tǒng)計(jì)推斷。它是與定距尺度屬于同一層次的一種計(jì)量尺它是與定距尺度屬于同一層次的一種計(jì)量尺度,但其功能比定距尺度更強(qiáng)一些。度,但其功能比定距尺度更強(qiáng)一些。 在日常生活中,大多數(shù)情況下使用的都是在日常生活中,大多數(shù)情況下使用的都是定比尺度。例如,年齡、收入、某地區(qū)每年的定比尺度。例如,年齡、收入、某地區(qū)每年的失業(yè)人數(shù)、罪犯人數(shù)等。失業(yè)人數(shù)、罪犯人數(shù)等。3000元元工資工資1500元元工資工資甲甲乙乙二人工資二人工資 之差:之差:3000-1500=1500元元 特

8、征:特征:(1)除了能夠區(qū)分類(lèi)別、排序、比較大小、求出)除了能夠區(qū)分類(lèi)別、排序、比較大小、求出大小差異外,還可以計(jì)算兩個(gè)測(cè)度值之間的比值,大小差異外,還可以計(jì)算兩個(gè)測(cè)度值之間的比值,不僅可以進(jìn)行定距尺度所能夠進(jìn)行的所有運(yùn)算,不僅可以進(jìn)行定距尺度所能夠進(jìn)行的所有運(yùn)算,而且在此基礎(chǔ)上還增加了乘、除的數(shù)學(xué)運(yùn)算功能。而且在此基礎(chǔ)上還增加了乘、除的數(shù)學(xué)運(yùn)算功能。(2)具有絕對(duì)零點(diǎn),)具有絕對(duì)零點(diǎn),“0”表示表示“沒(méi)有沒(méi)有”或或“不不存在存在”。 二人工資之比:二人工資之比: 30001500=2(倍)(倍) 四種計(jì)量尺度的比較:四種計(jì)量尺度的比較: 在統(tǒng)計(jì)分析中,一般要求測(cè)量的層次越高越好。在統(tǒng)計(jì)分析中

9、,一般要求測(cè)量的層次越高越好。 二、數(shù)據(jù)的類(lèi)型二、數(shù)據(jù)的類(lèi)型1.數(shù)據(jù)的類(lèi)型和分析方法數(shù)據(jù)的類(lèi)型和分析方法 統(tǒng)計(jì)數(shù)據(jù)是采用某種計(jì)量尺度對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)數(shù)據(jù)是采用某種計(jì)量尺度對(duì)數(shù)據(jù)進(jìn)行計(jì)量的結(jié)果,采用不同的計(jì)量尺度會(huì)得到不同計(jì)量的結(jié)果,采用不同的計(jì)量尺度會(huì)得到不同類(lèi)型的統(tǒng)計(jì)數(shù)據(jù)。根據(jù)以上四種計(jì)量尺度的結(jié)類(lèi)型的統(tǒng)計(jì)數(shù)據(jù)。根據(jù)以上四種計(jì)量尺度的結(jié)果可以將統(tǒng)計(jì)數(shù)據(jù)分成三種類(lèi)型:果可以將統(tǒng)計(jì)數(shù)據(jù)分成三種類(lèi)型: 定類(lèi)數(shù)據(jù)、定類(lèi)數(shù)據(jù)、 定序數(shù)據(jù)、定序數(shù)據(jù)、 數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù) 前兩者可以統(tǒng)稱(chēng)為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);前兩者可以統(tǒng)稱(chēng)為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);后者成為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。后者成為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。 提問(wèn)

10、:提問(wèn):以男女代號(hào)分別為以男女代號(hào)分別為0、1,那么這樣的數(shù)據(jù)到底,那么這樣的數(shù)據(jù)到底是什么數(shù)據(jù)?是什么數(shù)據(jù)? 區(qū)別的法則是能不能做加減法區(qū)別的法則是能不能做加減法二、數(shù)據(jù)的類(lèi)型二、數(shù)據(jù)的類(lèi)型2.變量及其類(lèi)型變量及其類(lèi)型變量:變量:是說(shuō)明現(xiàn)象某種特征的概念。變量最基是說(shuō)明現(xiàn)象某種特征的概念。變量最基本的特點(diǎn)是在同一總體的不同單位上可取不同本的特點(diǎn)是在同一總體的不同單位上可取不同的數(shù)值,以及同一總體相同單位在不同時(shí)間上的數(shù)值,以及同一總體相同單位在不同時(shí)間上可取不同的數(shù)值,即變量的變異性,或差異性可取不同的數(shù)值,即變量的變異性,或差異性特征。特征。變量的類(lèi)型:變量的類(lèi)型:定類(lèi)變量、定序變量、定類(lèi)

11、變量、定序變量、數(shù)值型變量(離散變量、連續(xù)變量)數(shù)值型變量(離散變量、連續(xù)變量) 一、品質(zhì)數(shù)據(jù)的描述一、品質(zhì)數(shù)據(jù)的描述二、數(shù)據(jù)的類(lèi)型品質(zhì)數(shù)據(jù)的圖示二、數(shù)據(jù)的類(lèi)型品質(zhì)數(shù)據(jù)的圖示三、品質(zhì)數(shù)據(jù)的分布特征描述三、品質(zhì)數(shù)據(jù)的分布特征描述 一、品質(zhì)數(shù)據(jù)的一、品質(zhì)數(shù)據(jù)的 描述描述1.頻數(shù)頻數(shù):是落在某一特定類(lèi)別(或組)中的:是落在某一特定類(lèi)別(或組)中的數(shù)據(jù)的個(gè)數(shù)。把各個(gè)類(lèi)別及其相應(yīng)的頻數(shù)全數(shù)據(jù)的個(gè)數(shù)。把各個(gè)類(lèi)別及其相應(yīng)的頻數(shù)全部列出來(lái)則形成頻數(shù)分布。部列出來(lái)則形成頻數(shù)分布。 頻率:把各組的頻數(shù)與全部頻數(shù)之和求得頻率:把各組的頻數(shù)與全部頻數(shù)之和求得的比值,稱(chēng)之為頻率。的比值,稱(chēng)之為頻率。 一、品質(zhì)數(shù)據(jù)的一、

12、品質(zhì)數(shù)據(jù)的 描述描述2.比例比例:是一個(gè)總體(或樣本)中各個(gè)部分:是一個(gè)總體(或樣本)中各個(gè)部分的數(shù)據(jù)與全部數(shù)據(jù)之比,通常用于反映總體的數(shù)據(jù)與全部數(shù)據(jù)之比,通常用于反映總體(或樣本)的構(gòu)成。(或樣本)的構(gòu)成。 一、品質(zhì)數(shù)據(jù)的一、品質(zhì)數(shù)據(jù)的 描述描述3.百分比或百分?jǐn)?shù)百分比或百分?jǐn)?shù):是將比例乘以:是將比例乘以100%得到得到的數(shù)值。是將對(duì)比的技術(shù)劃為的數(shù)值。是將對(duì)比的技術(shù)劃為100而計(jì)算得到而計(jì)算得到的,它表示每的,它表示每100個(gè)分母中擁有多少個(gè)分子。個(gè)分母中擁有多少個(gè)分子。 一、品質(zhì)數(shù)據(jù)的一、品質(zhì)數(shù)據(jù)的 描述描述4.比率:比率:是總體中不同類(lèi)別數(shù)值之間的比值。是總體中不同類(lèi)別數(shù)值之間的比值。

13、它可以是一個(gè)總體(或樣本)中個(gè)不同部分它可以是一個(gè)總體(或樣本)中個(gè)不同部分的數(shù)量對(duì)比。可以以的數(shù)量對(duì)比。可以以1作為基數(shù),也可以以作為基數(shù),也可以以100為基數(shù)。為基數(shù)。 一、品質(zhì)數(shù)據(jù)的一、品質(zhì)數(shù)據(jù)的 描述描述5.累計(jì)頻數(shù):累計(jì)頻數(shù):是將各類(lèi)別的頻數(shù)逐級(jí)累加得是將各類(lèi)別的頻數(shù)逐級(jí)累加得到的頻數(shù)。有到的頻數(shù)。有向上累積向上累積和和向下累積向下累積兩種方式。兩種方式。 二、品質(zhì)數(shù)據(jù)的二、品質(zhì)數(shù)據(jù)的 圖示圖示1.條形圖條形圖:是用寬度相同的條形的高度或長(zhǎng):是用寬度相同的條形的高度或長(zhǎng)短來(lái)表示數(shù)據(jù)變動(dòng)的圖形,橫置的稱(chēng)為帶形短來(lái)表示數(shù)據(jù)變動(dòng)的圖形,橫置的稱(chēng)為帶形圖,縱置的稱(chēng)為柱形圖(直方圖)。圖,縱置

14、的稱(chēng)為柱形圖(直方圖)。 柱形圖(直方圖)柱形圖(直方圖)二、品質(zhì)數(shù)據(jù)的二、品質(zhì)數(shù)據(jù)的 圖示圖示2.餅圖餅圖:又稱(chēng)圓圖,是以圓的整體面積代表:又稱(chēng)圓圖,是以圓的整體面積代表被研究現(xiàn)象的總體,按各構(gòu)成部分占總體比被研究現(xiàn)象的總體,按各構(gòu)成部分占總體比重的大小把面積分割成若干扇形,用以表示重的大小把面積分割成若干扇形,用以表示現(xiàn)象的部分對(duì)總體的比例關(guān)系統(tǒng)計(jì)圖,主要現(xiàn)象的部分對(duì)總體的比例關(guān)系統(tǒng)計(jì)圖,主要表示結(jié)構(gòu)性問(wèn)題。表示結(jié)構(gòu)性問(wèn)題。 餅圖餅圖二、品質(zhì)數(shù)據(jù)的二、品質(zhì)數(shù)據(jù)的 圖示圖示3.折線圖折線圖:折線圖是用直線段將各數(shù)據(jù)點(diǎn)連:折線圖是用直線段將各數(shù)據(jù)點(diǎn)連接起來(lái)而組成的圖形,以折線方式顯示數(shù)據(jù)接起來(lái)

15、而組成的圖形,以折線方式顯示數(shù)據(jù)的變化趨勢(shì)。折線圖可以顯示隨時(shí)間(根據(jù)的變化趨勢(shì)。折線圖可以顯示隨時(shí)間(根據(jù)常用比例設(shè)置)而變化的連續(xù)數(shù)據(jù),因此非常用比例設(shè)置)而變化的連續(xù)數(shù)據(jù),因此非常適用于顯示在相等時(shí)間間隔下數(shù)據(jù)的趨勢(shì)。常適用于顯示在相等時(shí)間間隔下數(shù)據(jù)的趨勢(shì)。 折線圖三、品質(zhì)數(shù)據(jù)的三、品質(zhì)數(shù)據(jù)的 分布特征描述分布特征描述1.集中趨勢(shì)值集中趨勢(shì)值眾數(shù)眾數(shù):該變量出現(xiàn)次數(shù)最多的取值,記為:該變量出現(xiàn)次數(shù)最多的取值,記為Mo 。例例: 對(duì)報(bào)名參加全國(guó)奧林匹克數(shù)學(xué)競(jìng)賽的對(duì)報(bào)名參加全國(guó)奧林匹克數(shù)學(xué)競(jìng)賽的47名學(xué)生的出生省份進(jìn)行調(diào)查,調(diào)查結(jié)果見(jiàn)下名學(xué)生的出生省份進(jìn)行調(diào)查,調(diào)查結(jié)果見(jiàn)下表:表:出生省份出

16、生省份人數(shù)人數(shù)遼寧1北京7湖北10江蘇8浙江5安徽2上海8廣東6合計(jì)47中位數(shù)中位數(shù):是一組數(shù)據(jù)排序后處于中間位置:是一組數(shù)據(jù)排序后處于中間位置上的變量值,記為上的變量值,記為Me。 中中位位數(shù)數(shù)n為奇數(shù)為奇數(shù)12nx22(1)2nnxxn為偶數(shù)為偶數(shù)例例2.2 在某城市中隨機(jī)抽取在某城市中隨機(jī)抽取9個(gè)家庭,調(diào)查得個(gè)家庭,調(diào)查得到每個(gè)家庭的人均月收入數(shù)據(jù)如下(單位:到每個(gè)家庭的人均月收入數(shù)據(jù)如下(單位:元)。要求計(jì)算人均月收入的中位數(shù)。元)。要求計(jì)算人均月收入的中位數(shù)。1500 750 780 1080 850960 2000 1250 1630解:將上面的數(shù)據(jù)按從小到大排列,如下:解:將上面

17、的數(shù)據(jù)按從小到大排列,如下:750 780 850 960 1080 1250 1500 1630 2000四分位數(shù)四分位數(shù):是一組數(shù)據(jù)排序后處于:是一組數(shù)據(jù)排序后處于25%和和75%位置上的位置上的變量值,記為變量值,記為QL和和QU 。 三、品質(zhì)數(shù)據(jù)的三、品質(zhì)數(shù)據(jù)的 分布特征描述分布特征描述2.離散程度測(cè)度值離散程度測(cè)度值異眾比率:非眾數(shù)組的頻數(shù)占總頻數(shù)的比異眾比率:非眾數(shù)組的頻數(shù)占總頻數(shù)的比例,計(jì)算公式為:例,計(jì)算公式為:1immriifffVff 其中,其中, 表示第表示第i組的頻數(shù),組的頻數(shù), 表示眾數(shù)組的頻數(shù)表示眾數(shù)組的頻數(shù)ifmf例例2.1 對(duì)報(bào)名參加全國(guó)奧林匹克數(shù)學(xué)競(jìng)賽的對(duì)報(bào)名

18、參加全國(guó)奧林匹克數(shù)學(xué)競(jìng)賽的47名學(xué)生的出生省份進(jìn)行調(diào)查,調(diào)查結(jié)果見(jiàn)名學(xué)生的出生省份進(jìn)行調(diào)查,調(diào)查結(jié)果見(jiàn)下表:下表:出生省份出生省份人數(shù)人數(shù)遼寧1北京7湖北10江蘇8浙江5安徽2上海8廣東6合計(jì)47異眾比率為:異眾比率為:103714747三、品質(zhì)數(shù)據(jù)的三、品質(zhì)數(shù)據(jù)的 分布特征描述分布特征描述2.離散程度測(cè)度值離散程度測(cè)度值極差,是變量觀測(cè)值中最大值與最小值只極差,是變量觀測(cè)值中最大值與最小值只差,計(jì)算公式為:差,計(jì)算公式為:四分位差:也稱(chēng)為內(nèi)距或四分間距,是四分位差:也稱(chēng)為內(nèi)距或四分間距,是上四分位數(shù)與下四分位數(shù)的差值計(jì)算公式上四分位數(shù)與下四分位數(shù)的差值計(jì)算公式為:為:max( )min( )

19、iiRxxdULQQQ一、數(shù)值數(shù)據(jù)的分組一、數(shù)值數(shù)據(jù)的分組二、數(shù)值數(shù)據(jù)的圖示二、數(shù)值數(shù)據(jù)的圖示三、數(shù)值數(shù)據(jù)的分布特征三、數(shù)值數(shù)據(jù)的分布特征 一、數(shù)值數(shù)據(jù)的一、數(shù)值數(shù)據(jù)的 分組分組 為什么要進(jìn)行數(shù)據(jù)的分組?為什么要進(jìn)行數(shù)據(jù)的分組?107108108110112112113114115117117117118118118119120120121122122122122123123123123124124124125125126126126127127128128129130131133133134134135139139139某電腦公司某電腦公司50名銷(xiāo)售代表某季度電腦銷(xiāo)售量按從小名銷(xiāo)售代表某季度

20、電腦銷(xiāo)售量按從小到大排序如下表:到大排序如下表: 數(shù)據(jù)過(guò)多,掩蓋數(shù)據(jù)特征,進(jìn)行單變量分組數(shù)據(jù)過(guò)多,掩蓋數(shù)據(jù)特征,進(jìn)行單變量分組得到下表:得到下表: 50名銷(xiāo)售代表的某季度電腦銷(xiāo)售量分組表名銷(xiāo)售代表的某季度電腦銷(xiāo)售量分組表 銷(xiāo)售量銷(xiāo)售量頻數(shù)頻數(shù)銷(xiāo)售量銷(xiāo)售量頻數(shù)頻數(shù)銷(xiāo)售量銷(xiāo)售量頻數(shù)頻數(shù)107111911282108212021291110112111301112212241311113112341332114112431342115112521351117312621371118312731392在數(shù)據(jù)較多的情況下,單變量分組會(huì)使數(shù)據(jù)在數(shù)據(jù)較多的情況下,單變量分組會(huì)使數(shù)據(jù)較多,仍舊不利于觀察數(shù)據(jù)的

21、特征和規(guī)律。較多,仍舊不利于觀察數(shù)據(jù)的特征和規(guī)律。 因此我們采用組距分組因此我們采用組距分組一、數(shù)值數(shù)據(jù)的一、數(shù)值數(shù)據(jù)的 分組分組組距分組組距分組:是將全部變量依次劃分為若干?。菏菍⑷孔兞恳来蝿澐譃槿舾尚^(qū)間,并將這一區(qū)間的變量值作為一組的分區(qū)間,并將這一區(qū)間的變量值作為一組的分組方法。組方法。在組距分組中,一個(gè)組的最小值成為下限,在組距分組中,一個(gè)組的最小值成為下限,最大值成為上限最大值成為上限 按電腦銷(xiāo)售量分組(個(gè))按電腦銷(xiāo)售量分組(個(gè))頻數(shù)(人)頻數(shù)(人)頻率(頻率(%)1051103611011551011512081612012514281251301020130135612135

22、14048合計(jì)5010050名銷(xiāo)售代表的某季度電腦銷(xiāo)售量分組表名銷(xiāo)售代表的某季度電腦銷(xiāo)售量分組表 一、數(shù)值數(shù)據(jù)的一、數(shù)值數(shù)據(jù)的 分組分組組距分組的步驟:組距分組的步驟:第一步:確定組數(shù)第一步:確定組數(shù)組數(shù)不宜太多也不宜太少,一般組數(shù)不宜太多也不宜太少,一般 5 K 15Sturges提出的經(jīng)驗(yàn)公式確定組數(shù):提出的經(jīng)驗(yàn)公式確定組數(shù): 如:如:K=1+lg50/lg2=7 lg1lg2nK 一、數(shù)值數(shù)據(jù)的一、數(shù)值數(shù)據(jù)的 分組分組第二步:確定各組的組距第二步:確定各組的組距組距組距:是一個(gè)組的上限和下限差,可根據(jù)全:是一個(gè)組的上限和下限差,可根據(jù)全部數(shù)據(jù)的最大值和最小值確定。部數(shù)據(jù)的最大值和最小值確

23、定。 組距組距=(最大值最小值)(最大值最小值)組數(shù)組數(shù)如:如:(139107) 7=4.6 因此組距可以取到因此組距可以取到5 一、數(shù)值數(shù)據(jù)的一、數(shù)值數(shù)據(jù)的 分組分組第三步:根據(jù)分組整理成頻數(shù)分布表第三步:根據(jù)分組整理成頻數(shù)分布表 按電腦銷(xiāo)售量分組(個(gè))按電腦銷(xiāo)售量分組(個(gè))頻數(shù)(人)頻數(shù)(人)頻率(頻率(%)105110361101155101151208161201251428125130102013013561213514048合計(jì)5010050名銷(xiāo)售代表的某季度電腦銷(xiāo)售量分組表名銷(xiāo)售代表的某季度電腦銷(xiāo)售量分組表 全距與組距全距與組距等距與異距等距與異距組限與組中值組限與組中值開(kāi)口組與

24、閉口組開(kāi)口組與閉口組 連續(xù)組距分組連續(xù)組距分組 和不連續(xù)組距分組和不連續(xù)組距分組 重疊組限重疊組限 “上限不在內(nèi)上限不在內(nèi)”原則原則 關(guān)于組距式分組的幾個(gè)問(wèn)題關(guān)于組距式分組的幾個(gè)問(wèn)題例:學(xué)生按成績(jī)分組(分)例:學(xué)生按成績(jī)分組(分) (1)5060 6070 7080 8090 90100(2)60以下以下 6069 7079 8089 90以上以上組距=80-70=10上限:80下限:70開(kāi)口組閉口組組中值組中值75270805 .552960組中值5 .942990重疊組限值70歸于7080組不連續(xù)組距式分組連續(xù)組距式分組 5060 6080 8090 90100異距分組最典型的例子:異距分

25、組最典型的例子:對(duì)人口年齡分組對(duì)人口年齡分組0 6歲歲 嬰幼兒組嬰幼兒組7 17歲歲 少年兒童組少年兒童組18 59歲歲 中青年組中青年組60 歲以上歲以上 老年組老年組 二、數(shù)值數(shù)據(jù)的二、數(shù)值數(shù)據(jù)的 圖示圖示1.直方圖直方圖:用矩形的寬度和高度來(lái)表示頻數(shù):用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形。分布的圖形。 等距分組等距分組不等距分組不等距分組等距分組等距分組家庭人均生活費(fèi)收入次數(shù)分布圖571086321302468101214月收入戶(hù)數(shù)8001 00010001 20012001 40014001 60016001 80018002 00020002 20022002 400如果是異距分組

26、,則各組次數(shù)的數(shù)值受組距不同如果是異距分組,則各組次數(shù)的數(shù)值受組距不同的影響。在研究各組次數(shù)的實(shí)際分布時(shí),要消除的影響。在研究各組次數(shù)的實(shí)際分布時(shí),要消除組距不同的影響,要按次數(shù)密度來(lái)看實(shí)際的次數(shù)組距不同的影響,要按次數(shù)密度來(lái)看實(shí)際的次數(shù)分布情況。例如:分布情況。例如:按照次數(shù)密度作的直方圖如下:按照次數(shù)密度作的直方圖如下: 二、數(shù)值數(shù)據(jù)的二、數(shù)值數(shù)據(jù)的 圖示圖示2.折線圖折線圖:在直方圖的基礎(chǔ)上,把直方圖頂:在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)用直線連接起來(lái)形成的。部的中點(diǎn)用直線連接起來(lái)形成的。 二、數(shù)值數(shù)據(jù)的二、數(shù)值數(shù)據(jù)的 圖示圖示3.盒形圖盒形圖:又稱(chēng)箱線圖,構(gòu)成如下:又稱(chēng)箱線圖,構(gòu)成如

27、下: 二、數(shù)值數(shù)據(jù)的二、數(shù)值數(shù)據(jù)的 圖示圖示4.莖葉圖莖葉圖:由頻數(shù)、莖和葉構(gòu)成,莖表示數(shù):由頻數(shù)、莖和葉構(gòu)成,莖表示數(shù)值的整數(shù)部分,葉表示數(shù)值的小數(shù)部分。值的整數(shù)部分,葉表示數(shù)值的小數(shù)部分。 三、數(shù)值數(shù)據(jù)的分布特征描述三、數(shù)值數(shù)據(jù)的分布特征描述1.集中趨勢(shì)測(cè)度值集中趨勢(shì)測(cè)度值均值均值:均值是反映數(shù)據(jù)分布集中趨勢(shì)十分重:均值是反映數(shù)據(jù)分布集中趨勢(shì)十分重要的數(shù)據(jù),代表總體單位某一標(biāo)志值的一般要的數(shù)據(jù),代表總體單位某一標(biāo)志值的一般水平。水平。例如:例如:某市中學(xué)生每周平均上網(wǎng)時(shí)間為某市中學(xué)生每周平均上網(wǎng)時(shí)間為2.8小時(shí)。小時(shí)。某農(nóng)貿(mào)市場(chǎng)某農(nóng)貿(mào)市場(chǎng)2月份牛肉的平均價(jià)格為月份牛肉的平均價(jià)格為16元元/

28、千千克。克。某地區(qū)某地區(qū)“十五十五”期間經(jīng)濟(jì)平均增長(zhǎng)率為期間經(jīng)濟(jì)平均增長(zhǎng)率為9.6% 常用的幾種平均數(shù)常用的幾種平均數(shù)概概 念念 計(jì)算計(jì)算 公公 式式 特特 點(diǎn)點(diǎn)優(yōu)點(diǎn):優(yōu)點(diǎn): 容易理解,便于計(jì)算容易理解,便于計(jì)算 靈敏度高靈敏度高 穩(wěn)定性好穩(wěn)定性好 和和 缺點(diǎn):缺點(diǎn): 易受極值影響易受極值影響1. 算術(shù)平均數(shù)算術(shù)平均數(shù)( )標(biāo)志總量與標(biāo)志總量與總體單位總總體單位總數(shù)的比值數(shù)的比值簡(jiǎn)單:簡(jiǎn)單:加權(quán):加權(quán):xnxxiiiiffxx最小2xx0 xx112niinXXXXXnn112NiiNXXXXNN Fi 四個(gè)品牌數(shù)碼相機(jī)的利潤(rùn)率和銷(xiāo)售額資料四個(gè)品牌數(shù)碼相機(jī)的利潤(rùn)率和銷(xiāo)售額資料1137.246.

29、3%590kiiikiiw XXw銷(xiāo)售總額利潤(rùn)總額商品銷(xiāo)售利潤(rùn)率1137246.3%590iniiwniiw XXwX Xi iF Fi i表表2-1 某車(chē)間某車(chē)間50名工人日加工零件均值計(jì)算表名工人日加工零件均值計(jì)算表按零件數(shù)分組按零件數(shù)分組組中值(組中值(Xi)頻數(shù)(頻數(shù)(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計(jì)合計(jì)506160.0常用的幾種平均數(shù)常用的幾種平均數(shù)概概 念念 計(jì)算計(jì)算 公公 式式 特特 點(diǎn)點(diǎn)優(yōu)點(diǎn):優(yōu)點(diǎn):靈敏度高靈敏度高在某種不能計(jì)算的條件在某種不能計(jì)算的條件下,可以代替下,可以代替 缺點(diǎn):缺點(diǎn):不易理解不易理解 易受極值影響易受極值影響 有有“ 0”值時(shí)不能計(jì)算值時(shí)不能計(jì)算 2. 調(diào)和平均數(shù)調(diào)和平均數(shù)( )標(biāo)志值倒數(shù)標(biāo)志值倒數(shù)平均數(shù)的倒平均數(shù)的倒數(shù)數(shù)Hx/iHiXiMxM某日三種蔬菜的批發(fā)成交數(shù)據(jù)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜蔬菜名稱(chēng)名稱(chēng)批發(fā)價(jià)格批發(fā)價(jià)格(元元/公斤公斤) Xi成交額成交額(元元) Mi=XiFi成交量成交量(公斤公斤)Fi甲甲

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論