版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三章第三章 統(tǒng)計(jì)數(shù)據(jù)的概括性描述統(tǒng)計(jì)數(shù)據(jù)的概括性描述第三章第三章 統(tǒng)計(jì)數(shù)據(jù)的概括性描述統(tǒng)計(jì)數(shù)據(jù)的概括性描述第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理與展示第二節(jié) 數(shù)據(jù)集位置的測(cè)度第三節(jié) 數(shù)據(jù)集離散程度的測(cè)度第四節(jié) 數(shù)據(jù)集的峰度與偏度學(xué)習(xí)目標(biāo)1. 了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的2. 掌握分配數(shù)列的整理與顯示方法掌握分配數(shù)列的整理與顯示方法3. 掌握數(shù)據(jù)集的位置測(cè)度的變量與方法掌握數(shù)據(jù)集的位置測(cè)度的變量與方法4. 掌握數(shù)據(jù)集的離散程度測(cè)度的變量與方法掌握數(shù)據(jù)集的離散程度測(cè)度的變量與方法5. 掌握數(shù)據(jù)集的分布形態(tài)測(cè)度的變量與方法掌握數(shù)據(jù)集的分布形態(tài)測(cè)度的變量與方法案例與背景 統(tǒng)計(jì)數(shù)據(jù)首先需要經(jīng)過
2、預(yù)處理和整理,以便人們對(duì)數(shù)據(jù)分布的類型和特點(diǎn)有了一個(gè)大概的了解。但這種了解并不能幫助我們準(zhǔn)確地描述出統(tǒng)計(jì)數(shù)據(jù)的分布,還需要更深入的分析,找到能反映數(shù)據(jù)分布特征的各個(gè)代表值。對(duì)統(tǒng)計(jì)數(shù)據(jù)分布的特征和規(guī)律,可以從本章所介紹的三個(gè)方面進(jìn)行測(cè)度和描述:一是數(shù)據(jù)集位置的測(cè)度,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二是數(shù)據(jù)集離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢(shì);三是數(shù)據(jù)集的峰度與偏度,反映數(shù)據(jù)分布的形狀。這三個(gè)方面從不同側(cè)面反映了數(shù)據(jù)分布特征。本章將重點(diǎn)介紹這些代表值的計(jì)算方法、特點(diǎn)及其應(yīng)用。第一節(jié)第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理與展示統(tǒng)計(jì)數(shù)據(jù)的整理與展示3.1.1 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理3.1.2 頻數(shù)分布表的
3、編制與圖示頻數(shù)分布表的編制與圖示3.1.1 數(shù)據(jù)的預(yù)處理1. 數(shù)據(jù)的審核數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯(cuò)誤檢查數(shù)據(jù)中的錯(cuò)誤2. 數(shù)據(jù)的篩選數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)找出符合條件的數(shù)據(jù)3. 數(shù)據(jù)排序數(shù)據(jù)排序升序和降序升序和降序?qū)ふ覕?shù)據(jù)的基本特征尋找數(shù)據(jù)的基本特征數(shù)據(jù)審核原始數(shù)據(jù)(raw data) 審核的內(nèi)容審核的內(nèi)容1.1. 完整性審核完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全2.2. 準(zhǔn)確性審核準(zhǔn)確性審核檢查數(shù)據(jù)是否真實(shí)反映客觀實(shí)際情況,內(nèi)檢查數(shù)據(jù)是否真實(shí)反映客觀實(shí)際情況,內(nèi)容是否符合實(shí)際容是否符合實(shí)際
4、檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等數(shù)據(jù)的審核原始數(shù)據(jù)(raw data)審核數(shù)據(jù)準(zhǔn)確性的方法審核數(shù)據(jù)準(zhǔn)確性的方法1.1. 邏輯檢查邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項(xiàng)目或數(shù)字之間有無相互矛盾的現(xiàn)象合理,各項(xiàng)目或數(shù)字之間有無相互矛盾的現(xiàn)象主要用于對(duì)分類和順序據(jù)的審核主要用于對(duì)分類和順序據(jù)的審核2.2. 計(jì)算檢查計(jì)算檢查檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無錯(cuò)誤上有無錯(cuò)誤主要用于對(duì)數(shù)值型數(shù)據(jù)的審核主要用于對(duì)數(shù)值型數(shù)據(jù)的審核數(shù)據(jù)的審核二手?jǐn)?shù)據(jù)(sec
5、ond hand data)1. 適用性審核適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料背景材料確定數(shù)據(jù)是否符合自己分析研究的需要確定數(shù)據(jù)是否符合自己分析研究的需要2. 時(shí)效性審核時(shí)效性審核盡可能使用最新的數(shù)據(jù)盡可能使用最新的數(shù)據(jù)3. 確認(rèn)是否必要做進(jìn)一步的加工整理確認(rèn)是否必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter)1. 當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時(shí),數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選需要對(duì)數(shù)據(jù)進(jìn)行篩選2. 數(shù)據(jù)篩選的內(nèi)容包括數(shù)據(jù)篩選的
6、內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔符合特定條件的數(shù)據(jù)予以剔用用SPSS進(jìn)行數(shù)據(jù)篩選進(jìn)行數(shù)據(jù)篩選 數(shù)據(jù)篩選(data filter)數(shù)據(jù)排序 (data rank)1. 按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問題的線索的特征或趨勢(shì),找到解決問題的線索2. 排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)歸類或分組等提供依據(jù)3. 在
7、某些場(chǎng)合,排序本身就是分析的目的之在某些場(chǎng)合,排序本身就是分析的目的之一一4. 排序可借助于計(jì)算機(jī)完成排序可借助于計(jì)算機(jī)完成數(shù)據(jù)排序 (方法)1.1. 分類數(shù)據(jù)的排序分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降也可按筆畫排序,其中也有筆畫多少的升序降序之分序之分2.2. 數(shù)值型數(shù)據(jù)的排序數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為遞增排序:設(shè)一組數(shù)據(jù)為x x1 1,x x2 2,x xn n,遞增,遞增排序后可表示為:排
8、序后可表示為:x x(1)(1) x x( (2)2) x x(2)(2)x x(n)(n)3.1.2 頻數(shù)分布表的編制與圖示1. 頻數(shù)與頻數(shù)分布頻數(shù)與頻數(shù)分布2. 統(tǒng)計(jì)分組統(tǒng)計(jì)分組3. 品質(zhì)數(shù)列的整理和顯示品質(zhì)數(shù)列的整理和顯示4. 變量數(shù)列的整理和顯示變量數(shù)列的整理和顯示5. 頻數(shù)分布的類型頻數(shù)分布的類型1. 頻數(shù)與頻數(shù)分布頻數(shù)與頻數(shù)分布頻數(shù)分布數(shù)列的概念頻數(shù)分布數(shù)列的概念在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體的所有單在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體的所有單位按組歸類整理,并按一定順序排列,位按組歸類整理,并按一定順序排列,形成總體中各個(gè)單位在各組簡(jiǎn)的分布,形成總體中各個(gè)單位在各組簡(jiǎn)的分布,又稱次數(shù)分配或分布
9、數(shù)列。又稱次數(shù)分配或分布數(shù)列。頻數(shù)頻數(shù)( (frequency)frequency) :又叫次數(shù),又叫次數(shù),落在各類別落在各類別中的數(shù)據(jù)(單位)個(gè)數(shù),中的數(shù)據(jù)(單位)個(gè)數(shù),記作記作 Fi 。 頻率頻率( (ratio)ratio) :又叫比率,各組次數(shù)(頻數(shù))又叫比率,各組次數(shù)(頻數(shù))與總次數(shù)(頻數(shù))之比。與總次數(shù)(頻數(shù))之比。 頻率分布的性質(zhì):頻率分布的性質(zhì):= = = = = =110111NiNiiiNiiiFFFF分配數(shù)列的種類 品質(zhì)分配數(shù)列(屬性分布數(shù)品質(zhì)分配數(shù)列(屬性分布數(shù)列)列) :按品質(zhì)標(biāo)志分組形成的:按品質(zhì)標(biāo)志分組形成的分配數(shù)列。分配數(shù)列。 變量分配數(shù)列(變量分布數(shù)變量分配數(shù)
10、列(變量分布數(shù)列)列) :按數(shù)量標(biāo)志分組形成的:按數(shù)量標(biāo)志分組形成的分配數(shù)列。分配數(shù)列。單項(xiàng)數(shù)列:總體按單項(xiàng)式分組而形單項(xiàng)數(shù)列:總體按單項(xiàng)式分組而形成的變量數(shù)列,每個(gè)變量值是一個(gè)成的變量數(shù)列,每個(gè)變量值是一個(gè)組,順序排列。組,順序排列。 組距數(shù)列:總體按組距式分組而形組距數(shù)列:總體按組距式分組而形成的變量數(shù)列,每個(gè)組是由若干個(gè)成的變量數(shù)列,每個(gè)組是由若干個(gè)變量值形成的區(qū)間表示。變量值形成的區(qū)間表示。 分配數(shù)列分配數(shù)列品質(zhì)數(shù)列品質(zhì)數(shù)列變量數(shù)列變量數(shù)列單項(xiàng)數(shù)列單項(xiàng)數(shù)列組距數(shù)列組距數(shù)列2. 統(tǒng)計(jì)分組統(tǒng)計(jì)分組統(tǒng)計(jì)分組概念:概念: 是根據(jù)統(tǒng)計(jì)研究的目的,選擇某一主要標(biāo)志,是根據(jù)統(tǒng)計(jì)研究的目的,選擇某一主
11、要標(biāo)志,將總體單位劃分為若干類型或組別,使組內(nèi)將總體單位劃分為若干類型或組別,使組內(nèi)具有同質(zhì)性,組間具有差異性。具有同質(zhì)性,組間具有差異性。統(tǒng)計(jì)分組統(tǒng)計(jì)分組作用作用 劃分現(xiàn)象的類型劃分現(xiàn)象的類型 揭示現(xiàn)象內(nèi)部結(jié)構(gòu)揭示現(xiàn)象內(nèi)部結(jié)構(gòu) 分析現(xiàn)象之間的依存關(guān)系分析現(xiàn)象之間的依存關(guān)系統(tǒng)計(jì)分組分組標(biāo)志的選擇統(tǒng)計(jì)分組的關(guān)鍵問題:如何選擇分組標(biāo)志統(tǒng)計(jì)分組的關(guān)鍵問題:如何選擇分組標(biāo)志和確定各組的界限。和確定各組的界限。根據(jù)統(tǒng)計(jì)研究的目的來選擇根據(jù)統(tǒng)計(jì)研究的目的來選擇在滿足研究目的的前提下,應(yīng)選擇本質(zhì)的、在滿足研究目的的前提下,應(yīng)選擇本質(zhì)的、主要的,而不是非本質(zhì)的、次要的標(biāo)志。主要的,而不是非本質(zhì)的、次要的標(biāo)志。
12、考慮具體的歷史和經(jīng)濟(jì)條件??紤]具體的歷史和經(jīng)濟(jì)條件。簡(jiǎn)單分組、復(fù)合分組和分組體系根據(jù)采用的分組標(biāo)志的多少,可根據(jù)采用的分組標(biāo)志的多少,可以分為:以分為:簡(jiǎn)單分組簡(jiǎn)單分組復(fù)合分組復(fù)合分組簡(jiǎn)單分組 又稱單一分組,是對(duì)被研究現(xiàn)象總體只按又稱單一分組,是對(duì)被研究現(xiàn)象總體只按一個(gè)標(biāo)志進(jìn)行的分組。一個(gè)標(biāo)志進(jìn)行的分組。 特點(diǎn):特點(diǎn): 只能反映現(xiàn)象在某一標(biāo)志特征方面的差異情況。只能反映現(xiàn)象在某一標(biāo)志特征方面的差異情況。 不能反映現(xiàn)象在其他標(biāo)志特征方面的差異,說不能反映現(xiàn)象在其他標(biāo)志特征方面的差異,說明問題比較簡(jiǎn)單明了。明問題比較簡(jiǎn)單明了。簡(jiǎn)單分組復(fù)合分組對(duì)同一總體選擇兩個(gè)或兩個(gè)以上標(biāo)志層疊起來對(duì)同一總體選擇兩
13、個(gè)或兩個(gè)以上標(biāo)志層疊起來進(jìn)行的分組。進(jìn)行的分組。特點(diǎn):特點(diǎn):可以從幾個(gè)不同角度了解總體內(nèi)部的差別和關(guān)系,可以從幾個(gè)不同角度了解總體內(nèi)部的差別和關(guān)系,比簡(jiǎn)單分組能更全面、更深入地研究問題;比簡(jiǎn)單分組能更全面、更深入地研究問題;分組的組數(shù)隨著分組標(biāo)志的增加而成倍地增加。因分組的組數(shù)隨著分組標(biāo)志的增加而成倍地增加。因而在采用復(fù)合分組時(shí),選擇分組標(biāo)志的數(shù)量要適量,而在采用復(fù)合分組時(shí),選擇分組標(biāo)志的數(shù)量要適量,并且要考慮倒只有在總體包括的單位數(shù)較多的情況并且要考慮倒只有在總體包括的單位數(shù)較多的情況下,才宜于采用復(fù)合分組。下,才宜于采用復(fù)合分組。 理理科科學(xué)學(xué)生生組組高高等等學(xué)學(xué)校校學(xué)學(xué)生生總總體體男男學(xué)
14、學(xué)生生組組女女學(xué)學(xué)生生組組男男學(xué)學(xué)生生組組女女學(xué)學(xué)生生組組本本科科學(xué)學(xué)生生組組專??瓶茖W(xué)學(xué)生生組組男男學(xué)學(xué)生生組組女女學(xué)學(xué)生生組組男男學(xué)學(xué)生生組組女女學(xué)學(xué)生生組組文文科科學(xué)學(xué)生生組組本本科科學(xué)學(xué)生生組組專專科科學(xué)學(xué)生生組組復(fù)合分組分組體系為了從不同側(cè)面反映總體的特征,運(yùn)用幾為了從不同側(cè)面反映總體的特征,運(yùn)用幾個(gè)標(biāo)志對(duì)總體進(jìn)行分組,形成的一個(gè)完整個(gè)標(biāo)志對(duì)總體進(jìn)行分組,形成的一個(gè)完整的體系。的體系。分組體系有兩種不同的形式:分組體系有兩種不同的形式:平行分組體系:同一個(gè)總體的幾個(gè)簡(jiǎn)單分組平行分組體系:同一個(gè)總體的幾個(gè)簡(jiǎn)單分組按某一規(guī)定排列起來就構(gòu)成一個(gè)平行分組體按某一規(guī)定排列起來就構(gòu)成一個(gè)平行分組
15、體系。系。復(fù)合分組體系:由復(fù)合分組形成的分組系列。復(fù)合分組體系:由復(fù)合分組形成的分組系列。品質(zhì)分布數(shù)列的整理分類分類分類分類分類分類頻數(shù)頻數(shù)頻數(shù)頻數(shù)頻數(shù)頻數(shù)比例比例比例比例比例比例百分比百分比百分比百分比百分比百分比比率比率比率比率比率比率A A AB B BC C CD D DE E E分類數(shù)據(jù)整理頻數(shù)分布表 (例題分析)分類數(shù)據(jù)的圖示條形圖(bar Chart) 用寬度相同的條形的高度或長(zhǎng)短來表示用寬度相同的條形的高度或長(zhǎng)短來表示各類別數(shù)據(jù)的圖形各類別數(shù)據(jù)的圖形 有單式條形圖、復(fù)式條形圖等形式有單式條形圖、復(fù)式條形圖等形式 主要用于反映分類數(shù)據(jù)的頻數(shù)分布主要用于反映分類數(shù)據(jù)的頻數(shù)分布 繪制
16、時(shí),各類別可以放在縱軸,稱為條繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖形圖,也可以放在橫軸,稱為柱形圖分類數(shù)據(jù)的圖示條形圖 (例題分析)15119690481216頻數(shù)可口可樂旭日升冰茶百事可樂匯源果汁露露品牌不同品牌飲料的頻數(shù)分布不同品牌飲料的頻數(shù)分布分類數(shù)據(jù)的圖示餅圖(pie Chart) 也稱圓形圖,是用圓形及園內(nèi)扇形的面積也稱圓形圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形來表示數(shù)值大小的圖形 主要用于表示總體或樣本中各組成部分所主要用于表示總體或樣本中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問題十分有用占的比例,對(duì)于研究結(jié)構(gòu)性問題十分有用 繪制圓形圖時(shí),總體
17、中各部分所占的百分繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示,這些扇形比用園內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3603600 0的相應(yīng)比例確定的的相應(yīng)比例確定的分類數(shù)據(jù)的圖示餅圖 (例題分析)順序數(shù)據(jù)的整理 累積頻數(shù)累積頻數(shù)( (cumulative frequenciescumulative frequencies) ):各類:各類別頻數(shù)的逐級(jí)累加別頻數(shù)的逐級(jí)累加 累積頻率累積頻率( (cumulative percentagescumulative percentages) ):各類:各類別頻率別頻率( (
18、百分比百分比) )的逐級(jí)累加的逐級(jí)累加順序數(shù)據(jù)的頻數(shù)分布表(例題分析)甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別回答類別甲城市甲城市戶數(shù)戶數(shù)(戶戶)百分比百分比(%)累累 計(jì)計(jì)戶數(shù)戶數(shù)(戶戶)百分比百分比(%) 非常不滿意非常不滿意 不滿意不滿意 一般一般 滿意滿意 非常滿意非常滿意24108934530836311510241322252703008.044.075.090.0100.0合計(jì)合計(jì)300100.0順序數(shù)據(jù)的頻數(shù)分布表 (例題分析)乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別回答類別乙城市乙城市戶數(shù)戶數(shù)(戶戶)百分
19、比百分比(%)累累 計(jì)計(jì)戶數(shù)戶數(shù)(戶戶)百分比百分比(%) 非常不滿意非常不滿意 不滿意不滿意 一般一般 滿意滿意 非常滿意非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.0合計(jì)合計(jì)300100.0順序數(shù)據(jù)的圖示累計(jì)頻數(shù)分布圖 (例題分析)環(huán)形圖(annular chart) 環(huán)形圖中間有一個(gè)環(huán)形圖中間有一個(gè)“空洞空洞”,總體中的每一,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示部分?jǐn)?shù)據(jù)用環(huán)中的一段表示 環(huán)形圖與圓形圖類似,但又有區(qū)別環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個(gè)總體各部分所占的比例圓形圖只能顯示一個(gè)
20、總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán) 環(huán)形圖可用于結(jié)構(gòu)比較研究環(huán)形圖可用于結(jié)構(gòu)比較研究 環(huán)形圖主要用于展示分類和順序數(shù)據(jù)環(huán)形圖主要用于展示分類和順序數(shù)據(jù)環(huán)形圖 (例題分析)8%36%31%15%7%33%26%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià)甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià) 數(shù)據(jù)分組數(shù)據(jù)分組 累計(jì)頻數(shù)分布累計(jì)頻數(shù)分布 數(shù)值型數(shù)據(jù)的圖示數(shù)值型數(shù)據(jù)的圖示數(shù)據(jù)分組分組方法分組方法分組方法等距分組等距分組異距分組異距分組單變量
21、值分組單變量值分組組距分組組距分組單變量值分組(要點(diǎn)) 將一個(gè)變量值作為一組將一個(gè)變量值作為一組 適合于離散變量適合于離散變量 適合于變量值較少的情況適合于變量值較少的情況組距分組 (要點(diǎn)) 將變量值的一個(gè)區(qū)間作為一組將變量值的一個(gè)區(qū)間作為一組 適合于連續(xù)變量適合于連續(xù)變量 適合于變量值較多的情況適合于變量值較多的情況 需要遵循需要遵循“不重不漏不重不漏”的原則的原則 可采用等距分組,也可采用不等距分組可采用等距分組,也可采用不等距分組等距分組(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按和規(guī)律為目的。在實(shí)
22、際分組時(shí),可以按 SturgesSturges 提出提出的經(jīng)驗(yàn)公式來確定組數(shù)的經(jīng)驗(yàn)公式來確定組數(shù)K K頻數(shù)分布表的編制(例題分析)頻數(shù)分布表的編制(步驟) 確定組數(shù):根據(jù)確定組數(shù):根據(jù) Sturges Sturges 提出的經(jīng)驗(yàn)公式提出的經(jīng)驗(yàn)公式得組數(shù)得組數(shù)K K為:為:組距分組與不等距分組(在表現(xiàn)頻數(shù)分布上的差異) 等距分組等距分組各組頻數(shù)的分布不受組距大小的影響各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對(duì)頻數(shù)來觀察頻數(shù)分布的特征可直接根據(jù)絕對(duì)頻數(shù)來觀察頻數(shù)分布的特征 不等距分組不等距分組各組頻數(shù)的分布受組距大小不同的影響各組頻數(shù)的分布受組距大小不同的影響各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布
23、的實(shí)際各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況狀況需要用頻數(shù)密度反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度反映頻數(shù)分布的實(shí)際狀況異距分組(幾個(gè)概念) 標(biāo)準(zhǔn)組距:數(shù)列中能被各組組距整除的最大組距。標(biāo)準(zhǔn)組距:數(shù)列中能被各組組距整除的最大組距。 常用數(shù)列中的最小組距作為標(biāo)準(zhǔn)組距。常用數(shù)列中的最小組距作為標(biāo)準(zhǔn)組距。各各組組頻頻數(shù)數(shù)(次次數(shù)數(shù))頻頻數(shù)數(shù)(次次數(shù)數(shù))密密度度各各組組組組距距各各組組頻頻率率頻頻率率密密度度各各組組組組距距異距分組 (例題分析)某廠工人年齡分布情況某廠工人年齡分布情況工人按年齡分組工人按年齡分組組距組距人數(shù)(人)人數(shù)(人)標(biāo)準(zhǔn)組距標(biāo)準(zhǔn)組距人數(shù)人數(shù)次數(shù)密度次數(shù)密度15202025
24、253030353545455055551051728407065101728407032.5103.45.68146.52合計(jì)合計(jì)230異距分組 (例題分析)異距分組 (例題分析)組限和組中值 組限組限( (class limit)class limit) :各組的上限界限值:各組的上限界限值 組下限組下限( (low limit)low limit) :一個(gè)組的最小值:一個(gè)組的最小值 組上限組上限( (upper limit)upper limit) :一個(gè)組的最大值:一個(gè)組的最大值 閉口組:上限和下限都齊全的組閉口組:上限和下限都齊全的組 開口組:上限或下限有一個(gè)沒有的組開口組:上限或下
25、限有一個(gè)沒有的組組限的確定組限確定有一個(gè)基本原則:即按這樣的組組限確定有一個(gè)基本原則:即按這樣的組限分組后,標(biāo)志值在各組的變動(dòng)能反映事限分組后,標(biāo)志值在各組的變動(dòng)能反映事物的質(zhì)的變化。物的質(zhì)的變化。常用的組限表示方法:常用的組限表示方法:按連續(xù)變量分組,由于相鄰兩組的上限和下限常時(shí)按連續(xù)變量分組,由于相鄰兩組的上限和下限常時(shí)同一數(shù)值,每組的界限會(huì)重疊,為避免計(jì)算各組次同一數(shù)值,每組的界限會(huì)重疊,為避免計(jì)算各組次數(shù)時(shí)出現(xiàn)混亂,一般的原則是數(shù)時(shí)出現(xiàn)混亂,一般的原則是“上組限不在內(nèi),或上組限不在內(nèi),或下組限不在內(nèi)下組限不在內(nèi)”。按離散變量分組,則相鄰的上限和現(xiàn)象通常是以兩按離散變量分組,則相鄰的上限
26、和現(xiàn)象通常是以兩個(gè)確定的不同整數(shù)值來表示,故相鄰兩組的上下限個(gè)確定的不同整數(shù)值來表示,故相鄰兩組的上下限可以不重合??梢圆恢睾?。 等距分組表(上下組限重疊)等距分組表(上下組限間斷)等距分組表(使用開口組)組中值(class midpoint) 組中值組中值( (class midpoint)class midpoint) :下限與上限之間的:下限與上限之間的中點(diǎn)值。中點(diǎn)值。2鄰鄰組組組組距距缺缺上上限限的的開開口口組組組組中中值值下下限限下限值下限值+上限值上限值2組中值組中值 =2鄰鄰組組組組距距缺缺下下限限的的開開口口組組組組中中值值上上限限累計(jì)頻數(shù)分布累計(jì)頻數(shù)分布在頻數(shù)分布的基礎(chǔ)上將各
27、組頻數(shù)逐一累計(jì),稱為頻在頻數(shù)分布的基礎(chǔ)上將各組頻數(shù)逐一累計(jì),稱為頻數(shù)分布累計(jì)。數(shù)分布累計(jì)。向上累計(jì):從變量值最低組開始向變量值高的組累計(jì),向上累計(jì):從變量值最低組開始向變量值高的組累計(jì),表明小與該組上限的頻數(shù)(頻率)一共有多少;表明小與該組上限的頻數(shù)(頻率)一共有多少;向下累計(jì):從變量值最高組開始向變量值低的組累計(jì),向下累計(jì):從變量值最高組開始向變量值低的組累計(jì),表明大與該組下限的頻數(shù)(頻率)一共有多少。表明大與該組下限的頻數(shù)(頻率)一共有多少。特點(diǎn):同一數(shù)值的向上累計(jì)和向下累計(jì)次數(shù)之和等于特點(diǎn):同一數(shù)值的向上累計(jì)和向下累計(jì)次數(shù)之和等于總體總次數(shù)??傮w總次數(shù)。 累計(jì)頻數(shù)分布圖:以變量值為橫坐標(biāo)
28、,累計(jì)頻數(shù)和累計(jì)頻數(shù)分布圖:以變量值為橫坐標(biāo),累計(jì)頻數(shù)和頻率為縱坐標(biāo)。頻率為縱坐標(biāo)。累計(jì)頻數(shù)分布(例題分析)141141159159166166172172177177182182188188196196203203214214143143160160167167173173177177183183189189196196203203215215144144160160168168173173178178184184189189196196205205218218149149161161168168174174178178185185189189196196206206223223150150
29、161161168168174174178178186186190190196196207207225225152152162162170170174174179179186186190190197197208208226226153153163163171171175175179179187187191191197197209209228228153153163163171171175175179179187187192192198198210210233233154154164164172172175175180180187187194194198198210210233233155155
30、165165172172175175180180187187194194200200211211234234156156165165172172176176181181188188195195201201211211234234158158165165172172176176182182188188195195202202213213237237某電腦公司某電腦公司20022002年前年前4 4個(gè)月的銷售量個(gè)月的銷售量累計(jì)頻數(shù)分布(例題分析)按銷售量按銷售量分組分組( (臺(tái)臺(tái)) )頻數(shù)頻數(shù)(天)(天)頻率頻率(% %)向上累積頻率向上累積頻率(% %)向下累積頻率向下累積頻率(% %)1501
31、50以下以下4 43.333.333.333.33100.00 100.00 1501501601609 97.507.5010.8310.8396.67 96.67 160160170170161613.3313.3324.1724.1789.1789.17170170180180272722.5022.5046.6746.6775.8375.83180180190190202016.6716.6763.3363.3355.3355.33190190200200171714.1714.1777.5077.5036.6736.6720020021021010108.338.3385.8385.
32、8322.5022.502102102202208 86.676.6792.5092.5014.1714.172202202302304 43.333.3395.8395.837.507.50230230以上以上5 54.174.17100.00100.004.174.17合計(jì)合計(jì)120120100100100.00100.00100.00100.00累計(jì)頻數(shù)分布(例題分析)變量分布數(shù)列的圖示分組數(shù)據(jù)直方圖(histogram)1.1. 用矩形的寬度和高度來表示頻數(shù)分布的圖用矩形的寬度和高度來表示頻數(shù)分布的圖形,實(shí)際上是用矩形的形,實(shí)際上是用矩形的面積面積來表示各組的來表示各組的頻數(shù)分布頻數(shù)分
33、布2.2. 在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖形成了一個(gè)矩形,即直方圖3.3. 直方圖下的總面積等于直方圖下的總面積等于1 1分組數(shù)據(jù)的圖示(直方圖的繪制)140 150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖某電腦公司銷售量分布的直方圖190 200180160 170頻頻數(shù)數(shù)(天天)25201510530220 230 240分組數(shù)據(jù)直方圖(直方圖與條形圖的區(qū)別)1.1. 條形圖是用條形的長(zhǎng)度條形圖是用條形的長(zhǎng)度( (橫置時(shí)橫置時(shí)) )表示
34、各類別頻數(shù)表示各類別頻數(shù)的多少,其寬度的多少,其寬度( (表示類別表示類別) )則是固定的則是固定的2.2. 直方圖是用面積表示各組頻數(shù)的多少,矩形的高直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義的組距,其高度與寬度均有意義3.3. 直方圖的各矩形通常是連續(xù)排列,條形圖則是分直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列開排列4.4. 條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)于展示數(shù)值型數(shù)據(jù)分組數(shù)據(jù)折線圖(frequency
35、 polygon)1.1. 折線圖也稱頻數(shù)多邊形圖折線圖也稱頻數(shù)多邊形圖2.2. 是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)( (組組中值中值) )用直線連接起來,再把原來的直方圖抹掉用直線連接起來,再把原來的直方圖抹掉3.3. 折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面
36、積相等,二者折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示(折線圖的繪制)折線圖與直方圖下的面積相等!140 150210某電腦公司銷售量分布的折線圖某電腦公司銷售量分布的折線圖190200180160 170220 230240頻頻數(shù)數(shù)(天天)25201510530數(shù)值型數(shù)據(jù)的圖示未分組數(shù)據(jù)莖葉圖(stem-and-leaf display)1.用于顯示未分組的原始數(shù)據(jù)的分布用于顯示未分組的原始數(shù)據(jù)的分布2.由由“莖莖”和和“葉葉”兩部分構(gòu)成,其圖形是由數(shù)字組兩部分構(gòu)成,其圖形是由數(shù)字組成的成的3.以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)
37、字作樹葉以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉4.樹葉上只保留一位數(shù)字樹葉上只保留一位數(shù)字5.對(duì)于對(duì)于n(20 n 300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過 L = 10 lg(n) 6.莖葉圖類似于橫置的直方圖,但又有區(qū)別莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)莖葉圖(例題分析)未分組數(shù)據(jù)莖葉圖(擴(kuò)展的莖葉圖)
38、未分組數(shù)據(jù)箱線圖(box plot)1. 用于顯示未分組的原始數(shù)據(jù)的分布用于顯示未分組的原始數(shù)據(jù)的分布2. 箱線圖由一組數(shù)據(jù)的箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成由一個(gè)箱子和兩條線段組成3. 其繪制方法是:其繪制方法是:首先找出一組數(shù)據(jù)的首先找出一組數(shù)據(jù)的5個(gè)特征值,即個(gè)特征值,即最大值、最最大值、最小值、中位數(shù)小值、中位數(shù)Me 和兩個(gè)和兩個(gè)四分位數(shù)四分位數(shù)(下四分位數(shù)下四分位數(shù)QL和上四分位數(shù)和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接點(diǎn)與箱子相連接 未分組數(shù)據(jù)單批數(shù)據(jù)箱線
39、圖(箱線圖的構(gòu)成)未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140 150 160 170 180 190 200 210 220 230 240某電腦公司銷售量數(shù)據(jù)的箱線圖某電腦公司銷售量數(shù)據(jù)的箱線圖分布的形狀與箱線圖對(duì)稱分布對(duì)稱分布QL中位數(shù)中位數(shù) QU左偏分布左偏分布QL中位數(shù)中位數(shù) QU右偏分布右偏分布QL 中位數(shù)中位數(shù) QU未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)11名學(xué)生各科的考試成績(jī)數(shù)據(jù)名學(xué)生各科的考試成績(jī)數(shù)據(jù)課程名稱課程名稱學(xué)生編號(hào)學(xué)生編號(hào)1234567891011英語英語經(jīng)濟(jì)數(shù)學(xué)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)
40、營(yíng)銷學(xué)市場(chǎng)營(yíng)銷學(xué)財(cái)務(wù)管理財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖(例題分析)Min-Max25%-75%Median value455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)數(shù)值型數(shù)據(jù)的圖示時(shí)間序列數(shù)據(jù)線圖(line plot) 繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)1. 時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸2. 圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為為10:73. 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州省貴陽市花溪區(qū)高坡民族中學(xué)2024-2025學(xué)年度第一學(xué)期12月質(zhì)量監(jiān)測(cè)九年級(jí)數(shù)學(xué)試卷
- 2021年高考英語考點(diǎn)總動(dòng)員系列-專題03-介詞和介詞短語(解析版)
- 【名師一號(hào)】2020-2021學(xué)年新課標(biāo)化學(xué)必修一-綜合能力檢測(cè)4-非金屬及其化合物
- 四年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)及答案
- 2021高考地理二輪專項(xiàng)突破:自然地理事物特征描述和原理闡釋(2)課后訓(xùn)練及詳解
- 《肝硬化的臨床表現(xiàn)》課件
- 【名師一號(hào)】2020-2021學(xué)年蘇教版化學(xué)必修二雙基限時(shí)練21-蛋白質(zhì)和氨基酸
- 【2022屆走向高考】高三數(shù)學(xué)一輪(北師大版)基礎(chǔ)鞏固:第4章-第7節(jié)-正弦定理、余弦定理的應(yīng)用舉例
- 《甲狀腺術(shù)后的護(hù)理》課件
- 室內(nèi)配線工年終工作總結(jié)計(jì)劃匯報(bào)
- 淮北市和淮南市2025屆高三第一次質(zhì)量檢測(cè)(一模)地理試卷(含答案)
- 化學(xué)-安徽省淮北市和淮南市2025屆高三第一質(zhì)量檢測(cè)(淮北淮南一模)試題和答案
- 2020-2021學(xué)年【江西省撫州市】八年級(jí)(上)期末生物試卷
- 2025年山西文旅集團(tuán)招聘筆試參考題庫含答案解析
- 【8地RJ期末】安徽省蕪湖市無為市2023-2024學(xué)年八年級(jí)上學(xué)期期末地理試題(含解析)
- 2023學(xué)年杭州市十四中高二數(shù)學(xué)(上)期末考試卷附答案解析
- 新增值稅法學(xué)習(xí)課件
- 中國(guó)AI+Agent應(yīng)用研究報(bào)告
- 五級(jí)(程控交換)職業(yè)技能鑒定理論考試題及答案
- 醫(yī)療救護(hù)合作協(xié)議
- 《微元法的應(yīng)用》課件
評(píng)論
0/150
提交評(píng)論