統(tǒng)計學數(shù)據(jù)的圖表展示_第1頁
統(tǒng)計學數(shù)據(jù)的圖表展示_第2頁
統(tǒng)計學數(shù)據(jù)的圖表展示_第3頁
統(tǒng)計學數(shù)據(jù)的圖表展示_第4頁
統(tǒng)計學數(shù)據(jù)的圖表展示_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

關(guān)于統(tǒng)計學數(shù)據(jù)的圖表展示學習目標了解數(shù)據(jù)預處理的內(nèi)容和目的掌握分類和順序數(shù)據(jù)的整理與顯示方法掌握數(shù)值型數(shù)據(jù)的整理與顯示方法用Excel作頻數(shù)分布表和圖形合理使用圖表第2頁,共103頁,2024年2月25日,星期天

重點

1.分類、順序、數(shù)值型數(shù)據(jù)的整理

2.分類、順序、數(shù)值型數(shù)據(jù)的展示方法

難點利用Excel做頻數(shù)分布表和形圖和合理使用統(tǒng)計表

本章教學重點與難點第3頁,共103頁,2024年2月25日,星期天3.1

數(shù)據(jù)的預處理3.1.1數(shù)據(jù)審核3.1.2數(shù)據(jù)篩選3.1.3數(shù)據(jù)排序3.1.4數(shù)據(jù)透視表第4頁,共103頁,2024年2月25日,星期天數(shù)據(jù)的預處理數(shù)據(jù)審核檢查數(shù)據(jù)中的錯誤數(shù)據(jù)篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征數(shù)據(jù)透視按需要匯總第5頁,共103頁,2024年2月25日,星期天數(shù)據(jù)審核第6頁,共103頁,2024年2月25日,星期天數(shù)據(jù)審核—原始數(shù)據(jù)(rawdata)完整性審核應調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或變量是否填寫齊全準確性審核數(shù)據(jù)是否真實反映實際情況,內(nèi)容是否符合實際數(shù)據(jù)是否有錯誤,計算是否正確等第7頁,共103頁,2024年2月25日,星期天數(shù)據(jù)的審核—二手數(shù)據(jù)(secondhanddata)適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時效性審核盡可能使用最新的數(shù)據(jù)確認是否有必要做進一步的加工整理第8頁,共103頁,2024年2月25日,星期天數(shù)據(jù)篩選與排序第9頁,共103頁,2024年2月25日,星期天數(shù)據(jù)篩選(datafilter)當數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除第10頁,共103頁,2024年2月25日,星期天

用Excel進行數(shù)據(jù)篩選

8名學生的考試成績數(shù)據(jù)

數(shù)據(jù)篩選(datafilter)第11頁,共103頁,2024年2月25日,星期天數(shù)據(jù)排序(datarank)按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成第12頁,共103頁,2024年2月25日,星期天數(shù)據(jù)排序(方法)分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分2.數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)第13頁,共103頁,2024年2月25日,星期天數(shù)據(jù)透視表第14頁,共103頁,2024年2月25日,星期天數(shù)據(jù)透視表(pivottable)可以從復雜的數(shù)據(jù)中提取有用的信息可以對數(shù)據(jù)表的重要信息按使用者的習慣或分析要求進行匯總和作圖形成一個符合需要的交叉表(列聯(lián)表)在利用數(shù)據(jù)透視表時,數(shù)據(jù)源表中的首行必須有列標題第15頁,共103頁,2024年2月25日,星期天數(shù)據(jù)透視表(用Excel創(chuàng)建數(shù)據(jù)透視表)第1步:在Excel工作表中建立數(shù)據(jù)清單第2步:選中數(shù)據(jù)清單中的任意單元格,并選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第3步:確定數(shù)據(jù)源區(qū)域第4步:在【向?qū)А?步驟之3】中選擇數(shù)據(jù)透視表的輸出位置。然后選擇【布局】第5步:在【向?qū)А季帧繉υ捒蛑?,依次將”分類變量“拖至左邊的“行”區(qū)域,上邊的“列”區(qū)域,將需要匯總的“變量”拖至“數(shù)據(jù)區(qū)域”第6步:然后單擊【確定】,自動返回【向?qū)А?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表第16頁,共103頁,2024年2月25日,星期天3.2品質(zhì)數(shù)據(jù)的整理與展示3.2.1分類數(shù)據(jù)的整理與圖示3.2.2順序數(shù)據(jù)的整理與圖示第17頁,共103頁,2024年2月25日,星期天數(shù)據(jù)的整理與顯示(基本問題)要弄清所面對的數(shù)據(jù)類型不同類型的數(shù)據(jù),采取不同的處理方式和方法對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)第18頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的整理與圖示第19頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的整理(基本過程)1.列出各類別

2.計算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE第20頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的整理(可計算的統(tǒng)計量)頻數(shù)(frequency)

:落在各類別中的數(shù)據(jù)個數(shù)比例(proportion)

:某一類別數(shù)據(jù)個數(shù)占全部數(shù)據(jù)個數(shù)的比值百分比(percentage)

:將對比的基數(shù)作為100而計算的比值比率(ratio)

:不同類別數(shù)值個數(shù)的比值第21頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)整理—頻數(shù)分布表(例題分析)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)

用Excel制作頻數(shù)分布表綠色健康飲品第22頁,共103頁,2024年2月25日,星期天使用Excel數(shù)據(jù)透視表數(shù)計數(shù)(pivottable)第1步:選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第2步:確定數(shù)據(jù)源區(qū)域第3步:在【向?qū)А?步驟之3】中選擇數(shù)據(jù)透視表的輸出位置。然后選擇【布局】第4步:在【向?qū)А季帧繉υ捒蛑校来螌ⅰ胺诸愖兞俊?這里是飲料類型)連續(xù)拖放兩次:一次拖至左邊的“行”區(qū)域,一次拖至“數(shù)據(jù)”區(qū)域,將“顧客性別”拖至“列”區(qū)域第5步:然后單擊【確定】,自動返回【向?qū)А?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表第23頁,共103頁,2024年2月25日,星期天生成頻數(shù)分布表(定性數(shù)據(jù))不同類型飲料的頻數(shù)分布

第24頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—條形圖(barChart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(columnchart)

第25頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—條形圖(例題分析)第26頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—對比條形圖

(side-by-sidebarchart)分類變量在不同時間或不同空間上有多個取值對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688第27頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—對比條形圖(例題分析)第28頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—帕累托圖(paretochart)按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖主要用于展示分類數(shù)據(jù)的分布第29頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—餅圖(pieChart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題繪制圓形圖時,樣本或總體中各部分所占的百分比用圓內(nèi)的各個扇形角度表示,這些扇形的中心角度,按各部分數(shù)據(jù)百分比乘以3600確定第30頁,共103頁,2024年2月25日,星期天分類數(shù)據(jù)的圖示—餅圖(例題分析)第31頁,共103頁,2024年2月25日,星期天環(huán)形圖(doughnutchart)環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個樣本或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán)用于結(jié)構(gòu)比較研究

第32頁,共103頁,2024年2月25日,星期天環(huán)形圖(doughnutchart)【例】2006年北京、上海和天津地區(qū)按收入法計算的地區(qū)生產(chǎn)總值(按當年價格計算)數(shù)據(jù)。繪制環(huán)形圖比較三個地區(qū)的生產(chǎn)總值構(gòu)成第33頁,共103頁,2024年2月25日,星期天環(huán)形圖

(doughnutchart)北京、上海和天津地區(qū)按收入法計算的地區(qū)生產(chǎn)總值第34頁,共103頁,2024年2月25日,星期天順序數(shù)據(jù)的整理與圖示第35頁,共103頁,2024年2月25日,星期天順序數(shù)據(jù)的整理(可計算的統(tǒng)計量)1.累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加2.累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加

第36頁,共103頁,2024年2月25日,星期天順序數(shù)據(jù)的頻數(shù)分布表(例題分析)【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?”1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。

甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————第37頁,共103頁,2024年2月25日,星期天順序數(shù)據(jù)的頻數(shù)分布表(例題分析)乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————第38頁,共103頁,2024年2月25日,星期天順序數(shù)據(jù)的圖示—累計頻數(shù)分布圖(例題分析)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對住房狀況評價的累積頻數(shù)分布第39頁,共103頁,2024年2月25日,星期天環(huán)形圖(例題分析)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對住房狀況的評價第40頁,共103頁,2024年2月25日,星期天3.3數(shù)值型數(shù)據(jù)的整理與展示3.3.1數(shù)據(jù)分組3.3.2數(shù)值型數(shù)據(jù)的圖示第41頁,共103頁,2024年2月25日,星期天一、數(shù)據(jù)分組第42頁,共103頁,2024年2月25日,星期天分組方法分組方法等距分組異距分組單變量值分組組距分組第43頁,共103頁,2024年2月25日,星期天單變量值分組(要點)1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況

第44頁,共103頁,2024年2月25日,星期天組距分組(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~第45頁,共103頁,2024年2月25日,星期天組距分組的步驟1.將原始數(shù)據(jù)進行排序2.確定組數(shù)3.確定各組的組距4.確定各組的組限5.統(tǒng)計出各組的頻數(shù)下面舉例說明。第46頁,共103頁,2024年2月25日,星期天確定組數(shù)1、分組的目的之一是為了觀察數(shù)據(jù)的特征和規(guī)律。2、組數(shù)的多少應適中。不宜過多也不宜過少,一般5~15組3、組數(shù)的確定,應以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。第47頁,共103頁,2024年2月25日,星期天第48頁,共103頁,2024年2月25日,星期天確定各組組距組限:一個組的最小值稱為“下限”;一個組的最大值稱為“上限”。組距:是一個組的上限與下限之差。=(全部數(shù)據(jù)的最大值-全部數(shù)據(jù)的最小值)÷組數(shù)通常,組距宜取5或10的倍數(shù),且第一組的下限應小于最小變量值,最后一組的上限要大于最大的變量值。第49頁,共103頁,2024年2月25日,星期天組距分組應注意的問題一定要遵循“不重不漏”的原則。解決“不重”的問題,連續(xù)型變量的各相鄰組的組限必須重疊,習慣上規(guī)定“上組限不在內(nèi)”。當一組數(shù)據(jù)懸殊較大時,為避免出現(xiàn)空白組或極個別極端值被遺漏,一般應采用“××以下”及“××以上”,稱謂開口組。第50頁,共103頁,2024年2月25日,星期天組距分組(幾個概念)1.下限(lowerlimit)

:一個組的最小值2.上限(upperlimit)

:一個組的最大值3.組距(classwidth)

:上限與下限之差4.組中值(classmidpoint)

:下限與上限之間的中點值下限值+上限值2組中值=第51頁,共103頁,2024年2月25日,星期天頻數(shù)分布表的編制(例題分析)【例】某電腦公司2005年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進行分組第52頁,共103頁,2024年2月25日,星期天頻數(shù)分布表的編制(步驟)1.確定組數(shù):根據(jù)Sturges提出的經(jīng)驗公式得組數(shù)K為:確定各組的組距:組距=(237-141)÷10=9.6

10統(tǒng)計出各組的頻數(shù)。每個組的數(shù)據(jù)滿足a

x<b(上限值不在內(nèi))第53頁,共103頁,2024年2月25日,星期天等距分組表(上下組限重疊)第54頁,共103頁,2024年2月25日,星期天等距分組表(上下組限間斷)第55頁,共103頁,2024年2月25日,星期天等距分組表(使用開口組)第56頁,共103頁,2024年2月25日,星期天統(tǒng)計函數(shù)創(chuàng)建頻數(shù)分布表(FREQUENCY)使用統(tǒng)計函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖可解決這一問題。具體步驟是1、選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域2、選擇統(tǒng)計函數(shù)中的【FREQUENCY】函數(shù)3、在對話框【Date-array】后輸入數(shù)據(jù)區(qū)域,在【Bins-array】后輸入接受區(qū)域4、同時按下“ctrl-shift-Enter”組合鍵,即得到頻數(shù)分布第57頁,共103頁,2024年2月25日,星期天利用工具菜單中的【直方圖】

創(chuàng)建頻數(shù)分布表利用工具菜單中的【直方圖】來創(chuàng)建頻數(shù)分布表的步驟:第1步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】項第2步:在【數(shù)據(jù)分析】項對話框中選擇【直方圖】命令第3步:當出現(xiàn)對話框時:在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)區(qū)域在【接收區(qū)域】方框內(nèi)鍵入創(chuàng)建分組的上限值區(qū)域在【輸出區(qū)域】方框內(nèi)鍵入結(jié)果輸出的區(qū)域第58頁,共103頁,2024年2月25日,星期天二、數(shù)值型數(shù)據(jù)的圖示Excel

分組數(shù)據(jù)—直方圖和折線圖

未分組數(shù)據(jù)—莖葉圖和箱線圖

時間序列數(shù)據(jù)—線圖

多變量數(shù)據(jù)的圖示第59頁,共103頁,2024年2月25日,星期天分組數(shù)據(jù)—直方圖(histogram)用于展示分組數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖第60頁,共103頁,2024年2月25日,星期天分組數(shù)據(jù)的圖示(直方圖的繪制)140150210某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240第61頁,共103頁,2024年2月25日,星期天分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)第62頁,共103頁,2024年2月25日,星期天分組數(shù)據(jù)—折線圖(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的第63頁,共103頁,2024年2月25日,星期天分組數(shù)據(jù)的圖示(折線圖的繪制)折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530第64頁,共103頁,2024年2月25日,星期天數(shù)值型數(shù)據(jù)的圖示STATISTICA

未分組數(shù)據(jù)—莖葉圖和箱線圖第65頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)第66頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—莖葉圖(例題分析)某電腦公司銷售量分布的莖葉圖第67頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—箱線圖(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接該箱線圖也稱為Median/Quart./Range箱線圖第68頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖第69頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Rang箱線圖第70頁,共103頁,2024年2月25日,星期天分布的形狀與箱線圖

不同分布的箱線圖左偏分布QL中位數(shù)

QULeft-skeweddistribution右偏分布QL

中位數(shù)

QURight-skeweddistribution對稱分布QL中位數(shù)

QUBell-shapeddistribution第71頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖(例題分析)【例】

從某大學經(jīng)濟管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學生各科的考試成績數(shù)據(jù)課程名稱學生編號1234567891011英語經(jīng)濟數(shù)學西方經(jīng)濟學市場營銷學財務(wù)管理基礎(chǔ)會計學統(tǒng)計學計算機應用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177第72頁,共103頁,2024年2月25日,星期天未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)8門課程考試成績的Median/Quart./Range箱線圖第73頁,共103頁,2024年2月25日,星期天11名學生8門課程考試成績的Median/Quart./Range箱線圖min-max25%-75%medianvalue455565758595105學生1學生2學生3學生4學生5學生6學生7學生8學生9學生10學生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)第74頁,共103頁,2024年2月25日,星期天數(shù)值型數(shù)據(jù)的圖示

時間序列數(shù)據(jù)—線圖Excel第75頁,共103頁,2024年2月25日,星期天時間序列數(shù)據(jù)—線圖(lineplot)表示時間序列數(shù)據(jù)趨勢的圖形時間一般繪在橫軸,數(shù)據(jù)繪在縱軸圖形的長寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷第76頁,共103頁,2024年2月25日,星期天時間序列數(shù)據(jù)—線圖(例題分析)【例】我國1991~2003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試繪制線圖¥

1991~2003年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民(元)農(nóng)村居民(元)19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2第77頁,共103頁,2024年2月25日,星期天時間序列數(shù)據(jù)—線圖(例題分析)第78頁,共103頁,2024年2月25日,星期天數(shù)值型數(shù)據(jù)的圖示

多變量數(shù)據(jù)的圖示Excel第79頁,共103頁,2024年2月25日,星期天兩個變量間的關(guān)系—二維散點圖

(2DScatterplots)展示兩個變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi

,yi)在坐標系中用一個點表示,n組數(shù)據(jù)在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數(shù)據(jù)圖溫度/0C降雨量/mm產(chǎn)量/kg/hm262522508403450105845001368575014110580016987500211208250第80頁,共103頁,2024年2月25日,星期天兩個變量間的關(guān)系—二維散點圖

(2DScatterplots)第81頁,共103頁,2024年2月25日,星期天三個變量間的關(guān)系—氣泡圖

(bubblechart)顯示三個變量之間的關(guān)系圖中數(shù)據(jù)點的大小依賴于第三個變量第82頁,共103頁,2024年2月25日,星期天也稱為蜘蛛圖(spiderchart)顯示多個變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度多變量數(shù)據(jù)—雷達圖(radarchart)第83頁,共103頁,2024年2月25日,星期天

設(shè)有n組樣本S1,S2,…,Sn,每個樣本測得P個變量X1,X2

,…,XP,要繪制這P個變量的雷達圖,其具體做法是多變量數(shù)據(jù)—雷達圖

(雷達圖的制作)

先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖第84頁,共103頁,2024年2月25日,星期天多變量數(shù)據(jù)—雷達圖(例題分析)【例】2003年我國城鄉(xiāng)居民家庭平均每人各項生活消費支出構(gòu)成數(shù)據(jù)如表。試繪制雷達圖今天的主食是面包2003年城鄉(xiāng)居民家庭平均每人生活消費支出構(gòu)成(%)項目城鎮(zhèn)居民農(nóng)村居民

食品衣著家庭設(shè)備用品及服務(wù)醫(yī)療保健交通通訊娛樂教育文化服務(wù)居住雜項商品與服務(wù)37.129.796.307.3111.0814.3510.743.3045.595.674.205.968.3612.1315.872.21第85頁,共103頁,2024年2月25日,星期天多變量數(shù)據(jù)—雷達圖(例題分析)第86頁,共103頁,2024年2月25日,星期天數(shù)據(jù)類型及圖示(小結(jié))數(shù)據(jù)類型品質(zhì)數(shù)據(jù)數(shù)值型數(shù)據(jù)匯總表原始數(shù)據(jù)分組數(shù)據(jù)時序數(shù)據(jù)多元數(shù)據(jù)條形圖餅圖莖葉圖箱線圖直方圖折線圖線圖散點圖氣泡圖雷達圖環(huán)形圖第87頁,共103頁,2024年2月25日,星期天三、頻數(shù)分布的類型第88頁,共103頁,2024年2月25日,星期天次數(shù)分布的類型次數(shù)分布的類型:正態(tài)分布、偏態(tài)分布、J型分布、U型分布。第89頁,共103頁,2024年2月25日,星期天正態(tài)分布正態(tài)分布:是一種對稱的鐘型分布。它成“兩頭小,中間大”的形狀。有許多現(xiàn)象均服從正態(tài)分布。如農(nóng)作物的單位面積產(chǎn)量、學生的考試成績、零件的公差、纖維的強度等均服從正態(tài)分布。正態(tài)分布第90頁,共103頁,2024年2月25日,星期天正偏(右偏)分布正偏分布:是相對于“正態(tài)分布”而言的,表現(xiàn)為一組數(shù)據(jù)中多數(shù)數(shù)據(jù)偏低,少數(shù)數(shù)據(jù)偏高,有極大值出現(xiàn)。此時,全部數(shù)據(jù)的均值會高于中位數(shù)。右偏分布第91頁,共103頁,2024年2月25日,星期天負偏(左偏)分布負偏分布:也是相對于“正態(tài)分布”而言的,表現(xiàn)為一組數(shù)據(jù)中,多數(shù)數(shù)據(jù)偏高,少數(shù)數(shù)據(jù)偏低,有極小值出現(xiàn)。此時,全部數(shù)據(jù)的均值會低于中位數(shù)左偏分布第92頁,共103頁,2024年2月25日,星期天正J型分布正J分布:即全部數(shù)據(jù)由小到大成曲線形上升趨勢。正J型分布第93頁,共103頁,2024年2月25日,星期天反J型分布反J分布:即全部數(shù)據(jù)由大到小呈曲線下降趨勢。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論