描述性統(tǒng)計分析_第1頁
描述性統(tǒng)計分析_第2頁
描述性統(tǒng)計分析_第3頁
描述性統(tǒng)計分析_第4頁
描述性統(tǒng)計分析_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于描述性統(tǒng)計分析第1頁,共59頁,2022年,5月20日,23點4分,星期四本章學(xué)習(xí)目標(biāo):掌握數(shù)據(jù)分析項目的整個過程;掌握數(shù)據(jù)的分類方法;掌握對數(shù)據(jù)進行描述的圖形化方法和數(shù)值方法;學(xué)習(xí)分析數(shù)據(jù)分布的方法;掌握應(yīng)用SPSS進行描述性數(shù)據(jù)分析的方法;掌握常用統(tǒng)計圖形的繪制方法和解釋技巧

第2頁,共59頁,2022年,5月20日,23點4分,星期四前言:描述性統(tǒng)計和推斷性統(tǒng)計統(tǒng)計學(xué)分為描述性統(tǒng)計分析和推斷性統(tǒng)計分析描述性統(tǒng)計應(yīng)用分類、制表、圖形以及概括性數(shù)據(jù)指標(biāo)來概括數(shù)據(jù)分布特征的方法。結(jié)論不能推及總體。

推斷性統(tǒng)計推斷性統(tǒng)計分析得到的結(jié)論適用于總體。第3頁,共59頁,2022年,5月20日,23點4分,星期四統(tǒng)計量統(tǒng)計分析往往是從了解數(shù)據(jù)的基本特征開始的。統(tǒng)計上,需要把樣本數(shù)據(jù)所含信息進行概括、融合和抽象,從而得到反映樣本數(shù)據(jù)的綜合指標(biāo),這些指標(biāo)稱為統(tǒng)計量。第4頁,共59頁,2022年,5月20日,23點4分,星期四描述性統(tǒng)計分析指標(biāo)統(tǒng)計量可分為兩類一類表示數(shù)據(jù)的中心位置,例如均值、中位數(shù)、眾數(shù)等一類表示數(shù)據(jù)的離散程度,例如方差、標(biāo)準(zhǔn)差、極差等用來衡量個體偏離中心的程度。

第5頁,共59頁,2022年,5月20日,23點4分,星期四3.1頻率分析功能:頻率分析主要通過頻率分布表、條形圖和直方圖,以及集中趨勢和離散趨勢的各種統(tǒng)計量來描述數(shù)據(jù)的分布特征第6頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析意義意義:SPSS的頻數(shù)分析過程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通過頻數(shù)分析,我們可以得到詳細(xì)的頻數(shù)表以及平均值、最大值、最小值、方差、標(biāo)準(zhǔn)差、極差、平均數(shù)標(biāo)準(zhǔn)誤、偏度系數(shù)和峰度系數(shù)等重要的描述統(tǒng)計量,還可以通過分析得到合適的統(tǒng)計圖。所以進行頻數(shù)分析不僅可以方便地對數(shù)據(jù)按組進行歸類整理,還可以對數(shù)據(jù)的分布特征形成初步的認(rèn)識。第7頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析術(shù)語頻率

對于定性觀測值時,把它們按照某種原則分成一些組,每個觀測值必須落入一個類并且只能夠落入一個類中。對于給定的類,落入這個類的個案數(shù)稱為頻率

落入該類中的個案數(shù)和個案總數(shù)的比例稱為相對頻率第8頁,共59頁,2022年,5月20日,23點4分,星期四案例數(shù)據(jù)文件EmployData.sav記錄了某公司職工的基本信息,例如性別、民族、出生日期、教育水平、工資水平、工作年限等。教育水平為分類變量,它有11個類別。

第9頁,共59頁,2022年,5月20日,23點4分,星期四SPSS頻率分析選擇【分析】→【描述統(tǒng)計】→【頻率】

第10頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析選項-統(tǒng)計量第11頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析選項-圖表第12頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析的結(jié)果解釋頻率表格條形圖、直方圖第13頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-頻率分析實例案例3.1身高數(shù)據(jù)給出了河南省某學(xué)校50名高二學(xué)生的身高。試分析該50名學(xué)生的身高分布特征,計算平均值、最大值、最小值、標(biāo)準(zhǔn)差等統(tǒng)計量,并繪制頻數(shù)表、直方圖。第14頁,共59頁,2022年,5月20日,23點4分,星期四3.2中心趨勢的描述均值(尺度數(shù)據(jù)和定序數(shù)據(jù))中位數(shù)(尺度數(shù)據(jù)和定序數(shù)據(jù))眾數(shù)(定性數(shù)據(jù)和尺度數(shù)據(jù))5%截尾均值(尺度數(shù)據(jù)和定序數(shù)據(jù))

第15頁,共59頁,2022年,5月20日,23點4分,星期四均值均值即數(shù)據(jù)的算術(shù)平均數(shù),是數(shù)據(jù)中心趨勢的主要度量指標(biāo),設(shè)變量有n個測量值,則算術(shù)均值為:第16頁,共59頁,2022年,5月20日,23點4分,星期四均值的特點最常用的中心位置度量受極端值影響例:1,3,5,7,9和

1,3,5,7,14第17頁,共59頁,2022年,5月20日,23點4分,星期四中位數(shù)重要的中心位置度量在遞增排序后的數(shù)據(jù)列中若數(shù)據(jù)個數(shù)為奇數(shù),中位數(shù)是正中央的數(shù)若數(shù)據(jù)個數(shù)是偶數(shù),中位數(shù)是正中央的兩數(shù)的平均值.不受極端值的影,例如:1,5,7,3,9第18頁,共59頁,2022年,5月20日,23點4分,星期四眾數(shù)發(fā)生頻數(shù)最高的數(shù)據(jù)值不受極端值的影響眾數(shù)可能不存在可能有多個眾數(shù)(單峰,雙峰,多峰)可用于定量或定性數(shù)據(jù)第19頁,共59頁,2022年,5月20日,23點4分,星期四5%截尾均值避免了極端值的影響

第20頁,共59頁,2022年,5月20日,23點4分,星期四3.3離散趨勢的描述僅僅根據(jù)數(shù)據(jù)的中心趨勢指標(biāo)進行決策是不夠的。例如,如果一個國家的不同家庭收入差距很少;而另一個國家的家庭收入差距很大,既存在大量的貧困家庭,也存在許多十分富有的家庭,那么即使這兩個國家的中等收入家庭的收入完全一樣,其家庭收入情況仍然完全不同。第21頁,共59頁,2022年,5月20日,23點4分,星期四例子假設(shè)我們有以下的三組觀測值:觀測A:11,12,13,16,16,17,18,21觀測B:14,15,15,15,16,16,16,17觀測C:11,11,11,12,19,20,20,20這三組觀測值的均值都是15.5,那么這三組數(shù)據(jù)是否相似呢?第22頁,共59頁,2022年,5月20日,23點4分,星期四離散趨勢第23頁,共59頁,2022年,5月20日,23點4分,星期四離散趨勢的描述極差(range)方差(Variance)標(biāo)準(zhǔn)差(S.d.)分位數(shù)(Percentage)變異指標(biāo)第24頁,共59頁,2022年,5月20日,23點4分,星期四極差極差=最大值-最小值受極端值影響較大第25頁,共59頁,2022年,5月20日,23點4分,星期四方差和標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差第26頁,共59頁,2022年,5月20日,23點4分,星期四變異系數(shù)在比較兩組數(shù)據(jù)離散程度大小時,如果數(shù)據(jù)的測量尺度相差太大,直接比較二者的標(biāo)準(zhǔn)差并不合適。需要首先消除測量尺度和量綱的影響。變異系數(shù)可以剔除這些影響,其計算公式為:第27頁,共59頁,2022年,5月20日,23點4分,星期四分位數(shù)第p百分位數(shù)使得至少有p%的數(shù)據(jù)小于或等于這個值,且使得至少有(100-p)%的數(shù)據(jù)大于或等于這個值如何計算?將原數(shù)據(jù)從小到大排列計算i=(p/100)n若i是整數(shù),則第p百分位數(shù)為第i與第i+1項的平均若i不是整數(shù),則向上取整。第28頁,共59頁,2022年,5月20日,23點4分,星期四總結(jié)五數(shù)最小值、第一個四分位數(shù)、中位數(shù)、第三個四分位數(shù)、最大值從這五個值可以大致看出數(shù)據(jù)分布的中心和離散程度。而箱圖則是這五個數(shù)的圖形表現(xiàn)

第29頁,共59頁,2022年,5月20日,23點4分,星期四3.4分布的形狀偏度當(dāng)偏度系數(shù)大于0時,分布為正偏或右偏,布圖形在右邊拖尾,分布圖有很長的右尾,尖峰偏左當(dāng)偏度系數(shù)小于0,分布為負(fù)偏或左偏,即分布圖形在左邊拖尾,分布圖有很長的左尾,峰尖偏右當(dāng)偏度系數(shù)為0,分布對稱第30頁,共59頁,2022年,5月20日,23點4分,星期四峰度峰度

>3,分布為高峰度,即比正態(tài)分布的峰要陡峭;<3,分布為低峰度,即比正態(tài)分布的峰要平坦些;=0,分布為正態(tài)峰。第31頁,共59頁,2022年,5月20日,23點4分,星期四3.5SPSS描述性統(tǒng)計許多菜單均可進行描述性分析,提供描述性統(tǒng)計指標(biāo)的輸出。例如T檢驗、方差分析、因子分析等SPSS自定義表模塊也可以產(chǎn)生大部分的描述性統(tǒng)計指標(biāo)第32頁,共59頁,2022年,5月20日,23點4分,星期四SPSS中的菜單專門的描述性統(tǒng)計菜單:頻率(F):該過程將產(chǎn)生頻數(shù)表,輸出頻數(shù)分布的條形圖、餅圖或者直方圖;描述(D):該過程則進行一般性的統(tǒng)計描述;探索(E):該過程用于對數(shù)據(jù)概況不清時的探索性分析;交叉表(C):該過程完成分類數(shù)據(jù)的統(tǒng)計描述和一般的統(tǒng)計檢驗,我們常用的檢驗也包含在該對話框中。第33頁,共59頁,2022年,5月20日,23點4分,星期四頻率:實例【分析】→【描述】→【頻率】

第34頁,共59頁,2022年,5月20日,23點4分,星期四頻率:統(tǒng)計量的選擇第35頁,共59頁,2022年,5月20日,23點4分,星期四頻率:結(jié)果的解釋第36頁,共59頁,2022年,5月20日,23點4分,星期四描述性子菜單第37頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-描述性分析實例案例3.2體重數(shù)據(jù)給出了河南省某高校50名大一入學(xué)新生的體重。試對該50名學(xué)生的體重進行描述性分析,從而了解這50名學(xué)生體重的基本特征。第38頁,共59頁,2022年,5月20日,23點4分,星期四探索子菜單【分析】→【描述統(tǒng)計】→【探索】該菜單可以對不同的組分別給出描述性統(tǒng)計量第39頁,共59頁,2022年,5月20日,23點4分,星期四探索:選擇統(tǒng)計量第40頁,共59頁,2022年,5月20日,23點4分,星期四探索:圖第41頁,共59頁,2022年,5月20日,23點4分,星期四探索:結(jié)果解釋(1)第42頁,共59頁,2022年,5月20日,23點4分,星期四探索:結(jié)果解釋(2)第43頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-探索分析實例實例3.3氣溫數(shù)據(jù)給出了鄭州、泰安兩城市2012年各月份的平均氣溫。試據(jù)此對兩城市平均氣溫進行探索性統(tǒng)計分析,研究其基本特征。第44頁,共59頁,2022年,5月20日,23點4分,星期四設(shè)定表格第45頁,共59頁,2022年,5月20日,23點4分,星期四表格:摘要統(tǒng)計量設(shè)置第46頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-列聯(lián)表分析實例數(shù)據(jù)文件EmployeeData給出了某公司職工的基本信息,據(jù)此對職工的教育水平進行列聯(lián)表分析,研究不同性別的職工教育水平之間有無明顯的差別。第47頁,共59頁,2022年,5月20日,23點4分,星期四3.6統(tǒng)計圖進行描述性統(tǒng)計分析定性數(shù)據(jù)條形圖餅圖帕累托圖定量數(shù)據(jù)直方圖莖葉圖箱圖第48頁,共59頁,2022年,5月20日,23點4分,星期四頻率描述-頻率->圖表條形圖餅圖直方圖示例:數(shù)據(jù)文件DisasterReason.sav條形圖餅圖直方圖帕累托圖第49頁,共59頁,2022年,5月20日,23點4分,星期四條形圖第50頁,共59頁,2022年,5月20日,23點4分,星期四餅圖第51頁,共59頁,2022年,5月20日,23點4分,星期四帕累托圖第52頁,共59頁,2022年,5月20日,23點4分,星期四直方圖-莖葉圖-箱圖描述性->探索直方圖莖葉圖箱圖示例:數(shù)據(jù)EmployeeData.sav直方圖莖葉圖箱圖第53頁,共59頁,2022年,5月20日,23點4分,星期四直方圖和莖葉圖第54頁,共59頁,2022年,5月20日,23點4分,星期四箱圖第55頁,共59頁,2022年,5月20日,23點4分,星期四從舊對話框作圖重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論