版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于描述性統(tǒng)計分析第1頁,共59頁,2022年,5月20日,23點4分,星期四本章學(xué)習(xí)目標(biāo):掌握數(shù)據(jù)分析項目的整個過程;掌握數(shù)據(jù)的分類方法;掌握對數(shù)據(jù)進行描述的圖形化方法和數(shù)值方法;學(xué)習(xí)分析數(shù)據(jù)分布的方法;掌握應(yīng)用SPSS進行描述性數(shù)據(jù)分析的方法;掌握常用統(tǒng)計圖形的繪制方法和解釋技巧
第2頁,共59頁,2022年,5月20日,23點4分,星期四前言:描述性統(tǒng)計和推斷性統(tǒng)計統(tǒng)計學(xué)分為描述性統(tǒng)計分析和推斷性統(tǒng)計分析描述性統(tǒng)計應(yīng)用分類、制表、圖形以及概括性數(shù)據(jù)指標(biāo)來概括數(shù)據(jù)分布特征的方法。結(jié)論不能推及總體。
推斷性統(tǒng)計推斷性統(tǒng)計分析得到的結(jié)論適用于總體。第3頁,共59頁,2022年,5月20日,23點4分,星期四統(tǒng)計量統(tǒng)計分析往往是從了解數(shù)據(jù)的基本特征開始的。統(tǒng)計上,需要把樣本數(shù)據(jù)所含信息進行概括、融合和抽象,從而得到反映樣本數(shù)據(jù)的綜合指標(biāo),這些指標(biāo)稱為統(tǒng)計量。第4頁,共59頁,2022年,5月20日,23點4分,星期四描述性統(tǒng)計分析指標(biāo)統(tǒng)計量可分為兩類一類表示數(shù)據(jù)的中心位置,例如均值、中位數(shù)、眾數(shù)等一類表示數(shù)據(jù)的離散程度,例如方差、標(biāo)準(zhǔn)差、極差等用來衡量個體偏離中心的程度。
第5頁,共59頁,2022年,5月20日,23點4分,星期四3.1頻率分析功能:頻率分析主要通過頻率分布表、條形圖和直方圖,以及集中趨勢和離散趨勢的各種統(tǒng)計量來描述數(shù)據(jù)的分布特征第6頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析意義意義:SPSS的頻數(shù)分析過程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通過頻數(shù)分析,我們可以得到詳細(xì)的頻數(shù)表以及平均值、最大值、最小值、方差、標(biāo)準(zhǔn)差、極差、平均數(shù)標(biāo)準(zhǔn)誤、偏度系數(shù)和峰度系數(shù)等重要的描述統(tǒng)計量,還可以通過分析得到合適的統(tǒng)計圖。所以進行頻數(shù)分析不僅可以方便地對數(shù)據(jù)按組進行歸類整理,還可以對數(shù)據(jù)的分布特征形成初步的認(rèn)識。第7頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析術(shù)語頻率
對于定性觀測值時,把它們按照某種原則分成一些組,每個觀測值必須落入一個類并且只能夠落入一個類中。對于給定的類,落入這個類的個案數(shù)稱為頻率
落入該類中的個案數(shù)和個案總數(shù)的比例稱為相對頻率第8頁,共59頁,2022年,5月20日,23點4分,星期四案例數(shù)據(jù)文件EmployData.sav記錄了某公司職工的基本信息,例如性別、民族、出生日期、教育水平、工資水平、工作年限等。教育水平為分類變量,它有11個類別。
第9頁,共59頁,2022年,5月20日,23點4分,星期四SPSS頻率分析選擇【分析】→【描述統(tǒng)計】→【頻率】
第10頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析選項-統(tǒng)計量第11頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析選項-圖表第12頁,共59頁,2022年,5月20日,23點4分,星期四頻率分析的結(jié)果解釋頻率表格條形圖、直方圖第13頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-頻率分析實例案例3.1身高數(shù)據(jù)給出了河南省某學(xué)校50名高二學(xué)生的身高。試分析該50名學(xué)生的身高分布特征,計算平均值、最大值、最小值、標(biāo)準(zhǔn)差等統(tǒng)計量,并繪制頻數(shù)表、直方圖。第14頁,共59頁,2022年,5月20日,23點4分,星期四3.2中心趨勢的描述均值(尺度數(shù)據(jù)和定序數(shù)據(jù))中位數(shù)(尺度數(shù)據(jù)和定序數(shù)據(jù))眾數(shù)(定性數(shù)據(jù)和尺度數(shù)據(jù))5%截尾均值(尺度數(shù)據(jù)和定序數(shù)據(jù))
第15頁,共59頁,2022年,5月20日,23點4分,星期四均值均值即數(shù)據(jù)的算術(shù)平均數(shù),是數(shù)據(jù)中心趨勢的主要度量指標(biāo),設(shè)變量有n個測量值,則算術(shù)均值為:第16頁,共59頁,2022年,5月20日,23點4分,星期四均值的特點最常用的中心位置度量受極端值影響例:1,3,5,7,9和
1,3,5,7,14第17頁,共59頁,2022年,5月20日,23點4分,星期四中位數(shù)重要的中心位置度量在遞增排序后的數(shù)據(jù)列中若數(shù)據(jù)個數(shù)為奇數(shù),中位數(shù)是正中央的數(shù)若數(shù)據(jù)個數(shù)是偶數(shù),中位數(shù)是正中央的兩數(shù)的平均值.不受極端值的影,例如:1,5,7,3,9第18頁,共59頁,2022年,5月20日,23點4分,星期四眾數(shù)發(fā)生頻數(shù)最高的數(shù)據(jù)值不受極端值的影響眾數(shù)可能不存在可能有多個眾數(shù)(單峰,雙峰,多峰)可用于定量或定性數(shù)據(jù)第19頁,共59頁,2022年,5月20日,23點4分,星期四5%截尾均值避免了極端值的影響
第20頁,共59頁,2022年,5月20日,23點4分,星期四3.3離散趨勢的描述僅僅根據(jù)數(shù)據(jù)的中心趨勢指標(biāo)進行決策是不夠的。例如,如果一個國家的不同家庭收入差距很少;而另一個國家的家庭收入差距很大,既存在大量的貧困家庭,也存在許多十分富有的家庭,那么即使這兩個國家的中等收入家庭的收入完全一樣,其家庭收入情況仍然完全不同。第21頁,共59頁,2022年,5月20日,23點4分,星期四例子假設(shè)我們有以下的三組觀測值:觀測A:11,12,13,16,16,17,18,21觀測B:14,15,15,15,16,16,16,17觀測C:11,11,11,12,19,20,20,20這三組觀測值的均值都是15.5,那么這三組數(shù)據(jù)是否相似呢?第22頁,共59頁,2022年,5月20日,23點4分,星期四離散趨勢第23頁,共59頁,2022年,5月20日,23點4分,星期四離散趨勢的描述極差(range)方差(Variance)標(biāo)準(zhǔn)差(S.d.)分位數(shù)(Percentage)變異指標(biāo)第24頁,共59頁,2022年,5月20日,23點4分,星期四極差極差=最大值-最小值受極端值影響較大第25頁,共59頁,2022年,5月20日,23點4分,星期四方差和標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差第26頁,共59頁,2022年,5月20日,23點4分,星期四變異系數(shù)在比較兩組數(shù)據(jù)離散程度大小時,如果數(shù)據(jù)的測量尺度相差太大,直接比較二者的標(biāo)準(zhǔn)差并不合適。需要首先消除測量尺度和量綱的影響。變異系數(shù)可以剔除這些影響,其計算公式為:第27頁,共59頁,2022年,5月20日,23點4分,星期四分位數(shù)第p百分位數(shù)使得至少有p%的數(shù)據(jù)小于或等于這個值,且使得至少有(100-p)%的數(shù)據(jù)大于或等于這個值如何計算?將原數(shù)據(jù)從小到大排列計算i=(p/100)n若i是整數(shù),則第p百分位數(shù)為第i與第i+1項的平均若i不是整數(shù),則向上取整。第28頁,共59頁,2022年,5月20日,23點4分,星期四總結(jié)五數(shù)最小值、第一個四分位數(shù)、中位數(shù)、第三個四分位數(shù)、最大值從這五個值可以大致看出數(shù)據(jù)分布的中心和離散程度。而箱圖則是這五個數(shù)的圖形表現(xiàn)
第29頁,共59頁,2022年,5月20日,23點4分,星期四3.4分布的形狀偏度當(dāng)偏度系數(shù)大于0時,分布為正偏或右偏,布圖形在右邊拖尾,分布圖有很長的右尾,尖峰偏左當(dāng)偏度系數(shù)小于0,分布為負(fù)偏或左偏,即分布圖形在左邊拖尾,分布圖有很長的左尾,峰尖偏右當(dāng)偏度系數(shù)為0,分布對稱第30頁,共59頁,2022年,5月20日,23點4分,星期四峰度峰度
>3,分布為高峰度,即比正態(tài)分布的峰要陡峭;<3,分布為低峰度,即比正態(tài)分布的峰要平坦些;=0,分布為正態(tài)峰。第31頁,共59頁,2022年,5月20日,23點4分,星期四3.5SPSS描述性統(tǒng)計許多菜單均可進行描述性分析,提供描述性統(tǒng)計指標(biāo)的輸出。例如T檢驗、方差分析、因子分析等SPSS自定義表模塊也可以產(chǎn)生大部分的描述性統(tǒng)計指標(biāo)第32頁,共59頁,2022年,5月20日,23點4分,星期四SPSS中的菜單專門的描述性統(tǒng)計菜單:頻率(F):該過程將產(chǎn)生頻數(shù)表,輸出頻數(shù)分布的條形圖、餅圖或者直方圖;描述(D):該過程則進行一般性的統(tǒng)計描述;探索(E):該過程用于對數(shù)據(jù)概況不清時的探索性分析;交叉表(C):該過程完成分類數(shù)據(jù)的統(tǒng)計描述和一般的統(tǒng)計檢驗,我們常用的檢驗也包含在該對話框中。第33頁,共59頁,2022年,5月20日,23點4分,星期四頻率:實例【分析】→【描述】→【頻率】
第34頁,共59頁,2022年,5月20日,23點4分,星期四頻率:統(tǒng)計量的選擇第35頁,共59頁,2022年,5月20日,23點4分,星期四頻率:結(jié)果的解釋第36頁,共59頁,2022年,5月20日,23點4分,星期四描述性子菜單第37頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-描述性分析實例案例3.2體重數(shù)據(jù)給出了河南省某高校50名大一入學(xué)新生的體重。試對該50名學(xué)生的體重進行描述性分析,從而了解這50名學(xué)生體重的基本特征。第38頁,共59頁,2022年,5月20日,23點4分,星期四探索子菜單【分析】→【描述統(tǒng)計】→【探索】該菜單可以對不同的組分別給出描述性統(tǒng)計量第39頁,共59頁,2022年,5月20日,23點4分,星期四探索:選擇統(tǒng)計量第40頁,共59頁,2022年,5月20日,23點4分,星期四探索:圖第41頁,共59頁,2022年,5月20日,23點4分,星期四探索:結(jié)果解釋(1)第42頁,共59頁,2022年,5月20日,23點4分,星期四探索:結(jié)果解釋(2)第43頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-探索分析實例實例3.3氣溫數(shù)據(jù)給出了鄭州、泰安兩城市2012年各月份的平均氣溫。試據(jù)此對兩城市平均氣溫進行探索性統(tǒng)計分析,研究其基本特征。第44頁,共59頁,2022年,5月20日,23點4分,星期四設(shè)定表格第45頁,共59頁,2022年,5月20日,23點4分,星期四表格:摘要統(tǒng)計量設(shè)置第46頁,共59頁,2022年,5月20日,23點4分,星期四當(dāng)堂練習(xí)-列聯(lián)表分析實例數(shù)據(jù)文件EmployeeData給出了某公司職工的基本信息,據(jù)此對職工的教育水平進行列聯(lián)表分析,研究不同性別的職工教育水平之間有無明顯的差別。第47頁,共59頁,2022年,5月20日,23點4分,星期四3.6統(tǒng)計圖進行描述性統(tǒng)計分析定性數(shù)據(jù)條形圖餅圖帕累托圖定量數(shù)據(jù)直方圖莖葉圖箱圖第48頁,共59頁,2022年,5月20日,23點4分,星期四頻率描述-頻率->圖表條形圖餅圖直方圖示例:數(shù)據(jù)文件DisasterReason.sav條形圖餅圖直方圖帕累托圖第49頁,共59頁,2022年,5月20日,23點4分,星期四條形圖第50頁,共59頁,2022年,5月20日,23點4分,星期四餅圖第51頁,共59頁,2022年,5月20日,23點4分,星期四帕累托圖第52頁,共59頁,2022年,5月20日,23點4分,星期四直方圖-莖葉圖-箱圖描述性->探索直方圖莖葉圖箱圖示例:數(shù)據(jù)EmployeeData.sav直方圖莖葉圖箱圖第53頁,共59頁,2022年,5月20日,23點4分,星期四直方圖和莖葉圖第54頁,共59頁,2022年,5月20日,23點4分,星期四箱圖第55頁,共59頁,2022年,5月20日,23點4分,星期四從舊對話框作圖重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 癲癇病人的急救護理
- 淺談制作課件教學(xué)課件
- 測量運動課件教學(xué)課件
- 部編版八年級地理上冊第四章第二節(jié)《農(nóng)業(yè)》課件
- 河南省2024九年級語文上冊第一單元3我愛這土地課件新人教版
- 2.3.1共價鍵的極性 課件 高二上學(xué)期化學(xué)人教版(2019)選擇性必修2
- 特殊藥品管理應(yīng)急演練
- 董氏奇穴治療頸椎病
- 初中語文教案教學(xué)反思
- 護理專業(yè)說課稿
- 2024年中考語文復(fù)習(xí)分類必刷:非連續(xù)性文本閱讀(含答案解析)
- 項目經(jīng)理或管理招聘面試題與參考回答(某大型國企)
- 2024年國際貿(mào)易實務(wù)試題及答案
- 冀少版(2024)七年級上冊生物單元+期中+期末共6套學(xué)情評估測試卷匯編(含答案)
- 2024年四川宜賓江安縣考調(diào)事業(yè)單位工作人員7人歷年(高頻重點復(fù)習(xí)提升訓(xùn)練)共500題附帶答案詳解
- 2025高考數(shù)學(xué)一輪復(fù)習(xí)-4.1-任意角和弧度制及三角函數(shù)的概念【課件】
- 智能安防監(jiān)控設(shè)備采購合同
- 工程進度款申請表
- 當(dāng)代社會政策分析 課件 第八章 兒童社會政策
- 2023年徽商銀行市區(qū)支行招聘綜合柜員信息筆試上岸歷年典型考題與考點剖析附帶答案詳解
- 2024年湖南化工職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫帶答案解析
評論
0/150
提交評論