描述性統(tǒng)計分析_第1頁
描述性統(tǒng)計分析_第2頁
描述性統(tǒng)計分析_第3頁
描述性統(tǒng)計分析_第4頁
描述性統(tǒng)計分析_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、描述性統(tǒng)計描述性統(tǒng)計 分析分析主要內容 n描述性統(tǒng)計分析q頻率分析q對數(shù)據(jù)進行描述的圖形化方法和數(shù)值方法q學習分析數(shù)據(jù)分布的方法q應用SPSS進行描述性數(shù)據(jù)分析的方法q常用統(tǒng)計圖形的繪制方法和解釋技巧 q數(shù)據(jù)標準化本章學習目標:n掌握數(shù)據(jù)分析項目的整個過程;n掌握數(shù)據(jù)的分類方法;n掌握對數(shù)據(jù)進行描述的圖形化方法和數(shù)值方法;n學習分析數(shù)據(jù)分布的方法;n掌握應用SPSS進行描述性數(shù)據(jù)分析的方法;n掌握常用統(tǒng)計圖形的繪制方法和解釋技巧 前言:描述性統(tǒng)計和推斷性統(tǒng)計n統(tǒng)計學分為描述性統(tǒng)計分析和推斷性統(tǒng)計分析n描述性統(tǒng)計q應用分類、制表、圖形以及概括性數(shù)據(jù)指標來概括數(shù)據(jù)分布特征的方法。結論不能推及總體。

2、 n推斷性統(tǒng)計q推斷性統(tǒng)計分析得到的結論適用于總體。 統(tǒng)計量n統(tǒng)計分析往往是從了解數(shù)據(jù)的基本特征開始的。統(tǒng)計上,需要把樣本數(shù)據(jù)所含信息進行概括、融合和抽象,從而得到反映樣本數(shù)據(jù)的綜合指標,這些指標稱為統(tǒng)計量。 描述性統(tǒng)計分析指標n統(tǒng)計量可分為兩類q一類表示數(shù)據(jù)的中心位置,例如均值、中位數(shù)、眾數(shù)等q一類表示數(shù)據(jù)的離散程度,例如方差、標準差、極差等用來衡量個體偏離中心的程度。 3.1 頻率分析 n功能:頻率分析主要通過頻率分布表、條形圖和直方圖,以及集中趨勢和離散趨勢的各種統(tǒng)計量來描述數(shù)據(jù)的分布特征頻率分析意義n意義:SPSS的頻數(shù)分析過程(Frequencies)是描述性分析中最基本也是最常用的

3、方法之一。通過頻數(shù)分析,我們可以得到詳細的頻數(shù)表以及平均值、最大值、最小值、方差、標準差、極差、平均數(shù)標準誤、偏度系數(shù)和峰度系數(shù)等重要的描述統(tǒng)計量,還可以通過分析得到合適的統(tǒng)計圖。所以進行頻數(shù)分析不僅可以方便地對數(shù)據(jù)按組進行歸類整理,還可以對數(shù)據(jù)的分布特征形成初步的認識。頻率分析術語n頻率頻率 q對于定性觀測值時,把它們按照某種原則分成一些組,每個觀測值必須落入一個類并且只能夠落入一個類中。對于給定的類,落入這個類的個案數(shù)稱為頻率頻率 n落入該類中的個案數(shù)和個案總數(shù)的比例稱為相相對頻率對頻率案例n數(shù)據(jù)文件Employ Data.sav記錄了某公司職工的基本信息,例如性別、民族、出生日期、教育水

4、平、工資水平、工作年限等。n教育水平為分類變量,它有11個類別。 SPSS頻率分析n選擇【分析】【描述統(tǒng)計】【頻率】 頻率分析選項-統(tǒng)計量頻率分析選項-圖表頻率分析的結果解釋n頻率表格n條形圖、直方圖當堂練習-頻率分析實例n案例3.1身高數(shù)據(jù)給出了河南省某學校50名高二學生的身高。試分析該50名學生的身高分布特征,計算平均值、最大值、最小值、標準差等統(tǒng)計量,并繪制頻數(shù)表、直方圖。3.2 中心趨勢的描述n均值(尺度數(shù)據(jù)和定序數(shù)據(jù))n中位數(shù)(尺度數(shù)據(jù)和定序數(shù)據(jù))n眾數(shù)(定性數(shù)據(jù)和尺度數(shù)據(jù))n5%截尾均值(尺度數(shù)據(jù)和定序數(shù)據(jù)) 均值n均值即數(shù)據(jù)的算術平均數(shù),是數(shù)據(jù)中心趨勢的主要度量指標,n設變量有n

5、個測量值 ,則算術均值為:12,nxxx均值的特點n最常用的中心位置度量n 受極端值影響n 例:1,3,5,7,9 和 1,3,5,7,14中位數(shù)n重要的中心位置度量n在遞增排序后的數(shù)據(jù)列中q 若數(shù)據(jù)個數(shù)為奇數(shù),中位數(shù)是正中央的數(shù)q 若數(shù)據(jù)個數(shù)是偶數(shù),中位數(shù)是正中央的兩數(shù)的平均值.n不受極端值的影,例如:1,5,7,3,9眾數(shù)n發(fā)生頻數(shù)最高的數(shù)據(jù)值n不受極端值的影響n眾數(shù)可能不存在n可能有多個眾數(shù)(單峰,雙峰,多峰)n可用于定量或定性數(shù)據(jù)5%截尾均值 n避免了極端值的影響 3.3 離散趨勢的描述n僅僅根據(jù)數(shù)據(jù)的中心趨勢指標進行決策是不夠的。例如,如果一個國家的不同家庭收入差距很少;而另一個國家

6、的家庭收入差距很大,既存在大量的貧困家庭,也存在許多十分富有的家庭,那么即使這兩個國家的中等收入家庭的收入完全一樣,其家庭收入情況仍然完全不同。 例子n假設我們有以下的三組觀測值:q觀測A:11,12,13,16,16,17,18,21q觀測B:14,15,15,15,16,16,16,17q觀測C:11,11,11,12,19,20,20,20n這三組觀測值的均值都是15.5,那么這三組數(shù)據(jù)是否相似呢? 離散趨勢離散趨勢的描述 n極差(range)n方差(Variance)n標準差(S.d.)n分位數(shù)( Percentage)n變異指標極差n極差=最大值-最小值n受極端值影響較大方差和標準差

7、n方差n標準差變異系數(shù) n在比較兩組數(shù)據(jù)離散程度大小時,如果數(shù)據(jù)的測量尺度相差太大,直接比較二者的標準差并不合適。n需要首先消除測量尺度和量綱的影響。變異系數(shù)可以剔除這些影響,其計算公式為:分位數(shù) n第p p百分位數(shù)q使得至少有p%的數(shù)據(jù)小于或等于這個值,且使得至少有(100-p)%的數(shù)據(jù)大于或等于這個值q如何計算?n將原數(shù)據(jù)從小到大排列n計算i=(p/100)n n若i是整數(shù), 則第p百分位數(shù)為第i 與第 i+1 項的平均n若i不是整數(shù),則向上取整??偨Y五數(shù)n最小值、第一個四分位數(shù)、中位數(shù)、第三個四分位數(shù)、最大值n從這五個值可以大致看出數(shù)據(jù)分布的中心和離散程度。而箱圖則是這五個數(shù)的圖形表現(xiàn) 3.4 分布的形狀n偏度q當偏度系數(shù)大于0時,分布為正偏或右偏,布圖形在右邊拖尾,分布圖有很長的右尾,尖峰偏左q當偏度系數(shù)小于0,分布為負偏或左偏,即分布圖形在左邊拖尾,分布圖有很長的左尾,峰尖偏右 q當偏度系數(shù)為0,分布對稱 峰度n峰度n 3,分布為高峰度,即比正態(tài)分布的峰要陡峭; 圖表q條形圖q餅圖q直方圖n示例:數(shù)據(jù)文件DisasterReason.sav q條形圖q餅圖q直方圖q帕累托圖條形圖餅圖帕累托圖直方圖-莖葉圖-箱圖n描述性-探索q直方圖q莖葉圖q箱圖n示例:數(shù)據(jù)Employee Data.savq直方圖q莖葉圖q箱圖直方圖和莖葉圖箱圖從舊對話框作圖n重新完

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論