統(tǒng)計數(shù)據(jù)的描述性分析_第1頁
統(tǒng)計數(shù)據(jù)的描述性分析_第2頁
統(tǒng)計數(shù)據(jù)的描述性分析_第3頁
統(tǒng)計數(shù)據(jù)的描述性分析_第4頁
統(tǒng)計數(shù)據(jù)的描述性分析_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第5章統(tǒng)計數(shù)據(jù)的描述性分析常用來度量集中趨勢的指標包括:平均數(shù)、中位數(shù)、眾數(shù)。標志值分布的集中趨勢。了解集中趨勢的量數(shù)計算一組數(shù)據(jù)的均值

學(xué)習(xí)目標計算一組數(shù)據(jù)的眾數(shù)和中位數(shù)選擇一種集中趨勢度量數(shù)一.平均數(shù)——是依據(jù)總體各單位全部標志值計算出的平均數(shù)。〔一〕.算術(shù)平均數(shù)平均數(shù)的根本公式(1)簡潔算術(shù)平均數(shù)標志總量除以單位總量而得。計算公式:我國電視觀眾調(diào)查式:例:2023年1月比特啤酒公司銷售點銷售量60個銷售點的啤酒銷售量(單位:桶)比特啤酒公司每個銷售點月銷售量?〔頻數(shù)〕的大小所對應(yīng)的標志值對平均數(shù)的影響具有權(quán)衡輕重的作用。當各組的次數(shù)都一樣時,即當f1=f2=f3fn時:加權(quán)算術(shù)平均數(shù)就等于簡潔算術(shù)平均數(shù)。使用SPSS求算術(shù)平均數(shù)利用Analyze==>Descriptive菜單算術(shù)平均數(shù)二.中位數(shù)(Median〕將總體各單位標志值按由小到大的挨次排列后處于中間位置的標志值稱為中位數(shù),記為Me。中位數(shù)是描述分布中心趨勢的另一種典型的度量。中位數(shù)是“最中間的數(shù)”,一半的觀測值比它小,一半比它大。中位數(shù)是是依據(jù)總體標志值所處的特別位置確定的一類平均指標-位置平均數(shù),不受極端數(shù)據(jù)的影響。當統(tǒng)計資料中含有特別的或極端的數(shù)據(jù)時,中位數(shù)比算術(shù)平均數(shù)更具有代表性。5筆付款:9元,10元,10元,11元,60元付款的均值為20元,明顯這并不是一個很好的代表值,而中位數(shù)M=10元則更能代表平均每筆的付款數(shù)。觀測變量為定序變量、定距變量或定比率變量時,中位數(shù)都是有意義的;但是不適于定類變量。查找中位數(shù)的步驟·將全部n個觀測值按由小到大的挨次排列;·假設(shè)觀測值的個數(shù)為奇數(shù)·假設(shè)觀測值的個數(shù)為偶數(shù),中位數(shù)就是排序后最中間的兩個觀測值的平均。三、眾數(shù)〔Mode〕——是總體中消滅次數(shù)最多的標志值,記為M0。眾數(shù)明確反映了數(shù)據(jù)分布的集中趨勢,也是一種位置平均數(shù),不受極在某些狀況下,眾數(shù)是一個較好的代表值。例如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在進展生產(chǎn)和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當要了解大多數(shù)家庭的收入狀況時,也要用到眾數(shù)。平均數(shù)、中位數(shù)、眾數(shù)間的關(guān)系1.頻數(shù)分布呈完全對稱的單峰分布,算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者一樣。在偏斜分布中,中位數(shù)和平均數(shù)可能相差很遠。均數(shù)拉高,這時再承受平均數(shù)來描述分布的中心就沒有什么實際意義不管這些巨額廣告投入有多大,對中位數(shù)的值不會有什么影響,由于它們只不過是“中間點”右邊的個別點而已。狀況下,最好承受中位數(shù)而不是平均數(shù)來描述分布的中心,以免造成誤會。當分布比較有規(guī)律時,承受平均數(shù)則優(yōu)于中位數(shù)當次數(shù)安排呈右偏(正偏)時:算術(shù)平均數(shù)受極大值的影響當次數(shù)安排呈左偏(負偏)時,算術(shù)平均數(shù)受微小值的影響中位數(shù)則總是介于眾數(shù)和平均數(shù)之間。均值和中位數(shù)的關(guān)系均值是一系列數(shù)值的中間點。中位數(shù)是一系列個體的中間點〔奇異值〕就不會對中位數(shù)產(chǎn)生影響。練習(xí):的報告:特惠食品售出數(shù)量價格〔美元〕HugeBurger202.95BabyBurger181.49ChickenLittles253.50PorkerBurger192.95YummyBurger171.99ConDog201.99售出總數(shù)119假設(shè)僅有平均指標而沒有描述分布的伸展程度的統(tǒng)計量來協(xié)作,對觀測數(shù)據(jù)的描述不僅是不完整的,還有可能造成誤導(dǎo)。例如北京市01是觀l000和1271就掩蓋了其中有2.5%的家庭月收入低于300元、有1.8%的家庭月收入高于20230元的事實。為此還需要有關(guān)分布伸展程度或數(shù)據(jù)的散布程度的統(tǒng)計量.程度或差異狀況。幾個總體可以有一樣的均值,但取值狀況卻可以相差很大。對變異性的理解7,6,3,3,13,4,4,5,44,4,4,4,4一.極差〔Range) 描述分布的伸展程度的最簡潔的方法之一,兩個數(shù)表示了數(shù)據(jù)的分布范圍,稱它們的差為極差(也稱全距),通常記為R。R=最大值-最小值明顯,一組數(shù)據(jù)的差異越大,其極差也越大。產(chǎn)品質(zhì)量的穩(wěn)定。但極差有很大的局限性,它僅考慮了兩個極端的數(shù)據(jù),沒有利用其余數(shù)據(jù)分布的他觀測值的奇異值,因而是一種比較粗糙的變異指標。二.四分位數(shù)差〔Inter-QuartileRange) 將全部數(shù)據(jù)由小到大排序,用三個數(shù)把數(shù)據(jù)分成四局部,每一局部都包含25%Q1、Q2、和Q3。Q2就是中位數(shù)M。有25%的數(shù)據(jù)小于Q1;有25%的數(shù)據(jù)大于Q3;Q1和Q3給出了中間一半數(shù)據(jù)的范圍,四分位數(shù)差(IQR)為Q1和Q3之間的距離:IQR=Q3-Q1QI和Q3·將數(shù)據(jù)按從小到大的挨次排列,找出中位數(shù)M,即Q2;·找出中位數(shù)左邊全部觀測值的中位數(shù),得到Q1;·找出中位數(shù)右邊全部觀測值的中位數(shù),得到Q3。二.四分位數(shù)差〔Inter-QuartileRange) 將全部數(shù)據(jù)由小到大排序,用三個數(shù)把數(shù)據(jù)分成四局部,每一局部都包含25%Q1、Q2、和Q3。Q2就是中位數(shù)M。有25%的數(shù)據(jù)小于Q1;有25%的數(shù)據(jù)大于Q3;Q1和Q3給出了中間一半數(shù)據(jù)的范圍,四分位數(shù)差(IQR)為Q1和Q3之間的距離:IQR=Q3-Q1QI和Q3·將數(shù)據(jù)按從小到大的挨次排列,找出中位數(shù)M,即Q2;·找出中位數(shù)左邊全部觀測值的中位數(shù),得到Q1;找出中位數(shù)右邊全部觀測值的中位數(shù),得到Q3。三.五數(shù)綜合合:最小值、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)、最大值用符號表示:Min、Q1、M、Q3、Max依據(jù)分布的五數(shù)綜合,可畫出盒型圖(boxplot)?!昂行汀本植康膬啥宋挥趦蓚€四分位數(shù),盒型里面的直線段標出中位數(shù)的位置。例:依據(jù)1998年的一次受眾調(diào)查,某省電視臺以聞類、體育類和電影類節(jié)目為主(分鐘)的五數(shù)綜合分別為:聞頻道育頻道影頻道C106090120300觀眾日收看時間長度的盒型圖從三個盒型圖可以清楚地看到,電影頻道觀眾的收看時間最長,其中半數(shù)觀眾的收看時間都在1至2個小時之間;體育頻道(B)觀眾的收看時間雖然短于電影頻道,但是約有1/4的觀眾日收看時間都超過了1到了5小時;而聞頻道(A)觀眾的收看時間則相對少得多、也集中得多。〔n=30)例:依據(jù)1998年的一次受眾調(diào)查,某省電視臺以聞類、體育類和電影類節(jié)目為主(分鐘)的五數(shù)綜合分別為:聞頻道A 15 30 45 50 120體育頻道影頻道C106090120300不同時段播出的電視廣告效果比較對變異性的理解7,6,3,3,13,4,4,5,44,4,4,4,4四.平均差平均差是各數(shù)據(jù)與其均值離差確定值的算術(shù)平均數(shù),通常記為A.D。五.方差和標準差描述分布的最常用的統(tǒng)計量是平均數(shù)加上標準差,前者描述分布的中心;后者描述分布的伸展程度或離散程度。標準差標準化了與某個值的偏差。標準差每個值與均值的平均距離;方差是標準差的平方。方差和標準差計算公式:1.總體標準差總體標準差記為。2.樣本方差與樣本標準差樣本標準差記為S,樣本方差記為S2,在推斷統(tǒng)計中,它們分別是總體方差和標準差的優(yōu)良估量。計算標準差:5,8,5,4,6,7,8,8,3,6對于分組數(shù)據(jù)方差:例:試計算觀眾日收看電視時間X的平均數(shù)和標準差方差和標準差的計算SPSS。使用SPSS->數(shù)據(jù)分析->統(tǒng)計功能->返回全部參數(shù)中數(shù)據(jù)的樣本方差、標準差。留意:第三節(jié)度量偏斜程度的指標?是“瘦高的”還是“矮胖的”?斜度(skewed)向:假設(shè)分布是對稱的,斜度為零;假設(shè)長尾巴指向大的值,則稱正偏,斜度為正值;假設(shè)長尾巴指向小的值,則稱負偏,斜度為負值;分布的斜度示意圖:峰度(kurtosis)峰度描述觀測值聚攏在中心的程度,是分布外形的另一特征。假設(shè)觀測值的中心聚攏度與正態(tài)分布一樣,或分布的外形與正態(tài)曲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論