《統(tǒng)計學》輔修-第三章-數(shù)據(jù)的描述資料_第1頁
《統(tǒng)計學》輔修-第三章-數(shù)據(jù)的描述資料_第2頁
《統(tǒng)計學》輔修-第三章-數(shù)據(jù)的描述資料_第3頁
《統(tǒng)計學》輔修-第三章-數(shù)據(jù)的描述資料_第4頁
《統(tǒng)計學》輔修-第三章-數(shù)據(jù)的描述資料_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第三章數(shù)據(jù)的描述

本章分為兩部分:

1.數(shù)據(jù)的圖表描述.

2.數(shù)據(jù)的數(shù)字特征描述.§3.1數(shù)據(jù)的圖表描述用收集到的數(shù)據(jù)來列表和作圖要求:

理解圖形的意義;學會用SPSS作圖。定性數(shù)據(jù)的圖表描述1.頻數(shù)、頻率分布表:例:最喜歡喝哪一種飲料?

原始數(shù)據(jù)見下表原始數(shù)據(jù)見數(shù)據(jù)文件:飲料飲料的頻數(shù)、頻率表(畫條形圖用)用Excel建立頻數(shù)表:先排序、再匯總。用SPSS建立頻數(shù)表:分析

描述性統(tǒng)計

頻率表2.定性數(shù)據(jù)的條形圖

用SPSS制作條形圖(打開“飲料.sav”文件)

1)選擇菜單“圖形”中的

“條形圖”選項;

2)在對話窗口選擇“簡單條形圖(Simple)”

3)在彈出窗口的“類別軸”框

輸入定性變量名(飲料);

4)點擊“確定(OK)”即可。條形圖可分為:

簡單(Simple)條形圖;

復雜(Clusered)條形圖;

堆積(Stacked)條形圖。簡單條形圖復雜條形圖堆積條形圖3.定性數(shù)據(jù)的交叉表:例:最喜歡喝哪一種飲料?

原始數(shù)據(jù)見“飲料”飲料品種和性別的交叉表交叉表的Excel命令打開數(shù)據(jù)文件“飲料”;“數(shù)據(jù)”

“數(shù)據(jù)透視表和數(shù)據(jù)透視圖(P)”選項;“MicrosoftOfficeExcel數(shù)據(jù)列表或數(shù)據(jù)庫(M)”,選擇“數(shù)據(jù)透視表(T)”,選擇“下一步”;選定區(qū)域“a2:b51”,“下一步”;選擇“現(xiàn)有工作表”,鍵入“d5”,選擇“完成”;將項目“飲料”拖入行字段,將項目“性別”拖入列字段,然后將“飲料”拖入中間部分。交叉表的SPSS命令分析

描述性統(tǒng)計交叉表4.定性數(shù)據(jù)的餅圖餅圖的形狀為一圓餅,用不同顏色標出大小不等的扇區(qū),見下圖。不同扇區(qū)代表定性變量的不同取值,這些取值通常為代表定性變量不同性質(zhì)的某字符串。扇區(qū)的面積大小代表占圓面積的百分比,即為定性變量取相應值的比例。餅圖的制作:(打開language.sav文件)

1)選擇菜單“圖形(Graphs)”中的

“餅圖(Pie)”選項,

2)在對話窗口的“定義分區(qū)(DefineSlicesby)”

框中輸入定性變量名(語種)。3)在對話窗口的“其他摘要函數(shù)(Variable)”

框中輸入要統(tǒng)計的變量名(母語)。

4)點擊“確定(OK)”即可。母語定量數(shù)據(jù)的圖表描述1.直方圖直方圖的解讀——直方圖的形狀為一個個矩形(直方),這也是其名字的由來,見下圖。圖的橫坐標為變量(數(shù)據(jù))的不同取值范圍,縱坐標為落在相應范圍內(nèi)的數(shù)據(jù)個數(shù)。圖中還附帶有三個數(shù)字特征,分別為均值、(Mean)標準差(Std.Dev.)和樣本容量N。2.定量數(shù)據(jù)的分組可以等距分組,也可以不等距分組;組數(shù)不要太少(5個以上),

也不要太多(20個以下)。不重不漏;左開右閉(ai,ai+1];組中值:(ai+ai+1)/2.3.定量數(shù)據(jù)的散點圖散點圖由橫坐標和縱坐標兩個變量的取值來確定:

二維變量的每一組值由平面中的一個點來描述.例如:美國不同年代男士(或女士)的初婚年齡:可將不同年代作為橫坐標,初婚年齡作為縱坐標.散點圖的制作:

1)輸入數(shù)據(jù)文件(例marriage.sav);

2)選擇菜單“圖形”中的

“散點圖”選項,

3)在對話框中選擇放置在

Y軸的變量名,和X軸的變量名;

4)點擊“確定(OK)”即可。散點圖允許多個變量的圖畫在同一張圖中.一個變量的選簡單散點圖(Simple

Scatter).多個變量的選重疊散點圖(Overlay

Scatter).4.定量數(shù)據(jù)的序列圖序列圖的形狀為一條折線;折線的高度(縱坐標)代表變量的值;而橫向的位置為這些值(數(shù)據(jù))的自然排序.序列圖的制作1)輸入數(shù)據(jù)文件(例sales.sav);

2)選擇菜單“圖形(Graphs)”中的

“序列圖(Sequence)”選項,

3)在對話框中選擇所要畫序列圖的變量名,

4)點擊“確定(OK)”即可。制作序列圖的注意點:在對話框中“時間軸標簽(Time

Axis

Labels)”

一般不用人為選擇,SPSS軟件自動設定其為數(shù)

據(jù)的序號,見sales.sav

的例子。制作序列圖的注意點:時間軸也可以由某個時間變量來確定,見marriage.sav

的例子。

序列圖也允許多個變量的圖畫在同一張圖中?!?.2數(shù)據(jù)的數(shù)字特征描述數(shù)據(jù)的數(shù)字特征描述就是借助某些公式,對數(shù)據(jù)(樣本)進行運算,以此得到一些的量來描述數(shù)據(jù)某方面的性質(zhì)。數(shù)據(jù)的特征量分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值變異系數(shù)方差,標準差全距(極差)左偏、右偏鐘形對稱數(shù)據(jù)的位置特征位置特征是描述數(shù)據(jù)相對的位置,常用的位置特征量有:

均值、中位數(shù)、眾數(shù)。

平均數(shù)(均值)一組數(shù)據(jù)的“中心點”;最常用的測量值;用于數(shù)值型數(shù)據(jù),不能用于定性數(shù)據(jù)。平均數(shù)(均值)的計算公式平均數(shù)的Excel計算200個圓筒的內(nèi)徑數(shù)據(jù)放在A列的第1至第200個單元格上,然后在任意一個單元格上輸入平均數(shù)函數(shù)名

“=average(a1:a200)”,則顯示45.2915推銷員每獲得一份訂單平均需向顧客提出4.6次成交要求;把一個包裹送到一個陌生人那里去,平均經(jīng)過6個人的手;上海市平均每個家庭有多少人?

年份1950196019701980199020002010

人數(shù)4.64.54.23.83.12.82.49某路口早高峰時,一個綠燈2分10秒能通過250輛車,若有人闖紅燈,最多通行120輛。平均數(shù)有什么不足之處?平均數(shù)受極端數(shù)據(jù)的影響大2000年江蘇省農(nóng)民人均年純收入增長了2.9%。2000年江蘇農(nóng)民減收戶達60%,平收和增收的農(nóng)戶只占1/3強。中位數(shù)(Me)

中位數(shù)是將數(shù)據(jù)按遞增的順序排列后位于中間的數(shù)值。在中位數(shù)左邊有一半的數(shù);在中位數(shù)右邊有一半的數(shù)。Me50%50%假設有

n個數(shù)據(jù):x1,x2,…,xn

。

首先將它們按由小到大的次序排列。n為奇數(shù),中間那個數(shù)為中位數(shù);n為偶數(shù),中間兩個數(shù)的平均為中位數(shù)。上海市人口年齡中位數(shù)上海居民的年齡中位數(shù)1964年19.4

歲1982年29.2歲1990年33.9歲2000年37.6歲2010年36.0歲眾數(shù)(Mo)眾數(shù):數(shù)據(jù)中出現(xiàn)次數(shù)最高的數(shù)據(jù)值。在“最喜歡喝哪一種飲料”的例子中,

“可口可樂”的頻數(shù)最高,因而“可口可樂”是眾數(shù)。男性:“可口可樂”是眾數(shù);

女性:“杏仁露”是眾數(shù).眾數(shù)內(nèi)在因素事故數(shù)頻率(%)察覺得晚119159.6判斷失誤69734.8駕駛錯誤964.8其他190.8合計2000100.0“察覺得晚”和“判斷失誤”共占94.4%。交通事故駕駛過程因素分析Mo=不滿意某城市家庭對住房狀況評價的頻數(shù)分布回答類別某城市戶數(shù)(戶)百分比(%)

非常不滿意不滿意一般滿意非常滿意24108934530836311510合計300100.0中心位置的度量眾數(shù):數(shù)出現(xiàn)的頻率;中位數(shù):數(shù)的順序;平均數(shù):數(shù)的大小。臨終關懷醫(yī)院病人收容時間(670個病人記錄)

平均數(shù):35.7天

中位數(shù):17天

數(shù):1天某企業(yè)101位雇員的工資眾數(shù)、中位數(shù)和均值的關系對稱分布

相等

左偏分布均值

中位數(shù)

眾數(shù)右偏分布

眾數(shù)中位數(shù)均值50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計—506160.0分組數(shù)據(jù)的平均數(shù)1.先確定中位數(shù)所在的組;2.采用下列近似公式計算:分組數(shù)據(jù)的中位數(shù)前一組的累積頻數(shù)某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—例

計算50名工人日加工零件數(shù)的中位數(shù):分組數(shù)據(jù)的眾數(shù)1.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo2.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算(相似三角形的相似比)MoMoff-1f+1L組距某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—例

計算50名工人日加工零件數(shù)的眾數(shù):數(shù)據(jù)的尺度特征量尺度特征量是描述數(shù)據(jù)的離散程度。常用的尺度特征量有:

極差、方差(標準差)、變異系數(shù)(1)樣本極差(SampleRange),常記為R

=樣本最大值與最小值之間的差。

(2)樣本方差(SampleVariance),常記為樣本方差越小,數(shù)據(jù)越集中;樣本方差越大,數(shù)據(jù)越分散。樣本方差是一個非負的量。樣本方差等于零,則所有數(shù)據(jù)相同。樣本標準差(StandardDeviation):樣本方差的(非負)平方根,記為S.

注意:使用標準差的好處在于,其量綱單位與X是一致的。Excel函數(shù)用SPSS計算均值和標準差:

(1)

打開Student.sav

數(shù)據(jù)文件;

(2)從菜單“分析”中選

“描述性統(tǒng)計”,

再選“描述性統(tǒng)計分析”;

(3)在對話窗口中選擇要分析的變量。單個數(shù)學(math)成績的分析:數(shù)學(math)和物理(phys)成績同時分析:均值和標準差在實際問題中的應用(一)一種簡單的說法:數(shù)據(jù)中有

68%

落在

(-

S,+

S

)中;

95%

落在

(-

2S,+

2S

)中;

99%

落在

(-

3S,+

3S

)中;-

x

-

x

-

x

-

x

-

x

-

x

均值和標準差在實際問題中的應用(二)數(shù)據(jù)的標準化(標準得分)假設有兩個班級上同一門課,但是由于兩個任課老師的評分標準不同,使得兩個班成績的均值和標準差都不一樣。一班分數(shù)的均值和標準差分別為78.53和9.43,而二班的均值和標準差分別為70.19和7.00。問題:得到90分的一班的張穎是不是比得到82分的二班的劉疏成績更好呢?這種均值和標準差不同的數(shù)據(jù)不能夠直接比較,但是可以把它們進行標準化,然后再比較標準化后的數(shù)據(jù)。標準化(standardize):

(原數(shù)據(jù)-均值)/標準差一班張穎的標準得分是(90-78.53)/9.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論