




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
社會統(tǒng)計學離中趨勢的量度第1頁,共47頁,2023年,2月20日,星期一10名同學的成績:78808285898790867988另10名同學的成績556878889910098908583均值相等(84.4),但兩組數(shù)據(jù)有差別嗎?是否有必要去計算一下數(shù)據(jù)之間的差距呢?第2頁,共47頁,2023年,2月20日,星期一2023/4/142A組:60,60,60,60,60B組:58,59,60,61,62C組:40,50,60,70,80D組:80,80,80,80,80平均數(shù)不同,離勢可能相同;平均數(shù)相同,離勢可能不同。第3頁,共47頁,2023年,2月20日,星期一2023/4/143第一節(jié)全距與四分位差1.全距(range)全距(R):最大值和最小值之差。也叫極差。全距越大,表示變動越大。對分組資料,不能確知最大值和最小值:
1、組值最大組的組中值減去最小組的組中值
2、組值最大組的上限減去最小組的下限
3、組值最大組的組中值減去最小組的下限;最大組的上限減去最小組的組中值第4頁,共47頁,2023年,2月20日,星期一2023/4/144第5頁,共47頁,2023年,2月20日,星期一2023/4/145求下列兩組成績的全距:A:78808285898790867988B:556878889910098908583優(yōu)點:計算簡單、直觀。缺點:受極端值影響大;沒有量度中間各個單位間的差異性,數(shù)據(jù)利用率低,信息喪失嚴重;受抽樣變動影響大,大樣本全距比小樣本全距大。第6頁,共47頁,2023年,2月20日,星期一2023/4/1462.四分位差(Quartiledeviation)Q·D:第三四分位數(shù)和第一四分位數(shù)的半距。避免全距受極端值影響大的缺點。
Q·D=
第7頁,共47頁,2023年,2月20日,星期一2023/4/147求下列兩組成績的四分位差:A:788082858987908679888481B:5568788899100989085838481A:78,79,80,81,82,84,85,86,87,88,89,90B:55,68,78,81,83,84,85,88,90,98,99,100第8頁,共47頁,2023年,2月20日,星期一2023/4/148第二節(jié)平均差(Meanabsolutedeviation)離差——各變量值與算術平均數(shù)的差平均差——離差絕對值的算術平均數(shù)。(meandeviation)1.未分組資料
A·D=
2.分組資料A·D=3.平均差的性質:仍屬算術平均數(shù);在受抽樣變動、極端值影響,理論意義不易闡述有時以中位數(shù)為基準來計算平均差更合理。第9頁,共47頁,2023年,2月20日,星期一2023/4/149[例5.2.1]試分別以算術平均數(shù)為基準,求85,69,69,74,87,91,74這些數(shù)字的平均差。[例5.2.2]試以算術平均數(shù)為基準,求下表所示數(shù)據(jù)的平均差。
第10頁,共47頁,2023年,2月20日,星期一2023/4/1410人口數(shù)(X)戶數(shù)(f)頻率(P)23456785816106410.100.160.320.200.120.080.02合計501.00第11頁,共47頁,2023年,2月20日,星期一2023/4/1411第三節(jié)標準差S(standarddeviation)意義:克服平均差帶有絕對值的缺點,又保留其優(yōu)點。定義:各變量值對其算術平均數(shù)的離差平方的算術平均數(shù)的平方根。(均方差)Describeshowscoresofaninterval/ratiovariablearespreadacrossthedistributiontothemeanscore.1.未分組資料
S=
=第12頁,共47頁,2023年,2月20日,星期一2023/4/1412S==第13頁,共47頁,2023年,2月20日,星期一2023/4/1413方差方差(variance,2,
S2):各數(shù)據(jù)與平均數(shù)差數(shù)的平方和的平均值稱為方差,也稱為變異數(shù)。因此,方差的定義公式為:
2=(X-)2/n-1
S2=(X-)2/n-1第14頁,共47頁,2023年,2月20日,星期一2023/4/1414例1:求72、81、86、69、57這些數(shù)字的標準差和方差。簡算式:
S=第15頁,共47頁,2023年,2月20日,星期一2023/4/14152.分組資料S=S===第16頁,共47頁,2023年,2月20日,星期一2023/4/1416求下表數(shù)據(jù)資料的標準差第17頁,共47頁,2023年,2月20日,星期一2023/4/1417是反映總體各單位標志值的離散狀況和差異程度的最佳測度。(1)以算術平均數(shù)為基準計算的標準差比以其他任何數(shù)值為基準計算的標準差要小。“最小二乘方”性質——各變量值對算術平均數(shù)的離差的平方和,必定小于他們對任何其他數(shù)偏差的平方和。(2)它將總體中各單位標志值的差異全包括在內,受抽樣變動影響小。但在受極端值影響以及處理不確定組距方面,缺點同算術平均數(shù)。方差:標準差的平方。3.標準差的性質第18頁,共47頁,2023年,2月20日,星期一2023/4/1418問:已知一組數(shù)列的平均數(shù)和標準差,此時若將該組數(shù)列的每一個變量值均增加10形成一組新數(shù)列,請問新數(shù)列的平均數(shù)和標準差怎樣變化。注意:樣本標準差(SampleStandardDeviation):n-1樣本方差第19頁,共47頁,2023年,2月20日,星期一2023/4/1419假如兩個學生都通過不同的大學入學考試,共同向一個學校申請獎學金。設Mary參加的是ACT(theAcademicCollegeTestingService)andscored26ACTpoints,[0~36]John參加的是SAT(theStanfordAdmissionsTest)andscored900SATpoints.[200~1600]另有其他數(shù)據(jù),ACT:Mean=22,S=2SAT:Mean=1000,S=100請問若只能一人獲獎,應該給誰?第20頁,共47頁,2023年,2月20日,星期一2023/4/14204.標準分(standardizedscore)定義:以離差和標準差的比值來測定變量X與的相對位置。使原來不能直接比較的離差標準化,可以相互比較,加、減、平均
Z=z分數(shù)的特性:1、z是和X一一對應的變量值。2、Z分數(shù)沒有單位,是一個不受原資料單位影響的相對數(shù),所以可以用于不同單位資料的比較。3、Z分數(shù)實際表達了變量值距總體均值有幾個標準差。
Z=2,Z=3.2,標準正態(tài)變量第21頁,共47頁,2023年,2月20日,星期一2023/4/1421Z分數(shù)的性質:1、Z分數(shù)之和等于02、Z分數(shù)的算術平均數(shù)等于03、Z分數(shù)的標準差等于1,方差也等于1實際意義:以均值為基礎,以標準差為量度單位,各總體之間可以通過標準分進行合理的比較和相加。第22頁,共47頁,2023年,2月20日,星期一2023/4/1422Z分數(shù)的應用(1)可用于比較分數(shù)性質不同的觀測值在各自數(shù)據(jù)分布中的相對位置高低。(2)當已知各不同質的觀測值的次數(shù)分布為正態(tài)分布時,可用Z分數(shù)求不同觀測值的總和或均值,以表示在團體中的相對位置。第23頁,共47頁,2023年,2月20日,星期一2023/4/1423例1:甲班的平均分為80分,乙班的平均分為60分,標準差都為10分,A、B分別屬于甲、乙兩班。A的成績?yōu)?0分,B的成績?yōu)?5分,試比較兩學生成績的好壞。例2:甲乙兩班的平均分均為60分,甲班的標準差為10,乙班的標準差為20分,A、B分別屬于甲、乙兩班,成績均為80分,試比較兩學生成績的好壞。一個20歲的大學生智力測驗中作對了35個題目,一個6歲的兒童作對了9個題目,誰更聰明?第24頁,共47頁,2023年,2月20日,星期一2023/4/1424作業(yè)1.計算下列數(shù)據(jù)的全距、平均差、方差和標準差
788082858987908679885568788899100989085832.第25頁,共47頁,2023年,2月20日,星期一2023/4/14252.求下表頻次分布的標準差第26頁,共47頁,2023年,2月20日,星期一2023/4/14263.下列數(shù)據(jù)是從16~20歲的抽煙者中抽出的樣本。X為每天抽煙支數(shù),mean=15支,S=5支。請完成下表。CaseXZ(standardizedscore)張三17李四30王五4馬六20第27頁,共47頁,2023年,2月20日,星期一2023/4/1427第四節(jié)相對離勢
用離勢的絕對離勢除以其平均指標就得到離勢的相對指標,稱為相對離勢。當所對比的兩個數(shù)列的水平高低不同時,就不能采用全距、平均差或標準差進行對比分析,因為它們都是絕對指標,其數(shù)值的大小不僅受各單位標志值差異程度的影響,而且受到總體單位標志值本身水平高低的影響;為了對比分析不同水平的變量數(shù)列之間標志值的變異程度,就必須消除數(shù)列水平高低的影響。第28頁,共47頁,2023年,2月20日,星期一2023/4/14281、異眾比率:非眾數(shù)的頻數(shù)與總體單位數(shù)的比值。V·R表示意義:能表明眾數(shù)所不能代表的那一部分變量值在總體中的比重。2、變異系數(shù):絕對離勢統(tǒng)計量與其算術平均數(shù)的比率,用V表示。(1)全距系數(shù):數(shù)列中全距與算術平均數(shù)之比。(2)平均差系數(shù):數(shù)列中各變量的平均差與其算術平均數(shù)之比。(3)標準差系數(shù):數(shù)列中各變量的標準差與其算術平均數(shù)之比。變異系數(shù)的意義:對不同性質、不同水平總體的離散程度進行比較。第29頁,共47頁,2023年,2月20日,星期一2023/4/1429例1:某項調查發(fā)現(xiàn),現(xiàn)今三口之家的家庭最多(32%),求異重比率。某開發(fā)商根據(jù)這一報導,將房屋的戶型大部分都設計為適合三口之家居住的樣式和面積,你認為如何呢?例2:設為測體重,得到成人組和嬰兒組各100人的兩個抽樣總體。成人組平均體重為65千克,全距為10千克;嬰兒組平均體重為4千克,全距為2.5千克。能否認為成人組體重的離勢比嬰兒組體重的離勢大?例3:對一個群體測量身高和體重,平均身高為170.2厘米,身高標準差為5.30厘米;平均體重為70千克,體重標準差為4.77千克;比較身高和體重的離散程度。第30頁,共47頁,2023年,2月20日,星期一2023/4/14303.偏態(tài)系數(shù)偏態(tài)=算術平均數(shù)-眾數(shù)偏斜系數(shù)=偏態(tài)/標準差α=0,對稱分布;α>0為右偏;α<0為左偏[-3,+3]第31頁,共47頁,2023年,2月20日,星期一2023/4/1431練習:甲乙兩單位職工工資資料如下:
試比較哪個單位的職工工資差異程度小
月工資甲單位(人)乙單位(人)600以下21600~70042700~800104800~900712900~1000661000~110045合計3330第32頁,共47頁,2023年,2月20日,星期一2023/4/1432SPSS基本統(tǒng)計在中可以很容易地得出頻數(shù)分布表,平均數(shù),標準差等。第33頁,共47頁,2023年,2月20日,星期一2023/4/1433界面菜單菜單欄:file(SPSS文件的操作)Edit(編輯菜單)View(用戶界面設置菜單)Data(數(shù)據(jù)文件建立和編輯菜單)Transform(數(shù)據(jù)基本處理菜單)Analyze(統(tǒng)計分析菜單,主要統(tǒng)計功能)Graphs(統(tǒng)計圖形菜單)Utilities(相關應用和設置菜單)Windows(各窗口切換菜單)Help(幫助菜單)第34頁,共47頁,2023年,2月20日,星期一2023/4/1434一、頻數(shù)分布頻數(shù)分布:可以概略地看到資料的分布情況,可做初步整理之用,從中還可檢查數(shù)據(jù)輸入情況。Analyze——DescriptiveStatistics——Frequencies可選入多個變量。第35頁,共47頁,2023年,2月20日,星期一2023/4/1435第36頁,共47頁,2023年,2月20日,星期一2023/4/1436第37頁,共47頁,2023年,2月20日,星期一2023/4/1437二、描述統(tǒng)計分析過程對于定距以上變量,可以進行集中趨勢和離中趨勢的統(tǒng)計Analyze——DescriptiveStatistics——Descriptives變量可多選其中選項有:MeanStd.deviationMinimum第38頁,共47頁,2023年,2月20日,星期一2023/4/1438第39頁,共47頁,2023年,2月20日,星期一2023/4/1439Statistics:Dispersion(離差欄):Std.Deviation標準差Variance方差Range全距MinimumMaximumS.E.mean均數(shù)的標準誤CentralTendency(集中趨勢欄)MeanMedianModeSum例:09-01第40頁,共47頁,2023年,2月20日,星期一2023/4/1440Distribution(分布參數(shù))Skewness偏度(0,1.5,0.5,-0.5)標準正態(tài)分布,值為0;正數(shù),右偏;負數(shù),左偏;值絕對值大于1,則可肯定數(shù)據(jù)的分布不成正態(tài)分布
Kurtosis峰度(0,正,負):尖平程度標準正態(tài)分布,值為0;大于0,分布比標準正態(tài)分布峰高(尖);小于0,第41頁,共47頁,2023年,2月20日,星期一2023/4/1441第42頁,共47頁,2023年,2月20日,星期一202
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 22《文言文二則》第一課時(教學設計)-2024-2025學年統(tǒng)編版語文六年級上冊
- 2024-2025學年高中物理第1章電磁感應第1節(jié)電磁感應現(xiàn)象第2節(jié)產(chǎn)生感應電流的條件學案粵教版選修3-2
- 2024-2025學年高中物理第二章勻變速直線運動的研究第4節(jié)勻變速直線運動的速度與位移的關系B同步訓練含解析新人教版必修1
- 2024-2025學年新教材高中歷史課時素養(yǎng)評價十四清朝前中期的鼎盛與危機新人教版必修中外歷史綱要上
- 2024-2025學年新教材高中地理課后作業(yè)提升十八地理信息技術在防災減災中的應用含解析新人教版必修第一冊
- 第四單元 綜合實踐活動專題 發(fā)現(xiàn)寧波之美 教學設計 2024-2025學年統(tǒng)編版高中語文必修上冊
- 高中信息技術-粵教版選修2教學設計-4.3 圖形圖像的加工
- 2025年PA6T項目合作計劃書
- 2025年凝血因子VIII、IX合作協(xié)議書
- 14健康過冬天( 教學設計)統(tǒng)編版道德與法治一年級上冊
- 復工復產(chǎn)應急處置方案
- 歷史類常識經(jīng)典考試題100題帶答案(能力提升)
- 水利水電工程建設用地設計標準(征求意見稿)
- 《了解紋樣》參考課件
- (正式版)JBT 2603-2024 電動懸掛起重機
- 小學信息技術-第8冊全冊-6年級下-電子工業(yè)出版社
- 《網(wǎng)絡攻擊與防御》課件第四章 基于系統(tǒng)的攻擊與防御
- 口腔醫(yī)學美學口腔攝影
- 供電一把手講安全課
- 健康生活的五大要素
- JTG∕T F30-2014 公路水泥混凝土路面施工技術細則
評論
0/150
提交評論