




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
教育與心理統(tǒng)計(jì)課件第四章差異量數(shù)第1頁,共57頁,2023年,2月20日,星期一第四章差異量數(shù)學(xué)習(xí)目標(biāo)1、離散程度各測(cè)度值的計(jì)算方法2、離散程度各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合3、偏態(tài)與峰態(tài)的測(cè)度方法第2頁,共57頁,2023年,2月20日,星期一離中趨勢(shì)數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值第3頁,共57頁,2023年,2月20日,星期一全距(極差)(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910
R
=max(xi)-min(xi)**R越大,說明離散程度越大。計(jì)算公式為第4頁,共57頁,2023年,2月20日,星期一百分位差(percentile)為了避免極端數(shù)據(jù)的影響,將數(shù)據(jù)的兩端各截去10%,即P10和P90之間的距離作為差異量數(shù)。第5頁,共57頁,2023年,2月20日,星期一百分等級(jí)分?jǐn)?shù)表示分?jǐn)?shù)在整個(gè)分?jǐn)?shù)分布中所處的百分位置。其中:
PR:百分等級(jí)X:對(duì)應(yīng)的原始分?jǐn)?shù)f:該分?jǐn)?shù)所在組的次數(shù)Lb:該分?jǐn)?shù)所在組的精確下限
Fb:小于L的各組次數(shù)之和N:總次數(shù)
i:組距**百分等級(jí)一般只用整數(shù)不用小數(shù)。第6頁,共57頁,2023年,2月20日,星期一例:如下表示,求分?jǐn)?shù)為77的百分等級(jí)分?jǐn)?shù)。組別fF80—78—76—74—72—4719125474336175解:第7頁,共57頁,2023年,2月20日,星期一百分位分?jǐn)?shù)意義:
1、原始分?jǐn)?shù)在次數(shù)分布中的特定地位分?jǐn)?shù)。2、表示總體中有p%的分?jǐn)?shù)小于PP。計(jì)算公式:第8頁,共57頁,2023年,2月20日,星期一【例】:用下面的次數(shù)分布表計(jì)算該分布的百分位差P90-P10。組別f向上累加次數(shù)65-115760-415655-615250-814645-1613840-2412235-349830-216425-164320-112715-91610-77合計(jì)157注意:組位在第一次大于N*m/100的F所在組!第9頁,共57頁,2023年,2月20日,星期一解:先計(jì)算P90和P10兩個(gè)百分位數(shù)。
(如何確定PP所在的組位?)第10頁,共57頁,2023年,2月20日,星期一四分位數(shù)(quartile)1、排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)Q1Q2Q325%25%25%25%第11頁,共57頁,2023年,2月20日,星期一四分位數(shù)
(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):第12頁,共57頁,2023年,2月20日,星期一順序數(shù)據(jù)的四分位數(shù)解:Q1位置=(300)/4=75
Q3位置=(3×300)/4
=225從累計(jì)頻數(shù)看,Q1在“不滿意”這一組別中;Q3在“一般”這一組別中四分位數(shù)為
Q1
=不滿意
Q3
=一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的次數(shù)分布回答類別甲城市次數(shù)(戶)累計(jì)次數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—第13頁,共57頁,2023年,2月20日,星期一數(shù)值型數(shù)據(jù)的四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789第14頁,共57頁,2023年,2月20日,星期一數(shù)值型數(shù)據(jù)的四分位數(shù)
(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:1234
5678910第15頁,共57頁,2023年,2月20日,星期一四分位差
(quartiledeviation)對(duì)順序數(shù)據(jù)離散程度的測(cè)度也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差的一半。
Q
=(Q3
–Q1)/2反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性第16頁,共57頁,2023年,2月20日,星期一四分位差解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5。已知
Q1=不滿意=2
Q3
=
一般=3四分位差:
Q=(Q3-
Q1)/2
=(3–2)/2
=0.5甲城市家庭對(duì)住房狀況評(píng)價(jià)的次數(shù)分布回答類別甲城市次數(shù)(戶)累計(jì)次數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—第17頁,共57頁,2023年,2月20日,星期一平均差
(meandeviation)各變量值與其均值離差絕對(duì)值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)第18頁,共57頁,2023年,2月20日,星期一【例】:有5名被試的錯(cuò)覺實(shí)驗(yàn)數(shù)據(jù)如下,求其平均差。解:已知n=5x=18.6被試12345錯(cuò)覺量1618202217第19頁,共57頁,2023年,2月20日,星期一平均差某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(xc)次數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—2040求該電腦公司銷售量的平均差第20頁,共57頁,2023年,2月20日,星期一解:含義:每一天的銷售量平均數(shù)相比,平均相差17臺(tái)第21頁,共57頁,2023年,2月20日,星期一方差和標(biāo)準(zhǔn)差
(varianceandstandarddeviation)為了避免負(fù)數(shù)出現(xiàn),數(shù)據(jù)離散程度的最常用測(cè)度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差第22頁,共57頁,2023年,2月20日,星期一總體方差計(jì)算公式:總體標(biāo)準(zhǔn)差的計(jì)算公式:第23頁,共57頁,2023年,2月20日,星期一樣本方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!第24頁,共57頁,2023年,2月20日,星期一
樣本方差
自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為
n
時(shí),若樣本均值x
確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則x
=5。當(dāng)x
=5
確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差σ2時(shí),它是σ2的無偏估計(jì)量第25頁,共57頁,2023年,2月20日,星期一方差、標(biāo)準(zhǔn)差的計(jì)算原始數(shù)據(jù):【例】:計(jì)算6、5、7、4、6、8、這一組數(shù)據(jù)的方差和標(biāo)準(zhǔn)差。解:(1)公式法計(jì)算(2)計(jì)算器計(jì)算法第26頁,共57頁,2023年,2月20日,星期一分組數(shù)據(jù)的樣本標(biāo)準(zhǔn)差計(jì)算某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(Xc)次數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—55400第27頁,共57頁,2023年,2月20日,星期一樣本標(biāo)準(zhǔn)差
含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺(tái)。
**計(jì)算器的算法?!第28頁,共57頁,2023年,2月20日,星期一總標(biāo)準(zhǔn)差的合成:【例】:在三個(gè)班級(jí)進(jìn)行某項(xiàng)能力研究,三個(gè)班測(cè)查結(jié)果的平均數(shù)和標(biāo)準(zhǔn)差如下,求三個(gè)班的總標(biāo)準(zhǔn)差。班級(jí)nxS14210316236110123509817第29頁,共57頁,2023年,2月20日,星期一方差和標(biāo)準(zhǔn)差的性質(zhì)和意義性質(zhì)(1)每一個(gè)觀測(cè)值都加上一個(gè)相同常數(shù)C之后,計(jì)算得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差。(2)每一個(gè)觀測(cè)值都乘以一個(gè)相同的常數(shù)C,則所得的標(biāo)準(zhǔn)差等原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)。(3)每一個(gè)觀測(cè)值都乘以同一個(gè)常數(shù)C(C≠0),再加一個(gè)常數(shù)d,所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)C。第30頁,共57頁,2023年,2月20日,星期一意義:(1)方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好指標(biāo)。其值越大,次數(shù)分布越分散,反之,其值越小,離散越小。(2)
標(biāo)準(zhǔn)差具備一個(gè)良好的差異量數(shù)應(yīng)具備的條件:①反應(yīng)靈敏,每個(gè)數(shù)據(jù)取值變化,方差與標(biāo)準(zhǔn)關(guān)都隨之變化;②計(jì)算公式嚴(yán)密確定;③容易計(jì)算;④適合代數(shù)運(yùn)算;⑤受抽樣變動(dòng)影響,即不同樣本的標(biāo)準(zhǔn)差或方差比較穩(wěn)定;⑥簡(jiǎn)單明了,這一點(diǎn)其他差異量數(shù)比較稍有不足,但其意義還是較明確的。(3)標(biāo)準(zhǔn)差與其他各種差異量數(shù)相比,具有數(shù)學(xué)上的優(yōu)越性,特別是當(dāng)已知一組數(shù)據(jù)的平均數(shù)與標(biāo)準(zhǔn)差后,就可以知道落在平均數(shù)上下各一個(gè)標(biāo)準(zhǔn)差、兩個(gè)標(biāo)準(zhǔn)差,或三個(gè)標(biāo)準(zhǔn)差范圍內(nèi)的數(shù)據(jù)所占的百分比。
第31頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)差的應(yīng)用
差異系數(shù)
標(biāo)準(zhǔn)分?jǐn)?shù)第32頁,共57頁,2023年,2月20日,星期一差異系數(shù)(coefficientofvariation)1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比
2.對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度
3.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為第33頁,共57頁,2023年,2月20日,星期一差異系數(shù)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號(hào)產(chǎn)品銷售額(萬元)x1銷售利潤(rùn)(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度第34頁,共57頁,2023年,2月20日,星期一解:結(jié)論:計(jì)算結(jié)果表明,cv1<cv2,說明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度Cv1=536.25309.19=0.577cv2=32.521523.09=0.710第35頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)分?jǐn)?shù)
(standardscore)1.也稱標(biāo)準(zhǔn)化值或Z分?jǐn)?shù)2. 對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)4. 用于對(duì)變量的標(biāo)準(zhǔn)化處理5.計(jì)算公式為第36頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)均值等于02. 方差等于1第37頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)(圖示)z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在改組數(shù)據(jù)中的位置,也沒有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。第38頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)化值9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表家庭編號(hào)人均月收入(元)標(biāo)準(zhǔn)化值z(mì)
123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996第39頁,共57頁,2023年,2月20日,星期一經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)第40頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn)1、
可比性2、
可加性3、
明確性4、
穩(wěn)定性第41頁,共57頁,2023年,2月20日,星期一標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用:1、
用于比較幾個(gè)分屬性質(zhì)不同的觀測(cè)值在各自數(shù)據(jù)分布相對(duì)位置的高低2、
計(jì)算不同質(zhì)的觀測(cè)值的總和或平均值,以表示在團(tuán)體中的相對(duì)位置。3、表示標(biāo)準(zhǔn)測(cè)驗(yàn)分?jǐn)?shù)第42頁,共57頁,2023年,2月20日,星期一偏態(tài)與峰態(tài)的度量第43頁,共57頁,2023年,2月20日,星期一動(dòng)差和中心動(dòng)差(p86)FOLM=F.L0xi第44頁,共57頁,2023年,2月20日,星期一一級(jí)動(dòng)差二級(jí)動(dòng)差三級(jí)動(dòng)差(偏態(tài)指標(biāo))四級(jí)動(dòng)差(峰態(tài)指標(biāo))第45頁,共57頁,2023年,2月20日,星期一偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!第46頁,共57頁,2023年,2月20日,星期一偏態(tài)第47頁,共57頁,2023年,2月20日,星期一偏態(tài)
(skewness)統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出數(shù)據(jù)分布偏斜程度的測(cè)度2. 偏態(tài)系數(shù)=0為對(duì)稱分布3. 偏態(tài)系數(shù)>0為右偏分布4. 偏態(tài)系數(shù)<0為左偏分布第48頁,共57頁,2023年,2月20日,星期一偏態(tài)系數(shù)(skewnesscoefficient)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算第49頁,共57頁,2023年,2月20日,星期一偏態(tài)系數(shù)
某電腦公司銷售量偏態(tài)及峰度計(jì)算表按銷售量份組(臺(tái))組中值(Mi)頻數(shù)fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-27000017000800002160002560006
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 供貨款合同范本
- 沖壓產(chǎn)品供貨合同范本
- 勞動(dòng)合同范本表格
- 供暖ppp項(xiàng)目合同范本
- 醫(yī)師兼職勞務(wù)合同范本
- 公司瓶子采購合同范本
- 廈門車庫出租合同范本
- 公司工裝合同范本
- 公司簽商務(wù)合同范本
- 單體藥店轉(zhuǎn)讓貨品合同范例
- 大學(xué)生安全知識(shí)班會(huì)
- 《電力變壓器》課件
- 初級(jí)鐵路線路工技能鑒定考試題庫
- 2025年度建筑垃圾運(yùn)輸與再生資源回收一體化合同樣本
- 2024新人教版英語七下單詞默寫表(開學(xué)版)
- 河南省信陽市固始縣2023-2024學(xué)年四年級(jí)下學(xué)期期末數(shù)學(xué)試題
- 不吸煙不喝酒課件
- 奧數(shù)知識(shí)點(diǎn) 間隔問題
- 簡(jiǎn)易旋轉(zhuǎn)倒立擺及控制裝置
- 深圳大學(xué)《數(shù)字信號(hào)處理》2009年期末考試試卷A卷
- BMC缺陷以及原因
評(píng)論
0/150
提交評(píng)論