![統(tǒng)計(jì)的整理統(tǒng)計(jì)量數(shù)課件_第1頁](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50031.gif)
![統(tǒng)計(jì)的整理統(tǒng)計(jì)量數(shù)課件_第2頁](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50032.gif)
![統(tǒng)計(jì)的整理統(tǒng)計(jì)量數(shù)課件_第3頁](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50033.gif)
![統(tǒng)計(jì)的整理統(tǒng)計(jì)量數(shù)課件_第4頁](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50034.gif)
![統(tǒng)計(jì)的整理統(tǒng)計(jì)量數(shù)課件_第5頁](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50035.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章 統(tǒng)計(jì)資料的整理:統(tǒng)計(jì)量數(shù)學(xué) 習(xí) 目 標(biāo)介紹常用的統(tǒng)計(jì)量數(shù)來表達(dá)資料的特性。學(xué)習(xí)集中趨勢(shì)的統(tǒng)計(jì)量數(shù)。學(xué)習(xí)位置的統(tǒng)計(jì)量數(shù)。學(xué)習(xí)分散程度的統(tǒng)計(jì)量數(shù)。學(xué)習(xí)如何建立全方位的統(tǒng)計(jì)圖盒鬚圖。學(xué)習(xí)形狀的統(tǒng)計(jì)量數(shù)有偏度與峰度。學(xué)習(xí)如何計(jì)算分組資料。認(rèn)識(shí)謝比雪夫不等式與經(jīng)驗(yàn)法則。學(xué)習(xí)Z分?jǐn)?shù)的應(yīng)用。洞悉平均數(shù)、變異數(shù)及標(biāo)準(zhǔn)差的重要性質(zhì)。本 章 架 構(gòu)4.1 集中趨勢(shì)統(tǒng)計(jì)量數(shù)4.2 位置統(tǒng)計(jì)量數(shù)4.3 分散程度統(tǒng)計(jì)量數(shù)4.4 全方位的統(tǒng)計(jì)圖盒鬚圖4.5 形狀統(tǒng)計(jì)量數(shù)4.6 分組資料的統(tǒng)計(jì)量數(shù)4.7 謝比雪夫不等式與經(jīng)驗(yàn)法則4.8 z分?jǐn)?shù)的應(yīng)用4.9 樣本平均數(shù)、樣本變異數(shù)及樣本標(biāo)準(zhǔn)差的重要性質(zhì)4.1 集中趨勢(shì)
2、統(tǒng)計(jì)量數(shù)4.1.1 平均數(shù)(mean)4.1.2 中位數(shù)(median)4.1.3 眾數(shù)(mode)4.1.4 集中趨勢(shì)統(tǒng)計(jì)量數(shù)的比較4.1 集中趨勢(shì)統(tǒng)計(jì)量數(shù)(續(xù))所謂集中趨勢(shì)統(tǒng)計(jì)量數(shù)是以一個(gè)數(shù)值來描述樣本資料中,那一個(gè)分?jǐn)?shù)或數(shù)值是最具代表性,或集中在那個(gè)中心位置。最常見的集中量數(shù)有三種,即眾數(shù)(Mode)、中位數(shù)(Median)、和算術(shù)平均數(shù)(Mean),到底用那一個(gè)集中量數(shù)和資料衡量尺度以及研究之目的有關(guān)。4.1.1 平均數(shù)平均數(shù)(mean) 為所有數(shù)值總和除以所有數(shù)值的個(gè)數(shù),當(dāng)資料是屬量資料時(shí)適用。 母體平均數(shù)()樣本平均數(shù)( )臺(tái)積電股價(jià)報(bào)價(jià)2003年7月14日臺(tái)積電股價(jià)基本面訊息資料
3、來源:中時(shí)理財(cái)網(wǎng)臺(tái)灣電力公司近五年經(jīng)營績(jī)效資料來源:臺(tái)灣電力公司網(wǎng)站例4.1 平均數(shù)若全班12位學(xué)生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤,試求其母體平均數(shù)?若以上資料為抽自全班60位同學(xué)的樣本觀察值,則其樣本平均數(shù)為何?解:例4.2 平均數(shù)已知樣本資料2,3,5,10,15,若其中有所誤植,15應(yīng)為85才正確,問平均數(shù)有何變化? 解: 根據(jù)誤植的資料,則樣本平均數(shù)為(2+3+5+10+15)/15=7;若將15改為85,則樣本平均值變?yōu)?1,為原值的三倍。由上例可以知道平均數(shù)對(duì)於極端值(如上例中之85)的敏感度很強(qiáng),這是採用平均數(shù)作為集中趨勢(shì)統(tǒng)
4、計(jì)量數(shù)應(yīng)特別留意之處。為此,我們介紹中位數(shù)來克服這樣的疑慮。平均數(shù)性質(zhì)Xi = n ; Xi = N(Xi - )離差值 ( Xi - ) = 0min (Xi - A )2 (Xi - )2 最小易受離群值(outlier)影響,可用修正平均數(shù)改善。變數(shù)變換:Y = a X+ b = a + b修正平均數(shù)調(diào)查大學(xué)生每周上網(wǎng)時(shí)數(shù),今隨機(jī)抽取n16學(xué)生其資料如下: 4, 5, 6, 8, 9, 10, 12, 14, 15, 15, 15, 16, 17, 18, 20, 26求平均數(shù)求5修正平均數(shù)Sol: (1) = 13.125 (2)修正平均數(shù) = 12.86註:求修正平均數(shù)前需先將原資料
5、排序4.1.2 中位數(shù)中位數(shù)(median) 將資料由小到大(或由大到?。╉樞蚺帕嗅?,位於中心的數(shù)值稱之, 通常以 表示,當(dāng)資料是屬量資料時(shí)適用。 計(jì)算方法 將資料由小到大排序?qū)懗蓌(1), x(2), , x(n) 例4.3 續(xù)例4.1求12位學(xué)生的體重之中位數(shù)?解: 全班12位學(xué)生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤。 將12位學(xué)生的體重由小到大排序如下:35,38,39,40,42,43,46,48,50,51,54,54,因?yàn)閚=12為偶數(shù),故中位數(shù)為排序第六和第七位數(shù)值的平均,即例4.4 續(xù)例4.2已知樣本資料2,3,5,10,15,
6、若其中有所誤植,15應(yīng)為85才正確,請(qǐng)討論中位數(shù)的變化情形。 解: 若是誤植資料,其中位數(shù)為5,但經(jīng)訂正使用85取代15,則中位數(shù)依然為5,由此可知,中位數(shù)完全不受影響。由上例可知,中位數(shù)可能只用資料的一個(gè)或兩個(gè)數(shù)值,故對(duì)極端值不敏感。但其數(shù)學(xué)運(yùn)算卻不易操作,比如說,我們無法直接將兩組資料的個(gè)別中位數(shù)作運(yùn)算而求得合併兩組資料後的中位數(shù),因此中位數(shù)不常用來作統(tǒng)計(jì)推論。4.1.3 眾數(shù)眾數(shù): 指資料中出現(xiàn)次數(shù)最多的數(shù)或分組名稱。當(dāng)數(shù)據(jù)或名稱各只出現(xiàn)一次時(shí),眾數(shù)便不存在,但因次數(shù)可能相同,故眾數(shù)可能不唯一。 屬質(zhì)資料的集中趨勢(shì)統(tǒng)計(jì)量數(shù),用眾數(shù)(mode)表示最為適當(dāng)。 例4.5 眾數(shù)擲一公正的骰子1
7、0次,其點(diǎn)數(shù)分別為3、6、2、6、1、4、6、5、3、5,求其眾數(shù)?解: 點(diǎn)數(shù)的出現(xiàn)次數(shù)分別為點(diǎn)數(shù)1:1次、點(diǎn)數(shù)2:1次、點(diǎn)數(shù)3:2次、點(diǎn)數(shù)4:1次、點(diǎn)數(shù)5:2次、點(diǎn)數(shù)6:3次,故M0=6。例 4.6 某科技大學(xué)管理學(xué)院院長(zhǎng)欲瞭解所屬各碩士班的報(bào)名情形,得知資料如下:財(cái)金系250人,企管系308人,資管系169人,保險(xiǎn)系145人,會(huì)計(jì)系178人,休閒系134人,問那一碩士班最為熱門? 解: 各碩士班乃屬質(zhì)資料,故以眾數(shù)代表最為合適,即表示眾數(shù)為企管系,報(bào)名人數(shù)最多,是為某一年度最熱門的碩士班。4.1.4 集中趨勢(shì)統(tǒng)計(jì)量數(shù)的比較當(dāng)資料是對(duì)稱分配時(shí),則平均數(shù)、中位數(shù)及眾數(shù)三者皆相等。當(dāng)數(shù)據(jù)是屬量資
8、料時(shí),則適用平均數(shù)或中位數(shù)。若為屬質(zhì)資料時(shí),則應(yīng)以眾數(shù)為最佳選擇。以極端值而言,平均數(shù)受其影響最為明顯,相較之下,中位數(shù)與眾數(shù)則對(duì)極端值不敏感。平均數(shù)易於作數(shù)學(xué)運(yùn)算,但中位數(shù)與眾數(shù)則不易達(dá)成某些簡(jiǎn)單的數(shù)學(xué)運(yùn)算目的。平均數(shù)易於數(shù)學(xué)計(jì)算之特性 例如兩組樣本資料的個(gè)數(shù)與平均數(shù)分別為n1和n2及 和 ,則將兩組資料合併後的樣本平均數(shù)為 平均數(shù)具有如此的功能,但中位數(shù)和眾數(shù)則無法同理得知,也就是說,兩組資料合併後的中位數(shù)和眾數(shù)都無法以一關(guān)係式來直接代表。 4.2 位置統(tǒng)計(jì)量數(shù)4.2.1 百分位數(shù)(percentile)4.2.2 四分位數(shù)(quartile)4.2.1 百分位數(shù)百分位數(shù)(percenti
9、le) 通常以第k個(gè)百分?jǐn)?shù)稱之,並寫成Pk,代表資料中在此分?jǐn)?shù)下有多少百分比之樣本是在此分?jǐn)?shù)之下。設(shè)樣本數(shù)為n,則 4.2.1 百分位數(shù)求百分位數(shù) Pk 之步驟:(1) 將原始資料排序(2) 求位址 i : i = n/100 k(3) (i) i Z (整數(shù)), i 進(jìn)位如 i 3.2 Pk = X(4) (ii) i Z (整數(shù)) 如 i 5 Pk = (X(5) + X(6) )/2兒童的身高所謂的矮小是相對(duì)的。一個(gè)排在第3百分位數(shù)的兒童,比排在第50百分位數(shù)的矮,但這個(gè)第50百分位數(shù)的兒童,也比第97百分位數(shù)的兒童矮。 在臨床上,排在第三百分位數(shù)以下的兒童才算是所謂的矮。人的高度分佈是
10、平均的,所以大約有3%的兒童,其身高低於第三百分位數(shù),這是正常的。如果他們的高度遠(yuǎn)低於第三百分位數(shù),他們便可能是患病。 例4.7 續(xù)例4.1全班12位學(xué)生的體重分別為38,46,43,51,54,50,40,48,39,42,54,35公斤,求P20。解: 因?yàn)?不是整數(shù),所以取第三小的數(shù),即 。 4.2.2 四分位數(shù)四分位數(shù)(quartile) : 是將N分成四等份,因此第一個(gè)四分位之分?jǐn)?shù)是指有25%的樣本數(shù)目(N)的分?jǐn)?shù)低於此分?jǐn)?shù)。 P25,稱為第一個(gè)四分位數(shù)或下四分位數(shù)Q1。P50,稱為第二個(gè)四分位數(shù)Q2,就是中位數(shù),所以P50= Q2 = Me。P75,稱為第三個(gè)四分位數(shù)或上四分位數(shù)Q
11、3。註:十分位數(shù)是將N分成四等份: D1, D2, , D10 Di = Pk,k = 0.1100 i 例4.8 續(xù)例4.1全班12位學(xué)生的體重分別為38,46,43,51,54,50,40,48,39,42,54,35公斤,求Q1、Q2、Q3。解:平均數(shù)、中位數(shù)及眾數(shù)三者之關(guān)係單峰右偏 : Mo Me 單峰左偏 : Me 3 Xi為偏離值 (當(dāng)資料呈鐘形分布)例4.14 基金報(bào)酬率是否有偏離值?假設(shè)某一年有12檔基金的報(bào)酬率(%)如下:15、12、35、14、16、14、17、20、18、17、15、14請(qǐng)繪製盒鬚圖,並判斷是否有偏離值?解: 首先,我們計(jì)算出x(1)=12,Q1=14,M
12、e=15.5,Q3 =17.5,x(12)= 35。然後根據(jù)這五個(gè)統(tǒng)計(jì)量數(shù)繪製如圖4.3之盒鬚圖。(此圖係以SPSS統(tǒng)計(jì)軟體繪製,Excel軟體無此功能。)例4.14 基金報(bào)酬率是否有偏離值?(續(xù))由圖4.3可知,存在一個(gè)偏離值,即報(bào)酬率35%的那一檔基金。圖4.3 12檔基金報(bào)酬率之盒鬚圖RETURN40302010124.5 形狀統(tǒng)計(jì)量數(shù)4.5.1 偏度(skewness)4.5.2 峰度(kurtosis)4.5 形狀統(tǒng)計(jì)量數(shù)(續(xù))形狀統(tǒng)計(jì)量數(shù)(measure of shape)是用以表示資料是否對(duì)稱於中心點(diǎn)及寬闊或高聳的程度,主要的統(tǒng)計(jì)量數(shù)有偏度和峰度兩種。4.5.1 偏度偏度(ske
13、wness) 用來說明一組資料是否對(duì)稱於中心位置,通常以1表示。樣本偏度 (1) 1 0,單峰右偏 (2) 1 0,高狹峰 (2) 2 1圖4.8 謝比雪夫不等式之圖示4.7.1 謝比雪夫不等式(續(xù)) 例4.18 謝比雪夫不等式就例3.6之五十筆樣本資料,試問有多少比例的觀察值落於樣本平均數(shù)左右兩個(gè)樣本標(biāo)準(zhǔn)差的區(qū)間內(nèi)?解: 根據(jù)謝比雪夫不等式的結(jié)論,則至少有75%的資料落於該區(qū)間內(nèi)。本例中,我們可以實(shí)際瞭解真正的情形。首先計(jì)算 , ,所以 因?yàn)?k=2,故 ,實(shí)際計(jì)數(shù)後得知有 的資料落於該區(qū)間內(nèi)。 4.7.2 經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則(empirical rule): 當(dāng)資料呈現(xiàn)對(duì)稱分配或鐘形分配時(shí),
14、則約有68%的資料落在平均數(shù)左右一個(gè)標(biāo)準(zhǔn)差的區(qū)間內(nèi)。約有95%的資料落在平均數(shù)左右二個(gè)標(biāo)準(zhǔn)差的區(qū)間內(nèi)。約有99.7%的資料落在平均數(shù)左右三個(gè)標(biāo)準(zhǔn)差的區(qū)間內(nèi)。數(shù)學(xué)式: P( | X | k ) 68% , k = 1 95%, k = 2 99.7%, k = 3 經(jīng)驗(yàn)法則的應(yīng)用根據(jù)經(jīng)驗(yàn)法則吾人可預(yù)測(cè)共同基金的報(bào)酬率分布情況:平均報(bào)酬率加上兩個(gè)標(biāo)準(zhǔn)差大約是最佳狀況時(shí)的報(bào)酬率;平均報(bào)酬率剪去兩個(gè)標(biāo)準(zhǔn)差大約是最差狀況時(shí)的報(bào)酬率。換言之,四個(gè)標(biāo)準(zhǔn)差大約是最好與最壞時(shí)的差距。例4.19 續(xù)例4.18試依經(jīng)驗(yàn)法則驗(yàn)證相關(guān)的結(jié)論。解:在 的區(qū)間有33個(gè)數(shù)據(jù),占33/50=66%。在 的區(qū)間有49個(gè)數(shù)據(jù),占4
15、9/50=98%。在 的區(qū)間有50個(gè)數(shù)據(jù),占50/50=100%。以上三個(gè)比例和經(jīng)驗(yàn)法則的結(jié)論都非常接近,因?yàn)橘Y料具有近似對(duì)稱分配的性質(zhì)。謝比雪夫不等式與經(jīng)驗(yàn)法則例:自某大學(xué)四年級(jí)N = 1080學(xué)生,測(cè)驗(yàn)智力測(cè)驗(yàn),得其IQ分?jǐn)?shù)之平均數(shù)()= 120,標(biāo)準(zhǔn)差()= 8。假設(shè)資料呈鐘形分布時(shí),試回答下列問題。 (1) 試?yán)弥x比雪夫定理求出分?jǐn)?shù)108 132區(qū)間至 少有多少人? (2) 試?yán)媒?jīng)驗(yàn)法則求區(qū)間a , b內(nèi)約有1026個(gè)學(xué) 生? (3) 設(shè)依此成績(jī)學(xué)校給予IQ分?jǐn)?shù)前27名學(xué)生獎(jiǎng)金做 為鼓勵(lì),試問最低分?jǐn)?shù)為多少?4.8 z分?jǐn)?shù)的應(yīng)用z分?jǐn)?shù)(z score) 代表任一觀測(cè)值(x)與平均數(shù)
16、間的距離有幾個(gè)標(biāo)準(zhǔn)差的意義。 母體的z分?jǐn)?shù)樣本的z分?jǐn)?shù)註 : z分?jǐn)?shù)沒有單位z分?jǐn)?shù)的性質(zhì)zi = 0 (zi - ) = 0變異數(shù) : Sz2 = 1,z2 = 1母體:Zi2 = N 樣本:Zi2 = n 1註:若資料呈鐘形分布經(jīng)轉(zhuǎn)換成Z分?jǐn)?shù)時(shí),當(dāng)|Zi| 3,則Xi為離群值。例4.20 統(tǒng)計(jì)學(xué)成績(jī)進(jìn)步抑或退步?小明在班上的統(tǒng)計(jì)學(xué)期中考成績(jī)65分,全班的平均是62分,標(biāo)準(zhǔn)差5分;另其期末考成績(jī)?yōu)?6分,班上的平均是80分,標(biāo)準(zhǔn)差3分,試問小明的成績(jī)?cè)诎嗌厦问沁M(jìn)步或退步呢?另外,小明期中考成績(jī)以相同班上名次則期末考須考幾分?(假設(shè)期中考、期末考成績(jī)均呈鐘形分布)解:(1) 若以數(shù)學(xué)的基本觀念
17、而言,76分絕對(duì)高於62分,但若 換算兩次考試的z分?jǐn)?shù),期中考的z分?jǐn)?shù)為0.6,正數(shù)表示高於全班平均;至於期末考則為 -1.33,表示在全班平均以下,所以小明的成績(jī)就全班而言是退步了。 (2) 利用期中考、期末考成績(jī)的z分?jǐn)?shù)相等。z分?jǐn)?shù)的應(yīng)用隨機(jī)抽出n5個(gè)樣本並轉(zhuǎn)換成Z分分?jǐn)?shù),其分別為 Z1 = 1.4, Z2 = -0.8, Z3 = -1.2, Z4 = 1.6 (1) 試問Z5 之值為何? (2) 若 = 30,S = 3,試問x5 之值為何?解:(1) Zi = 0 Z5 = -1 (2) Z5 = ( X5 - )/s X5 = 274.9 樣本平均數(shù)、樣本變異數(shù)及樣本標(biāo)準(zhǔn)差的重要性質(zhì)平移:將資料同加一個(gè)常數(shù)項(xiàng)的方式。 令 zi = xi c
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度勞動(dòng)合同終止與離職證明書
- 二零二五年度股東持股權(quán)益變動(dòng)與公司長(zhǎng)期發(fā)展戰(zhàn)略協(xié)議
- 施工現(xiàn)場(chǎng)施工防地質(zhì)災(zāi)害制度
- 職場(chǎng)演講稿的創(chuàng)意寫作技巧
- 持續(xù)關(guān)注客戶體驗(yàn)銀行如何通過CRM提升其貸款業(yè)務(wù)的穩(wěn)健性
- 防疫物資保障應(yīng)急預(yù)案
- 二手房屋買賣合同協(xié)議
- 中外合資飯店建設(shè)與運(yùn)營合同
- 三方就業(yè)合同模板
- 產(chǎn)學(xué)研合作協(xié)議合同樣本
- 2025版大學(xué)食堂冷鏈?zhǔn)巢呐渌头?wù)合同模板3篇
- 新能源發(fā)電項(xiàng)目合作開發(fā)協(xié)議
- 《中醫(yī)體重管理臨床指南》
- 2025年上半年潞安化工集團(tuán)限公司高校畢業(yè)生招聘易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024年鐵嶺衛(wèi)生職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2025年山東魯商集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 大型活動(dòng)中的風(fēng)險(xiǎn)管理與安全保障
- 課題申報(bào)書:個(gè)體衰老差異視角下社區(qū)交往空間特征識(shí)別與優(yōu)化
- 江蘇省招標(biāo)中心有限公司招聘筆試沖刺題2025
- 綜采工作面過空巷安全技術(shù)措施
- 云南省麗江市2025屆高三上學(xué)期復(fù)習(xí)統(tǒng)一檢測(cè)試題 物理 含解析
評(píng)論
0/150
提交評(píng)論