第4章離散趨勢(shì)測(cè)度_第1頁(yè)
第4章離散趨勢(shì)測(cè)度_第2頁(yè)
第4章離散趨勢(shì)測(cè)度_第3頁(yè)
第4章離散趨勢(shì)測(cè)度_第4頁(yè)
第4章離散趨勢(shì)測(cè)度_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

笑話有一個(gè)統(tǒng)計(jì)學(xué)家,他把頭放在熱的平底鍋中,把腳放在冰箱中,然后說:”現(xiàn)在,在平均的意義上我感覺很好.”一個(gè)社區(qū)的平均家庭收入可能是令人舒適的每年10萬(wàn)美元,但假如這個(gè)均值是從200戶極窮的人家與20戶極富的人家的收入計(jì)算得來的,它就不能代表他們中的任何一個(gè).明顯,只了解變量的集中趨勢(shì)是不夠的!一、測(cè)定離散程度的指標(biāo)及其作用1.說明數(shù)據(jù)的分散程度,反映變量的穩(wěn)定性、均衡性。數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。2.衡量平均數(shù)的代表性。離散程度越大,平均數(shù)的代表性就越小。3.統(tǒng)計(jì)推斷的重要依據(jù)判別統(tǒng)計(jì)推斷前提條件是否成立,衡量推斷效果好壞的重要尺度。集中趨勢(shì)弱、離散趨勢(shì)強(qiáng)集中趨勢(shì)強(qiáng)、離散趨勢(shì)弱(一)全距和四分位差(二)方差和標(biāo)準(zhǔn)差(三)變異系數(shù)(四)偏度離散程度的度量全距(Range):全部數(shù)據(jù)中最大值與最小值之差。即:四分位差(interquartile

range):第三個(gè)四分位數(shù)與第一個(gè)四分位數(shù)之差。即:RIQR152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174全距=174-152=22(cm)四分位差=167-160=7(cm)152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174185190190200全距=200-152=48(cm)四分位差=168-160=8(cm)Q1Q2Q3微小值極大值(一)全距和四分位差(二)方差和標(biāo)準(zhǔn)差(三)變異系數(shù)(四)偏度離散程度的度量方差(variance):各變量值與其算術(shù)平均數(shù)離差平方的算術(shù)平均數(shù)。標(biāo)準(zhǔn)差(meansquaredeviation

Standarddeviation

):是方差的算術(shù)平方根。也稱均方差、均方根差、離差均方根等。Var2S2MSDSTDEV

S方差及標(biāo)準(zhǔn)差的概念方差及標(biāo)準(zhǔn)差的計(jì)算簡(jiǎn)單式加權(quán)式總體方差及標(biāo)準(zhǔn)差簡(jiǎn)單式樣本方差及標(biāo)準(zhǔn)差方差及標(biāo)準(zhǔn)差的計(jì)算一般的計(jì)算過程:列表第一步計(jì)算均值第二步計(jì)算離差第三步離差平方第四步乘以權(quán)數(shù)簡(jiǎn)捷計(jì)算方法:不計(jì)算離差方差及標(biāo)準(zhǔn)差的作用方差及標(biāo)準(zhǔn)差的作用68.27%95.45%99.73%STAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)方差及標(biāo)準(zhǔn)差的作用標(biāo)準(zhǔn)差可以用來度量相對(duì)位置和異樣值的檢測(cè)。Z分?jǐn)?shù)標(biāo)準(zhǔn)化的數(shù)值,標(biāo)明Xi

距離其平均數(shù)的標(biāo)準(zhǔn)差個(gè)數(shù)。某學(xué)生期末考試時(shí),數(shù)學(xué)成果為85分,據(jù)此計(jì)算的Z分?jǐn)?shù)為0.5;英語(yǔ)成果為70分,Z分?jǐn)?shù)也是0.5。則說明該學(xué)生兩科考試成果的相對(duì)位置是相同的,即都高于平均成果0.5個(gè)標(biāo)準(zhǔn)差。一個(gè)數(shù)據(jù)集中某個(gè)或某幾個(gè)數(shù)據(jù)反常地大或小,一般稱其為極端值或異樣值,應(yīng)當(dāng)進(jìn)一步加以檢查、鑒別。一般的建議是:凡Z分?jǐn)?shù)小于-3或大于+3的數(shù)據(jù)均可以被認(rèn)為是異樣值。異樣值的診斷Z分?jǐn)?shù)法異樣值:質(zhì)量限制統(tǒng)計(jì)中限制圖的原理限制下限限制上限中心線

若數(shù)據(jù)落在限制線外,則認(rèn)為生產(chǎn)過程失去限制,推斷錯(cuò)誤的概率小于0.5%。國(guó)外一項(xiàng)探討表明,IQ值呈正態(tài)分布,其平均數(shù)為100,標(biāo)準(zhǔn)差為15。問:凡IQ值高于145的人都被視為天才,閱歷法則是否支持這一論斷?

結(jié)論:支持《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174185190190200異常值練習(xí):前NBA巨星MichaelJordan身高78英寸,而WNBA運(yùn)動(dòng)員R.lobo身高76英寸。很明顯,Jordan高出2英寸,但誰(shuí)相對(duì)來說更高一些?Jordan在男性中的身高是否超過了lobo在女性中的身高?(男性身高的平均數(shù)為69.0英寸,標(biāo)準(zhǔn)差為2.8英寸;女性身高平均數(shù)為63.6英寸,標(biāo)準(zhǔn)差為2.5英寸。)是非標(biāo)記的均值及標(biāo)準(zhǔn)差其值僅表現(xiàn)為具有某種特征或不具有某種特征兩種狀況的標(biāo)記稱為是非標(biāo)記,也稱交替標(biāo)記。性別:男、女(非男)產(chǎn)品質(zhì)量:合格、不合格1010是非標(biāo)記的均值及標(biāo)準(zhǔn)差具有某種標(biāo)記的總體單位數(shù)不具有某種標(biāo)記的總體單位數(shù)總體單位總數(shù)是非標(biāo)記的均值及標(biāo)準(zhǔn)差是非標(biāo)記的均值:是非標(biāo)記的標(biāo)準(zhǔn)差:某廠某月份生產(chǎn)了1000件產(chǎn)品,其中合格品900件,不合格品100件。求產(chǎn)品質(zhì)量分布的集中趨勢(shì)與離散趨勢(shì)。集中趨勢(shì)離散趨勢(shì)不同贊同率下的標(biāo)準(zhǔn)差贊同率反映兩種看法的對(duì)立狀況,越接近50%,爭(zhēng)論的強(qiáng)度越大,可把這種“爭(zhēng)論強(qiáng)度”用方差或標(biāo)準(zhǔn)差的方法進(jìn)行計(jì)算和表示(一)全距和四分位差(二)平均差(三)方差和標(biāo)準(zhǔn)差(四)變異系數(shù)(五)偏度離散程度的度量變異現(xiàn)象舉例假如某家人每天的食譜都是一樣的,窮還是富?南美安第斯山,窮人老是吃土豆和玉米變異太小是“單調(diào)”、“齋”寧欺山莫欺水水裏的危急更多更隱藏,猝不及防什么是“戲劇性變更”現(xiàn)實(shí)中的變更小,但無(wú)巧不成書,要把很多小概率事務(wù)匯合一處,“濃縮”人生男性笨還是女性笨?在平均智力水平方面,男女并無(wú)明顯差別。但在被測(cè)為最聰慧的2%人群和最傻的2%人群中,男子人數(shù)均為女子的兩倍。參與這項(xiàng)探討的英國(guó)愛丁堡高校教授蒂莫西·貝茨說:“男性更簡(jiǎn)潔處在頂點(diǎn)和底部?!薄短┪钍繄?bào)》提到一種理論,男子為在女性面前更具魅力,會(huì)儘量提陞自己的智力。可比STAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)身高的差異水平:cm體重的差異水平:kg用變異系數(shù)可以相互比較STAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)可比變異系數(shù)(離散系數(shù)):數(shù)列的離散水平指標(biāo)與數(shù)列均值的比值。STAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)(一)全距和四分位差(二)平均差(三)方差和標(biāo)準(zhǔn)差(四)變異系數(shù)(五)偏度離散程度的度量4.3統(tǒng)計(jì)分佈的形態(tài)相對(duì)于正態(tài)分佈而言,總體的分佈是否對(duì)稱?集中趨勢(shì)是高是低?分別用偏度和峰度指標(biāo)來反映。三階中心矩、四階中心矩可用來描述偏度和峰度兩個(gè)指標(biāo)可檢驗(yàn)數(shù)據(jù)集的分佈是否接近正態(tài)分佈(Skew=0,Kurt=0)。統(tǒng)計(jì)實(shí)務(wù)中常用來進(jìn)行質(zhì)量管理(如產(chǎn)品、過程等的一樣性、穩(wěn)定性)一、矩(動(dòng)差)矩(動(dòng)差)——一系列刻畫數(shù)據(jù)分布特征的指標(biāo)的統(tǒng)稱。變量值與數(shù)值a之離差的K次方的平均數(shù)稱為變量x關(guān)于a的K階矩,即:K階原點(diǎn)矩(當(dāng)a=0時(shí))是數(shù)據(jù)的K次方的平均數(shù).一階原點(diǎn)矩即算術(shù)平均數(shù);二階原點(diǎn)矩即平方平均數(shù)。

K階中心矩矩(當(dāng)a=均值

時(shí))是以均值為中心計(jì)算的離差K次方的平均數(shù)k=1時(shí),稱為一階中心矩,它恒等于0,即m1=0;k=2時(shí),稱為二階中心矩,也就是方差,即m2=σ2。

二、偏度(Skewness)偏度——指數(shù)據(jù)分布的不對(duì)稱程度或偏斜程度。以對(duì)稱分布為標(biāo)準(zhǔn)來區(qū)分偏態(tài)分布又分左偏(負(fù)偏)和右偏(正偏).左偏分布(負(fù)偏)右偏分布(正偏)偏態(tài)的測(cè)度方法-30+3

極左偏態(tài)對(duì)稱分布極右偏態(tài)一般有:(一)由均值與眾數(shù)(中位數(shù))之間的關(guān)系求偏態(tài)系數(shù):(二)由三個(gè)四分位數(shù)之間的關(guān)系求偏態(tài)系數(shù)值域:-1Sk1

極左偏態(tài)對(duì)稱分布極右偏態(tài)-10+1

偏度系數(shù)(三)利用3階中心矩來計(jì)算偏度系數(shù)。測(cè)定偏度最常用的方法原理:若分布不對(duì)稱,則3階中心矩不為0。不對(duì)此程度愈嚴(yán)峻,3階中心矩的確定值愈大。為消退量綱的影響,可除以σ3。0

對(duì)稱分布左偏分布

右偏分布偏態(tài)系數(shù)的含義左偏分布(也稱負(fù)偏分布):偏態(tài)系數(shù)SK<0;偏態(tài)系數(shù)的絕對(duì)值越大,偏斜越嚴(yán)重?cái)?shù)據(jù)向左邊延伸得更多右偏分布(也稱正偏分布):偏態(tài)系數(shù)SK>0;偏態(tài)系數(shù)的絕對(duì)值越大,偏斜越嚴(yán)重。數(shù)據(jù)向右邊延伸得更多對(duì)稱分布:偏態(tài)系數(shù)=0。

三、峰度(Kurtosis)峰度——是指變量的集中程度和分布曲線的陡峭(或平坦)的程度。對(duì)峰度的度量通常以正態(tài)分布曲線為比較標(biāo)準(zhǔn),分為正態(tài)峰度、尖頂峰度和平頂峰度.平頂分布尖峰分布尖頂峰度的分布曲線比正態(tài)分布曲線更加尖峭、更高更窄;平頂峰度的分布曲線比正態(tài)安排曲線更為平緩、更低更扁平。峰度系數(shù)原理:分布曲線的尖峭程度與偶數(shù)階中心矩的數(shù)值大小有干脆關(guān)系。以四階中心矩m4為基礎(chǔ),為了消退量綱的影響,再除以標(biāo)準(zhǔn)差的四次方σ4所得到的相對(duì)數(shù)即可衡量峰度。當(dāng)K=0時(shí),分布曲線為正態(tài)曲線;當(dāng)K>0時(shí),為尖頂曲線,表示數(shù)據(jù)比正態(tài)分布更集中在均值旁邊;K的數(shù)值越大,則變量分布曲線之頂端越尖峭;當(dāng)K<0時(shí),為平頂曲線,表示數(shù)據(jù)比正態(tài)分布更分散;K的數(shù)值越小,則變量分布曲線之頂端越平坦。對(duì)于正態(tài)分布曲線有:m4/σ4=3,故峰度系數(shù)為:峰度系數(shù)的含義扁平分布尖峰分布峰度系數(shù)K<0,與正態(tài)分布相比該分布一般為扁平。峰度系數(shù)K>0,與正態(tài)分布相比該分布一般為尖峰。均值和方差相同的正態(tài)分布【例3-13】依據(jù)表3-3的數(shù)據(jù),計(jì)算運(yùn)用壽命分布的偏度系數(shù)和峰度系數(shù)。解:計(jì)算結(jié)果表明,偏度系數(shù)幾乎為0,峰度系數(shù)略小于0,說明該產(chǎn)品運(yùn)用壽命的分布特別接近對(duì)稱分布,分布曲線頂峰略比正態(tài)分布平坦一些??偟恼f來,該產(chǎn)品的運(yùn)用壽命的分布特別接近正態(tài)分布。STAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)離散形態(tài)的概念非對(duì)稱的,偏斜的分布對(duì)稱的、高度適中的分布既偏斜又低平的分布偏度(skewness):度量數(shù)據(jù)分布非對(duì)稱方向及程度的指標(biāo)。SKSTAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)STAT《統(tǒng)計(jì)學(xué)》其次章統(tǒng)計(jì)數(shù)據(jù)動(dòng)差法偏度的計(jì)算:一階中心矩衡為零,偶數(shù)階中心矩為正數(shù),奇數(shù)階中心矩可以反映分布偏度。三階中心矩有計(jì)量單位,不便于比較,故用具有相同單位的3相除,去掉單位本章小結(jié)測(cè)度集中趨勢(shì)的各指標(biāo)的含義、計(jì)算方法、特點(diǎn)和應(yīng)用場(chǎng)合測(cè)度離散程度的各指標(biāo)的含義、計(jì)算方法、特點(diǎn)和應(yīng)用場(chǎng)合偏度與峰度的含義和測(cè)度方法利用Excel計(jì)算描述統(tǒng)計(jì)量變異指標(biāo)1.一個(gè)班統(tǒng)計(jì)測(cè)驗(yàn)分?jǐn)?shù)的平均數(shù)為75,標(biāo)準(zhǔn)差為12.運(yùn)用全距閱歷法則估計(jì)最高和最低的通常分?jǐn)?shù)。在這里,50分能被視為通常的分?jǐn)?shù)嗎?2.女性的身高具有鐘形分布,其平均數(shù)為63

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論