數(shù)據(jù)采集與處理 課件 任務(wù)5 數(shù)據(jù)離中趨勢(shì)處理_第1頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)5 數(shù)據(jù)離中趨勢(shì)處理_第2頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)5 數(shù)據(jù)離中趨勢(shì)處理_第3頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)5 數(shù)據(jù)離中趨勢(shì)處理_第4頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)5 數(shù)據(jù)離中趨勢(shì)處理_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

項(xiàng)目四靜態(tài)數(shù)據(jù)處理技術(shù)任務(wù)5數(shù)據(jù)離中趨勢(shì)處理任務(wù)導(dǎo)入:某企業(yè)甲、乙兩個(gè)班組工人的平均日產(chǎn)量分別為:甲班組為8.5件/人,乙班組為11.9件/人;甲、乙兩班組工人日產(chǎn)量的標(biāo)準(zhǔn)差分別為:甲班組σ=2.22(件),乙班:σ=2.69(件)。任務(wù)要求:試分析甲乙兩班組工人平均日產(chǎn)量哪個(gè)代表性要強(qiáng)一些?一、標(biāo)志變異指標(biāo)概述離中趨勢(shì):是數(shù)據(jù)分布的又一特征,是指一組數(shù)據(jù)遠(yuǎn)離其中心值的程度,表明該組數(shù)據(jù)值的差異或離散狀況。離中趨勢(shì)常用標(biāo)志變異指標(biāo)來(lái)進(jìn)行測(cè)度。標(biāo)志變異指標(biāo):是描述數(shù)據(jù)采集對(duì)象各單位標(biāo)志值差別大小程度的指標(biāo),又稱標(biāo)志變動(dòng)度、離散程度或離中程度。如果說(shuō)均值是說(shuō)明總體分布的集中趨勢(shì),那么標(biāo)志變異指標(biāo)則是說(shuō)明總體分布的離散趨勢(shì)。不同類型的數(shù)據(jù)有不同的離中程度測(cè)度方法,離中趨勢(shì)測(cè)度經(jīng)常用到的標(biāo)志變異指標(biāo)有:異眾比率、四分位差、極差、方差和標(biāo)準(zhǔn)差等。(一)標(biāo)志變異指標(biāo)的概念一、標(biāo)志變異指標(biāo)概述(1)反映一組數(shù)據(jù)離中程度。(2)標(biāo)志變異指標(biāo)是評(píng)價(jià)平均數(shù)代表性的依據(jù)。標(biāo)志變異指標(biāo)值越大,平均數(shù)的代表性越低;反之,平均數(shù)的代表性越高。(3)一般來(lái)說(shuō),標(biāo)志變異指標(biāo)值越大,總體各單位變量值分布的離散趨勢(shì)越高、均衡性越低;反之,總體各單位變量值分布的離散趨勢(shì)越低、均衡性越高。(二)標(biāo)志變異指標(biāo)的作用一、標(biāo)志變異指標(biāo)概述二、全距全距又稱極差,是總體各單位標(biāo)志的最大值和最小值之差,可用來(lái)測(cè)度數(shù)值型數(shù)據(jù)的離中程度,易受極端值的影響。其一般計(jì)算公式為:全距=最大變量值-最小變量值用符號(hào)表示為:二、全距根據(jù)原始資料和單項(xiàng)數(shù)列計(jì)算全距時(shí),可直接用上述公式。但如果掌握的資料是組距數(shù)列,則全距的計(jì)算公式為:全距=最大變量值組上限-最小變量值組下限由于全距只考慮了兩個(gè)極端值之間的差距,沒(méi)有利用全部觀測(cè)值的信息,所以不能充分反映全部觀測(cè)值之間的實(shí)際差異程度,在應(yīng)用上有一定的局限性。三、平均差平均差是各變量值與其均值離差絕對(duì)值的平均數(shù),它也能全面反映一組數(shù)據(jù)的離散程度。(一)平均差的概念平均差越大,說(shuō)明數(shù)據(jù)的離散程度越大;平均差愈小,說(shuō)明數(shù)據(jù)的離散程度越小。平均差計(jì)算方法簡(jiǎn)單,能完整地反映了全部數(shù)據(jù)的分散程度,主要用來(lái)測(cè)度數(shù)值型數(shù)據(jù)的離中趨勢(shì),但由于絕對(duì)值計(jì)算不方便,故實(shí)際中應(yīng)用較少。三、平均差(二)平均差的計(jì)算公式或式中,A.D是平均差,xi是各單位標(biāo)志值,

是平均數(shù),n是總體單位數(shù),fi是各組單位數(shù)。三、平均差(三)平均差的Excel處理下面我們以某電腦公司日銷售量為例,利用Excel對(duì)數(shù)據(jù)進(jìn)行處理來(lái)測(cè)度平均差。三、平均差(三)平均差的Excel處理第一步,分在B列、D列、E列和F列插入一列,分別輸入“組中值(x)”、“xifi”、

和三、平均差(三)平均差的Excel處理第二步,根據(jù)組中值的計(jì)算方法,在B3到B8單元格中分別填入相應(yīng)的組中值;

第三步,求出各組的銷售量及總銷售量;第四步,求出日銷售量均值;第五步,求出組中值與日均銷售量離差的絕對(duì)值;第六步,求出;第七步,求出平均差;該平均差數(shù)值表明,每一天的銷售量與平均數(shù)相比,平均相差17臺(tái)。四、標(biāo)準(zhǔn)差1.方差(一)方差與標(biāo)準(zhǔn)差的概念方差是指數(shù)據(jù)采集對(duì)象各單位標(biāo)志值與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù)。2.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是指數(shù)據(jù)采集對(duì)象各單位標(biāo)志值與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù)的平方根。

標(biāo)準(zhǔn)差越大,說(shuō)明數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差越小,說(shuō)明數(shù)據(jù)的離散程度越小。四、標(biāo)準(zhǔn)差1.方差的計(jì)算公式(二)方差與標(biāo)準(zhǔn)差的計(jì)算公式或

四、標(biāo)準(zhǔn)差2.標(biāo)準(zhǔn)差的計(jì)算公式(二)方差與標(biāo)準(zhǔn)差的計(jì)算公式或

四、標(biāo)準(zhǔn)差(三)標(biāo)準(zhǔn)差的Excel處理仍以上述電腦公司銷售情況為例來(lái)進(jìn)行標(biāo)準(zhǔn)差的Excel的處理,已經(jīng)計(jì)算出算術(shù)平均數(shù)為145。四、標(biāo)準(zhǔn)差(三)標(biāo)準(zhǔn)差的Excel處理第二步,依次求出E2-E11的值、F2-F11的值第三步,根據(jù)方差公式求出方差第四步,根據(jù)平方根函數(shù)(SQRT)求出標(biāo)準(zhǔn)差四、標(biāo)準(zhǔn)差(三)標(biāo)準(zhǔn)差的Excel處理說(shuō)明:未分組的數(shù)據(jù),可借助于Excel中的函數(shù)求方差和標(biāo)準(zhǔn)差方差:可借助于“VARP”函數(shù)來(lái)計(jì)算(樣本方差要使用“VAR”函數(shù))標(biāo)準(zhǔn)差:可借助于“STDEVP”函數(shù)來(lái)計(jì)算五、離散系數(shù)離散系數(shù)又稱變異系數(shù),主要是用于比較性質(zhì)不同的數(shù)據(jù)采集對(duì)象總體數(shù)據(jù)的離散程度。常用的離散系數(shù)有全距系數(shù)、平均差系數(shù)、標(biāo)準(zhǔn)差系數(shù)等。離散系數(shù)中最為常用的是標(biāo)準(zhǔn)差系數(shù),它是指標(biāo)準(zhǔn)差與其均值的比值,可以消除了數(shù)據(jù)水平高低和計(jì)量單位的影響。標(biāo)準(zhǔn)差系數(shù)的計(jì)算公式為:六、離中趨勢(shì)的其它測(cè)度量異眾比率指非眾數(shù)值的次數(shù)之和占總次數(shù)的比重,主要用于對(duì)分類數(shù)據(jù)離散程度的測(cè)度,用VMo表示,其計(jì)算公式為:(一)異眾比率其中,fMo

為眾數(shù)值次數(shù),N為總次數(shù)含義:非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,用于衡量眾數(shù)的代表性。異眾比率數(shù)值越大,說(shuō)明眾數(shù)的代表性越低,即觀測(cè)值差異較大;異眾比率數(shù)值越小,說(shuō)明眾數(shù)的代表性越高,即觀測(cè)值差異較小。六、離中趨勢(shì)的其它測(cè)度量(一)異眾比率大家算一算異眾比率是多少?表4-4-1某店鋪不同品牌飲料銷售情況的頻數(shù)分布

=70%在所調(diào)查的50人當(dāng)中,購(gòu)買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“冰紅茶”代表消費(fèi)者購(gòu)買飲料品牌的狀況,其代表性不是很好.眾數(shù)的代表性怎么樣?六、離中趨勢(shì)的其它測(cè)度量(二)四分位差四分位差,也稱為內(nèi)距或四分間距,是上四分位數(shù)(QU,即位于75%)與下四分位數(shù)(QL,即位于25%)之差,反映中間50%數(shù)據(jù)的離散程度。數(shù)值越小,說(shuō)明中間的數(shù)據(jù)越集中,數(shù)值越大,說(shuō)明中間的數(shù)據(jù)越分散。四分位差主要用于對(duì)順序數(shù)據(jù)離散程度的測(cè)度,對(duì)于數(shù)值型數(shù)據(jù)也可以計(jì)算四分位差,但不適合分類數(shù)據(jù),它不受極端值的影響。四分位差主要用于衡量中位數(shù)的代表性。其公式為:QD=QU–QL六、離中趨勢(shì)的其它測(cè)度量(二)四分位差可以假設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5表4-4-2某城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布QU=300*0.75%=225=一般=3QL=300*0.25%=75=不滿意=2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論