版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)數(shù)據(jù)分布特征的描述第一頁,共六十五頁,2022年,8月28日第三章統(tǒng)計(jì)數(shù)據(jù)分布特征的描述3.1統(tǒng)計(jì)變量集中趨勢(shì)的測定3.2統(tǒng)計(jì)變量離散程度的測定3.3變量分布偏度與峰度的描述第二頁,共六十五頁,2022年,8月28日3.1統(tǒng)計(jì)變量集中趨勢(shì)的測定3.1.1測定集中趨勢(shì)的主要指標(biāo)及其作用3.1.2位置平均數(shù)3.1.3數(shù)值平均數(shù)第三頁,共六十五頁,2022年,8月28日
測定集中趨勢(shì)的主要指標(biāo)及其作用
測定集中趨勢(shì)的指標(biāo)有兩類:位置平均數(shù)和數(shù)值平均數(shù)。
位置平均數(shù)是根據(jù)變量值位置來確定的代表值,即在總體中將變量值按順序排列得到的數(shù)列中某個(gè)特殊位置的值就稱為位置平均數(shù)。常用的位置平均數(shù)有眾數(shù)、中位數(shù)和分位數(shù)等,前兩種常用。位置平均數(shù)可以用于對(duì)品質(zhì)數(shù)據(jù)和數(shù)量數(shù)據(jù)的測度。
數(shù)值平均數(shù)就是均值,它是對(duì)總體中的所有數(shù)據(jù)計(jì)算平均值,用以反映所有數(shù)據(jù)的一般水平。根據(jù)計(jì)算方法不同,數(shù)值平均數(shù)可以分為算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)和冪平均數(shù)。這類平均數(shù)的特點(diǎn)是,統(tǒng)計(jì)總體中任何一項(xiàng)數(shù)據(jù)的變動(dòng)都會(huì)在一定程度上影響到數(shù)值平均數(shù)的計(jì)算結(jié)果。數(shù)值平均數(shù)只能用于對(duì)數(shù)量數(shù)據(jù)的測度。
第四頁,共六十五頁,2022年,8月28日
測定集中趨勢(shì)的主要指標(biāo)及其作用
測定集中趨勢(shì)是為了表示社會(huì)經(jīng)濟(jì)現(xiàn)象總體各單位某一標(biāo)志在一定時(shí)間、地點(diǎn)條件下所達(dá)到的一般水平。亦即將總體各單位標(biāo)志值的數(shù)量差異抽象化,反映總體在具體條件下各單位標(biāo)志值達(dá)到的一般水平。
集中趨勢(shì)的指標(biāo)經(jīng)常被作為評(píng)價(jià)事物和決策的數(shù)量標(biāo)準(zhǔn)或參考。具體地說,測定集中趨勢(shì)的作用如下:
1.反映總體各單位變量分布的集中趨勢(shì)和一般水平;2.比較同類現(xiàn)象在不同單位的發(fā)展水平;3.比較同類現(xiàn)象在不同時(shí)期的發(fā)展變化趨勢(shì)或規(guī)律;4.分析現(xiàn)象之間的依存關(guān)系。第五頁,共六十五頁,2022年,8月28日3.1.2位置平均數(shù)
位置平均數(shù)是根據(jù)數(shù)據(jù)排列位置所確定的代表值,其與數(shù)值平均數(shù)的基本區(qū)別在于不需要依據(jù)每一個(gè)數(shù)據(jù)值來計(jì)算。
常用的位置平均數(shù)有:
1、眾數(shù)
2、中位數(shù)
3、其它分位數(shù)。第六頁,共六十五頁,2022年,8月28日3.1.2.1眾數(shù)(mode)
眾數(shù)是總體中出現(xiàn)次數(shù)最多的那個(gè)數(shù)據(jù)值。在頻數(shù)分布中,眾數(shù)指頻數(shù)或頻率最大的標(biāo)志值,用Mo表示。
從數(shù)據(jù)的分布層面看,分布數(shù)列中最常出現(xiàn)的標(biāo)志值說明該標(biāo)志值最具有代表性,因此可以反映數(shù)列的一般水平。在分配曲線圖上,眾數(shù)就是曲線的最高峰所對(duì)應(yīng)的標(biāo)志值。但是,眾數(shù)具有不確定性。如果數(shù)據(jù)的分布沒有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)就不存在;如果有多個(gè)高峰點(diǎn),就有多眾數(shù)。
在不等距分組的條件下,眾數(shù)必須根據(jù)頻數(shù)密度或頻率密度來計(jì)算。眾數(shù)是按照數(shù)據(jù)的位置計(jì)算的,它的長處是易于理解,不受極端數(shù)值的影響。當(dāng)數(shù)據(jù)分布存在明顯的集中趨勢(shì),且有顯著的極端值時(shí),適合使用眾數(shù)。但是其靈敏度、計(jì)算功能和穩(wěn)定性差,具有不唯一性,所以當(dāng)數(shù)據(jù)分布的集中趨勢(shì)不明顯或存在兩個(gè)以上分布中心時(shí),便不適合使用眾數(shù)(前者無眾數(shù),后者為雙眾數(shù)或多眾數(shù),也等于沒有眾數(shù))。第七頁,共六十五頁,2022年,8月28日3.1.2.1.1由品質(zhì)數(shù)列和單項(xiàng)式數(shù)量數(shù)列確定眾數(shù)
由品質(zhì)數(shù)列和單項(xiàng)式數(shù)量分配數(shù)列確定眾數(shù),方法比較簡單。即出現(xiàn)次數(shù)最多的標(biāo)志值就是眾數(shù)。
[例3-1]
2000年福建省城鎮(zhèn)居民家庭居住條件構(gòu)成如下表,求居住條件的眾數(shù)。
表3-1城鎮(zhèn)居民家庭居住條件構(gòu)成(單位:%)
資料來源:《福建統(tǒng)計(jì)年鑒—2002》。
按房屋產(chǎn)權(quán)分組數(shù)據(jù)就是一個(gè)品質(zhì)數(shù)列,有71.7%的城鎮(zhèn)居民的住房是自有房,因?yàn)?1.7%是該品質(zhì)數(shù)列中的最高頻率,因此,其眾數(shù)就是“自有房”,Mo=自有房。項(xiàng)目2000年按房屋產(chǎn)權(quán)分公房租賃私房自有房其他100.012.61.971.713.8第八頁,共六十五頁,2022年,8月28日3.1.2.1.1由品質(zhì)數(shù)列和單項(xiàng)式數(shù)量數(shù)列確定眾數(shù)[例3-2]某學(xué)院某學(xué)年教師開課門數(shù)如表3-2,求開課門數(shù)的眾數(shù)。
表3-2教師開課門數(shù)(單位:門)
在上表的單項(xiàng)式數(shù)量數(shù)列中,教師開課門數(shù)最集中的是2門課,所以2就是眾數(shù),Mo=2。開課門數(shù)x1234合計(jì)教師數(shù)f1530281285第九頁,共六十五頁,2022年,8月28日3.1.2.1.2由組距數(shù)量數(shù)列確定眾數(shù)按年人均純收入分組(元)農(nóng)民家庭數(shù)(戶)1000-12001200-14001400-16001600-18001800-20002000-22002200-24002400-2600240480105060027021012030合計(jì)3000
[例3-3]某地區(qū)農(nóng)民收入情況如表3-3,計(jì)算其人均純收入的眾數(shù)。
表3-3農(nóng)民家庭年人均純收入情況表第十頁,共六十五頁,2022年,8月28日3.1.2.2中位數(shù)(Median)
中位數(shù)和眾數(shù)一樣,也是一種位置代表值。中位數(shù)是將總體中的數(shù)據(jù)按順序排列后,處于數(shù)列中點(diǎn)位置上的那個(gè)數(shù)據(jù)值或變量值,或者說中位數(shù)是累計(jì)頻率數(shù)列中,累計(jì)頻率為0.50所對(duì)應(yīng)的變量值。用Me表示。在總體中,小于中位數(shù)的數(shù)據(jù)個(gè)數(shù)占一半,大于中位數(shù)的數(shù)據(jù)個(gè)數(shù)也占一半,即中位數(shù)是將數(shù)據(jù)按大小順序排列后,位于二等分點(diǎn)上的那個(gè)數(shù)據(jù)值。用中位數(shù)來代表總體中所有標(biāo)志值的一般水平,可以避免極端值的影響,在有些情況下更具有代表性。中位數(shù)的確定方法,根據(jù)所掌握的數(shù)據(jù)不同而有所不同。第十一頁,共六十五頁,2022年,8月28日[例3-4]某高校一次對(duì)食堂伙食滿意度的調(diào)查
數(shù)據(jù)如表3-4所示。求滿意度的中位數(shù)。
回答類別學(xué)生人數(shù)(人)學(xué)生人數(shù)累計(jì)(向上累計(jì))非常不滿意240240不滿意10801320一般9302250滿意4502700非常滿意3003000合計(jì)3000——表3-4調(diào)查數(shù)據(jù)次數(shù)分布中位數(shù)位置=3000/2=1500
從學(xué)生數(shù)累計(jì)看,中位數(shù)在第三組,所以,Me=一般。
第十二頁,共六十五頁,2022年,8月28日3.1.2.2.2由單項(xiàng)式分組數(shù)量數(shù)據(jù)確定中位數(shù)
單項(xiàng)式數(shù)量數(shù)據(jù)分組已經(jīng)將數(shù)據(jù)順序化,這時(shí)數(shù)據(jù)個(gè)數(shù)即總體單位數(shù)n=∑f,確定中位數(shù)位置的方法要通過累計(jì)次數(shù)計(jì)算。[例3-6]由表3-5數(shù)據(jù)計(jì)算中位數(shù)。
中位數(shù)的位置是85/2=42.5,因此,Me=2。表3-5教師開課門數(shù)累計(jì)頻數(shù)表開課門數(shù)(門)教師數(shù)(人)向上累計(jì)教師數(shù)(人)向下累計(jì)教師數(shù)(人)1151585230457032873404128512合計(jì)85————第十三頁,共六十五頁,2022年,8月28日3.1.2.2.3由組距式分組的數(shù)量數(shù)據(jù)確定中位數(shù)
[例3-7]根據(jù)表3-6數(shù)據(jù),計(jì)算農(nóng)民家庭年人均純收入中位數(shù)。表3-6農(nóng)民家庭年人均純收入累計(jì)次數(shù)表年人均純收入(元)農(nóng)民家庭數(shù)(戶)向上累計(jì)戶數(shù)向下累計(jì)戶數(shù)1000-120024024030001200-140048072027601400-16001050177022801600-1800600237012301800-200027026406302000-220021028503602200-240012029701502400-260030300030合計(jì)3000————第十四頁,共六十五頁,2022年,8月28日3.1.2.3.1四分位數(shù)(Quartile)
四分位數(shù)又稱為四分位點(diǎn),它利用三個(gè)等分點(diǎn)將數(shù)據(jù)四等分:第一個(gè)等分點(diǎn)稱為下四分位數(shù),第二個(gè)等分點(diǎn)就是中位數(shù),第三個(gè)等分點(diǎn)稱為上四分位數(shù)。四分位數(shù)的計(jì)算方法與中位數(shù)相似,即先確定其位置,再確定其數(shù)值。(1)順序數(shù)據(jù)四分位數(shù)位置的確定Qi=in/4(i=1,2,3)式中,Qi
是第i個(gè)四分位數(shù),n是數(shù)據(jù)個(gè)數(shù)即總體單位數(shù)。
(2)未分組和單項(xiàng)式分組的數(shù)量數(shù)據(jù)四分位數(shù)位置的確定Qi=i(n+1)/4(i=1,2,3)(3)組距式分組數(shù)量數(shù)據(jù)中四分位數(shù)位置的確定第十五頁,共六十五頁,2022年,8月28日3.1.2.3.1四分位數(shù)(Quartile)
[例3-8]利用例3-4的數(shù)據(jù)確定四分位數(shù)。
解:依題意得:Q1位置=n/4=3000/4=750(人)Q1=不滿意Q2位置=2n/4=2*3000/4=1500(人)Q2=一般Q3位置=3n/4=3*3000/4=2250(人)Q3=滿意第十六頁,共六十五頁,2022年,8月28日3.1.2.3.1四分位數(shù)(Quartile)
[例3-9]
計(jì)算例3-5中數(shù)據(jù)的四分位數(shù)。
解:依題意得:Q1位置=(n+1)/4=9/4=2.25Q1=x2+0.25(x3-x2)=19+0.25*(20-19)=19.25(元)Q2位置=2(n+1)/4=2*9/4=4.5Q2=(x4+x5)/2=(22+23)/2=22.5(元)Q3位置=3(n+1)/4=6.75Q3=x6+0.75(x7-x6)=23+0.75*(23-23)=23(元)第十七頁,共六十五頁,2022年,8月28日3.1.2.3.2百分位數(shù)(Percentile)
百分位數(shù)是數(shù)據(jù)順序排列后,將數(shù)據(jù)100等分,位于i(i=1,2,…,99)個(gè)等分點(diǎn)位置的數(shù)據(jù)值??梢?,第25百分位數(shù)就是第一個(gè)四分位數(shù);第50百分位數(shù)即第二個(gè)四分位數(shù),也就是中位數(shù);第75百分位數(shù)則是第三個(gè)四分位數(shù)。百分位數(shù)的計(jì)算思路與四分位數(shù)一樣。
對(duì)第i百分位數(shù),嚴(yán)格的定義如下:第i百分位數(shù)是這樣一個(gè)值,它使得至少有i%的數(shù)據(jù)項(xiàng)小于或等于這個(gè)值,且至少有(100-i)%的數(shù)據(jù)項(xiàng)大于或等于這個(gè)值。第十八頁,共六十五頁,2022年,8月28日3.1.3數(shù)值平均數(shù)
數(shù)值平均數(shù)又稱為均值,是用于測定數(shù)量數(shù)據(jù)的集中趨勢(shì)的指標(biāo),算術(shù)平均數(shù)是最常用的數(shù)值平均數(shù),由算術(shù)平均數(shù)又引申出了調(diào)和平均數(shù)和幾何平均數(shù)。第十九頁,共六十五頁,2022年,8月28日3.1.3.1算術(shù)平均數(shù)(均值)arithmeticmean
算術(shù)平均數(shù)又稱均值,是統(tǒng)計(jì)數(shù)據(jù)高低相互抵消后的結(jié)果,表現(xiàn)了數(shù)據(jù)的集中趨勢(shì)和代表性水平。從統(tǒng)計(jì)思想看,均值削弱了數(shù)據(jù)中偶然性,揭示了蘊(yùn)含在偶然性當(dāng)中的必然性,是統(tǒng)計(jì)數(shù)據(jù)集中趨勢(shì)的一個(gè)最重要特征值。而且本身具有良好的數(shù)學(xué)性質(zhì)?;拘问剑核阈g(shù)平均數(shù)=總體標(biāo)志總量/總體單位總量
算術(shù)平均數(shù)的計(jì)算條件:算術(shù)平均數(shù)是同質(zhì)總體的標(biāo)志總量和單位總量的比率關(guān)系,要求分子與分母必須是同一總體,而且兩者在數(shù)量上存在著直接的對(duì)應(yīng)關(guān)系,即分子數(shù)值隨著分母數(shù)值的變動(dòng)而變動(dòng)。實(shí)際工作中,由于數(shù)據(jù)的不同,算術(shù)平均數(shù)有簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)兩種計(jì)算形式。第二十頁,共六十五頁,2022年,8月28日3.1.3.1.1簡單算術(shù)平均數(shù)[例3-11]例3-5的中,日產(chǎn)零件數(shù)分別為17、19、20、22、23、23、24、25(件/人)8名工人的日產(chǎn)零件的平均數(shù)為:第二十一頁,共六十五頁,2022年,8月28日3.1.3.1.2加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)
加權(quán)算術(shù)平均數(shù)主要用于數(shù)據(jù)已經(jīng)分組,并編制出次數(shù)分布的條件下。這時(shí)必須先將各組標(biāo)志值乘以相應(yīng)的次數(shù),得到各組的標(biāo)志總量,然后再相加得到總體標(biāo)志總量,最后用總體標(biāo)志總量除以總體單位總量。加權(quán)算術(shù)平均數(shù)的計(jì)算公式為:如果是組距式分組,在假定各組內(nèi)的變量值均勻分布的條件下,用各組的組中值代表各組的平均值,以各組組中值乘以各組次數(shù)作為各組的標(biāo)志總量,再計(jì)算總平均數(shù)。第二十二頁,共六十五頁,2022年,8月28日
[例3-12]
利用表3-2數(shù)據(jù)計(jì)算算術(shù)平均數(shù)。第二十三頁,共六十五頁,2022年,8月28日表3-7教師平均開課門數(shù)計(jì)算表開課門數(shù)x教師數(shù)fxff/∑f(%)X*f/∑f1151517.650290.70583288432.940.98824124814.120.5648合計(jì)852071002.4353第二十四頁,共六十五頁,2022年,8月28日3.1.3.1.2加權(quán)算術(shù)平均數(shù)
[例3-13]利用表3-3的數(shù)據(jù)計(jì)算算術(shù)平均數(shù)。
解:依題意得:所以,這3000戶農(nóng)民家庭平均年人均純收入是1596元。第二十五頁,共六十五頁,2022年,8月28日表3-8農(nóng)民家庭平均年人均純收入計(jì)算表年人均純收入(元)組中值x農(nóng)民家庭數(shù)(戶)fxf1000-120011002402640001200-140013004806240001400-16001500105015750001600-1800170060010200001800-200019002705130002000-220021002104410002200-240023001202760002400-260025003075000合計(jì)__30004788000第二十六頁,共六十五頁,2022年,8月28日計(jì)算加權(quán)算術(shù)平均數(shù)需要注意的問題
加權(quán)算術(shù)平均數(shù)的大小受兩個(gè)因素的影響:一是變量值大?。欢歉鹘M次數(shù)占總次數(shù)比重即頻率的影響。
加權(quán)算術(shù)平均數(shù)中的權(quán)數(shù),指的就是標(biāo)志值出現(xiàn)的次數(shù)或各組次數(shù)占總次數(shù)的比重。在計(jì)算平均數(shù)時(shí),各組次數(shù)具有權(quán)衡各組變量值輕重的作用,出現(xiàn)次數(shù)多的標(biāo)志值對(duì)平均數(shù)的形成影響大些,出現(xiàn)次數(shù)少的標(biāo)志值對(duì)平均數(shù)的形成影響小些。即,在一個(gè)數(shù)列中,當(dāng)標(biāo)志值較大的單位數(shù)居多時(shí),平均數(shù)就會(huì)趨近標(biāo)志值大的一方;當(dāng)標(biāo)志值較小的單位數(shù)居多時(shí),平均數(shù)就趨近標(biāo)志值小的一方;當(dāng)標(biāo)志值較大的單位數(shù)與標(biāo)志值較小的單位數(shù)基本平分時(shí),平均數(shù)居中。
可見,各組標(biāo)志值的單位數(shù)(頻數(shù))的多少對(duì)平均數(shù)的大小有權(quán)衡輕重的作用,所以稱各組單位數(shù)為權(quán)數(shù),用權(quán)數(shù)乘以各組標(biāo)志值叫加權(quán),由此計(jì)算的平均數(shù)叫加權(quán)算術(shù)平均數(shù)。注意:權(quán)數(shù)對(duì)算術(shù)平均數(shù)大小的影響程度,并不取決于權(quán)數(shù)本身數(shù)值的大小,而是取決于作為權(quán)數(shù)的各組單位數(shù)占總體單位數(shù)比重的大小,即頻率的大小。
在分組數(shù)列的條件下,當(dāng)各組標(biāo)志值出現(xiàn)的次數(shù)或各組次數(shù)所占比重均相等時(shí),權(quán)數(shù)就失去了權(quán)衡輕重的作用,這時(shí)用加權(quán)算術(shù)平均數(shù)計(jì)算的結(jié)果與用簡單算術(shù)平均數(shù)計(jì)算的結(jié)果相同,因此可以把簡單算術(shù)平均數(shù)理解為加權(quán)算術(shù)平均數(shù)當(dāng)f1=f2=…=fn時(shí)的特例。第二十七頁,共六十五頁,2022年,8月28日關(guān)于加權(quán)算術(shù)平均數(shù)的權(quán)數(shù)選擇原則
1、權(quán)數(shù)選擇的原則:
各組標(biāo)志值×各組單位數(shù)=各組標(biāo)志總量2、該等式必須有實(shí)際經(jīng)濟(jì)意義。即,權(quán)數(shù)必須是標(biāo)志值的直接承擔(dān)者,權(quán)數(shù)與標(biāo)志值的乘積要具有標(biāo)志總量的意義。
只有當(dāng)三個(gè)量之間存在著客觀的數(shù)量對(duì)等關(guān)系時(shí),各組單位數(shù)才是加權(quán)算術(shù)平均數(shù)的合適權(quán)數(shù)。實(shí)例。第二十八頁,共六十五頁,2022年,8月28日算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)
算術(shù)平均數(shù)是最重要的平均數(shù)形式,有一些非常重要的數(shù)學(xué)性質(zhì),其中最重要的數(shù)學(xué)性質(zhì)是:
1、算術(shù)平均數(shù)與標(biāo)志值個(gè)數(shù)的乘積等于各標(biāo)志值的總和。2、各個(gè)標(biāo)志值與算術(shù)平均數(shù)離差之和等于零。3、各標(biāo)志值與算術(shù)平均數(shù)離差的平方和為最小。第二十九頁,共六十五頁,2022年,8月28日3.1.3.2調(diào)和平均數(shù)(Harmonicmean)
調(diào)和平均數(shù)是集中趨勢(shì)的另一種測定指標(biāo),它是總體中各單位標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又稱“倒數(shù)平均數(shù)”。
在統(tǒng)計(jì)實(shí)踐中,調(diào)和平均數(shù)常常被作為算術(shù)平均數(shù)的變形來使用:當(dāng)因?yàn)閿?shù)據(jù)的原因不能采用算術(shù)平均數(shù)的方法計(jì)算均值時(shí),可以考慮采用調(diào)和平均數(shù)的形式。
調(diào)和平均數(shù)也有簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)兩種形式。第三十頁,共六十五頁,2022年,8月28日3.1.3.2.1簡單調(diào)和平均數(shù)
簡單調(diào)和平均數(shù)是各個(gè)標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。計(jì)算公式如下:第三十一頁,共六十五頁,2022年,8月28日[例3-16]某種蔬菜早市、午市和晚市的價(jià)格
分別為0.7、0.68和0.74元,各買一元,求其平均
價(jià)格。第三十二頁,共六十五頁,2022年,8月28日3.1.3.2.2加權(quán)調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)的計(jì)算公式為:式中,m表示各單位或各組的標(biāo)志值對(duì)應(yīng)的標(biāo)志總量。第三十三頁,共六十五頁,2022年,8月28日[例3-17]某種蔬菜價(jià)格和成交量資料如表3-10,求該種蔬菜一天的平均價(jià)格。
第三十四頁,共六十五頁,2022年,8月28日3.1.3.3幾何平均數(shù)(geomatricmean)
幾何平均數(shù)也稱幾何均值或?qū)?shù)平均數(shù),是一種有特定作用的平均數(shù)。幾何平均數(shù)是N個(gè)變量值(比率)連乘積的N次方根,通常用于時(shí)間上有聯(lián)系或有先后順序關(guān)系的比率求平均,凡是度量值的連乘積等于總比率或總速度的現(xiàn)象都必須使用幾何平均法計(jì)算均值。幾何平均數(shù)根據(jù)所掌握數(shù)據(jù)資料不同,有簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種方法。
幾何平均數(shù)也是算術(shù)平均數(shù)的變形,也受極端變量值的影響,適合于反映特定現(xiàn)象的平均水------現(xiàn)象的總標(biāo)志值是各單位標(biāo)志值的連乘積。但是,如果數(shù)列中有一個(gè)標(biāo)志值等于0,或者數(shù)列中有一個(gè)標(biāo)志值是負(fù)值,又要開偶次方根,就都無法計(jì)算幾何平均數(shù)。第三十五頁,共六十五頁,2022年,8月28日3.1.3.3.1簡單幾何平均數(shù)式中G表示幾何平均數(shù),
表示各項(xiàng)標(biāo)志值。簡單幾何平均數(shù)適用于計(jì)算未分組數(shù)列的平均比率或平均速度。若將變量值取對(duì)數(shù),幾何平均數(shù)就變成均值形式。第三十六頁,共六十五頁,2022年,8月28日[例3-18]某產(chǎn)品需經(jīng)四個(gè)工序的加工,已知第一工
序加工合格率為97%,第二個(gè)工序加工合格率為95%,第
三個(gè)工序加工合格率為96%,第四個(gè)工序加工合格率為94%,求四個(gè)工序平均加工合格率。
解:依題意得:第三十七頁,共六十五頁,2022年,8月28日3.1.3.3.2加權(quán)幾何平均數(shù)當(dāng)計(jì)算幾何平均數(shù)的各個(gè)標(biāo)志值的次數(shù)不相同時(shí),應(yīng)采用加權(quán)幾何平均數(shù)。加權(quán)幾何平均數(shù)是各標(biāo)志值fi次方的連乘積的次方根,計(jì)算公式為:第三十八頁,共六十五頁,2022年,8月28日[例3-19]某2企業(yè)2000~2002年增加值發(fā)展速度如表3-11,試計(jì)算其2000~2002年增加值平均發(fā)展速度。環(huán)比發(fā)展速度(%)x時(shí)期次數(shù)f1021990-199331041993-19985981998-199911031999-20012
第三十九頁,共六十五頁,2022年,8月28日集中趨勢(shì)測定指標(biāo)的關(guān)系
1、眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系在對(duì)稱的正態(tài)分布條件下,算術(shù)平均數(shù)=眾數(shù)=中位數(shù)。
在非對(duì)稱正態(tài)分布的情況下,眾數(shù)、中位數(shù)和平均數(shù)三者的差別取于偏斜的程度。偏斜的程度越大(?。?,它們之間的差別越大(?。.?dāng)次數(shù)分配呈右偏時(shí),算術(shù)平均數(shù)>中位數(shù)>眾數(shù);當(dāng)次數(shù)分配呈左偏時(shí),眾數(shù)>中位數(shù)>算術(shù)平均數(shù);一般地,中位數(shù)介于眾數(shù)和平均數(shù)之間。英國統(tǒng)計(jì)學(xué)家皮爾生(Pearson.E.S)的研究提出,在存在輕微偏斜的情況下,眾數(shù)、中位數(shù)和算術(shù)平均數(shù)數(shù)量關(guān)系的經(jīng)驗(yàn)公式:算術(shù)平均數(shù)和眾數(shù)的距離約等于算術(shù)平均數(shù)與中位數(shù)距離的三倍。2、算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的關(guān)系在相同的數(shù)據(jù)中,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)在數(shù)值是的關(guān)系如下:調(diào)和平均數(shù)≤幾何平均數(shù)≤算術(shù)平均數(shù)。第四十頁,共六十五頁,2022年,8月28日計(jì)算和應(yīng)用集中趨勢(shì)測定指標(biāo)應(yīng)注意的問題
1、集中趨勢(shì)的測定指標(biāo)只能應(yīng)用于同質(zhì)總體。集中趨勢(shì)是總體中的所有數(shù)據(jù)向中心靠攏的程度,位置平均數(shù)和數(shù)值平均數(shù)作為總體的特征值,反映的是總體各單位的一般水平和集中趨勢(shì),只有在同質(zhì)總體中應(yīng)用才有意義,否則就會(huì)失真。
2、用組平均數(shù)和分配數(shù)列補(bǔ)充說明總平均數(shù)。平均數(shù)是一個(gè)高度概括性的數(shù)值,它抽象了總體中各數(shù)據(jù)的差異。為使總體信息即有綜合又保真,可以用分配數(shù)列和各組的平均數(shù)來總體具體情況,以顯示被平均數(shù)抽象掉的各單位差異及其分布。3、集中趨勢(shì)指標(biāo)與離中趨勢(shì)指標(biāo)及具體分析相結(jié)合??傮w除了集中趨勢(shì)特征外,還具有與集中趨勢(shì)相反的特征——離中趨勢(shì),研究中對(duì)總體的不同層面、不同方向的特征值都進(jìn)行剖析,相互補(bǔ)充,會(huì)使分析更透徹、全面。此外,集中趨勢(shì)指標(biāo)與典型事例相結(jié)合,具體問題具體分析。第四十一頁,共六十五頁,2022年,8月28日3.2.1測定離散趨勢(shì)的主要指標(biāo)及其作用
離散程度的主要指標(biāo)有極差、平均差、四分位差、方差和標(biāo)準(zhǔn)差以及離散系數(shù)等,在實(shí)踐中有重大作用。
1、反映現(xiàn)象總體中變量分布的離中趨勢(shì)總體各單位的標(biāo)志值存在差異,標(biāo)志變動(dòng)度表明總體各單位標(biāo)志值的分散程度。變量值的差異越大,離中趨勢(shì)也越大;反之,變量值越小,離中趨勢(shì)也就越小。
2、衡量均值的代表性均值作為總體數(shù)量標(biāo)志的代表值,其代表性取決于總體各數(shù)據(jù)的差異程度。當(dāng)總體中各數(shù)據(jù)的變異程度越大,均值的代表性就越小;反之,總體中各數(shù)據(jù)的變異程度越小,均值的代表性就越大。
3、測定現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度離散程度能夠表明生產(chǎn)過程的節(jié)奏性和其他活動(dòng)的均衡性,可作為企業(yè)產(chǎn)品質(zhì)量控制和評(píng)價(jià)經(jīng)濟(jì)管理工作的依據(jù)。第四十二頁,共六十五頁,2022年,8月28日3.2.2.1極差極差又稱全距,離散程度的最簡單測度值,是最大和最小觀測值之間的距離。
式中,Umax代表最高組的上限;Lmin代表最低組的下限。用極差描述資料的離散程度簡單明了,但它僅僅測度了兩個(gè)端點(diǎn)數(shù)值,沒有考察中間位置上的數(shù)值,沒有考慮數(shù)據(jù)的分布特征,不能反映觀察值的整個(gè)離散程度。特別當(dāng)總體存在極端數(shù)值時(shí),極差就完全受極端數(shù)值的影響,缺乏全面性。第四十三頁,共六十五頁,2022年,8月28日3.2.2.2異眾比率異眾比率又稱離異比率或變差比,是指非眾數(shù)的次數(shù)與全部變量值總次數(shù)的比率。異眾比率是描述數(shù)據(jù)離散程度的測定值之一,在對(duì)數(shù)據(jù)數(shù)量變動(dòng)規(guī)律進(jìn)行研究時(shí),與眾數(shù)結(jié)合使用。其計(jì)算公式為:
式中:Vr是異眾比率,是變量值的總次數(shù),是眾數(shù)組的次數(shù)。事實(shí)上異眾比率是一個(gè)相對(duì)數(shù),更具體講是一個(gè)比例相對(duì)數(shù)。它所描述的是非眾數(shù)的數(shù)據(jù)次數(shù)占數(shù)據(jù)總次數(shù)的比重,它與眾數(shù)的數(shù)據(jù)次數(shù)占總體總次數(shù)的比重之和為1。異眾比率可以用于定類數(shù)據(jù)。第四十四頁,共六十五頁,2022年,8月28日3.2.2.3四分位差(quartiledeviation
)分位差是極差的一種改進(jìn),它是從分配數(shù)列中剔除了一部分極端數(shù)值后確定的、反映數(shù)據(jù)之間差異情況的指標(biāo)。經(jīng)常使用的分位差有四分位差、八分位差、16分位差、32分位差以及百分位差等,以四分位差最為多見。
四分位差是在數(shù)列中剔除最大和最小各四分之一的數(shù)據(jù),是第一和第三個(gè)四分位數(shù)之間距離的二分之一,表明中位數(shù)到這兩個(gè)四分位數(shù)的平均距離,是說明中位數(shù)代表性高低的測量值。四分位差計(jì)算公式為:
式中:QD表示四分位差,Q3、Q1分別為第三個(gè)、第一個(gè)四位數(shù)。第四十五頁,共六十五頁,2022年,8月28日3.2.2.4平均差(MeanAbsoluteDeviation)
平均差是分配數(shù)列中各單位標(biāo)志值與其算術(shù)平均數(shù)之間離差絕對(duì)值的平均數(shù),反映總體各單位標(biāo)志值的平均差異(離散)程度。一般用MD表示。由于掌握的數(shù)據(jù)不同,平均差的計(jì)算可分為簡單平均差和加權(quán)平均差兩種形式。即:1、未分組數(shù)列:
2、分組數(shù)列:
平均差考慮到了數(shù)列中各個(gè)標(biāo)志值的變異程度對(duì)整個(gè)數(shù)列變異程度的影響,因此,比較全面、客觀地反映了數(shù)列的變異程度。但是平均差在計(jì)算中,為了保證正、負(fù)總體中的各變量值與算術(shù)平均數(shù)的離差和不至于在計(jì)算中相互抵消為零,對(duì)離差取了絕對(duì)值,這在數(shù)學(xué)處理上有困難,不符合代數(shù)方法演算,具有局限性。第四十六頁,共六十五頁,2022年,8月28日3.2.3方差(variance)與標(biāo)準(zhǔn)差(StandardDeviation
方差與標(biāo)準(zhǔn)差是測定離散程度最常用的指標(biāo)。標(biāo)準(zhǔn)差是方差的平方根,也稱均方差。方差與標(biāo)準(zhǔn)差利用了算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì),因此是離散程度最靈敏的指標(biāo),實(shí)踐中應(yīng)用十分廣泛。
方差和標(biāo)準(zhǔn)差的思路與平均差基本相同,只是在數(shù)學(xué)處理方法上與平均差不同:對(duì)于總體中各變量值與算術(shù)平均數(shù)的正負(fù)離差相互抵消為零的問題,平均差采用取絕對(duì)值的方法來避免。而方差則是采用平方的方法來避免。然后再對(duì)離差的平方計(jì)算算術(shù)平均數(shù),并開方取其正根,求出標(biāo)準(zhǔn)差。第四十七頁,共六十五頁,2022年,8月28日3.2.3.1數(shù)量標(biāo)志的方差與標(biāo)準(zhǔn)差1、未分組數(shù)列的計(jì)算公式:
2、分組數(shù)列的計(jì)算公式:
式中,表示方差;表示標(biāo)準(zhǔn)差。
方差和標(biāo)準(zhǔn)差一般用于定序數(shù)據(jù)和定比數(shù)據(jù)。第四十八頁,共六十五頁,2022年,8月28日
[例3-23]兩種不同水稻品種在不同的田塊上試種,產(chǎn)量資料如表3-12所示。要求:⑴分別計(jì)算兩種品種的單位面積產(chǎn)量。⑵計(jì)算兩種品種畝產(chǎn)量的方差和標(biāo)準(zhǔn)差。
表3-12兩種水稻品種產(chǎn)量資料表甲品種乙品種田塊面積(畝)產(chǎn)量(公斤)田塊面積(畝)產(chǎn)量(公斤)1.2661.58401.14951.47701.04451.25400.95401.05200.84200.9450第四十九頁,共六十五頁,2022年,8月28日表3-13計(jì)算表
xfxfxfxf5001.2600005601.58404024004501.1495-5027005501.47703012604451.0445-5530255201.0520006000.954010090004501.2540-7058805250.8420255005000.9450-20360合計(jì)5.02500—15275合計(jì)6.03120—9900第五十頁,共六十五頁,2022年,8月28日解:依題意得:計(jì)算結(jié)果說明,甲品種水稻的平均畝產(chǎn)量為500公斤,平均誤差55.3公斤;乙品種水稻的平均畝產(chǎn)量為520公斤,平均誤差40.6公斤。第五十一頁,共六十五頁,2022年,8月28日3.2.3.2是非標(biāo)志的方差與標(biāo)準(zhǔn)差
用“1”表示“是”的變量值,用“0”表示“非”的變量值,則:是非標(biāo)志的方差、標(biāo)準(zhǔn)差,當(dāng)p=q=0.5時(shí)取得最大值,方差最大值為0.25,標(biāo)準(zhǔn)差最大值為0.5,也就是說,此時(shí)是非標(biāo)志的變異程度最大。第五十二頁,共六十五頁,2022年,8月28日方差與標(biāo)準(zhǔn)差的數(shù)學(xué)性質(zhì)1、變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方。2、變量對(duì)算術(shù)平均數(shù)的方差小于對(duì)任意常數(shù)的方差
3、n個(gè)同性質(zhì)獨(dú)立變量和的方差等于各個(gè)變量方差的和。4、n個(gè)同性質(zhì)獨(dú)立變量平均數(shù)的方差等于各變量方差平均數(shù)的1/n。
5、變量線性變換的方差等于變量的方差乘以變量系數(shù)的平方。第五十三頁,共六十五頁,2022年,8月28日3.2.4離散系數(shù)
前述的變異指標(biāo)都是有量綱的量,它們的大小不僅取決于總體數(shù)據(jù)的差異程度,而且還與標(biāo)志值的大小有關(guān)。當(dāng)分析比較兩類不同現(xiàn)象或具有不同平均水平數(shù)據(jù)的變異程度時(shí),就必須采用離散程度的相對(duì)數(shù)——離散系數(shù)來反映。離散系數(shù)又稱為變異系數(shù)是一個(gè)無量綱的量。它是數(shù)量數(shù)據(jù)的各離散程度指標(biāo)與其算術(shù)平均數(shù)的比值。如,將標(biāo)準(zhǔn)差與其平均數(shù)對(duì)比,得到標(biāo)準(zhǔn)差系數(shù),等等。其計(jì)算公式為:
變異系數(shù)=變異指標(biāo)/算術(shù)平均數(shù)最常用的變異系數(shù)是標(biāo)準(zhǔn)差系數(shù):第五十四頁,共六十五頁,2022年,8月28日3.3變量分布偏度與峰度的描述3.3.1矩3.3.2偏度3.3.3峰度第五十五頁,共六十五頁,2022年,8月28日3.3.1矩
矩也稱為動(dòng)差。它是總體中所有變量值與任意常數(shù)離差K次方的算術(shù)平均數(shù)。1.基本形式1)未分組數(shù)據(jù):2)分組數(shù)據(jù):
式中,k為任意正整數(shù),a為常數(shù)。第五十六頁,共六十五頁,2022年,8月28日2.原點(diǎn)矩若a=0,即變量x關(guān)于原點(diǎn)的k階矩——k階原點(diǎn)矩。
1)未分組數(shù)據(jù):
2)分組數(shù)據(jù):
顯然,一階原點(diǎn)矩就是變量的算術(shù)平均數(shù),二階原點(diǎn)矩就是變量平方的算術(shù)平均數(shù)。第五十七頁,共六十五頁,2022年,8月28日3.中心矩
若a=,就得到變量x關(guān)于分布中心的k階矩——k階中心矩。1)未分組數(shù)據(jù):
2)分組數(shù)據(jù):
可見,一階中心矩為0,二階中心矩就是方差。
第五十八頁,共六十五頁,2022年,8月28日3.3.2偏度偏度指分布不對(duì)稱的方向和程度。偏度指標(biāo)是三階中心動(dòng)差除以標(biāo)準(zhǔn)差三次方。其計(jì)算公式:當(dāng)α=0時(shí),數(shù)列分布為正態(tài)分布。當(dāng)α≠0時(shí),數(shù)列分布有便斜,且便斜程度隨著α絕對(duì)值的增大而增大。當(dāng)α>0時(shí),表示大于平均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合格的企業(yè)合同 管理
- 通信工程專業(yè)合同條款
- 《蜜蜂導(dǎo)學(xué)案》課件
- 2025年衡陽貨運(yùn)從業(yè)資格證考試試題及答案
- 2025年廣東從業(yè)資格證貨運(yùn)題庫答案
- 公園建筑施工合同
- 精密儀器煙囪安裝合同模板
- 大數(shù)據(jù)項(xiàng)目招投標(biāo)要點(diǎn)
- 超市廁所改造施工合同范本
- 高速公路照明安全管理辦法
- 新產(chǎn)品開發(fā)市場風(fēng)險(xiǎn)評(píng)估與防范措施可行性研究報(bào)告
- 玩轉(zhuǎn)計(jì)算機(jī)網(wǎng)絡(luò)-計(jì)算機(jī)網(wǎng)絡(luò)原理智慧樹知到課后章節(jié)答案2023年下青島大學(xué)
- 犯罪現(xiàn)場勘察題庫(348道)
- 竣工財(cái)務(wù)決算審計(jì)工作方案
- 貴陽市云巖區(qū)2023-2024學(xué)年數(shù)學(xué)三年級(jí)第一學(xué)期期末綜合測試試題含答案
- Stevens-Johnson綜合征及中毒性表皮壞死松解癥課件
- 學(xué)前兒童健康教育與活動(dòng)指導(dǎo)(第2版)高職PPT完整全套教學(xué)課件
- 理論力學(xué)-上海交通大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- 風(fēng)景背后的地貌學(xué)-華中師范大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- 消防聯(lián)動(dòng)測試記錄表
- 【教師必備】部編版四年級(jí)語文上冊(cè)第二單元【集體備課】
評(píng)論
0/150
提交評(píng)論