離散趨勢的測量演示文稿_第1頁
離散趨勢的測量演示文稿_第2頁
離散趨勢的測量演示文稿_第3頁
離散趨勢的測量演示文稿_第4頁
離散趨勢的測量演示文稿_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

離散趨勢的測量演示文稿現(xiàn)在是1頁\一共有100頁\編輯于星期四(優(yōu)選)離散趨勢的測量現(xiàn)在是2頁\一共有100頁\編輯于星期四二、變異指標(biāo)的概念在統(tǒng)計研究中,通常把一組數(shù)值之間的差異程度叫做標(biāo)志變動度。測定標(biāo)志變動度大小的指標(biāo)叫做標(biāo)志變異指標(biāo)。標(biāo)志變動度與標(biāo)志變異指標(biāo)在數(shù)值上成正比。如果說平均指標(biāo)說明總體分布的集中趨勢的話,標(biāo)志變異指標(biāo)則說明總體分布的離中趨勢?,F(xiàn)在是3頁\一共有100頁\編輯于星期四三、變異指標(biāo)的作用變異指標(biāo)是描述數(shù)據(jù)分布的一個很重要的特征值,因此,它在統(tǒng)計分析、統(tǒng)計推斷中具有很重要的作用。具體可以概括為以下幾點(diǎn):現(xiàn)在是4頁\一共有100頁\編輯于星期四1.反映總體各單位變量值分布的均衡性一般來說,標(biāo)志變異指標(biāo)數(shù)值越大,總體各單位變量值分布的離散趨勢越高、均衡性越低,反之,變量值分布的的離散趨勢越低、均衡性就越高。

現(xiàn)在是5頁\一共有100頁\編輯于星期四2.判斷平均指標(biāo)對總體各單位變量值代表性的高低平均指標(biāo)作為總體各單位某一數(shù)量標(biāo)志的代表值,其代表性的高低與總體差異程度有直接關(guān)系:總體的標(biāo)志變異指標(biāo)值愈大,平均數(shù)的代表性愈低;反之,標(biāo)志變異指標(biāo)值愈小,平均數(shù)代表性愈高。另一方面,平均指標(biāo)代表性的高低同總體各單位變量值分布的均衡性也有直接關(guān)系:總體各單位變量值分布的均衡性越高,平均指標(biāo)代表性就越高;反之,總體各單位變量值分布的均衡性越低,平均指標(biāo)代表性就越低?,F(xiàn)在是6頁\一共有100頁\編輯于星期四3.在實(shí)際工作中,借助標(biāo)志變異指標(biāo)還可以對社會經(jīng)濟(jì)活動過程的節(jié)奏性和均衡性進(jìn)行評價4.標(biāo)志變異指標(biāo)是衡量風(fēng)險大小的重要指標(biāo)?,F(xiàn)在是7頁\一共有100頁\編輯于星期四四、變異指標(biāo)的分類變異指標(biāo)按數(shù)量關(guān)系來分有以下兩類:凡用絕對數(shù)來表達(dá)的變異指標(biāo),統(tǒng)稱絕對離勢,主要有極差、平均差、四分位差、標(biāo)準(zhǔn)差等。凡用相對數(shù)來表達(dá)的變異指標(biāo),統(tǒng)稱相對離勢,主要有異眾比率、標(biāo)準(zhǔn)差系數(shù)、平均差系數(shù)和一些常用的偏態(tài)系數(shù)。現(xiàn)在是8頁\一共有100頁\編輯于星期四第二節(jié)、全距與四分位差一、全距1、未分組資料計算公式全距又稱極差,是一組數(shù)據(jù)的最大值與最小值之差,用表示。計算公式為:

式中,、分別表示為一組數(shù)據(jù)的最大值與最小值。由于全距是根據(jù)一組數(shù)據(jù)的兩個極值表示的,所以全距表明了一組數(shù)據(jù)數(shù)值的變動范圍。越大,表明數(shù)值變動的范圍越大,即數(shù)列中各變量值差異大,反之,越小,表明數(shù)值變動的范圍越小,即數(shù)列中各變量值差異小?,F(xiàn)在是9頁\一共有100頁\編輯于星期四[例3.12]例3.1給出的40個同學(xué)統(tǒng)計學(xué)的考試成績,其最高成績?yōu)?9分,最低成績?yōu)?6,則全距為:(分)現(xiàn)在是10頁\一共有100頁\編輯于星期四2、分組資料計算公式R=最高組上限-最低組下限R=最高組組中組-最低組組中值R=最高組組中組-最低組下限R=最高組上限-最低組組中值如果資料經(jīng)過整理,并形成組距分配數(shù)列,全距可近似表示為:

R≈最高組上限值-最低組下限值現(xiàn)在是11頁\一共有100頁\編輯于星期四3、優(yōu)缺點(diǎn):優(yōu)點(diǎn):計算簡單,易于理解。缺點(diǎn):(1)受極端值影響大,遇含開口組的資料時無法計算;(2)數(shù)據(jù)利用率低,信息喪失嚴(yán)重;(3)受抽樣變動影響大(一般大樣本的全距會比小樣本的全距大)?,F(xiàn)在是12頁\一共有100頁\編輯于星期四二、四分位差(inter-quartilerange)上四分位數(shù)與下四分位數(shù)之差的平均數(shù),稱為四分位差,亦稱為內(nèi)距或四分間距。四分位差的計算方法:Q·D=(Q3-Q1)/2現(xiàn)在是13頁\一共有100頁\編輯于星期四四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。此外,由于中位數(shù)處于數(shù)據(jù)的中間位置,因此,四分位差的大小在一定程度上也說明了中位數(shù)對一組數(shù)據(jù)的代表程度?,F(xiàn)在是14頁\一共有100頁\編輯于星期四[例3.2]在某城市中隨機(jī)抽取9個家庭,調(diào)查得到每個家庭的人均月收入數(shù)據(jù)如下(單位:元),1500、750、780、1080、850、960、2000、1250、1630,計算人均月收入的四分位數(shù)?,F(xiàn)在是15頁\一共有100頁\編輯于星期四解:,即QL在第2個數(shù)值(780)和第3個數(shù)值(850)之間0.5的位置上,因此QL=(780+850)÷2=815(元),即QU在第7個數(shù)值(1500)和第8個數(shù)值(1630)之間0.5的位置上,因此現(xiàn)在是16頁\一共有100頁\編輯于星期四QU=(1500+1630)÷2=1565(元)QL和QU之間包含了50%的數(shù)據(jù),因此,我們可以說有一半的家庭人均月收入在815~1565元之間。根據(jù)例3.2資料計算上下四分位數(shù),那么家庭人均月收入的四分位差為:QU—QL=?現(xiàn)在是17頁\一共有100頁\編輯于星期四上四分位數(shù)下四分位數(shù):數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算公式)現(xiàn)在是18頁\一共有100頁\編輯于星期四四分位差主要用于測度順序數(shù)據(jù)的離散程度。當(dāng)然,對于數(shù)值型數(shù)據(jù)也可以計算四分位差,但不適合于分類數(shù)據(jù)。優(yōu)缺點(diǎn):主要是避免了全距受極端值影響的缺點(diǎn),其他優(yōu)缺點(diǎn)同全距:數(shù)據(jù)利用率低,信息喪失嚴(yán)重;受抽樣變動影響大。現(xiàn)在是19頁\一共有100頁\編輯于星期四第三節(jié)、平均差(Meandeviation)平均差是各變量值與其算術(shù)平均數(shù)離差絕對值的平均數(shù),用A.D表示。根據(jù)掌握資料的不同,平均差有以下兩種計算方法:1.簡單平均法對于未分組資料,采用簡單平均法。其計算公式為:現(xiàn)在是20頁\一共有100頁\編輯于星期四[例3.13]某廠甲、乙兩組工人生產(chǎn)某種產(chǎn)品的產(chǎn)量資料如表3.8所示。現(xiàn)在是21頁\一共有100頁\編輯于星期四現(xiàn)在是22頁\一共有100頁\編輯于星期四從計算結(jié)果看,甲、乙兩組平均生產(chǎn)件數(shù)相等,但由于甲組的平均差(1.2件)小于乙組的平均差(16件),因而其平均數(shù)的代表性比乙組大?,F(xiàn)在是23頁\一共有100頁\編輯于星期四2.加權(quán)平均法在資料分組的情況下,應(yīng)采用加權(quán)平均式:現(xiàn)在是24頁\一共有100頁\編輯于星期四現(xiàn)在是25頁\一共有100頁\編輯于星期四現(xiàn)在是26頁\一共有100頁\編輯于星期四平均差計算簡便,意義明確,而且平均差是根據(jù)所有變量值計算的,每個數(shù)據(jù)均參與了計算,因此它能夠準(zhǔn)確地、全面地反映一組數(shù)值的變異程度。但是,由于平均差是用絕對值進(jìn)行運(yùn)算的,它不適宜于代數(shù)形式處理,所以在實(shí)際應(yīng)用上受到很大的限制。現(xiàn)在是27頁\一共有100頁\編輯于星期四第四節(jié)、方差和標(biāo)準(zhǔn)差(Variance、Standarddeviation)一、概念要點(diǎn)方差和標(biāo)準(zhǔn)差同平均差一樣,也是根據(jù)全部數(shù)據(jù)計算的,反映每個數(shù)據(jù)與其算術(shù)平均數(shù)相比平均相差的數(shù)值,因此它能準(zhǔn)確地反映出數(shù)據(jù)的差異程度。但與平均差不同之處是在計算時的處理方法不同,平均差是取離差的絕對值消除正負(fù)號,而方差、標(biāo)準(zhǔn)差是取離差的平方消除正負(fù)號,這更便于數(shù)學(xué)上的處理。因此,方差、標(biāo)準(zhǔn)差是實(shí)際中應(yīng)用最廣泛的離中程度度量值。由于總體的方差、標(biāo)準(zhǔn)差與樣本的方差、標(biāo)準(zhǔn)差在計算上有所區(qū)別,因此下面分別加以介紹?,F(xiàn)在是28頁\一共有100頁\編輯于星期四1、方差是個變量值與其均值離差平方的平均數(shù),標(biāo)準(zhǔn)差是方差的開方。

2、離散程度的測度值之一。

3、最常用的測度值。

4、反映了數(shù)據(jù)的分布。5、反映了各變量值與均值的平均差異。6、根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差。根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差?,F(xiàn)在是29頁\一共有100頁\編輯于星期四二、總體的方差和標(biāo)準(zhǔn)差設(shè)總體的方差為,標(biāo)準(zhǔn)差為,對于未分組整理的原始資料,方差和標(biāo)準(zhǔn)差的計算公式分別為:現(xiàn)在是30頁\一共有100頁\編輯于星期四現(xiàn)在是31頁\一共有100頁\編輯于星期四現(xiàn)在是32頁\一共有100頁\編輯于星期四現(xiàn)在是33頁\一共有100頁\編輯于星期四現(xiàn)在是34頁\一共有100頁\編輯于星期四現(xiàn)在是35頁\一共有100頁\編輯于星期四(二)樣本的方差和標(biāo)準(zhǔn)差樣本的方差、標(biāo)準(zhǔn)差與總體的方差、標(biāo)準(zhǔn)差在計算上有所差別??傮w的方差和標(biāo)準(zhǔn)差在對各個離差平方平均時是除以數(shù)據(jù)個數(shù)或總頻數(shù),而樣本的方差和標(biāo)準(zhǔn)差在對各個離差平方平均時是用樣本數(shù)據(jù)個數(shù)或總頻數(shù)減1去除總離差平方和?,F(xiàn)在是36頁\一共有100頁\編輯于星期四現(xiàn)在是37頁\一共有100頁\編輯于星期四現(xiàn)在是38頁\一共有100頁\編輯于星期四現(xiàn)在是39頁\一共有100頁\編輯于星期四(三)是非標(biāo)志的方差與標(biāo)準(zhǔn)差在實(shí)際生活中,有些事物或現(xiàn)象的特征只表現(xiàn)為兩種性質(zhì)上的差異,例如,產(chǎn)品的質(zhì)量表現(xiàn)為合格或不合格,人的性別表現(xiàn)為男或女,人們對某種意見表示為同意或不同意;對學(xué)生考試成績分為及格和不及格,等等。這些只表現(xiàn)為是與否、有或無的標(biāo)志,稱為是非標(biāo)志,也稱為交替標(biāo)志。在進(jìn)行抽樣估計時,是非標(biāo)志的方差或標(biāo)準(zhǔn)差具有很重要的意義?,F(xiàn)在是40頁\一共有100頁\編輯于星期四1.成數(shù)(比例)如前所述,是非標(biāo)志只有兩種表現(xiàn),我們把總體中或樣本中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部單位數(shù)的比重稱為成數(shù),它反映了總體或樣本中“是”與“非”的構(gòu)成,并且代表著兩種表現(xiàn)或性質(zhì)各反復(fù)出現(xiàn)的程度,即頻率。例如,某一批產(chǎn)品,合格品占95%,不合格品占5%。在這里。95%和5%均為成數(shù)。現(xiàn)在是41頁\一共有100頁\編輯于星期四現(xiàn)在是42頁\一共有100頁\編輯于星期四

2.是非標(biāo)志的平均數(shù)是非標(biāo)志是一種品質(zhì)標(biāo)志,其表現(xiàn)為文字。因此,在計算平均數(shù)時,首先需要將文字表現(xiàn)進(jìn)行數(shù)量化處理。用“1”表示具有某種表現(xiàn),用“0”表示不具有某種表現(xiàn),然后以“1”和“0”作為變量值,計算加權(quán)算術(shù)平均數(shù)?,F(xiàn)以總體為例予以說明?,F(xiàn)在是43頁\一共有100頁\編輯于星期四現(xiàn)在是44頁\一共有100頁\編輯于星期四3.是非標(biāo)志的方差與標(biāo)準(zhǔn)差將經(jīng)過量化處理的是非標(biāo)志的表現(xiàn)“1”和“0”作為變量值代入總體的方差計算公式:現(xiàn)在是45頁\一共有100頁\編輯于星期四現(xiàn)在是46頁\一共有100頁\編輯于星期四[例3.17]從一批產(chǎn)品中隨機(jī)抽取100件產(chǎn)品進(jìn)行質(zhì)量測試,測試的結(jié)果為96件合格,4件不合格,試計算成數(shù)的方差和標(biāo)準(zhǔn)差?,F(xiàn)在是47頁\一共有100頁\編輯于星期四是非標(biāo)志的方差、標(biāo)準(zhǔn)差,當(dāng)時取得最大值,方差最大值為0.25,標(biāo)準(zhǔn)差最大值為0.5,也就是說,此時是非標(biāo)志的變異程度最大。如某學(xué)生群體中男生數(shù)和女生數(shù)相等,即男女生的成數(shù)均為0.5(50%),說明該學(xué)生群體性別差異程度最大。是非標(biāo)志的方差、標(biāo)準(zhǔn)差的最小值均為0。現(xiàn)在是48頁\一共有100頁\編輯于星期四4.方差的數(shù)學(xué)性質(zhì)現(xiàn)在是49頁\一共有100頁\編輯于星期四現(xiàn)在是50頁\一共有100頁\編輯于星期四第五節(jié)、標(biāo)準(zhǔn)分

(Standardscore)相對位置的度量:標(biāo)準(zhǔn)分?jǐn)?shù)有了均值和標(biāo)準(zhǔn)差之后,我們可以計算一組數(shù)據(jù)中各個數(shù)值的標(biāo)準(zhǔn)分?jǐn)?shù),以測度每個數(shù)據(jù)在該組數(shù)據(jù)中的相對位置,并可以用它來判斷一組數(shù)據(jù)是否有離群值?,F(xiàn)在是51頁\一共有100頁\編輯于星期四1、定義。變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,稱為標(biāo)準(zhǔn)分?jǐn)?shù),也稱標(biāo)準(zhǔn)化值或Z值。現(xiàn)在是52頁\一共有100頁\編輯于星期四標(biāo)準(zhǔn)分?jǐn)?shù)也給出了一組數(shù)據(jù)中各數(shù)值的相對位置。比如,如果某個數(shù)值的標(biāo)準(zhǔn)分?jǐn)?shù)為-2,我們就知道該數(shù)值低于均值2倍的標(biāo)準(zhǔn)差。(4.4.21)式也就是我們常用的統(tǒng)計標(biāo)準(zhǔn)化公式,在對多個具有不同量綱的變量進(jìn)行處理時,常常需要對各變量數(shù)值進(jìn)行標(biāo)準(zhǔn)化處理?,F(xiàn)在是53頁\一共有100頁\編輯于星期四【例3.18】根據(jù)例3.2的數(shù)據(jù),計算每個家庭人均收入的標(biāo)準(zhǔn)分?jǐn)?shù)。在某城市中隨機(jī)抽取9個家庭,調(diào)查得到每個家庭的人均月收入數(shù)據(jù)如下(單位:元),1500、750、780、1080、850、960、2000、1250、1630,計算每個家庭人均收入的標(biāo)準(zhǔn)分?jǐn)?shù)?,F(xiàn)在是54頁\一共有100頁\編輯于星期四現(xiàn)在是55頁\一共有100頁\編輯于星期四(3.40)

實(shí)際上,z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變該組數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?、標(biāo)準(zhǔn)差為1。

現(xiàn)在是56頁\一共有100頁\編輯于星期四經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對稱分布時——約有68.27%的數(shù)據(jù)在平均數(shù)加減1個標(biāo)準(zhǔn)差的范圍內(nèi)——約有95.45%的數(shù)據(jù)在平均數(shù)加減2個標(biāo)準(zhǔn)差的范圍內(nèi)——約有99.73%的數(shù)據(jù)在平均數(shù)加減3個標(biāo)準(zhǔn)差的范圍內(nèi)。由此可見,一組數(shù)據(jù)中低于或高于平均數(shù)3個標(biāo)準(zhǔn)差以上的數(shù)據(jù)很少。因此,在統(tǒng)計上,往往將平均數(shù)3個標(biāo)準(zhǔn)差以外的數(shù)據(jù)稱為異常值或離群值?,F(xiàn)在是57頁\一共有100頁\編輯于星期四2、標(biāo)準(zhǔn)分的特性(1)對于給定資料,由于算術(shù)平均數(shù)和標(biāo)準(zhǔn)差都是確定值,所以z是和X一一對應(yīng)的變量。(2)它沒有單位,是一個不受原資料單位影響的相對數(shù),因而也適用于不同單位資料的比較。(3)均值和方差不同的正態(tài)分布經(jīng)Z分?jǐn)?shù)標(biāo)準(zhǔn)化后,可以轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,所以Z又稱標(biāo)準(zhǔn)正態(tài)變量。(4)Z分?jǐn)?shù)的數(shù)學(xué)特性:Z分?jǐn)?shù)之和等于0;Z分?jǐn)?shù)的算術(shù)平均數(shù)等于0;Z分?jǐn)?shù)的標(biāo)準(zhǔn)差和方差均為1?,F(xiàn)在是58頁\一共有100頁\編輯于星期四3、標(biāo)準(zhǔn)分的主要作用:標(biāo)準(zhǔn)分?jǐn)?shù)的作用主要在兩個方面,一是可以表明原始數(shù)據(jù)在總體分布中的相對位置,二是可以對不同分布的各原始數(shù)據(jù)進(jìn)行比較。(1)確定原始數(shù)據(jù)在總體分布中的位置。如某縣的年人均收入為286元,標(biāo)準(zhǔn)差是62元。該縣某村的年人均收入為348元,那么該村在全縣中的位置怎樣?我們計算它的標(biāo)準(zhǔn)分?jǐn)?shù)為1,我們將標(biāo)準(zhǔn)分?jǐn)?shù)和書后所附的標(biāo)準(zhǔn)正態(tài)分布表聯(lián)系在一起,可以查出Z=1在總體中的相對位置是0.84,也就是說全縣有84%的村子其年均收入低于該村,有16%的村子高于該村。這就是它的年人均收入在全縣所所處的位置。現(xiàn)在是59頁\一共有100頁\編輯于星期四(2)對不同分布的各原始數(shù)據(jù)進(jìn)行比較。如果是不同縣的兩個村,甲村的情況和上例相同,乙村的年人均收入是275元,但乙村所在的縣其年均收入是225元,標(biāo)準(zhǔn)差是25元。從絕對值看,甲村的收入高于乙村,但通過標(biāo)準(zhǔn)正態(tài)分布表可以查出Z=2在總體中的相對位置是0.977。因?yàn)閆乙=2>Z甲=1,所以乙村在當(dāng)?shù)氐南冗M(jìn)程度比甲村更高。

現(xiàn)在是60頁\一共有100頁\編輯于星期四標(biāo)準(zhǔn)分?jǐn)?shù)能測定相同或不同總體內(nèi)個案的相對位置,并進(jìn)行比較,所以是比較分析的有力工具。[例]假設(shè)某考生在高考中,語文得110分,數(shù)學(xué)得125分。如果所有考生的語文平均分為90,標(biāo)準(zhǔn)差為10;數(shù)學(xué)平均分為100,標(biāo)準(zhǔn)差為15分。那么,相對而言這個考生哪方面能力更強(qiáng)?(如:廣東省高考中各科分?jǐn)?shù)用的是T=100Z+500。而高考成績是各科標(biāo)準(zhǔn)分的平均分。)假設(shè)只考兩門課A語文120分,數(shù)學(xué)0分;B數(shù)學(xué)120分,語文0分,按傳統(tǒng)計分辦法兩名學(xué)生成績相同,但按標(biāo)準(zhǔn)分計分A的成績就比B好?,F(xiàn)在是61頁\一共有100頁\編輯于星期四第六節(jié)離散系數(shù)相對離散程度:離散系數(shù)前面介紹的全距、平均差、方差和標(biāo)準(zhǔn)差都是反映一組數(shù)值變異程度的絕對值,其數(shù)值的大小,不僅取決于數(shù)值的變異程度,而且還與變量值水平的高低、計量單位的不同有關(guān)。所以,不宜直接利用上述變異指標(biāo)對不同水平、不同計量單位的現(xiàn)象進(jìn)行比較,應(yīng)當(dāng)先做無量綱化處理,即將上述的反映數(shù)據(jù)的絕對差異程度的變異指標(biāo)轉(zhuǎn)化為反映相對差異程度的指標(biāo),然后再進(jìn)行對比?,F(xiàn)在是62頁\一共有100頁\編輯于星期四

用離差的絕對指標(biāo)除以平均指標(biāo)來求離差的相對指標(biāo),就可以在計量單位不同或平均水平不一的對象間進(jìn)行直接比較。這種由絕對離差與其算術(shù)平均數(shù)的比值,叫變異系數(shù)?,F(xiàn)在是63頁\一共有100頁\編輯于星期四1、全距系數(shù):全距與算術(shù)平均數(shù)之比。2、平均差系數(shù):平均差與算術(shù)平均數(shù)之比。3、標(biāo)準(zhǔn)差系數(shù)(最重要和最常用的變異系數(shù))(1)標(biāo)準(zhǔn)差與其相應(yīng)的均值之比(2)消除了數(shù)據(jù)水平高低和計量單位的影響(3)測度了數(shù)據(jù)的相對離散程度(4)用于對不同組別數(shù)據(jù)離散程度的比較現(xiàn)在是64頁\一共有100頁\編輯于星期四計算公式:離散系數(shù)是反映一組數(shù)據(jù)相對差異程度的指標(biāo),是各變異指標(biāo)與其算術(shù)平均數(shù)的比值。離散系數(shù)是一個無名數(shù),可以用于比較不同數(shù)列的變異程度。離散系數(shù)通常用表示,常用的離散系數(shù)有平均差系數(shù)和標(biāo)準(zhǔn)差系數(shù),其計算公式分別為:現(xiàn)在是65頁\一共有100頁\編輯于星期四現(xiàn)在是66頁\一共有100頁\編輯于星期四[例3.19]甲乙兩組工人的平均工資分別為138.14元、176元,標(biāo)準(zhǔn)差分別為21.32元、24.67元。兩組工人工資水平離散系數(shù)計算如下:現(xiàn)在是67頁\一共有100頁\編輯于星期四從標(biāo)準(zhǔn)差來看,乙組工人工資水平的標(biāo)準(zhǔn)差比甲組大,但不能斷言,乙組平均工資的代表性小。這是因?yàn)閮山M工人的工資水平處在不同的水平上,所以不能直接根據(jù)標(biāo)準(zhǔn)差的大小作結(jié)論。而正確的方法要用消除了數(shù)列水平的離散系數(shù)比較。從兩組的離散系數(shù)可以看出,甲組相對的變異程度大于乙組,因而乙組平均工資的代表性要大。現(xiàn)在是68頁\一共有100頁\編輯于星期四某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)X1銷售利潤(萬元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表,試比較產(chǎn)品銷售額與銷售利潤的離散程度現(xiàn)在是69頁\一共有100頁\編輯于星期四X1=536.25(萬元)S1=309.19(萬元)V1=536.25309.19=0.577S2=23.09(萬元)V2=32.521523.09=0.710X2=32.5215(萬元)結(jié)論:計算結(jié)果表明,V1<V2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度現(xiàn)在是70頁\一共有100頁\編輯于星期四第七節(jié)、異眾比率非眾數(shù)組的頻數(shù)占總頻數(shù)的比率(variationratio),稱為異眾比率,用表示。異眾比率的計算公式為:式中:為變量值的總頻數(shù);為眾數(shù)組的頻數(shù)現(xiàn)在是71頁\一共有100頁\編輯于星期四異眾比率的作用是衡量眾數(shù)對一組數(shù)據(jù)的代表性程度的指標(biāo)。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重就越大,眾數(shù)的代表性就越差;反之,異眾比率越小,眾數(shù)的代表性就越好。異眾比率主要用于測度分類數(shù)據(jù)的離散程度,當(dāng)然,對于順序數(shù)據(jù)也可以計算異眾比率。現(xiàn)在是72頁\一共有100頁\編輯于星期四[例3.10]一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了紀(jì)錄。整理得不同品牌飲料的頻數(shù)分布資料如表所示,要求根據(jù)資料計算異眾比率。現(xiàn)在是73頁\一共有100頁\編輯于星期四計算結(jié)果說明在所調(diào)查的50人當(dāng)中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”來代表消費(fèi)者購買飲料品牌的狀況,其代表性不是很好。此外,利用異眾比率還可以對不同總體或樣本的離散程度進(jìn)行比較。假定我們在另一個超市對統(tǒng)一問題抽查了100人,購買可口可樂的人數(shù)為40人,則異眾比率為60%。通過比較可知,本次調(diào)查的異眾比率小于上一次調(diào)查,因此,用“可口可樂”作為消費(fèi)者購買飲料品牌的代表值比上一次調(diào)查要好些?,F(xiàn)在是74頁\一共有100頁\編輯于星期四各種離散趨勢測量指標(biāo)的適用:數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)或定比數(shù)據(jù)適用的測度值※異眾比率※四分位差

※方差或標(biāo)準(zhǔn)差—異眾比率

※離散系數(shù)(比較時用)——平均差——極差——四分位差——異眾比率現(xiàn)在是75頁\一共有100頁\編輯于星期四第八節(jié)偏度和峰度

數(shù)據(jù)分布偏態(tài)與峰度的測度指標(biāo)現(xiàn)在是76頁\一共有100頁\編輯于星期四偏度是對數(shù)據(jù)分布在偏移方向和程度所作的進(jìn)一步描述;峰度是用來對數(shù)據(jù)分布的扁平程度所做的描述。對于偏斜程度的描述用偏態(tài)系數(shù),扁平程度的描述用峰度系數(shù)。集中趨勢和離中趨勢是數(shù)據(jù)分布的兩個重要特征,但要全面了解數(shù)據(jù)分布的特點(diǎn),還需要知道數(shù)據(jù)分布的形狀是否對稱、偏斜的程度以及分布的扁平程度等。偏態(tài)和峰度就是對這些分布特征的描述?,F(xiàn)在是77頁\一共有100頁\編輯于星期四一、偏態(tài)的度量偏態(tài)是對分布偏斜方向及程度的度量。從前面的內(nèi)容中我們已經(jīng)知道,頻數(shù)分布有對稱的,有不對稱的即偏態(tài)的。在偏態(tài)的分布中,又有兩種不同的形態(tài),即左偏和右偏。我們可以利用眾數(shù)、中位數(shù)和算術(shù)平均數(shù)之間的關(guān)系判斷分布是左偏還是右偏,但要度量分布偏斜的程度,就需要計算偏態(tài)系數(shù)了。偏態(tài)系數(shù)的計算方法很多,這里僅介紹兩種?,F(xiàn)在是78頁\一共有100頁\編輯于星期四(一)由算術(shù)平均數(shù)與眾數(shù)之間的關(guān)系求偏態(tài)系數(shù)任何一個頻數(shù)分布的算術(shù)平均數(shù)與眾數(shù)之間的差異情況,與這個頻數(shù)分布的形態(tài)有固定的關(guān)系。若頻數(shù)分布是對稱的,則算術(shù)平均數(shù)等于眾數(shù);若頻數(shù)分布為右偏,則算術(shù)平均數(shù)大于眾數(shù);若頻數(shù)分布為左偏,則算術(shù)平均數(shù)小于眾數(shù)。用其二者的差量除以標(biāo)準(zhǔn)差,即可求得偏態(tài)系數(shù),現(xiàn)在是79頁\一共有100頁\編輯于星期四現(xiàn)在是80頁\一共有100頁\編輯于星期四(二)動差法動差又稱矩,原是物理學(xué)上用以表示力與力臂對重心關(guān)系的術(shù)語,這個關(guān)系和統(tǒng)計學(xué)中變量與權(quán)數(shù)對平均數(shù)的關(guān)系在性質(zhì)上很類似,所以統(tǒng)計學(xué)也用動差來說明頻數(shù)分布的性質(zhì)?,F(xiàn)在是81頁\一共有100頁\編輯于星期四現(xiàn)在是82頁\一共有100頁\編輯于星期四現(xiàn)在是83頁\一共有100頁\編輯于星期四現(xiàn)在是84頁\一共有100頁\編輯于星期四需要注意的是,計算各階原點(diǎn)動差和各階中心動差,如果依據(jù)的資料是分組資料,則應(yīng)用各組的頻數(shù)或頻率加權(quán)平均。由于中心動差計算起來比較繁雜,而計算原點(diǎn)動差相對比較簡單,通常多從原點(diǎn)動差來推算中心動差。只要展開中心動差的各項(xiàng),就容易求得它與原點(diǎn)動差的關(guān)系?,F(xiàn)在是85頁\一共有100頁\編輯于星期四現(xiàn)在是86頁\一共有100頁\編輯于星期四現(xiàn)在是87頁\一共有100頁\編輯于星期四現(xiàn)在是88頁\一共有100頁\編輯于星期四現(xiàn)在是89頁\一共有100頁\編輯于星期四從計算結(jié)果可以看出,偏態(tài)系數(shù)為正值,而且數(shù)值較大,說明該地區(qū)農(nóng)民家庭人均收入的分布為右偏分布,即人均收入較少的家庭占據(jù)多數(shù),而人均收入較高的家庭則占少數(shù),而且偏斜的程度較大。現(xiàn)在是90頁\一共有100頁\編輯于星期四二、峰度的度量峰度是用來衡量分布的集中程度或分布曲線的尖峭程度的指標(biāo)?,F(xiàn)在是91頁\一共有100頁\編輯于星期四現(xiàn)在是92頁\一共有100頁\編輯于星期四當(dāng)峰度β>0時,表示分布的形狀比正態(tài)分布更瘦更高,這意味著分布比正態(tài)分布更集中在平均數(shù)周圍,這樣的分布稱為尖峰分布,如圖3.4(a);β=0時,分布為正態(tài)分布;β<0,表示分布比正態(tài)分布更矮更胖,意味著分布比正態(tài)分布更分散,這樣的分布稱為平峰分布如圖3.4(b)?,F(xiàn)在是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論