統計學基礎第四章課件_第1頁
統計學基礎第四章課件_第2頁
統計學基礎第四章課件_第3頁
統計學基礎第四章課件_第4頁
統計學基礎第四章課件_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章 統計數據的指標描述第一節(jié) 總量指標與相對指標第一節(jié) 總量指標與相對指標一、總量指標(一)總量指標的概念總量指標是表明社會經濟現象在一定的時間、地點、條件下的規(guī)模或水平的統計指標。例如,一個國家或地區(qū)在一定時點上的人口數、土地面積數、生產設備數、物資庫存數等等(二)總量指標的分類1.時期指標和時點指標 時期指標能夠反映現象在一段時間內活動過程的成果。如工資總額,基本建設投資額,國民生產總值等;時點指標則反映現象在某一時點(瞬間)的狀況。如人口數,物資庫存量,設備臺數等。時期指標和時點指標各有不同的特點。 第一,時期指標的數值可以連續(xù)計數,它的每個數值都說明現象在這一時期內發(fā)生的總量,如一

2、年的總產值是一年四季產值的累計。而時點指標的數值只能間斷計數,它的每個數值都表示現象發(fā)展到一定時點上所處的水平。如月末職工人數,是指月末時點上的實有人數。 第二,時期指標的各期數值直接相加可以說明較長時期內現象發(fā)生的總量,而時點指標的數值直接相加除在有關指標的計算過程中需要運用外,沒有實際意義。 第三,一般來講,同一總體時期指標的數值大小與時間的長短具有直接關系,如一個季度的銷售額必然大于一個月的銷售額;而時點指標的數值大小與時點間的間隔長短沒有直接聯系。如季度末的職工人數不一定比月末的職工人數多。因此,在分析研究現象時,必須考慮現象的特點,來正確的反映事實。2.總體單位總量和總體標志總量總體

3、單位總量,是總體單位的合計數,它表示總體本身規(guī)模的大小。例如:了解商業(yè)企業(yè)的經營狀況,每個商業(yè)企業(yè)是總體單位,全部商業(yè)企業(yè)的總和就是總體單位總量指標。總體標志總量,是總體中某種標志數值的總和,它是反映總體特征的總數量的。例如:前例中,全部商業(yè)企業(yè)的銷售額、利潤額便是總體標志總量。(三)總量指標的計量單位 1、實物量單位:是根據事物的屬性和特點而采用的計量單位。自然計量單位是按照被研究現象的自然狀況來度量其數量的一種計量單位。度量衡單位是按照統一的度量衡標準對現象實物量進行度量的一種計量單位。專用單位是根據某些事物的物理化學性質專門規(guī)定的計量單位。復合單位是兩個(或多個)單位結合使用時的計量單位

4、,又分為雙重復合單位和多重復合單位兩種。標準實物單位是把那些品種、規(guī)格、性能或化學成份含量不同的同類產品,按一定的折合標準,折算為標準規(guī)格或標準含量的產品。2、價值量單位 價值量單位是用貨幣量計量總量的一種計量單位。價值量指標所使用的價格有兩種,即現行價格和不變價格。按現行價格計算的價值量指標是只按各部門實際價格計算的價值量指標。按現行價格計算的價值量指標可以反映國民經濟實際發(fā)展的狀況,并可研究生產,分配、消費、積累等國民經濟重大比例關系。二、相對指標(一)相對指標的概念相對指標也叫相對數,是兩個相互聯系的有關指標對比計算的一種比值 ( 或比率 ) 。它反映現象總體的結構、比例、程度、發(fā)展速度

5、等的對比關系。相對指標一般是無名數。通常用系數、倍數、成數、百分數、千分數表示。但也有一種相對指標表示為有名數,它是在進行對比的兩個數值帶有不同單位時產生的,因此它表現為復名數,例如人口密度就是用“人/平方公里”來表示的。( 二 ) 相對指標的作用1. 相對指標便于進行比較分析。2. 相對指標可使一些不能直接對比的現象找到共同對比的基礎。(三)相對指標的計算方法 1、計劃完成相對指標計劃完成相對指標是用來檢查、監(jiān)督計劃執(zhí)行情況的基本指標之一,常以百分數表示,又稱為計劃完成百分比。其計算公式為:例如,某商店某月計劃完成銷售額400萬元,實際完成銷售額420萬元,則其計劃完成相對指標為計算結果說明

6、該商店該月超額完成銷售額計劃5%。計劃成程度相對指標 計劃完成相對指標105% 在經濟現象的分析研究中,計劃任務數不僅可以用總量指標表示,而且可以用相對指標和平均指標表示。當計劃任務為相對指標時,其計算公式為: 計劃完成相對指標這種方法適用于考核各種現象的增長率、降低率的計劃完成情況。例如,某企業(yè)某種產品單位成本計劃規(guī)定比上期降低7%,實際單位成本比上期降低8.5%,則其計劃完成程度為:計劃完成相對指標 98.39% 2、結構相對指標結構相對指標是運用分組法,將總體內部區(qū)分為不同性質的若干部分,以部分數值與總體數值對比求得的比重或比率,它反映總體內部構成情況,表明總體中各部分所占比重大小,所以

7、,又稱比重相對數,其公式為: 結構相對數例如,2014國內生產總值636463億元,其中,第一產業(yè)增加值58332億元,第二產業(yè)增加值271392億元,第三產業(yè)增加值306739億元,第一產業(yè)增加值占國內生產總值的比重為9.2%,第二產業(yè)增加值比重為42.6%,第三產業(yè)增加值比重為48.2%。 3、比例相對指標比例相對指標是總體中的一部分數值與總體中的另一部分數值相比,反映總體內各組成部分之間的數量關系。因此它所表明的是結構性比例。比例相對指標的計算公式為: 比例相對指標例如我國第六次人口普查結果,大陸31個省、自治區(qū)、直轄市和現役軍人的人口中,男性人口為686852572人,占51.27%;

8、女性人口為652872280人,占48.73%??側丝谀信詣e比為1.052:1或者105.2:100。4、比較相對指標比較相對指標是同類指標在相同時期內不同空間對比求得的相對指標。它可以反映國家與國家、部門與部門、地區(qū)與地區(qū)、單位與單位、組與組之間同類現象的對比關系。其計算公式為: 比較相對指標比較相對指標既可以用百分數表示,也可以用倍數表示。用來對比的指標既可以是總量指標,也可以是相對指標或平均指標,但要注意對比的兩個同類指標數值,必須具有可比性,即指標涵義、口徑、計算方法,計量單位、所屬時間等一致。例如,某年底,甲省人口 5452 萬人,全省集市數有 2488個。乙省人口 5356 萬人

9、,集市數 1696 個??梢?,甲省人口等于乙省人口的101.8%, 而甲省集市數為乙省集市數的146.7% 。從此例中可以看出,人口差不多的二個省,集市發(fā)展是不平衡的。 5、強度相對指標 強度相對指標是同一時期兩個有聯系的不同總體的數值之比,說明某一現象在一定情況下的強度、密度或普及程度。強度相對指標的計算公式為: 強度相對指標強度相對指標的表現形式一般為復合單位。例如:商業(yè)網點密度為:個/千人、人均國民收入為元/人等等。但也有些強度相對指標用百分數或千分數表示的,如資金利用率、產值利稅率等。強度相對指標,一般有正指標和逆指標(反指標)兩種,指標數值越大說明現象的強度、密度或普及程度越高的,稱

10、之為正指標;相反,指標數值越大說明現象的強度、密度或普及程度越低的,稱之為逆指標。前者為正指標,因為其數值與現象的發(fā)展程度成正比,越大越好;后者為逆指標,因為其數值與現象的發(fā)展程度成反比,越小越好。例如,某地 2014年總人口為 280 萬人,零售商店 5200個。則: 上述計算結果為 538 人/個,說明每一個零售商店為 538 人服務,數值越大,表示一個商店服務的人口數越多,說明商業(yè)網密度越小,所以是逆指標;計算結果為 19 個/萬人,說明每一萬人中有19 個商店,數值越大,表示商業(yè)網密度越大 , 所以是正指標。 6、動態(tài)相對指標 動態(tài)相對指標是同一現象不同時期指標數值對比關系的相對指標,

11、說明現象的發(fā)展速度和增長速度,一般用百分數和倍數表示。其公式為: 動態(tài)相對指標通常把用來作為比較標準的時期稱為基期,把和基期對比的時期稱為報告期,基期和報告期要根據不同的研究任務來選定。 如兩個相比的數值中分子很大分母很小時,計算結果可用倍數表示。反之,如分子很小時,也可用千分數表示。(四)相對指標的應用原則 1.保持對比指標數值的可比性 在使用相對指標時,要注意相對指標分子、分母之間的可比性,即分子、分母所包含的內容、范圍、價格和計算方法以及結構方面是否可比。2.相對指標與總量指標結合運用 在反映社會經濟現象中,只用總量指標不易看清事物的差別程度,只用相對指標又看不出這種差別的絕對水平。3.

12、正確地選擇基數指標 相對指標是通過指標和指標的對比,來反映現象之間的聯系,而基數指標(母項)是對比的基礎和標準。 第二節(jié) 數據的集中趨勢一、集中趨勢的含義 集中趨勢是指一組數據向某一點集中的情況,它能夠揭示總體中眾多個變量值所圍繞與集中的中心,是總體中的共性特征的反映。集中趨勢是次數分布的第一個也是最為重要的數量特征,所以,人們通常使用集中趨勢去代表總體中個體單位水平,也常使用集中趨勢進行不同總體的比較。二、集中趨勢的測定(一)算術平均數 算術平均數是將總體中各個個體單位的變量值匯總,然后除以所有個體單位之和所獲得的一種平均指標,也稱為均值。算術平均數是最有普遍意義的一種平均指標。如平均物價水

13、平、平均畝產量、平均工資等。 1、算術平均數的算法 算術平均數算術平均數又分為簡單算術平均數和加權算術平均數。(1)簡單算術平均數。所掌握的資料是單個的變量值或數據未經分組時,就可以將各個變量值簡單相加求得總體變量總量,然后除以個體單位總量,求出平均指標。這種方法稱為簡單算術平均法,所得數值稱為簡單算術平均數,用 來表示。計算公式可表示如下: 例如某小組工人5人,加工某種零件日產量分別是 7 、9、1O 、11 、13, 則平均每名工人日產量為:即平均每名工人日產量是10 從上面的計算可以看出,簡單算術平均數只受變量因素的影響。一般來說,越接近于中間位置的數值便越接近于算術平均數。因此我們可用

14、標志值所處的位置去大致地判斷一下算術平均數的數值。 (2)加權算術平均數。在計算算術平均數時,如果數據已分組,則不能簡單地將各組變量值直接相加作為總體變量總量,而是將各組變量值乘以相應各組單位數或權數求出各組變量總量,然后將其加和求得總體變量總量,同時把各組單位數或權數相加求出總體單位總量,最后用總體標志總量除以個體單位總量。用這種方法計算的算術平均數稱為加權算術平均數。計算公式為:求下表中工人平均日產量即這 100 名工人平均日產量為 9.56 件。組序日產量(件)工人數(人)各組日產量(件)12345791011131035401237031540013239合計100956加權算術平均數

15、的次數起著權衡輕重的作用,只有當各個標志值的次數不相等時,次數作為權數才起作用,如果各組次數完全相同( 即 f1=f2=f3= =fn ), 次數作為權數,就不起作用了。這時加權算術平均數就等于簡單算術平均數。即如上例,假定每組都是 20 人,則:可見,簡單算術平均數實際上是權數相等的加權算術平均數,是加權算術平均數的特例。當分組數據是組距式的分組資料時,由于每組次數所對應的不是一個變量值,而是一個變量值區(qū)間。因此,必須先找出一個能夠代表各組水平的變量值,一般采取的簡便方法就是用組中值來代替組平均數。此時計算公式為:求下表中平均成績某班學生統計學考試平均成績計算表按成績分組(分)組中值(分)學

16、生人數(人)組中值次數次數(x)(f )Xf60以下60-7070-8080-9090以上556575859526101931103907501615285合計403150(二)調和平均數 調和平均數是變量值倒數的算術平均數的倒數,又稱倒數平均數,有簡單調和平均數和加權調和平均數兩種。 在社會經濟統計中,主要使用的是權數為特定形式 的加權調和平均數。這里,我們把調和平均數作為算術平均數的變形使用,它仍然是依據算術平均數的基本公式-變量總量除以個體單位總量來計算。其計算公式和它與算術平均數的關系如下:作為算術平均數變形的加權調和平均數,一般運用于沒有直接提供被平均指標的相應單位數的場合。舉例說明

17、: 四個市場某種商品某月平均價格及銷售額資料如表 4-3,試計算該種商品四個市場的平均價格。市場商品平均價格(元/公斤)X商品銷售額(元)M甲乙丙丁6791030000210002250010000合計83500解:從價格的基本公式出發(fā),可知商品的平均價格是商品銷售額與商品銷售量之比。但現在沒有商品銷售量資料,此時欲求商品平均價格,不能直接使用算術平均數方法,因此,必須先求出商品銷售量,而在這里商品銷售量是可求到的,即此即調和平均數公式,四個市場商品銷售量的計算結果列于表4-4的第四列。將計算結果代入調和平均數公式便可計算出該種商品四個市場的平均價格為市場商品平均價格(元/公斤)商品銷售額(元

18、)商品銷售量(公斤)MM/ 甲乙丙丁67910300002100022500100005000300025001000合計8350011500(三)幾何平均數幾何平均數是與算術平均數和調和平均數不同的另一種平均指標,它是幾何級數(等比級數)的平均數。 1簡單幾何平均數 簡單幾何平均數是n個變量值連乘積的n次方根,其公式為: 例4-4:某機械廠有4個連續(xù)作業(yè)的車間:毛坯車間(一車間)、粗加工車間(二車間)、精加工車間(三車間)和裝配車間(四車間)。本月份,各個車間的產品合格率為:一車間95%,二車間90%,三車間92%,四車間85%。求4個車間的平均產品合格率。則4個車間的平均產品合格率為: 它

19、的含義是:用幾何平均數代表各個變量值,則變量值的連乘積不變。幾何平均數與算術平均數的不同:算術平均數變量值的總和不變。算術平均數作為集中趨勢的代表值,大于算術平均數和各變量值對算術平均數的差額之和(正離差)與小于算術平均數各變量值對算術平均數的差額之和(負離差),絕對值彼此相等;幾何平均數作為集中趨勢的代表值,大于幾何平均數和各變量值對幾何平均數之比的乘積與幾何平均數對小于幾何平均數的各變量值之比的乘積,彼此相等。以本例言,即:這種關系,是幾何平均數作為集中趨勢特征值的重要依據之一。 2加權幾何平均數 當各個變量值出現的次數不同時,計算幾何平均數應采用加權的形式。加權幾何平均數的公式為: 例4

20、-5:投資銀行某筆投資是按復利計算的,25年間年利率分配情況是:有1年為3%,有4年為5%,有8年為8%,有10年為10%,有2年為15%。求平均年利率。 計算平均年利率,必須先將各年的利率加上100%,換算為各年的本利率;然后按加權幾何平均數的方法,計算平均年本利率;再減去100%,得平均年利率。計算結果:這就是說,25年間年平均利率為108.6%。因而,年平均利率為8.6%。(四)眾數與中位數1. 眾數眾數是指總體中出現次數最多的數值。它表示被研究現象中最普遍、最常見的變量值,反映該現象的一般水平。眾數的計算方法,要根據所掌握的統計數據而定。未分組數據的眾數,是指出現次數最多的那個數值。例

21、如:有5人的年齡分別為30歲、28歲、30歲、32歲、33歲,這一未分組數據的眾數是30歲。利用分組數據計算眾數的方法一般有兩種。一是根據單項式次數分布計算眾數,二是根據組距式次數分布計算眾數。根據單項式次數分布計算眾數,方法比較簡單,一般用直接觀察的方法,根據分配數列中次數出現最多的變量值便可確定為眾數。在組距式次數分布情況下,最多次數所對應眾數組的值并不是一個單一數,而是一組數值,所以假定眾數組組距內所有數值是均勻分布的。可得出眾數的兩個計算公式:式中, 是眾數;L 為眾數所在組下限;u 為眾數所在組上限;為眾數組次數 ;1為眾數組前一組次數;2為眾數組后一組次數; 為眾數組組距。 后面的

22、為大寫,統一為大寫?例4-6 依表 4-5工人完成生產定額分配數列計算眾數。 解:110120 這一組次數最多,是 54, 所以該組為眾數組由下限公式:工人按完成生產定額百分比分組 ( %)各組人數(人)80-9090-100100-110110-120120-130130-140140-15010222854402818合計2002. 中位數將研究總體中各單位的標志值依其大小順序排列,位于中間位置的標志值就是中位數。即中位數是正居各標志值中心的數值。在這個數值之上和之下各有 50%的單位數。中位數一般用 表示。根據中位數的性質,確定中位數的關鍵在于找出總體各單位的中間項的位置點。中間項的位置

23、點,即是中位數所在的位置,其所對應的標志值為中位數。但有時掌握的是未分組資料,有時掌握的是分組資料,由于資料不同確定中間項的方法也有所不同(1)未分組資料。當總體單位數是奇數時,中位數的確定。例4-7某班組7人生產某種產品日產量分別是 :14、15、15、16、16、16、17。解:中間位置點= 。第四位對應的變量值 16是中位數。當總體單位數是偶數時,中位數的確定。例4-8某班組 6 人生產某種產品日產量分別是 :15、15、15、16、16、16。中位數為:(2)由分組資料確定中位數。由分組資料確定中位數的基本步驟為:首先,確定中位數位置。其次,用累計次數的方法找擊中位數所在組。最后,根據

24、中位數所在組的標志值確定中位數。1)由單項數列確定中位數。仍用某住宅小區(qū)家庭人口數資料見表 4-6為例,說明由單項數列確定中位數的方法。即中位數應在180 戶的位置上,它所對應的標志值就是中位數。通過向上或向下累計次數可知,中位數均在第三組,該組的標志值 3 為中位數。按家庭人口數分組家庭數(戶)(次數)次數累計(戶)向上累計向下累計1234510502008020106026034036036035030010020合計3602)由組距數列確定中位數。由組距數列計算中位數,當中位數所在組的位置確定之后,中位數組所對應的變量值不是一個數值,而是個變量值區(qū)間,其具體數值為多少還要進一步認定。一種

25、粗略的方法是用組中值代替;另一種較精確的方法是用比例推算法推算。比例推算法的前提是假定次數在組內均勻分布,計算公式為: 例4-9資料如表 4-7, 求中位數。工人按完成生產定額百分比分組(%)各組人數(人)較小制累計次數(次)較大制累計次數(次)809010102009010022321901001102860l6811012054114140120130401548613014028182461401501820018合計200解:中間位置點 ,累計次數見表 4-18, 因為 60100114, 所以中位數在 110-120 這一組。(五)四分位數四分位數也稱四分位點,它是通過三個點將全部數

26、據等分為四部分,其中每部分包含25%的數據,處在分位點上的數值就是四分位數。很顯然,中間的四分位數就是中位數,因此通常所說的四分位數是指第一個四分位數(下四分位數)和第三個四分位數(上四分位數)。 (1)根據未分組數據計算四分位數。根據未分組數據計算四分位數時,首先對數據進行排序,然后確定四分位數所在的位置。則各四分位數的位置分別為:當四分位數的位置不在某一個數值上時,可根據四分位數的位置按比例分攤四分位數位置兩側數值的差值。 例4-10某企業(yè)上半月產品次品數如表4-8。時間(日)次品數(件)時間(日)次品數(件)1 2 3 4 5 6 7 8 111313131414171791011121

27、3141517181921212528(2)根據已分組數據確定四分位數。根據分組數據確定四分位數時,先確定 和 的位置,并確定 和 所在的組, 然后仿照中位數的計算公式,確定 和 的具體數值。計算公式為: (六)算術平均數、中位數、眾數的特點1三種平均指標的涵義不同算術平均數是應用最廣泛的一種平均指標,它的數值是整個總體次數分布的中心或重心,這個中心點的兩邊具有相等的變量值之和,即相等的 2三種平均指標受極值影響的程度不同算術平均數所受影響最大,而中位數只考慮數值的位置,即中位數與數據個數多少有關,與極值無關,而眾數則不受極值的影響。3.三種平均指標受非對稱分布的影響程度不同在非對稱的鐘形分布

28、情況下,平均指標、眾數、中位數三者的差別取決于非對稱的程度。非對稱的程度越大,它們之間的差別愈大;非對稱的程度愈小,它們之間的差別愈小。當次數分布右偏時意味著算術平均數受大的極端值影響,就有 如圖(a)當次數分布左偏時意味著算術平均數受小的極端值影響,就有 如圖(b)當現象呈對稱的鐘形分布的情況下,算術平均數處于分布曲線的對稱點上,對稱點又是曲線的中心點和最高點,這時,算術平均數、眾數、中位數三者一致,就有 ,如圖(c)。第三節(jié) 數據的離中趨勢一、離中趨勢的及其測定指標含義離中趨勢的測定指標反映總體各個個體單位變量值的差異程度,是反映總體次數分布中各變量值的變動范圍或離散程度的綜合指標。因而,

29、它能夠揭示各變量值之間的差異性,從而說明總體次數分布的集中趨勢的強弱,反映平均指標的代表性大小,從另一個方面來補充說明總體的數量規(guī)律性,全面地描述總體次數分布的數量特征。所以,離中趨勢的測定指標也是總體次數分布的一個重要的數量特征值。二、離中趨勢測定指標的作用 (一)衡量平均指標的代表性的尺度離中趨勢的測定指標可以說明平均指標的代表性的大小。離中趨勢的測定指標數值愈大,說明總體單位的差異程度也愈大,次數分布愈分散,從而,平均指標的代表性就愈??;反之,離中趨勢的測定指標數值愈小,則平均指標代表性就愈大。 例4-11有甲、乙、丙三組工人,每組都是 5 人,每人每日生產某零件的件數如下:甲、乙、丙三

30、組平均每名工人日產量都是 50 件,但各組工人日產量的差異程度不同。甲組差異程度較小,乙組差異程度較大,丙組差異程度為零。平均日產量 50 件對丙組各人日產量有完全的代表性,對甲組各人日產量代表性較高,對乙組各人日產量代表性最小。 (二)反映社會經濟活動過程的穩(wěn)定性和均衡性 離中趨勢的測定指標可以表明生產過程的節(jié)奏性、穩(wěn)定性或其他經濟活動過程的均衡性,進行產品質量控制和說明經濟管理工作的質量。如果離中趨勢的測定指標數值較小,說明產品質量比較穩(wěn)定;反之,離中趨勢的測定指標數值愈大,則產品質量的穩(wěn)定性差。 在統計研究中,離中趨勢的測定指標和平均指標有著密切的關聯。在應用平均指標的基礎上來結合離中趨

31、勢的測定指標,可以全面地進行統計分析。脫離平均指標的應用,離中趨勢的測定指標便失去其實際意義。 (三)反映現象的質量與風險 一般說來,離中趨勢的測定指標數值越小,現象的質量越好;離中趨勢的測定指標數值越大,現象的質量越差。另外,離中趨勢的測定指標數值越小,對于某些現象來講便越穩(wěn)定,風險越小,如股票,風險投資,保險等;反之,如果離中趨勢的測定指標數值越大,說明這些現象的變化越不穩(wěn)定,風險便越大。三、離中趨勢的測定 離中趨勢的測定指標主要有:全距、平均差、標準差、四分位差、異眾比率、標準分數和離散系數。其中標準差是最重要的離中趨勢測定指標。(一)全距 全距是總體各單位標志的最大值和最小值之差。若將

32、研究總體中各個單位,按某一數量標志值的大小順序排列起來,則最大值與最小值分別處于數列的兩極,所以全距也稱極差,說明標志值的變動范圍和幅度,通常用 R 表示。其計算公式為:全距 = 最大標志值最小標志值 即 R = max(x) min (x)式中, R代表全距 max(x)表示最大變量值; min(x) 表示最小變量值。未分組資料和變量數列中的單項數列計算全距,直接用最大標志值減最小標志值求得。如上例甲、乙、丙三組的全距分別為 : 甲、乙、丙三組每人平均生產零件數均為 50 件,但日產量的變動范圍相差很大:乙組 90 件,甲組 4 件,丙組為零。這說明乙組平均日產量代表性最低,甲組平均日產量代

33、表性較高,丙組平均日產量代表性最高。 由組距數列求全距,可以用最高組的上限與最低組下限之差,求得全距的近似值。 全距 = 最高組上限一最低組下限例如,工人按完成生產定額百分比分組資料見表 4-7從得到的組距數列求全距為: 全距 =150%-80%=70 % 這表明,這組工人完成生產定額百分比的變化幅度為 70% 工人按完成生產定額百分比分組(%)各組人數(人)較小制累計次數(次)較大制累計次數(次)809010102009010022321901001102860l6811012054114140120130401548613014028182461401501820018合計200(二)平均

34、差 平均差是各個變量值對其算術平均數的平均離差。 由于各個變量值對算術平均數的離差總和恒等于0即 ,因而各項離差的平均數也恒等于0。為此,在計算平均差時,采取離差的絕對值,即計算平均差,根據掌握的數據資料不同,可采用簡單平均式和加權平均式兩種方法。 1、簡單平均差對未分組資料計算的平均差叫簡單平均差。其計算公式為:例4-12現以甲乙兩個生產組生產產品的件數為例,計算如下計算結果表明,甲、乙兩組每個工人的平均日產量都為50 件,但平均差卻不同。甲組工人的日產量與平均日產量之間平均相差1.2 件,乙組工人的日產量與平均日產量之間平均相差32 件。甲組的平均差小于乙組,因而甲組平均數代表生高于乙組。

35、2. 加權平均差。 用分組資料計算的平均差叫加權平均差。其計算公式為:式中,代表各組的次數分組資料有單項數列和組距數列兩種,單項數列資料直接利用加權式公式計算平均差,組距數列資料先計算出各組的組中值作為各組的標志值的代表值,再利用加權式公式計算平均差。按成績(分)組中值人數(人)總成績(分)離差離差絕對值離差絕對值加權60以下60-7070-8080-9090以上556575859526101931103907501615285-23.75-13.75-3.756.2516.2523.7513.753.756.2516.2547.5082.5037.50118.7548.75合計一403150

36、335.00例4-13現以某班學生的統計學考試成績組距數列資料,計算如下:平均成績加權平均差 (分)以上計算說明,該班 40 名學生統計學考試成績的平均離差為8.375 分,即每個學生的成績與平均成績之間平均相差 8.375 分。(三)標準差 1標準差的概念 標準差是各個變量值與其算術平均數的離差平方的算術平均數的平方根,因此又稱“均方差”。標準差的平方稱為方差。 2標準差的計算方法依據掌握的資料不同,標準差的計算方法,也分為簡單平均式和加權平均式兩種。(1)簡單標準差。在資料未分組的情況下,由于各標志值出現的次數相同,計算標準差可采用簡單平均方法。其計算公式為:式中,代表標準差( )2代表離

37、差平方和;n代表總體單位數。例4-14仍以表 4-9甲、乙兩組工人生產產品的件數資料為例,計算標準方差。根據表4-9計算離差平方,如表4-11所示 表4-9 表4-11(2)加權標淮差。在資料分組的情況下,由于各組標志值出現的次數不同,計算標準差需采用加權平均的方法。其計算公式為:式中,為各組次數,為總次數。 如果資料是按單項式進行分組,即用單項數列資料計算標準差,直接用加權公式計算。以某車間一組工人日產量單項式分組資料為例,計算標準差計算結果說明,該組工人的日產量平均為8.5件,平均離差勁 2.2件。如果資料是按組距式進行分組 , 則先計算出各組組中值代表各組標志值 , 然后按加權公式計算。

38、以表 4-10資料為例 , 計算見表 4-13。計算結果說明,該班學生在平均成績78.75分的水平上的平均離差9.92分。 3是非標志標準差(1)是非標志的概念。將總體現象按是否具有某種屬性分為兩組。例如,全部產品按是否合格分為合格品組和不合格品組;全部人口按性別區(qū)分為男、女兩組;將學生劃分為文科和非文科兩組等。這種用“是”、“否”或“有”、“無”來表示的標志稱為是非標志或交替標志。是非標志是品質標志,為了解決是非標志的平均數和標準差的度量問題,有必要將品質標志數量化。一般地:用 1 表示數列中具有某種性質的單位標志值,即單位的標志為“是”的標志值;以 0 表示數列中不具有某種性質的單位的標志

39、值,即單位的標志為“非”的標志值,這樣就把“是”與“非”這類品質標志量化為“1”和“0”的標志值。(2)是非標志的成數。數列中的全部總體單位是確定的,可以用 N 表示全部總體單位數,用NI表示具有某種性質標志表現的單位數 , 用N0表示不具有某種性質標志表現的單位數,則 N=NI+N0這兩部分單位數(N1和N0)分別占全部總體單位數 (N)的比重叫成數,可分別用p和 q 表示,即標志值為 1 的單位數占全部單位數的比重(成數)標志值為 0 的單位數占全部單位數的比重(成數)成數反映數列中單位數“是”與“非”的構成,并且代表該種性質或屬性反復出現的程度,即頻率。(3)是非標志的平均數及標準差。根

40、據以上討論,可得到是非標志平均數與標準差的計算方法如下:是非標志的平均數即是非標志的平均數為總體中標志值為 1 的屬性的成數。是非標志的標準差亦即是非標志的標準差是總體中標志值為 1 的屬性的成數和標志值為 O 的屬性的成數的乘積之平方根。例4-21 某班學生統計學考試成績資料的分布數列如表 4-14所示計算結果表明,該班學生統計學考試成績及格率為 95%,其標準差為 21.79%。43 定則及其應用社會經濟統計研究的是大量數量方面的社會經濟現象。在大量觀察下,許多現象總體內的次數分布呈正態(tài)分布,即以平均數為中心,中間大,兩頭小的分布狀態(tài)。數理統計證明,在正態(tài)分布情況下:即:有68.27%工人

41、日產量在33.63件到51.37件之間;有95.45%工人的日產量在24.76件到60.24件之間;有99.73%工人的日產量在15.89件到 69.11件之間。(四)四分位差 1四分位差的概念 四分位差是上四分位數與下四分位數的差值,也稱為內距或四分間距。 四分位差反映了中間50%的數據的離散程度。其數值越小,說明中間的數據越集中;反之數值越大,說明中間的數據越分散。四分位差不受極值的影響。 2四分位差的計算 四分位差的計算公式為:【例4-23】甲班統計學考試成績的四分位差為 =90-70=20,乙班統計學考試成績的四分位差為 =80-70=10,這說明,甲、乙兩班都有75%的學生成績在70

42、分以上,但甲班的成績比乙班相對分散一些,因為甲班有一半的學生成績集中在70分90分之間,而乙班有一半的學生成績集中在70分80分之間。由于中位數處于數據的中間位置,因此四分位差的大小在一定程度上反映了中位數對一組數據的代表程度。(五)異眾比率 1異眾比率的概念 異眾比率又稱離異比率或變差比,是指非眾數組的次數占總次數的比率。 異眾比率的作用是衡量眾數對一組數據的代表程度。異眾比率越大,說明非眾數組的次數占總次數的比重越大,眾數的代表性就越差;異眾比率越小,說明非眾數組的次數占總次數的比重越小,眾數的代表性越好。2異眾比率的計算 異眾比率的計算公式為: 【例4-24】根據表4-13中的數據,計算

43、異眾比率計算結果表明,該班級40名學生中,有52.5%的學生成績的不在80-90之間,異眾比率較大(六)標準分數 1標準分數的概念 標準分數也稱標準化值或Z分數,是指變量值與其算術平均數的離差除以標準差的值。它是測量每個數據在該組數據中相對位置的常用指標。 2標準分數的計算 設標準分數為 ,則有 標準分數給出了一組數據中各數值的相對位置。例如,如果某個數值的標準分數為1.6,我們就知道該數值高于均值1.6倍的標準差。 (七)變異系數當兩個不同總體進行比較其平均指標代表性大小時,便應使用離中趨勢測定方法的相對形式去剔除變量數列水平及其計量單位的影響,以便能夠獨立地顯示出數據變動的差異程度,進行比

44、較。離中趨勢測定方法的相對形式是變異系數。常用的變異系數有兩種:平均差系數和標準差系數,其中,標準差系數是最常用的。兩種變異系數的計算公式為:【例4-25】下表是甲、乙兩企業(yè)產量的有關數據資料,試根據此數據資料說明哪一個企業(yè)的平均日產量代表性大。第四節(jié) 偏態(tài)與峰度一、偏態(tài)的含義及其測定(一)偏態(tài)的含義 所謂偏態(tài),是指次數分布的非對稱程度。它和算術平均數與標準差一樣,也是次數分布的一個數量特征。偏態(tài)通常分為兩種,即右偏(或正偏態(tài))與左偏(或負偏態(tài))。它們是與對稱分布相比較而言。在對稱分布的情況下,算術平均數與中位數和眾數是合而為一的。在偏態(tài)分布的情況下算術平均數與中位數和眾數是分離的。如果眾數在左邊,算術平均數在右邊,即極端數值在右邊,次數分布曲線向右延伸,則稱為右向偏態(tài)。右向偏態(tài),算術平均數的數值較大,眾數的數值較小,算術平均數與眾數之差為正值,故右向偏態(tài)又稱為正向偏態(tài)。如果眾數在右邊,算術平均數在左邊,即極端數值在左邊,次數分布曲線向左延伸,稱為左向偏態(tài)。左向偏態(tài),算術平均數的數值較小,眾數的數值較大。算術平均數與眾數之差為負值,故左向偏態(tài)又稱為負向偏態(tài)。(二)偏態(tài)的測定方法 在統計中用偏態(tài)系數來反映分布的對稱程度。測定偏態(tài)的方法通常用以下兩種,即Pearson偏態(tài)測定法和動差法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論