




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)定量數(shù)據(jù)的頻數(shù)分布對于定量數(shù)據(jù),在編制頻數(shù)分布表時,首先需要將定量數(shù)據(jù)進行分組,然后再統(tǒng)計出各組別的數(shù)據(jù)頻數(shù)。定量數(shù)據(jù)頻數(shù)分布表的編制關鍵在于科學、合理的統(tǒng)計分組對于定量數(shù)據(jù),在編制頻數(shù)分布表時,首先需要將定量數(shù)據(jù)進行分組,然后再統(tǒng)計出各組別的數(shù)據(jù)頻數(shù)。定量數(shù)據(jù)頻數(shù)分布表的編制關鍵在于科學、合理的統(tǒng)計分組。對于定量數(shù)據(jù),在編制頻數(shù)分布表時,首先需要將定量數(shù)據(jù)進行分組,然后再統(tǒng)計出各組別的數(shù)據(jù)頻數(shù)。定量數(shù)據(jù)頻數(shù)分布表的編制關鍵在于科學、合理的統(tǒng)計分組。單變量組距[例]某車間A生產(chǎn)小組20名工人日加工零件數(shù)如下(單位:件),試編制工人日加工零件數(shù)的頻數(shù)分布表。1613181519141713151718151618141615161716一、單變量值分組編制頻數(shù)分布表[例]某車間A生產(chǎn)小組20名工人日加工零件數(shù)如下(單位:件),試編制工人日加工零件數(shù)的頻數(shù)分布表。1613181519141713151718151618141615161716這些數(shù)據(jù)大小無序,為了便于分組,要先對原始數(shù)據(jù)排序。排序結果如下:這種方法一般適用于離散變量且變量值較少的情況。1313141415151515161616161617171718181819一、單變量值分組編制頻數(shù)分布表[例]某車間A生產(chǎn)小組20名工人日加工零件數(shù)如下(單位:件),試編制工人日加工零件數(shù)的頻數(shù)分布表。1613181519141713151718151618141615161716這些數(shù)據(jù)大小無序,為了便于分組,要先對原始數(shù)據(jù)排序。排序結果如下:這種方法一般適用于離散變量且變量值較少的情況。1313141415151515161616161617171718181819一、單變量值分組編制頻數(shù)分布表[例]某車間A生產(chǎn)小組20名工人日加工零件數(shù)如下(單位:件),試編制工人日加工零件數(shù)的頻數(shù)分布表。1613181519141713151718151618141615161716這些數(shù)據(jù)大小無序,為了便于分組,要先對原始數(shù)據(jù)排序。排序結果如下:這種方法一般適用于離散變量且變量值較少的情況。1313141415151515161616161617171718181819一、單變量值分組編制頻數(shù)分布表經(jīng)過排序后,確定各組變量值,列出頻數(shù)并計算頻率,頻數(shù)分布數(shù)表如下:20名工人日加工零件數(shù)頻數(shù)分布表工人日加工零件數(shù)(件)頻數(shù)(人)頻率(%)1321014210154201652517315183151915合計20100二、組距分組編制頻數(shù)分布表編制定量數(shù)據(jù)頻數(shù)分布表的具體步驟:1.將原始數(shù)據(jù)排序,確定變量值的變動范圍;⒉確定組數(shù)和組距;3.確定組限和組限的表示方法;4.根據(jù)所確定的組數(shù)、組距及組限表示方法,可以分別統(tǒng)計各組出現(xiàn)的次數(shù)形成變量頻數(shù)分布表。二、組距分組編制頻數(shù)分布表編制定量數(shù)據(jù)頻數(shù)分布表的具體步驟:1.將原始數(shù)據(jù)排序,確定變量值的變動范圍;⒉確定組數(shù)和組距;3.確定組限和組限的表示方法;4.根據(jù)所確定的組數(shù)、組距及組限表示方法,可以分別統(tǒng)計各組出現(xiàn)的次數(shù)形成變量頻數(shù)分布表。例:某班級40名同學統(tǒng)計學課程考試成績資料如下(單位:分):68898884868775737268758299588154797695767160916576827685899264578381787772617087二、組距分組編制頻數(shù)分布表首先,排序得到結果如下:54575860616465686870717272727375757676767676777881818283848586878788898991929599二、組距分組編制頻數(shù)分布表99-54=45首先,排序得到結果如下:54575860616465686870717272727375757676767676777881818283848586878788898991929599二、組距分組編制頻數(shù)分布表99-54=45首先,排序得到結果如下:54575860616465686870717272727375757676767676777881818283848586878788898991929599二、組距分組編制頻數(shù)分布表99-54=45
按成績分組(分)頻數(shù)(人)頻率(%)60以下37.560~70615.070~801537.580~901230.090以上410.0合計40100經(jīng)過排序、確定組數(shù)、組距,編制頻數(shù)分布表如下:40名學生統(tǒng)計學成績的頻數(shù)分布表按成績分組(分)頻數(shù)(人)頻率(%)60以下37.560~70615.070~801537.580~901230.090以上410.0合計40100經(jīng)過排序、確定組數(shù)、組距,編制頻數(shù)分布表如下:40名學生統(tǒng)計學成績的頻數(shù)分布表鐘型數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)定性數(shù)據(jù)的頻數(shù)分數(shù)一頻數(shù)分布的意義定性數(shù)據(jù)的頻數(shù)分布二一、頻數(shù)分布的意義一、頻數(shù)分布的概念頻數(shù)(Frequency):將統(tǒng)計數(shù)據(jù)分組后,各組數(shù)據(jù)出現(xiàn)的次數(shù)被稱為頻數(shù),亦稱為次數(shù)。頻數(shù)分布(Frequencydistribution):把數(shù)據(jù)分成的各個組以及相應的頻數(shù)依一定的次序全部列出來,就形成了頻數(shù)分布,又稱為次數(shù)分布。一、頻數(shù)分布的概念頻數(shù)(Frequency):將統(tǒng)計數(shù)據(jù)分組后,各組數(shù)據(jù)出現(xiàn)的次數(shù)被稱為頻數(shù),亦稱為次數(shù)。按機構類型分組法人單位數(shù)企業(yè)法人10617154事業(yè)法人828440機關法人259357社會團體294691其他1701798合計13701440資料來源:《中國統(tǒng)計年鑒2015》表2.42014年中國按機構類型分法人單位數(shù)(單位:個)一、頻數(shù)分布的概念頻數(shù)(Frequency):將統(tǒng)計數(shù)據(jù)分組后,各組數(shù)據(jù)出現(xiàn)的次數(shù)被稱為頻數(shù),亦稱為次數(shù)。按機構類型分組法人單位數(shù)企業(yè)法人10617154事業(yè)法人828440機關法人259357社會團體294691其他1701798合計13701440資料來源:《中國統(tǒng)計年鑒2015》表2.42014年中國按機構類型分法人單位數(shù)(單位:個)一、頻數(shù)分布的概念頻數(shù)(Frequency):將統(tǒng)計數(shù)據(jù)分組后,各組數(shù)據(jù)出現(xiàn)的次數(shù)被稱為頻數(shù),亦稱為次數(shù)。頻數(shù)分布(Frequencydistribution):把數(shù)據(jù)分成的各個組以及相應的頻數(shù)依一定的次序全部列出來,就形成了頻數(shù)分布,又稱為次數(shù)分布。頻數(shù)分布有兩個構成要素:一個是對現(xiàn)象總體的分組;另一個是各組所出現(xiàn)的元素數(shù)或數(shù)據(jù)數(shù),即頻數(shù)。一、頻數(shù)分布的概念有時,頻數(shù)以相對數(shù)的形式,即各組頻數(shù)占頻數(shù)之和比重的形式出現(xiàn),這種頻數(shù)被稱為頻率(Relativefrequency)。頻率反映了各組頻數(shù)的大小對總體所起作用的相對強度。頻率具有兩個性質(zhì):(1)任何頻率都介于0和1之間;(2)各組頻率之和等于1。二、定性數(shù)據(jù)的頻數(shù)分布U形分布U形分布J形分布(a)正J形分布(b)反J形分布次數(shù)分布的類型主要取決于社會經(jīng)濟現(xiàn)象本身的性質(zhì),編制的次數(shù)分布表和分布圖形有時可能會因總體所處的客觀條件不同而表現(xiàn)不同,但其形態(tài)仍應符合該現(xiàn)象的分布特征。頻數(shù)分布的主要類型鐘形分布(a)對稱分布
(b)右偏分布
(c)左偏分布頻數(shù)分布的主要類型頻數(shù)分布主要有三種類型,即鐘型分布、U型分布和J型分布。1.鐘型分布。其特征是“兩頭小、中間大”。鐘型分布若以中心變量值為核心,左右兩側變量值的頻數(shù)對稱分布,且隨著離中心變量值距離的增大而漸次減少。這種分布在統(tǒng)計學中被稱為正態(tài)分布,如圖(a);圖(b)和圖(c)被稱為偏態(tài)分布,其中,圖(b)為正偏態(tài)(右偏)分布,圖(c)為負偏態(tài)(左偏)分布。(a)
(b)
(c)
頻數(shù)分布的主要類型頻數(shù)分布主要有三種類型,即鐘型分布、U型分布和J型分布。1.鐘型分布。其特征是“兩頭小、中間大”。鐘型分布若以中心變量值為核心,左右兩側變量值的頻數(shù)對稱分布,且隨著離中心變量值距離的增大而漸次減少。這種分布在統(tǒng)計學中被稱為正態(tài)分布,如圖(a);圖(b)和圖(c)被稱為偏態(tài)分布,其中,圖(b)為正偏態(tài)(右偏)分布,圖(c)為負偏態(tài)(左偏)分布。(a)(b)
(c)對稱右左
頻數(shù)分布的主要類型2.U型分布。其特征是“兩頭大、中間小”。3.J型分布。J型分布有兩種類型,一種是正J型分布,即頻數(shù)隨著變量值的增大而增多,如圖中(a)所示:另一種是反J型分布,如圖中(b)所示。(a)(b)
頻數(shù)分布的主要類型2.U型分布。其特征是“兩頭大、中間小”。3.J型分布。J型分布有兩種類型,一種是正J型分布,即頻數(shù)隨著變量值的增大而增多,如圖中(a)所示:另一種是反J型分布,如圖中(b)所示。(a)(b)
正反數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)累計次數(shù)分布次數(shù)分布是統(tǒng)計研究的一個基本課題,通過次數(shù)的分布規(guī)律,可以研究大量的社會現(xiàn)象的統(tǒng)計規(guī)律性。累計次數(shù)的計算方法:向上累計向上累計是將各組次數(shù)和比率,由變量值低的組向變量值高的組逐組累計。向上累計會產(chǎn)生相應的向上累計次數(shù)和向上累計頻率。向下累計向下累計是將各組次數(shù)和比率,由變量值高的組向變量值低的組逐組累計。向下累計會產(chǎn)生相應的向下累計次數(shù)和向下累計頻率。累計次數(shù)分布表3-15某班統(tǒng)計學考試成績次數(shù)分配表考分次數(shù)向上累計向下累計人數(shù)(人)比率(%)人數(shù)(人)比率(%)人數(shù)(人)比率(%)50~6025.025.040100.060~70717.5922.53895.070~801127.52050.03177.580~901230.03280.02050.090~100820.040100.0820.0合計40100.0----累計次數(shù)的特點是:同一數(shù)值的向上累計和向下累計次數(shù)之和等于總體總次數(shù),而累計比率之和等于1(或100%)。表3-12中的資料表明:80分以下累計20人,比率50%;80分以上累計20人,比率50%;兩個累計人數(shù)之和等于總體的40人,兩個累計比率之和等于100%。對單項數(shù)列也可以計算累計次數(shù)和累計頻率還可以繪制累計次數(shù)分布折線圖。圖3-1次數(shù)分布的類型主要取決于社會經(jīng)濟現(xiàn)象本身的性質(zhì),編制的次數(shù)分布表和分布圖形有時可能會因總體所處的客觀條件不同而表現(xiàn)不同,但其形態(tài)仍應符合該現(xiàn)象的分布特征。次數(shù)分布的主要類型U形分布U形分布J形分布(a)正J形分布(b)反J形分布鐘形分布(a)對稱分布
(b)右偏分布
(c)左偏分布數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)數(shù)據(jù)的預處理數(shù)據(jù)應該如何整理?1.1數(shù)據(jù)的預處理
數(shù)據(jù)的預處理:數(shù)據(jù)整理的先前步驟,是在對數(shù)據(jù)分類或分組之前所做的必要處理。篩選審核排序是否有誤原始數(shù)據(jù)檢查完整性和準確性完整性檢查應調(diào)查的單位或個體是否遺漏,項目是否填寫齊全準確性數(shù)據(jù)是否有錯誤,是否存在異常值二手數(shù)據(jù)審核適用性和時效性適用性來源、口徑、相關背景材料時效性對應的時間1.2數(shù)據(jù)的審核主要是從數(shù)據(jù)的真實性與精確性角度檢查資料,其審核的重點是檢查調(diào)查過程中所發(fā)生的誤差。1.準確性審核主要是檢查數(shù)據(jù)是否按照規(guī)定時間報送,如未按規(guī)定時間報送,就需要檢查未及時報送的原因。
3.及時性審核數(shù)據(jù)審核的內(nèi)容主要包括以下四個方面:主要是根據(jù)數(shù)據(jù)的用途,檢查數(shù)據(jù)解釋說明問題的程度。具體包括數(shù)據(jù)與調(diào)查主題、與目標總體的界定、與調(diào)查項目的解釋等是否匹配。2.適用性審核主要是檢查數(shù)據(jù)在不同地區(qū)或國家、在不同的時間段是否具有可比性。4.一致性審核1.3數(shù)據(jù)的篩選
無法糾正或不符合要求又無法彌補時使用數(shù)據(jù)篩選數(shù)據(jù)篩選不符合要求或有明顯錯誤的數(shù)據(jù)剔除符合特定條件的數(shù)據(jù)篩選表3-18名學生考試成績數(shù)據(jù)試著找出統(tǒng)計學成績等于75分的學生英語成績最高的前三名學生四門課程成績都高于70分的學生姓名統(tǒng)計學成績數(shù)學成績英語成績經(jīng)濟學成績張松69688486王翔91759594田雨54886778李華81608664趙穎75968183宋媛83726671袁方75587690陳風87769277首先選擇“數(shù)據(jù)”菜單。并選擇“篩選”命令。如果要篩選出滿足給定條件的數(shù)據(jù)可使用“自動篩選”命令,如表3-1所示。這時會在第一行出現(xiàn)下拉箭頭。用鼠標點擊箭頭會出現(xiàn)如圖3-2所示的結果。要篩選出統(tǒng)計學成績?yōu)?5分的學生選擇75。得到如圖3-2所示的結果。要篩選出英語成績最高的前三名學生可選擇“10個最大的值”選項。并在對話框中更改數(shù)據(jù)為3,得到的結果如圖3-3所示。篩選出四門課程成績都高于70分的學生。使用“高級篩選”命令,建立條件區(qū)域。需要在數(shù)據(jù)清單上面至少留出三行作為條件區(qū)域。把數(shù)據(jù)清單中的條件標志行復制黏貼到條件區(qū)域的第一個空行。再在條件標志下面的一行中鍵入要匹配的條件。比如我們要篩選出四門課程考試成績均高于70分的學生。可是定條件區(qū)域如圖3-4所示。選擇高級篩選命令,在高級篩選對話框中修改“數(shù)據(jù)區(qū)域”和“條件區(qū)域”,結果如圖3-5所示。單擊“確定”按鈕出現(xiàn)如表3-3所示的結果。1.4數(shù)據(jù)的排序按一定順序將數(shù)據(jù)排列,以便于發(fā)現(xiàn)明顯特征或趨勢,或有助于檢查糾錯,或便于重新歸類或分組數(shù)據(jù)排序字母型一般用升序降序,漢字型可按首位字母或筆畫分類數(shù)據(jù)升序或降序數(shù)值型數(shù)據(jù)將姓名筆畫按照升序方式排序操作過程操作過程將“高職英語”成績按降序方式排序小結數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)統(tǒng)計分組的原則與方法二、統(tǒng)計分組的原則1.組內(nèi)同質(zhì)性和組間差異性原則;2.“窮盡”性原則;3.互斥”性原則。三、統(tǒng)計分組的方法數(shù)據(jù)分為定性數(shù)據(jù)和定量數(shù)據(jù),統(tǒng)計分組方法因不同的研究要求和數(shù)據(jù)類型而不同。(一)定性數(shù)據(jù)分組和定量數(shù)據(jù)分組由于定性數(shù)據(jù)本身就是對現(xiàn)象的一種分類,我們只需要根據(jù)分析研究目的科學合理的列出所分的類別即可。1.定性數(shù)據(jù)分組定量數(shù)據(jù)主要有單變量值分組和組距分組兩種。2.定量數(shù)據(jù)分組100戶居民家庭按人口數(shù)單項式分組按家庭人口數(shù)分組(人)居民戶數(shù)(戶)152353454105人及以上5合計100單變量值分組就將每個變量值作為一組。這種方法一般適用于離散變量且變量值較少的情況。當離散變量數(shù)據(jù)較多時,單變量值分組會使組數(shù)較多,這不利于觀察數(shù)據(jù)分布的特征或規(guī)律性,而且連續(xù)變量無法采用這種分組。這就要考慮組距分組了。(1)單變量值分組某工廠50名工人日加工零件數(shù)如下表所示,請按日加工零件數(shù)進行統(tǒng)計分組。ABCDEFGHIJ11171221241291391071171301221252108131125117122133126122118108311018112312613313412712311811241121341271231191131201231271355137114120123124115139123124121單變量值數(shù)據(jù)排序ABCDEFGHIJ11071081081101121121131141151172117117118118118119120120121122312212212312312312312312412412441251251261261271271271281281295130131133133134134135137137139ABCD1零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)21071124331082125241101126251122127361131128271141129181151130191173131110118313321111911342121202135113121113711412241392151234合計50適用性:離散型變量值較多的情況,同時也適用于連續(xù)型變量,因為其值無法一一列舉。可以等距分組也可以不等距分組。按組距進行分組在一定程度上會損害資料的真實性。因此,在統(tǒng)計研究中,假定變量值在各組內(nèi)部均勻分布。(2)組距分組組距分組是將全部變量值依次劃分為若干個數(shù)值區(qū)間,每一個數(shù)值區(qū)間作為一個組。下面兩個表分別是離散變量和連續(xù)變量進行的組距分組:企業(yè)工人按日產(chǎn)零件分組按日產(chǎn)零件分組(件)工人數(shù)(人)50~601060~702570~804080~902090以上5合計100按日產(chǎn)零件分組(件)工人數(shù)(人)50~601060~702570~804080~902090以上5合計100按工資水平分組工人數(shù)(人)2000以下352000~2500652500~3000503000~3500303500以上20合計200企業(yè)工人按日產(chǎn)零件分組連續(xù)變量的組距分組企業(yè)工人按工資水平分組離散變量的組距分組64分配數(shù)列的種類:品質(zhì)數(shù)列變量數(shù)列分配數(shù)列又稱次數(shù)分布,在統(tǒng)計分組的基礎上,將總體中所有的單位按組歸類整理,并按一定順序排列,形成總體中各個單位在各組間的分布。65某農(nóng)業(yè)企業(yè)職工的性別構成情況表
性別人數(shù)(人)比率(%)男職工90030女職工210070合計3000100該廠職工的性別構成特點是,女職工占的比重大于男職工。對于品質(zhì)數(shù)列來講,如果分組標志選擇得好,分組標準定得恰當,則事物質(zhì)的差異表現(xiàn)得就比鉸明確。品質(zhì)數(shù)列一般比較穩(wěn)定,通常均能準確地反映總體的分布特征。品質(zhì)數(shù)列按品質(zhì)標志分組形成的分配數(shù)列稱品質(zhì)數(shù)列,也稱屬性分配數(shù)列。品質(zhì)數(shù)列由各組名稱和次數(shù)組成。各組次數(shù)可以用絕對數(shù)表示,即頻數(shù);也可用相對數(shù)表示,即頻率66變量數(shù)列按數(shù)量標志分組形成的分配數(shù)列稱變量數(shù)列。變量數(shù)列也分為單項數(shù)列和組距數(shù)列兩種。單項數(shù)列是總體按單項式分組而形成的變量數(shù)列,每個變量值是一組,順序排列,在組數(shù)不多和組值變動幅度不大時采用某農(nóng)機企業(yè)工人平均日產(chǎn)量工人平均日產(chǎn)量(件)工人數(shù)(人)比率(%)288.7931112.0942931.8753336.2661010.99合計91100.0067組距數(shù)列總體按組距式分組而形成的變量數(shù)列,每個組是由若干個變量值形成的區(qū)間表示,在變量個數(shù)較多、變動幅度較大時采用某農(nóng)機企業(yè)工人日平均加工零件量日平均加工零件量(個)工人數(shù)(人)比率(%)30~4066.5940~501415.3850~603032.9760~702729.6770~801415.38合計91100.00數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)統(tǒng)計分組作用與分組標志的選擇
69統(tǒng)計分組根據(jù)研究任務的要求和現(xiàn)象總體內(nèi)在的特點,將統(tǒng)計總體按照一定的標志劃分為若干組成部分的一種統(tǒng)計分析方法。統(tǒng)計分組同時有兩方面的含義:對客觀現(xiàn)象總體而言是“分”,即將現(xiàn)象總體分為性質(zhì)相異的若干部分,而對構成總體的每個個體而言是“合”,即將性質(zhì)相同的許多個體組合為一組。總→分個→合71劃分社會經(jīng)濟現(xiàn)象的類型揭示社會經(jīng)濟現(xiàn)象的內(nèi)部結構分析研究現(xiàn)象間的依存關系統(tǒng)計分組的作用72社會經(jīng)濟現(xiàn)象存在著復雜多樣的類型,各種不同的類型有著不同的特點及不同的發(fā)展規(guī)律。在整理大量統(tǒng)計資料時,有必要運用統(tǒng)計分組法將所研究的現(xiàn)象總體劃分為不同的類型組來進行研究。在社會經(jīng)濟類型分組中,最重要的是按生產(chǎn)資料的所有制形式進行分組。例如,我國經(jīng)濟成分分為公有制經(jīng)濟和非公有制經(jīng)濟兩大類型;工業(yè)分為輕工業(yè)和重工業(yè)兩大類型;社會產(chǎn)品劃分為生產(chǎn)資料和生活資料兩大類;農(nóng)業(yè)劃分為農(nóng)、林、牧、漁四大類型等等。劃分社會經(jīng)濟現(xiàn)象的類型表3.2上海市農(nóng)業(yè)總產(chǎn)值資料表單位:億元類型2014年2015年2016年2017年種植業(yè)169.51162.04148.53141.18林業(yè)8.7812.1513.2014.94牧業(yè)69.9365.6162.6240.86漁業(yè)62.5051.7950.1653.27農(nóng)林牧漁服務業(yè)11.5011.0310.5711.34合計322.22302.62285.09261.5973社會經(jīng)濟現(xiàn)象所包括的大量單位,不但在性質(zhì)上不盡相同,而且在總體中所占比重也不一樣。各組所占比重大小不同,說明它們在總體中所處的地位不同,對總體分布特征的影響也不同,其中所占比重相對大的部分,決定著總體的性質(zhì)或結構類型。如表是改革開放以來我國第一、第二、第三產(chǎn)業(yè)比例構成資料,從資料中大致可以看出國民經(jīng)濟內(nèi)部產(chǎn)業(yè)結構隨著時間的推移不斷地發(fā)生變化,尤其明顯的是,第三產(chǎn)業(yè)的比例在逐漸上升,說明人民的消費水平在不斷提高。揭示社會經(jīng)濟現(xiàn)象的內(nèi)部結構74揭示社會經(jīng)濟現(xiàn)象的內(nèi)部結構國內(nèi)生產(chǎn)總值中各產(chǎn)業(yè)比例構成表
1992年1997年2002年2007年2012年2017年第一產(chǎn)業(yè)21.317.913.310.39.47.9第二產(chǎn)業(yè)43.147.144.546.945.340.5其中:工業(yè)38.041.439.341.338.733.9建筑業(yè)5.25.85.35.76.86.7第三產(chǎn)業(yè)35.635.042.242.945.351.6其中:交通運輸、倉儲和郵電業(yè)6.25.26.25.44.44.4批發(fā)和零售業(yè)8.87.98.27.79.29.475社會經(jīng)濟現(xiàn)象不是孤立存在的,而是相互依存、相互制約的。分析研究現(xiàn)象之間的依存關系的方法很多,如相關與回歸分析法、指數(shù)因素分析法、分組分析法等,其中統(tǒng)計分組分析法是最基本的方法,是進行其他分析法的基礎。例如,某地茶葉產(chǎn)量與有效土層之間的依存關系分析研究現(xiàn)象間的依存關系表3.4茶葉產(chǎn)量與有效土層的關系有效土層厚度(cm)茶葉產(chǎn)量指數(shù)38~40154~571.2960~821.6885~1202.0576正確選擇分組標志的原則:選擇能夠反映現(xiàn)象本質(zhì)特征的分組標志選擇能夠滿足統(tǒng)計研究目的所需要的分組標志結合現(xiàn)象所處的歷史條件和經(jīng)濟條件,選擇具有現(xiàn)實意義的分組標志正確選擇分組標志是使統(tǒng)計分組作用得以充分發(fā)揮的關鍵,也是使統(tǒng)計研究獲得正確結論的前提。正確選擇分組標志的意義77序號按性別分組按文化程度分組按技術等級分組按工資收人分組按工齡分組1234合計按品質(zhì)標志分組按數(shù)量標志分組統(tǒng)計分組的種類78序號職工按性別分組1
2
合計
簡單分組序號男性女性
助理教師中級教師副高級教師正高級教師助理教師中級教師副高級教師正高級教師1
2
3
4
5
合計
復合分組數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)數(shù)據(jù)處理與統(tǒng)計分析——統(tǒng)計整理&尿布啤酒一、對數(shù)據(jù)進行排序1.對定性數(shù)據(jù)按照習慣的文字順序進行排列2.對于定量數(shù)據(jù),我們按照從小到大或者是從大到小的順序進行排列二、對排序后的數(shù)據(jù)進行統(tǒng)計分組注意(1)定性數(shù)據(jù)—屬性(2)定量數(shù)據(jù)—數(shù)值1.分組標志的選擇(1)組內(nèi)差異—盡可能?。?)組間差異—盡可能大2.分組界限的確定三、頻數(shù)分布的編制依次統(tǒng)計頻數(shù)、頻率、累計頻數(shù)、累計頻率以及他的組中值。將原始資料按大小順序排列850870910910940950960970101010101030
1050105010501060106010601070107010901100110011101180119012101280月工資額(元)職工人數(shù)(人)比率%累計人數(shù)(人)累計比率%組中值(元)800~900310310850900~1000723.31033.39501000~11001343.32376.610501100~1200516.72893.311501200~130026.7301001250合計30100---某農(nóng)業(yè)企業(yè)職工月工資額情況統(tǒng)計表
直方圖
折線圖
曲線圖
餅圖月份利潤(百萬)7月2.08月2.19月2.210月2.111月2.312月2.4利潤(百萬)利潤(百萬)利潤(百萬)游戲種類滿意度射擊90%動作85%策略95%體育99%其他85%游戲種類滿意度射擊90%動作85%策略95%體育99%其他85%數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)單項式數(shù)列變量數(shù)列是將總體按數(shù)量標志分組,將分組后形成的各組變量值與該組中所分配的單位次數(shù)或頻數(shù),按照一定的順序相對應排列所形成的分配數(shù)列。數(shù)量標志的變異性體現(xiàn)在它自身不斷變動的數(shù)量上,故稱為變量數(shù)列。按數(shù)量標志分組時,根據(jù)數(shù)量標志的性質(zhì)與數(shù)據(jù)的變異大小,分為單項式分組數(shù)列組距式分組數(shù)列單項式數(shù)列是將變量值相同的單位歸類為一組,即一個變量值作為一組,并按按照一定順序排列形成的變量數(shù)列。變量數(shù)列由各組名稱(由變量值表示)和次數(shù)(或頻率)組成。頻率大小表明各組標志值對總體的相對作用程度,也可以表明各組標志值出現(xiàn)的概率大小。【例3-2】己知某單位50名員工家庭人口資料如下:23443125321222323345232432341321323353212431253213要求:根據(jù)以上資料編制變量數(shù)列。解:從資料中看出,家庭人口數(shù)量變動范圍較小,最少的為1人,最大的為5人,宜編制出單項式數(shù)列,按數(shù)值歸類,將數(shù)值相同的歸為一組,排序列表。對于離散型變量且變量不同取值個數(shù)較少時,宜采用單項式數(shù)列。符號表示變量一般用符合
變量的具體數(shù)值即變量值一般用符號
單位數(shù)即次數(shù)
意思是在所有數(shù)據(jù)中心某個數(shù)據(jù)出現(xiàn)的次數(shù),各組次數(shù)或頻數(shù)通常用符號
表3-6某單位家庭人口分布表單項式變量數(shù)列的編制比較明確、容易。但是用連續(xù)變量分組來編制分配數(shù)列時,或者雖是離散變量,但數(shù)值很多,變化范圍很大時,變量值不能一一列舉,單項數(shù)列就不能適用,需要將變量進行合并,采用組距數(shù)列的形式。表3-6某單位家庭人口分布表數(shù)據(jù)處理與統(tǒng)計分析(農(nóng)業(yè)經(jīng)濟方向)組距分組涉及的重要概念編制組距數(shù)列牽涉的問題較多,其中分組標志的選擇最為重要,此外還要看分組界限的確定是否合理。在組距數(shù)列的編制過程中一般要處理好以下幾個問題。組距數(shù)列的編制:組距和組數(shù)等距分組和異距分組組限和組中值104組數(shù)的確定和組距有密切的聯(lián)系。組距大則組數(shù)少,組距小則組數(shù)多,兩者成反比例關系。在具體確定組距時,應使組距能體現(xiàn)組內(nèi)資料的同質(zhì)性和組與組之間資料的差異性。組距和組數(shù)105【例3-1】按百分制記分,某班40位學生統(tǒng)計學考試成績分別如下:89887699746082608986939994827779977895928784796598675972848556817773656683637970根據(jù)考試成績性質(zhì)的不同,在60分的數(shù)量界限基礎上分為不及格、及格、中等、良好、無秀五個類型,并將組數(shù)k定為5,則組距h=(99-56)÷5=8.6,為便于計算,組距宜取5或10的倍數(shù),而且第一組的下限應低于最小變量值,最后一組的上限應高于最大變量值,因此組距可取10,則基本上能反映學生成績分布特征??梢跃幹迫绫硭镜慕M距數(shù)列。某班學生統(tǒng)計學考試成績表考分(分)人數(shù)(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合計40100.0表3-13組距和組數(shù)某村人口分布狀況表人口按年齡分組(歲)人口數(shù)(人)1以下(嬰兒組)121~7(幼兒組)417~17(學齡少兒組)17517~55(有勞動能力的人口組)76555以上(老年組)296合計1289表3-14組距數(shù)列根據(jù)組距是否相等,分為等距數(shù)列和異距數(shù)列兩種。等距數(shù)列中各組組距是相等的(如表1所示),異距數(shù)列中每組的組距是不全相等的(如表2所示)等距分組和異距分組次數(shù)密度=各組次數(shù)/各
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工培訓計劃表-培訓項目規(guī)劃表
- 2025年內(nèi)江貨運資格證模擬考試題
- 物資領用與報廢管理表
- 2025年阿壩貨運資格證題庫在線練習
- 2025年孝感道路運輸貨運從業(yè)資格證模擬考試題庫
- 大數(shù)據(jù)分析平臺上的預測模型構建
- 重大市場營銷活動策劃與執(zhí)行方案
- 企業(yè)規(guī)范化規(guī)章制度匯編
- 人力資源行業(yè)招聘與人力資源服務平臺開發(fā)方案
- 建筑工程安明施工協(xié)議書
- 體重管理健康科普教育
- 大學數(shù)學《概率論與數(shù)理統(tǒng)計》說課稿
- 深大基坑設計施工關鍵技術孫加齊
- 《神經(jīng)外科常見疾病》課件
- DL-T5707-2014電力工程電纜防火封堵施工工藝導則
- 職業(yè)素養(yǎng)提升第2版(大學生職業(yè)素養(yǎng)指導課程)全套教學課件
- 西師版小學數(shù)學六年級下冊單元測試卷(含答案)
- 2024年公安機關理論考試題庫500道【綜合卷】
- 2024年四川成都市公共交通集團有限公司招聘筆試參考題庫含答案解析
- 第2章導游(課件)《導游業(yè)務》(第五版)
- 2023年北京重點校初二(下)期中數(shù)學試卷匯編:一次函數(shù)
評論
0/150
提交評論