統(tǒng)計學課件 ch3 數(shù)據(jù)整理與顯示_第1頁
統(tǒng)計學課件 ch3 數(shù)據(jù)整理與顯示_第2頁
統(tǒng)計學課件 ch3 數(shù)據(jù)整理與顯示_第3頁
統(tǒng)計學課件 ch3 數(shù)據(jù)整理與顯示_第4頁
統(tǒng)計學課件 ch3 數(shù)據(jù)整理與顯示_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計學

Statistics黃曉莉主講2023/2/312023/2/32第3章數(shù)據(jù)的整理與顯示數(shù)據(jù)整理是將收集的各種原始數(shù)據(jù)條理化、系統(tǒng)化,使之符合統(tǒng)計分析的要求。通過整理可以大大簡化數(shù)據(jù),更有效地提供統(tǒng)計信息。教學內容3.1數(shù)據(jù)預處理3.2數(shù)據(jù)分組3.3頻數(shù)分布3.4數(shù)據(jù)的顯示學習目標1.理解數(shù)據(jù)分組的原則、分類2.熟悉并會判斷頻數(shù)分布的類型3.掌握并會編制組距式分布數(shù)列4.會繪制統(tǒng)計圖表2023/2/35數(shù)據(jù)整理的程序審核統(tǒng)計資料對資料進行分組匯總積累、保管和公布統(tǒng)計資料編制統(tǒng)計表或繪制統(tǒng)計圖2023/2/363.1數(shù)據(jù)預處理數(shù)據(jù)預處理是數(shù)據(jù)整理的先期步驟,它是對數(shù)據(jù)分組前所做的必要處理,內容包括數(shù)據(jù)的審核、排序等工作。3.1.1數(shù)據(jù)審核數(shù)據(jù)審核是指對原始數(shù)據(jù)的審查和核對。審核的內容主要包含以下4個方面:(一)準確性審核(二)適用性審核(三)及時性審核(四)一致性審核(一)準確性審核準確性審核主要從數(shù)據(jù)的真實性與精確性角度檢查資料,其審核的重點是檢查調查過程中所發(fā)生的誤差。準確性審查可包括以下幾個方面:1.邏輯性審核它是利用邏輯理論檢查數(shù)據(jù)之間有無矛盾。2.比較審查法它是數(shù)據(jù)之間進行比較方法審查。3.設置疑問框審查一般來說,數(shù)據(jù)之間存在一定取值范圍與比例關系,利用這種范圍和比例關系,可以設置疑問框,從而審查數(shù)據(jù)是否有疑問。(二)適用性審核審查數(shù)據(jù)的適用性,主要是根據(jù)數(shù)據(jù)的用途,檢查數(shù)據(jù)解釋說明問題的程度。具體包括數(shù)據(jù)與調查主題、與目標總體的界定、與調查項目的解釋等是否匹配。(三)及時性審核審查數(shù)據(jù)的及時性,主要是檢查數(shù)據(jù)是否按規(guī)定時間送報,如未按規(guī)定時間送報,就需檢查未按規(guī)定時間送報的原因。(四)一致性審核審查數(shù)據(jù)的一致性,主要是檢查數(shù)據(jù)在不同地區(qū)或根據(jù)、在不同時間段是否具有可比性。3.1.2數(shù)據(jù)排序數(shù)據(jù)排序是按一定規(guī)則,如大小、高低、優(yōu)劣等次序將數(shù)據(jù)排列,以便于研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索。2023/2/3133.2數(shù)據(jù)分組(重點)將總體中所有單位按一定的標志分為性質不同但又有聯(lián)系的若干部分的過程??傮w經(jīng)過分組,能夠突出組與組之間的差異而抽象掉組內各單位之間的差異,使數(shù)據(jù)變得條理化,便于進一步分析研究。(組間差異大、組內差異?。┙y(tǒng)計分組3.2.1數(shù)據(jù)分組的意義2023/2/3143.2數(shù)據(jù)分組

統(tǒng)計分組的原則:窮盡原則、互斥原則例:從業(yè)人員按文化程度分組小學畢業(yè)中學畢業(yè)(含中專)大學畢業(yè)文盲或識字不多小學畢業(yè)初中畢業(yè)高中畢業(yè)大專畢業(yè)本科畢業(yè)研究生及以上(×)(√)2023/2/3153.2數(shù)據(jù)分組例:某商場把服裝分為男裝①女裝童裝②成年裝(男、女裝)兒童裝(男、女裝)(√)(×)2023/2/3163.2數(shù)據(jù)分組在社會經(jīng)濟統(tǒng)計研究中,數(shù)據(jù)分組的作用在于:劃分現(xiàn)象的類型、研究總體的結構和現(xiàn)象之間的依存關系。2023/2/3173.2.2數(shù)據(jù)分組標志(統(tǒng)計分組的種類)分組的關鍵問題是選擇分組標志和確定各組的界限。選擇分組標志——統(tǒng)計分組的關鍵問題分組標志是將總體區(qū)分為不同的組別的標準或依據(jù)。選擇分組標志的原則是:結合一定的歷史條件或經(jīng)濟條件,根據(jù)統(tǒng)計研究的目的和任務,選用那些最能反映現(xiàn)象本質特征的標志作為分組標志。2023/2/3183.2.2數(shù)據(jù)分組標志(統(tǒng)計分組的種類)(一)品質標志分組:按品質特征分組(二)數(shù)量標志分組:按數(shù)量特征分組3.2.3數(shù)據(jù)分組體系(一)平行分組,簡單分組(二)復合分組,按兩個及以上標志分組例為了了解某地區(qū)銀行存款的構成,可以選用存款性質、期限兩個標志分別進行分組:按存款性質分組企業(yè)存款儲蓄存款財政性存款按存款期限分組活期存款定期存款簡單分組復合分組存款同時按其性質及期限分組企業(yè)存款活期定期儲蓄存款活期定期財政性存款活期定期例

企業(yè)職工按工齡分組:

5年以下

5~10年

10~15年

15~20年

20年以上品質標志分組數(shù)量標志分組2023/2/3192023/2/3203.3頻數(shù)分布(重點)在統(tǒng)計分組的基礎上,將總體所有的單位按某一標志進行歸類排列,稱為頻數(shù)分布,或次數(shù)分布。根據(jù)分組標志的特征不同,分布數(shù)列可分為屬性分布數(shù)列和變量分布數(shù)列兩種。

總體按某一標志所分的組兩個構成要素(常用x表示)

各組次數(shù)(頻數(shù))(有兩種表現(xiàn)形式:絕對數(shù)也稱頻數(shù),用f表示相對數(shù)稱為頻率,用f/∑f表示)2023/2/3213.3.1屬性分布數(shù)列屬性分布數(shù)列是按品質標志分組所形成的分布數(shù)列,簡稱品質數(shù)列。(一)定類尺度的頻數(shù)分布例P35-363.1(二)定序尺度的頻數(shù)分布例P36-373.22023/2/3223.3.2變量數(shù)列變量分布數(shù)列是按數(shù)量標志分組所形成的分布數(shù)列,它包括定距尺度和定比尺度分組所形成的頻數(shù)分布,即數(shù)值型數(shù)據(jù)頻數(shù)分布。(一)種類1.單項式:適用于離散型變量且變量變動范圍不大的場合。2.組距式:適用于連續(xù)型變量或者變動范圍較大的離散型變量。單項式分組:一個變量值列為一組。如:對居民家庭按家庭人口數(shù)進行分組:

1人2人3人4人5人及以上組距式分組:將全部變量值依次劃分為若干個區(qū)間,并將每一區(qū)間的變量值作為一組。如:工人按工資水平分組(連)

300-400400-500500-600600-700700-800適用于離散型變量,且變量值不多時。適用于連續(xù)型變量,或者變動范圍較大的離散型變量。2023/2/3232023/2/324(二)組距式數(shù)列的編制(難點)1.確定組數(shù):斯特杰斯經(jīng)驗公式n=1+3.3LgN2.確定組距:組距=(最大變量值-最小變量值)/(1+3.3LgN)等距數(shù)列與異距數(shù)列3.確定組限:上限與下限,組限重疊與否,分為連續(xù)組距式分組與不連續(xù)組距分組,“上組限不在內”原則4.計算組中值:缺下限開口組的組中值=上限-鄰組組距/2缺上限開口組的組中值=下限+鄰組組距/2①全距與組距②等距與異距③組限與組中值④開口組與閉口組⑤連續(xù)組距分組和不連續(xù)組距分組重疊組限

“上限不在內”原則關于組距式分組的幾個問題例:學生按成績分組(分)

(1)50-6060-70

70-8080-9090-100(2)60以下

60-6970-7980-89

90以上組距=80-70=10上限:80下限:70開口組閉口組組中值組中值組中值重疊組限值70歸于70—80組不連續(xù)組距式分組連續(xù)組距式分組2023/2/325注:關于劃分分組界限的問題

按品質標志分組,只要根據(jù)事物的性質劃分界限。目前我國實踐中有制定和實施的幾種最重要的、基礎性國家分類標準。按數(shù)量標志分組,要根據(jù)事物的數(shù)量變動來判斷事物性質上的差異。注意客觀界限。例:1、人口按年齡分組(歲):

0-6嬰幼兒

7-17少年兒童

18-59中青年

60以上老年2023/2/3262、學生按成績分組(分):

60以下

60-7070-8080-9090以上3、企業(yè)按產(chǎn)值計劃完成程度分組(%):

100以下

100-110110以上例:55-6060-6565-70……95-10055-6565-7575-8585-9595以上(×)(×)95-105105-115115以上(×)2023/2/3272023/2/3285.頻數(shù)計量累計頻數(shù)與累計頻率

1.向上累計與向下累計:向上累計頻數(shù)(頻率)分布,首先列出各組的上限,然后由標志值低的組向標志值高的組依次累計。向下累計頻數(shù)(頻率)分布,首先列出各組的下限,然后由標志值高的組向標志值低的組依次累計。2023/2/329

2.累計頻率與累計頻數(shù)的特點:1)累計頻數(shù)的特點第一組的累計頻數(shù)等于第一組本身的頻數(shù)。最后一組累計頻數(shù)等于總體單位數(shù)。

2)累計頻率的特點第一組的累計頻率等于第一組本身的頻率。最后一組累計頻率等于1。2023/2/3303.4數(shù)據(jù)的顯示3.4.1統(tǒng)計表

將統(tǒng)計數(shù)據(jù)按一定的順序排列在表格上,就形成了統(tǒng)計表。從廣義講,統(tǒng)計表包括統(tǒng)計工作各階段所使用的一切表格,有調查表、匯總表和分析表。本節(jié)將側重就表現(xiàn)統(tǒng)計整理結果所用的統(tǒng)計表進行討論。2023/2/3313.4數(shù)據(jù)顯示(一)統(tǒng)計表的構成

從統(tǒng)計表的形式上看,可由總標題(表頭)、橫行標題、縱列標題和指標數(shù)值四部分組成。此外,必要時可以在統(tǒng)計表下方加上表外附加。2023/2/3323.4數(shù)據(jù)顯示(一)統(tǒng)計表的構成表頭應放在表的上方,它是表的名稱,所說明的是表的主要內容;行標題通常安排在表的第一列,它說明數(shù)據(jù)是誰的或數(shù)據(jù)的時間,一般由研究問題的名稱、分組標志和數(shù)據(jù)時間等內容構成;列標題通常在表的第一行,所要表達的是什么數(shù)據(jù),一般由指標(變量)構成;數(shù)據(jù)資料則是指標或變量的具體數(shù)據(jù)。表外附加通常放在統(tǒng)計表的下方,主要包括資料來源、指標解釋和必要說明等內容。3.4數(shù)據(jù)顯示(二)統(tǒng)計表的設計:設計統(tǒng)計表總的要求是科學、實用、簡練、美觀。具體包括以下幾點:1.表頭應以較少的文字準確地概況出統(tǒng)計表的基本內容,一般應滿足3W的要求,即誰的數(shù)據(jù)(who)、什么時間的數(shù)據(jù)(when)和什么數(shù)據(jù)(what)。2.表的格式開口式;上下端線要粗表內一般不打橫線,但合計欄要打橫線2023/2/3343.4數(shù)據(jù)顯示

(二)統(tǒng)計表的設計:3.計量單位必須標明計量單位,若表中所有數(shù)據(jù)的計量單位相同,該計量單位標于表頭右側。若表中列標題的計量單位可寫在標題旁或下方。4.填表要求表中不應有空格,小數(shù)點位數(shù)一致……5.表的注釋統(tǒng)計表中數(shù)據(jù)的來源、指標解釋等內容一般放在統(tǒng)計表的下方,以表示對他人勞動的尊重,備讀著查閱使用。2023/2/3363.4數(shù)據(jù)顯示

圖1三次產(chǎn)業(yè)構成圖3.4.2統(tǒng)計圖

統(tǒng)計圖是以點、線、面積、體積等圖形表現(xiàn)數(shù)據(jù)的一種形式。對統(tǒng)計資料圖形化處理形成統(tǒng)計圖;(一)非數(shù)值型數(shù)據(jù)的統(tǒng)計圖:條形圖,餅圖圖2互聯(lián)網(wǎng)和電話用戶規(guī)模示意圖(一)非數(shù)值型數(shù)據(jù)的統(tǒng)計圖1.條形圖條形圖是用寬度相等、相互分離的條狀圖形的高度(或長度)來表示頻數(shù)分布的圖形。條形圖有單式、復式等形式,可以橫置或縱置,縱置時又稱為柱形圖。2.餅圖餅圖是以整個園的360度代表全部數(shù)據(jù)的總和,按照各組所占的百分比(頻率),把一個“餅”切割為各個扇形。(二)數(shù)值型數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論