統(tǒng)計學(xué)第二章 數(shù)據(jù)的收集與整理_第1頁
統(tǒng)計學(xué)第二章 數(shù)據(jù)的收集與整理_第2頁
統(tǒng)計學(xué)第二章 數(shù)據(jù)的收集與整理_第3頁
統(tǒng)計學(xué)第二章 數(shù)據(jù)的收集與整理_第4頁
統(tǒng)計學(xué)第二章 數(shù)據(jù)的收集與整理_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2-1 復(fù)習(xí)復(fù)習(xí) 2-2 對某系學(xué)生情況的進(jìn)行統(tǒng)計調(diào)查,抽取若干 學(xué)生進(jìn)行問卷調(diào)查。 則某系全體學(xué)生是( ), 問卷中,要求同學(xué)填寫生源地是( ), 抽取的某位同學(xué)的性別為男是( ), 該系學(xué)生上學(xué)期及格率是( ), 某系的男生比例為30%是( )。 A 總體 B 樣本 C 標(biāo)志 D 指標(biāo) E 標(biāo)志值(標(biāo)志表現(xiàn)) F 指標(biāo)值 2-3 2第二章第二章 數(shù)據(jù)的收集和整理數(shù)據(jù)的收集和整理 通過本章的學(xué)習(xí),我們應(yīng)該知道:通過本章的學(xué)習(xí),我們應(yīng)該知道: 數(shù)據(jù)來源數(shù)據(jù)來源 數(shù)據(jù)是如何收集的數(shù)據(jù)是如何收集的 數(shù)據(jù)是如何整理的數(shù)據(jù)是如何整理的 1. 如何做次數(shù)分布表如何做次數(shù)分布表 S t a t i s t

2、 i c s 2-4 有組織、有組織、 有計劃地有計劃地 搜集資料。搜集資料。 要求:準(zhǔn)確、要求:準(zhǔn)確、 完整、及時完整、及時 對調(diào)查資料對調(diào)查資料 去偽存真、去偽存真、 去粗取精、去粗取精、 科學(xué)分類、科學(xué)分類、 濃縮簡化濃縮簡化 描述性分析描述性分析 推斷分析、推斷分析、 決策分析。決策分析。 要求:定性要求:定性 定量結(jié)合定量結(jié)合 2-5 一、數(shù)據(jù)來源一、數(shù)據(jù)來源 Data Sources 數(shù)據(jù)數(shù)據(jù) 來源來源 直接來源直接來源 (原始資料)(原始資料) 間接來源間接來源 (次級資料)(次級資料) 試驗(yàn)試驗(yàn) 出版物出版物 (或者網(wǎng)上或者網(wǎng)上) 問卷調(diào)查問卷調(diào)查觀察觀察 2-6 二、數(shù)據(jù)收集

3、方法二、數(shù)據(jù)收集方法 2-7 直接觀察法直接觀察法 2-8 調(diào)查者調(diào)查者強(qiáng)制、約束強(qiáng)制、約束 報告法報告法 2-9 采訪法采訪法 調(diào)查者調(diào)查者被調(diào)查者被調(diào)查者 平等合作平等合作 返回 口頭詢問口頭詢問 自填問卷自填問卷 2-10 危害自身健康危害自身健康 影響他人健康影響他人健康 浪費(fèi)錢財浪費(fèi)錢財 容易引起火災(zāi)容易引起火災(zāi) 破壞家庭團(tuán)結(jié)破壞家庭團(tuán)結(jié) 容易控制,容易控制, 但不易全面但不易全面 調(diào)查問卷的問題類型:調(diào)查問卷的問題類型: 容易造成人際容易造成人際 關(guān)系緊張關(guān)系緊張 不易控制,不易控制, 但內(nèi)容豐富但內(nèi)容豐富 您認(rèn)為吸煙有哪您認(rèn)為吸煙有哪 些害處?些害處? 危害自身健康危害自身健康

4、影響他人健康影響他人健康 浪費(fèi)錢財浪費(fèi)錢財 容易引起火災(zāi)容易引起火災(zāi) 破壞家庭團(tuán)結(jié)破壞家庭團(tuán)結(jié) 其他其他 。 2-11 2-12 其他統(tǒng)計方法:登記法、電話訪問、網(wǎng)絡(luò)調(diào) 查、試驗(yàn)設(shè)計,等等 學(xué)校統(tǒng)計畢業(yè)生就業(yè)情況,一般流程:學(xué)生簽署三方協(xié)議 后通知輔導(dǎo)員,向輔導(dǎo)員遞交相關(guān)材料,由輔導(dǎo)員定期整 理本學(xué)院畢業(yè)生的就業(yè)情況,并向?qū)W校就業(yè)辦公室上報數(shù) 據(jù)。在該項(xiàng)統(tǒng)計工作中用到了哪些數(shù)據(jù)收集方法? 2-13 按調(diào)查單位的范圍大小分為 按調(diào)查時間是否連續(xù)分為 三、統(tǒng)計調(diào)查的種類三、統(tǒng)計調(diào)查的種類 2-14 2-15 統(tǒng)計調(diào)查的各種形式 普 查 統(tǒng)計報表 抽樣調(diào)查 重點(diǎn)調(diào)查 典型調(diào)查 2-16 普查(cen

5、sus) 特點(diǎn):全面調(diào)查 一次性調(diào)查(非經(jīng)常性調(diào)查) 概念: 指國家為詳盡了解某項(xiàng)重要的國情國力 而專門組織的一次性全面全面調(diào)查 建立專門機(jī)構(gòu),配備專門人員調(diào)查。 原則:規(guī)定統(tǒng)一的標(biāo)準(zhǔn)時點(diǎn)。 規(guī)定統(tǒng)一的普查期限,盡可能快地完成。 規(guī)定調(diào)查的項(xiàng)目和指標(biāo)。 2-17 由政府部門組織,采用統(tǒng)一的表格,自 上而下布置,自下而上報告。 任務(wù): 搜集國民經(jīng)濟(jì)和社會發(fā)展基本情況的資 料,為制訂國民經(jīng)濟(jì)和社會發(fā)展計劃和 檢查計劃執(zhí)行情況服務(wù)。 特點(diǎn): 概念: 統(tǒng)計報表制度(statistical report forms) 來源基層 逐級上報 經(jīng)常性調(diào)查 2-18 抽樣調(diào)查(sampling survey)

6、含義: 是一種非全面調(diào)查,根據(jù)某種原則抽取一部分單 位作為樣本進(jìn)行光差,然后根據(jù)樣本數(shù)據(jù)推算總 特特征。 特點(diǎn): 1 (隨機(jī)抽樣)按照隨機(jī)原則從總體種選擇樣本; 2 以樣本指標(biāo)(統(tǒng)計量)為依據(jù),估計總體特征 3 抽樣誤差可以事先計算并加以控制。 作用: 不可能或不必要做全面調(diào)查的(無限總體;破壞 性實(shí)驗(yàn)) 修正普查資料 2-19 抽樣調(diào)查的組織方式 1 簡單隨機(jī)抽樣; 2 系統(tǒng)抽樣; 3 分層抽樣; 4 整群抽樣; 調(diào)查一個班的學(xué)生(共調(diào)查一個班的學(xué)生(共60人,其中男生人,其中男生10人,女生人,女生50人)情況,人)情況, 需要抽取需要抽取12位同學(xué)作為樣本位同學(xué)作為樣本 抽簽決定 學(xué)號為

7、2,7,12,17,22,27 男生中隨機(jī)抽取2人,女生中隨機(jī)抽取10人 抽取一個男生宿舍,一個女生宿舍的同學(xué) 2-20 抽樣調(diào)查 優(yōu)點(diǎn):經(jīng)濟(jì)性 時效性 準(zhǔn)確性 靈活性 原則:隨機(jī) 最大抽樣效果(最小抽樣誤差) 2-21 重點(diǎn)調(diào)查(key point survey) 概念:在總體中選擇個別或部分重點(diǎn)單位進(jìn)行非全 面調(diào)查。重點(diǎn)單位指在總體中這些單位的標(biāo) 志值在標(biāo)志總量中占有絕大比重。 能以較少的投入和較快的速度取得總體基 本情況及變動趨勢的資料;只適用于客觀 存在重點(diǎn)單位的情況(適用于存在類似 “寡頭”或者“壟斷”的情況) 特點(diǎn): 2-22 典型調(diào)查(model survey) 概念: 在初步分

8、析的基礎(chǔ)上,有意識地選擇代表性的 典型單位進(jìn)行非全面調(diào)查。對于典型單位的挑 選,更多地取決于主觀判斷 作用:適宜于研究處于萌芽狀態(tài)事物和傾向性問題; 起步早起步早 措施力措施力 效果好效果好重慶合川市思居村新農(nóng)村建設(shè)典型調(diào)查重慶合川市思居村新農(nóng)村建設(shè)典型調(diào)查 農(nóng)村信息化建設(shè)調(diào)查分析農(nóng)村信息化建設(shè)調(diào)查分析以湖北省仙桃市的以湖北省仙桃市的5個村鎮(zhèn)為典型個村鎮(zhèn)為典型 調(diào)查對象調(diào)查對象 2-23 總體單位總體單位 調(diào)查單位調(diào)查單位 2-24 總體單位總體單位 調(diào)查單位調(diào)查單位 報表制度報表制度 可以全面調(diào)查,但可以全面調(diào)查,但 通常是調(diào)查限定規(guī)通常是調(diào)查限定規(guī) 模以上的總體單位模以上的總體單位 2-2

9、5 總體單位總體單位 調(diào)查單位調(diào)查單位 普普 查查 對全部單位對全部單位 進(jìn)行調(diào)查進(jìn)行調(diào)查 2-26 總體單位總體單位 調(diào)查單位調(diào)查單位 重點(diǎn)調(diào)查重點(diǎn)調(diào)查 只調(diào)查重點(diǎn)單位(單位只調(diào)查重點(diǎn)單位(單位 數(shù)不多但其標(biāo)志量占標(biāo)數(shù)不多但其標(biāo)志量占標(biāo) 志總量比重較大的單位)志總量比重較大的單位) 2-27 總體單位總體單位 調(diào)查單位調(diào)查單位 典型調(diào)查典型調(diào)查 對典型單位進(jìn)行調(diào)對典型單位進(jìn)行調(diào) 查,典型單位的選查,典型單位的選 擇并不一定按規(guī)模擇并不一定按規(guī)模 2-28 總體單位總體單位 調(diào)查單位調(diào)查單位 抽樣調(diào)查抽樣調(diào)查 按隨機(jī)原則選擇調(diào)按隨機(jī)原則選擇調(diào) 查單位,各單位被查單位,各單位被 選中的機(jī)會相同。

10、選中的機(jī)會相同。 2-29 統(tǒng)計調(diào)查的組織形式統(tǒng)計調(diào)查的組織形式 統(tǒng)計報表 普 查 重點(diǎn)調(diào)查 典型調(diào)查 抽樣調(diào)查 制度化的 經(jīng)常性調(diào)查 專門組織的 一次性調(diào)查 全面調(diào)查非全面調(diào)查 2-30 統(tǒng)計調(diào)查方案的設(shè)計統(tǒng)計調(diào)查方案的設(shè)計 組織調(diào)查之前統(tǒng)計調(diào)查方案的設(shè)計內(nèi)容: 1、明確調(diào)查目的(為什么調(diào)查?) 2、確定調(diào)查對象和調(diào)查單位(調(diào)查誰?) 3、確定調(diào)查項(xiàng)目(調(diào)查什么?) 4、確定調(diào)查方式,問卷設(shè)計(怎么調(diào)查?) 5、確定調(diào)查時間和調(diào)查期限 6、制定調(diào)查的組織實(shí)施計劃 統(tǒng)計調(diào)查方案:用來指導(dǎo)整個調(diào)查工作的綱領(lǐng)性統(tǒng)計調(diào)查方案:用來指導(dǎo)整個調(diào)查工作的綱領(lǐng)性 文件,是統(tǒng)計設(shè)計在統(tǒng)計調(diào)查階段的具體化文件,

11、是統(tǒng)計設(shè)計在統(tǒng)計調(diào)查階段的具體化 返回 2-31 調(diào)查誤差 抽樣誤差:由于隨機(jī)性原因產(chǎn)生的誤差 非抽樣誤差:由于各種操作環(huán)節(jié)失誤,或設(shè) 計不合理等原因造成的誤差 2-32 二手統(tǒng)計資料來源 查閱公開出版物;查閱公開出版物; 向政府統(tǒng)計機(jī)構(gòu)咨詢;向政府統(tǒng)計機(jī)構(gòu)咨詢; 向其他機(jī)構(gòu)咨詢;向其他機(jī)構(gòu)咨詢; 網(wǎng)上查詢。網(wǎng)上查詢。 2-33 返回 2-34 2-35 2-36 2 數(shù)據(jù)的整理 數(shù)據(jù)整理的程序 2-37 數(shù)據(jù)分組數(shù)據(jù)分組 2-38 統(tǒng)計分組的種類 根據(jù)分組標(biāo)志的個數(shù)分類:根據(jù)分組標(biāo)志的個數(shù)分類: 簡單分組:僅按照一個標(biāo)志進(jìn)行分組簡單分組:僅按照一個標(biāo)志進(jìn)行分組 復(fù)合分組:按照兩個或兩個以上的

12、標(biāo)志進(jìn)行層疊分組復(fù)合分組:按照兩個或兩個以上的標(biāo)志進(jìn)行層疊分組 根據(jù)分組標(biāo)志的性質(zhì)分類:根據(jù)分組標(biāo)志的性質(zhì)分類: 品質(zhì)標(biāo)志分組:如上市公司的行業(yè)分類品質(zhì)標(biāo)志分組:如上市公司的行業(yè)分類 數(shù)量標(biāo)志分組:人口按年齡分組數(shù)量標(biāo)志分組:人口按年齡分組 2-39 數(shù)量分組數(shù)量分組 品質(zhì)分組品質(zhì)分組 分分 類類 異距分組異距分組 等距分組等距分組 組距分組組距分組 單項(xiàng)分組單項(xiàng)分組 分組方法分組方法 一般原則: 窮盡原則:各有歸屬,不能遺漏任何一個單位 互斥原則:一個單位不能歸屬于幾個組 標(biāo)志表現(xiàn)只標(biāo)志表現(xiàn)只 有一個值有一個值 標(biāo)志表現(xiàn)在標(biāo)志表現(xiàn)在 一個區(qū)間一個區(qū)間 組距?組限? 變量值變動變量值變動 區(qū)間

13、的長度區(qū)間的長度 相等相等 2-40 指每組兩端表示各組界限的變量值,各組指每組兩端表示各組界限的變量值,各組 的最小值為下限,最大值為上限的最小值為下限,最大值為上限 每組變量值變動區(qū)間的長度,為上下限每組變量值變動區(qū)間的長度,為上下限 之差之差 連續(xù)式分組組距d=上限-下限 間斷式分組組距d=上限-下限+1 2-41 數(shù)據(jù)一共分為多少組數(shù)據(jù)一共分為多少組 每組變量取值范圍的中點(diǎn)數(shù)值每組變量取值范圍的中點(diǎn)數(shù)值 2 下限上限 組中值= 對于等距分組,組數(shù)n=R/d, 其中R為全距,即R=最大標(biāo)志值-最小標(biāo)志值 d=組距 顯然組距越大,組數(shù)越小,怎樣選擇組距和組數(shù)比較合理? Nnlg33.31

14、其中N為樣本單位數(shù) 注意:連續(xù)型變量 分組時上限的選取 2-42 變量數(shù)列中的組距數(shù)列組距數(shù)列編制比較復(fù)雜,下面主要研究它: (1)排序,找到最大最小值 (2) 組數(shù)的確定 在按實(shí)際情況稍做調(diào)整 (3)組距的確定 R=Xmax-Xmin i=R/n(小數(shù)進(jìn)一) (4)組限的確定 (5)數(shù)出在每一組中的個體數(shù)(頻數(shù)),計算頻率,列表整 理得到等距數(shù)列 Nnlg33.31 2-43 q對于離散變量,相鄰組組限可以間斷,也可重疊; q對于連續(xù)變量,相鄰組組限必須重疊; q符合“上組限不計入”原則; q首末兩組可使用“以下”及“以上”的開 口組。 2-44 【例】根據(jù)抽樣調(diào)查,某鎮(zhèn)【例】根據(jù)抽樣調(diào)查,

15、某鎮(zhèn)6060戶居民月消費(fèi)資料如下,要戶居民月消費(fèi)資料如下,要 求編制變量數(shù)列,形成次數(shù)分布。求編制變量數(shù)列,形成次數(shù)分布。 753753845845740740723723891891860860563563556556 670670998998663663790790925925589589683683776776 700700703703639639807807708708715715643643661661 545545671671780780708708667667701701500500612612 650650840840778778777777775775889889653653

16、631631 948948827827910910698698760760623623415415523523 763763738738647647835835770770878878578578569569 805805516516768768775775 2-45 第一步,先將第一步,先將6060個數(shù)據(jù)排序,找出最大值個數(shù)據(jù)排序,找出最大值998998和最小值和最小值415415, 這個數(shù)列的全距這個數(shù)列的全距R R998-415998-415583583厘米。厘米。 第二步,確定組數(shù)和組距:第二步,確定組數(shù)和組距: 根據(jù)公式:根據(jù)公式:n = 1 + 3.33n = 1 + 3.33(l

17、g60)(lg60)7, 再根據(jù)實(shí)際情況調(diào)整(因?yàn)槿嘣俑鶕?jù)實(shí)際情況調(diào)整(因?yàn)槿?83583,分,分6 6組可使每組組距組可使每組組距 為為100100,分組后組限可取整)取組數(shù)為,分組后組限可取整)取組數(shù)為6 6,組距為,組距為100100 第三步,確定組限:第三步,確定組限: 第一組組限定為第一組組限定為400500400500; 第二組第二組500600500600;依此類推,;依此類推, 第六組為第六組為90010009001000 也可以也可以 第一組組限定為第一組組限定為500以下,第六組為以下,第六組為900及以上及以上 2-46 第四步,進(jìn)行歸組,即將各個變量值歸入相應(yīng)的組中

18、,數(shù)第四步,進(jìn)行歸組,即將各個變量值歸入相應(yīng)的組中,數(shù) 出各個組中變量的個數(shù),即為頻數(shù)。出各個組中變量的個數(shù),即為頻數(shù)。 第五步,計算頻率。將各組頻數(shù)除以總樣本個數(shù),即為頻第五步,計算頻率。將各組頻數(shù)除以總樣本個數(shù),即為頻 率率 各組單位數(shù)占總體單位總數(shù)的比重各組單位數(shù)占總體單位總數(shù)的比重 頻率=頻數(shù)/總樣本個數(shù) 單位組距中的頻數(shù)單位組距中的頻數(shù) 某組頻數(shù)密度=該組頻數(shù)/該組組距 單位組距中的頻率單位組距中的頻率 某組頻率密度=該組頻率/該組組距 2-47 月消費(fèi)(元)月消費(fèi)(元)戶數(shù)戶數(shù)頻率(頻率(%) 400-50011.7 500-600813.3 600-7001525.0 700-8

19、002135.0 800-9001118.3 900-100046.7 合計合計60100 居民月消費(fèi)分布表居民月消費(fèi)分布表 2-48 第六步,繪圖:一般繪制散點(diǎn)、折線或柱狀圖第六步,繪圖:一般繪制散點(diǎn)、折線或柱狀圖 如果是等距分組,如果是等距分組,EXCEL繪制折線圖、散點(diǎn)圖或柱繪制折線圖、散點(diǎn)圖或柱 狀圖基本相似。但散點(diǎn)圖需要再計算組中值,以組中狀圖基本相似。但散點(diǎn)圖需要再計算組中值,以組中 值為橫坐標(biāo)值為橫坐標(biāo) 如果不是等距分組,則一般繪制散點(diǎn)圖,需要計算如果不是等距分組,則一般繪制散點(diǎn)圖,需要計算 組中值,以組中值為橫坐標(biāo)。組中值,以組中值為橫坐標(biāo)。 在其他分組類型中需要具體情況具體分

20、析。例如:在其他分組類型中需要具體情況具體分析。例如: 如果進(jìn)行品質(zhì)分組,無法繪制散點(diǎn)圖,只能繪制折線如果進(jìn)行品質(zhì)分組,無法繪制散點(diǎn)圖,只能繪制折線 圖或柱狀圖,還可以通過繪制餅圖表現(xiàn)分組后的結(jié)構(gòu)。圖或柱狀圖,還可以通過繪制餅圖表現(xiàn)分組后的結(jié)構(gòu)。 單項(xiàng)式分組,一般繪制折線圖或柱狀圖,也可以通過單項(xiàng)式分組,一般繪制折線圖或柱狀圖,也可以通過 繪制餅圖表現(xiàn)分組后的結(jié)構(gòu)。繪制餅圖表現(xiàn)分組后的結(jié)構(gòu)。 2-49 表示低于某分組上限的頻數(shù)與頻率。表示低于某分組上限的頻數(shù)與頻率。 表示高于某分組下限的頻數(shù)與頻率。表示高于某分組下限的頻數(shù)與頻率。 2-50 消費(fèi)分組消費(fèi)分組頻數(shù)頻數(shù) 頻率頻率 (%)(%) 向

21、上累積向上累積向下累積向下累積 頻數(shù)頻數(shù) 頻率頻率 /%/% 頻數(shù)頻數(shù) 頻率頻率 /%/% 400-500400-5001 11.71 1 500-600500-6008 813.39 9 600-700600-700151525.02424 700-800700-800212135.0 800-900800-900111118.3 900-1000900-10004 46.7 合計合計6060100 2-51 消費(fèi)分組消費(fèi)分組頻數(shù)頻數(shù) 頻率頻率 (%)(%) 向上累積向上累積向下累積向下累積 頻數(shù)頻數(shù) 頻率頻率 /%/% 頻數(shù)頻數(shù) 頻率頻率 /%/% 400-500400-5001 11.7

22、1 11.71.7 500-600500-6008 813.39 915.015.0 600-700600-700151525.0242440.040.0 700-800700-800212135.0454575.075.05050 800-900800-900111118.3565693.393.31515 900-1000900-10004 46.760601001004 4 合計合計6060100 2-52 消費(fèi)分組消費(fèi)分組頻數(shù)頻數(shù) 頻率頻率 (%)(%) 向上累積向上累積向下累積向下累積 頻數(shù)頻數(shù) 頻率頻率 /%/% 頻數(shù)頻數(shù) 頻率頻率 /%/% 400-500400-5001 11.76060100100 500-600500-6008 813.3595998.398.3 600-700600-700151525.0515185.085.0 700-800700-800212135.0363660.060.0 800-900800-900111118.3151525.025.0 900-1000900-10004 46.74 46.76.7 合計合計6060100 2-53 消費(fèi)分組消費(fèi)分組頻數(shù)頻數(shù) 頻率頻率 (%)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論