統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理_第1頁(yè)
統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理_第2頁(yè)
統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理_第3頁(yè)
統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理_第4頁(yè)
統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理第一頁(yè),共五十三頁(yè),編輯于2023年,星期三第2章數(shù)據(jù)的搜集與整理2.1統(tǒng)計(jì)數(shù)據(jù)的收集2.2統(tǒng)計(jì)數(shù)據(jù)的整理第二頁(yè),共五十三頁(yè),編輯于2023年,星期三2.1統(tǒng)計(jì)數(shù)據(jù)的收集統(tǒng)計(jì)數(shù)據(jù)的直接來(lái)源統(tǒng)計(jì)數(shù)據(jù)的間接來(lái)源第三頁(yè),共五十三頁(yè),編輯于2023年,星期三一、統(tǒng)計(jì)數(shù)據(jù)的直接來(lái)源

兩個(gè)渠道:調(diào)查或觀察

-取得社會(huì)經(jīng)濟(jì)數(shù)據(jù)的重要手段實(shí)驗(yàn)

-取得自然科學(xué)數(shù)據(jù)的主要手段第四頁(yè),共五十三頁(yè),編輯于2023年,星期三(一)統(tǒng)計(jì)調(diào)查方式統(tǒng)計(jì)調(diào)查方式抽樣調(diào)查普查統(tǒng)計(jì)報(bào)表重點(diǎn)調(diào)查典型調(diào)查第五頁(yè),共五十三頁(yè),編輯于2023年,星期三1、抽樣調(diào)查

(Samplesurvey)(1)從總體中隨機(jī)抽取一部分單位(樣本)進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來(lái)推斷總體數(shù)量特征總體隨機(jī)樣本(2)目的是推斷總體的未知數(shù)字特征

(3)遵循隨機(jī)原則抽樣第六頁(yè),共五十三頁(yè),編輯于2023年,星期三(4)特點(diǎn)

-按隨機(jī)原則抽選調(diào)查單位

-用樣本推斷總體

-在調(diào)查前可計(jì)算和控制抽樣誤差第七頁(yè),共五十三頁(yè),編輯于2023年,星期三2、普查

(census)

1.專(zhuān)門(mén)組織進(jìn)行的一次性全面調(diào)查

2.相對(duì)于常規(guī)性調(diào)查

3.相對(duì)于經(jīng)常性調(diào)查

4.相對(duì)于非全面調(diào)查

5.我國(guó)已建立了周期性普查制度總體第八頁(yè),共五十三頁(yè),編輯于2023年,星期三3.統(tǒng)計(jì)表報(bào)

(Statisticalreportforms)

1.按照國(guó)家有關(guān)法規(guī)的規(guī)定,自上而下地統(tǒng)一布置、自下而上地逐級(jí)提供基本統(tǒng)計(jì)數(shù)據(jù)

2.是我國(guó)重要的數(shù)據(jù)收集方式

3.以原始數(shù)據(jù)為基礎(chǔ),按統(tǒng)一的表式、指標(biāo)、報(bào)送時(shí)間、程序填報(bào)第九頁(yè),共五十三頁(yè),編輯于2023年,星期三4.重點(diǎn)調(diào)查和典型調(diào)查

典型調(diào)查(Modelsurvey)從調(diào)查對(duì)象的全部單位中選擇若干有代表性的單位進(jìn)行調(diào)查目的是描述和揭示事物的本質(zhì)特征和規(guī)律調(diào)查結(jié)果不能用于推斷總體

重點(diǎn)調(diào)查(Key-pointinvestigation)從調(diào)查對(duì)象的全部單位中選擇少數(shù)重點(diǎn)單位進(jìn)行調(diào)查調(diào)查結(jié)果不能用于推斷總體第十頁(yè),共五十三頁(yè),編輯于2023年,星期三(二)數(shù)據(jù)的搜集方法數(shù)據(jù)的搜集方法詢(xún)問(wèn)調(diào)查訪問(wèn)調(diào)查觀察實(shí)驗(yàn)電話(huà)調(diào)查郵寄調(diào)查觀察座談會(huì)個(gè)別深訪實(shí)驗(yàn)第十一頁(yè),共五十三頁(yè),編輯于2023年,星期三訪問(wèn)調(diào)查

(Personalinterview)

1.調(diào)查者與被調(diào)查者通過(guò)面對(duì)面地交談而獲得資料

2.有標(biāo)準(zhǔn)式訪問(wèn)和非標(biāo)準(zhǔn)式訪問(wèn)標(biāo)準(zhǔn)式訪問(wèn)通常按事先設(shè)計(jì)好的問(wèn)卷進(jìn)行非標(biāo)準(zhǔn)式訪問(wèn)事先一般不制作問(wèn)卷對(duì)不起,打擾了!第十二頁(yè),共五十三頁(yè),編輯于2023年,星期三郵寄調(diào)查

(Mailsurvey)是一種標(biāo)準(zhǔn)化調(diào)查調(diào)查者與被調(diào)查者沒(méi)有直接的語(yǔ)言交流,信息的傳遞依賴(lài)于問(wèn)卷通過(guò)某種方式將調(diào)查表或問(wèn)卷送至某被調(diào)查者手中,由被調(diào)查者填寫(xiě),然后將問(wèn)卷寄回指定收集點(diǎn)問(wèn)卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專(zhuān)門(mén)場(chǎng)所分發(fā)三種

第十三頁(yè),共五十三頁(yè),編輯于2023年,星期三電話(huà)調(diào)查

(Telephonesurvey)調(diào)查者利用電話(huà)與被調(diào)查者進(jìn)行語(yǔ)言交流以獲得信息時(shí)效快、成本低問(wèn)題的數(shù)量不宜過(guò)多

您好!我是××調(diào)查公司的調(diào)查員…第十四頁(yè),共五十三頁(yè),編輯于2023年,星期三座談會(huì)

(Colloquia)將一組被調(diào)查者集中在調(diào)查現(xiàn)場(chǎng),讓他們對(duì)調(diào)查的主題發(fā)表意見(jiàn)以獲得資料人數(shù)不宜過(guò)多,一般為6~10人側(cè)重于定性研究第十五頁(yè),共五十三頁(yè),編輯于2023年,星期三個(gè)別深度訪問(wèn)

(PersonalInterviewing)一次只有一名受訪者參加、針對(duì)特殊問(wèn)題的調(diào)查適合于較隱秘的問(wèn)題側(cè)重于定性研究第十六頁(yè),共五十三頁(yè),編輯于2023年,星期三觀察法

(Observationalmethod)調(diào)查人員邊觀察邊記錄以收集所需信息能夠在被調(diào)查者不察覺(jué)的情況下獲得資料第十七頁(yè),共五十三頁(yè),編輯于2023年,星期三實(shí)驗(yàn)法

(Experimentalmethod)在設(shè)定的特殊實(shí)驗(yàn)場(chǎng)所、特殊狀態(tài)下,對(duì)調(diào)查對(duì)象進(jìn)行實(shí)驗(yàn)以獲得所需資料有室內(nèi)實(shí)驗(yàn)法和市場(chǎng)實(shí)驗(yàn)法第十八頁(yè),共五十三頁(yè),編輯于2023年,星期三(三)調(diào)查方案設(shè)計(jì)調(diào)查方案的內(nèi)容調(diào)查目的調(diào)查對(duì)象調(diào)查單位調(diào)查項(xiàng)目和調(diào)查表其他第十九頁(yè),共五十三頁(yè),編輯于2023年,星期三確定調(diào)查目的

(Objectiveofsurvey)調(diào)查要達(dá)到的具體目標(biāo)回答“為什么調(diào)查?”調(diào)查之前必須明確第二十頁(yè),共五十三頁(yè),編輯于2023年,星期三確定調(diào)查對(duì)象和調(diào)查單位調(diào)查對(duì)象(Respondent):調(diào)查研究的總體或調(diào)查范圍調(diào)查單位(Surveyunit):需要對(duì)之進(jìn)行調(diào)查的單位??梢允钦{(diào)查對(duì)象的全部單位(全面調(diào)查),也可以是調(diào)查對(duì)象中的一部分單位(非全面調(diào)查)回答“向誰(shuí)調(diào)查?”調(diào)查對(duì)象調(diào)查單位?第二十一頁(yè),共五十三頁(yè),編輯于2023年,星期三設(shè)計(jì)調(diào)查項(xiàng)目和調(diào)查表調(diào)查項(xiàng)目(Surveyitems):調(diào)查的具體內(nèi)容調(diào)查表(Questionnaire):表現(xiàn)調(diào)查項(xiàng)目的表格或問(wèn)卷回答“調(diào)查什么?”Q1…………Q2…………Q3…………Q4…………第二十二頁(yè),共五十三頁(yè),編輯于2023年,星期三二、統(tǒng)計(jì)數(shù)據(jù)的間接來(lái)源

1.公開(kāi)出版物:《中國(guó)統(tǒng)計(jì)年鑒》、《中國(guó)統(tǒng)計(jì)摘要》、《中國(guó)社會(huì)統(tǒng)計(jì)年鑒》、《中國(guó)工業(yè)經(jīng)濟(jì)統(tǒng)計(jì)年鑒》、《中國(guó)農(nóng)村統(tǒng)計(jì)年鑒》、《中國(guó)人口統(tǒng)計(jì)年鑒》、《中國(guó)市場(chǎng)統(tǒng)計(jì)年鑒》、《世界經(jīng)濟(jì)年鑒》、《國(guó)外經(jīng)濟(jì)統(tǒng)計(jì)資料》、《世界發(fā)展報(bào)告》……Internet

2.網(wǎng)絡(luò)中國(guó)統(tǒng)計(jì)年鑒2003中國(guó)人口統(tǒng)計(jì)年鑒中國(guó)市場(chǎng)統(tǒng)計(jì)年鑒世界發(fā)展報(bào)告世界經(jīng)濟(jì)年檢工業(yè)普查數(shù)據(jù)中國(guó)統(tǒng)計(jì)出版社第二十三頁(yè),共五十三頁(yè),編輯于2023年,星期三2.2統(tǒng)計(jì)數(shù)據(jù)的整理一、數(shù)據(jù)的預(yù)處理二、數(shù)據(jù)分組與頻數(shù)分布三、頻數(shù)分布的圖示和類(lèi)型第二十四頁(yè),共五十三頁(yè),編輯于2023年,星期三一、數(shù)據(jù)的預(yù)處理1.數(shù)據(jù)審核2.數(shù)據(jù)篩選3.數(shù)據(jù)排序第二十五頁(yè),共五十三頁(yè),編輯于2023年,星期三

數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征第二十六頁(yè),共五十三頁(yè),編輯于2023年,星期三1、數(shù)據(jù)審核—原始數(shù)據(jù)

(rawdata)審核的內(nèi)容完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫(xiě)齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等檢查是否存在異常值第二十七頁(yè),共五十三頁(yè),編輯于2023年,星期三1、數(shù)據(jù)的審核—二手?jǐn)?shù)據(jù)

(secondhanddata)適用性審核弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時(shí)效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)有否必要做進(jìn)一步的加工整理第二十八頁(yè),共五十三頁(yè),編輯于2023年,星期三2、數(shù)據(jù)篩選

(datafilter)當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來(lái),而不符合特定條件的數(shù)據(jù)予以剔除第二十九頁(yè),共五十三頁(yè),編輯于2023年,星期三數(shù)據(jù)篩選

(datafilter)用Excel進(jìn)行數(shù)據(jù)篩選

8名學(xué)生的考試成績(jī)數(shù)據(jù)

第三十頁(yè),共五十三頁(yè),編輯于2023年,星期三3、數(shù)據(jù)排序

(datarank)?按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索?排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類(lèi)或分組等提供依據(jù)?在某些場(chǎng)合,排序本身就是分析的目的之一?排序可借助于計(jì)算機(jī)完成第三十一頁(yè),共五十三頁(yè),編輯于2023年,星期三數(shù)據(jù)排序

(方法)(1)分類(lèi)數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫(huà)排序,其中也有筆畫(huà)多少的升序降序之分(2)數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)第三十二頁(yè),共五十三頁(yè),編輯于2023年,星期三二、數(shù)據(jù)分組與頻數(shù)分布數(shù)據(jù)分組與頻數(shù)分布第三十三頁(yè),共五十三頁(yè),編輯于2023年,星期三分組方法分組方法等距分組異距分組單變量值分組組距分組第三十四頁(yè),共五十三頁(yè),編輯于2023年,星期三單變量值分組

(要點(diǎn))?適合于離散變量?適合于變量值較少的情況第三十五頁(yè),共五十三頁(yè),編輯于2023年,星期三組距分組

(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~第三十六頁(yè),共五十三頁(yè),編輯于2023年,星期三組距分組

(步驟)1.確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按Sturges提出的經(jīng)驗(yàn)公式來(lái)確定組數(shù)K確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即

組距=(最大值-最小值)÷組數(shù)

3.統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表

第三十七頁(yè),共五十三頁(yè),編輯于2023年,星期三組距分組

(幾個(gè)概念)1.下限(lowlimit):一個(gè)組的最小值2.上限(upperlimit):一個(gè)組的最大值3.組距(classwidth):上限與下限之差4.組中值(classmidpoint):下限與上限之間的中點(diǎn)值下限值+上限值2組中值=第三十八頁(yè),共五十三頁(yè),編輯于2023年,星期三頻數(shù)分布表的編制

(例題分析)【例】某電腦公司2002年前四個(gè)月各天的銷(xiāo)售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組。

第三十九頁(yè),共五十三頁(yè),編輯于2023年,星期三頻數(shù)分布表的編制

(步驟)確定組數(shù):根據(jù)Sturges提出的經(jīng)驗(yàn)公式得組數(shù)K為:確定各組的組距:

組距=(237-141)÷10=9.610用Excel制作頻數(shù)分布表

第四十頁(yè),共五十三頁(yè),編輯于2023年,星期三等距分組表

(上下組限重疊)第四十一頁(yè),共五十三頁(yè),編輯于2023年,星期三等距分組表

(上下組限間斷)第四十二頁(yè),共五十三頁(yè),編輯于2023年,星期三等距分組表

(使用開(kāi)口組)第四十三頁(yè),共五十三頁(yè),編輯于2023年,星期三等距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對(duì)頻數(shù)來(lái)觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況第四十四頁(yè),共五十三頁(yè),編輯于2023年,星期三三、頻數(shù)分布的圖示Excel分組數(shù)據(jù)—直方圖和折線圖第四十五頁(yè),共五十三頁(yè),編輯于2023年,星期三分組數(shù)據(jù)—直方圖

(histogram)用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻率/組距,各組與相應(yīng)的頻率/組距就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1第四十六頁(yè),共五十三頁(yè),編輯于2023年,星期三分組數(shù)據(jù)的圖示

(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷(xiāo)售量分布的直方圖我一眼就看出來(lái)了,銷(xiāo)售量在170~180之間的天數(shù)最多!190200180160170(1/1200天)25201510530220230240第四十七頁(yè),共五十三頁(yè),編輯于2023年,星期三分組數(shù)據(jù)—折線圖

(frequencypolygon)折線圖也稱(chēng)頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的第四

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論