第2章統(tǒng)計(jì)數(shù)據(jù)搜集與整理_第1頁
第2章統(tǒng)計(jì)數(shù)據(jù)搜集與整理_第2頁
第2章統(tǒng)計(jì)數(shù)據(jù)搜集與整理_第3頁
第2章統(tǒng)計(jì)數(shù)據(jù)搜集與整理_第4頁
第2章統(tǒng)計(jì)數(shù)據(jù)搜集與整理_第5頁
已閱讀5頁,還剩99頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章統(tǒng)計(jì)數(shù)據(jù)收集、整理與顯示1主要內(nèi)容2.1統(tǒng)計(jì)數(shù)據(jù)的收集2.2統(tǒng)計(jì)數(shù)據(jù)的整理2.3統(tǒng)計(jì)數(shù)據(jù)的顯示——統(tǒng)計(jì)表和統(tǒng)計(jì)圖2統(tǒng)計(jì)數(shù)據(jù)是通過統(tǒng)計(jì)實(shí)踐活動(dòng)所獲得的能夠說明現(xiàn)象總體的屬性或數(shù)量表象或內(nèi)在關(guān)系的表現(xiàn),是統(tǒng)計(jì)實(shí)踐活動(dòng)的成果。3統(tǒng)計(jì)數(shù)據(jù)的種類按是否可以直接用數(shù)字表示,分為定性數(shù)據(jù)和定量數(shù)據(jù)按是否經(jīng)過加工處理,分為原始數(shù)據(jù)和綜合數(shù)據(jù)按時(shí)間狀況,分為截面數(shù)據(jù)和時(shí)序數(shù)據(jù)4定性數(shù)據(jù)—說明事物的品質(zhì)特征的,不能用數(shù)值表示,其結(jié)果通常表現(xiàn)為類別。定量數(shù)據(jù)—說明事物的數(shù)量特征,是用數(shù)值來表示的,其結(jié)果表現(xiàn)為具體的數(shù)字。原始數(shù)據(jù)—說明總體單位特征的數(shù)據(jù),主要產(chǎn)生于統(tǒng)計(jì)調(diào)查階段。也稱為標(biāo)志值。綜合數(shù)據(jù)—說明總體數(shù)量特征的數(shù)據(jù),主要產(chǎn)生于統(tǒng)計(jì)整理和分析階段。截面數(shù)據(jù)—是同一時(shí)間點(diǎn)或時(shí)間段的數(shù)據(jù)時(shí)序數(shù)據(jù)—是不同時(shí)間點(diǎn)或時(shí)間段的數(shù)據(jù)

5§2.1統(tǒng)計(jì)數(shù)據(jù)的收集

一、原始數(shù)據(jù)的收集統(tǒng)計(jì)數(shù)據(jù)收集是根據(jù)統(tǒng)計(jì)研究的目的要求,采用科學(xué)的形式和方法,有計(jì)劃、有組織地獲取所研究變量數(shù)據(jù)的過程。在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,統(tǒng)計(jì)數(shù)據(jù)收集也稱為統(tǒng)計(jì)調(diào)查。它是進(jìn)行統(tǒng)計(jì)數(shù)據(jù)整理和分析的必要前提。對(duì)統(tǒng)計(jì)數(shù)據(jù)收集的基本要求:準(zhǔn)確性、及時(shí)性。6統(tǒng)計(jì)數(shù)據(jù)的分類按照獲取途徑不同,統(tǒng)計(jì)數(shù)據(jù)可以分為直接來源的原始數(shù)據(jù)和間接來源的次級(jí)數(shù)據(jù)。原始數(shù)據(jù)是直接對(duì)各調(diào)查單位進(jìn)行觀察登記或通過實(shí)驗(yàn)來收集的數(shù)據(jù)。次級(jí)數(shù)據(jù)亦稱二手?jǐn)?shù)據(jù),是從統(tǒng)計(jì)年鑒、報(bào)刊、互聯(lián)網(wǎng)或有關(guān)部門業(yè)務(wù)資料中獲取經(jīng)過加工整理的數(shù)據(jù)。71.統(tǒng)計(jì)調(diào)查的組織形式8就范圍不同劃分而言全面調(diào)查:對(duì)調(diào)查對(duì)象中的所有單位無一例外地進(jìn)行調(diào)查。直接獲得總體數(shù)據(jù)。優(yōu)點(diǎn):資料齊全、能夠滿足各級(jí)政府領(lǐng)導(dǎo)管理需要;不存在代表性誤差。缺點(diǎn):耗費(fèi)大,易產(chǎn)生登記性誤差。應(yīng)用:搜集重要的、基礎(chǔ)性數(shù)據(jù)。非全面調(diào)查:對(duì)調(diào)查對(duì)象中的一部分進(jìn)行調(diào)查。獲得樣本數(shù)據(jù)。優(yōu)點(diǎn):耗費(fèi)小(人財(cái)物時(shí)間),不易產(chǎn)生登記性誤差。缺點(diǎn):存在代表性誤差。應(yīng)用:廣泛。9(1)統(tǒng)計(jì)報(bào)表統(tǒng)計(jì)報(bào)表是以基層單位的原始記錄為依據(jù),按國家有關(guān)法規(guī)的規(guī)定,自上而下地統(tǒng)一布置任務(wù),按統(tǒng)一的表式、統(tǒng)一的項(xiàng)目、保守時(shí)間和程序,自下而上地定期提供基本統(tǒng)計(jì)資料的一種調(diào)查方式。

統(tǒng)計(jì)報(bào)表的種類

按報(bào)送周期:日?qǐng)?bào)、旬報(bào)、月報(bào)、年報(bào)、年報(bào) 按調(diào)查范圍:全面統(tǒng)計(jì)報(bào)表和非全面統(tǒng)計(jì)報(bào)表

特點(diǎn)

是國家重要的定期統(tǒng)計(jì)報(bào)告制度; 自上而下統(tǒng)一布置,自下而上定期提供; 費(fèi)時(shí)、費(fèi)力。

優(yōu)點(diǎn)和缺點(diǎn)

優(yōu)點(diǎn):全面性、穩(wěn)定性、連續(xù)性、可比性

曾經(jīng)是我國數(shù)據(jù)收集的主要方式 缺點(diǎn):耗費(fèi)大、數(shù)據(jù)質(zhì)量差、基層負(fù)擔(dān)重10(2)普查概念:對(duì)調(diào)查對(duì)象中所有總體單位都進(jìn)行調(diào)查,目的是為了詳盡地了解重要的國情國力。目前,我國政府開展的普查主要有人口普查、第三產(chǎn)業(yè)普查、工業(yè)普查、農(nóng)業(yè)普查,這些普查都是每10年進(jìn)行一次,分別在逢0、3、5、7的年份實(shí)施;基本單位普查每5年進(jìn)行一次,在逢1、6的年份實(shí)施。

11普查應(yīng)該注意:統(tǒng)一規(guī)定普查的標(biāo)準(zhǔn)時(shí)間和統(tǒng)一的普查期限,以避免由于時(shí)間變動(dòng)使資料重復(fù)和遺漏。統(tǒng)一規(guī)定普查內(nèi)容和指標(biāo)解釋,不得任意改變或增減項(xiàng)目。同類普查,各次調(diào)查的項(xiàng)目應(yīng)盡可能一致,以便于歷史資料的對(duì)比研究。同類普查應(yīng)盡可能按周期進(jìn)行,以便觀察現(xiàn)象發(fā)展變化的過程和規(guī)律。12(3)抽樣調(diào)查抽樣調(diào)查是總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本資料來推斷總體數(shù)量特征的一種非全面調(diào)查方法。廣義的抽樣包括概率抽樣和非概率抽樣。概率抽樣也稱隨機(jī)抽樣,是指按照隨機(jī)原則從總體中抽取部分單位構(gòu)成樣本。非概率抽樣也叫非隨機(jī)抽樣,是指從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗(yàn)或判斷,從總體中有意識(shí)地抽取若干單位構(gòu)成樣本。非概率抽樣常用的方式主要有方便抽樣和判斷抽樣。13方便抽樣是指不考慮抽樣的概率,純粹以便于取得樣本的方式進(jìn)行抽樣。判斷抽樣是指研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的地選擇一些單位作為樣本進(jìn)行調(diào)查的抽樣方式。14概率抽樣和非概率抽樣是性質(zhì)不同的兩種抽樣類型,在調(diào)查中采用何種抽樣類型,取決于研究問題的性質(zhì)、使用數(shù)據(jù)要說明的問題、調(diào)查對(duì)象的特征、調(diào)查費(fèi)用、調(diào)查時(shí)間等多方面的因素。統(tǒng)計(jì)上所說的抽樣一般都是指概率抽樣,即指隨機(jī)抽樣調(diào)查。本教材若無特別說明,抽樣均指概率抽樣,抽樣調(diào)查也即對(duì)隨機(jī)樣本的調(diào)查。15常用的概率抽樣方式

(了解)簡單隨機(jī)抽樣,也稱為純隨機(jī)抽樣,是一種最基本的抽樣形式。這種抽樣方式無須對(duì)總體單位進(jìn)行任何劃分或排隊(duì),只需對(duì)總體單位進(jìn)行編號(hào),利用抽簽法、隨機(jī)數(shù)表或計(jì)算機(jī)隨機(jī)取數(shù)法等完全隨機(jī)地直接從總體中抽取樣本單位,每個(gè)總體單位入樣的概率是相等的。16分層抽樣(類型抽樣)(了解)概念首先將總體單位按某一標(biāo)志分層(分類、分組);然后在各層按隨機(jī)抽樣的方法分別抽出各層的樣本。特點(diǎn):分層抽樣在層內(nèi)是抽樣調(diào)查,層間是全面調(diào)查;分層抽樣保證了樣本中包含有各種特征的抽樣單位,樣本結(jié)構(gòu)與總體結(jié)構(gòu)比較相近,從而可以提高估計(jì)的精度。適用于類別間差異比較大的情況;不僅能夠用樣本推斷總體,還可以用各子樣本推斷相應(yīng)子總體的特征,深化對(duì)總體的認(rèn)識(shí)。17等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣)(了解)概念:首先將總體單位按某一標(biāo)志排隊(duì), 然后計(jì)算抽樣間隔距離,后在第一個(gè)抽樣距離內(nèi)確定抽樣起點(diǎn)r, 最后抽取樣本單位(或樣本點(diǎn))構(gòu)成樣本(按固定的間隔和排隊(duì)順序)。關(guān)鍵:1)排隊(duì)(選擇排隊(duì)標(biāo)志,可與調(diào)查標(biāo)志有關(guān),也可與調(diào)查標(biāo)志無關(guān)); 2)確定抽樣起點(diǎn)(即第一個(gè)樣本單位)。18無關(guān)標(biāo)志排隊(duì)等中距抽樣(了解)等距抽樣據(jù)以排隊(duì)的標(biāo)志與調(diào)查內(nèi)容無關(guān)。抽樣起點(diǎn)可隨機(jī)確定,,完全遵循了隨機(jī)原則,不會(huì)產(chǎn)生系統(tǒng)偏差。抽樣效果近似簡單隨機(jī)抽樣,注意:抽樣間隔現(xiàn)象的周期長度整數(shù)。否則所抽取的樣本有系統(tǒng)偏差。

這種周期有時(shí)是比較隱蔽的。如工人交班時(shí)間、地塊中農(nóng)作物垅長、社區(qū)住戶調(diào)查中門牌號(hào)碼(樓層)。19有關(guān)標(biāo)志排隊(duì)等距抽樣(了解)特點(diǎn):將總體單位按某一有關(guān)標(biāo)志排隊(duì)的結(jié)果。排隊(duì)后,就所要調(diào)查的標(biāo)志來看,總體單位也大致呈順序排隊(duì)。抽樣起點(diǎn)不宜隨機(jī)確定。20半距起點(diǎn)等距抽樣(中心系統(tǒng)等距抽樣)(了解)——在第一個(gè)抽樣距離中的一半為抽取起點(diǎn)r。優(yōu)點(diǎn):樣本代表性高。局限性:限制了抽樣的隨機(jī)性受到限制;而且只能抽取一個(gè)樣本。抽樣效果:理論上接近分層抽樣的效果。21對(duì)稱等距抽樣(了解)在第一個(gè)抽樣距離內(nèi)隨機(jī)地確定抽樣起點(diǎn);然后以組界為對(duì)稱點(diǎn)兩兩對(duì)稱地抽取樣本單位(或樣本點(diǎn))。如下圖所示(符號(hào)

表示樣本單位的位置):22整群抽樣(集團(tuán)抽樣)(了解)概念:首先將總體單位劃分為R個(gè)群;然后按隨機(jī)的原則不重復(fù)地抽出r個(gè)群構(gòu)成樣本,在抽中群中進(jìn)行全面調(diào)查。特點(diǎn):簡化了抽樣組織工作,便于實(shí)施調(diào)查和組織管理。。缺點(diǎn):樣本單位在總體中過于集中,樣本代表性較差,抽樣誤差較大。適用:群間差異不大,而群內(nèi)差異較大的情況。23(4)重點(diǎn)調(diào)查概念重點(diǎn)調(diào)查——是指在調(diào)查對(duì)象中選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,用以反映總體基本情況的非全面調(diào)查方法。重點(diǎn)單位是指就所要調(diào)查的標(biāo)志而言,標(biāo)志值所占比重較大的少數(shù)總體單位。24

重點(diǎn)調(diào)查的特點(diǎn)(1)調(diào)查目的主要用于掌握總體基本情況;(2)調(diào)查單位的選取有客觀標(biāo)準(zhǔn)。 適用范圍(1)適用于現(xiàn)象總量在各總體單位之間的分布極不均衡,客觀上存在重點(diǎn)單位的情況;(2)既可以用于一次性調(diào)查,也可用于經(jīng)常性調(diào)查。25(5)典型調(diào)查(了解)

典型調(diào)查的概念典型調(diào)查——是在對(duì)調(diào)查對(duì)象有一定了解基礎(chǔ)上,有意識(shí)地選擇少數(shù)典型單位進(jìn)行的非全面調(diào)查方法。

典型調(diào)查的特點(diǎn) 調(diào)查目的是為了深入研究某一問題; 調(diào)查單位是根據(jù)調(diào)查目的有意識(shí)地選取的。

調(diào)查結(jié)果不能用于推斷總體

作用 彌補(bǔ)全面調(diào)查的不足; 用于研究新生事物; 在一定條件下,用來推算總體數(shù)值。(劃類選典)劃類選典分類與典型調(diào)查方法的結(jié)合可以用于推斷總體26調(diào)查單位構(gòu)成目的與總體的關(guān)系重點(diǎn)調(diào)查重點(diǎn)單位了解總體基本情況不宜推斷總體典型調(diào)查有意識(shí)選擇典型單位了解生動(dòng)具體資料劃類選典可以推斷總體,但不能計(jì)算和控制誤差

抽樣調(diào)查按隨機(jī)原則抽取部分單位推斷總體可計(jì)算和控制誤差三種非全面調(diào)查的比較(了解)272.統(tǒng)計(jì)數(shù)據(jù)收集的基本方法(1)直接觀察法直接觀察法是調(diào)查人員深入現(xiàn)場對(duì)調(diào)查單位進(jìn)行直接觀察、記錄和計(jì)量。(2)報(bào)告法報(bào)告法是指被調(diào)查者按照調(diào)查者的要求,根據(jù)自己的實(shí)際情況如實(shí)填報(bào)調(diào)查內(nèi)容,以信函、傳真、計(jì)算機(jī)網(wǎng)絡(luò)等方式向調(diào)查者報(bào)送數(shù)據(jù)的方法。(3)訪問法訪問法也稱采訪法、詢問法,是由調(diào)查人員提問、被調(diào)查者回答來獲取數(shù)據(jù)的方法。訪問方式也是多樣的,可以集團(tuán)座談,也可以個(gè)別訪問;可以街頭訪問,入戶訪問;也可以面談訪問、電話訪問等。除了以上幾種傳統(tǒng)的調(diào)查方法以外,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的普及,電子郵件調(diào)查法、WED站點(diǎn)調(diào)查法、計(jì)算機(jī)電話輔助調(diào)查等以互聯(lián)網(wǎng)絡(luò)為平臺(tái)進(jìn)行調(diào)查的方法應(yīng)運(yùn)而生,其應(yīng)用范圍日益廣泛。283.統(tǒng)計(jì)誤差概念統(tǒng)計(jì)數(shù)據(jù)與客觀現(xiàn)象真實(shí)數(shù)值之間的差異按來源不同登記性誤差和代表性誤差登記性誤差是指在調(diào)查、匯總過程中由于觀察、測量、登記、計(jì)算等方面的差錯(cuò)或被調(diào)查者提供虛假、錯(cuò)誤資料而造成的誤差。這種誤差在任何一種調(diào)查形式中都可能產(chǎn)生.代表性誤差是非全面調(diào)查所特有的,是指由于所調(diào)查的部分單位與總體在結(jié)構(gòu)上不完全相同,用部分單位的數(shù)據(jù)推斷總體數(shù)量特征所產(chǎn)生的誤差。29抽樣誤差和非抽樣誤差統(tǒng)計(jì)誤差還可分為抽樣誤差和非抽樣誤差。抽樣誤差是一種隨機(jī)的代表性誤差,是由于抽樣的隨機(jī)性引起的樣本估計(jì)量與總體參數(shù)之間的誤差。對(duì)于任何一個(gè)隨機(jī)樣本,這種誤差都無法避免,但可以計(jì)算和控制。非抽樣誤差是相對(duì)于抽樣誤差而言的,是指除隨機(jī)抽樣以外之外的各種原因引起的統(tǒng)計(jì)數(shù)據(jù)與客觀真實(shí)值之間的差異,既包括各種登記性誤差,也包括代表性誤差中的非隨機(jī)誤差,無論是概率抽樣還是非概率抽樣,或是全面調(diào)查,都有可能產(chǎn)生非抽樣誤差。30二、統(tǒng)計(jì)調(diào)查方案(一)確定調(diào)查目的為什么調(diào)查,解決什么問題(二)確定調(diào)查對(duì)象、調(diào)查單位和填報(bào)單位

調(diào)查對(duì)象是所要調(diào)查事物的全體,由許多個(gè)別單位構(gòu)成,即統(tǒng)計(jì)總體。調(diào)查單位是所要調(diào)查的具體單位,是調(diào)查項(xiàng)目的具體承擔(dān)者,即總體單位。前者確定調(diào)查范圍,后者明確具體向誰調(diào)查。

調(diào)查單位要與調(diào)查的填報(bào)單位或報(bào)告單位相區(qū)別。(三)確定調(diào)查項(xiàng)目調(diào)查項(xiàng)目是具體的調(diào)查內(nèi)容,是調(diào)查單位具有的特征,由一系列品質(zhì)標(biāo)志和數(shù)量標(biāo)志構(gòu)成。31(四)調(diào)查表與問卷設(shè)計(jì)為了便于調(diào)查和匯總,應(yīng)該把調(diào)查項(xiàng)目按一定順序排列在表格中,這就是調(diào)查表。一個(gè)調(diào)查單位填寫一份的調(diào)查表稱為單一表,若干個(gè)調(diào)查單位填寫一份的調(diào)查表稱為一攬表。(五)確定調(diào)查組織形式和方法明確調(diào)查的組織形式和收集數(shù)據(jù)的具體方法。(六)確定調(diào)查時(shí)間確定調(diào)查時(shí)間一是指確定調(diào)查的標(biāo)準(zhǔn)時(shí)間,即調(diào)查資料所屬的時(shí)間,二是指調(diào)查期限,即整個(gè)調(diào)查工作從開始到結(jié)束的時(shí)間,包括調(diào)查登記的時(shí)間、數(shù)據(jù)處理的時(shí)間、數(shù)據(jù)分析的時(shí)間。(七)確定其它事項(xiàng)包括確定調(diào)查機(jī)構(gòu)、培訓(xùn)計(jì)劃、是否需要試點(diǎn)、經(jīng)費(fèi)預(yù)算、資料報(bào)送程序和方法、數(shù)據(jù)公布時(shí)間等。32三、次級(jí)資料的收集次級(jí)資料的收集通常稱為文案調(diào)查,是指利用單位內(nèi)部和外部的各種信息和情報(bào)資料,對(duì)所需數(shù)據(jù)資料進(jìn)行調(diào)查;也稱為間接調(diào)查、桌面調(diào)查和二手資料調(diào)查。這種調(diào)查不受時(shí)空限制,可以獲得實(shí)地調(diào)查難以取得的大量歷史資料。次級(jí)資料包括內(nèi)部資料和外部資料。內(nèi)部資料主要指企業(yè)或單位內(nèi)部相關(guān)的數(shù)據(jù)或檔案。外部資料指通過統(tǒng)計(jì)部門、信息咨詢機(jī)構(gòu)、電臺(tái)和電視臺(tái)、圖書和報(bào)刊雜志、互聯(lián)網(wǎng)絡(luò)等渠道公布的有關(guān)資料。33§2.2統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)整理是指根據(jù)統(tǒng)計(jì)研究的需要,將統(tǒng)計(jì)調(diào)查階段所搜集到的大量個(gè)體資料進(jìn)行科學(xué)的分類匯總、加工處理,或?qū)σ呀?jīng)經(jīng)過加工的次級(jí)資料再加工,使之系統(tǒng)化、條理化,以符合統(tǒng)計(jì)分析的需要,成為能夠反映事物總體特征的綜合資料的過程。內(nèi)容數(shù)據(jù)處理:分類、匯總、表現(xiàn)(制表)數(shù)據(jù)管理:輸入、貯存、更新、輸出步驟審核原始資料、數(shù)據(jù)的分類匯總數(shù)據(jù)的表現(xiàn)、數(shù)據(jù)保管和發(fā)布

原始數(shù)據(jù)的整理一般是分類和匯總性的整理,次級(jí)資料的整理主要是分組。34一、統(tǒng)計(jì)分組1、概念統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將總體中的所有單位按照一定的標(biāo)志分為若干部分或組別的方法。

對(duì)總體——分;

對(duì)個(gè)體——合。突出組與組之間的差異、抽象組內(nèi)各單位差異2、作用

劃分總體類型、反映現(xiàn)象內(nèi)部結(jié)構(gòu)和比例關(guān)系、揭示現(xiàn)象間的相互依存關(guān)系3、原則

科學(xué)性、完備性、互斥性

354、統(tǒng)計(jì)分組的種類

按標(biāo)志的性質(zhì)分為品質(zhì)標(biāo)志分組和數(shù)量標(biāo)志分組。品質(zhì)標(biāo)志分組是從屬性上區(qū)分各種類型組,其關(guān)鍵是界定各類型的性質(zhì)差異。數(shù)量標(biāo)志分組是從某個(gè)變量的數(shù)量差異上區(qū)分各種類型組,其關(guān)鍵是證券劃分各組界限。

按分組標(biāo)志多少分為簡單分組和復(fù)合分組。簡單分組按一個(gè)標(biāo)志對(duì)總體單位進(jìn)行分組,它只反映總體某一方面的類型和結(jié)構(gòu)特征。復(fù)合分組按兩個(gè)或以上標(biāo)志對(duì)總體單位進(jìn)行重疊分組,復(fù)合分組還可以顯示結(jié)構(gòu)的層次,說明總體內(nèi)部類型的主從關(guān)系。

36二、分布數(shù)列---統(tǒng)計(jì)分組整理的基本結(jié)果1.分布數(shù)列的概念將總體各單位按某個(gè)標(biāo)志分成若干組,列出各組的總體單位數(shù)或各組單位數(shù)在總體單位數(shù)中所占的比重,這樣形成的數(shù)列稱為分布數(shù)列。它表明總體單位在各組的分布狀況。

次數(shù)(頻數(shù))是分布在各組的單位數(shù)。頻率是各組單位數(shù)在總體單位數(shù)中所占的比重。372.分布數(shù)列的種類

(1)品質(zhì)數(shù)列是按品質(zhì)標(biāo)志分組形成的分布數(shù)列

38表2-1某公司職工文化程度狀況文化程度工人數(shù)比重(%)小學(xué)4008初中150030高中260052大學(xué)50010合計(jì)5000100品質(zhì)標(biāo)志39性別是品質(zhì)標(biāo)志性別人數(shù)(萬人(比重(%)男6362950.98女6118149.02合計(jì)124810100.00表2-2某年中國人口狀況402、變量數(shù)列

是按數(shù)量標(biāo)志分組而形成的分布數(shù)列,定量數(shù)據(jù)。41變量數(shù)列單項(xiàng)式變量數(shù)列組距式變量數(shù)列42(1)單項(xiàng)式變量數(shù)列以一個(gè)變量值作為一組的變量序列是單項(xiàng)式變量數(shù)列。適合于離散變量

——取值可以一一列舉適合于變量值較少,變動(dòng)幅度不大的情況43表2—7某企業(yè)日產(chǎn)量

日產(chǎn)量工人數(shù)107011100123801315014100合計(jì)80044將變量值的一個(gè)區(qū)間作為一組的變量數(shù)列是組距式變量數(shù)列每一組兩端的值稱為組限,各組最小值稱為下限,最大值稱為上限。適合于連續(xù)變量,也適合于變量值較多、變化幅度大的情況(離散變量)相鄰兩組間的上下組限可以重疊也可以不重疊。一般來說,離散變量采用不重疊組形式,連續(xù)變量采用重疊組形式。區(qū)間的長度稱為組距開口組、開口數(shù)列等距數(shù)列、異距數(shù)列(2)組距式變量數(shù)列45表2—8某班學(xué)生考試成績次數(shù)表成績(分)學(xué)生人數(shù)向上累計(jì)向下累計(jì)60以下225460-7015175270-8019363780-9015511890-1003543合計(jì)54————組限重疊46等距數(shù)列表2-10某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計(jì)50100組限重疊47表2-11某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計(jì)50100組限間斷48開口數(shù)列表2-12某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)109~以下110~114115~119120~124125~129130~134135~以上358141064610162820128合計(jì)50100適合數(shù)據(jù)集有極端值的情況49組距的計(jì)算組限重疊組距=本組上限-本組下限組限間斷組距=本組上限-上組上限=下組下限-本組下限據(jù)此可以判斷等距與不等距數(shù)列50開口數(shù)列?組中值:各組上下限的中點(diǎn)值。當(dāng)組內(nèi)變量值均勻分布或?qū)ΨQ分別時(shí),組中值可作為組變量值的代表值。組中值的計(jì)算51確定分組形式3.編制變量數(shù)列的步驟確定組數(shù)確定組距確定組限排序計(jì)算頻數(shù)表現(xiàn)現(xiàn)象的度、規(guī)定的界限體現(xiàn)分布的集中趨勢考慮到習(xí)慣、便于對(duì)比52某月啤酒公司60個(gè)銷售點(diǎn)的銷量487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750單位:桶

excel53啤酒銷售量的分布數(shù)列(表2-3)銷售桶數(shù)銷售點(diǎn)數(shù)頻率(%)19以下11.720—2935.030—3958.340—491626.750—592033.360—69915.070—7946.780以上23.3合計(jì)60100.0544.累計(jì)次數(shù)分布551.向上累計(jì)

次數(shù)的累計(jì)從變量值較小的組相變量值較大的組累計(jì),反映小于該組上限的次數(shù)或百分?jǐn)?shù)總共有多少。2.向下累計(jì)

次數(shù)從變量值較大的組向變量值較小的組累計(jì),反映大于該組下限的次數(shù)或百分比總共有多少。56某班學(xué)生考試成績次數(shù)表成績(分)學(xué)生人數(shù)向上累計(jì)向下累計(jì)60以下225460-7015175270-8019363780-9015511890-1003543合計(jì)54————57定序數(shù)據(jù)頻數(shù)分布表【例2.2】在一項(xiàng)城市住房問題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問題是:“您對(duì)您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。

表2-5甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0————58定序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積圖2-3甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布595.次數(shù)分布類型和次數(shù)分布圖(1)次數(shù)分布類型鐘型分布——中間多、兩頭少對(duì)稱分布——如正態(tài)分布左偏分布(負(fù)偏)右偏分布(正偏)U型分布兩頭大,中減少J型分布一頭大,一頭小60頻數(shù)分布的類型U型分布正J型分布反J型分布對(duì)稱分布右偏分布左偏分布612.3統(tǒng)計(jì)表和統(tǒng)計(jì)圖2.3.1統(tǒng)計(jì)表1.統(tǒng)計(jì)表的概念表現(xiàn)經(jīng)過整理的統(tǒng)計(jì)數(shù)據(jù)按一定結(jié)構(gòu)和順序排列而成的表格統(tǒng)計(jì)數(shù)據(jù)最規(guī)范的表現(xiàn)形式

2.統(tǒng)計(jì)表的構(gòu)成標(biāo)題——總標(biāo)題、橫行標(biāo)題、縱列標(biāo)題橫行、縱列數(shù)字資料表外附加6263表2-122007年我國城鄉(xiāng)居民家庭人均收入及恩格爾系數(shù)家庭人均可支配收入恩格爾系數(shù)(%)絕對(duì)額(元)指數(shù)(1978=100)農(nóng)村居民4140.4734.443.1城鎮(zhèn)居民13785.8752.336.3總標(biāo)題縱列標(biāo)題數(shù)據(jù)橫行標(biāo)題資料來源:《中國統(tǒng)計(jì)年鑒2008》注釋:表外附加(表腳)63表2—131999年世界500強(qiáng)企業(yè)中利潤額最高的前五個(gè)行業(yè)總標(biāo)題橫

標(biāo)

題數(shù)

料縱列標(biāo)題資料來源:《中國國情國力》2000年第10期表外附加主詞賓詞6465家庭人均可支配收入恩格爾系數(shù)(%)絕對(duì)額(元)指數(shù)(78=100)農(nóng)村居民2366.4503.847.7城鎮(zhèn)居民6859.6416.338.2家庭人均可支配收入恩格爾系數(shù)(%)絕對(duì)額(元)指數(shù)(78=100)農(nóng)村居民3254.9624.545.5城鎮(zhèn)居民10493.0607.436.72005年2001年家庭人均可支配收入恩格爾系數(shù)(%)絕對(duì)額(元)指數(shù)(78=100)農(nóng)村居民3587.0670.743.0城鎮(zhèn)居民11759.5670.735.82006年65分組年份家庭人均可支配收入恩格爾系數(shù)(%)絕對(duì)額(元)指數(shù)(78=100)農(nóng)村居民20012005200620072366.43254.93587.04140.4503.8624.5670.7734.447.745.543.043.1城鎮(zhèn)居民20012005200620076859.610493.011759.513785.8416.3607.4670.7752.338.236.735.836.3我國農(nóng)村和城鎮(zhèn)居民家庭人均可支配收入及恩格爾系數(shù)聯(lián)合國糧農(nóng)組織針對(duì)該系數(shù)提出具體標(biāo)準(zhǔn):即恩格爾系數(shù)在59%以上為貧困,在50-59%之間為溫飽,在40-50%之間為小康,在30-40%之間為富裕,低于30%為最富裕。

66年份農(nóng)村居民城鎮(zhèn)居民人均可支配收入(元)指數(shù)(78=100)恩格爾系數(shù)(%)人均可支配收入(元)指數(shù)(78=100)恩格爾系數(shù)(%)20012005200620072366.43254.93587.04140.4503.8624.5670.7734.447.745.543.043.16859.610493.011759.513785.8416.3607.4670.7752.338.236.735.836.567統(tǒng)計(jì)表按主詞是否分組及分組標(biāo)志的多少:簡單表:對(duì)總體未進(jìn)行任何分組;簡單分組表:對(duì)總體僅按一個(gè)標(biāo)志進(jìn)行分組;復(fù)合表;對(duì)總體按兩個(gè)及以上的標(biāo)志進(jìn)行重疊分組。1994——1997年城鄉(xiāng)居民家庭人均收入單位:元簡單表68

表2—2某城市居民關(guān)注廣告類型的頻數(shù)分布1001200合計(jì)56.025.54.58.05.01.00.5600.2550.0450.0800.0500.01011251916102

商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告頻率(%)比例人數(shù)(人)廣告類型簡單分組表:69某地區(qū)工業(yè)企業(yè)產(chǎn)值統(tǒng)計(jì)表復(fù)合表:70列聯(lián)表又稱為交叉表,是由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表對(duì)于定類數(shù)據(jù)的描述和分析,通常采用列聯(lián)表進(jìn)行交叉分析。列聯(lián)表是由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表。列聯(lián)表就是復(fù)合分組表。列聯(lián)表,P35性別月平均通信費(fèi)(元)50以下50~60。。。合計(jì)男女合計(jì)表x某校300為學(xué)生性別與通信費(fèi)列聯(lián)表71總標(biāo)題內(nèi)容應(yīng)滿足3W要求(whatwherewhen)要合理安排統(tǒng)計(jì)表的結(jié)構(gòu)數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對(duì)于沒有數(shù)字的表格單元,一般用“——”表示必要時(shí)可在表的下方加上注釋4.統(tǒng)計(jì)表的設(shè)計(jì)規(guī)則7273制作頻數(shù)分布表用圖形顯示數(shù)據(jù)列出各類別計(jì)算各類別的頻數(shù)2.3.2統(tǒng)計(jì)圖次數(shù)分布圖73定性數(shù)據(jù)整理—頻數(shù)分布表【例】為研究廣告市場的狀況,一家廣告公司在某城市隨機(jī)抽取200人就廣告問題做了郵寄問卷調(diào)查,其中的一個(gè)問題是“您比較關(guān)心下列哪一類廣告?”1.商品廣告;2.服務(wù)廣告;3.金融廣告;4.房地產(chǎn)廣告;5.招生招聘廣告;6.其他廣告。廣告類型人數(shù)(人)比重(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1121651910256.025.54.58.05.01.0表2-9某城市居民關(guān)注廣告類型的頻數(shù)分布74定性數(shù)據(jù)的圖示—柱形圖柱形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動(dòng)的圖形柱形圖有單式、復(fù)式等形式在表示定性數(shù)據(jù)的分布時(shí),是用柱形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率繪制時(shí),各類別可以放在縱軸,又稱為條形圖,也可以放在橫軸,稱為柱形圖75定類數(shù)據(jù)的圖示—條形圖人數(shù)(人)5191610211204080120

商品廣告

服務(wù)廣告

金融廣告

房地產(chǎn)廣告

招生招聘廣告

其他廣告廣告類型

圖2-7某城市居民關(guān)注不同類型廣告的人數(shù)分布76定量數(shù)據(jù)——直方圖用矩形的寬度和高度來表示頻數(shù)分布的圖形,在平面直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖。直方圖要求各組具有相同的組距,這樣每一組的矩形面積就與該組的次數(shù)完全對(duì)應(yīng)。異距數(shù)列作直方圖時(shí),應(yīng)將不等組距調(diào)整為等距組。直方圖下任何一個(gè)矩形所占面積的百分?jǐn)?shù)與其頻率值相同。77表2-10某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計(jì)5010078分組數(shù)據(jù)—直方圖頻數(shù)(人)1512963105110115120125130135140日加工零件數(shù)(個(gè))圖2-2某車間工人日加工零件數(shù)的直方圖79表2-14某車間50名工人日加工零件數(shù)的異距分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105—110110—115115—120120—125125—135135—1403581416(=10+6)4610162832(=20+12)8合計(jì)5010080頻數(shù)(人)1512963105110115120125135140日加工零件數(shù)(個(gè))次數(shù)怎么增加了?直方圖的面積之和不等于總次數(shù)圖2-4根據(jù)表2—14某車間工人日加工零件數(shù)的異距分組表所作直方圖10681找出標(biāo)準(zhǔn)組距:該例為5頻數(shù)密度=頻數(shù)/組距=16/10=1.6

標(biāo)準(zhǔn)組距的頻數(shù)=5×1.6=8按標(biāo)準(zhǔn)組距的次數(shù)8作直方圖。異距數(shù)列作直方圖時(shí),應(yīng)將不等組距調(diào)整為等組距。調(diào)整的方法是:以標(biāo)準(zhǔn)組距乘以頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)得到標(biāo)準(zhǔn)組距的頻數(shù),再按標(biāo)準(zhǔn)組距的次數(shù)作直方圖。82105110115120125140直方圖的面積之和等于總次數(shù)圖2-5根據(jù)表2—14某車間工人日加工零件數(shù)異距分組表按標(biāo)準(zhǔn)組距所作直方圖13513088頻數(shù)(人)1512963日加工零件數(shù)(個(gè))83直方圖與條形圖的區(qū)別條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;直方圖是可用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義;直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列。84折線圖折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的851512963105110115120125130135140日加工零件數(shù)(個(gè))頻數(shù)(人)折線圖下的面積與直方圖的面積相等!圖2-3某車間工人日加工零件數(shù)的折線圖86曲線圖曲線圖是用一條光滑的曲線表示次數(shù)分布;當(dāng)直方圖的組距無限縮小時(shí),折線圖就成了曲線圖曲線圖是折線圖的理論圖8788莖葉圖莖葉圖是反映原始數(shù)據(jù)的圖形。它由莖和葉兩部分構(gòu)成。通過莖葉圖,可以看出數(shù)據(jù)的分步形狀及數(shù)據(jù)的離散狀況,如分布是否對(duì)稱,數(shù)據(jù)是否集中,是否有離群點(diǎn)等等。繪制莖葉圖關(guān)鍵是設(shè)置好樹莖。制作莖葉圖時(shí),首先把一個(gè)數(shù)字分成兩部分,通常是以該數(shù)據(jù)的高位數(shù)值作為樹莖,而且葉上只保留該數(shù)值的最后一個(gè)數(shù)字。如125分成125,12分成12,前部分是樹莖,后部分是樹葉。莖葉圖類似于橫置的直方圖,與直方圖相比,莖葉圖既能夠給出數(shù)據(jù)的分布狀況,又能夠給出每一個(gè)原始數(shù)據(jù)。而直方圖雖然能夠很好的顯示數(shù)據(jù)的分布,但不能保留原始數(shù)值。在應(yīng)用方面,直方圖通常適用于數(shù)據(jù)量大的情況,莖葉圖通常適用于小批量數(shù)據(jù)。89141156215205196191187181177173143158218206197192187182177173144159223207197194188182178174149160225208198194188183178174150160226209198195188184178174152161228210200195189185179175153161233210201196189186179175153162233211202196189186179175154163234211203196190187180176155163234213203196190187180176165164237214171172172172167168166168165168171172173165170172某電腦公司某年4個(gè)月銷售量90某電腦公司某年4個(gè)月銷售量91圓形圖也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問題十分有用在繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應(yīng)比例確定的例如,關(guān)注服務(wù)廣告的人數(shù)占總?cè)藬?shù)的百分比為25.5%,那么其扇形的中心角度就應(yīng)為3600×25.5%=91.80,其余類推92

其他廣告1.0%

房地產(chǎn)廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務(wù)廣告25.5%

招生招聘廣告5.8%圖2-8某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成93【例】在一項(xiàng)城市住房問題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問題是:“您對(duì)您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。

表2-10甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0———

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論