賈俊平《統(tǒng)計學》考研考點大全 (一)_第1頁
賈俊平《統(tǒng)計學》考研考點大全 (一)_第2頁
賈俊平《統(tǒng)計學》考研考點大全 (一)_第3頁
賈俊平《統(tǒng)計學》考研考點大全 (一)_第4頁
賈俊平《統(tǒng)計學》考研考點大全 (一)_第5頁
已閱讀5頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

目錄

第一章導論(2)

第一節(jié)統(tǒng)計及其應用領域(2)

第二節(jié)統(tǒng)計數(shù)據(jù)類型(4)

第三節(jié)統(tǒng)計學的常用基本概念(4)

第二章數(shù)據(jù)的搜集(6)

第一節(jié)數(shù)據(jù)的來源(6)

第二節(jié)調查數(shù)據(jù)(7)

第三節(jié)數(shù)據(jù)的誤差(10)

第三章數(shù)據(jù)的圖表展示(12)

第一節(jié)數(shù)據(jù)的預處理(12)

第二節(jié)品質數(shù)據(jù)的整理與展示(13)

第三節(jié)數(shù)值型數(shù)據(jù)的整理與展示(18)

第四節(jié)合理使用圖表(24)

第四章數(shù)據(jù)的概括性度量(26)

第一節(jié)集中趨勢的度量(26)

第二節(jié)離散程度的度量(31)

第三節(jié)偏態(tài)與峰態(tài)的度量(34)

第五章概率與概率分布(36)

第一節(jié)隨機事件及概率(36)

第二節(jié)概率的性質與運算法則(39)

第三節(jié)離散型隨機變量及其分布(44)

第四節(jié)連續(xù)型隨機變量的概率分布(49)

第六章統(tǒng)計量及其抽樣分布(54)

第一節(jié)統(tǒng)計量(54)

第二節(jié)由正態(tài)分布導出的幾個重要分布(55)

第三節(jié)樣本均值的分布(58)

第四節(jié)樣本方差和樣本比例的分布(61)

第七章參數(shù)估計(62)

第一節(jié)參數(shù)估計的基本原理(62)

第二節(jié)一個總體參數(shù)的區(qū)間估計(66)

第三節(jié)兩個總體參數(shù)的區(qū)間估計(70)

第四節(jié)樣本量的確定(73)

第八章假設檢驗(75)

第一節(jié)假設檢驗的基本問題(75)

第二節(jié)一個總體參數(shù)的檢驗(80)

第三節(jié)兩個總體參數(shù)的檢驗(85)

第九章列聯(lián)分析(91)

第一節(jié)分類數(shù)據(jù)與列聯(lián)表(91)

第二節(jié)X2檢驗

第三節(jié)列聯(lián)表中的相關測量(95)

第十章方差分析(99)

第一節(jié)方差分析引論(99)

第二節(jié)單因素方差分析(102)

第三節(jié)雙因素方差分析(110)

第十一章一元線性回歸(116)

第一節(jié)變量間關系的度量(116)

第二節(jié)一元線性回歸(121)

第三節(jié)利用回歸方程進行預測(128)

第四節(jié)殘差分析(129)

第十二章多元線性回歸(132)

第一節(jié)多元線性回歸模型(132)

第二節(jié)回歸方程的擬合優(yōu)度(133)

第三節(jié)顯著性檢驗(134)

第四節(jié)多重共線性(136)

第五節(jié)變量選擇與逐步回歸(138)

第十三章時間序列分析和預測(140)

第一節(jié)時間序列及其分解(140)

第二節(jié)時間序列的描述性分析(142)

第三節(jié)時間序列預測的程序(145)

第四節(jié)平穩(wěn)序列的預測(149)

第五節(jié)趨勢型序列的預測(154)

第六節(jié)復合型序列的分解預測(162)

第十四章指數(shù)(168)

第一節(jié)基本問題(168)

第二節(jié)總指數(shù)編制方法(169)

第三節(jié)指數(shù)體系(174)

第四節(jié)幾種典型的指數(shù)(176)

第五節(jié)綜合評價指數(shù)(179)

賈俊平《統(tǒng)計學》考點精講

課程簡介

統(tǒng)計學是一門關于大量數(shù)據(jù)如何進行搜集、整理和分析的方法論科學,它是統(tǒng)計學專業(yè)的一門專

業(yè)基礎課程,也是經(jīng)濟學類和工商管理類各專業(yè)的一門核心課程,眾多學科必備的考研專'也課程,主

要介紹如何運用統(tǒng)計方法對社會經(jīng)濟現(xiàn)象的總體特征和發(fā)展規(guī)律進行描述、分析,包括:統(tǒng)計指標、數(shù)

字特征、動態(tài)分析、指數(shù)分析和簡單的趨勢模型及抽樣推斷、相關和回歸分析等。

內(nèi)容體系和章節(jié)分配

描述統(tǒng)計:前四章

推斷統(tǒng)計:第五章至第十一章

統(tǒng)計應用:第十二章至第十四章

第1章導論第2章數(shù)據(jù)的搜集

第3章數(shù)據(jù)的圖表展示

第5章概率與概率分布

第7章參數(shù)估計

第9章列聯(lián)分析

第11章一元線性回歸

第13章時間序列分析和預測

課程輔導的作用

凸現(xiàn)重點,分解難點,關聯(lián)體系,把握核心。

內(nèi)容應有取舍,要求亦分三個層次:

了解-------般的認識。知道出處、適用范圍,反映的具體事情;

理解-----對概念、原理、公式的條件、結論及意義有準確的把握;

掌握-----理解基礎上,能夠正確運用。

通過對重點內(nèi)容的精細講解,對難點內(nèi)容的透徹分析,將整個課程體系串聯(lián)起來,達到對課程大

綱中核心考點和綜合知識的系統(tǒng)掌握。

課程輔導的目標

1.更加深刻地理解統(tǒng)計學主要概念及統(tǒng)計背景,了解在社會經(jīng)濟應用及分析中的重要作用,系統(tǒng)

掌握統(tǒng)計描述和統(tǒng)計推斷的基本內(nèi)容與基本方法;

2.在掌握統(tǒng)計學基礎知識的基礎匕能較容易理解其他課程中的一些數(shù)量分析方法,并能獨立完

成對有關資料的搜集、整理、分析。

3.為深入研究社會經(jīng)濟問題和學習其它專業(yè)課程提供數(shù)量分析的方法。

4.為進一步學習專業(yè)統(tǒng)計和數(shù)量經(jīng)濟課程打好基礎。

要求學生能在教師的指導下,掌握統(tǒng)計學的基本理論和方法,熟悉統(tǒng)計軟件的基本操作,并能夠

結合經(jīng)濟學和工商管理理論加以應用。

1—

hda

第一章導論

基本內(nèi)容

統(tǒng)計學的含義、統(tǒng)計數(shù)據(jù)及其分類、統(tǒng)計學常用的基本概念。

重點內(nèi)容

統(tǒng)計學常用的基本概念。

學習目標

1.理解統(tǒng)計學的含義,能區(qū)分描述統(tǒng)計與推斷統(tǒng)計

2.了解統(tǒng)計學的應用領域

3.理解統(tǒng)計數(shù)據(jù)的含義、基本類型及特點

4.熟悉總體、樣本、參數(shù)、統(tǒng)計量、變量等基本概念的含義

第一節(jié)統(tǒng)計及其應用領域

一、什么是統(tǒng)計學

統(tǒng)計學是處理數(shù)據(jù)的方法論,是關于收集、處理、分析、解釋數(shù)據(jù)并從中獲得結論的科學,研

究對象是來自各領域的數(shù)據(jù),其目的是探索數(shù)據(jù)的內(nèi)在數(shù)量規(guī)律性,以達到對客觀事物的科學

認識。

1.數(shù)據(jù)收集:取得統(tǒng)計數(shù)據(jù)。例如,調查與試驗。

2.數(shù)據(jù)處理:展示數(shù)據(jù)。例如,分組、制表、作圖。

3.數(shù)據(jù)分析:選擇統(tǒng)計方法研究數(shù)據(jù)。例如,回歸分析

4.數(shù)據(jù)解釋:結論的討論與說明。例如,判別出變量相互獨立。

實際問題

收集數(shù)據(jù)

分析數(shù)據(jù)

圖1-1統(tǒng)計研究的過程

2—

賈俊平《統(tǒng)計學》考點精講

數(shù)據(jù)分析方法分類:描述統(tǒng)計方法和推斷統(tǒng)計方法,描述是推斷統(tǒng)計的前提,推斷統(tǒng)計是描述統(tǒng)

計的發(fā)展。

描述統(tǒng)計是研究數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等的統(tǒng)計方法,通常采用集中量數(shù)、

差異量數(shù)、地位量數(shù)、相關系數(shù)等概括性的度量工具;反映研究總體的直觀特征、外在聯(lián)系或橫向比較

結果等淺表性信息。

推斷統(tǒng)計是借助概率論的原理,研究如何利用樣木信息來推斷對總體特征的統(tǒng)計方法,主要包括

參數(shù)估計、假設檢驗和方差分析;揭示研究總體內(nèi)在統(tǒng)計規(guī)律與特征;對各種統(tǒng)計方法的性質和優(yōu)良

程度進行探討。見圖1一2

圖1-2統(tǒng)計方法的分類

二、統(tǒng)計學的應用領域

統(tǒng)計學是適用于所有學科領域的通用數(shù)據(jù)分析方法,使廣泛運用于包含定量數(shù)據(jù)的一切領域中

有效的分析工具,并已發(fā)展成為由若干分支學科組成的學科體系。下面給出統(tǒng)計在工商管理中的一

些主要應用。

1.企業(yè)發(fā)展戰(zhàn)略

利用統(tǒng)計方法提供可靠數(shù)據(jù),了解經(jīng)濟發(fā)展狀況、變化趨勢,考察市場變化;

利用統(tǒng)計方法的科學分析,挖掘企業(yè)優(yōu)勢,發(fā)現(xiàn)不足,進行合理的市場定位。

2.產(chǎn)品質量管理

統(tǒng)計在產(chǎn)品管理的主要應用方式是質量控制,借助質量控制圖監(jiān)測生產(chǎn)過程。

3.市場研究

通過市場調查,獲取所需信息,利用統(tǒng)計分析,得到關于市場規(guī)律的科學結論。

4.財務分析

利用統(tǒng)計方法,對上市公司提供的財務資料與數(shù)據(jù)進行分析,為股民提供投資參考。

5.經(jīng)濟預測

利用統(tǒng)計方法,對獲得的經(jīng)濟領域的一些指標數(shù)據(jù)和統(tǒng)計信息建立定量模型,作出特征判斷和趨

勢預測。

6.人力資源管理

利用統(tǒng)計方法,可以對企業(yè)員工的基本信息進行管理與分析,并作為企業(yè)制定工資計劃、獎懲制

度的依據(jù)。

圖1-3展示了統(tǒng)計學的一些應用領域統(tǒng)計,表1—1。

3—

hda

圖1—3統(tǒng)計學的應用領域

第二節(jié)統(tǒng)計數(shù)據(jù)類型

統(tǒng)計數(shù)據(jù)是統(tǒng)計研究的基礎信息和分析應用的依據(jù),是對客觀現(xiàn)象進行測量的結果,視研究問題

的角度可有不同方式數(shù)據(jù)類型劃分。

1.按計量尺度劃分

數(shù)值型數(shù)據(jù)(m?Eidat):按數(shù)字尺度測量的數(shù)據(jù),結果表現(xiàn)為具體的數(shù)值,能對不同事物的特征

及間距作出精確測度。例如:比例數(shù)1%、5%、10%、25%、50%、75%、90%等;

順序數(shù)據(jù)(ankdat):只能歸于有序等級的非數(shù)字型數(shù)據(jù),結果表現(xiàn)為等級標準,目的是對事物

類別順序進行測度,例如,學歷分為小學、初中、高中、大專、本科、研究生等;

分類數(shù)據(jù)(c電tig。rca1dat):只能用不同類別表述的非數(shù)字型數(shù)據(jù),結果表現(xiàn)為文字類別,目的是

對事物類別進行區(qū)分;例如,物體顏色、形狀、物理狀態(tài)等。

2.按收集方法劃分

觀測數(shù)據(jù)(。bVnat。na1dat):通過調查或觀測而收集到的數(shù)據(jù),屬于自然環(huán)境下獲得的。通常經(jīng)

濟、社會、人口領域有關現(xiàn)象的數(shù)據(jù)大多來源于觀測數(shù)據(jù)。

試驗數(shù)據(jù)(exqe/ment1dat):在試驗中控制試驗對象而收集到的數(shù)據(jù)。各種物理、化學、生物、醫(yī)

學試驗等大多數(shù)自然科學領域的數(shù)據(jù)主要出自試驗數(shù)據(jù)。

3.按時間狀況劃分

截面數(shù)據(jù)(cor—jsctona1dat):取自相同或相似的時間點上的數(shù)據(jù),這類數(shù)據(jù)通常是在不同的

空間上獲得的,測度現(xiàn)象在某一時刻的狀態(tài)特征。例如,某一年亞洲各國和地區(qū)的人文發(fā)展數(shù)據(jù)。

時間序列數(shù)據(jù)(qmjesresdat):取自不同時間點上的數(shù)據(jù),這類數(shù)據(jù)通常是在同一空間上獲得

的,描述現(xiàn)象隨時間變化的規(guī)律。例如,2000年至2010年我國人口數(shù)據(jù)。

第三節(jié)統(tǒng)計學的常用基本概念

1.總體和樣本

總體(popR1ton):包含研究對象的全體組成的集合,組成總體的每一個元素稱為個體,按照總體

所含元素數(shù)目可分為有限總體和無限總體。有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的;

無限總體所包括的元素是無限的,元素的數(shù)目不可數(shù)的。區(qū)分有限總體和無限總體主要目的是為了

4—

賈俊平《統(tǒng)計學》考點精講

判斷在抽樣過程中獨立性。

注意:在統(tǒng)計問題中通常將所研究總體限定于它的某個數(shù)量指標,視總體為一些實數(shù)構成的集

合,利于統(tǒng)計分析方法應用。例如檢驗一批燈泡的質量,從中選擇100只,觀察其使用壽命,這里研究

總體就不是這批燈泡,而是這批燈泡的使用壽命,為一組實數(shù)構成的集合。

樣本(&meP1):從總體中抽取的一部分元素組成的集合,也是總體的一個子集。構成樣本的元素

數(shù)目稱為樣本容量或樣本量(s捫Rljsez上例中100只燈泡的使用壽命就構成一個樣本。

2.參數(shù)和統(tǒng)計量

參數(shù)(parm)etr:描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征的數(shù)量

表現(xiàn)。統(tǒng)計學中常用的參數(shù)主要有總體均值(U)、標準差(。)、總體比例(n)等,總體參數(shù)通常是一個

未知的常數(shù)。

統(tǒng)計量(5Pttcsi):用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣木數(shù)據(jù)計算出來的,集中了

樣本所帶來的總體眾多信息的樣木函數(shù)。對應于總體主要參數(shù)的樣本統(tǒng)計量有樣本均值(x)、樣木

標準差(3、樣本比例()等,樣本統(tǒng)計量通常用小寫英文字母來表示。

注意:除了上述基本統(tǒng)計量外,統(tǒng)計學中還有一些為統(tǒng)計分析需要所構造的統(tǒng)計量,以后章節(jié)中

將會陸續(xù)引入。

3.變量

變量:反映現(xiàn)象某種特征和狀態(tài)的指標,變量的具體取值稱為變量值,即數(shù)據(jù)。如商品價格、受教

育程度、時間、體重等都是變量。統(tǒng)計數(shù)據(jù)就是統(tǒng)計變量的一些取值。

按照計量尺度劃分數(shù)據(jù)類型的方式,相應地可將變量分成分類變量、順序變量和數(shù)值型變量。數(shù)

值型變量因刻畫事物特征最為精確,亦為應用最廣泛的類型,而且根據(jù)其取值是否連續(xù),又可分為離

散型變量和連續(xù)型變量。

5—

hda

第二章數(shù)據(jù)的搜集

基本內(nèi)容

數(shù)據(jù)的來源、獲得數(shù)據(jù)方法、數(shù)據(jù)的誤差。

重點內(nèi)容

簡單隨機抽樣、抽樣誤差。

學習目標

1.了解數(shù)據(jù)來源的兩種渠道

2.了解概率抽樣與非概率抽樣特點和差異

3.熟悉概率抽樣幾種常用方式的操作方法和優(yōu)缺點

4.了解非概率抽樣常用方式適用條件和差異

5.了解搜集數(shù)據(jù)的基本方法及其特點

6.理解數(shù)據(jù)的誤差含義,以及抽樣誤差和非抽樣誤差的區(qū)別、產(chǎn)生的原因,了解誤差控制的方法

第一節(jié)數(shù)據(jù)的來源

統(tǒng)計數(shù)據(jù)是實踐的基本資源和統(tǒng)計分析的依據(jù),展示了客觀現(xiàn)象數(shù)量方面的特征,從本質上講,

所有統(tǒng)計數(shù)據(jù)最初都來源于調查或實驗,但從使用者的角度看,主要出自直接和間接兩條途徑。

1.數(shù)據(jù)的間接來源

間接來源:未經(jīng)過自己的實踐,而對別人已搜集數(shù)據(jù)直接加以利用而得到的。或將已存在信息重

新加工、整理,變?yōu)槲覀兯脭?shù)據(jù)的方式。

搜集的范圍包括系統(tǒng)外部和系統(tǒng)內(nèi)部。系統(tǒng)外部:對外公布的常規(guī)信息,收集渠道很多;系統(tǒng)內(nèi)

部:不對外公布的精密資料,獲取途徑較少。

優(yōu)點:采集成本低,便于搜集,并且能很快利用;

作用廣泛,包括分析所要研究的問題、提供研究問題的背景、幫助研究者更好地定義問題、檢驗和

回答某些疑問和假設、尋找研究問題的思路和途徑等。

缺點:針對性差,相關性、準確性、時效性可能有不足。

2.數(shù)據(jù)的直接來源

直接來源:經(jīng)過自己的調查或實驗等直接的實踐活動,取得的第一手數(shù)據(jù)。

包括通過調查方法獲得的調查數(shù)據(jù),主要針對社會經(jīng)濟現(xiàn)象且取自有限總體,比如統(tǒng)計學家收集

—6—

賈俊平《統(tǒng)計學》考點精講

人口數(shù)據(jù)分析某地區(qū)人口增長的規(guī)律;通過實驗方法得到的實驗數(shù)據(jù),它大多用于自然現(xiàn)象,社會科

學領域也有應用,比如醫(yī)學家通過實驗驗證某種中成藥的療效。

優(yōu)缺點恰與間接來源相反。

第二節(jié)調查數(shù)據(jù)

1.概率抽樣與非概率抽樣

在數(shù)據(jù)采集階段,我們面臨的?個關鍵問題:如何選出一個好的樣本?相對而言,好的樣本包含

兩方面含義:

①對所研究問題有較強的針對性;

②調查費用與估計精度間要保持較高的性價比。

運用抽樣方式采集數(shù)據(jù)的具體方式有很多,但根據(jù)抽樣原則劃分只有概率抽樣和非概率抽樣兩

大類。

圖2—1抽樣方式圖標

1)概率抽樣(<prb豆btiayismp1ng

它是遵循隨機原則進行的抽樣,又稱隨機抽樣。

主要特點

抽取樣本時按一定的概率以隨機方式選擇樣本單位;

每個單位被抽中的概率是已知的,通??梢杂嬎愠鰜淼?;

當用樣本對總體指標進行估計時,需考慮到每個樣本單位被抽中的概率。

概率抽樣是調查實踐中最主要且應用最廣泛的類型,主要優(yōu)點是以隨機性為原則選取樣木,可以

導出樣本統(tǒng)計量的理論分布,進而依據(jù)調查結果,計算估計量誤差,確保了統(tǒng)計推斷的可靠性,因此是

獲得統(tǒng)計分析樣本的基本抽樣類型。

概率抽樣常用方式包括:

?簡單隨機抽樣(simelarnd)oSjmping

方法:從總體N個單位中隨機地抽取n個單位作為樣本,每個單位以相等的概率入選,為最基本

的抽樣方法,也是其它抽樣方法的基礎。

優(yōu)點:簡單、直觀,在抽樣框完整時,可直接從中抽取樣本;用樣本統(tǒng)計量對目標量進行估計比較方便。

注:抽樣框指包含全部總體單位及標志特征的一個框架。

局限性:當N很大時,構造抽樣框較困難;抽出的單位交分散,增加了實施調查的難度;無利用其

—7—

hda

它輔助信息以提高估計的效率。

?分層抽樣(St%tjfead$n)p1ng

方法:將總體單位按某種特征或規(guī)則先劃分為不同的層,然后從不同的層中獨立、隨機地抽取一

定數(shù)量的單位組成樣本。

優(yōu)點:保證了樣本的結構與總體的結構比較相近,從而提高估計的精度;一定條件下方便了調查

的組織實施;可以同時對總體和各層的目標量,效率較高。該方法在實踐中應用較為廣泛。

例如:某市稅務部門欲對市區(qū)600名個體戶的月零售額作抽樣調查,可按申報資金分為大、中、小

3類,比例數(shù)為1:4:5,假定選取120人作樣本,則可取大戶12人,中戶48人,小戶60人。

?整群抽樣(cultsarjsmp1ng

方法:先將總體中若干個單位合并為組(群),然后以群為單位直接抽取樣本,再對入選群中的所

有單位實施調查。

優(yōu)點:抽樣時只需群的抽樣框,可簡化工作量;調查的地點相對集中,節(jié)約費用,方便實施;

缺點:但由于同一群內(nèi)單位相對接近,對總體估計的誤差較大。

?系統(tǒng)抽樣(勺,tema5cas(np1ng

方法:先將總體中的所有單位按一定順序排列,并隨機地抽取一個單位作為初始單位,然后按事

先規(guī)定好的規(guī)則確定其它單位組成樣本。

典型方式先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,然后依次選取r+k,r+2k,…

等單位組成樣本。

優(yōu)點:操作簡便,一定條件下還可提高估計的精度;缺點:對估計量方差的比較困難。

?多階段抽樣(mutls>gesmp1ng

方法:先抽取群,但并不是調查群內(nèi)的所有單位,然后從入選的群中在抽取出若干個單位組成樣

本進行調查。因接受調查的單位需經(jīng)兩個步驟產(chǎn)生而命名二階段抽樣,將該方法推廣,使抽樣的段數(shù)

增多,就成為多階段抽樣。

例如第?階段抽取初級單位------群,第二階段抽取二級單位,第三階段抽取接受調查的最終抽樣

單位就是三階段抽樣。

優(yōu)點:具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調查費用;

缺點:需要包含所有低階段抽樣單位的抽樣框;由于實行了再抽樣,使調查單位分布于較為廣泛

的范圍內(nèi)展開;經(jīng)常被用于規(guī)模較大的抽樣調查。

2)非概率抽樣(non—p)r]btabijiysmp1ng

根據(jù)研究目的對數(shù)據(jù)的要求,采用非隨機方式從總體中抽出部分單位進行調查的抽樣方法。由

于所得為非隨機樣本,樣本統(tǒng)計量的分布是不確定的,因而無法使用樣本的結果推斷總體,非概率抽

樣適合于探索性的研究。

主要方式有以下幾種:

?方便抽樣

方法:調查過程中由調查員依據(jù)方便的原則,自行確定入選樣本的單位。

例如:調查員在各種公共場所進行的攔截調查。

8—

賈俊平《統(tǒng)計學》考點精講

?判斷抽樣

方法:研究人員根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本。

?自愿抽樣

方法:被調查者自愿參加,向調查人員提供有關信息構成樣本。

例如,參與報刊上和互聯(lián)網(wǎng)上刊登的調查問卷活動,或向某類節(jié)目撥打熱線電話等。

?滾血球抽樣

方法:先選擇一組調查單位,對其實施調查之后,再通過他們找到另外一些調查單位,進行此后的

調查。這個過程持續(xù)下去,就會形成滾雪球效應。適合于對稀少群體和特定群體研究。

?配額抽樣

方法:先將總體的所有單位按一定的標志(變量)分為若干類,然后在每個類中采用方便抽樣或判

斷抽樣的方式選取樣本單位。保證了總體中各類別的單位都能出現(xiàn)在樣本中。

非概率抽樣的幾種方式具有相似的優(yōu)缺點。

優(yōu)點:易與實施且成本低。

缺點:樣本單位的確定較為主觀隨意,對總體代表性差,調查結果不能用于推斷總體。

說明:鑒于本課程中抽樣技術不是主要內(nèi)容,下面討論中均假定樣本是采用簡單隨機抽樣方式選

出的,以便更好地把握統(tǒng)計推斷的原理。

2.搜集數(shù)據(jù)的基本方法

樣本單位確定后,從樣本單位得到所需的數(shù)據(jù)有以下常用方法,如圖2—2所示。

搜集數(shù)據(jù)的抵本方法

調在的數(shù)據(jù)實船的數(shù)據(jù)

自填式面訪式電話式

圖2—2數(shù)據(jù)搜集方法圖標顯示

?自填式問卷調查

方法:在無調查員協(xié)助的情況下由被調查者自己完成調查問卷。比如調查員分發(fā)、郵寄、網(wǎng)絡、媒

體等遞送方法的問卷。一般要求調查問卷結構嚴謹,有清楚的說明。

優(yōu)點:實施方便且成本低。

缺點:問卷的返收率較低,不適合結構復雜的問卷,調查周期較長,發(fā)現(xiàn)的問題無法及時調改。

?面訪式問卷調查

方法:調查員與被調查者面對面提問、被調查者回答的調查方式。

優(yōu)點:可提高調查的回答率、數(shù)據(jù)的質量,調節(jié)花費的時間。

缺點:成本較高且難控制調查質量。

?電話式問卷調查

方法:通過各種電訊工具向被調查者實施調查。

9—

hda

優(yōu)點:速度快、時效性強,尤其適合樣本單位較為分散的情形。

缺點:受到多種條件的限制。

?觀察式調查

方法:調查員通過直接觀察方式獲取信息。如交通流量的調查。

?選擇數(shù)據(jù)收集方法的依據(jù)

主要考察抽樣框中的有關信息、目標總體的特征、調查問題的內(nèi)容、有形輔助物的使用、實施調查

的資源、管理與控制和質量要求。表2—1給出了幾種收集數(shù)據(jù)方法的特點比較。

表2-1常用數(shù)據(jù)收集方法的特點

自填式面訪式電話式

調查時間慢中等快捷

調查費用低高低

問卷難度要求容易可以復雜要求容易

有形輔助物的使用中等利用充分利用無法利用

調查過程控制簡單復雜容易

調查員作用的發(fā)揮無法發(fā)揮充分發(fā)揮一般發(fā)揮

回答率最低較高一般

小結:沒有哪一種方法在各方面都是最好的,應根據(jù)實際問題的多方面因素綜合要求而定。

3.實驗數(shù)據(jù)

它是搜集數(shù)據(jù)的另一類方法,指在實驗中控制實驗對象而得到的變量數(shù)據(jù)。由于這類方法專業(yè)

性較強,多用于理工科對應的領域,本課程中少有應用,故這里不再詳述。

第三節(jié)數(shù)據(jù)的誤差

泛指通過調查得到的數(shù)據(jù)與研究對象真實結果之間的差異。主要包括抽樣誤差和非抽樣誤差兩

類,如圖2—3所示。

圖2—3數(shù)據(jù)誤差的圖標分解

1.抽樣誤差6sjnp)Ingeror

定義:由于抽樣的隨機性所引起的樣本結果與總體真值之間的差異。

描述的不是個體偏差,而是所有樣本可能的結果與總體真值之間的平均性差異。

抽樣調查所特有的,僅存在于概率抽樣中的隨機誤差,可以計量或測度,并通過抽樣設計加以控制。

—10—

賈俊平《統(tǒng)計學》考點精講

影響抽樣誤差的大小的主要因素:樣本量的大?。ǚ幢龋┖涂傮w的變異性(正比)。

2.非抽樣誤差(no§i-isn)p1ngeror

泛指除抽樣誤差之外的,由于其他原因造成的樣本結果與總體真值之間的差異。

存在于所有類型的調查之中,包括概率抽樣,非概率抽樣,全面性調查。

主要類型有以下幾種

抽樣框誤差-----由于抽樣框的不完善所致,如抽樣框中遺漏部分總體單位;

回答誤差-----被調查者在接受調查時的回答與真實情況不符所致,原因包括理解誤差、記憶誤

差、有意識誤差;

無回答誤差-----被調查者拒絕接受調查,導致結果出現(xiàn)偏差,尤其是系統(tǒng)性的;

調查員誤差-----由于調查員自身的原因所致;

測量誤差-----由于調查的方式、測量工具的不完善所致。

3.誤差的控制

概率抽樣下抽樣誤差是不可避免的,但可計量,并能在統(tǒng)計理論指導卜,采取措施,控制其大小。

非抽樣誤差的控制的主要方面是調查過程的質量控制,可在調查員的挑選、培訓、督導及抽樣調

查的管理制度上采取措施。

11—

hda

第三章數(shù)據(jù)的圖表展示(一)

基本內(nèi)容

數(shù)據(jù)的預處理、頻數(shù)分布表的編制、兩類數(shù)據(jù)的整理與圖標展示。

重點內(nèi)容

數(shù)據(jù)預處理的方法、識別圖表中統(tǒng)計結論與特征。

學習目標

1.熟悉數(shù)據(jù)預處理的各種方法

2.了解兩類數(shù)據(jù)的整理與展示的方法、特點和差異

3.了解各種常用圖表的制作方法和應用條件

4.能夠識別各種常用圖表的統(tǒng)計結論與特征

第一節(jié)數(shù)據(jù)的預處理

數(shù)據(jù)的預處理是在對數(shù)據(jù)分類或分組之前所做的必要處理,確保數(shù)據(jù)的可靠性和應用的便利性。

主要內(nèi)容包括數(shù)據(jù)的審核、篩選、排序等。

1.數(shù)據(jù)審核

含義:檢查數(shù)據(jù)中有無錯誤。

?對調查取得的原始數(shù)據(jù),主要審核完整性和準確性兩個方面。

完整性審核-----應調查單位有無遺漏,各調查項目或變量是否填寫齊全;

準確性審核-----數(shù)據(jù)是否真實可靠,是否有錯誤或異常,計算的正確性等。

?對間接獲取的二手數(shù)據(jù),還需追加審核適用性、時效性。

適用性審核-----通過對數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關的背景材料的分析,判斷對自己的研究

有無應用價值;

時效性審核-----考察時間滯后性對數(shù)據(jù)的影響。

2.數(shù)據(jù)篩選(da;*f1er

含義:根據(jù)需要找出符合某種特定條件的數(shù)據(jù)。

數(shù)據(jù)篩選的原因-----數(shù)據(jù)中的錯誤不能糾正,或某些數(shù)據(jù)不符合調查要求且又無法彌補。

數(shù)據(jù)篩選的內(nèi)容-----剔除不符合要求或錯誤的數(shù)據(jù),篩選出符合特定條件的數(shù)據(jù)。

數(shù)據(jù)篩選可以由Exc(e1數(shù)據(jù)】菜單下【篩選】或【高級篩選】命令完成。

12-

賈俊平《統(tǒng)計學》考點精講

注意:各種圖標的制作需要借助于ExcelSPSS統(tǒng)計軟件實現(xiàn),非本課程基本內(nèi)容,輔導課均不作

介紹,有興趣同學可以通過教材自學。

3.數(shù)據(jù)排序(d用trnk)

含義:按一定順序將數(shù)據(jù)進行排列整理,包括升序和降序兩種。排序之后的數(shù)值型數(shù)據(jù)也被稱為

順序統(tǒng)計量(o(jresit§pctsi)。

作用:便于發(fā)現(xiàn)一些明顯的數(shù)據(jù)特征或趨勢,找到解決問題的線索;有助于對數(shù)據(jù)檢查糾錯,以及

為重新歸類或分組等提供依據(jù);排序本身也是分析的內(nèi)容與目的之一。

各種類型數(shù)據(jù)的排序都可以由Excp1數(shù)據(jù)】菜單下【自動篩選】命令實現(xiàn)。

4.數(shù)據(jù)透視表(@boatbi)

方法:按使用者的習慣或分析要求對數(shù)據(jù)表的重要信息進行匯總和作圖,形成?個符合需要的交

叉表(列聯(lián)表),建表條件是數(shù)據(jù)源表首行必須設置列標題。

作用:通過對數(shù)據(jù)源表的整理,能夠從復雜的數(shù)據(jù)中提取更為綜合、系統(tǒng)的有用信息。

數(shù)據(jù)透視表可以由Exc【e1數(shù)據(jù)透視表】工具生成。

第二節(jié)品質數(shù)據(jù)的整理與展示

數(shù)據(jù)經(jīng)過預處理后,可根據(jù)需要進一步作分類或分組,即數(shù)據(jù)整理。作用是便于更直觀清晰地顯示數(shù)

據(jù)特征。圖表是數(shù)據(jù)整理中基本的展示方式,合理使用圖表描述統(tǒng)計結果是應用統(tǒng)計的基本技能之一。

數(shù)據(jù)的整理與顯示的基本問題:需弄清所面對的數(shù)據(jù)類型,以便采取針對性的處理方式。對品質

數(shù)據(jù)(分類數(shù)據(jù)和順序數(shù)據(jù))主要是作分類整理,對數(shù)值型數(shù)據(jù)則主要是作分組整理。

1.分類數(shù)據(jù)的整理與展示

基本過程:列出所分類別,計算各類別的頻數(shù)、頻率或比例,制出頻數(shù)分布表,通過圖表展示數(shù)據(jù)

的直觀特征。

1)頻數(shù)與頻數(shù)分布

頻數(shù)(fequency)-----落在各類別中的數(shù)據(jù)個數(shù);

頻數(shù)分布表-----將各個類別及落在其中的相應頻數(shù)全部列出的統(tǒng)計表格。

分類數(shù)據(jù)的頻數(shù)分布表既可以由Exct1數(shù)據(jù)透視表】或【數(shù)據(jù)分析】工具中的【直方圖】命令生

成,還可以運用SPSS相應功能鍵實現(xiàn),包括制作多個變量交叉分類的列聯(lián)表。頻數(shù)分布表實例見

【例3.1】和【例3.2

【例3.1]對學生購買飲料品牌的調查資料建立頻數(shù)分布表。

表3—1學生購買飲料品牌的頻數(shù)分布表

代飲料品牌x頻數(shù)(人)f頻率(%)

1可口可樂1530

2百事可樂1122

3蒙牛918

4娃哈哈612

5伊利918

合計50100

13—

hda

【例3.2]對某百貨公司日商品銷售額建立頻數(shù)分布表。

表3—2某百貨公司日商品銷售額的頻數(shù)分布表

按銷售額分組X(萬元)頻數(shù)f(天)頻率(%)

25?30410.0

30?35615.0

35?401537.5

40?45922.5

45?50615.0

合計40100

其它描述分類數(shù)據(jù)的統(tǒng)計量:

比例(P°rp(prin):研究對象的某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值

百分比(p?「aentge):將對比的基數(shù)作為100的比值

比率(『比):研究對象中不同類別數(shù)據(jù)的比值

注意:比率不是部分與整體之間的對比關系,因而比值可能大于1。

2)分類數(shù)據(jù)的圖示

統(tǒng)計圖是統(tǒng)計數(shù)據(jù)最形象、直觀的表現(xiàn)形式,有許多種圖形能刻畫頻數(shù)、比例分布的特征。

條形圖(barqhar)------用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)多少的圖形,主要用于

反映分類數(shù)據(jù)的頻數(shù)分布,實例參見圖3-1o

帕雷托圖(P電bt2har)------按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖,特點易于比較

各類數(shù)據(jù)頻數(shù)多少,實例參見圖3—2。

【例3.3]為研究不同類型軟飲料的市場銷售情況,一家市場調查公司對隨機抽取的一家超市

進行了調查。調查員隨機觀察的50名顧客購買飲料的類型及購買者性別的記錄。生成頻數(shù)條形圖

和帕雷托圖,觀察飲料類型的分布狀況,并進行描述性分析。

飲料類5!

圖3—1飲料類型銷售量的條形圖

對比條形圖(SideTbyFsdebarchar)--------將分類變量在不同時間或不同空間上的多個取值合成

起來的條形圖,用于對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢。飲料類型銷

售量的帕雷托圖參見圖3—2。

14—

賈俊平《統(tǒng)計學》考點精講

圖3—2飲料類型銷售量的帕雷托圖

【例3.4]根據(jù)某商場一季度和二季度不同品牌電腦銷售情況數(shù)據(jù),試建立電腦銷售量的季度

對比條形圖。

8oo

7oo

6OO

電腦品季二季

5oO

聯(lián)想2546

4oO

IB2839O

3oO?季度

O

康柏24322o。二季度

O

戴爾5668IO

聯(lián)想IBM果柏蛾爾電腦品牌

圖3-3電腦銷售量的對比條形圖

餅圖(Peighar)--------用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形,主要用于數(shù)據(jù)結構性研

究,表示樣本或總體中各組成部分所占的比例。只能顯示一個總體各部分所占的比例。飲料類型銷

售量的餅圖參見圖3—4。

綠茶

圖3—4飲料類型銷售量的餅圖

環(huán)形圖(doughnutchar)---------餅圖挖去中間部分,形成的一個多層環(huán)狀圖形,可以同時描述多個

樣本或總體的數(shù)據(jù)比例,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán),結構比較研究上優(yōu)于餅圖。

2.順序數(shù)據(jù)的整理與圖示

分類數(shù)據(jù)的整理與展示的各種方法均適用于順序數(shù)據(jù),本段介紹適用于順序數(shù)據(jù)的整理與圖示方法。

15—

hda

累積頻數(shù)(Cumauiltrvesfequenci)-----各順序類別頻數(shù)的逐級累加的和數(shù)。應用中有向上累積和

向下累積兩種算法。作用是可直觀看出某一類別以上(下)頻數(shù)之和。

累積頻率(cun^uil4%eperentges)-----各順序類別頻率的逐級累加的比例數(shù)。

依據(jù)累積頻數(shù)或累積頻率可繪制出累積圖,展示數(shù)據(jù)的累積效果。借助于Excel的計算及制圖功

能即可實現(xiàn)。

【例3.5]在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的

一個問題是:“您對您家庭目前的住房狀況是否滿意?”

1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。

試依據(jù)調查數(shù)據(jù)建立甲乙兩個城市的累積頻數(shù)表,繪制出環(huán)形圖。

表3—3甲城市家庭對住房狀況評價的頻數(shù)分布

甲城市

向上累積向下累枳

回答類別

戶數(shù)百分比

戶數(shù)百分比戶數(shù)百分比

(戶(%)

(戶(%)(戶)(%)

)

非常不滿意2828.3010

不滿意136142792

一般931271656

滿意415297525

非常滿意3103103010

合計310————

乙城市

向上累積向下累積

回答類別

戶數(shù)百分比

戶數(shù)百分比戶數(shù)百分比

(戶(%)

(戶(%)(戶)(%)

)

非常不滿意27.27.3010

不滿意9314279

一?般7216186

滿意6228103

非常滿意31310381

合計310————

賈俊平《統(tǒng)計學》考點精講

■非常不滿意

口不滿意

口一般

口滿意

■非常滿意

圖3一5甲乙兩城市家庭對住房狀況的評價形圖

17—

hda

第三章數(shù)據(jù)的圖形展示(二)

第三節(jié)數(shù)值型數(shù)據(jù)的整理與展示

品質數(shù)據(jù)的整理與展示的各種方法均適用于數(shù)值型數(shù)據(jù),但是還有一些不適用于品質數(shù)據(jù),而為

數(shù)值型數(shù)據(jù)所特定的整理與圖示方法。本段主要介紹這些方法。

1.數(shù)據(jù)分組

按照數(shù)據(jù)統(tǒng)計研究的需要,將原始數(shù)據(jù)按照某種標準化分成不同的組別的方法即為數(shù)據(jù)分組。

數(shù)據(jù)分組后很容易算出各組頻數(shù),形成頻數(shù)分布表,因此便于觀察數(shù)據(jù)的分布特征。

數(shù)據(jù)分組常用方法有單變量值分組和組距分組兩種。

單變量值分組-----將每一個變量值作為一組,適合于離散變量或變量值較少的情況;

組距分組-----將全部變量值依次劃分為若干個區(qū)間,以變量值的一個區(qū)間作為一組,適合于連續(xù)

變量或變量值較多的情況,可采用等距分組,也可采用不等距分組。

相關概念:

上限(uppF41md才和下限(1W1mi):一個組的最大值和最小值;

組距(cal&hwit):上限與下限之差;

組中值(cal&is/p。it:下限與上限之間的中點值,代表各組數(shù)據(jù)的一般水平值。

分組繪制頻數(shù)分布表主要步驟:

1)確定組數(shù)-----應以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,組數(shù)一般取為5W

K<15;

2)確定組距-----可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,通常

組距=(最大值一最小值)小組數(shù)

3)數(shù)據(jù)分組整理制成頻數(shù)分布表

組距分組應遵循“不重不漏”的原則以及“上組限不在內(nèi)”的規(guī)定。

借助于Exce1中的【直方圖】工具或頻數(shù)函數(shù)均可創(chuàng)建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論