中級統(tǒng)計師講義-統(tǒng)計業(yè)務知識之統(tǒng)計方法_第1頁
中級統(tǒng)計師講義-統(tǒng)計業(yè)務知識之統(tǒng)計方法_第2頁
中級統(tǒng)計師講義-統(tǒng)計業(yè)務知識之統(tǒng)計方法_第3頁
中級統(tǒng)計師講義-統(tǒng)計業(yè)務知識之統(tǒng)計方法_第4頁
中級統(tǒng)計師講義-統(tǒng)計業(yè)務知識之統(tǒng)計方法_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章統(tǒng)計和數(shù)據(jù)

本章主要內容:

1.統(tǒng)計的含義

2.定性與定量數(shù)據(jù)、觀測與實驗數(shù)據(jù)

3.數(shù)據(jù)的直接與間接來源、搜集數(shù)據(jù)的方法

重點:

1.統(tǒng)計分析數(shù)據(jù)的方法:描述統(tǒng)計與推斷統(tǒng)計

2.數(shù)據(jù)的類型:定性與定量變量、觀測與實驗數(shù)據(jù)

3.數(shù)據(jù)的來源:直接來源與間接來源

4.搜集數(shù)據(jù)的方法:普查、抽樣調查、統(tǒng)計報表、重點調查、典型調查。

難點:

1.描述與推斷統(tǒng)計的區(qū)別

2.定性變量與定量變量的區(qū)別

3.典型抽樣的形式

第一節(jié)統(tǒng)計的含義

知識點一:什么是統(tǒng)計

1.含義

統(tǒng)計是用來處理數(shù)據(jù)的,關于數(shù)據(jù)的一門學問。按大百科全書的定義:統(tǒng)計學是

用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結論的一組概念、原則和方法。

[例題?多選題]下列關于統(tǒng)計學的描述,正確的有()。

a.統(tǒng)計學是用來處理數(shù)據(jù)的,是關于數(shù)據(jù)的一門學問

b.統(tǒng)計學是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結論的一組概念、原則和方

c.統(tǒng)計分析數(shù)據(jù)的方法大體上可分為描述統(tǒng)計和推斷統(tǒng)計兩大類

d.在現(xiàn)代社會中,幾乎所有領域都會應用到統(tǒng)計學

e.統(tǒng)計的應用范圍很廣泛,有時也會被濫用

答案:abcde

解析:統(tǒng)計學是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結論的一組概念、原則和

方法。統(tǒng)計分析數(shù)據(jù)分描述統(tǒng)計和推斷統(tǒng)計。統(tǒng)計是適用于所有學科領域的通用

數(shù)據(jù)分析方法,是一種通用的數(shù)據(jù)分析語言。

2.種類

統(tǒng)計分析數(shù)據(jù)的方法分兩種:描述統(tǒng)計和推斷統(tǒng)計

描述統(tǒng)計:是研究數(shù)據(jù)搜集、處理和描述的統(tǒng)計學方法。其內容包括如何取得研

究所需要的數(shù)據(jù),如何用圖表形式對數(shù)據(jù)進行處理和展示,如何通過對數(shù)據(jù)的綜

合、概括與分析,得出所關心的數(shù)據(jù)特征。

推斷統(tǒng)計:是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法,內容包括參

數(shù)估計和假設檢驗兩大類。

[例題?單選題]研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法是()。

a.描述統(tǒng)計b.理論統(tǒng)計

c.推斷統(tǒng)計d.應用統(tǒng)計

答案:c

解析:推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法,內容包

括參數(shù)估計和假設檢驗兩大類

[例題?判斷題]描述統(tǒng)計是研究如何利用樣本數(shù)據(jù)來獲得總體特征的統(tǒng)計學方

法。

答案:錯

解析:描述統(tǒng)計是研究數(shù)據(jù)搜集、處理和描述的統(tǒng)計學方法。

知識點二:統(tǒng)計的應用

一、統(tǒng)計的應用領域

統(tǒng)計是適用于所有學科領域的通用數(shù)據(jù)分析方法,是一種通用的數(shù)據(jù)分析語言。

無論是在社會科學領域,還是在自然科學領域,進行某個課題的研究時,為使觀

點與結論具有事實依據(jù)和說服力,必須根據(jù)調查研究或實驗取得的統(tǒng)計數(shù)據(jù)來說

明問題,這需要運用科學地統(tǒng)計方法來進行。

二、統(tǒng)計的誤用與濫用

統(tǒng)計常常被人們有意或無意地濫用。如,錯誤的統(tǒng)計定義、錯誤的圖表提示、一

個不合理的樣本、數(shù)據(jù)的遺漏或邏輯錯誤等。這些誤用有些是常識性的,有些是

技術性的,有些則是故意的。作為從數(shù)據(jù)中尋找事實的統(tǒng)計,卻被有人變成了歪

曲事實的工具。

[例題?判斷題]統(tǒng)計是適用于所有科學領域的通用數(shù)據(jù)分析方法。

答案:正確。

解析:統(tǒng)計是適用于所有學科領域的通用數(shù)據(jù)分析方法,是一種通用的數(shù)據(jù)分析

語言。

第二節(jié)數(shù)據(jù)類型

知識點一:變量與數(shù)據(jù)

變數(shù)或變量:是指沒有固定的值,可以改變的數(shù)。它們的特點是從一次觀察到下

一次觀察會出現(xiàn)不同的結果。

數(shù)據(jù):把觀察到的結果記錄下來就是數(shù)據(jù)。統(tǒng)計數(shù)據(jù)就是統(tǒng)計變量的具體表現(xiàn)。

[例題?判斷題]變量是數(shù)據(jù)的具體體現(xiàn)。

答案:錯誤。

解析:數(shù)據(jù)是變量的具體表現(xiàn)。

知識點二:數(shù)據(jù)類型

一、定性變量(數(shù)據(jù))與定量變量(數(shù)據(jù))

(一)定性變量:反映“職業(yè)”、“教育程度”等現(xiàn)象的屬性特點的變量

定性變量的特點:它只能反映現(xiàn)象的屬性特點,而不能說明具體量的大小和差異。

定性變量的分類:分類變量與順序變量

分類變量:沒有量的特征,只有分類特征。這種只反映現(xiàn)象分類特征的變量又稱

分類變量。分類變量的觀測結果就是分類數(shù)據(jù)。說明事物類別的一個名稱。如“性

別”就是一個分類變量。分類變量沒有數(shù)值特征,所以不能對其數(shù)據(jù)進行數(shù)學運

算。

順序變量:如果類別具有一定的順序,如,“教育類別”,這樣的變量稱為順序

變量,相應的觀察結果就是順序數(shù)據(jù)。說明事物有序類別的一個名稱,這類變量

的具體表現(xiàn)就是順序數(shù)據(jù)。

順序數(shù)據(jù)之間雖然可以比較大小,卻無法計算相互之間大小、高低和優(yōu)劣的距離。

這樣的數(shù)據(jù)仍然用來表示事物在性質上的差異,而不能用來反映事物在數(shù)量上的

差異。

(二)數(shù)值(定量)變量:

反映“天氣溫度”、“月收入”等變量可以用數(shù)值表示其觀察結果,而且這些數(shù)

值具有明確的數(shù)值含義,不僅能分類而且能測量出來具體大小和差異。這些變量

就是定量變量也稱數(shù)值變量,定量變量的觀察結果成為定量數(shù)據(jù)。是說明事物數(shù)

字特征的一個名稱。

定性變量與定量變量的區(qū)別:

1.分類變量沒有數(shù)值特征,所以不能對其數(shù)據(jù)進行數(shù)學運算。分類數(shù)據(jù)只能用來

區(qū)分事物,而不能用來表明實物之間的大小、優(yōu)劣關系。

2.順序變量比分類變量向前進一步,它不僅能用來區(qū)分客觀現(xiàn)象的不同類別,而

且還可以表明現(xiàn)象之間的大小、高低、優(yōu)劣關系。顯然,順序數(shù)據(jù)的功能比分類

數(shù)據(jù)要強一些,對事物的劃分也更精細一些。但順序數(shù)據(jù)的數(shù)據(jù)之間雖然可以比

較大小,卻無法計算相互之間的大小、高低或優(yōu)劣的距離。只是反映事物在性質

上的差異,而不能用來反映事物在數(shù)量上的差異。因此,從本質上,順序數(shù)據(jù)仍

然是定性數(shù)據(jù)中的一種。

3.數(shù)值型數(shù)據(jù)作為統(tǒng)計研究的主要資料,其特征在于它們都是以數(shù)值的形式出現(xiàn)

的,有些數(shù)值型數(shù)據(jù)只可以計算數(shù)據(jù)之間的絕對差,而有些數(shù)值型數(shù)據(jù)不僅可以

計算數(shù)據(jù)之間的絕對差,還可以計算數(shù)據(jù)之間的相對差。其計量精度遠遠高于定

性數(shù)據(jù)。在統(tǒng)計學研究中,對數(shù)值型數(shù)據(jù)的研究是定量分析的主要內容。

從上述三種數(shù)據(jù)的基本特點可以看出,這三類數(shù)據(jù)對事物的描述是由定性到定

量、由低級到高級,從粗略到精細。在統(tǒng)計研究中,需要明確各種數(shù)據(jù)所適用的

統(tǒng)計方法,正確的選擇和應用,這是正確進行統(tǒng)計研究的基本要求。

[例題?單選題]下列變量是定性變量的是()。

a.年齡

b.職業(yè)

c.居民的受教育年限

d.月收入

答案:b

解析:定性變量是反映“職業(yè)”、“教育程度”等現(xiàn)象的屬性特點的變量,不能

說明具體量的大小和差異。

[例題?單選題]為了便于數(shù)據(jù)分析,人們常用數(shù)字1表示男性,2表示女性,

這個數(shù)字1和2()o

a.具有數(shù)量上的差異

b.具有實際數(shù)字含義

c.只是一個編號

d.可以進行運算

答案:c

解析:這種變量是分類變量,沒有量的特征,只有分類特征。

[例題?單選題]若產品質量由高到低劃分為三個級別:1級、2級、3級,則

下列說法中正確的是()。

a.1級品的質量是2級品的兩倍

b.2級品的質量是1級品的兩倍

c.產品質量級別是順序數(shù)據(jù)

d.產品質量級別是定量數(shù)據(jù)

答案:c

解析:產品質量級別是定性變量,只是反映產品之間在質量上的性質差異,卻無

法計算相互之間大小、高低和優(yōu)劣的距離。

[例題?單選題]下列關于變量數(shù)據(jù)的說法錯誤的是()。

a.分類數(shù)據(jù)只能用來區(qū)分事物,不能用來表明事物間的大小、優(yōu)劣

b.順序數(shù)據(jù)具有數(shù)值特征,可以用于反映事物在數(shù)量上的差異

c.數(shù)值型數(shù)據(jù)的計量功能要大于分類數(shù)據(jù)和順序數(shù)據(jù)

d.在統(tǒng)計學研究中,對數(shù)值型數(shù)據(jù)的研究是定量分析的主要內容

答案:b

解析:順序數(shù)據(jù)的數(shù)據(jù)之間雖然可以比較大小,卻無法計算相互之間的大小、高

低或優(yōu)劣的距離。只是反映事物在性質上的差異,而不能用來反映事物在數(shù)量上

的差異。

二、觀測數(shù)據(jù)和實驗數(shù)據(jù)

按獲取數(shù)據(jù)的方法不同,可分為觀測數(shù)據(jù)和實驗數(shù)據(jù)。

觀測數(shù)據(jù)可能是全面數(shù)據(jù)也可能是樣本數(shù)據(jù)(局部),實驗數(shù)據(jù)一般都是樣本數(shù)

據(jù)。

1.觀測數(shù)據(jù)。

觀測數(shù)據(jù)是對客觀現(xiàn)象進行實地觀測所取得的數(shù)據(jù),在數(shù)據(jù)取得的過程中一般沒

有人為的控制和條件約束。在社會經濟問題研究中,觀測是取得數(shù)據(jù)最主要的方

法。

2.實驗數(shù)據(jù)。

實驗數(shù)據(jù)一般是在科學實驗環(huán)境下取得的數(shù)據(jù)。在實驗中,實驗環(huán)境是受到嚴格

控制的,數(shù)據(jù)的產生一定是某一約束條件下的結果。在自然科學研究中實驗的方

法應用非常普遍。

[例題?單選題]根據(jù)獲取方法不同,數(shù)據(jù)可分為觀測數(shù)據(jù)和()o

a.描述數(shù)據(jù)

b.實驗數(shù)據(jù)

c.推斷數(shù)據(jù)

d.分析數(shù)據(jù)

答案:b

解析:按獲取數(shù)據(jù)的方法不同,可分為觀測數(shù)據(jù)和實驗數(shù)據(jù)。

第二章數(shù)據(jù)描述

重點:

1.定性數(shù)據(jù)和定量數(shù)據(jù)的圖表展示方法

2.標準的統(tǒng)計表的構成

3.定性數(shù)據(jù)和定量數(shù)據(jù)的數(shù)字特征

難點:

1.定性數(shù)據(jù)和定量數(shù)據(jù)的圖表展示的區(qū)別

2.定性數(shù)據(jù)和定量數(shù)據(jù)的數(shù)字特征的區(qū)別

知識點一:定性數(shù)據(jù)的圖表展示方法

定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),它們的圖表展示方法基本相同。通??梢杂?/p>

頻數(shù)分布表和圖形來描述。

一.生成頻數(shù)分布表

定性數(shù)據(jù)本身是對事物的一種分類,因此,只要先把所有的類別都列出來,然后

統(tǒng)計出每一類別的頻數(shù),就是一張頻數(shù)分布表。頻數(shù)分布表中落在某一特定類別

的數(shù)據(jù)個數(shù)稱為頻數(shù)。頻數(shù)分布包含了很多有用的信息,通過它可以觀察不同類

型數(shù)據(jù)的分布情況。

頻數(shù)分步表一般是用excel生成。

[例題?單選題]在某一特定類別中的數(shù)據(jù)個數(shù)稱為()。

a.均值b.眾數(shù)

c.標準差d.頻數(shù)

答案:d

解析:頻數(shù)分布表中落在某一特定類別的數(shù)據(jù)個數(shù)稱為頻數(shù)。頻數(shù)分布包含了很

多有用的信息,通過它可以觀察不同類型數(shù)據(jù)的分布情況。

二.定性數(shù)據(jù)的圖形表示

定性數(shù)據(jù)(分類數(shù)據(jù)和順序數(shù)據(jù))可以描繪出它們各類的比例,常用餅圖和條形

圖表示。

(-)餅圖

餅圖又稱圓餅圖、圓形圖等,它是利用圓形及圓內扇形面積來表示數(shù)值大小的圖

形。餅圖主要用于總體中各組成部分所占比重的研究。

(二)條形圖

條形圖是用寬度相同的條形的高度或長度來表述數(shù)據(jù)多少的圖形,用于觀察不同

類別數(shù)據(jù)的多少或分布情況。

(三)環(huán)形圖

餅圖只能顯示一個變量(如年齡變量)各部分所占的比重。如果我們想比較不同

變量之間的結構差異,就可以通過環(huán)形圖來實現(xiàn)。

首先,利用產生頻數(shù)表的方法先做出分性別的年齡分布表;然后,根據(jù)

上表再繪制出環(huán)形圖。

[例題?單選題]條形圖是利用寬度相同的條形的()來表述數(shù)據(jù)多少的圖形。

a.面積b.高度或長度

c.頻數(shù)d.類別

答案:b

解析:條形圖是用寬度相同的條形的高度或長度來表述數(shù)據(jù)多少的圖形,用于觀

察不同類別數(shù)據(jù)的多少或分布情況。

[例題?單選題]若需要比較不同變量之間的結構差異,可采用的圖形為()。

a.頻數(shù)分布圖b.條形圖

c.餅圖d.環(huán)形圖

答案:d

解析:餅圖只能顯示一個變量(如年齡變量)各部分所占的比重。如果我們想比

較不同變量之間的結構差異,就可以通過環(huán)形圖來實現(xiàn)。

[例題?單選題]餅圖是利用圓形及圓內扇形的()來表示數(shù)值大小。

a.面積b.弧線長度c.角度d.顏色

答案:a

解析:餅圖又稱圓餅圖、圓形圖等,它是利用圓形及圓內扇形面積來表示數(shù)值大

小的圖形。餅圖主要用于總體中各組成部分所占比重的研究。

第二節(jié)用圖表展示定量數(shù)據(jù)

知識點一:生成頻數(shù)分布表

定性數(shù)據(jù)的圖示表示方法,也都適用于定量數(shù)據(jù)。但定量數(shù)據(jù)還有一些特定的圖

示方法,它們并不適用于定性數(shù)據(jù)。

生成定量數(shù)據(jù)的頻數(shù)分布表時,首先是將數(shù)據(jù)進行分組,然后再統(tǒng)計出各組別的

數(shù)據(jù)頻數(shù)即可

定量數(shù)據(jù)頻數(shù)分布表的生成過程:

首先,要對數(shù)據(jù)進行分組

其次,要確定組距。所謂組距是指每個組變量值中的最大值與最小值之差。每組

最大值稱為該組上限,最小值稱為該組下限。則組距等于上限與下限之差,即組

距=上限-下限

[例題?單選題]生成定量數(shù)據(jù)的頻數(shù)分布表時,首先要對數(shù)據(jù)()

a.分類b.確定組距c.分組d.確定組頻數(shù)

答案:c

解析:生成定量數(shù)據(jù)的頻數(shù)分布表時,首先是將數(shù)據(jù)進行分組,然后再統(tǒng)計出各

組別的數(shù)據(jù)頻數(shù)即可。

在確定組距是,一般應掌握的原則:-是要考慮各組的劃分是否能區(qū)分總體內部

各個組成部分的性質差別。如果不能正確反映各部分質的差異,必須重新分組。

二是要能準確地清晰地反映總體單位的分布特征。

在確定組距時,在研究的現(xiàn)象變動比較均勻的情況下,可以采用等距分組;而當

研究的現(xiàn)象變動很不均勻時,例如急劇的增長或急劇的下降,波動的幅度很大時,

則一般采用不等距分組。在實際工作中,要結合實際情況確定各組的組距。

[例題?判斷題]能夠對統(tǒng)計總體進行分組,是由統(tǒng)計總體中的各個單位所具有的

同質性特點決定的。

答案:錯誤

解析:在確定組距是,一般應掌握的原則:一是要考慮各組的劃分是否能區(qū)分總

體內部各個組成部分的性質差別。如果不能正確反映各部分質的差異,必須重新

分組。

最后,統(tǒng)計出各組的頻數(shù)及頻數(shù)分布表。在統(tǒng)計各組頻數(shù)時,恰好等于某一組的

組限時,則采取上限不在內的原則,即將該頻數(shù)計算在與下限相同的組內。

[例題?單選題]在統(tǒng)計分組中,如果某一數(shù)值恰好等于某一組的組限時,則采取

()O

a.下限不在內的原則b.上限不在內的原則

c.上下限都可以在內的原則d.上下限都不在內的原則

答案:b

解析:分組采取的是“上限不在內”的原則.

[例題?多選題]確定組距時()o

a.要考慮各組的劃分是否能區(qū)分總體內部各個組成部分的性質差別

b.要能準確清晰地反映總體單位的分布特征

c.在研究的現(xiàn)象變動比較均勻時,可采用等距分組

d.在研究的現(xiàn)象變動不均勻時,可采用不等距分組

e.各組的下組限一般不包括在本組當中

答案:abed

解析:分組采取的是“上限不在內”的原則.

[例題?單選題]某連續(xù)變量分為五組,第一組為40-50,第二組為50-60,

第三組為60-70第四組為70-80,第五組為80以上,依照規(guī)定()。

a.50在第一組,70在第四組b.60在第二組,80在第五組c.70在第四

組,80在第五組d.80在第四組,50在第二組

答案:c

解析:分組有“上限不在其內”,所以50在第二組、60在第三組、70在第四組、

80在第五組。

知識點二:定量數(shù)據(jù)的圖形表示

定性數(shù)據(jù)的圖形都可以表述定量數(shù)據(jù),但效果不好。

常用來表述定量數(shù)據(jù)統(tǒng)計圖形有:直方圖、折線圖和散點圖。

此外還有莖葉圖、箱線圖等,由于excel不能實現(xiàn)這些圖。

1.直方圖

對于一個定量數(shù)據(jù),直方圖是一個常見的而且非常重要的圖形。它的橫坐標代表

變量分組,縱指標代表各變量值出現(xiàn)的頻數(shù),這樣,各組與相應的頻數(shù)就形成了

一個矩形,即直方圖。

2.折線圖

折線圖是利用線段的升降來說明現(xiàn)象變動的一種統(tǒng)計圖,它主要用于表示現(xiàn)象的

分配情況、現(xiàn)象在時間上的變化和兩個現(xiàn)象之間的依存關系等。

3.散點圖

散點圖能反映兩個變量的關系,判斷其變化的方向是否相同

[例題?單選題]下列圖形中不能在excel當中實現(xiàn)的是()。

a.直方圖b.折線圖

C.箱形圖d.散點圖

答案:C

解析:常用來表述定量數(shù)據(jù)統(tǒng)計圖形有直方圖、折線圖和散點圖。此外還有莖葉

圖、箱線圖等,由于excel不能實現(xiàn)這些圖。

[例題?單選題]常用于表示定性數(shù)據(jù)的統(tǒng)計圖是()。

a.直方圖b.散點圖

c.條形圖d.折線圖

答案:c

解析:直方圖、散點圖和折線圖都是表示定量數(shù)據(jù)的統(tǒng)計圖。

[例題?單選題]常用于表示定量數(shù)據(jù)的統(tǒng)計圖是()。

a.直方圖b.條形圖

c.餅圖d.環(huán)形圖

答案:a

解析:直方圖只能表示定量數(shù)據(jù)不能表示定性數(shù)據(jù)。

第三節(jié)用統(tǒng)計表來表示數(shù)據(jù)

知識點一:統(tǒng)計表的構成

統(tǒng)計表和統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種方式。

統(tǒng)計表是一種用密集的形式歸納數(shù)據(jù)的方法,它主要利用行和列中的數(shù)據(jù)來表述

現(xiàn)象特征。

人們利用統(tǒng)計表的主要目的有:一是在文章中使用它以支持自己的觀點;二是利

用它組織數(shù)據(jù)。

把整理匯總得出的統(tǒng)計數(shù)據(jù)資料,按照一定的結構和順序,有系統(tǒng)地排列在一定

的表格內,就形成一張統(tǒng)計表。

統(tǒng)計表的主要優(yōu)點是:能使統(tǒng)計資料條理化、系統(tǒng)化,能清晰的表達統(tǒng)計資料的

內容,且簡明易懂、節(jié)省篇幅,便于對表中資料進行對比,并易于檢查數(shù)字的完

整性和正確性。

統(tǒng)計表一般由五個部分組成,即表頭、行標題、列標題、數(shù)字資料和表外附加構

成。

表頭,在表的上方,說明的是表的主要內容

行標題和列標題,放在表的第一行和第一列,表示的是所研究問題類別的名稱和

指標名稱

表的其余部分是具體的數(shù)字資料

表外附加,放在表的下方,說明資料來源、指標注釋和必要的說明等內容。通常,

統(tǒng)計表左右兩邊不能封口

[例題-多選題]下列關于統(tǒng)計表的說法中,正確的有()。

a.統(tǒng)計表是組織數(shù)據(jù)的一種有效形式b.表頭放在統(tǒng)計表的上方c.行標題放在

統(tǒng)計表的第二行d.統(tǒng)計表的左右兩邊不能封口e.統(tǒng)計表可用來支持使用者的

觀點

答案:abde

解析:統(tǒng)計表是一種用密集的形式歸納數(shù)據(jù)的方法,它主要利用行和列中的數(shù)據(jù)

來表述現(xiàn)象特征。行標題放在統(tǒng)計表的第一列,第一行是列標題。

[例題?多選題]統(tǒng)計表組成部分包括()。

a.表頭b.行標題c.列標題d.數(shù)字資料

e.表外附加

答案:abcde

解析:統(tǒng)計表組成部分包括:表頭;行、列標題;數(shù)字資料;表外附加。

第四節(jié)用數(shù)字來概括數(shù)據(jù)

知識點一:對統(tǒng)計數(shù)據(jù)的分布特征的考查

針對一組數(shù)據(jù)的分布特征,可以從兩個方面來考查它:

-是該組數(shù)據(jù)的集中趨勢,即該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度。

二是該組數(shù)據(jù)的離散程度,它反映的是該組數(shù)據(jù)的各個數(shù)值遠離其中心的趨勢和

程度。

[例題?判斷]針對統(tǒng)計數(shù)據(jù)的分布特征的考查,主要是從該組數(shù)據(jù)的集中趨勢和

離散程度兩方面來考查的。

答案:正確

解析:集中趨勢和離散程度這兩個方面反映了數(shù)據(jù)分布特征的不同側面,讓我們

從不同視角來分析統(tǒng)計數(shù)據(jù),以達到分析和運用統(tǒng)計數(shù)據(jù)的目的。

由于定性數(shù)據(jù)主要是計數(shù),比較簡單,對定性數(shù)據(jù)的集中趨勢常用的方法就是計

算百分比、中位數(shù)和眾數(shù)。

中位數(shù)是將總體各單位標志值按大小順序排列,處于中間位置的那個數(shù)(如果樣

本量為奇數(shù)),或者中間兩個數(shù)目的平均(如果樣本量為偶數(shù))。

眾數(shù)就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中,由于記錄的是

頻數(shù),因此眾數(shù)用得多些。

[例題?多選題]對于定性數(shù)據(jù),反映其集中趨勢的數(shù)字特征有()。

a.比例b.百分比c.平均數(shù)

d.眾數(shù)e.中位數(shù)

答案:abde

解析:由于定性數(shù)據(jù)主要是計數(shù),比較簡單,對定性數(shù)據(jù)的集中趨勢常用的方法

就是計算百分比、中位數(shù)和眾數(shù)。注意,百分比是一種比例。

知識點二:定量數(shù)據(jù)的數(shù)字特征

由于定量數(shù)據(jù)有數(shù)值實際含義,可以進行加減乘除計算,所以反映定量數(shù)據(jù)特征

的統(tǒng)計量很多,常用的有:

反映數(shù)據(jù)集中趨勢的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等

反映數(shù)據(jù)離散程度的差異度量:極差、四分位差、標準差和方差

[例題?單選題]某組數(shù)據(jù)的離散程度是指()。

a.該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度

b.該組數(shù)據(jù)的數(shù)值遠離其中心值的趨勢和程度

c.該組數(shù)據(jù)的數(shù)值向其中位數(shù)值的靠攏程度

d.該組數(shù)據(jù)的數(shù)值遠離其中位數(shù)值的趨勢和程度

答案:b

解析:離散程度反映的是該組數(shù)據(jù)的各個數(shù)值遠離其中心的趨勢和程度。反映數(shù)

據(jù)離散程度的差異度量有極差、四分位差、標準差和方差。

[例題?多選題]對于定量數(shù)據(jù),反映其集中趨勢的數(shù)字特征有()。

a.平均數(shù)b.中位數(shù)c.標準差

d.方差e.眾數(shù)

答案:abe

解析:對于定量數(shù)據(jù),反映數(shù)據(jù)集中趨勢的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和

分位數(shù)等。

一、水平的度量

1.平均數(shù)平均數(shù)也稱為均值,是把某一組數(shù)據(jù)進行算術平均,用以表述某一事

物的平均水平,它在統(tǒng)計中叫做均值。

簡單平均數(shù):把一個變量的所有觀測值相加再除以觀測值的數(shù)目。x=~

加權平均數(shù):如果原始數(shù)據(jù)為分組數(shù)據(jù),則采用加權平均數(shù)公式計算,其中的權

?

數(shù)f為各組的頻數(shù)。x=

用excel中的【average】函數(shù)求平均數(shù)。

[例題?單選題]對于一組數(shù)據(jù):10、25、36、40、53、69,中位數(shù)為0。

a.36b.40c.38d.44.5

答案:c

解析:偶數(shù)位數(shù)是中間兩數(shù)的平均數(shù),即(36+40)/2=38。

2.眾數(shù)

數(shù)組中出現(xiàn)次數(shù)最多的數(shù)。用excel中的[mode]函數(shù)求眾數(shù)

[例題?單選題]對于一組數(shù)據(jù):16、25、25、27、27、36、36、36、41、41、41、

41,眾數(shù)為()。

a.16b.25c.36d.41

答案:d

解析:眾數(shù)是出現(xiàn)次數(shù)最多的數(shù),41出現(xiàn)次數(shù)4次,最多。

3.用哪個值代表一組數(shù)據(jù)平均數(shù)、中位數(shù)和眾數(shù)是描述數(shù)據(jù)水平的三個主要統(tǒng)

計量,要合理使用則需要了解它們的不同特點和應用場合。平均數(shù)易為多數(shù)人理

解和接受,實際中用的也較多,但主要缺點是更容易受少數(shù)極端數(shù)值的影響,對

于嚴重偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。中位數(shù)和眾數(shù)提供的信息不像平

均數(shù)那樣多,但它們也有優(yōu)點,比如不受極端值的影響,具有統(tǒng)計上的穩(wěn)健性,

當數(shù)據(jù)為偏態(tài)分布,特別是偏斜程度較大時,可以考慮選擇中位數(shù)和眾數(shù),這時

它們的代表性要比平均數(shù)好。

[例題?單選題]下列關于平均數(shù)、中位數(shù)和眾數(shù)的描述,錯誤的是0。

a.三者都是用來反映數(shù)據(jù)的集中趨勢

b.平均數(shù)易被多數(shù)人理解和接受,實際中用的也較多

c.眾數(shù)容易受到極端值的影響d.當數(shù)據(jù)為偏態(tài)分布時,使用眾數(shù)和中位數(shù)的

代表性較好

答案:c

解析:平均數(shù)容易受到極端值的影響。

[例題?單選題]在反映數(shù)據(jù)集中趨勢的水平度量中,最易受到極端數(shù)值影響的是

()O

a.平均數(shù)b.中位數(shù)

c.眾數(shù)d.分位數(shù)

答案:a

解析:平均數(shù)容易受到極端值的影響。

二、差異的度量

對社會經濟現(xiàn)象不僅需要對現(xiàn)象的集中趨勢進行分析(平均數(shù)、中位數(shù)、眾數(shù)),

而且還需要進行差異程度分析即離散程度分析。研究事物現(xiàn)象的差異性,從差異

性的事物現(xiàn)象中,尋求解決差異性的一些方法。

1.極差(range)r=xBilx-x?llll

極差又稱全距,是最簡單的離散指標,它是一組數(shù)據(jù)中的最大值和最小值之差。

計算極差非常簡單,含義也很直觀。但是,它僅僅受最大值和最小值的影響,不

能反映一組數(shù)據(jù)分布的情況,而且它非常容易受數(shù)據(jù)中極端值的影響。因此,

它不能準確地描述數(shù)據(jù)的分散程度。

2.方差和標準差

為了反映數(shù)據(jù)中的每一個觀察值與平均水平的差異程度就必須引入方程和標準

差的概念。

方差:將各個變量值和其均值離差平方的平均數(shù),作為樣本數(shù)據(jù),它反映了樣本

中各個觀測值到其均值的平均離散程度。其計算公式為:

未分組的計算公式:

分組的計算公式:工S

標準差是方差的平方根,它與方差相比更具量綱性,而且與變量值的計量單位相

同,使用的范圍比方差更廣泛。其計算公式為:

未分組的計算公式:V?-i

分組的計算公式:

在一個統(tǒng)計樣本中,其標準差越大,說明它的各個觀測值分布的越分散,它的趨

中程度就越差。反之,其標準差越小,說明它的各個觀測值分布的越集中,它的

趨中程度就越好。

求法:利用excel中的方差函數(shù)[var]得到方差,再利用標準差函數(shù)[stdev]

得到標準差。

3.離散系數(shù)

離散系數(shù)也稱變異系數(shù)、標準差系數(shù),它是將一組數(shù)據(jù)的標準差除以其均值,用

來測度數(shù)據(jù)離散程度的相對數(shù)。其計算公式為:

總體數(shù)據(jù)的離散系數(shù):X

樣本數(shù)據(jù)的離散系數(shù):X

4.標準分數(shù)

標準分數(shù)也稱標準化值或z分數(shù),它是變量值與其平均數(shù)的離差除以標準差后的

值,用以測定某一個數(shù)據(jù)在該組數(shù)據(jù)中的相對位置。其計算公式為:

S

標準分數(shù)最大的用途是可以把兩組數(shù)據(jù)中的兩個不同均值,不同標準差的數(shù)據(jù)進

行對比,以判定它們在各組中的位置。

[例題?判斷題]一個總體的差異程度不僅受標準差大小的影響,而且還受數(shù)據(jù)

本身數(shù)值大小的影響。

答案:正確

解析:總體的差異程度比較最好的是離散系數(shù),是標準差除以其均值。

[例題?單選題]下列說法錯誤的是()。

a.極差容易受數(shù)據(jù)中極端值的影響,不能準確地反映數(shù)據(jù)的分散程度

b.標準差的大小會受到數(shù)據(jù)本身數(shù)值大小的影響

c.一組數(shù)據(jù)的離散系數(shù)除以均值即為標準差

d.標準差相同的兩組數(shù)據(jù)的差異程度可能不同

答案:c

解析:一組數(shù)據(jù)的離散系數(shù)乘以均值即為標準差

[例題?單選題]已知一組數(shù)據(jù)均值為3,標準差為1.58,則其離散系數(shù)為()。

a.1.90b.0.53

c.4.58d.4.74

答案:b

解析:離散系數(shù)=標準差/均值=L58/3=0.53

[例題?單選題]已知第一組數(shù)據(jù)的均值為5,標準差為1.58;第二組數(shù)據(jù)均值為

125,標準差為2.58,則()。

a.第一組數(shù)據(jù)離散程度小于第二組數(shù)據(jù)

b.第一組數(shù)據(jù)離散程度等于第二組數(shù)據(jù)

c.第一組數(shù)據(jù)離散程度大于第二組數(shù)據(jù)

d.以上都不對

答案:c

解析:vl=l.58/5,v2=2.58/125,v2<vl,第一組數(shù)據(jù)離散程度大于第二組數(shù)據(jù).

[例題?單選題]兩個總體的平均數(shù)不等,標準差相等,比較兩總體平均數(shù)的代表

性()。

a.平均數(shù)大的代表性大b.平均數(shù)小的代表性大

c.平均數(shù)大的代表性小d.兩平均數(shù)的代表性相同

答案:a

解析:離散系數(shù)=標準差/均值,標準差相等,均值越大,離散系數(shù)越小,均值的

代表性越大。

第三章參數(shù)估計

重點:

1.總體參數(shù)與統(tǒng)計量

2.樣本均值與樣本比例及其標準誤差

難點:

1.區(qū)間估計

2.樣本量的確定

知識點一:總體分布與總體參數(shù)

統(tǒng)計分析數(shù)據(jù)的方法包括:描述統(tǒng)計和推斷統(tǒng)計(第一章)

推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法,包括參數(shù)估

計和假設檢驗兩大類。

總體分布是總體中所有觀測值所形成的分布。

總體參數(shù)是對總體特征的某個概括性的度量。通常有

總體平均數(shù)(u)

總體方差(。②)

總體比例(兀)

知識點二:統(tǒng)計量和抽樣分布

總體參數(shù)是未知的,但可以利用樣本信息來推斷。

統(tǒng)計量是根據(jù)樣本數(shù)據(jù)計算的用于推斷總體的某些量,是對樣本特征的某個概括

性度量。

統(tǒng)計量是樣本的函數(shù),如樣本均值(3)、樣本方差(S2),樣本比例(P)等。

構成統(tǒng)計量的函數(shù)中不能包括未知因素。

由于樣本是從總體中隨機抽取的,樣本具有隨機性,由樣本數(shù)據(jù)計算出的統(tǒng)計量

也就是隨機的。統(tǒng)計量的取值是依據(jù)樣本而變化的,不同的樣本可以計算出不同

的統(tǒng)計量值。

[例題?單選題]以下為總體參數(shù)的是()

a.樣本均值b.樣本方差

c.樣本比例d.總體均值

答案:d

解析:總體參數(shù)是對總體特征的某個概括性的度量。通常有總體平均數(shù)、總體方

差、總體比

例題?判斷題:統(tǒng)計量是樣本的函數(shù)。

答案:正確

解析:統(tǒng)計量是樣本的函數(shù),如樣本均值(7)、樣本方差($2)、樣本比例(p)

等。構成統(tǒng)計量的函數(shù)中不能包括未知因素。

[例題?判斷題]在抽樣推斷中,作為推斷對象的總體和作為觀察對象的樣本都

是確定的、唯一的。

答案:錯誤

解析:作為推斷對象的總體是唯一的,但作為觀察對象的樣本不是唯一

的,不同的樣本可以計算出不同的統(tǒng)計量值。。

(一)樣本均值的抽樣分布

設總體共有n個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有

C=------------

n"種抽法,即可以組成n0不同的樣本,在不重復抽樣時,共有川個

可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成

的分布就是樣本均值的分布。

但現(xiàn)實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布

實際上是一種理論分布。

數(shù)理統(tǒng)計學的相關定理已經證明:

從即樣本均值的均值就是總體均值。

.

在重置抽樣時,樣本均值的方差為總體方b?的1/n,即:’

在不重置抽樣時,樣本均值的方差為

_a2N-n

=TN-\

N-x

其中,菽斤為修正系數(shù),對于無限總體進行不重置抽樣時,可以按照重置抽樣

計算,當總體為有限總體,n比較大而n/n25%時,修正系數(shù)可以簡化為1-n/n,

當n比較大,而n/n〈5%時,修正系數(shù)可以近似為1,即可以按重置抽樣計算。

當總體服從正態(tài)分布時,樣本均值一定服從正態(tài)分布,即有x~n(“,b‘)時,

x~n(",n)

若總體為未知的非正態(tài)分布時,只要樣本容量n足夠大(通常要求n230),

樣本均值仍會接近正態(tài)分布。樣本分布的期望值為總體均值,樣本方差/為總

體方差〃的1/n。這就是統(tǒng)計上著名的中心極限定理。

該定理可以表述為:從均值為",方差為b,的總體中,抽取樣本量為n的隨機樣

本,當n充分大時(通常要求n230),樣本均值的分布近似服從均值為“,

方差為n的正態(tài)分布。

如果總體不是正態(tài)分布,當n為小樣本時(通常n<30),樣本均值的分

布則不服從正態(tài)分布。

[例題?單選題]設一個總體共有5個元素,從中隨機抽取一個容量為2的樣本,

在重置抽樣時,共有()個樣本

a.25b.10c.5

d.1

答案:a

解析:在重置抽樣時,共有d種抽法,共有樣本4個,即52=5X5=25個。

[例題?單選題]設一個總體共有5個元素,從中隨機抽取一個容量為2的樣本,

在不重置抽樣時,共有()個樣本

a.25b.10

c.5d.1

答案:b

解析:在不重復抽樣時,共有一麗F個可能的樣本。即

5!_5x4x3x2xl_1Q

S21(5-2)12xlx3x2x1(個)

(二)樣本比例的抽樣分布

比例是指具有某種屬性的單位占全部單位數(shù)的比重。

總體比例(通常用元表示)是總體中具有某種屬性的單位數(shù)占全部總體單位數(shù)

的比例,是一個參數(shù),通常是未知的,也是我們想通過抽樣得到的說明總體特征

的數(shù)據(jù)。

樣本比例(通常用p表示)是隨機抽取的樣本中具有某種屬性的單位數(shù)占樣本全

部單位數(shù)的比例,是一個樣本統(tǒng)計量,是隨機變量,對于一個已經抽取出來的樣

本來講,是可以觀察到的。描述所有可能樣本比例的概率分布就是樣本比例的抽

樣分布。

當樣本容量比較大時,樣本比例p近似服從正態(tài)分布,且有p的數(shù)學期望就是總

體比率JT,即0(p)=Jt

而P的方差與抽樣方法有關,在重置抽樣下為N,在不重置抽樣下為

E1-.N'-為

nN-1

即在重置抽樣時,P的分布為p~n(一,H)

在不重置抽樣時,P的分布為p~n(才,nAT-1)

一般講,當np25,并n(『p)25時,就可以認為樣本容量足夠大。對于無限

總體進行不重置抽樣時,可以按照重置抽樣計算,當總體為有限總體,當n比較

大,而n/n<5%時,修正系數(shù)”-1會趨向1,這時也可以按重置抽樣計算方

差。

從上述分析可以看出,隨著樣本容量的增大,樣本比例的方差愈來愈小,說明樣

本比例隨樣本容量增大,圍繞總體比例分布的峰度愈來愈高。

[例題?單選題]當樣本容量比較大時,在重置抽樣條件下,樣本比例p的方差為

()

———快1-”)

a.nb.石c.nNd.\

答案:a

El—-

解析:當樣本容量比較大時,在重置抽樣條件下,樣本比例P的方差為〃

[例題?單選題]設一個總體含有3個可能元素,取值分別為1,2,3。從該總體

中采取重復抽樣方法抽取樣本量為2的所有可能樣本,樣本均值為2的概率值是

()

a.1/9b.2/9c.1/3d.4/9

答案:c

解析:在重復抽樣下,樣本為1,2,3的概率都是1/3。

[例題?判斷題]樣本容量是指從一個總體中可能抽取的樣本個數(shù)。

答案:錯誤

解析:樣本容量是樣本中個體的數(shù)目。一個總體可以有多個樣本,各個樣本的的

容量可以相同可以不同。

[例題?判斷題]在確定總體比例估計中的樣本容量時,如果缺少比例的方差,常

取比例值為0.5。

答案:正確

知識點三:統(tǒng)計量的標準誤差

統(tǒng)計量的標準誤差也稱為標準誤,是指樣本統(tǒng)計量分布的標準差??捎糜诤饬繕?/p>

本統(tǒng)計量的離散程度。在參數(shù)估計中,它是用于衡量樣本統(tǒng)計量與總體參數(shù)之間

差距的一個重要尺度。

a

b-=片

樣本均值的標準誤計算公式為:r石

當總體標準差。未知時,可用樣本標準差S代替計算,這時計算的標準誤差稱

為估計標準誤差。

IM1-兀)

相應地,樣本比例的標準誤計算公式為

同樣,當總體比例的方差n(1-n)未知時,可用樣本比例的方差p(『p)代

替。

[例題?單選題]樣本均值的標準誤差計算公式為()

工^卜一令

a.nb.、份c.\Ld.'JV/

答案:b

1

解析:樣本均值的標準誤差計算公式為方0

[例題?單選題]樣本比例的標準誤差計算公式為()

b警C產拜d.場g

江1-兀)

n

答案:a

解析:樣本比例的標準誤差計算公式為'-4―

[例題?單選題]統(tǒng)計量的標準誤差也稱為標準誤,其大小與()。

a.樣本量的平方根成反比b.樣本量的大小成反比

C.樣本量的大小成正比d.總體的標準差成反比

答案:a

解析:樣本均值的標準誤計算公式為:T忑,標準誤與標準差成正

比,與樣本量的平方根成反比。

[例題?多選題]在參數(shù)估計中統(tǒng)計量的標準誤差可用于。

a.衡量樣本統(tǒng)計量與總體參數(shù)之間的差距

b.衡量樣本統(tǒng)計量的離散程度

c.衡量樣本統(tǒng)計量的集中程度

d.衡量總體參數(shù)的離散程度

e.衡量總體參數(shù)的集中程度。

答案:ab

解析:統(tǒng)計量的標準誤差也稱為標準誤,是指樣本統(tǒng)計量分布的標準差??捎糜?/p>

衡量樣本統(tǒng)計量的離散程度。在參數(shù)估計中,它是用于衡量樣本統(tǒng)計量與總體參

數(shù)之間差距的一個重要尺度。

第二節(jié)參數(shù)估計

知識點一:點估計與區(qū)間估計

一.點估計與區(qū)間估計

參數(shù)估計是用樣本統(tǒng)計量去估計總體的參數(shù)。

用樣本統(tǒng)計量來估計總體參數(shù)有兩種方法:點估計和區(qū)間估計

點估計:是用樣本統(tǒng)計量的實現(xiàn)值來近似相應的總體參數(shù)。

區(qū)間估計:是根據(jù)估計可靠程度的要求,利用隨機抽取的樣本的統(tǒng)計量確定能夠

覆蓋總體參數(shù)的可能區(qū)間的一種估計方法。

區(qū)間估計是包括樣本統(tǒng)計量在內(有時是以統(tǒng)計量為中心)的一個區(qū)間,該區(qū)間

通常是由樣本統(tǒng)計量加減估計標準誤差得到的。與點估計不同,進行區(qū)間估計時,

根據(jù)樣本統(tǒng)計量的抽樣分布,可以對統(tǒng)計量與總體參數(shù)的接近程度給出一個概率

度量。

標準正態(tài)分布為n(0,1)分布,將概率分布標準化的公式為:

觀測值-均值x—〃

Z

標準差=Bg

將z所對應的概率稱為置信度或置信水平,將”表示的范圍稱為置

信區(qū)間。

幾個概率下的置信區(qū)間:

1.以68.73%的置信水平推斷總體參數(shù)推斷總體參數(shù)口的置信區(qū)間為(Z=l)

-a-a

(J厘J力)

2.以95.45%的置信水平推斷總體參數(shù)推斷總體參數(shù)口的置信區(qū)間為(z=2)

Jn)

3.以99.73%的置信水平推斷總體參數(shù)推斷總體參數(shù)口的置信區(qū)間為(z=3)

()

4.還有一個95%的概率度為z=l.96

X-196/E+】969

[例題?多選題]由樣本統(tǒng)計量來估計總體參數(shù)的方法有()

a.點估計b.區(qū)間估計c.假設檢驗

d.近似估計e.抽樣估計

答案:ab

解析:用樣本統(tǒng)計量來估計總體參數(shù)有兩種方法:點估計和區(qū)間估計

[例題?單選題]以68.27%的置信水平推斷總體參數(shù)的置信區(qū)間為

C.色哈,"W)&H吟,,啕

答案:a

a-a)

解析:68.27%的置信水平,其置信度為1,則置信區(qū)間為

知識點二:評價估計量的標準

用于估計總體參數(shù)的估計量可以有很多,如何選擇估計效果最好的那種估計量,

評價估計量的好壞的標準具體有:

1.無偏性,是指估計量抽樣分布的期望值等于被估計的總體參數(shù)。e(8)=8

2.有效性,是指估計量的方差盡可能小。對同一個總體參數(shù)的兩個無偏估計量,

有更小方差的估計量更有效。

3.一致性,是指隨著樣本量的增大,標準誤u'一而越小,點估計量的值越來越

接近被估計總體的參數(shù)。

[例題?多選題]評價估計量的標準為()。

a.一致性b.無偏性c.顯著性

d.有效性e.綜合性

答案:abd

解析:評價估計量的標準為:一致性、無偏性、有效性。

[例題?多選題]樣本均值是總體均值的()

a.無偏估計量b.一致估計量c.有偏估計量

d.無效估計e.近似估計量

答案:ab

解析:從無偏性和一致性來看,樣本均值是總體均值的無偏估計量、一致估計

量。

知識點三:一個總體均值的區(qū)間估計

在對總體均值進行區(qū)間估計時,需要考慮總體是否為正態(tài)分布、總體方差是否已

知,用于估計的樣本是大樣本(n230)還是小樣本(n<30)等幾種情況。但不

管哪種情況,總體均值的置信區(qū)間都是由樣本均值加減估計誤差得到的

一般將置信水平表示為卜a,統(tǒng)計量分布兩側面積各為a/2的分位數(shù)值,它

取決于事先所要求的置信度(或可靠程度)。因此總體均值在1-a置信水平

下的置信區(qū)間可一般性地表達為:(;-分位數(shù)值*7的標準誤差,7+分位數(shù)值

*7的標準誤差)

(-)大樣本的估計

大樣本(n230)情況下,當總體方差已知時,總體均值"在置信

-a-a

水平下的置信區(qū)間為(6冊)

式中:a為事先確定的一個概率值,它是總體均值不包括在置信區(qū)間的概率;

a

1-a為置信水平;z.n為標準正態(tài)分布上兩側面積各為a/2時的z值;、/〃

為估計誤差。

大樣本情況下,當總體方差。,未知時,上式中的b,可以用樣本方差一代替,總

體均值〃在i-a置信水平下的置信區(qū)間為(X不‘X

[例題?單選題]以95.45%的置信水平推斷總體參數(shù)的置信區(qū)間為

卜春氏6牙+2竟)

C.

答案:b

-c0

解析:95.45%的置信水平,其置信度為2,則置信區(qū)間為?R喙)

(二)小樣本的估計

小樣本(n<30)情況下,對總體均值的估計都是建立在總體服從正態(tài)分布的假定

前提下。

(1)當總體方差。已知時,樣本均值經過標準化后仍服從標準正態(tài)分布,此時

總體均值〃在1-a置信水平下的置信區(qū)間仍為('"Q『FC

(2)如果總體方差b:未知時,樣本均值經過標準化后仍服從自由度為(n-1)

,=---=~:(?-I)

的t分布,即sljn。t分布也是對稱分布,只不過計算出來的t值

對應的概率要查t分布概率表。總體均值〃在1-儀置信水平下的置信區(qū)間為

-S-S

(V?)

總體均值的置信區(qū)間是由樣本均值和估計誤差兩部分組成的。

[例題?單選題]小樣本情況下,總體服從正態(tài)分布,總體方差已知,總體均值在

置信水平

1-3帝)+3與]卜-4弓5+4三]

C.IW-Jn)&\5W

答案:a

解析:小樣本(n<30)情況下,當總體方差b?已知時,樣本均值經過標準化后

仍服從標準正態(tài)分布,此時總體均值〃在1-&置信水平下的置信區(qū)間仍為

X-Z.〃—=,X+Z./27,

(5)

[例題?單選題]小樣本情況下,總體服從正態(tài)分布,總體方差未知,總體均值在

置信水平

;25+2

b.(-ii)

份-3爺)+3

c.\W7鞫)d.I'inm)

答案:a

解析:小樣本情況下,如果總體方差未知時,總體均值在置信水平(?a)下

的置信區(qū)間為J'"2而天)

[例題?單選題]在其他條件不變的情況下,提高抽樣推斷的置信度,抽樣誤差范

圍會()。

a.不變b.變小

c.變大d.不能確定

答案:c

aa

解析:估計誤差%"工,當抽樣推斷的置信度提高,不為變大,范圍會

變大。

知識點四:一個總體比例的區(qū)間估計

在大樣本(n230)情況下,當總體比例不已知時,在卜&置信水平下,總

體比例的置信區(qū)間為囪,*—川〃)

在大樣本(n230)情況下,當總體比例不未知時,在1-&置信水平下,總

體比例的置信區(qū)間為(n‘、呻附‘)

總體比例的置信區(qū)間是由樣本比例和估計誤差兩部分組成的。

[例題?單選題]根據(jù)隨機抽樣調查資料,某企業(yè)工人生產定額平均完成103%,

標準誤為1%,置信度為95.45%時,可以推斷該企業(yè)工人的生產定額平均完成百

分比()。

a.小于101%b.大于105%

c.在102%—104%之間d.在101%—105%之間

答案:d

解析:估計誤差=2*1%,則103%±2%,范圍為(101%,105%)

[例題?判斷題]當np》5,并且n(l-p)25時,就可以認為樣本容量足夠大,樣

本比例近似服從正態(tài)分布。

答案:正確

解析:在大樣本條件下,根據(jù)中心極限定理,若np",n(l-p)?,則二

項分布可用正態(tài)分布近似。

第三節(jié)樣本量的確定

知識點一:估計總體均值時樣本量的確定

總體均值的置信區(qū)間是由樣本均值和估計誤差兩部分組成的。

1.在重置抽樣條件下,設e代表允許的估計誤差,則樣本量計算公式為:

如果總體標準差。未知,可以用樣本標準差s來代替;也可以用試驗調查的辦

法,選擇一個初始樣本,以該樣本的標準差s作為總體標準差。的估計值。

樣本量與置信水平成正比,與總體方差成正比,與允許的估計誤差的平方成反比。

[例題?計算題]對某大學的消費支出進行估計,已知該校的大學生消費支出的標

準差為300元,現(xiàn)在想要估計消費支出95%的置信區(qū)間,允許的估計誤差不超過

30元,則應抽取多大的樣本量?

解:已知。=300,e=30,z“2=1.96.則

“陰196〃3002

E2=303=384.16心385人

即應抽取385人作為樣本。(注意,不是四舍五入)

[例題?多選題]決定樣本量大小的因素有()

a.置信水平b.總體方差c.允許的估計誤差

d.總體均值e.總體比例

答案:abc

解析:在重置抽樣條件下,設e代表允許的估計誤差,則樣本量計算公式為:

[例題?判斷題]樣本量與置信水平成正比,與總體方差成反比,與允許的估計誤

差成正比.()

答案:錯誤

解析,樣本廣*_平的平方成正比,與總體方差成正

比,與允許的估計誤差的平方成反比.

知識點二:估計總體比例時樣本量的確定

在重置抽樣條件下,設e代表允許的估計誤差,則樣本量計算公式為:

(入2)'瓶1?幻

n=

樣本量越大,估計誤差就越小,估計的精度就越高。

估計誤差由使用者預先確定。

大多數(shù)情況下,估計誤差的取值一般應小于o.L

如果總體比例n的值不知道,可以用樣本比例s來代替,或者取n=0.5,使

得Ji(1-n)達到最大。

[例題計算題]某冷庫對貯藏一批禽蛋的變質率進行抽樣調查,根據(jù)以前的資料,

禽蛋貯藏期變質率為5.3虬4.9%,現(xiàn)在允許誤差不超過5%,推斷的置信水平為

95%,問至少要抽取多少禽蛋進行檢查?

解:已知n1=5.3%,n2=4.9%,e=5%>z?/2=l.96.

因為:(1-n.)=0.053x(1-0.053)=0.050

3(l-n2)=0.049x(1-0.049)=0.047,選方差最大的0.050,則

S用1.96?x0.050

n=

E2~=~005a-=76.83心77個

即應抽取77個禽蛋作為樣本。

[例題?多選題]計算樣本容量,如果總體比例的值未知,可以()

a.用樣本比例來代替

b.取總體比例值為0.5,使得意(1-JT)達到最大

c.取總體比例值為0.1,使得n(1-n)達到最大

d.取總體比例值為0.2,使得口(1-n)達到最小

e.取總體比例值為0.3,使得n(1-n)達到最小

答案:ab

解析:計算樣本容量,如果總體比例的值未知,大多數(shù)情況下,估計誤差的取值

一般應小于0.1.如果總體比例n的值不知道,可以用樣本比例s來代替,或者

取m=0.5,使得n(1-JT)達到最大。

[例題?判斷題]在確定總體比例估計中的樣本容量時,如果缺少比例的方差,常

取比例值為0.50

答案:正確

解析:取n=0.5,使得n(1-g)達到最大。

第四章假設檢驗

重點:

1、假設檢驗的過程

2、總體均值的假設檢驗、大樣本與小樣本檢驗

3、總體比例的假設檢驗

難點:

1、假設檢驗的過程

2、總體方差已知與總體方差未知的檢驗統(tǒng)計量的區(qū)別

第一節(jié)假設檢驗的基本原理

知識點一:假設檢驗的含義

假設檢驗是統(tǒng)計推斷的另一項重要內容,它與參數(shù)估計類似,只是角度

不同。參數(shù)估計是用樣本統(tǒng)計量估計總體參數(shù)的方法。

而假設檢驗是先對總體參數(shù)或分布形式提出某種假設,然后利用樣本信

息和相關統(tǒng)計量的分布特征檢驗這個假設做出是否拒絕原來假設的結

論。

一.為什么要進行假設檢驗

進行假設檢驗是為了找出樣本均值與總體均值之間存在誤差的原因。

二.如何進行假設檢驗

運用小概率事件來檢驗。

小概率事件是指在一次事件中幾乎不可能發(fā)生的事件,一般稱為“顯著

性水平”,用a來表示。顯著性水平一般取值為a=0.05或a=5%0

三.假設檢驗的過程

1.提出原假設和替換假設(備擇假設)。

在統(tǒng)計學中,把需要通過樣本去推斷其正確與否的命題稱為原假設(零

假設),用瓜表示。

h0:某一給定數(shù)

與原假設相對立的就是備擇假設,用h表示。

hi:PW某一給定數(shù)(雙尾檢驗)

h1:IO某一給定數(shù)或〈某一給定數(shù)(單尾檢驗)

對于任何一個假設檢驗問題,其所有的結果都應包含在這兩個假設范圍

內。因此,在h。和儲中,總有一個假設,且只能有一個假設成立。接

受h。,就表明否定了h,,反之亦然,否定h。,就表明接受了hlo

2.確定適當?shù)臋z驗統(tǒng)計量。

用于檢驗假設問題的統(tǒng)計量稱為檢驗統(tǒng)計量。如同在參數(shù)估計中一樣,

需要借助于樣本統(tǒng)計量進行統(tǒng)計推斷。

在大樣本中,檢驗統(tǒng)計量服從正態(tài)分布,用z統(tǒng)計量。

在小樣本中,檢驗統(tǒng)計量服從t分布,用t統(tǒng)計量。這和參數(shù)估計的考

慮情況是一樣的。

3.確定顯著性水平。

根據(jù)樣本所得的數(shù)據(jù)來拒絕零假設的概率應小于0.05,當然也可能是

0.01,0.005等。

顯著性水平就是允許的小概率水平,但小概率并不能說明不會發(fā)生,僅

僅是發(fā)生的概率很小罷了。統(tǒng)計推斷中的假設檢驗是根據(jù)樣本的數(shù)據(jù)信

息對關于總體參數(shù)的某種假設進行的判斷,由于樣本的信息與總體參數(shù)

的真實情況不完全一致,無論我們做出的拒絕或不拒絕原假設的結論,

都有可能犯錯誤。

第一類錯誤:棄真錯誤,即h。本來正確,卻拒絕了它,犯這類錯誤的概

率不超過a,即:p(拒絕h。|h。為真}Wa

第二類錯誤:取偽錯誤,即h。本不真,卻接受了它,犯這類錯誤的概率

不超過B,即:p{接受h°I也為真}Wa

在一般的假設檢驗問題中,犯第一類錯誤的概率最大不超過a,但由于

備選假設往往不是一個點,所以無法算出第二類錯誤的概率Bo一般情

況下,人們認為犯第一類錯誤的后果更嚴重一些,因此通常會取一個較

小的a值。人們通常選擇顯著性水平為0.05或比0.05更小的概率。

4.根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量值和與這個統(tǒng)計量值對應的概率p值,并進

行決策。

①設有總體:x?n(R,o■),o。已知;

2

②隨機抽樣:樣本均值工?n(ix,o/n);

X一〃

③將“標準化:z=B品?n(0,1);

④確定a值,查概率表,定臨界值k

⑤將z和k值對比,作出判斷。

確定顯著性水平a,就確定了臨界值k

根據(jù)顯著性水平和統(tǒng)計量的分布,可以找出接受域和拒絕域

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論