版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第21章統(tǒng)計與統(tǒng)計數(shù)據(jù)
第一節(jié)統(tǒng)計學
【本節(jié)考點】
1、統(tǒng)計學的兩大分支
2、描述統(tǒng)計的含義、內(nèi)容、舉例
3、推斷統(tǒng)計的含義、內(nèi)容、舉例
【本節(jié)內(nèi)容】
一、統(tǒng)計學的含義:
統(tǒng)計學是關于收集、整理、分析數(shù)據(jù)和從數(shù)據(jù)中得出結(jié)論的科學。
二統(tǒng)計學的兩大分支(描述統(tǒng)計和推斷統(tǒng)計)
類型含義及內(nèi)容舉例
描述統(tǒng)計研究數(shù)據(jù)收集、整理和描述的統(tǒng)計方法。其為了解與居民生活相關的商
內(nèi)容包括:品及服務價格水平的變動情
(1)如何取得所需要的數(shù)據(jù);況,收集統(tǒng)計局發(fā)布的CPI
(2)如何用圖表或數(shù)學方法對數(shù)據(jù)進行數(shù)據(jù),利用統(tǒng)計圖展示CPI,
整理和展示;利用增長率計算CPI的走
(3)如何描述數(shù)據(jù)的一般特征。勢。
推斷統(tǒng)計研究如何利用樣本數(shù)據(jù)推斷總體特征的統(tǒng)某公司評測顧客滿意度,隨
計方法。其內(nèi)容包括:機抽取部分顧客進行調(diào)查,
1、參數(shù)估計:利用樣本信息推斷總體特征:再對顧客總體滿意度進行評
2、假設檢驗:利用樣本信息判斷對總體假估,此時需要用到參數(shù)估計
設是否成立。法,然后驗證滿意度高的客
戶更傾向于成為忠誠客戶。
【例題1:單選】描述統(tǒng)計的研究內(nèi)容不包括。
A如何取得所需要的數(shù)據(jù);
B如何用圖表或數(shù)學方法對數(shù)據(jù)進行整理和展示;
C如何描述數(shù)據(jù)的一般特征。
D如何利用樣本信息判斷對總體假設是否成立
【答案】D
【例題2:單選】收集統(tǒng)計局發(fā)布的CPI數(shù)據(jù),利用統(tǒng)計圖展示CPI,利用增長率計算CPI的走勢,這種
統(tǒng)計方法是。。
A描述統(tǒng)計B推斷統(tǒng)計C客觀統(tǒng)計D心理統(tǒng)計
【答案】A
第二節(jié)變量和數(shù)據(jù)
【本節(jié)考點】
A.變量的含義及分類
B.數(shù)據(jù)的含義及分類
【本節(jié)內(nèi)容】
項目含義分類
變量變量是研究對象的定量變量變量的取值是數(shù)量。
屬性或特征,它是(數(shù)量變量)如企業(yè)銷售額、注冊員工數(shù)
相對于常數(shù)而言分類變量的取值是類別。
的。常數(shù)只有一個變量變量如企業(yè)所屬行業(yè)、員工性別
固定取值,變量亙順序變量的取值是類別且有順序。
以有兩個或更多個變量如員工受教育水平
可能的取值。
數(shù)據(jù)數(shù)據(jù)是對變量進行定量數(shù)據(jù)是對定量變量的觀測結(jié)果,其取值表現(xiàn)
測量、觀測的結(jié)果。(數(shù)值型數(shù)據(jù))為具體的數(shù)值。
數(shù)據(jù)可以是數(shù)值、如企業(yè)銷售額1000萬元。
文字或者圖像等形定性分類分類變量的觀測結(jié)果,表現(xiàn)為類別,二
式數(shù)據(jù)數(shù)據(jù)般用文字來表述,也可用數(shù)字描述。如,
用1表示男性,2表示女性。
順序順序變量的觀測結(jié)果,表現(xiàn)為類別,二
數(shù)據(jù)般用文字描述,也可用數(shù)字描述。如用
1表示碩士及以上,2表示本科,3表示
大專及以下。
「A分類變量
測量結(jié)果.分類數(shù)據(jù)
統(tǒng)
計
變
量
與
數(shù)
據(jù)
測量結(jié)果順序數(shù)據(jù)
數(shù)值型數(shù)據(jù)
對于不同類型的數(shù)據(jù),可以采用不同的統(tǒng)計方法處理和分析。對分類數(shù)據(jù)可以計算出各類別的頻率,而數(shù)
值型數(shù)據(jù)則可以計算均值和方差等統(tǒng)計量。
【例題3:多選】定性變量的觀測結(jié)果是()。
A.順序變量
B.分類數(shù)據(jù)
C.順序數(shù)據(jù)
D.數(shù)值型數(shù)據(jù)
E.分類變量
【答案】BC
【例題4:09年多選題改編】下列變量中,通常用數(shù)值型數(shù)據(jù)表示的有。。
A.商品銷售額
B.上班出行方式
C.家庭收入
D.居住地區(qū)
E.年齡
【答案】ACE
第三節(jié)常用的數(shù)據(jù)特征測度
【本節(jié)考點】
1、均值和中位數(shù)
2、方差和標準差
【本節(jié)內(nèi)容】
對統(tǒng)計數(shù)據(jù)特征的測度,主要從三個方面進行:
一是分布的集中趨勢,反映數(shù)據(jù)向其中心值靠攏或聚集的程度;
二是分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;
三是分布的偏態(tài)和峰度,反映數(shù)據(jù)分布的形狀。
(-)均值和中位數(shù)(測度數(shù)據(jù)的集中趨勢)
集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點的位置所在。集中趨勢的測度
也就是尋找數(shù)據(jù)水平的代表值或中心值。
1、均值
均值也就是平均數(shù),就是數(shù)據(jù)組中所有數(shù)值的總和除以該組數(shù)值的個數(shù)。
【注1】它是集中趨勢中最主要的測度值,是一組數(shù)據(jù)的重心所在,解釋了一組數(shù)據(jù)的平均水平。
[注2]均值主要適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。
【注3】均值易受極端值的影響,極端值會使得均值向極大值或極小值方向傾斜,使得均值對數(shù)據(jù)組的代
表性減弱。
2、中位數(shù)
(1)含義:把一組數(shù)據(jù)按從小到大或從大到小的順序進行排列,位置居中的數(shù)值叫做中位數(shù)。中位數(shù)將
數(shù)據(jù)分為兩部分,其中一半的數(shù)據(jù)小于中位數(shù),另一半數(shù)據(jù)大于中位數(shù)。
(2)計算:
根據(jù)未分組數(shù)據(jù)計算中位數(shù)時,要先對數(shù)據(jù)進行排序,然后確定中位數(shù)的位置,n為數(shù)據(jù)的個數(shù),其公式
為:
(l)n為奇數(shù):中位數(shù)位置是山,該位置所對應的數(shù)值就是中位數(shù)數(shù)值。
---2
(2)n為偶數(shù):中位數(shù)位置是介于上和(匚+1)之間,中位數(shù)就是這兩個位置對應的數(shù)據(jù)的均值。
------21
(3)適用:中位數(shù)主要用于順序數(shù)據(jù),也適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù),中位數(shù)不受極端值
的影響,抗干擾性強。
【例題5:2008單選題】某小學六年級8個班的學生人數(shù)由少到多依次為34人、34人、34人、34人、
36人、36人、37人、37人,其中位數(shù)為()
A34
B35
C36
D37
【答案】B
【解析】n為偶數(shù),中位數(shù)=(34+36)/2=35.
【例題6:單選】下面一組數(shù)據(jù)為9個家庭的人均月收入數(shù)據(jù)(單位:元):750;780;850;960;1080;
1250;1500;1650;2000;則中位數(shù)為()
A750
B1080
C1500
D2000
【答案】B
【解析】n為奇數(shù),中位數(shù)位置為5,所對應的數(shù)值為1080。
【例題7:2011年單選】2010年某省8個地市的財政支出(單位:萬元)分別為:
59000500026560266450780007800078000132100這組數(shù)據(jù)的中位數(shù)是()萬元。
A.78000
B.72225
C.66450
D.75894
【答案】B
[解析]由于所給數(shù)據(jù)是8個,所以中位數(shù)的位置是第4個和第5個數(shù)據(jù)的平均數(shù)。(66450+78000)/2=72225
【例題8:2003年單選】集中趨勢最主要的測度值是()。
A.眾數(shù)
B.中位數(shù)
C.均值
D.幾何平均數(shù)
【答案】C
【解析】算術平均數(shù)也稱為均值,是集中趨勢最主要的測度值。
【例題9:2007年單選改編】某連鎖超市6個分店的職工人數(shù)有小到大排序后為57人、58人、58人、
60人、63人、70人其均值、中位數(shù)分別為()。
A.59、58
B.61、58
C.61、59
D.61、70
【答案】C.
【解析】均值=(57+58+58+60+63+70)/6=61
中位數(shù)=(58+60)/2=59
(二)方差和標準差(測度數(shù)據(jù)的離散趨勢)
離散程度反映的是各變量值遠離中心值的程度。
集中趨勢的測度值是對數(shù)據(jù)一般水平的一個概括性變量,它對一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水
平。數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差,離散程度越小,其代表性就越好。
【例題10:2010年單選】集中趨勢的測度值對一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)
的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性()。
A.越好
B.越差
C.始終不變
D.在一定區(qū)間內(nèi)反復變化
【答案】B
1、含義:
(1)左差是數(shù)據(jù)組中各數(shù)值與其均值離差平方的平均數(shù)。是實際中應用最廣泛的離散程度測度值。方差越小,
說明數(shù)據(jù)值與均值的平均距離越小,均值的代表性越好。
(2)標準差:方差的平方根,不僅能度量數(shù)值與均值的平均距離,還與原始數(shù)值具有相同的計量單位。
2、計算:
指標名稱總體樣本
方差
n代表樣本單位數(shù)。
【注】(1)在有放回的簡單隨機抽樣中,
N代表總體單位數(shù)。樣本方差T是總體方差匚的無偏估計
S(2)在不放回的簡單隨機抽樣中,
樣本方差,是總體方差7的無偏估計
量
標準差
【例題11】某售貨小組有5名營業(yè)員,元旦一天的銷售額分別為520元、600元、480元、750元和500
元,求該日平均銷售額及樣本方差和樣本標準差。
【解析】
A.平均銷售額=(520+600+480+750+500)/5=570元
B.樣本方差
第一步:計算差
520-570=-50;600-570=30;480-570=90;750-570=180;500-570=-70
第二步:計算差平方和
(-50)2+(30)2+(90)2+(180)2+(-70)2
第三步:計算方差
方差二----------------M--------------
=12200
(3)樣本標準差=J12200=110.45
3、適用
只適用于數(shù)值型數(shù)據(jù),容易受極端值的影響。
【例題12:2010年多選題改編】數(shù)值型數(shù)據(jù)離散程度的測度指標有()。
A.中位數(shù)
B.幾何平均數(shù)
C.均值
D.標準差
E.方差
【答案】DE
第四節(jié)數(shù)據(jù)來源
【本節(jié)考點】
一、觀測數(shù)據(jù)和實驗數(shù)據(jù)
二、一手數(shù)據(jù)和二手數(shù)據(jù)
【本節(jié)內(nèi)容】
分類類別內(nèi)容
按收集方法觀測數(shù)據(jù)通過直接調(diào)查或測量而收集的數(shù)據(jù)。觀測數(shù)據(jù)是在沒有對
事物施加任何人為控制因素的條件下得到的。
幾乎所有與社會經(jīng)濟現(xiàn)象有關的統(tǒng)計數(shù)據(jù)都是觀測數(shù)據(jù),
如GDP、CPI、房價等。
實驗數(shù)據(jù)通過在實驗中控制實驗對象以及其所處的實驗環(huán)境收集到
的數(shù)據(jù)。如,一種新產(chǎn)品使用壽命的數(shù)據(jù),一種新藥療效
的數(shù)據(jù)。
自然科學領域的數(shù)據(jù)大多都是實驗數(shù)據(jù)。
按來源一手數(shù)據(jù)來源于直接的調(diào)查和科學實驗的數(shù)據(jù),對使用者來說這是
數(shù)據(jù)的直接來源。其來源主要有:調(diào)查或觀察;實驗。
二手數(shù)據(jù)來源于別人的調(diào)查或?qū)嶒灥臄?shù)據(jù)。對使用者來說這是數(shù)據(jù)
的間接來源。
【例題13:多選】統(tǒng)計數(shù)據(jù)按其收集方法,可以分為。。
A觀測數(shù)據(jù)
B一手數(shù)據(jù)
C主觀數(shù)據(jù)
D實驗數(shù)據(jù)
E二手數(shù)據(jù)
【答案】AD
【例題14:單選】幾乎所有與社會經(jīng)濟現(xiàn)象有關的統(tǒng)計數(shù)據(jù)都是()
A觀測數(shù)據(jù)
B一手數(shù)據(jù)
C二手數(shù)據(jù)
D實驗數(shù)據(jù)
【答案】A
第五節(jié)統(tǒng)計調(diào)查
【本節(jié)考點】
1、統(tǒng)計調(diào)查的概念及分類
2、統(tǒng)計調(diào)查的方式
【本節(jié)內(nèi)容】
一、統(tǒng)計調(diào)查的概念和和分類
1、統(tǒng)計調(diào)查的概念
統(tǒng)計調(diào)查過程有兩個重要特征:一是調(diào)查是一種有計劃、有方法、有程序的活動;二是調(diào)查的結(jié)果表現(xiàn)為
搜集到的數(shù)據(jù)。
2、統(tǒng)計調(diào)查的分類
種類具體內(nèi)容
按調(diào)查對象的范全面調(diào)查全面統(tǒng)計報表和普查
圍不同非全面調(diào)查非全面統(tǒng)計報表、抽樣調(diào)查、重點調(diào)查和典型調(diào)
查
按調(diào)查登記的時連續(xù)調(diào)查觀察總體現(xiàn)象在一定時期內(nèi)的數(shù)量變化,說明現(xiàn)
間是否連續(xù)象的發(fā)展過程,目的是為了解社會現(xiàn)象在一段時
期的總量。如工廠的產(chǎn)品生產(chǎn)、原材料的投入、
能源的消耗、人口的出生、死亡等。
不連續(xù)調(diào)查間隔相當長的時間所作的調(diào)查,為了對總體現(xiàn)象
在一定時點上的狀態(tài)進行研究。如生產(chǎn)設備擁有
量、耕地面積等。
【例題15:2008年多選題】下列調(diào)查方式中,屬于非全面調(diào)查的有()
A、重點調(diào)查
B、抽樣調(diào)查
C、典型調(diào)查
D、普查
E、全面報表
【答案】ABC
【例題16:多選】按調(diào)查登記的時間是否連續(xù),統(tǒng)計調(diào)查分為連續(xù)調(diào)查和不連續(xù)調(diào)查,下列現(xiàn)象適合不
連續(xù)調(diào)查的是()
A生產(chǎn)設備擁有量
B耕地面積
C人口的出生死亡
D原材料的投入
E工廠的產(chǎn)品生產(chǎn)
【答案】AB
(二)統(tǒng)計調(diào)查的方式
調(diào)查含義特征、分類及應用場合
方式
L按調(diào)查對象范圍的不同分為全面報表和非全面報
按照國家有關法規(guī)的規(guī)定,
表。目前的大多數(shù)統(tǒng)計報表都是全面報表。
統(tǒng)計自上而下地統(tǒng)一布置,自下
2.按報送周期長短,分為日報、月報、季報、年報等。
報表而上地逐級提供基本統(tǒng)計
3.按報表內(nèi)容和實施范圍不同分為國家的、部門的、
數(shù)據(jù)的一種調(diào)查方式。
地方的統(tǒng)計報表。
特點:
1普.查通常是一次性的或者周期性的;
為某一特定目的而專門組
2.一般需要規(guī)定統(tǒng)一的標準調(diào)查時間,以避免調(diào)查數(shù)
織的一次性全面調(diào)查,主要
據(jù)的重復或遺漏,保證普查結(jié)果的準確性。
普查用于了解處于某一時點狀
3.數(shù)據(jù)一般比較準確,規(guī)范化程度較高,可以為抽樣
態(tài)上的社會經(jīng)濟現(xiàn)象的基
調(diào)查或其他調(diào)查提供基本的依據(jù)。
本全貌。
4.使用范圍比較窄,只能調(diào)查一些最基本及特定的現(xiàn)
象。
(1).經(jīng)濟性:
是抽樣調(diào)查的一
個顯著優(yōu)點。
(2)時效性強:
可以迅速、及時
的獲得所需要的
從調(diào)查對象的總體中抽取
信息O
一部分單位作為樣本進行
抽樣(3).適應面廣:
調(diào)查,并根據(jù)樣本調(diào)查結(jié)果
調(diào)查可用于全面調(diào)查
來推斷總體特征的一種非
能夠調(diào)查的現(xiàn)
全面調(diào)查
象,也能調(diào)查全
面調(diào)查所不能調(diào)
查的現(xiàn)象,特別
適合特殊現(xiàn)象的
調(diào)查。如:產(chǎn)品
質(zhì)量檢驗、農(nóng)產(chǎn)
品試驗、醫(yī)藥的
臨床實驗。
(4).準確性高:
調(diào)查的目的只要求了解基本狀況和發(fā)展趨勢,不要求
掌握全面數(shù)據(jù),而調(diào)查少數(shù)重點單位就能滿足需要
從調(diào)查對象的全部單位中時,采用重點調(diào)查比較適宜。
選擇…部分重點單位進行(1)為了及時了解全國城市零售物價的變動趨勢,
調(diào)查。就可以對全國的35個大中型城市的零售物價的變化
重點
重點單位雖然只是全部單進行調(diào)查就是重點調(diào)查。
調(diào)查
位中的一部分,但就調(diào)查的(2)要及時了解全國工業(yè)企業(yè)的增加值和資產(chǎn)總額
標志值來說在總體中占絕情況,只需對全國大中型工業(yè)企業(yè)進行重點調(diào)查即
大比重???。
(3)國家統(tǒng)計局的全國5000家工業(yè)企業(yè)聯(lián)網(wǎng)直報制
度屬于重點調(diào)查。
有意識的選擇若干具有典作用:彌補全面調(diào)查的不足;在一定條件下可以驗證
典型
型意義的或有代表性的單全面調(diào)查數(shù)據(jù)的真實性。
調(diào)查
位進行的調(diào)查。
【注】抽樣調(diào)查和重點調(diào)查、典型調(diào)查的區(qū)別:
抽樣調(diào)查是隨機的抽取調(diào)查單位,可以根據(jù)抽樣結(jié)果推斷總體的數(shù)量特征;
重點調(diào)查和典型調(diào)查的單位不是隨機抽取的,具有一定的主觀性,因此調(diào)杳結(jié)果不能推斷總體。
【例題17:2006年單選題】能夠根據(jù)樣本結(jié)果推斷總體數(shù)量特征的調(diào)查方式是()
A.重點調(diào)查
B.抽樣調(diào)查
C.典型調(diào)查
D.所有非全面調(diào)查
【答案】B
【例題18:2009年單選題】為了解全國煤炭企業(yè)的生產(chǎn)安全狀況,找出安全隱患,專家根據(jù)經(jīng)驗選擇10
個有代表性的企業(yè)進行深入細致的調(diào)查。這類調(diào)查方法屬于()。
A.專家調(diào)查
B.重點調(diào)查
C.系統(tǒng)調(diào)查
D.典型調(diào)查
【答案】D
【例題19:2012年單選題】在進行重點調(diào)查時,應選擇的調(diào)查單位是。。
A.就調(diào)查標志值來說在總體中占絕大比重的單位
B.有典型意義的單位
C.主動參與調(diào)查的單位
D.隨機抽取的單位
【答案】A
【例題20:2011年多選題改編】關于抽樣調(diào)查的說法,正確的有()。
A.抽樣調(diào)查中不存在非抽樣誤差
B.抽樣調(diào)查用樣本數(shù)據(jù)推斷總體特征
C.抽樣調(diào)查適應面廣
D.抽樣調(diào)查時效性差
E.抽樣調(diào)查通常從總體中選擇重點單位進行調(diào)查
【答案】BC
【第21章考點總結(jié)】
1、統(tǒng)計學的兩大分支
2、描述統(tǒng)計和推斷統(tǒng)計的含義及內(nèi)容
3、變量和數(shù)據(jù)的含義及類型
4,均值及中位數(shù)的計算和適用范圍
5,方差和標準差的關系及二者的適用范圍
6、數(shù)據(jù)的來源(按收集方法及按來源)
7、統(tǒng)計調(diào)查的分類
8、統(tǒng)計調(diào)查的方式
第22章抽樣調(diào)查
第一節(jié)抽樣調(diào)查的基本概念
【本節(jié)考點】
1、總體、樣本;抽樣框、抽樣單位;總體參數(shù)、樣本統(tǒng)計量
2、概率抽樣的特點,非概率抽樣的主要方法
3、抽樣調(diào)查的步驟
4、抽樣調(diào)查中的誤差
【本節(jié)內(nèi)容】
一、抽樣調(diào)查基本概念
概念含義例子
總體和總調(diào)查對象的全體,組成總體的各個如研究某公司所有注冊在職人員
體單元個體稱作總體單元或單位。(共有1000名)的工資狀況,總
體是公司所有注冊在職員工,每
個注冊在職人員是總體單元。
樣本、樣樣本是總體的一部分,由從總體中上例中,按一定原則從所有注冊
本單位及按一定原則或程序抽出的部分個體在職人員中抽取出200人調(diào)查。
樣本量所組成。樣本也是一個集合。每個這200名注冊在職員工就是樣
被抽中進入樣本的單位稱為人樣單本;而抽出的每一名員工就是入
位。樣本中包含的入樣單位的個數(shù)樣單位;該樣本的樣本量是200.
稱為樣本量。
抽樣框供抽樣所用的所有抽樣單元的名上述例子中,企業(yè)1000名注冊在
單,是抽樣總體的具體表現(xiàn)。常見職職工的名冊,就是抽樣框。
的抽樣框有名錄框,如企業(yè)名錄、
電話簿、人員名冊。抽樣框也可以
是一張地圖或其他適當?shù)男问?不
管是那種形式,抽樣框中的單位必
須是有序的,便于編號。高質(zhì)量的
抽樣框應當提供被調(diào)查單位更多的
信息,并且沒有重復和遺漏。
抽樣單元構(gòu)成抽樣框的基本要素,抽樣單元要調(diào)查城市擁有兩套以上住房的
可以只包括一個總體單元,也可以人口比例,總體單元是該城市的
包括多個總體單元。每個人,但抽樣單元可以是該城
市的每戶家庭或是每個居委會。
總體參數(shù)總體參數(shù)就是總體指標值,它是未如研究某公司所有注冊在職人員
知的常數(shù),是根據(jù)總體中所有單位(共有1000名)的工資狀況,公
的數(shù)值計算的,是通過調(diào)查想要了司所有注冊在職人員的平均工資
解的,不受樣本的抽選結(jié)果影響。就是總體參數(shù)。
常用的總體參數(shù)有總體總量、總體
均值、總體比例、總體方差。
樣本統(tǒng)計是根據(jù)樣本中各單位的數(shù)值計算如上例中,200名注冊在職職工
量(估計的,是對總體參數(shù)的估計,也稱估的平均工資就是該公司所有員工
量)計量。它是一個隨機變量,取決于平均工資的一個估計量(樣本統(tǒng)
樣本設計和正好被選入樣本的單元計量)
特定組合。常用的樣本統(tǒng)計量有樣
本均值、樣本比例、樣本方差。
【例題1:2012年單選】在研究某城市居民的家庭消費結(jié)構(gòu)時,在全部50萬戶家庭中隨機抽取300
0戶進行入戶調(diào)查,這項抽樣調(diào)查中的樣本是指該城市中。。
B.抽取出來的3000戶家庭
B.50萬戶家庭
C.每一戶家庭
D.抽取出來的每一戶家庭
【答案】A
【例題2:單選】某工廠為了檢測出廠的十萬只燈泡的壽命,隨機抽取了1000只燈泡進行檢測.關于該抽
樣調(diào)查下列表述錯誤的是()。
A總體是出廠的十萬只燈泡
B樣本是抽取到的1000只燈泡
C全體燈泡的平均壽命是總體參數(shù)
D1000只燈泡的平均壽命是抽樣單元
【答案】D
【解析】1000只燈泡的平均壽命是樣本統(tǒng)計量,也稱為估計量。
二、概率抽樣和非概率抽樣
抽樣含義特點具體方式
方法
概率依據(jù)隨機1.按一定概率以隨機原則1.簡單隨機抽樣;
抽樣原則,按照抽取樣本。2.分層抽樣
某種事先2.總體中每個單元被抽中3.系統(tǒng)抽樣;
設計的程的概率是已知的或者是可4.整群抽樣
序,從總體以計算出來5.多階段抽樣
中抽取部3.當采用樣本對總體參數(shù)
分單元的進行估計時,要考慮到每個
方法。樣本單元被抽中的概率。若
每個單位被抽中的概率相
等,則成為等概率抽樣;否
則稱為非等概率抽樣。
非概調(diào)查者根抽取樣本時并不是依據(jù)隨L判斷抽樣:調(diào)查者依據(jù)調(diào)查目的
率抽據(jù)自己的機原則。和對調(diào)查對象的了解,人為確定樣
樣方便或主本單元;
觀判斷抽2.方便抽樣:攔截式
取樣本的3.自愿樣本:網(wǎng)上調(diào)查
方法。4.配額抽樣:總體劃分若干類型,
將樣本數(shù)額分配到各類型,從各類
型中抽取樣本的方法沒有嚴格限
制,一般采用方便抽樣。
【例題3:2011年單選題】下列抽樣方法中,屬于非概率抽樣的是()。
A.分層抽樣
B.整群抽樣
C.判斷抽樣
D.等距抽樣
【答案】C
【例題4:多選題】相對于非概率抽樣而言,概率抽樣的特點有。
A按一定的概率以隨機原則抽取樣本
B總體中每個單元被抽中的概率是已知的或可以計算出來
C每個單位被抽入樣本的概率相等
D抽取樣本時不需要依據(jù)隨機原則
E當采用樣本對總體參數(shù)進行估計時,要考慮到每個樣本單元被抽中的概率
【答案】ABE
三、抽樣調(diào)查的一般步驟
1、確定調(diào)查問題:
2、調(diào)查方案設計:明確如何實施調(diào)查,包括抽樣方案的設計和問卷設計。
3、實施調(diào)查過程:獲得樣本單元的調(diào)查數(shù)據(jù),關鍵的問題是要保證原始數(shù)據(jù)的質(zhì)量。
4、數(shù)據(jù)處理分析:對數(shù)據(jù)進行檢查核對、編碼、錄入、預處理、統(tǒng)計分析、對總體參數(shù)進行估計。
5、撰寫調(diào)查報告:調(diào)查活動的最終成果。
四、抽樣調(diào)查中的誤差
樣本估計值和總體參數(shù)值之間的差異稱為誤差,一般來說調(diào)查中的誤差分為抽樣誤差和非抽樣誤差兩類。
誤差形成原因
抽樣由抽樣的隨機性造成的,用樣本統(tǒng)計量估計總體參數(shù)時出現(xiàn)的誤差。抽到
誤差哪一個樣本完全是隨機的,而抽到不同的樣本,對總體的估計就會不同。
非抽樣誤除抽樣誤差外,由其他原因引起的樣本統(tǒng)計量與總體真值之間的差異。
1(1)抽樣框誤差:樣本框不完善造成的。如用工商局簽發(fā)的營業(yè)執(zhí)照作為
個體商業(yè)的抽樣框,對個體商業(yè)實施抽樣調(diào)查,以掌握個體商業(yè)零售額的
情況。但有些商販無照經(jīng)營、有些商販雖有執(zhí)照但轉(zhuǎn)行,不再經(jīng)商;有些
雖有一個攤點卻辦理多個營業(yè)執(zhí)照。這些情形均會導致估計結(jié)果失真。
(2)無回答誤差:調(diào)查人員沒能夠從被調(diào)查者那里得到所需要的數(shù)據(jù)。無
回答分為:
①由于隨機因素造成的。如被調(diào)查者恰巧不在家,這種會減少有效樣本量,
造成估計量方差增大。
②由于非隨機因素造成的:如被調(diào)查者不愿告訴實情而拒絕回答,這時,
回答者與不回答者在調(diào)查指標上存在數(shù)量的差異,調(diào)查的結(jié)果中只有回答
者的信息,卻沒有無回答者的信息,這種無回答不僅造成估計量方差增大,
還會帶來估計偏差。
(3)計量誤差:由于調(diào)查所獲得的數(shù)據(jù)與其真值之間不一致造成的誤差。這
種誤差可能是由調(diào)查人員、問卷設計、受訪者等原因造成的。
【例題5:單題】抽樣誤差形成的原因主要是。
A、抽樣的隨機性
B、有意虛報、瞞報
C、問卷設計缺陷
D、調(diào)查人員沒能夠從被調(diào)查者那里得到所需要的數(shù)據(jù)
【答案】A
【例題6:2010年多選題改編】統(tǒng)計數(shù)據(jù)的非抽樣誤差形成的原因主要有0。
A.受訪者提供虛假數(shù)字
B.抄錄錯誤
C.無回答誤差
D.抽樣的隨機性
E.抽樣框不完善
【答案】ABCE
【例題7:2010年多選題改編】人口普查統(tǒng)計數(shù)據(jù)可能存在的誤差來源有()。
A.填報錯誤
B.抽樣的隨機性
C.抄錄錯誤
D.匯總錯誤
E.有意瞞報
【答案】ACDE
【解析】普查只存在非抽樣誤差。所以本題實質(zhì)是考核登記性誤差產(chǎn)生的原因。
第二節(jié)幾種基本的概率抽樣方法
【本節(jié)考點】
各種概率抽樣方法的含義、特點
【本節(jié)內(nèi)容】
一、簡單隨機抽樣
(-)含義
1、有放回簡單隨機抽樣
從總體中隨機抽出一個樣本單位,記錄觀測結(jié)果后,將其放回到總體中去,再抽取第二個,如此類推,一直到
抽滿n個單位為止。
【注】單位有被重復抽中的可能,容易造成信息重疊而影響估計的效率,較少采用。
2、不放回簡單隨機抽樣
從包含N個單元的總體中逐個隨機抽取單元并無放回,每次都在所有尚未被抽入樣本的單元中等概率的抽
取下一個單元,直到抽取n個單元為止。
【注】每個單位最多只能被抽中一次,不會由于樣本單位被重復抽中而提供重疊信息,比放回抽樣有更低
的抽樣誤差。
(二)優(yōu)缺點
優(yōu)點:簡單隨機抽樣是最基本的隨機抽樣方法,操作簡單,且每個單位的入樣概率相同,樣本估計量形式
也比較簡單。
缺點:沒有利用抽樣框更多的輔助信息,用樣本統(tǒng)計量估計總體參數(shù)的效率受到影響,樣本的分布可能十
分分散,增加了調(diào)查過程中的費用和時間。
(三)適用條件
1、抽樣框中沒有更多可以利用的輔助信息
2、調(diào)查對象分布的范圍不廣闊
3、個體之間的差異不是很大
【例題8:單選】下列關于簡單隨機抽樣的表述錯誤的是
A總體的每個單位入樣概率相同
B是最基本的隨機抽樣方法
C沒有利用抽樣框更多的輔助信息
D適用個體之間差異較大的調(diào)查
【答案】D
二、分層抽樣
(-)含義
先按照某種規(guī)則把總體分為不同的層,然后在不同的層內(nèi)獨立、隨機的抽取樣本,這樣所得到的樣本稱為分層
樣本。如果每層中的抽樣都是簡單隨機抽樣,則稱為分層隨機抽樣。
分層抽樣樣本量在各層分配的方法有兩類,如下表:
分配方法含義優(yōu)缺點
等比例層中單位數(shù)越多,抽取的樣本單位就操作容易,易于理解,在實踐中廣
分配越多,該層樣本單位比例與該層中的泛使用。但各層單位數(shù)相差懸殊或
總體單位比例相一致.層內(nèi)方差過大時抽樣誤差會很大。
不等比例分層樣本單位比例與該層中的總體單如果各層的總體方差已知,不等比
配位比例不一致。例抽樣的抽樣誤差可能比等比例
抽樣更小。
【例題9:單選】某校高中生共有2700人,其中高一年級900人,高二年級1200人,高三年級600人,現(xiàn)采
取分層抽樣法抽取容量為135的樣本,那么高一、高二、高三各年級抽取的人數(shù)分別為()
A.45,75,15
B.45,45,45
C.30,90,15
D.45,60,30
【答案】D
【解析】樣本量占總體容量的比=135/2700=5%
-"900=5%,所以,n(?->=5%X900=45A
n(?-)/1200=5%,所以,一*二>=5%乂1200=60人
n8三"600=5%,所以,n*三>=5%X600=30人
(二)優(yōu)缺點
優(yōu)點:
1.不僅可以估計總體參數(shù),同時也可以估計各層參數(shù)
【例】調(diào)查某市中小企業(yè)就業(yè)的相關指標,可以按照行業(yè)將該市中小企業(yè)進行分層,再在每個行業(yè)內(nèi)獨立隨機
抽取一部分中小企業(yè)進行調(diào)查,這樣不僅能估計全市中小企業(yè)就業(yè)的相關指標,還可以在各行業(yè)進行推算。
2.便于抽樣工作的組織。
3.每層都要抽取一定的樣本單位,這樣樣本在總體中分布比較均勻,可以降低抽樣誤差。
(三)適用條件
抽樣框中有足夠的輔助信息,能夠?qū)⒖傮w單位按某種標準劃分到各層之中,實現(xiàn)在同一層內(nèi),各單位之間
的差異盡可能小,不同層之間各單位的差異盡可能大。(層內(nèi)差異小,層間差異大)
三、系統(tǒng)抽樣
(一)含義
系統(tǒng)抽樣指先將總體中的所有單元按一定順序排列,在規(guī)定范圍內(nèi)隨機抽取一個初始單元,然后按事先規(guī)定的
規(guī)則抽取其他樣本單元。
最簡單的系統(tǒng)抽樣是等距抽樣。其步驟:
1.將總體N個單位按直線排列,依次編號1——N;
2.根據(jù)樣本量n確定抽樣間隔K
抽樣間隔=以曰匕1C勺最4
nn
【例】N=24,n=4,抽樣間隔是24/4=6
若N=23,n=4,抽樣間隔是23/4=5.6%6
3.在1——K的范圍內(nèi)隨機抽取一個整數(shù)i,令位于i位置上的單位為起始單位,往后每間隔k抽取一個
單位,直至抽滿n。
【接上例】N=24,n=4,抽樣間隔是24/4=6,在1?6之間,隨機抽取一個整數(shù)2作為起始單位,以6為
間隔,可得到樣本到2+6=8;8+6=14;14+6=20
(二)優(yōu)缺點
1、優(yōu)點:
(1)操作簡便;
(2)對抽樣框的要求比較簡單,它只要求總體單位按一定順序排列,而不一定是一份具體的名錄清單。
系統(tǒng)抽樣的估計效果與總體排列順序有關。
①、無關標識排列:
排列順序與調(diào)查內(nèi)容沒有聯(lián)系。這時系統(tǒng)抽樣估計與簡單隨機抽樣估計效率相仿。
【例】對汽車尾氣排放情況的調(diào)查中,是按汽車牌號排列,牌號與尾氣排放沒有關系,即屬于無關標識排
列。
②、有關標識排列:
排列順序與調(diào)查內(nèi)容有關。其抽樣精度一般比簡單隨機抽樣的精度高。
【例】對汽車尾氣排放情況的調(diào)查中,按汽車價格排列,價格與尾氣排放量有相關性。
2、缺點:
方差估計比較復雜,這就給計算抽樣誤差帶來一定困難。
四、整群抽樣
(-)含義
整群抽樣是將總體中所有的基本單位按照一定規(guī)則劃分為互不重疊的群,抽樣時直接抽取群,對抽中的群調(diào)查
其全部的基本單位,對沒有抽中的群則不進行調(diào)查。
【例】調(diào)查某市在職的房地產(chǎn)行業(yè)人員工資水平,將房地產(chǎn)行業(yè)所有在職人員按照所屬企業(yè)分群,直接
抽取企業(yè)單位,入樣的企業(yè)單位內(nèi)所有職工接受調(diào)查,沒有入樣的企業(yè)單位員工都不調(diào)查。
(二)優(yōu)缺點
1、優(yōu)點:
(1)實施調(diào)查方便,可以節(jié)省費用和時間。
(2)抽樣框編制得以簡化,抽樣時只需要群的抽樣框
2、缺點
群內(nèi)各單位之間存在相似性,差異比較小,而群與群之間的差別比較大,使得整群抽樣的抽樣誤差比較大。
(三)適用
如果群內(nèi)各單位之間存在較大差異,群與群的結(jié)果相似,整群抽樣會降低估”?誤差。
【例】調(diào)查某地區(qū)的男女比例,以家庭為群,整群抽樣估計男女比例的誤差就低于簡單隨機抽樣。
整群抽樣特別適合于對某些特殊群結(jié)構(gòu)進行調(diào)查。
【例題10:2012單選】在調(diào)查某城市小學教師亞健康狀況時,從該城市的200所小學中隨機抽取40所,
每個被抽取小學中的所有教師都參與調(diào)查,這樣抽樣方法屬于()。
A.簡單隨機抽樣B.整群抽樣
C.分層抽樣D.等距抽樣
【答案】B
(五)多階段抽樣
(一)含義
在大規(guī)模抽樣調(diào)查中,一次抽取到最終樣本單位很難實現(xiàn),往往需要經(jīng)過二個或二個以上階段才能抽到最終樣
本單位,這就是多階段抽樣方法。首選從總體中采用隨機方法抽取若干個小總體,稱為初級單元;再在這些中
選的初級單元中隨機抽取若干個單位。
(二)優(yōu)缺點
在大范圍的抽樣調(diào)查中,采用多階段抽樣是必要的。首先,多階段抽樣是分階段進行的,抽樣框也可以分級進
行準備。其次因為多階段抽樣是在中選單位中的再抽選,這樣就使樣本的分布相對集中,從而可以節(jié)省調(diào)查中
的人力和財力。
多階段的抽樣設計比較復雜,其抽樣誤差計算也比較復雜。
第三節(jié)估計量和樣本量
【本節(jié)考點】
3、估計量的性質(zhì)
4、抽樣誤差的估計
5、樣本量的影響因素
【本節(jié)內(nèi)容】
一、估計量的性質(zhì)(一無有,可記憶為“一無所有”)
性質(zhì)內(nèi)含
一致性隨著樣本量的增大,估計量的值如果穩(wěn)定于總體參數(shù)的真值,這個估計量
就有一致性,可稱為“一致估計量”。
無偏性對于不放回簡單隨機抽樣,所有可能的樣本均值取值的平均值總等于總體
現(xiàn)值(樣本均值的平均數(shù)等于總體均值),這就是樣本均值估計量的無偏性。
有效性在同一抽樣方案下,對某一總體參數(shù),如果有兩個無偏估計量。1、82,由
于樣本的隨機性,如果e1的可能樣本取值較e2更密集在總體參數(shù)真值附
亞,則認為S比。更有效,此時e?的方差小于ez的方差。
【例題11:單選】抽樣統(tǒng)計中,估計量的性質(zhì)不包括()。
A一致性
B相關性
C無偏性
D有效性
【答案】B
(二)抽樣誤差的估計
抽樣誤差無法避免,但是可計算的。
在不放回簡單隨機抽樣方法中,將樣本均值作為總體均值的估計量。則估計量的方差為:
樣本估計量的方差=
【結(jié)論】
C.抽樣誤差與總體分布有關,總體單位值之間差異越大,即總體方差越大,抽樣誤差越大。
D.抽樣誤差與樣本量n有關,其他條件相同,樣本量越大,抽樣誤差越小。
E.抽樣誤差與抽樣方式和估計量的選擇也有關。例如分層抽樣的估計量方差一般小于簡單隨機抽樣。
F.利用有效輔助信息的估計量也可以有效的減小抽樣誤差。
2、實踐中,總體方差是未知的,可以利用樣本方差來估計,因此估計量方差的的估計公式為:
樣本估計量的方胃
【例12】從某個N=1000的總體中抽出一個樣本容量為100的不放回簡單隨機樣本,樣本均值50,樣本方差
200,對總體均值的估計量等于樣本均值等于50,估計量的方差是。。
【解析】
樣樣本方
樣本估計量的方差=4-總體分羹C樣本看
=a_K)O)x2OC=18
10001OC
【例13:多選】下列關于抽樣誤差的表述正確的有()。
A抽樣誤差無法避免,但可計算
B抽樣誤差與總體分布有關,總體方差越大,抽樣誤差越大。
C其他條件相同,樣本量越大,抽樣誤差越小
D抽樣誤差與抽樣方式和估計量的選擇也有關
E分層抽樣的估計量方差一般大于簡單隨機抽樣
【答案】ABCD
三、樣本量的影響因素
1、調(diào)查的精度:用樣本數(shù)據(jù)對總體進行估計時可以接受的誤差水平,要求的調(diào)查精度越高,所需要的樣
本量就越大。
2、總體的離散程度:在其他條件相同情況下,總體的離散程度越大,所需要的樣本量也越大。
3、總體的規(guī)模:對于大規(guī)模的總體,總體規(guī)模對樣本量的需求則幾乎沒有影響(樣本量n可大致用
------、——公式表示)。但對于小規(guī)模的總體,總體規(guī)模越大,為保證相同估計精度,樣本量也要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廚房員工服務協(xié)議書
- 招生咨詢合同范例
- 屋頂補漏工程合同書
- 2024年車輛損害賠償協(xié)議書范本
- 技術服務聘用協(xié)議范本
- 最標準版商鋪租賃合同
- 2024收養(yǎng)人員入院協(xié)議書樣本
- 倉房租賃協(xié)議
- 定制外教聘請協(xié)議書
- 商標設計協(xié)議書
- 《籃球:行進間單手肩上投籃》教案(四篇)
- 建筑施工企業(yè)(安全管理)安全生產(chǎn)管理人員安全生產(chǎn)考試參考題及答案
- 2024-2025學年部編版初一上學期期中歷史試卷與參考答案
- 職業(yè)技能大賽-鴻蒙移動應用開發(fā)賽初賽理論知識考試及答案
- 2024山東高速集團限公司招聘367人高頻難、易錯點500題模擬試題附帶答案詳解
- 【人教版】《勞動教育》二下 勞動項目一 洗頭 課件
- 第三單元長方形和正方形(單元測試)-2024-2025學年三年級上冊數(shù)學蘇教版
- 燈展合同范本
- 【課件】城鎮(zhèn)與鄉(xiāng)村課件2024-2025學年人教版地理七年級上冊
- 北京市歷年中考語文現(xiàn)代文之議論文閱讀30篇(含答案)(2003-2023)
- 四川省綿陽市2025屆高三數(shù)學上學期第一次診斷性考試試題文含解析
評論
0/150
提交評論