抽樣調(diào)查基本原理課件_第1頁
抽樣調(diào)查基本原理課件_第2頁
抽樣調(diào)查基本原理課件_第3頁
抽樣調(diào)查基本原理課件_第4頁
抽樣調(diào)查基本原理課件_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

抽樣調(diào)查基本原理第一節(jié)有關(guān)基本概念

一、總體總體也叫母體,它是所要認識對象的全體,是具有同一性質(zhì)的許多單位的集合。組成總體的每個個體叫做單位。在抽樣以前,必須根據(jù)實際情況把總體劃分成若干個互不重疊并且能組合成總體的部分,每個部分稱為一個抽樣單元,不論總體是否有限,總體中的抽樣單元數(shù)一定是有限的,而且是已知的,因此說抽樣調(diào)查的總體總是有限的。總體應(yīng)具備同質(zhì)性、大量性和差異性的特征。在抽樣調(diào)查中,通常將反映總體數(shù)量特征的綜合指標稱為總體參數(shù)。常見的總體參數(shù)主要有:總體總和Y總體均值總體比率R總體比例P

二、樣本樣本是由從總體中所抽選出來的若干個抽樣單元組成的集合體。抽樣前,樣本是一個n維隨機變量,屬樣本空間;抽樣后,樣本是一個n元數(shù)組,是樣本空間的一個點。影響樣本代表性的因素有以下幾個方面:(1)總體標志值分布的離散程度。

(2)抽樣單元數(shù)的多少(或稱樣本容量的大小)。(3)抽樣方法。一般將反映樣本數(shù)量特征的綜合指標稱之為統(tǒng)計量。統(tǒng)計量是n元樣本的一個實值函數(shù),是一個隨機變量,統(tǒng)計量的一個具體取值即為統(tǒng)計值。主要的樣本統(tǒng)計量有:樣本總和y樣本均值樣本比率r樣本比例p

三、必要樣本容量和樣本可能數(shù)目樣本中包含的抽樣單元個數(shù)稱為樣本容量,又稱樣本含量或樣本大小。樣本可能數(shù)目則是在容量為N的總體中抽取容量為n的樣本時,所有可能被抽中的不同樣本的個數(shù)。用A表示。當N和n一定時,A的多少與抽樣方法有關(guān),其計算方法列表如下:抽樣方法放回抽樣不放回抽樣考慮順序不考慮順序四、抽樣框抽樣框是在抽樣前,為便于抽樣工作的組織,在可能條件下編制的用來進行抽樣的、記錄或表明總體所有抽樣單元的框架,在抽樣框中,每個抽樣單元都被編上號碼。編制抽樣框是一個實際的、重要的問題,因此必須要認真對待。抽樣框可以是一份清單(名單抽樣框)、一張地圖(區(qū)域抽樣框)。常見的抽樣框問題可以概括為四種基本類型:(1)缺失一些元素,即抽樣框涵蓋不完全;(2)多個元素對應(yīng)一個號碼;(3)空白(一些號碼沒有與之對應(yīng)的元素)或存在異類元素;(4)重復(fù)號碼,即一個元素對應(yīng)多個號碼。返回第二節(jié)樣本統(tǒng)計量的抽樣分布一、正態(tài)分布如果總體各個體的標志值以總體平均數(shù)為中心,形成鐘型對稱分布,其分布曲線向兩側(cè)擴展,逐漸向橫軸逼近,無限延伸出去,但不接觸橫軸,則這種分布就叫做正態(tài)分布,或高斯分布、常態(tài)分布。服從正態(tài)分布的總體稱為正態(tài)總體。如果一個隨機變量X服從正態(tài)分布,則其分布的密度函數(shù)(分布曲線方程)為:

當μ=0,σ2=1時,稱該分布為標準正態(tài)分布。標準正態(tài)分布的密度函數(shù)為,

任何正態(tài)分布,它的樣本落在任意區(qū)間(a,b)內(nèi)的概率等于直線x=a,x=b,橫坐標和曲線f(x)所夾的面積(可由正態(tài)分布概率積分表查得)。經(jīng)計算,正態(tài)總體的樣本落在:

(-σ,+σ)概率是68.27%;

(-2σ,+2σ)概率是95.45%;

(-3σ,+3σ)概率是99.73%;

(-1.96σ,+1.96σ)概率是95%;二、抽樣分布抽樣分布是根據(jù)所有可能樣本計算出來的某一統(tǒng)計量的數(shù)值分布。抽樣分布有極限分布和精確分布兩類。極限分布也叫做大樣本分布,它只有正態(tài)分布一種形式;精確分布又叫做小樣本分布,其前提是總體服從正態(tài)分布,它是正態(tài)分布的導(dǎo)出分布,包括有t分布、F分布和分布等形式。χ2

一般地,可以證明如果總體服從正態(tài)分布,且總體均值和方差均為已知,即

Y~N(μ,σ2)則不論樣本量大小如何,樣本均值均圍繞總體均值而服從正態(tài)分布,并且其抽樣分布的方差等于總體方差的n分之一,即~N(μ,σ2/n)

而對于非正態(tài)總體,若均值μ和σ2有限,則根據(jù)中心極限定理,當樣本量n充分大時,樣本均值仍然圍繞著總體均值而近似地服從正態(tài)分布,即~N(μ,σ2/n)

(一)樣本統(tǒng)計量的極限分布

例:總體N=5,Y={40,50,60,70,80},則其次數(shù)分布圖為若取n=2,用放回抽樣,

可抽25個簡單隨機樣本,整理后,即可得出關(guān)于樣本均值的次數(shù)分布情況為:

404550556065707580f123454321用圖形表示,則為:如果總體容量較大,則當樣本容量逐步擴大時,樣本平均數(shù)的分布趨于正態(tài)分布的趨勢更加明顯。(二)樣本統(tǒng)計量的精確分布1、χ2分布設(shè)隨機變量Yi~N(0,1)(i=1,2,…,n),且相互獨立,則Y=∑Y2i服從自由度為n的χ2分布,記作Y~χ2(n)。χ2分布的概率密度函數(shù)為主要性質(zhì)有:①f(y)恒為正;②χ2分布呈右偏形態(tài);③χ2分布隨n的不斷增大而逐漸趨于正態(tài)分布。

χ2分布χ2(n)的數(shù)學期望和方差分別為EY=n,DY=2n.2、t分布若X~N(0,1),Y~χ2(n),且X與Y相互獨立,則稱隨機變量服從自由度為n的t分布,記作:T~t(n)。

推論:若X~N(μ,σ2),σ2未知,則

服從自由度為n-1的t分布,記作:T~t(n-1)

t分布t(n)的概率密度函數(shù)為

t分布具有如下性質(zhì):①t分布對稱于縱軸,與N(0,1)相似;②在n<30(小樣本)時,t分布的方差大于N(0,1)的方差;③在n≥30(大樣本)時,t分布隨n的增大而趨于N(0,1)。

t分布t(n)的數(shù)學期望與方差分別為ET=0,DT=n/(n-2).(n>2)

若X~χ2(n1),Y~χ2(n2),且X與Y相互獨立,則稱隨機變量

3、F分布服從第一自由度為n1,第二自由度為n2的F分布,記作:F~F(n1,n2)。其概率密度函數(shù)為F分布的主要性質(zhì)有:①F分布呈右偏態(tài);②f(x)恒為正;③在

④隨n1,n2的不斷增大,F(xiàn)分布的右偏程度逐漸減弱,但不會趨向正態(tài);⑤具有倒數(shù)性質(zhì),即若X~F(n1,n2),則1/X~F(n1,n2);⑥若t~t(n),則t2(n)~F(1,n)。

處取最大值(n1>2,f0<1);其數(shù)學期望和方差分別為返回第三節(jié)抽樣誤差一、抽樣調(diào)查中的誤差來源誤差就是調(diào)查結(jié)果與現(xiàn)象的實際結(jié)果之間的偏差,它幾乎在所有的統(tǒng)計調(diào)查中都或大或小的存在著。在抽樣調(diào)查中,按照形成原因的不同,一般可將誤差分成抽樣誤差和非抽樣誤差兩大類。抽樣誤差是用樣本統(tǒng)計量推斷總體參數(shù)時的誤差,它屬于一種代表性誤差。

在抽樣調(diào)查中抽樣誤差是不可避免的。但同非抽樣誤差不同的是,抽樣誤差可以計算,并且可以被控制在任意小的范圍內(nèi)。

影響抽樣誤差的因素

1.抽樣誤差通常會隨樣本量的大小而增減。

2.所研究現(xiàn)象總體變異程度的大小。

3.抽樣的方式方法。

非抽樣誤差不是由于抽樣引起的。它又包括:調(diào)查誤差;無回答誤差;抽樣框誤差;登記性誤差。同抽樣誤差相反,非抽樣誤差是隨著樣本量的增加而增大的。由于抽樣調(diào)查的訪問和資料整理都比普查更便于進行,因此非抽樣誤差也遠遠小于普查。有時,普查中的非抽樣誤差甚至大于抽樣調(diào)查中抽樣誤差與非抽樣誤差的總和。二、抽樣誤差的計算抽樣誤差的計算,是建立在誤差分布理論基礎(chǔ)上,從統(tǒng)計平均意義角度來考慮的。

抽樣誤差用所有可能的實際誤差的均方誤差表示

MSE()=E(-θ)2=E[

-E(

)]2+[E()-θ]2

式中第一項是估計量的方差,記作V()。

式中第二項是估計量的偏倚B()的平方。

無偏估計時,的方差就等于它的均方誤差。

說明:①上面所給出的估計量方差公式實際中當σ2未知時,一般用樣本方差s2代替以對②有偏的估計并非都是不可用的,有時有偏估計量在某些方面反而比無偏估計量更好。有研究認為,在實踐中當偏倚小于標準誤的十分之一時,偏倚對估計量準確度的影響可以忽略不計。仍然屬于一個理論公式,是依據(jù)調(diào)查變量的總體方差σ2進行計算的,估計量的方差做出估計。返回第四節(jié)抽樣估計一、抽樣估計的特點第一,抽樣估計在邏輯上運用的是歸納推理而不是演繹推理。第二,抽樣估計在方法上運用不確定的概率估計法而不是運用確定的數(shù)學分析法。第三,抽樣估計的結(jié)論存在著一定程度的抽樣誤差。二、抽樣估計的方法抽樣估計的方法多種多樣。如果以估計中所依據(jù)的資料不同來區(qū)分,一般可以有簡單估計、比估計和回歸估計等三種方法。簡單估計是單純依靠樣本調(diào)查變量的資料估計總體參數(shù),其估計結(jié)果稱為簡單估計量;比估計和回歸估計是同時依據(jù)樣本調(diào)查變量以及已知的有關(guān)輔助變量的資料來對總體參數(shù)做出估計,其結(jié)果分別稱為比估計量和回歸估計量。如果以估計結(jié)果的表示方式來區(qū)分,則抽樣估計可以有兩種形式,即定值估計和區(qū)間估計。三、置信區(qū)間一般地說,若估計量是無偏的,且呈正態(tài)分布,則參數(shù)θ的置信度當調(diào)查變量的總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論