統(tǒng)計學(xué)之9 抽樣推斷_第1頁
統(tǒng)計學(xué)之9 抽樣推斷_第2頁
統(tǒng)計學(xué)之9 抽樣推斷_第3頁
統(tǒng)計學(xué)之9 抽樣推斷_第4頁
統(tǒng)計學(xué)之9 抽樣推斷_第5頁
已閱讀5頁,還剩194頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章抽樣推斷:統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷美國總統(tǒng)選舉民意調(diào)查

1984年11月里根與孟代爾競選總統(tǒng),美國著名的蓋洛普、哈里斯、國家廣播公司三家民意調(diào)查社在選舉前三個星期所做調(diào)查的統(tǒng)計分析,里根分別約可獲得58%、55%及60%選票,正式選舉的結(jié)果:里根約獲得59%選票,而孟代爾約41%選票。此次美國所有的民意調(diào)查社的預(yù)測數(shù)字與選舉結(jié)果最多只有4%誤差,但被調(diào)查的選民不超過3000人,可見統(tǒng)計的技巧是多么有用。在以往的十七次美國總統(tǒng)選舉預(yù)測中,只有兩次失敗,第一次是1936年的藍頓對羅斯福的選舉,樣本數(shù)一千萬但是誤差20%,第二次是1948年杜威對杜魯門,樣本數(shù)二百萬誤差5%,50年來美國21次全國選舉預(yù)測之平均誤差只有2.3%。統(tǒng)計學(xué)之9抽樣推斷學(xué)習(xí)目的與要求:

抽樣估計是抽樣調(diào)查的繼續(xù),它提供了一套利用抽樣資料來估計總體數(shù)量特征的方法。通過本章的學(xué)習(xí),要理解和掌握抽樣估計的概念、特點,抽樣誤差的含義、計算方法,抽樣估計的置信度,推斷總體參數(shù)的方法,能結(jié)合實際資料進行抽樣估計。統(tǒng)計學(xué)之9抽樣推斷主要內(nèi)容:§1

抽樣推斷的概念與特點§2

抽樣平均誤差的計算§3

抽樣估計§4

抽樣的組織形式§5

必要抽樣數(shù)目的確定統(tǒng)計學(xué)之9抽樣推斷

第一節(jié)抽樣推斷概述一、抽樣推斷的概念抽樣推斷:是按隨機原則從總體中抽取一部分單位構(gòu)成一個樣本進行觀察,并根據(jù)樣本的實際數(shù)據(jù)對總體的數(shù)量特征作出具有一定可靠程度的估計和判斷的一種統(tǒng)計方法。統(tǒng)計學(xué)之9抽樣推斷隨機原則:隨機原則——即是在抽取樣本時,排除人們主觀意圖的作用,使得總體中的每個單位或每個樣本有相等的入選機會。隨機原則又稱為等可能性原則。統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計推斷的過程:樣本總體樣本指標(biāo)總體指標(biāo)統(tǒng)計學(xué)之9抽樣推斷二、抽樣推斷的特點按隨機原則抽取樣本單位;用部分推斷總體,即用樣本指標(biāo)去推斷或估計總體指標(biāo)。抽樣推斷必然產(chǎn)生抽樣誤差,且誤差可以事先計算并加以控制。運用概率估計方法。統(tǒng)計學(xué)之9抽樣推斷三、抽樣調(diào)查的作用適用于無限總體或者很難進行全面調(diào)查的總體的研究;對某些可以但事實上不必或不可能進行全面調(diào)查的現(xiàn)象總體的研究。適應(yīng)于破壞性產(chǎn)品的質(zhì)量檢驗;可以用于生產(chǎn)過程中的質(zhì)量控制;用于訂正全面調(diào)查的數(shù)據(jù);可用于假設(shè)檢驗。統(tǒng)計學(xué)之9抽樣推斷四、抽樣推斷的基本概念(一)總體與樣本總體(全及總體、母體):是指統(tǒng)計所要研究的全體,由具有某種特定性質(zhì)的許多個別事物組成的集合體。N:總體單位數(shù)。總體可分為有限總體與無限總體。統(tǒng)計學(xué)之9抽樣推斷樣本(抽樣總體、樣本總體或子樣)樣本

:是指按照隨機原則,從全及總體中抽取出來,代表全及總體的那部分單位的集合體。樣本容量(n)

樣本中所包含的總體單位數(shù)。n?30是大樣本。

總體是唯一的,樣本是隨機多個的。統(tǒng)計學(xué)之9抽樣推斷(二)、總體指標(biāo)與樣本指標(biāo)總體指標(biāo)(母體參數(shù)、總體參數(shù)、全及指標(biāo)):它是根據(jù)總體各單位的標(biāo)志值或標(biāo)志特征計算的,反映總體某種屬性的綜合指標(biāo)。全及指標(biāo)是唯一確定的,一個總體常常有多個總體參數(shù)。統(tǒng)計學(xué)之9抽樣推斷常用的總體指標(biāo)有:或或統(tǒng)計學(xué)之9抽樣推斷樣本指標(biāo)(樣本統(tǒng)計量):樣本指標(biāo):也稱為統(tǒng)計量或抽樣指標(biāo),它是根據(jù)抽樣各單位的標(biāo)志值或標(biāo)志特征值計算的、用以估計和推斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。一個樣本常常有多個樣本指標(biāo),依據(jù)樣本的數(shù)據(jù)計算的樣本指標(biāo)不是唯一確定的。統(tǒng)計學(xué)之9抽樣推斷常用的樣本統(tǒng)計量有:或或統(tǒng)計學(xué)之9抽樣推斷說明:按照無偏估計的要求,才是總體方差的無偏公式,但在某些統(tǒng)計中,n通常較大,n與(n-1)相差甚微,為簡便,就用n代替(n-1)??傮w指標(biāo)是唯一確定的值,樣本指標(biāo)是隨機變量。

統(tǒng)計學(xué)之9抽樣推斷(三)抽樣方法與樣本個數(shù)樣本個數(shù)(m)——指從總體中可能抽取的全部樣本數(shù)目,又稱樣本可能數(shù)目。這與抽樣方法和樣本容量有關(guān)系。抽樣方法重復(fù)(置)抽樣不重復(fù)(置)抽樣考慮順序不考慮順序考慮順序不考慮順序統(tǒng)計學(xué)之9抽樣推斷重復(fù)抽樣的特點:n個單位的樣本是由n次連續(xù)試驗構(gòu)成的。每次試驗相互獨立,各單位中選與不中選相互不影響。每次試驗都是在相同的條件下進行,即都是從N個總體單位中隨機抽取一個,因此,每個單位在每次中選的機會都相等,它們每次都有1/N的中選機會。統(tǒng)計學(xué)之9抽樣推斷不重復(fù)抽樣的特點:n個單位的樣本是由n次連續(xù)試驗構(gòu)成的,但由于每次抽出不放回,所以實質(zhì)上等同于同時從總體中抽n個樣本單位。每次試驗不相互獨立,上次中選情況影響下次中選結(jié)果。每抽一次總體的單位數(shù)便少一個,因此每個單位在各次中選的機會是不相等的,第i次抽取每個單位有1/(N-i+1)的中選機會。統(tǒng)計學(xué)之9抽樣推斷考慮順序的樣本個數(shù):1)不重復(fù)排列數(shù)2)重復(fù)排列數(shù)統(tǒng)計學(xué)之9抽樣推斷不考慮順序的樣本個數(shù):3)不重復(fù)組合數(shù)4)重復(fù)組合數(shù)統(tǒng)計學(xué)之9抽樣推斷【例】

從0-9的10個數(shù)中隨機重復(fù)抽選6個數(shù)字組成電話號碼,共能組成多少個電話號碼?(重復(fù)排列數(shù))統(tǒng)計學(xué)之9抽樣推斷【例】從班級10位學(xué)生中抽選三人擔(dān)任不同的職務(wù),問共有幾種抽法?(不重復(fù)的排列數(shù))統(tǒng)計學(xué)之9抽樣推斷【例】從小組10位學(xué)生中不重復(fù)隨機抽選3個組成樣本,考查其平均成績,可能的樣本數(shù)目為:(重復(fù)組合數(shù))統(tǒng)計學(xué)之9抽樣推斷從A、B、C、D四個單位中,抽出兩個單位構(gòu)成一個樣本,問樣本個數(shù)是多少?重復(fù)抽樣排列數(shù):Nn=42

=16(個樣本)AAACADBABBBCBDABCACBCCCDDADBDCDD不重復(fù)抽樣排列數(shù):N(N-1)(N-2)……=4×3=12(個樣本)【例】統(tǒng)計學(xué)之9抽樣推斷(四)抽樣推斷的理論依據(jù)1.大數(shù)法則(大數(shù)定律)基本思想:大量的隨機現(xiàn)象具有一定的穩(wěn)定性。統(tǒng)計學(xué)之9抽樣推斷我們知道,總體由許多總體單位組成,每個總體單位的表現(xiàn)各不一樣。這些不同的表現(xiàn)共同決定著總體的表現(xiàn)或特征。如果我們將這些大量的總體單位加以綜合平均,那么它們對總體的個別影響會將相互抵消,最后呈現(xiàn)出它們共同作用的結(jié)果,使總體具有穩(wěn)定的性質(zhì)。統(tǒng)計學(xué)之9抽樣推斷實際推斷原理:當(dāng)試驗次數(shù)很大時,可以用樣本指標(biāo)代替總體指標(biāo)。在概率論中,大數(shù)法則是這樣表述的:對于任意正數(shù),有:或這樣,以嚴(yán)格的數(shù)學(xué)形式,表達了頻率的穩(wěn)定性。統(tǒng)計學(xué)之9抽樣推斷2、中心極限定理:中心極限定理,其著眼點是“變量和的分布”。一個隨機變量服從正態(tài)分布的現(xiàn)象并不多見,但多個變量和的分布服從正態(tài)分布則是普遍存在的。在現(xiàn)實生活中,變量和的分布是普遍存在的?;舅枷耄鹤兞亢偷姆植己瘮?shù)向正態(tài)分布收斂。統(tǒng)計學(xué)之9抽樣推斷也就是說:

中心極限定理論證了:如果總體變量存在有限的平均數(shù)和方差,那么,不論這個總體變量的分布如何,隨著抽樣單位數(shù)n的增加,抽樣平均數(shù)的分布便趨近于正態(tài)分布。統(tǒng)計學(xué)之9抽樣推斷中心極限定理的通俗定義是這樣的:當(dāng)n無限增大時,不管總體分布是什么形狀,樣本平均數(shù)分布趨近于平均數(shù)為方差為的正態(tài)分布;且,。標(biāo)準(zhǔn)化變量的分布趨近于平均數(shù)為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布。這樣就可以利用標(biāo)準(zhǔn)正態(tài)分布求得標(biāo)準(zhǔn)變量t落入任意區(qū)間的概率了。統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷第二節(jié)抽樣平均誤差一、統(tǒng)計誤差的分類(抽樣誤差)統(tǒng)計誤差登記性誤差代表性誤差統(tǒng)計學(xué)之9抽樣推斷各種統(tǒng)計誤差:登記誤差:指由于調(diào)查登記或計算差錯在發(fā)生的誤差統(tǒng)計誤差:指調(diào)查所得的統(tǒng)計數(shù)字與調(diào)查總體實際數(shù)值之間的差異。代表性誤差:指用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致,樣本不能完全代表總體而產(chǎn)生的誤差。統(tǒng)計學(xué)之9抽樣推斷系統(tǒng)誤差:由于非隨機因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的值系統(tǒng)性偏高或偏低,故也稱為偏差。隨機誤差:指遵循隨機原則抽樣,由于隨機因素(偶然性因素)引起的代表性誤差。通常所說的抽樣誤差指的就是隨機誤差。統(tǒng)計學(xué)之9抽樣推斷抽樣實際誤差:抽樣實際誤差:每一次抽樣,得到的樣本指標(biāo)與總體指標(biāo)的絕對離差。如、,這是無法計算的。抽樣實際誤差是隨機變量。統(tǒng)計學(xué)之9抽樣推斷抽樣平均誤差抽樣平均誤差:指所有可能出現(xiàn)的樣本平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差。反映了抽樣指標(biāo)與總體指標(biāo)的平均誤差程度。從理論上說是一個唯一確定的量。統(tǒng)計學(xué)之9抽樣推斷二、抽樣平均數(shù)的平均誤差統(tǒng)計學(xué)之9抽樣推斷(一)平均數(shù)的抽樣分布平均數(shù)的抽樣分布:由總體中全部樣本平均數(shù)的可能取值和與之相應(yīng)的概率(頻率)組成。即把所有可能樣本平均數(shù)的次數(shù)分布稱之為平均數(shù)的抽樣分布。抽樣分布:指樣本指標(biāo)的次數(shù)分布。統(tǒng)計學(xué)之9抽樣推斷1.重復(fù)抽樣分布【例】設(shè)有某班組5個工人的日分別為34、38、42、46、50元,則:現(xiàn)用重復(fù)抽樣方法從中隨機抽取2個構(gòu)成樣本,并求樣本平均工資來推斷總體的平均工資。統(tǒng)計學(xué)之9抽樣推斷重復(fù)排列數(shù):樣本日工資平均數(shù)單位:元統(tǒng)計學(xué)之9抽樣推斷樣本日平均工資的次數(shù)分布表根據(jù)上表數(shù)據(jù),可以整理出樣本平均數(shù)的分布如左表:統(tǒng)計學(xué)之9抽樣推斷5/254/253/252/251/25

343638404244464850樣本日平均工資分布圖平均工資(元)統(tǒng)計學(xué)之9抽樣推斷則樣本日工資平均數(shù)的平均數(shù)和方差為:統(tǒng)計學(xué)之9抽樣推斷兩個重要結(jié)論:重復(fù)抽樣的樣本平均數(shù)的平均數(shù)等于總體平均數(shù),即:所以抽樣平均數(shù)的標(biāo)準(zhǔn)差反映了樣本平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均誤差或抽樣標(biāo)準(zhǔn)誤差。因為統(tǒng)計學(xué)之9抽樣推斷樣本平均數(shù)的分布與總體分布的比較:總體分布樣本平均數(shù)的分布3438424650X20100%3/252/251/254/255/253436384042444648500統(tǒng)計學(xué)之9抽樣推斷重復(fù)抽樣抽樣平均誤差的計算公式:可見抽樣平均誤差比總體標(biāo)準(zhǔn)差小得多,僅為總體標(biāo)準(zhǔn)的。另外,抽樣平均誤差和總體標(biāo)準(zhǔn)差成正比變化,而和樣本單位數(shù)n的平方根成反比變化。統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷2.不重復(fù)抽樣分布樣本日工資平均數(shù)單位:元統(tǒng)計學(xué)之9抽樣推斷樣本日平均工資的次數(shù)分布表根據(jù)上表數(shù)據(jù),可以整理出樣本平均數(shù)的分布如左表:統(tǒng)計學(xué)之9抽樣推斷則樣本日工資平均數(shù)的平均數(shù)和方差為:統(tǒng)計學(xué)之9抽樣推斷也可得出兩個重要結(jié)論:不重復(fù)抽樣的樣本平均數(shù)的平均數(shù)等于總體平均數(shù),即:所以抽樣平均數(shù)的標(biāo)準(zhǔn)差也反映了樣本平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均誤差或抽樣標(biāo)準(zhǔn)誤差。因為統(tǒng)計學(xué)之9抽樣推斷不重復(fù)抽樣的抽樣平均誤差計算公式:不重復(fù)抽樣的抽樣平均誤差等于重復(fù)抽樣的抽樣平均誤差乘以修正因子即:統(tǒng)計學(xué)之9抽樣推斷(二)、抽樣平均誤差1.定義定義公式反映抽樣平均數(shù)(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均誤差程度?;蛘哒f,用來描述各樣本抽樣實際誤差的一般水平。抽樣平均誤差

:指所有可能出現(xiàn)的樣本指標(biāo)的標(biāo)準(zhǔn)差。統(tǒng)計學(xué)之9抽樣推斷定義公式:抽樣平均誤差是一個確定的值。統(tǒng)計學(xué)之9抽樣推斷抽樣平均誤差的具體意義:從總體N中取容量為n的可能樣本共有m個,可計算出m個抽樣實際誤差(隨機變量):為了測定樣本(指標(biāo))的代表性程度的高低,單獨用某一次的抽樣誤差來衡量是不科學(xué)的,因此就需要采用一定的方法(求標(biāo)準(zhǔn)差的方法)計算所有m個抽樣實際誤差的平均數(shù),這就是抽樣平均誤差。(i=1,2,3,···m)統(tǒng)計學(xué)之9抽樣推斷2.抽樣平均誤差的應(yīng)用公式抽樣平均誤差是一個確定的值,但在實際抽樣估計中,常用某些樣本指標(biāo)來代替未知的總體指標(biāo)。例如用s2代替2。由于s2是隨機變量,故這時所測得的只是抽樣平均誤差的估計量,此估計量仍為隨機變量。實際工作中常用推導(dǎo)的應(yīng)用公式。統(tǒng)計學(xué)之9抽樣推斷抽樣平均誤差的應(yīng)用公式:重復(fù)抽樣:不重復(fù)抽樣:統(tǒng)計學(xué)之9抽樣推斷說明:抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比,僅為總體標(biāo)準(zhǔn)差的;抽樣平均誤差與成反比??赏ㄟ^調(diào)整樣本單位數(shù)來控制抽樣平均誤差。統(tǒng)計學(xué)之9抽樣推斷假定抽樣單位數(shù)增加2倍、0.5倍時,抽樣平均誤差怎樣變化?【例】【解】統(tǒng)計學(xué)之9抽樣推斷3.計算應(yīng)注意的兩點(1)

總體方差未知時的處理方法:用s2代替2或p代替P;用方差的歷史或經(jīng)驗數(shù)據(jù)代替。如果有多個方差可供選擇,則通常取用較大的,故p應(yīng)選擇最接近于0.5的。用方差的試驗或試點數(shù)據(jù)代替。(2)

當(dāng)N很大時,N-1≈N,于是統(tǒng)計學(xué)之9抽樣推斷4.的計算實例隨機抽查某大學(xué)150個男生的身高,得其平均身高為170.8公分。根據(jù)過去的材料,知道大學(xué)生身高的總體標(biāo)準(zhǔn)差為24公分,試求抽樣平均誤差?!纠?解:統(tǒng)計學(xué)之9抽樣推斷【例】2某廠生產(chǎn)某種燈泡5000只,隨機抽取500只作壽命測試。測試結(jié)果表明,平均壽命為6200小時,樣本標(biāo)準(zhǔn)差為450小時,求抽樣平均誤差。解:統(tǒng)計學(xué)之9抽樣推斷【例】3某倉庫有某種零配件10000套,隨機抽取400套,發(fā)現(xiàn)32套不合格。求合格率的抽樣平均誤差。已知N=10000,n=400,p=368/400=92%,求統(tǒng)計學(xué)之9抽樣推斷解:重復(fù)抽樣:不重復(fù)抽樣:統(tǒng)計學(xué)之9抽樣推斷【例】4某校隨機抽選400名學(xué)生,發(fā)現(xiàn)戴眼鏡的學(xué)生有80人。根據(jù)樣本資料推斷全部學(xué)生中戴眼鏡的學(xué)生所占比重時,抽樣誤差為多大?樣本p=n1/n=80/400=20%解:統(tǒng)計學(xué)之9抽樣推斷【例】5某燈泡廠對10000個產(chǎn)品進行使用壽命檢驗,隨機抽取2%樣本進行測試,按規(guī)定,燈泡使用壽命在1000小時以上者為合格品。測得樣本數(shù)據(jù)如下:燈泡平均使用時間x=1057小時,燈泡使用時間標(biāo)準(zhǔn)差為s=53.63小時,合格品率為p=91.5%,則:統(tǒng)計學(xué)之9抽樣推斷不重復(fù)抽樣時:統(tǒng)計學(xué)之9抽樣推斷重復(fù)抽樣時:

統(tǒng)計學(xué)之9抽樣推斷5.影響抽樣平均誤差的因素總體方差或標(biāo)準(zhǔn)差。

大,則大。樣本容量n。如n擴大為原來的4倍,則縮小為原來的1/2。抽樣方法。由于小于1,重復(fù)抽樣時的抽樣平均誤差永遠大于不重復(fù)抽樣時的抽樣平均誤差。抽樣調(diào)查的組織形式。統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷第三節(jié)抽樣估計(推斷)有效的估計將是……統(tǒng)計學(xué)之9抽樣推斷一、抽樣估計的概念統(tǒng)計推斷:就是利用樣本的數(shù)據(jù),對總體的數(shù)量特征作出具有一定可靠程度的估計和判斷。統(tǒng)計推斷包括參數(shù)估計和假設(shè)檢驗兩個方面??傮w參數(shù)估計:是以樣本統(tǒng)計量作為未知總體參數(shù)的估計量,并通過樣本數(shù)據(jù)計算樣本統(tǒng)計量的取值,作為總體參數(shù)的估計值。參數(shù)估計又稱抽樣估計。統(tǒng)計學(xué)之9抽樣推斷抽樣估計要具備三個基本要素:要有合適的統(tǒng)計量作為估計量要有合理的允許誤差范圍(△)要有一個可接受的置信度統(tǒng)計學(xué)之9抽樣推斷二、統(tǒng)計量的優(yōu)良估計標(biāo)準(zhǔn)估計量:用于估計總體參數(shù)的統(tǒng)計量。估計值:依據(jù)某一具體的樣本指標(biāo)所估計的總體指標(biāo)的值。優(yōu)良估計量總是從總體上來說的,其標(biāo)準(zhǔn)有三個:無偏性、一致性和有效性。統(tǒng)計學(xué)之9抽樣推斷1.無偏性要求樣本指標(biāo)的平均數(shù)等于被估計的總體指標(biāo)。即:樣本指標(biāo)是總體指標(biāo)的無偏估計量。有:統(tǒng)計學(xué)之9抽樣推斷無偏性:樣本統(tǒng)計量的期望值(均值)

等于被估計的總體參數(shù)。E(x)=X無偏估計量E(Me)≠X有偏估計量統(tǒng)計學(xué)之9抽樣推斷2.一致性當(dāng)樣本的單位數(shù)充分大時,樣本指標(biāo)充分靠近總體指標(biāo)。即當(dāng)n無限增加,樣本指標(biāo)與未知的總體指標(biāo)之差的絕對值小于任意小的正數(shù),它的可能性也趨近于必然性。對于,當(dāng)n愈多,抽樣平均誤差愈接近于0。統(tǒng)計學(xué)之9抽樣推斷3、有效性要求作為優(yōu)良估計量的方差應(yīng)該比其他估計量的方差小。例如有:注意:并不是所有的估計量都符合以上的標(biāo)準(zhǔn)。例如:在正態(tài)分布的情況下,總體平均數(shù)和中位數(shù)是重合的,樣本中位數(shù)是總體中位數(shù)的無偏和一致估計量,但對比樣本平均數(shù)卻不是更有效的估計量。而樣本平均數(shù)卻是總體中位數(shù)的優(yōu)良估計量。統(tǒng)計學(xué)之9抽樣推斷三、抽樣極限誤差(△)總體指標(biāo)是唯一確定的值,樣本指標(biāo)是圍繞著全及指標(biāo)上下隨機出現(xiàn)的變量。抽樣平均誤差指抽樣分布的標(biāo)準(zhǔn)差,說明的是某一抽樣方案下所有可能樣本的平均誤差情況,但在抽樣推斷實踐中往往只抽取一個樣本,該樣本的指標(biāo)數(shù)值與總體指標(biāo)數(shù)值的離差,可能為正,也可能為負,該誤差可能大于也可能小于或者等于抽樣平均誤差。因此,對于一項抽樣調(diào)查,總是要求有一個合理的允許誤差范圍,這就是抽樣極限誤差△。統(tǒng)計學(xué)之9抽樣推斷抽樣極限誤差的定義:抽樣極限誤差:指在進行抽樣估計時,根據(jù)研究對象的變異程度和分析任務(wù)的要求所確定的樣本指標(biāo)與總體指標(biāo)之間可允許的最大誤差范圍。也稱容許誤差、可能誤差。常用△表示。它是根據(jù)概率理論,以一定的可靠程度保證抽樣誤差不超過某一給定的范圍△。統(tǒng)計學(xué)之9抽樣推斷1)

△是指誤差范圍

△的原意表示是以為中心,在之間變動。但由于全及指標(biāo)未知,而樣本指標(biāo)通過實測可得到。因此,抽樣誤差范圍的實際意義是要求被估計的全及指標(biāo)落在抽樣指標(biāo)的一定范圍內(nèi),即落在的范圍內(nèi)。統(tǒng)計學(xué)之9抽樣推斷即:因此,、P的范圍估計(區(qū)間估計)分別為:

同理得:、統(tǒng)計學(xué)之9抽樣推斷2)△是指可能范圍而非肯定范圍抽樣極限誤差△不是唯一固定的,而是根據(jù)抽樣調(diào)查的目的,根據(jù)人們希望控制總體指標(biāo)的把握程度來確定的。如果希望控制的把握程度大些,就給予△較大的值,否則,△的給定值就較小。這種把握程度就是概率保證程度。亦即抽樣估計的可靠程度,叫估計置信度,習(xí)慣上也稱為可靠度、可信程度、把握程度或概率保證程度。統(tǒng)計學(xué)之9抽樣推斷四、置信度、概率度、估計精度1.置信度是估計的可靠性問題置信度:就是表明抽樣指標(biāo)和總體指標(biāo)的誤差,不超過一定范圍(△)的概率保證程度。統(tǒng)計學(xué)之9抽樣推斷置信度即概率保證程度:

由于抽樣指標(biāo)值隨著樣本的變動而變動,它本身是一個隨機變量,因而抽樣指標(biāo)和總體指標(biāo)的誤差仍然是一個隨機變量,并不能保證誤差不超過一定范圍這個事件是必然事件,而只能給以一定程度的概率保證。因此,就有必要來計算抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率大小,即計算抽樣指標(biāo)落在一定區(qū)間范圍內(nèi)的概率,這種概率稱之為抽樣估計的置信度。統(tǒng)計學(xué)之9抽樣推斷估計值所確定的估計區(qū)間是隨機的,在實際抽樣中并不能保證被估計的總體指標(biāo)值都落在允許誤差范圍內(nèi),這就產(chǎn)生要冒多大風(fēng)險來相信所作的估計。例如:我們愿意冒10%的風(fēng)險,表示如果進行多次重復(fù)估計,則平均每100次估計將有10次是錯誤的,90次是正確的,90%就稱為置信度或概率保證程度。統(tǒng)計學(xué)之9抽樣推斷2.概率度(t)反映△的相對程度

描述全部樣本指標(biāo)與總體指標(biāo)的平均誤差,而△則是對一個樣本的樣本指標(biāo)與總體指標(biāo)誤差的控制范圍,因而可用來衡量△。即抽樣極限誤差等于t倍的抽樣平均誤差:t就稱為概率度。或或統(tǒng)計學(xué)之9抽樣推斷因此:△——是用一定倍數(shù)的表示的抽樣指標(biāo)與全及指標(biāo)之間的絕對離差。t

——是指以抽樣平均誤差為尺度來衡量的相對誤差范圍。統(tǒng)計學(xué)之9抽樣推斷

求t值的過程,也就是樣本變量

和p的標(biāo)準(zhǔn)化過程。標(biāo)準(zhǔn)變量t服從正態(tài)分布。t值大小是確定正態(tài)分布函數(shù)的決定因子。即t是確定概率保證程度大小的指標(biāo)??梢罁?jù)一定的置信度,查標(biāo)準(zhǔn)正態(tài)分布表求得。統(tǒng)計學(xué)之9抽樣推斷概率是概率度的函數(shù):P=F(t)在正態(tài)分布的情況下,從總體中隨機抽取一個樣本觀察,則該樣本指標(biāo)落在某一范圍內(nèi)的概率,是用占正態(tài)曲線面積的大小表示的。即:統(tǒng)計學(xué)之9抽樣推斷正態(tài)分布及其曲線下的面積圖68.27%1-1-295.45%99.73%-323統(tǒng)計學(xué)之9抽樣推斷可見隨著t的不斷增大,概率P的數(shù)值也隨著增大以致逐漸接近于1,使抽樣推斷達到完全可靠的程度。應(yīng)用正態(tài)分布曲線,把概率度t和抽樣誤差范圍△聯(lián)系起來,便可得到抽樣推斷全及指標(biāo)在一定范圍內(nèi)的概率保證程度。統(tǒng)計抽樣推斷中常用的有:統(tǒng)計學(xué)之9抽樣推斷常用概率度與概率對照表

統(tǒng)計學(xué)之9抽樣推斷3.估計精度是從相對數(shù)的角度說明抽樣估計的準(zhǔn)確程度誤差率=允許誤差/估計值,即:估計精度=1-誤差率,即:抽樣估計的準(zhǔn)確性隨著△的增大而減小,它們之間呈反方向變動。統(tǒng)計學(xué)之9抽樣推斷注意:估計的準(zhǔn)確性與可靠信是相互矛盾的△決定估計的準(zhǔn)確性,成反比關(guān)系;F(t)決定估計的可靠性,成正比關(guān)系可靠性越大,F(xiàn)(t)越大

t越大△

越大

準(zhǔn)確性越小。統(tǒng)計學(xué)之9抽樣推斷【例】(仍用前面例子)從總體5個工人的日平均工資中重復(fù)抽取n為2的樣本平均工資的抽樣分布如下表:統(tǒng)計學(xué)之9抽樣推斷樣本日平均工資

的次數(shù)分布表統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷五、抽樣估計方法以樣本的平均數(shù)作為總體平均數(shù)的估計值。以樣本的成數(shù)p作為總體成數(shù)P的估計值。(一)點估計(定值估計)——它是直接以樣本指標(biāo)的實際值直接作為相應(yīng)總體參數(shù)的估計值。例如:統(tǒng)計學(xué)之9抽樣推斷點估計的特點:優(yōu)點:簡便、易行、原理直觀,它能夠提供總體指標(biāo)的具體估計值,可以作為行動決策的數(shù)量依據(jù)。缺點:任何點估計不是對就是錯,點估計沒有表明抽樣估計的誤差,更沒有指出誤差在一定范圍內(nèi)的概率保證程度有多大。統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)家做得比間諜們更漂亮!由于許多戰(zhàn)略上的理由,盟軍非常想知道二戰(zhàn)期間德軍總共制造了多少輛坦克。德國人在制造坦克時是墨守陳規(guī)的,他們把坦克從1開始進行了連續(xù)編號。在戰(zhàn)爭進行過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的編號。那么怎樣用這些號碼來估計坦克總數(shù)呢?統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)家做得比間諜們更漂亮!

我們知道,制造出來的坦克數(shù)肯定大于記錄中的最大編號。因此,其中點估計的方法之一就是,計算出被繳獲坦克編號的平均值,并認為這個值是德軍全部坦克編號的中點,用樣本均值乘以2就是總數(shù)的一個估計。

從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看,盟軍估計值非常接近所生產(chǎn)坦克的真實記錄。統(tǒng)計學(xué)之9抽樣推斷(二)區(qū)間估計統(tǒng)計學(xué)之9抽樣推斷定義:區(qū)間估計:就是在一定的概率保證程度下,選定概率度t及抽樣極限誤差△=t,再根據(jù)樣本指標(biāo)數(shù)值和△去估計總體指標(biāo)數(shù)值所在的可能范圍的一種統(tǒng)計推斷方法。估計區(qū)間的上下限:或置信區(qū)間:或置信度:統(tǒng)計學(xué)之9抽樣推斷1.根據(jù)F(t)求△及置信區(qū)間根據(jù)樣本資料,計算出及或p及。根據(jù)F(t)查正態(tài)分布概率表求t;根據(jù)t與,計算或,指出置信區(qū)間為:或統(tǒng)計學(xué)之9抽樣推斷【例】對某魚塘進行抽樣調(diào)查,從魚塘的不同部位共網(wǎng)到魚150條,其中草魚123條,草魚平均每條重2公斤,標(biāo)準(zhǔn)差為0.75公斤。1)試按95.45%(t=2)的概率保證程度,對該魚塘草魚平均每條重量作區(qū)間估計;2)以同樣的概率保證程度對該魚塘草魚所占比重作區(qū)間估計。統(tǒng)計學(xué)之9抽樣推斷解1)已知:草魚平均每條重量的估計區(qū)間為:

即[2-0.14,2+0.14]

[1.86,2.14]公斤

(公斤)=2kg,s=0.75kg,n=123,t=2統(tǒng)計學(xué)之9抽樣推斷解2)已知:n=150

,t=2,p=123/150=82%則草魚所占比重的估計區(qū)間為:即[82%-6.27%,82%+6.27%]

[75.73%,88.27%]統(tǒng)計學(xué)之9抽樣推斷2.根據(jù)給定的△,求F(t)抽取樣本,計算出、s,推算出;根據(jù)△,估計出根據(jù),求出F(t)統(tǒng)計學(xué)之9抽樣推斷隨機抽取25畝水稻田,測得平均畝產(chǎn)為650公斤,標(biāo)準(zhǔn)差為75公斤,求總體平均畝產(chǎn)在620-680斤之間的概率是多少?【例】統(tǒng)計學(xué)之9抽樣推斷【解】所以F(t)=95.45%。已知,s=75公斤,n=25統(tǒng)計學(xué)之9抽樣推斷【例】

某儲蓄所6月份共有存單3000張,為了解存款數(shù)量情況,現(xiàn)隨機抽取200張進行調(diào)查,得結(jié)果如右表,試求重復(fù)抽樣條件下:該儲蓄所本月存單平均存款范圍(概率保證程度為95.45%);該儲蓄所本月存款額在1000元以上存單所占比重范圍。(概率保證程度為95.45%)。統(tǒng)計學(xué)之9抽樣推斷該儲蓄所存單平均存款額與標(biāo)準(zhǔn)差計算表統(tǒng)計學(xué)之9抽樣推斷①統(tǒng)計學(xué)之9抽樣推斷②p=40/200=20%,則統(tǒng)計學(xué)之9抽樣推斷

對我國某城市進行居民家庭人均旅游消費支出調(diào)查,隨機抽取400戶居民家庭,調(diào)查得知居民家庭人均年旅游消費支出為350元,標(biāo)準(zhǔn)差為100元,要求以95%的概率保證程度,估計該市人均年旅游消費支出額。

解:第一步,根據(jù)抽樣資料已算得:樣本戶年人均消費支出x=350(元)樣本標(biāo)準(zhǔn)差s=100(元),則統(tǒng)計學(xué)之9抽樣推斷第二步,根據(jù)F(t)=95%,查得t=1.96。第三步,計算則該市居民家庭年人均旅游消費支出額的上下限為:結(jié)論:我們可以95%得概率保證程度,估計該市居民家庭年人均旅游消費支出額在340.20元—359.80元之間。統(tǒng)計學(xué)之9抽樣推斷【例】某市電視臺為了解觀眾對某電視欄目的喜愛程度,在該市隨機對900名居民進行調(diào)查,結(jié)果有540名喜歡該電視欄目,要求以90%的概率保證程度,估計該市居民喜歡該電視欄目的比率。解:統(tǒng)計學(xué)之9抽樣推斷根據(jù)給定的F(t)=90%,查表得t=1.64。結(jié)論:我們可以概率90%的保證程度,估計該市居民對此電視欄目喜愛的比率在57.33%~62.67%之間。則總體比率的上下限為:統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷第四節(jié)抽樣組織形式簡單隨機抽樣類型抽樣等距抽樣整群抽樣多階段抽樣統(tǒng)計學(xué)之9抽樣推斷一、簡單隨機抽樣簡單隨機抽樣:又稱為純隨機抽樣,它是按照隨機原則直接從總體N個個體中抽取n個個體作樣本,使總體中的每個個體都有同等的機會被抽中。直接抽選法

抽簽摸球法

隨機數(shù)表法簡單隨機抽樣

統(tǒng)計學(xué)之9抽樣推斷直接抽選法是指直接從調(diào)查對象中隨機抽選。例如,從倉庫中存放的所有同類產(chǎn)品中隨機指定若干件產(chǎn)品進行質(zhì)量檢驗;從糧食倉庫中不同的地點取出若干糧食樣本進行含雜量、含水量的檢驗等。抽簽法即先將全及總體各個單位按照某種自然的順序編上號,并做成號簽,再把號簽摻合起來,任意抽取所需單位數(shù),然后按照抽中的號碼取得對應(yīng)的調(diào)查單位加以登記調(diào)查。隨機數(shù)表是指含有一系列組別的隨機數(shù)字的表格。統(tǒng)計學(xué)之9抽樣推斷簡單隨機抽樣的特點是抽樣調(diào)查中最基本的組織形式;遵循隨機原則直接從總體N個單位中抽取n個單位作為樣本;又稱為純隨機抽樣。簡單隨機抽樣被用作評估其他抽樣策略的效率的基準(zhǔn);簡單隨機抽樣最原始的抽取方法是抽簽法,最常用的抽取方法是利用《隨機數(shù)表》或計算機生產(chǎn)隨機數(shù)。統(tǒng)計學(xué)之9抽樣推斷簡單隨機抽樣適用的情況:對調(diào)查對象很少了解;總體單位的排列沒有秩序;均勻總體。注:前面所討論的抽樣平均誤差的計算公式就是簡單隨機抽樣時的抽樣平均誤差的公式。統(tǒng)計學(xué)之9抽樣推斷抽樣單位數(shù)目的計算重復(fù)抽樣:不重復(fù)抽樣:統(tǒng)計學(xué)之9抽樣推斷【例】

某市開展職工家計調(diào)查,根據(jù)歷史資料該市職工家庭平均每人年收入的標(biāo)準(zhǔn)差為2400元,家庭消費總支出中食品消費支出比重(恩格爾系數(shù))為54%?,F(xiàn)用重復(fù)抽樣方法,要求在95.45%的概率保證下,平均收入的抽樣極限誤差不超過200元,恩格爾系數(shù)的抽樣極限誤差不超過4%,請確定樣本必要數(shù)目。統(tǒng)計學(xué)之9抽樣推斷樣本成數(shù)的樣本必要數(shù)目:【解】根據(jù)公式,在重復(fù)抽樣條件下:樣本平均數(shù)的樣本必要數(shù)目:統(tǒng)計學(xué)之9抽樣推斷關(guān)于抽樣單位數(shù)目的幾點說明在同樣條件下,不重復(fù)抽樣比重復(fù)抽樣要求的抽樣單位數(shù)目少。但不重復(fù)抽樣的抽樣單位數(shù)目計算公式比較復(fù)雜。在實際工作中,一般當(dāng)n/N的抽樣比很小時(小于5%),為了簡化計算,雖然采用不重復(fù)抽樣,也可用重復(fù)抽樣計算公式計算抽樣單位數(shù)目。統(tǒng)計學(xué)之9抽樣推斷關(guān)于抽樣單位數(shù)目的幾點說明同一總體往往同時需要估計總體平均數(shù)和總體成數(shù),對二者可以分別計算出各自抽樣單位數(shù)目,為了防止抽樣單位數(shù)目的不足,在實際工作中,往往根據(jù)抽樣單位數(shù)目比較大的一個數(shù)目進行抽樣,以滿足共同要求。統(tǒng)計學(xué)之9抽樣推斷即問即答在重復(fù)抽樣情況下,如果其它條件保持不變,要使允許誤差范圍縮小為原來的1/2,則樣本單位數(shù)目需要擴大為原來的多少?反之,如果允許誤差范圍要求擴大為原來的2倍,抽樣單位數(shù)目又要如何變化?統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷二、分類(層)抽樣類型抽樣:它是先對總體各單位按某種標(biāo)志分組,然后再從各組中按隨機原則抽選一定單位構(gòu)成樣本,再對樣本總體進行觀察。優(yōu)點:能夠提高樣本的代表性,可降低影響抽樣平均誤差的方差。特點:是統(tǒng)計分組和抽樣法的結(jié)合。統(tǒng)計學(xué)之9抽樣推斷經(jīng)過劃類分組后,確定各類型組抽樣單位數(shù)一般有兩種方法:不等比例抽樣。即各類型組所抽選的單位數(shù),按各類型組標(biāo)志值的變動程度來確定,變動程度大的多抽一些單位,變動程度小的少抽一些單位,沒有統(tǒng)一的比例關(guān)系。等比例抽樣。即按照樣本單位數(shù)在各類之間分配的比重與總體在各類之間分配相同的比重進行抽樣。統(tǒng)計學(xué)之9抽樣推斷等比例分層抽樣的抽樣平均誤差:

N=N1+N2+…+NK

n=n1+n2+…+nK等比例抽樣:分類抽樣總的抽樣誤差取決于各層內(nèi)的抽樣誤差,而各層內(nèi)的抽樣誤差又取決于各層內(nèi)部的方差和抽樣數(shù)目。統(tǒng)計學(xué)之9抽樣推斷重復(fù)抽樣條件下的計算公式(平均組內(nèi)方差)統(tǒng)計學(xué)之9抽樣推斷不重復(fù)抽樣條件下的計算公式統(tǒng)計學(xué)之9抽樣推斷注意:分層抽樣的取決于各組內(nèi)方差的平均數(shù),而總方差=組內(nèi)方差的平均數(shù)+組間方差,故分層抽樣的小于簡單隨機抽樣的。由于總體方差是確定數(shù),因此類型抽樣分組(層)時,應(yīng)盡量增大組(層)間差異,縮小組(層)內(nèi)差異。提高抽樣效果。統(tǒng)計學(xué)之9抽樣推斷不等比例抽樣

根據(jù)各組中標(biāo)志變異的大小確定適當(dāng)?shù)某闃訑?shù)目,差異程度大的組多抽一些單位,差異程度小的組少抽一些單位。則統(tǒng)計學(xué)之9抽樣推斷例:某鄉(xiāng)全部糧食耕地5000畝,按平原和山區(qū)分類抽取630畝,計算各組平均畝產(chǎn)和標(biāo)準(zhǔn)差i

如下表。求抽樣平均誤差。統(tǒng)計學(xué)之9抽樣推斷解:統(tǒng)計學(xué)之9抽樣推斷三、等距抽樣(機械抽樣、系統(tǒng)抽樣)等距抽樣:是先將總體單位按某一標(biāo)志排隊,計算出抽樣間隔,并在第一個抽樣間隔內(nèi)確定一個抽樣起點,再按固定的順序和相同的間隔來抽取樣本單位進行觀察的一種抽樣方法。統(tǒng)計學(xué)之9抽樣推斷系統(tǒng)抽樣的具體做法如下:從N中抽取n個樣本單位,可先排隊,算出間隔距離k=N/n,現(xiàn)從第一至k個單位中確定抽樣起點(即第一個樣本單位),之后,每隔k個單位抽取一個樣本單位。(圖示如下:)iNkkki+ki+2ki+(n-1)kkk統(tǒng)計學(xué)之9抽樣推斷機械抽樣的優(yōu)點:能提高樣本單位分布的均勻性,樣本代表性較強。其要小于簡單隨機抽樣時的。樣本單位的抽取工作也比較容易開展。統(tǒng)計學(xué)之9抽樣推斷無關(guān)標(biāo)志排隊:——等距抽樣據(jù)以排隊的標(biāo)志與調(diào)查內(nèi)容沒有直接關(guān)系。其是按簡單隨機抽樣的公式近似計算的。因為無關(guān)標(biāo)志排隊的結(jié)果,從所要調(diào)查的標(biāo)志來看,總體單位的排列順序?qū)嶋H上仍是隨機的。所以,其抽樣起點i可以隨機確定,即可以是第一個抽樣距離內(nèi)的任一個總體單位:1?i?k,這樣得到的樣本完全遵循了隨機原則,不會產(chǎn)生系統(tǒng)偏差。而且抽樣效果十分接近簡單隨機。統(tǒng)計學(xué)之9抽樣推斷有關(guān)標(biāo)志排隊指據(jù)以排隊的標(biāo)志與調(diào)查內(nèi)容有密切關(guān)系。由于其排隊標(biāo)志與調(diào)查內(nèi)容有密切關(guān)系,排隊后,從所要調(diào)查的變量來看,總體單位也大致呈順序排列。所以其抽樣起點一般不宜隨機確定。否則,若在第一個抽樣間隔內(nèi)隨機地抽取一個標(biāo)志值較小(或較大)的單位作為抽樣起點,整個樣本勢必出現(xiàn)偏低(或偏高)的系統(tǒng)偏差。統(tǒng)計學(xué)之9抽樣推斷半距起點等距抽樣(中心系統(tǒng)抽樣)——以第一個抽樣間隔內(nèi)的中點為抽樣起點,并每隔k個單位抽一個單位。優(yōu)點:樣本代表性高。不足點:限制了抽樣的隨機性。統(tǒng)計學(xué)之9抽樣推斷對稱等距抽樣——在第一個抽樣間隔內(nèi)隨機地確定抽樣起點(1?i?k)

。然后以組界[k、2k、3k、…(n-1)k]為對稱點兩邊對稱地抽取樣本單位。如下圖所示:依次抽取的樣本單位序號分別為i、2k+i、2k-i、4k+i、、4k-i、6i+i、6k-i、…iNk(n-1)k2k3knk2K-i2K+i統(tǒng)計學(xué)之9抽樣推斷有關(guān)標(biāo)志排隊等距抽樣的計算:有關(guān)標(biāo)志排隊等距抽樣相當(dāng)于分層較多(將總體分為同等大小的n個層),而每層只抽取一個調(diào)查單位的特殊分層抽樣,所以其抽樣效果類似于分層抽樣,其一般按分層抽樣的抽樣平均誤差公式來近似計算。統(tǒng)計學(xué)之9抽樣推斷注意:等距抽樣需要有總體的輔助信息,以便于進行單位的排序;等距抽樣要避免抽樣間隔和現(xiàn)象本身的周期、節(jié)奏重合而引起的系統(tǒng)性偏差。工業(yè)產(chǎn)品質(zhì)量檢查時,抽樣時間間隔不宜與上下班或交接班時間一致。例如:統(tǒng)計學(xué)之9抽樣推斷四、整群抽樣(集團抽樣)整群抽樣:是將總體全部單位分為若干部分(每一部分稱為一個群體,簡稱群),然后以群為單位,按隨機原則從中抽取若干個群構(gòu)成樣本,對中選群內(nèi)的所有單位進行全面調(diào)查的抽樣方法。統(tǒng)計學(xué)之9抽樣推斷整群抽樣的特點:整群抽樣直接抽取的不是總體中的個體而是“群”,因此總體和樣本是由“群”組成的??傮w中的每一群所包含的單位數(shù)有每一群的單位數(shù)相等和不盡相等兩種情況。影響抽樣誤差的方差是群間方差,群內(nèi)方差不影響抽樣誤差。整群抽樣是不重復(fù)抽樣,應(yīng)該用不重復(fù)抽樣公式計算抽樣平均誤差。

統(tǒng)計學(xué)之9抽樣推斷整群抽樣的優(yōu)點:由于是對中選群的全面調(diào)查,抽樣單位比較集中,所以整群抽樣能大大降低數(shù)據(jù)收集的費用;當(dāng)總體中個體自然聚合成群(例如:住戶、學(xué)校)時,整群抽樣組織更加方便;如果對于調(diào)查變量而言,群內(nèi)單元差異較大,而不同群的差異較小,整群抽樣比簡單隨機抽樣的效率更高(例如為估計性別比采用按戶的整群抽樣)。統(tǒng)計學(xué)之9抽樣推斷整群抽樣的缺點:對調(diào)查變量,若群內(nèi)個體有趨同性,則整群抽樣的抽樣效率比簡單隨機抽樣低,(這正是通常遇到的情況),但對此項效率的損失可通過增加群的抽取個數(shù)來彌補;通常無法提前控制總樣本量,因為在進行調(diào)查前,我們通常不知道一個群內(nèi)到底有多少個個體;抽樣誤差的計算可能比簡單隨機抽樣更為復(fù)雜。統(tǒng)計學(xué)之9抽樣推斷整群抽樣的取決于2的大小整群抽樣對中選群進行全面調(diào)查,其樣本代表性取決于抽中群體對全部群體的代表性。假設(shè)各群體之間沒有差異(即各群體的內(nèi)部結(jié)構(gòu)完全相同),則抽樣誤差為0。可見,整群抽樣的取決于群間差異程度的大小,而不受群體內(nèi)部差異程度的影響。整群抽樣的原則是:使群間方差盡可能小,群內(nèi)方差盡可能大。統(tǒng)計學(xué)之9抽樣推斷整群抽樣的計算:總體未知時可用樣本指標(biāo)替代。其中:統(tǒng)計學(xué)之9抽樣推斷例:某市保險公司要調(diào)查居民家庭財產(chǎn)情況。該保險公司調(diào)查組把該市的街道作為群,全市共100個街道,共100群。隨機抽選了18個街道(18群)進行了調(diào)查。調(diào)查結(jié)果樣本平均數(shù)(樣本中居民平均家庭財產(chǎn)數(shù))為40000元,樣本群間方差為(5100元)2。試以95.45%的置信度估計全市平均家庭財產(chǎn)數(shù)。統(tǒng)計學(xué)之9抽樣推斷解:已知:,R=100,r=18,t=2則:置信區(qū)間:統(tǒng)計學(xué)之9抽樣推斷五、多階段抽樣(多級抽樣)多階段抽樣:它是先從總體中抽取一級單位,再從一級單位中抽取二級單位……如此下去,最后才抽取所要調(diào)查的基本單位的一種抽樣形式。統(tǒng)計學(xué)之9抽樣推斷優(yōu)點:是比整群抽樣靈活,在樣本容量相同的條件下,多階段抽樣的樣本單位在總體中的散布比整群抽樣均勻。此外,它還可以利用現(xiàn)成的行政區(qū)劃組織系統(tǒng)作為劃分各階段的依據(jù)。缺點:調(diào)查結(jié)果的精確性不太高,計算、分析比較復(fù)雜。統(tǒng)計學(xué)之9抽樣推斷以兩階段抽樣為例兩階段抽樣在組織技術(shù)上是整群抽樣和類型抽樣的綜合。先將總體分為R群,每群包含Mi個單位,假定N=M1+M2+M3+

+MR=RM

,n1=m1+m2+m3+

+mro=rm。在每個階段都是隨機抽取樣本,都會產(chǎn)生隨機誤差,因此計算時要綜合兩階段的誤差。統(tǒng)計學(xué)之9抽樣推斷以xij表示第i樣本群第j個樣本單位的標(biāo)志值:第一階段抽樣平均數(shù)的方差為:第二階段抽樣平均數(shù)的方差為:統(tǒng)計學(xué)之9抽樣推斷兩階段抽樣平均誤差為:或者統(tǒng)計學(xué)之9抽樣推斷統(tǒng)計學(xué)之9抽樣推斷第五節(jié)必要抽樣數(shù)目的確定必要抽樣數(shù)目:是指為了完成抽樣調(diào)查任務(wù),滿足抽樣調(diào)查的各項要求,也就是為了保證抽樣推斷能達到預(yù)期的可靠程度和精確度的要求,而科學(xué)計算的需要抽取的樣本單位數(shù)。即樣本單位數(shù)“n”的具體數(shù)值,也叫樣本容量。

統(tǒng)計學(xué)之9抽樣推斷一、影響必要抽樣數(shù)目的因素總體各單位間的標(biāo)志變異程度極限抽樣誤差的大小調(diào)查結(jié)果的概率保證程度抽樣方法和抽樣的組織形式。二、必要抽樣數(shù)目的計算統(tǒng)計學(xué)之9抽樣推斷抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣(一)簡單隨機抽樣方式下的n統(tǒng)計學(xué)之9抽樣推斷【例】1:某市對職工收入抽樣調(diào)查,已知職工平均每人每月收入的標(biāo)準(zhǔn)差為220元,要求把握度為95.45%,允許誤差為15元,則需抽查人數(shù)為:統(tǒng)計學(xué)之9抽樣推斷【例】2:調(diào)查一批帳單的差錯率。根據(jù)以往的資料,差錯率曾有過1%,3%,5%三種情況。現(xiàn)在要求把握度為95%,允許誤差為1%,則需抽查的帳單數(shù)為:統(tǒng)計學(xué)之9抽樣推斷抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣(二)類型抽樣方式下的n統(tǒng)計學(xué)之9抽樣推斷(三)等距抽樣方式下的n

等距抽樣一般都采用不重復(fù)抽樣的方式,按無關(guān)標(biāo)志排隊的抽樣,用簡單隨機不重復(fù)抽樣公式確定樣本容量;按有關(guān)標(biāo)志排序的抽樣,用類型不重復(fù)抽樣公式確定樣本容量(公式從略)。統(tǒng)計學(xué)之9抽樣推斷(四)整群抽樣方式下的n

整群抽樣一般采用不重復(fù)抽樣,它的必要抽樣數(shù)目的計算公式和簡單隨機抽樣的計算公式從結(jié)構(gòu)上講基本上是一致的。其不同之處有兩個方面:一是標(biāo)志變異指標(biāo)不同。簡單隨機條件下必要抽樣數(shù)目計算公式中的標(biāo)志變異指標(biāo)是總體方差。而整群抽樣條件下的計算公式是群間方差。二是采用的單位數(shù)目不同。簡單隨機抽樣公式中總體單位數(shù)和樣本單位數(shù)分別用N、n表示。而整群抽樣公式中總體群數(shù)和抽樣群數(shù)分別用R、r表示。其計算公式為:統(tǒng)計學(xué)之9抽樣推斷整群抽樣要計算必要抽取的群數(shù)r統(tǒng)計學(xué)之9抽樣推斷三、確定n應(yīng)該注意的問題必要抽樣數(shù)目應(yīng)大于30。實際調(diào)查時可對計算的必要抽樣數(shù)目進行調(diào)整當(dāng)總體單位數(shù)不大時,如果采用不重復(fù)抽樣的方法抽取樣本,必須應(yīng)用不重復(fù)抽樣的計算公式計算必要抽樣數(shù)目;當(dāng)總體單位數(shù)很大時,雖然采用不重復(fù)抽樣方法,亦可采用重復(fù)抽樣的計算公式計算必要抽樣數(shù)目。統(tǒng)計學(xué)之9抽樣推斷當(dāng)抽樣調(diào)查是為了檢驗全面統(tǒng)計數(shù)字的質(zhì)量時,全及總體的標(biāo)志變異指標(biāo)或p(1–p)是有實際資料的,可以直接代入公式計算必要抽樣數(shù)目。如有幾個方差可以選用時,宜選擇最大數(shù)值。一個總體往往同時計算抽樣平均數(shù)和抽樣成數(shù)。由于它們的方差和允許誤差范圍不同,因此,需要的必要抽樣數(shù)目也不相同。為了防止由于樣本單位數(shù)不足而擴大抽樣誤差,在實際工作中往往根據(jù)比較大的必要抽樣數(shù)目進行抽樣,以滿足共同的需要。統(tǒng)計學(xué)之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論