第6章抽樣推斷88821373課件_第1頁
第6章抽樣推斷88821373課件_第2頁
第6章抽樣推斷88821373課件_第3頁
第6章抽樣推斷88821373課件_第4頁
第6章抽樣推斷88821373課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章抽樣推斷抽樣推斷的基本概念抽樣誤差抽樣推斷的方法

抽樣的組織形式

7/22/202316.1抽樣推斷的基本概念抽樣推斷,從其內(nèi)涵來說,包括抽樣調(diào)查和抽樣推斷兩部分,前者著重調(diào)查,后者著重推斷。抽樣推斷是在抽樣調(diào)查的基礎(chǔ)上利用樣本的實(shí)際資料計(jì)算出的樣本數(shù)據(jù),并運(yùn)用概率估計(jì)方法,推算總體相應(yīng)的數(shù)量指標(biāo)的一種統(tǒng)計(jì)分析方法。7/22/20232抽樣推斷具有如下幾個(gè)特點(diǎn)抽樣推斷是由部分推算整體的一種認(rèn)識方法。

抽樣推斷是建立在隨機(jī)取樣的基礎(chǔ)上。抽樣推斷是運(yùn)用概率估計(jì)的方法,利用樣本指標(biāo)來估計(jì)總體參數(shù)。抽樣推斷的誤差是可以事先控制的,用樣本指標(biāo)值推斷總體指標(biāo)值是存在一定誤差的。

7/22/20233抽樣推斷的作用應(yīng)用于某些不可能作全面調(diào)查或很難作全面調(diào)查的場合。在可以使用全面調(diào)查的場合,抽樣調(diào)查仍有其獨(dú)特的作用。用于假設(shè)檢驗(yàn)。7/22/202346.1.1總體和樣本1.總體(population)也稱全及總體,是指所研究現(xiàn)象的整體,即包括所要調(diào)查的所有單位。例如,從1000名學(xué)生中,抽取50名學(xué)生進(jìn)行抽樣調(diào)查,以計(jì)算學(xué)生的平均體重。這1000名學(xué)生是全及總體,一般用英文大寫字母N來表示總體的單位數(shù),取N=1000人。全及總體按其各單位性質(zhì)的不同,可以分為變量總體和屬性總體兩類。對于一個(gè)總體來說,若被研究的單位標(biāo)志屬于品質(zhì)標(biāo)志,則該總體為屬性總體,若被研究的單位標(biāo)志屬于數(shù)量標(biāo)志,則該總體為變量總體。7/22/202352.樣本(sample)又稱子樣,它是從全及總體中隨機(jī)抽取出來,作為代表這一總體的那部分單位組成的集合體。樣本的單位數(shù)是有限的,相對來說,它的數(shù)目比較小,一般用英文小寫字字母n來表示樣本的單位數(shù)。如上例n=50人。作為推斷對象的總體是確定的,而且是唯一的。但作為觀察對象的樣本就不是這樣。從一個(gè)總體可以抽取很多個(gè)樣本,每次可能抽到哪個(gè)樣本不是確定的。也不是唯一的,而是可變的。

7/22/202366.1.2參數(shù)和統(tǒng)計(jì)量

1.參數(shù)(parameter)。根據(jù)總體各單位的標(biāo)志值或標(biāo)志屬性計(jì)算的,反映總體數(shù)量特征的綜合指標(biāo)稱為全及指標(biāo)。全及指標(biāo)是總體變量的函數(shù),其數(shù)值是由總體各單位的標(biāo)志值決定的。由于總體是唯一確定的,因此,全及指標(biāo)也是唯一確定的,所以也稱參數(shù)。常用的參數(shù)有總體平均數(shù),總體成數(shù)、總體方差和總體標(biāo)準(zhǔn)差。

7/22/20237(1)總體平均數(shù)Populationmean

對于變量總體,由于各單位的標(biāo)志可以用數(shù)量表示,因此可以計(jì)算總體平均數(shù),通常用表示。

設(shè)X為總體的某一變量,其N項(xiàng)變量值為X1、X2、…Xn,則總體平均數(shù)為:7/22/20238(2)總體成數(shù)

Proportion對于屬性總體,由于各單位標(biāo)志不能用數(shù)量表示,因此總體參數(shù)常以成數(shù)或比重來表示。通常以P表示總體中具有某種標(biāo)志表現(xiàn)即“是”的單位數(shù)在總體單位數(shù)中所占的比重;以Q表示不具有某種標(biāo)志表現(xiàn)即“非”的單位數(shù)所占的比重。設(shè)總體N個(gè)單位中,有N1個(gè)單位具有某種標(biāo)志表現(xiàn),N0個(gè)單位不具有某種標(biāo)志表現(xiàn),且N=N1+N0,則總體成數(shù)為:7/22/20239【實(shí)例6.1】紅光燈泡廠生產(chǎn)的10000只燈泡中,有9550只是合格品,有450只是不合格產(chǎn)品,則總體成數(shù)即燈泡的合格率和不合格率分別為:

需要指出,統(tǒng)計(jì)上把只表現(xiàn)為“是”與“非”的標(biāo)志稱為是非標(biāo)志,也稱交替標(biāo)志,如性別標(biāo)志等。

7/22/202310(3)總體方差和總體標(biāo)準(zhǔn)差Variance&standarddeviation就變量總體而言,其總體方差和標(biāo)準(zhǔn)差計(jì)算公式分別為:

在屬性總體條件下,則可以把“是”與“非”兩種標(biāo)志表現(xiàn)進(jìn)行量化處理,用“1”表示“是”,即具有某種標(biāo)志表現(xiàn),用“0”表示“非”,即不具有某種標(biāo)志表現(xiàn),那么“是”的成數(shù)就可視為是非標(biāo)志的平均數(shù),從而計(jì)算出屬性總體的方差和標(biāo)準(zhǔn)差,即

=(1-P)2P+(0-P)2Q=Q2P+P2Q=PQ(P+Q)=PQ=P(1-P)

7/22/2023112.統(tǒng)計(jì)量(statistic)

。根據(jù)樣本各單位標(biāo)志值計(jì)算的反映樣本特征的指標(biāo)稱為統(tǒng)計(jì)量,也稱作樣本指標(biāo)samplestatistic。它是用來估計(jì)總體參數(shù)的。與總體參數(shù)相對應(yīng),統(tǒng)計(jì)量主要有樣本平均數(shù)表示樣本內(nèi)各單位某一標(biāo)志值的一般水平樣本方差,反映樣本中各單位標(biāo)志值的離散程度,從而可說明樣本平均數(shù)的代表性大小,記作S2,稱S為樣本標(biāo)準(zhǔn)差或均方差樣本成數(shù),指具有某種性質(zhì)的單位在樣本中所占比重(如抽樣產(chǎn)品的合格率),記作p;樣本成數(shù)的方差是p(1-p)7/22/202312(1)樣本平均數(shù)

Samplemean(2)樣本成數(shù)(3)樣本方差和樣本標(biāo)準(zhǔn)差

Samplevariance7/22/202313樣本是非標(biāo)志的方差S2和標(biāo)準(zhǔn)差S的計(jì)算公式分別為7/22/2023146.1.3樣本容量和樣本個(gè)數(shù)是兩個(gè)有聯(lián)系但又完全不同的概念。

樣本容量是指一個(gè)樣本所包含位數(shù)樣本個(gè)數(shù)又稱樣本可能數(shù)目。是指從一個(gè)總體上可能抽取的樣本個(gè)數(shù)。7/22/2023156.1.4重復(fù)抽樣和不重復(fù)抽樣

重復(fù)抽樣又叫重置samplingwithreplacement抽樣,也叫做有放回的抽樣或重置抽樣不重復(fù)抽樣又叫不重置samplingwithoutreplacement也叫做無放回抽樣或非重置抽樣樣本可能數(shù)目樣本可能數(shù)目7/22/2023166.2抽樣誤差6.2.1抽樣誤差的概念

抽樣誤差(samplingerror)是指由于隨機(jī)抽樣的偶然因素使各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)和全及指標(biāo)之間的絕對離差。Samplingerroristhedifferencebetweenasamplestatisticanditscorrespondingpopulationparameterandisduepurelytochance.是一種由于隨機(jī)抽樣引起的偶然的代表性誤差,或隨機(jī)誤差randomerror\chanceerror。抽樣誤差不可消除,但可以計(jì)算和控制。7/22/202317抽樣調(diào)查中誤差有以下兩個(gè)來源

一個(gè)是登記性誤差。也叫調(diào)查誤差datarecordingerror,是指在調(diào)查登記過程中發(fā)生的誤差,這類誤差是可以避免的。二是代表性誤差representativeerror,在抽樣調(diào)查中,是指由于用抽樣指標(biāo)去代替總體指標(biāo)時(shí)所產(chǎn)生的誤差。代表性誤差的發(fā)生的兩種情況:第一,非隨機(jī)的代表性誤差;第二,隨機(jī)性誤差。7/22/202318DubiousSampling:TheLiteraryDigestCaseAclassiccaseofbothselectionbiasandnonresponsebiasoccurredin1936.TheLiteraryDigestmagazine,whichhadcorrectlypredictedthewinnerineveryU.S.presidentialelectionsince1916,predictedconfidentlyacomfortablevictoryforAlfredM.Landon,theRepublicancandidate,overFranklinD.Roosevelt,theDemocraticcandidate,byamarginof57to43.YetRooseveltwonbyalandslideneverbeforeseeninU.S.history,receiving62percentofthevotescast.Whathadgonewrong?7/22/202319First,therewasselectionbias.TheDigestmailedquestionnairesto10millionpeoplewhosenameshadbeentakenfromvariouslistssuchasitsownsubscribers,telephonedirectories,andautomobile-registrationrolls.DuringtheGreatDepression,higher-incomepeopletypicallyvotedRepublican,andthesepeoplewerewellrepresentedintheDigest’ssample.Ontheotherhand,lower-incomepeople,whoheavilyfavoredtheDemocrats,wereunderrepresentedbecausealowerpercentagecouldaffordmagazinesubscriptions,telephones,andautomobiles.7/22/202320Second,therewasnonresponsebias.Only2.4millionofthel0millionquestionnairesweremailedback.Althoughthismadethesurveythelargestsampleevertaken,moreeducatedpeoplearemorelikelytorespondtomailquestionnairesthanlesseducatedones.Theformer,again,tendedtofavorRepublicans;thelatter,theDemocrats.Thus,amuchlargerpercentageofthenonrespondentsthanoftherespondentswereforRoosevelt.Thisbiasreinforcedtheselectionbias.7/22/202321Note:TheDigestneversurvivedthedebacleandfoldedshortlythereafter.Atthesametime,GeorgeGallupwassettinguphissurveyorganization,andhecorrectlyforecasttheRooseveltVictoryfromameresampleof50,000people.Yetin1948,usinganotherdubiousprocedure(aformofjudgmentsampling,calledquotasampling),Gallup'sorganization(alongwithCrossley'sandRoper's)incorrectlypredictedthevictoryofThomasDeweyoverHarrySTruman.7/22/2023226.2.2抽樣平均誤差standarderror

是根據(jù)隨機(jī)原則抽樣時(shí),所有可能出現(xiàn)的樣本平均數(shù)的標(biāo)準(zhǔn)差。它反映樣本平均數(shù)(樣本成數(shù))與總體平均數(shù)(總體成數(shù))的平均誤差程度,常用μ表示。Thestandarderrorofthesamplemeanisthestandarddeviationofthesamplingdistributionofsamplemeans.7/22/2023231.抽樣平均數(shù)的平均誤差(1)重復(fù)抽樣的抽樣平均誤差計(jì)算公式

但是,σ是全及總體標(biāo)準(zhǔn)差,這是不知道的。如果知道,就無需進(jìn)行抽樣調(diào)查了。在這種情況下可用樣本的方差s2來代替。其計(jì)算公式如下7/22/202324(2)不重復(fù)抽樣的抽樣平均誤差計(jì)算公式當(dāng)全及總體單位數(shù)N很大時(shí),N-1接近于N,即可用N代替,則上列公式可簡化如下

7/22/202325【實(shí)例6.5】從某學(xué)院2011級的2000名學(xué)生中,按簡單隨機(jī)抽樣方式抽取40名學(xué)生,對公共理論課的考試成績進(jìn)行檢查,得知其平均成績?yōu)?8.75分,標(biāo)準(zhǔn)差為12.13分,試根據(jù)重復(fù)抽樣和不重復(fù)抽樣的方法分別計(jì)算抽樣平均誤差。(1)按重復(fù)抽樣計(jì)算抽樣平均誤差

(2)按不重復(fù)抽樣計(jì)算抽樣平均誤差7/22/2023262.抽樣成數(shù)的抽樣平均誤差

(1)重復(fù)抽樣的抽樣平均誤差計(jì)算公式(2)不重復(fù)抽樣的抽樣平均誤差計(jì)算公式以上兩個(gè)公式中的P,是總體成數(shù),這是不知道的。而P(1-P)是總體方差,它等于,即也是不知道的。在這種情況下,可用樣本的成數(shù)P和樣本方差P(1-P)來代替,或者用過去類似調(diào)查的成數(shù)和成數(shù)方差來代替。成數(shù)方差的最大值為7/22/202327【實(shí)例6.6】從40000件產(chǎn)品中,隨機(jī)抽取200件進(jìn)行檢驗(yàn),結(jié)果有10件不合格,求合格率的抽樣平均誤差。(1)按重復(fù)抽樣計(jì)算抽樣平均誤差

(2)按不重復(fù)抽樣計(jì)算抽樣平均誤差

7/22/2023286.2.3抽樣極限誤差1.抽樣極限誤差的概念

抽樣極限誤差又稱抽樣允許誤差,是指樣本指標(biāo)與總體指標(biāo)之間產(chǎn)生抽樣誤差被允許的最大可能范圍,它是根據(jù)所研究對象的變異程度和分析任務(wù)的要求來確定的可允許的誤差范圍,凡是在這個(gè)范圍內(nèi)的數(shù)字都算有效,統(tǒng)計(jì)上把這種可允許的誤差范圍稱為抽樣極限誤差。根據(jù)樣本指標(biāo)估計(jì)總體指標(biāo)必會產(chǎn)生誤差,但誤差不能太大,以免使抽樣估計(jì)失去意義;但誤差也不是愈小愈好,因?yàn)檫@樣就要增加樣本單位數(shù),必然提高很多費(fèi)用,所以要確定一個(gè)誤差范圍。

7/22/202329抽樣極限誤差通常用樣本指標(biāo)可允許變動的上限或下限與總體指標(biāo)的絕對離差表示。設(shè)和分別表示抽樣平均數(shù)和抽樣成數(shù)的抽樣極限誤差,則有上式可變換為下列不等式

上式表明總體平均數(shù)

是以抽樣平均數(shù)為中心,在的范圍內(nèi)變動。總體成數(shù)P也是如此,這個(gè)變動范圍被稱為估計(jì)區(qū)間。7/22/2023302.抽樣誤差的概率度

基于概率估計(jì)的要求,抽樣極限誤差通常需要以抽樣平均誤差或?yàn)闃?biāo)準(zhǔn)單位來衡量。把極限誤差或分別除以或,得相對數(shù)t,它表示誤差范圍為抽樣平均誤差的若干倍,t是測量估計(jì)可靠程度的一個(gè)參數(shù),稱為抽樣平均誤差的概率度。7/22/2023316.3抽樣推斷的方法抽樣估計(jì)是指利用實(shí)際調(diào)查計(jì)算的樣本指標(biāo)值來估計(jì)相應(yīng)的總體指標(biāo)的數(shù)值。由于總體指標(biāo)是表明總體數(shù)量特征的參數(shù),所以也稱為參數(shù)估計(jì)??傮w參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種1.點(diǎn)估計(jì)。點(diǎn)估計(jì)(pointestimation)的基本特點(diǎn)是,根據(jù)總體指標(biāo)的結(jié)構(gòu)形式設(shè)計(jì)樣本指標(biāo)作為總體參數(shù)的估計(jì)量,并以樣本指標(biāo)的實(shí)際值作為相應(yīng)總體參數(shù)的估計(jì)值(例如以樣本平均數(shù)的實(shí)際值作為相應(yīng)總體平均數(shù)的估計(jì)值,以樣本成數(shù)的實(shí)際值作為相應(yīng)總體成數(shù)的估計(jì)值等)。7/22/202332Whentheestimationofapopulationisexpressedasasinglenumericalvalue,itisreferredtoasapointestimation.7/22/202333常用概率度與概率保證度表概率度t概率F(t)(%)1.002.003.001.641.962.5868.2795.4599.7390.0095.0099.007/22/202334抽樣估計(jì)的優(yōu)劣標(biāo)準(zhǔn)無偏性unbiasedness有效性efficiency一致性consistency7/22/202335無偏性

unbiasedness抽樣指標(biāo)的平均數(shù)等于全及指標(biāo)。即:抽樣指標(biāo)的估計(jì),平均說來是沒有誤差的。7/22/202336有效性

efficiency作為優(yōu)良估計(jì)量的方差應(yīng)比其它估計(jì)量的方差小。即:方差最小原則。7/22/202337一致性

consistency當(dāng)樣本容量充分大時(shí),抽樣指標(biāo)也充分地靠近全及指標(biāo)。即:n→N時(shí),△→07/22/2023382.區(qū)間估計(jì)區(qū)間估計(jì)(intervalestimation)是在一定的概率把握程度下,根據(jù)樣本指標(biāo)和抽樣極限誤差去估計(jì)總體指標(biāo)所在可能范圍的方法。在總體指標(biāo)的區(qū)間估計(jì)公式中,有兩個(gè)要素,一個(gè)是置信區(qū)間,另一個(gè)是置信概率。7/22/202339置信區(qū)間(confidenceinterval)又稱為估計(jì)區(qū)間,是指由低限到高限兩個(gè)數(shù)值所構(gòu)成的可能范圍,由樣本指標(biāo)和極限誤差組成。

置信概率(confidenceprobability)是指區(qū)間估計(jì)的概率保證程度,也稱為置信度。它是表明樣本指標(biāo)與總體指標(biāo)的誤差不超過一定范圍的概率有多大

估計(jì)的準(zhǔn)確性問題

估計(jì)的可靠性問題

7/22/202340置信區(qū)間7/22/202341總體平均數(shù)的估計(jì)就是用抽樣平均數(shù)來估計(jì)總體平均數(shù)

【實(shí)例】某學(xué)校進(jìn)行一次英語測驗(yàn),為了解學(xué)生的考試情況,隨機(jī)抽選部分學(xué)生進(jìn)行調(diào)查,所得資料如下:

考試成績(分)學(xué)生人數(shù)(人)60以下1060-702070-802280-904090以上8按重復(fù)抽樣方法以95.45%概率估計(jì)該校學(xué)生英語平均成績的范圍。

下限=

=74.32分上限==78.88分

所以,在95.45%的概率保證程度下,該校學(xué)生英語考試的平均成績的范圍在74.32-78.88分之間。7/22/202342總體成數(shù)的估計(jì)就是用抽樣成數(shù)來估計(jì)總體成數(shù)

仍按上例資料,以同樣的概率估計(jì)該校學(xué)生成績在80分以上的學(xué)生所占的比重的范圍。

解:樣本合格率為

抽樣平均誤差為:抽樣極限誤差為:所以,在95.45%的概率保證程度下,該校學(xué)生成績在80分以上的學(xué)生所占的比重的范圍在38.01%-57.99%之間。

7/22/2023436.3.2樣本容量的確定

1.確定必要樣本容量的意義樣本單位數(shù)越多,樣本的代表性越大,抽樣誤差越小,抽樣估計(jì)就越可靠。但樣本容量過多會增加不必要的人力、物力和費(fèi)用開支,造成浪費(fèi)。樣本容量減少,又會使抽樣誤差增大,達(dá)不到所需要的準(zhǔn)確程度。

基本原則是,在保證預(yù)期的抽樣估計(jì)可靠程度的要求下,抽取的樣本單位數(shù)不宜過多。7/22/2023442.影響樣本容量的因素

(1)總體各單位標(biāo)志變異程度??傮w標(biāo)志變異程度大,要求樣本容量大些;反之,總體標(biāo)志變異程度小,樣本容量可以小些。(2)抽樣方法。在其他條件相同的情況下,重復(fù)抽樣要比不重復(fù)抽樣多抽取一些樣本單位。(3)抽樣組織形式。一般來說,類型抽樣和等距抽樣的樣本容量要小于簡單隨機(jī)抽樣的樣本容量。(4)極限誤差的大小。如果允許誤差大,樣本容量就小;反之,如果允許誤差小,樣本容量就大。(5)抽樣估計(jì)的可靠程度即概率F(t)的大小。如果估計(jì)的可靠程度要求越高即F(t)越大,樣本容量就越多;反之,如果估計(jì)的可靠程度要求越低,即F(t)越小,樣本容量就越少。

7/22/2023453.必要樣本容量的計(jì)算公式(1)平均數(shù)的必要樣本容量的計(jì)算公式在重復(fù)抽樣的條件下為:在不重復(fù)抽樣的條件下為:7/22/202346(2)成數(shù)的必要樣本容量的計(jì)算公式在重復(fù)抽樣的條件下為:在不重復(fù)抽樣的條件下為:

7/22/202347【實(shí)例】對某罐頭廠生產(chǎn)的罐頭質(zhì)量進(jìn)行抽樣調(diào)查,抽樣極限誤差為5%,概率為0.9545,并知過去進(jìn)行同樣抽樣調(diào)查,其不合格率為10%,試求必要的樣本容量。根據(jù)題意可知:t=2、P=90%、=5%在重復(fù)抽樣的條件下:(盒)7/22/2023484.計(jì)算必要樣本容量應(yīng)注意的問題第一,在實(shí)際中采用不重復(fù)抽樣。但常用重復(fù)抽樣下的公式近似代替。第二,若σ2,P未知,其處理方式是:①用過去(近期)的數(shù)據(jù)代替;②用樣本數(shù)據(jù)代替;③取P=0.5或最接近0.5的P值。第三,對同一總體,若求出的nx、np不等,這時(shí)取較大的一個(gè)作為必要抽樣數(shù)目,以同時(shí)滿足作兩種調(diào)查的需要。第四,在實(shí)際工作中,常使用重復(fù)抽樣下的簡單隨機(jī)抽樣公式。7/22/2023496.3.3抽樣的組織形式

抽樣的基本組織形式可分為簡單隨機(jī)抽樣(純隨機(jī)抽樣)、類型抽樣、機(jī)械抽樣、整群抽樣等幾種。7/22/2023501簡單隨機(jī)抽樣

simplerandomsampling又稱純隨機(jī)抽樣。它是按隨機(jī)原則直接從總體N個(gè)單位中抽取n個(gè)單位作為樣本。不論是重復(fù)抽樣或不重復(fù)抽樣,都要保證每個(gè)單位在抽選中都有相等的中選機(jī)會。是一種最簡單而又最基本的抽樣組織形式,它往往帶有盲目性,因此多用于對總體的初期研究。7/22/202351簡單隨機(jī)抽樣中抽選樣本的常用方法有三種

第一種是直接抽取法第二種是抽簽摸球法第三種是利用隨機(jī)數(shù)表法7/22/202352The1970DraftLotteryFiascoDuringbothWorldWarsIandII,itbecamenecessarytoestablishanorderinwhichmenweretobedraftedintotheU.S.military,In1917,accordingly,10,500blackcapsules,containingnumberspreviouslyassignedtoeligiblemen,weredrawnfromaglassfish-bowl.Inl940,asimilarprocedurewasadoptedtodraw9,000numbers,buttherewerecriticisms:Thesmall,woodenpaddle(WhichwasmadefromapieceofraftertraceabletoIndependenceHallinPhiladelphia)usedtostirthecapsulesinthebowlwouldnotreachdeepenoughintothebow.7/22/202353Italsobrokeopensomeofthecapsules,impedingthemixingprocessfurther.Intheend,thenumbersdrawnlookedlikeanythingbutrandomones;theywereconcentratedincertainclustersofhundreds,apparentlyreflectingthefactthatthenumbershadbeenpouredintothebowlinlotsof100each.Thelessonwasclear:thoroughphysicalmixingofcapsulesinabowlisdifficult.7/22/202354Apparentlythelessonhadbeenforgottenwhenthel970draftlotterywasinstituted.Some366capsules,containingallthepossiblebirthdatesinayear,werepouredintoabowlbutnotstirred.(Therehadbeensomemixingduringtheprocessofinsertingdatedslipsofpaperintothecapsules).Thencapsulesweredrawnout,theorderoftheirwithdrawaldeterminingtheprioritiesforthedraft.7/22/202355Theobservedsequencestronglyreflectedtheorderinwhichthecapsuleswerecreated(onemonthatatime),withlate-in-the-yearbirthdays(thatwereencapsulatedlast)beingdrawnfirstandearly-in-the-yearbirthdays(thatwereencapsulatedfirst)beingdrawnlastand,therefore,lesssubjecttothedraft.Severalyoungmenfiledsuitinfederalcourtseekingtohavethe1970lotteryvoidedonthebasisoftheapparentlackofrandomization.Note:A1971draftlottery,inresponsetowidespreadcriticismofthe1970lottery,madeuseofrandom-numberstables.7/22/2023562分層抽樣

又稱類型抽樣。它是先對總體各單位按主要標(biāo)志加以分組,然后再從各組中按隨機(jī)原則抽選一定單位構(gòu)成樣本。stratifiedrandomsampling類型抽樣的方法又分兩種:等比例抽樣和不等比例抽樣。7/22/202357如果按比例分配樣本單位,可以得到類型抽樣誤差公式

1.

在重復(fù)抽樣條件下變量總體:其中是各組方差的加權(quán)平均數(shù),習(xí)慣上稱為平均組內(nèi)方差。屬性總體其中是各組比率的方差加權(quán)平均數(shù),是屬性總體的平均組內(nèi)方差。7/22/2023582.在不重復(fù)抽樣條件下

以上總體參數(shù)、是未知的,習(xí)慣用樣本值、代替7/22/2023593等距抽樣systematicsampling也稱機(jī)械抽樣或系統(tǒng)抽樣。它先按某一標(biāo)志對總體各單位進(jìn)行排隊(duì),然后依一定順序和間隔來抽取樣本單位的一種抽樣組織可分為按無關(guān)標(biāo)志排隊(duì)和按有關(guān)標(biāo)志排隊(duì)兩種按無關(guān)標(biāo)志排隊(duì)指采用的排隊(duì)標(biāo)志與所研究的問題沒有直接關(guān)系或聯(lián)系較少按有關(guān)標(biāo)志排隊(duì)指采用的排隊(duì)標(biāo)志與所研究的問題有直接關(guān)系。7/22/2023604整群抽樣clustersampling又稱聚點(diǎn)抽樣或群體抽樣,它是先將總體劃分為若干群(R群),再從中任意抽取幾群(r群),然后對抽中的群作全面調(diào)查,并據(jù)此結(jié)論對總體加以推斷。整群抽樣尤其適用于存在自然群的場合因?yàn)檎撼闃邮浅扇旱爻檫x樣本,故整群抽樣的誤差較大。由于整群抽樣是成群地抽樣,從而使樣本對總體的代表性會降低。

7/22/202361由于對抽中的群作全面調(diào)查,因此整群抽樣的誤差主要受各群間的差異即群間方差的影響,而群內(nèi)卻不存在抽樣誤差問題。整群抽樣下的平均誤差公式如下:其中,稱為群間方差7/22/202362必要抽樣群數(shù)r的確定公式類同簡單隨機(jī)抽樣中有關(guān)公式。只不過現(xiàn)在確定的是r,并用組內(nèi)方差取代。【實(shí)例】某產(chǎn)品合計(jì)生產(chǎn)3000批,每批產(chǎn)量大致相同,抽樣檢查產(chǎn)品合格品率。要求其允許誤差不超過2%,若根據(jù)過去該產(chǎn)品質(zhì)量資料,其各批群間方差為3%,問在95.45%(t=2)可靠程度下需抽多少批產(chǎn)品為宜?即要在全部產(chǎn)品中抽273批產(chǎn)品檢查

7/22/2023635多階段抽樣multi-stagesampling

是在組織抽樣時(shí),不是從總體中一次直接抽取樣本單位,而是把抽樣過程分成幾個(gè)過渡階段進(jìn)行。到最后才具體抽取樣本單位。它是先抽大單位,再在大單位中抽小單位,在小單位中抽更小單位,直到抽出最終能取得推斷總體的基本單位為止。一般在總體很大,單位分布面積廣時(shí),如從總體中采取一次直接抽取足夠多的樣本很困難時(shí),可采用多階段抽樣。7/22/2023646.4參數(shù)假設(shè)檢驗(yàn)6.4.1假設(shè)檢驗(yàn)的基本概念假設(shè)檢驗(yàn)(Hypothesistesting)是利用樣本的實(shí)際資料來檢驗(yàn)事先對總體某些數(shù)量特征所作的假設(shè)是否可信的一種統(tǒng)計(jì)分析方法。7/22/202365它和參數(shù)估計(jì)一樣,都是利用樣本資料對總體特征進(jìn)行某種推斷。但二者推斷角度不同。參數(shù)估計(jì)是根據(jù)樣本指標(biāo)以一定的把握程度估計(jì)總體參數(shù)取值范圍,更準(zhǔn)確地說,是對總體參數(shù)進(jìn)行了區(qū)間估計(jì);假設(shè)檢驗(yàn)則先對總體參數(shù)值提出一個(gè)假設(shè),然后利用樣本信息,以一定的概率水平去判斷這個(gè)假設(shè)是否成立。7/22/2023666.4.2假設(shè)檢驗(yàn)的步驟一個(gè)完整的假設(shè)檢驗(yàn)過程,通常包括以下四步驟:第一,提出原假設(shè)和備擇假設(shè);第二,選取和計(jì)算檢驗(yàn)統(tǒng)計(jì)量;第三,根據(jù)顯著性水平查臨界值;第四,進(jìn)行比較并做出決策。

7/22/2023676.4.3假設(shè)檢驗(yàn)中的兩類錯誤假設(shè)檢驗(yàn)可能犯兩種類型的錯誤。第一類錯誤(TypeIerror)指的是H0客觀上真實(shí)但被檢驗(yàn)所拒絕,這種錯誤也稱為棄真錯誤。犯這種錯誤的概率就是顯著水平α;第二類錯誤(TypeIIerror)指的是H0客觀上不真實(shí)但被檢驗(yàn)所接受,這種錯誤也稱為納偽錯誤。犯這種錯誤的概率我們用β(讀作“貝塔”)來表示。

7/22/2023686.4.4總體均值和總體成數(shù)檢驗(yàn)1.大樣本情況下總體均值檢驗(yàn)在大樣本(n≥30)情況下,總體均值的假設(shè)檢驗(yàn)可以應(yīng)用正態(tài)分布檢驗(yàn)法。2.小樣本情況下總體均值檢驗(yàn)在小樣本(n<30)情況下,總體均值的假設(shè)檢驗(yàn)可以應(yīng)用t分布檢驗(yàn)法。此時(shí),檢驗(yàn)統(tǒng)計(jì)量為t統(tǒng)計(jì)量,它服從自由度為n-1的t分布。7/22/202369【實(shí)例6.13】某食品公司生產(chǎn)一種罐頭,按標(biāo)準(zhǔn)每罐凈重為227克,根據(jù)以往生產(chǎn)經(jīng)驗(yàn)罐頭重量的標(biāo)準(zhǔn)差為5克?,F(xiàn)隨機(jī)抽查該公司產(chǎn)品100罐,測得平均凈重為228克,判斷這批罐頭是否符合標(biāo)準(zhǔn)?解:第一步提出原假設(shè)和備擇假設(shè)。H0:=227H1:≠227

第二步選取和計(jì)算檢驗(yàn)統(tǒng)計(jì)量。,代入數(shù)值,計(jì)算得Z=3.33

第三步根據(jù)顯著性水平查臨界值。由α=0.05,得臨界值-Z0.025=-1.96,Z0.025=1.96

第四步進(jìn)行比較并做出決策。∵Z=3.33>Z0.025=1.96∴拒絕H0

即這批罐頭不符合標(biāo)準(zhǔn)。7/22/202370【實(shí)例6.14】某輪胎制造商在廣告中聲稱,該公司生產(chǎn)的汽車輪胎在正常行使條件下平均壽命高于28000公里。檢測部門隨機(jī)挑選了40個(gè)輪胎進(jìn)行測試,結(jié)果顯示平均行使里程28200公里,樣本標(biāo)準(zhǔn)差為1000公里,問該制造商廣告是否屬實(shí)?解:第一步提出假設(shè)。這需要確定檢驗(yàn)的方向。題中制造商稱輪胎壽命高于28000公里,表述為>28000,其余集為≤28000,由于等號在原假設(shè)上,故≤28000為原假設(shè)H0,>28000為備擇假設(shè)H1,此為右單側(cè)檢驗(yàn)。第二步計(jì)算統(tǒng)計(jì)量。由于總體標(biāo)準(zhǔn)差s未知,用樣本標(biāo)準(zhǔn)差S替代。Z統(tǒng)計(jì)量為代入數(shù)值,得Z=1.26第三步查臨界值。因?yàn)槭怯覇蝹?cè)檢驗(yàn),α=0.05時(shí)其臨界值Z0.05=1.645第四步比較做決策。∵Z=1.26<Z0.05=1.645∴接受H0∴輪胎平均使用壽命不高于28000公里∴制造商廣告不屬實(shí)。7/22/202371【實(shí)例6.15】某批發(fā)商欲從廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡的平均使用壽命不能低于1000小時(shí)。從產(chǎn)品中隨機(jī)抽取100只燈泡,測得平均壽命為960小時(shí),標(biāo)準(zhǔn)差為200小時(shí),請問批發(fā)商是否應(yīng)該購買這批燈泡?解:第一步提假設(shè)。H0:≥1000H1:<1000

第二步計(jì)算檢驗(yàn)統(tǒng)計(jì)量。采用Z統(tǒng)計(jì)量,代入數(shù)值,計(jì)算得Z=-2

第三步查臨界值。由α=0.05,左單側(cè)檢驗(yàn)得臨界值-Z0.05=-1.645

第四步比較做決策。∵Z=-2<-Z0.05=-1.645∴拒絕H0

即批發(fā)商不應(yīng)當(dāng)購買這批燈泡。7/22/202372【實(shí)例6.16】某食品公司生產(chǎn)袋裝食品,采用自動打包機(jī)打包。每包標(biāo)準(zhǔn)凈重應(yīng)為1000克,每天開工后需要檢驗(yàn)一次打包機(jī)工作是否正?!,F(xiàn)從產(chǎn)品中隨機(jī)抽取9包,實(shí)測每包凈重如下:987,993,1012,1005,997,983,1021,995,1005,給定顯著性水平α=0.05,問該日打包機(jī)工作是否正常?解:由于本題關(guān)心的是每包凈重是否為1000克,因此是雙側(cè)檢驗(yàn)問題。又因?yàn)槭切颖举Y料,故采用t分布檢驗(yàn)法。第一步提假設(shè)。H0:=1000H1:≠1000

第二步計(jì)算檢驗(yàn)統(tǒng)計(jì)量。,樣本平均數(shù)=999.8

樣本標(biāo)準(zhǔn)差S=1.212

代入數(shù)值,計(jì)算得t=-0.495

第三步查臨界值。α=0.05,由于是雙側(cè)檢驗(yàn),自由度=n-1=8,查t分布表,得臨界值-t0.025(8)=-2.306,t0.025(8)=2.306

第四步比較做決策?!?2.306<t=-0.495<2.306∴接受H0∴該日打包機(jī)工作正常7/22/2023733.總體成數(shù)檢驗(yàn)方法及步驟與總體均值檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論