統(tǒng)計(jì)學(xué)之9 抽樣推斷

上傳人：小*** IP屬地：河南上傳時(shí)間：2023-06-27 格式：PPT 頁數(shù)：199 大?。?.66MB 積分：39.98 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩194頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章抽樣推斷：統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷美國總統(tǒng)選舉民意調(diào)查

1984年11月里根與孟代爾競選總統(tǒng)，美國著名的蓋洛普、哈里斯、國家廣播公司三家民意調(diào)查社在選舉前三個(gè)星期所做調(diào)查的統(tǒng)計(jì)分析，里根分別約可獲得58%、55%及60%選票，正式選舉的結(jié)果：里根約獲得59%選票，而孟代爾約41%選票。此次美國所有的民意調(diào)查社的預(yù)測數(shù)字與選舉結(jié)果最多只有4%誤差，但被調(diào)查的選民不超過3000人，可見統(tǒng)計(jì)的技巧是多么有用。在以往的十七次美國總統(tǒng)選舉預(yù)測中，只有兩次失敗，第一次是1936年的藍(lán)頓對(duì)羅斯福的選舉，樣本數(shù)一千萬但是誤差20%，第二次是1948年杜威對(duì)杜魯門，樣本數(shù)二百萬誤差5%，50年來美國21次全國選舉預(yù)測之平均誤差只有2.3%。統(tǒng)計(jì)學(xué)之9抽樣推斷學(xué)習(xí)目的與要求：

抽樣估計(jì)是抽樣調(diào)查的繼續(xù)，它提供了一套利用抽樣資料來估計(jì)總體數(shù)量特征的方法。通過本章的學(xué)習(xí)，要理解和掌握抽樣估計(jì)的概念、特點(diǎn)，抽樣誤差的含義、計(jì)算方法，抽樣估計(jì)的置信度，推斷總體參數(shù)的方法，能結(jié)合實(shí)際資料進(jìn)行抽樣估計(jì)。統(tǒng)計(jì)學(xué)之9抽樣推斷主要內(nèi)容：§1

抽樣推斷的概念與特點(diǎn)§2

抽樣平均誤差的計(jì)算§3

抽樣估計(jì)§4

抽樣的組織形式§5

必要抽樣數(shù)目的確定統(tǒng)計(jì)學(xué)之9抽樣推斷

第一節(jié)抽樣推斷概述一、抽樣推斷的概念抽樣推斷：是按隨機(jī)原則從總體中抽取一部分單位構(gòu)成一個(gè)樣本進(jìn)行觀察，并根據(jù)樣本的實(shí)際數(shù)據(jù)對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷的一種統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)之9抽樣推斷隨機(jī)原則：隨機(jī)原則——即是在抽取樣本時(shí)，排除人們主觀意圖的作用，使得總體中的每個(gè)單位或每個(gè)樣本有相等的入選機(jī)會(huì)。隨機(jī)原則又稱為等可能性原則。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)推斷的過程：樣本總體樣本指標(biāo)總體指標(biāo)統(tǒng)計(jì)學(xué)之9抽樣推斷二、抽樣推斷的特點(diǎn)按隨機(jī)原則抽取樣本單位；用部分推斷總體，即用樣本指標(biāo)去推斷或估計(jì)總體指標(biāo)。抽樣推斷必然產(chǎn)生抽樣誤差，且誤差可以事先計(jì)算并加以控制。運(yùn)用概率估計(jì)方法。統(tǒng)計(jì)學(xué)之9抽樣推斷三、抽樣調(diào)查的作用適用于無限總體或者很難進(jìn)行全面調(diào)查的總體的研究；對(duì)某些可以但事實(shí)上不必或不可能進(jìn)行全面調(diào)查的現(xiàn)象總體的研究。適應(yīng)于破壞性產(chǎn)品的質(zhì)量檢驗(yàn)；可以用于生產(chǎn)過程中的質(zhì)量控制；用于訂正全面調(diào)查的數(shù)據(jù)；可用于假設(shè)檢驗(yàn)。統(tǒng)計(jì)學(xué)之9抽樣推斷四、抽樣推斷的基本概念(一)總體與樣本總體(全及總體、母體)：是指統(tǒng)計(jì)所要研究的全體，由具有某種特定性質(zhì)的許多個(gè)別事物組成的集合體。N：總體單位數(shù)?？傮w可分為有限總體與無限總體。統(tǒng)計(jì)學(xué)之9抽樣推斷樣本(抽樣總體、樣本總體或子樣)樣本

：是指按照隨機(jī)原則，從全及總體中抽取出來，代表全及總體的那部分單位的集合體。樣本容量(n)

：

樣本中所包含的總體單位數(shù)。n?30是大樣本。

總體是唯一的，樣本是隨機(jī)多個(gè)的。統(tǒng)計(jì)學(xué)之9抽樣推斷(二)、總體指標(biāo)與樣本指標(biāo)總體指標(biāo)（母體參數(shù)、總體參數(shù)、全及指標(biāo)）：它是根據(jù)總體各單位的標(biāo)志值或標(biāo)志特征計(jì)算的，反映總體某種屬性的綜合指標(biāo)。全及指標(biāo)是唯一確定的，一個(gè)總體常常有多個(gè)總體參數(shù)。統(tǒng)計(jì)學(xué)之9抽樣推斷常用的總體指標(biāo)有：或或統(tǒng)計(jì)學(xué)之9抽樣推斷樣本指標(biāo)(樣本統(tǒng)計(jì)量)：樣本指標(biāo)：也稱為統(tǒng)計(jì)量或抽樣指標(biāo)，它是根據(jù)抽樣各單位的標(biāo)志值或標(biāo)志特征值計(jì)算的、用以估計(jì)和推斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。一個(gè)樣本常常有多個(gè)樣本指標(biāo)，依據(jù)樣本的數(shù)據(jù)計(jì)算的樣本指標(biāo)不是唯一確定的。統(tǒng)計(jì)學(xué)之9抽樣推斷常用的樣本統(tǒng)計(jì)量有：或或統(tǒng)計(jì)學(xué)之9抽樣推斷說明：按照無偏估計(jì)的要求，才是總體方差的無偏公式，但在某些統(tǒng)計(jì)中，n通常較大，n與(n-1)相差甚微，為簡便，就用n代替(n-1)?？傮w指標(biāo)是唯一確定的值，樣本指標(biāo)是隨機(jī)變量。

統(tǒng)計(jì)學(xué)之9抽樣推斷（三）抽樣方法與樣本個(gè)數(shù)樣本個(gè)數(shù)(m)——指從總體中可能抽取的全部樣本數(shù)目，又稱樣本可能數(shù)目。這與抽樣方法和樣本容量有關(guān)系。抽樣方法重復(fù)(置)抽樣不重復(fù)(置)抽樣考慮順序不考慮順序考慮順序不考慮順序統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣的特點(diǎn)：n個(gè)單位的樣本是由n次連續(xù)試驗(yàn)構(gòu)成的。每次試驗(yàn)相互獨(dú)立，各單位中選與不中選相互不影響。每次試驗(yàn)都是在相同的條件下進(jìn)行，即都是從N個(gè)總體單位中隨機(jī)抽取一個(gè)，因此，每個(gè)單位在每次中選的機(jī)會(huì)都相等，它們每次都有1/N的中選機(jī)會(huì)。統(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣的特點(diǎn)：n個(gè)單位的樣本是由n次連續(xù)試驗(yàn)構(gòu)成的，但由于每次抽出不放回，所以實(shí)質(zhì)上等同于同時(shí)從總體中抽n個(gè)樣本單位。每次試驗(yàn)不相互獨(dú)立，上次中選情況影響下次中選結(jié)果。每抽一次總體的單位數(shù)便少一個(gè)，因此每個(gè)單位在各次中選的機(jī)會(huì)是不相等的，第i次抽取每個(gè)單位有1/(N-i+1)的中選機(jī)會(huì)。統(tǒng)計(jì)學(xué)之9抽樣推斷考慮順序的樣本個(gè)數(shù)：1）不重復(fù)排列數(shù)2）重復(fù)排列數(shù)統(tǒng)計(jì)學(xué)之9抽樣推斷不考慮順序的樣本個(gè)數(shù)：3）不重復(fù)組合數(shù)4)重復(fù)組合數(shù)統(tǒng)計(jì)學(xué)之9抽樣推斷【例】

從0-9的10個(gè)數(shù)中隨機(jī)重復(fù)抽選6個(gè)數(shù)字組成電話號(hào)碼，共能組成多少個(gè)電話號(hào)碼？（重復(fù)排列數(shù)）統(tǒng)計(jì)學(xué)之9抽樣推斷【例】從班級(jí)10位學(xué)生中抽選三人擔(dān)任不同的職務(wù)，問共有幾種抽法？（不重復(fù)的排列數(shù)）統(tǒng)計(jì)學(xué)之9抽樣推斷【例】從小組10位學(xué)生中不重復(fù)隨機(jī)抽選3個(gè)組成樣本，考查其平均成績，可能的樣本數(shù)目為：（重復(fù)組合數(shù)）統(tǒng)計(jì)學(xué)之9抽樣推斷從A、B、C、D四個(gè)單位中，抽出兩個(gè)單位構(gòu)成一個(gè)樣本，問樣本個(gè)數(shù)是多少？重復(fù)抽樣排列數(shù):Nn＝42

＝16(個(gè)樣本)AAACADBABBBCBDABCACBCCCDDADBDCDD不重復(fù)抽樣排列數(shù):N(N-1)(N-2)……＝4×3＝12(個(gè)樣本)【例】統(tǒng)計(jì)學(xué)之9抽樣推斷(四)抽樣推斷的理論依據(jù)1．大數(shù)法則（大數(shù)定律）基本思想：大量的隨機(jī)現(xiàn)象具有一定的穩(wěn)定性。統(tǒng)計(jì)學(xué)之9抽樣推斷我們知道，總體由許多總體單位組成，每個(gè)總體單位的表現(xiàn)各不一樣。這些不同的表現(xiàn)共同決定著總體的表現(xiàn)或特征。如果我們將這些大量的總體單位加以綜合平均，那么它們對(duì)總體的個(gè)別影響會(huì)將相互抵消，最后呈現(xiàn)出它們共同作用的結(jié)果，使總體具有穩(wěn)定的性質(zhì)。統(tǒng)計(jì)學(xué)之9抽樣推斷實(shí)際推斷原理:當(dāng)試驗(yàn)次數(shù)很大時(shí)，可以用樣本指標(biāo)代替總體指標(biāo)。在概率論中，大數(shù)法則是這樣表述的：對(duì)于任意正數(shù)，有：或這樣，以嚴(yán)格的數(shù)學(xué)形式，表達(dá)了頻率的穩(wěn)定性。統(tǒng)計(jì)學(xué)之9抽樣推斷2、中心極限定理：中心極限定理，其著眼點(diǎn)是“變量和的分布”。一個(gè)隨機(jī)變量服從正態(tài)分布的現(xiàn)象并不多見，但多個(gè)變量和的分布服從正態(tài)分布則是普遍存在的。在現(xiàn)實(shí)生活中，變量和的分布是普遍存在的?；舅枷耄鹤兞亢偷姆植己瘮?shù)向正態(tài)分布收斂。統(tǒng)計(jì)學(xué)之9抽樣推斷也就是說：

中心極限定理論證了：如果總體變量存在有限的平均數(shù)和方差，那么，不論這個(gè)總體變量的分布如何，隨著抽樣單位數(shù)n的增加，抽樣平均數(shù)的分布便趨近于正態(tài)分布。統(tǒng)計(jì)學(xué)之9抽樣推斷中心極限定理的通俗定義是這樣的：當(dāng)n無限增大時(shí)，不管總體分布是什么形狀，樣本平均數(shù)分布趨近于平均數(shù)為方差為的正態(tài)分布；且，。標(biāo)準(zhǔn)化變量的分布趨近于平均數(shù)為0，方差為1的標(biāo)準(zhǔn)正態(tài)分布。這樣就可以利用標(biāo)準(zhǔn)正態(tài)分布求得標(biāo)準(zhǔn)變量t落入任意區(qū)間的概率了。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第二節(jié)抽樣平均誤差一、統(tǒng)計(jì)誤差的分類(抽樣誤差)統(tǒng)計(jì)誤差登記性誤差代表性誤差統(tǒng)計(jì)學(xué)之9抽樣推斷各種統(tǒng)計(jì)誤差：登記誤差：指由于調(diào)查登記或計(jì)算差錯(cuò)在發(fā)生的誤差統(tǒng)計(jì)誤差：指調(diào)查所得的統(tǒng)計(jì)數(shù)字與調(diào)查總體實(shí)際數(shù)值之間的差異。代表性誤差：指用樣本指標(biāo)推斷總體指標(biāo)時(shí)，由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致，樣本不能完全代表總體而產(chǎn)生的誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷系統(tǒng)誤差：由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差，表現(xiàn)為樣本估計(jì)量的值系統(tǒng)性偏高或偏低，故也稱為偏差。隨機(jī)誤差：指遵循隨機(jī)原則抽樣，由于隨機(jī)因素（偶然性因素）引起的代表性誤差。通常所說的抽樣誤差指的就是隨機(jī)誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣實(shí)際誤差：抽樣實(shí)際誤差：每一次抽樣，得到的樣本指標(biāo)與總體指標(biāo)的絕對(duì)離差。如、，這是無法計(jì)算的。抽樣實(shí)際誤差是隨機(jī)變量。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣平均誤差抽樣平均誤差：指所有可能出現(xiàn)的樣本平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差。反映了抽樣指標(biāo)與總體指標(biāo)的平均誤差程度。從理論上說是一個(gè)唯一確定的量。統(tǒng)計(jì)學(xué)之9抽樣推斷二、抽樣平均數(shù)的平均誤差統(tǒng)計(jì)學(xué)之9抽樣推斷(一)平均數(shù)的抽樣分布平均數(shù)的抽樣分布：由總體中全部樣本平均數(shù)的可能取值和與之相應(yīng)的概率(頻率)組成。即把所有可能樣本平均數(shù)的次數(shù)分布稱之為平均數(shù)的抽樣分布。抽樣分布：指樣本指標(biāo)的次數(shù)分布。統(tǒng)計(jì)學(xué)之9抽樣推斷1．重復(fù)抽樣分布【例】設(shè)有某班組5個(gè)工人的日分別為34、38、42、46、50元，則：現(xiàn)用重復(fù)抽樣方法從中隨機(jī)抽取2個(gè)構(gòu)成樣本，并求樣本平均工資來推斷總體的平均工資。統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)排列數(shù)：樣本日工資平均數(shù)單位：元統(tǒng)計(jì)學(xué)之9抽樣推斷樣本日平均工資的次數(shù)分布表根據(jù)上表數(shù)據(jù)，可以整理出樣本平均數(shù)的分布如左表：統(tǒng)計(jì)學(xué)之9抽樣推斷5/254/253/252/251/25

343638404244464850樣本日平均工資分布圖平均工資(元)統(tǒng)計(jì)學(xué)之9抽樣推斷則樣本日工資平均數(shù)的平均數(shù)和方差為：統(tǒng)計(jì)學(xué)之9抽樣推斷兩個(gè)重要結(jié)論：重復(fù)抽樣的樣本平均數(shù)的平均數(shù)等于總體平均數(shù)，即：所以抽樣平均數(shù)的標(biāo)準(zhǔn)差反映了樣本平均數(shù)與總體平均數(shù)的平均誤差程度，稱為抽樣平均誤差或抽樣標(biāo)準(zhǔn)誤差。因?yàn)榻y(tǒng)計(jì)學(xué)之9抽樣推斷樣本平均數(shù)的分布與總體分布的比較：總體分布樣本平均數(shù)的分布3438424650X20100%3/252/251/254/255/253436384042444648500統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣抽樣平均誤差的計(jì)算公式：可見抽樣平均誤差比總體標(biāo)準(zhǔn)差小得多，僅為總體標(biāo)準(zhǔn)的。另外，抽樣平均誤差和總體標(biāo)準(zhǔn)差成正比變化，而和樣本單位數(shù)n的平方根成反比變化。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷2．不重復(fù)抽樣分布樣本日工資平均數(shù)單位：元統(tǒng)計(jì)學(xué)之9抽樣推斷樣本日平均工資的次數(shù)分布表根據(jù)上表數(shù)據(jù)，可以整理出樣本平均數(shù)的分布如左表：統(tǒng)計(jì)學(xué)之9抽樣推斷則樣本日工資平均數(shù)的平均數(shù)和方差為：統(tǒng)計(jì)學(xué)之9抽樣推斷也可得出兩個(gè)重要結(jié)論：不重復(fù)抽樣的樣本平均數(shù)的平均數(shù)等于總體平均數(shù)，即：所以抽樣平均數(shù)的標(biāo)準(zhǔn)差也反映了樣本平均數(shù)與總體平均數(shù)的平均誤差程度，稱為抽樣平均誤差或抽樣標(biāo)準(zhǔn)誤差。因?yàn)榻y(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣的抽樣平均誤差計(jì)算公式：不重復(fù)抽樣的抽樣平均誤差等于重復(fù)抽樣的抽樣平均誤差乘以修正因子即：統(tǒng)計(jì)學(xué)之9抽樣推斷(二)、抽樣平均誤差1．定義定義公式反映抽樣平均數(shù)(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均誤差程度?；蛘哒f，用來描述各樣本抽樣實(shí)際誤差的一般水平。抽樣平均誤差

：指所有可能出現(xiàn)的樣本指標(biāo)的標(biāo)準(zhǔn)差。統(tǒng)計(jì)學(xué)之9抽樣推斷定義公式：抽樣平均誤差是一個(gè)確定的值。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣平均誤差的具體意義：從總體N中取容量為n的可能樣本共有m個(gè)，可計(jì)算出m個(gè)抽樣實(shí)際誤差(隨機(jī)變量)：為了測定樣本(指標(biāo))的代表性程度的高低，單獨(dú)用某一次的抽樣誤差來衡量是不科學(xué)的，因此就需要采用一定的方法(求標(biāo)準(zhǔn)差的方法)計(jì)算所有m個(gè)抽樣實(shí)際誤差的平均數(shù)，這就是抽樣平均誤差。(i=1，2，3，···m)統(tǒng)計(jì)學(xué)之9抽樣推斷2．抽樣平均誤差的應(yīng)用公式抽樣平均誤差是一個(gè)確定的值，但在實(shí)際抽樣估計(jì)中，常用某些樣本指標(biāo)來代替未知的總體指標(biāo)。例如用s2代替２。由于s2是隨機(jī)變量，故這時(shí)所測得的只是抽樣平均誤差的估計(jì)量，此估計(jì)量仍為隨機(jī)變量。實(shí)際工作中常用推導(dǎo)的應(yīng)用公式。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣平均誤差的應(yīng)用公式：重復(fù)抽樣：不重復(fù)抽樣：統(tǒng)計(jì)學(xué)之9抽樣推斷說明：抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比，僅為總體標(biāo)準(zhǔn)差的；抽樣平均誤差與成反比?？赏ㄟ^調(diào)整樣本單位數(shù)來控制抽樣平均誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷假定抽樣單位數(shù)增加２倍、0.5倍時(shí)，抽樣平均誤差怎樣變化？【例】【解】統(tǒng)計(jì)學(xué)之9抽樣推斷３．計(jì)算應(yīng)注意的兩點(diǎn)(1)

總體方差未知時(shí)的處理方法：用s２代替２或p代替P；用方差的歷史或經(jīng)驗(yàn)數(shù)據(jù)代替。如果有多個(gè)方差可供選擇，則通常取用較大的，故p應(yīng)選擇最接近于0.5的。用方差的試驗(yàn)或試點(diǎn)數(shù)據(jù)代替。(2)

當(dāng)N很大時(shí)，N-1≈N，于是統(tǒng)計(jì)學(xué)之9抽樣推斷4．的計(jì)算實(shí)例隨機(jī)抽查某大學(xué)150個(gè)男生的身高，得其平均身高為170.8公分。根據(jù)過去的材料，知道大學(xué)生身高的總體標(biāo)準(zhǔn)差為24公分，試求抽樣平均誤差?！纠?解：統(tǒng)計(jì)學(xué)之9抽樣推斷【例】2某廠生產(chǎn)某種燈泡5000只，隨機(jī)抽取500只作壽命測試。測試結(jié)果表明，平均壽命為6200小時(shí)，樣本標(biāo)準(zhǔn)差為450小時(shí)，求抽樣平均誤差。解：統(tǒng)計(jì)學(xué)之9抽樣推斷【例】3某倉庫有某種零配件10000套，隨機(jī)抽取400套，發(fā)現(xiàn)32套不合格。求合格率的抽樣平均誤差。已知Ｎ=10000，n=400，p=368/400=92%，求統(tǒng)計(jì)學(xué)之9抽樣推斷解：重復(fù)抽樣：不重復(fù)抽樣：統(tǒng)計(jì)學(xué)之9抽樣推斷【例】４某校隨機(jī)抽選400名學(xué)生，發(fā)現(xiàn)戴眼鏡的學(xué)生有80人。根據(jù)樣本資料推斷全部學(xué)生中戴眼鏡的學(xué)生所占比重時(shí)，抽樣誤差為多大？樣本p=n1/n=80/400=20%解：統(tǒng)計(jì)學(xué)之9抽樣推斷【例】５某燈泡廠對(duì)10000個(gè)產(chǎn)品進(jìn)行使用壽命檢驗(yàn)，隨機(jī)抽取2%樣本進(jìn)行測試，按規(guī)定，燈泡使用壽命在1000小時(shí)以上者為合格品。測得樣本數(shù)據(jù)如下：燈泡平均使用時(shí)間x=1057小時(shí)，燈泡使用時(shí)間標(biāo)準(zhǔn)差為s=53.63小時(shí)，合格品率為p=91.5％，則：統(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣時(shí)：統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣時(shí)：

統(tǒng)計(jì)學(xué)之9抽樣推斷5．影響抽樣平均誤差的因素總體方差或標(biāo)準(zhǔn)差。

大，則大。樣本容量n。如n擴(kuò)大為原來的4倍，則縮小為原來的1/2。抽樣方法。由于小于1，重復(fù)抽樣時(shí)的抽樣平均誤差永遠(yuǎn)大于不重復(fù)抽樣時(shí)的抽樣平均誤差。抽樣調(diào)查的組織形式。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第三節(jié)抽樣估計(jì)（推斷）有效的估計(jì)將是……統(tǒng)計(jì)學(xué)之9抽樣推斷一、抽樣估計(jì)的概念統(tǒng)計(jì)推斷：就是利用樣本的數(shù)據(jù)，對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩個(gè)方面?？傮w參數(shù)估計(jì)：是以樣本統(tǒng)計(jì)量作為未知總體參數(shù)的估計(jì)量，并通過樣本數(shù)據(jù)計(jì)算樣本統(tǒng)計(jì)量的取值，作為總體參數(shù)的估計(jì)值。參數(shù)估計(jì)又稱抽樣估計(jì)。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣估計(jì)要具備三個(gè)基本要素：要有合適的統(tǒng)計(jì)量作為估計(jì)量要有合理的允許誤差范圍（△）要有一個(gè)可接受的置信度統(tǒng)計(jì)學(xué)之9抽樣推斷二、統(tǒng)計(jì)量的優(yōu)良估計(jì)標(biāo)準(zhǔn)估計(jì)量：用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量。估計(jì)值：依據(jù)某一具體的樣本指標(biāo)所估計(jì)的總體指標(biāo)的值。優(yōu)良估計(jì)量總是從總體上來說的，其標(biāo)準(zhǔn)有三個(gè)：無偏性、一致性和有效性。統(tǒng)計(jì)學(xué)之9抽樣推斷1．無偏性要求樣本指標(biāo)的平均數(shù)等于被估計(jì)的總體指標(biāo)。即：樣本指標(biāo)是總體指標(biāo)的無偏估計(jì)量。有：統(tǒng)計(jì)學(xué)之9抽樣推斷無偏性：樣本統(tǒng)計(jì)量的期望值（均值）

等于被估計(jì)的總體參數(shù)。E(x)＝X無偏估計(jì)量E(Me)≠X有偏估計(jì)量統(tǒng)計(jì)學(xué)之9抽樣推斷2．一致性當(dāng)樣本的單位數(shù)充分大時(shí)，樣本指標(biāo)充分靠近總體指標(biāo)。即當(dāng)n無限增加，樣本指標(biāo)與未知的總體指標(biāo)之差的絕對(duì)值小于任意小的正數(shù)，它的可能性也趨近于必然性。對(duì)于，當(dāng)n愈多，抽樣平均誤差愈接近于0。統(tǒng)計(jì)學(xué)之9抽樣推斷3、有效性要求作為優(yōu)良估計(jì)量的方差應(yīng)該比其他估計(jì)量的方差小。例如有：注意：并不是所有的估計(jì)量都符合以上的標(biāo)準(zhǔn)。例如：在正態(tài)分布的情況下，總體平均數(shù)和中位數(shù)是重合的，樣本中位數(shù)是總體中位數(shù)的無偏和一致估計(jì)量，但對(duì)比樣本平均數(shù)卻不是更有效的估計(jì)量。而樣本平均數(shù)卻是總體中位數(shù)的優(yōu)良估計(jì)量。統(tǒng)計(jì)學(xué)之9抽樣推斷三、抽樣極限誤差（△）總體指標(biāo)是唯一確定的值，樣本指標(biāo)是圍繞著全及指標(biāo)上下隨機(jī)出現(xiàn)的變量。抽樣平均誤差指抽樣分布的標(biāo)準(zhǔn)差，說明的是某一抽樣方案下所有可能樣本的平均誤差情況，但在抽樣推斷實(shí)踐中往往只抽取一個(gè)樣本，該樣本的指標(biāo)數(shù)值與總體指標(biāo)數(shù)值的離差，可能為正，也可能為負(fù)，該誤差可能大于也可能小于或者等于抽樣平均誤差。因此，對(duì)于一項(xiàng)抽樣調(diào)查，總是要求有一個(gè)合理的允許誤差范圍，這就是抽樣極限誤差△。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣極限誤差的定義：抽樣極限誤差：指在進(jìn)行抽樣估計(jì)時(shí)，根據(jù)研究對(duì)象的變異程度和分析任務(wù)的要求所確定的樣本指標(biāo)與總體指標(biāo)之間可允許的最大誤差范圍。也稱容許誤差、可能誤差。常用△表示。它是根據(jù)概率理論，以一定的可靠程度保證抽樣誤差不超過某一給定的范圍△。統(tǒng)計(jì)學(xué)之9抽樣推斷1)

△是指誤差范圍

△的原意表示是以為中心，在之間變動(dòng)。但由于全及指標(biāo)未知，而樣本指標(biāo)通過實(shí)測可得到。因此，抽樣誤差范圍的實(shí)際意義是要求被估計(jì)的全及指標(biāo)落在抽樣指標(biāo)的一定范圍內(nèi)，即落在的范圍內(nèi)。統(tǒng)計(jì)學(xué)之9抽樣推斷即：因此，、P的范圍估計(jì)(區(qū)間估計(jì))分別為：

同理得：、統(tǒng)計(jì)學(xué)之9抽樣推斷2)△是指可能范圍而非肯定范圍抽樣極限誤差△不是唯一固定的，而是根據(jù)抽樣調(diào)查的目的，根據(jù)人們希望控制總體指標(biāo)的把握程度來確定的。如果希望控制的把握程度大些，就給予△較大的值，否則，△的給定值就較小。這種把握程度就是概率保證程度。亦即抽樣估計(jì)的可靠程度，叫估計(jì)置信度，習(xí)慣上也稱為可靠度、可信程度、把握程度或概率保證程度。統(tǒng)計(jì)學(xué)之9抽樣推斷四、置信度、概率度、估計(jì)精度1．置信度是估計(jì)的可靠性問題置信度：就是表明抽樣指標(biāo)和總體指標(biāo)的誤差，不超過一定范圍（△）的概率保證程度。統(tǒng)計(jì)學(xué)之9抽樣推斷置信度即概率保證程度：

由于抽樣指標(biāo)值隨著樣本的變動(dòng)而變動(dòng)，它本身是一個(gè)隨機(jī)變量，因而抽樣指標(biāo)和總體指標(biāo)的誤差仍然是一個(gè)隨機(jī)變量，并不能保證誤差不超過一定范圍這個(gè)事件是必然事件，而只能給以一定程度的概率保證。因此，就有必要來計(jì)算抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率大小，即計(jì)算抽樣指標(biāo)落在一定區(qū)間范圍內(nèi)的概率，這種概率稱之為抽樣估計(jì)的置信度。統(tǒng)計(jì)學(xué)之9抽樣推斷估計(jì)值所確定的估計(jì)區(qū)間是隨機(jī)的，在實(shí)際抽樣中并不能保證被估計(jì)的總體指標(biāo)值都落在允許誤差范圍內(nèi)，這就產(chǎn)生要冒多大風(fēng)險(xiǎn)來相信所作的估計(jì)。例如：我們愿意冒10%的風(fēng)險(xiǎn)，表示如果進(jìn)行多次重復(fù)估計(jì)，則平均每100次估計(jì)將有10次是錯(cuò)誤的，90次是正確的，90%就稱為置信度或概率保證程度。統(tǒng)計(jì)學(xué)之9抽樣推斷2．概率度(t)反映△的相對(duì)程度

描述全部樣本指標(biāo)與總體指標(biāo)的平均誤差，而△則是對(duì)一個(gè)樣本的樣本指標(biāo)與總體指標(biāo)誤差的控制范圍，因而可用來衡量△。即抽樣極限誤差等于t倍的抽樣平均誤差：t就稱為概率度?；蚧蚪y(tǒng)計(jì)學(xué)之9抽樣推斷因此：△——是用一定倍數(shù)的表示的抽樣指標(biāo)與全及指標(biāo)之間的絕對(duì)離差。t

——是指以抽樣平均誤差為尺度來衡量的相對(duì)誤差范圍。統(tǒng)計(jì)學(xué)之9抽樣推斷

求t值的過程，也就是樣本變量

和p的標(biāo)準(zhǔn)化過程。標(biāo)準(zhǔn)變量t服從正態(tài)分布。t值大小是確定正態(tài)分布函數(shù)的決定因子。即t是確定概率保證程度大小的指標(biāo)?？梢罁?jù)一定的置信度，查標(biāo)準(zhǔn)正態(tài)分布表求得。統(tǒng)計(jì)學(xué)之9抽樣推斷概率是概率度的函數(shù)：P=F(t)在正態(tài)分布的情況下，從總體中隨機(jī)抽取一個(gè)樣本觀察，則該樣本指標(biāo)落在某一范圍內(nèi)的概率，是用占正態(tài)曲線面積的大小表示的。即：統(tǒng)計(jì)學(xué)之9抽樣推斷正態(tài)分布及其曲線下的面積圖68.27%1-1-295.45%99.73%-323統(tǒng)計(jì)學(xué)之9抽樣推斷可見隨著t的不斷增大，概率P的數(shù)值也隨著增大以致逐漸接近于1，使抽樣推斷達(dá)到完全可靠的程度。應(yīng)用正態(tài)分布曲線，把概率度t和抽樣誤差范圍△聯(lián)系起來，便可得到抽樣推斷全及指標(biāo)在一定范圍內(nèi)的概率保證程度。統(tǒng)計(jì)抽樣推斷中常用的有：統(tǒng)計(jì)學(xué)之9抽樣推斷常用概率度與概率對(duì)照表

統(tǒng)計(jì)學(xué)之9抽樣推斷3．估計(jì)精度是從相對(duì)數(shù)的角度說明抽樣估計(jì)的準(zhǔn)確程度誤差率＝允許誤差／估計(jì)值，即：估計(jì)精度＝１－誤差率，即：抽樣估計(jì)的準(zhǔn)確性隨著△的增大而減小，它們之間呈反方向變動(dòng)。統(tǒng)計(jì)學(xué)之9抽樣推斷注意：估計(jì)的準(zhǔn)確性與可靠信是相互矛盾的△決定估計(jì)的準(zhǔn)確性，成反比關(guān)系；F(t)決定估計(jì)的可靠性，成正比關(guān)系可靠性越大，F(xiàn)(t)越大

t越大△

越大

準(zhǔn)確性越小。統(tǒng)計(jì)學(xué)之9抽樣推斷【例】（仍用前面例子）從總體5個(gè)工人的日平均工資中重復(fù)抽取n為2的樣本平均工資的抽樣分布如下表：統(tǒng)計(jì)學(xué)之9抽樣推斷樣本日平均工資

的次數(shù)分布表統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷五、抽樣估計(jì)方法以樣本的平均數(shù)作為總體平均數(shù)的估計(jì)值。以樣本的成數(shù)p作為總體成數(shù)P的估計(jì)值。(一)點(diǎn)估計(jì)（定值估計(jì)）——它是直接以樣本指標(biāo)的實(shí)際值直接作為相應(yīng)總體參數(shù)的估計(jì)值。例如：統(tǒng)計(jì)學(xué)之9抽樣推斷點(diǎn)估計(jì)的特點(diǎn)：優(yōu)點(diǎn)：簡便、易行、原理直觀，它能夠提供總體指標(biāo)的具體估計(jì)值，可以作為行動(dòng)決策的數(shù)量依據(jù)。缺點(diǎn)：任何點(diǎn)估計(jì)不是對(duì)就是錯(cuò)，點(diǎn)估計(jì)沒有表明抽樣估計(jì)的誤差，更沒有指出誤差在一定范圍內(nèi)的概率保證程度有多大。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)家做得比間諜們更漂亮！由于許多戰(zhàn)略上的理由，盟軍非常想知道二戰(zhàn)期間德軍總共制造了多少輛坦克。德國人在制造坦克時(shí)是墨守陳規(guī)的，他們把坦克從1開始進(jìn)行了連續(xù)編號(hào)。在戰(zhàn)爭進(jìn)行過程中，盟軍繳獲了一些敵軍坦克，并記錄了它們的編號(hào)。那么怎樣用這些號(hào)碼來估計(jì)坦克總數(shù)呢？統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)家做得比間諜們更漂亮！

我們知道，制造出來的坦克數(shù)肯定大于記錄中的最大編號(hào)。因此，其中點(diǎn)估計(jì)的方法之一就是，計(jì)算出被繳獲坦克編號(hào)的平均值，并認(rèn)為這個(gè)值是德軍全部坦克編號(hào)的中點(diǎn)，用樣本均值乘以2就是總數(shù)的一個(gè)估計(jì)。

從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看，盟軍估計(jì)值非常接近所生產(chǎn)坦克的真實(shí)記錄。統(tǒng)計(jì)學(xué)之9抽樣推斷（二）區(qū)間估計(jì)統(tǒng)計(jì)學(xué)之9抽樣推斷定義：區(qū)間估計(jì)：就是在一定的概率保證程度下，選定概率度t及抽樣極限誤差△=t，再根據(jù)樣本指標(biāo)數(shù)值和△去估計(jì)總體指標(biāo)數(shù)值所在的可能范圍的一種統(tǒng)計(jì)推斷方法。估計(jì)區(qū)間的上下限：或置信區(qū)間：或置信度：統(tǒng)計(jì)學(xué)之9抽樣推斷1．根據(jù)Ｆ(t)求△及置信區(qū)間根據(jù)樣本資料，計(jì)算出及或p及。根據(jù)F(t)查正態(tài)分布概率表求t；根據(jù)t與，計(jì)算或，指出置信區(qū)間為：或統(tǒng)計(jì)學(xué)之9抽樣推斷【例】對(duì)某魚塘進(jìn)行抽樣調(diào)查，從魚塘的不同部位共網(wǎng)到魚150條，其中草魚123條，草魚平均每條重2公斤，標(biāo)準(zhǔn)差為0.75公斤。1）試按95.45%（t=2）的概率保證程度，對(duì)該魚塘草魚平均每條重量作區(qū)間估計(jì)；2）以同樣的概率保證程度對(duì)該魚塘草魚所占比重作區(qū)間估計(jì)。統(tǒng)計(jì)學(xué)之9抽樣推斷解1）已知：草魚平均每條重量的估計(jì)區(qū)間為：

即［2－0.14，2＋0.14］

［1.86，2.14］公斤

(公斤)=2kg，s=0.75kg，n=123，t=2統(tǒng)計(jì)學(xué)之9抽樣推斷解2)已知:n=150

，t＝2，p＝123/150＝82%則草魚所占比重的估計(jì)區(qū)間為：即［82%－6.27%，82%＋6.27%］

［75.73%，88.27%］統(tǒng)計(jì)學(xué)之9抽樣推斷2．根據(jù)給定的△，求F(t)抽取樣本，計(jì)算出、s，推算出；根據(jù)△，估計(jì)出根據(jù)，求出F(t)統(tǒng)計(jì)學(xué)之9抽樣推斷隨機(jī)抽取25畝水稻田，測得平均畝產(chǎn)為650公斤，標(biāo)準(zhǔn)差為75公斤，求總體平均畝產(chǎn)在620-680斤之間的概率是多少？【例】統(tǒng)計(jì)學(xué)之9抽樣推斷【解】所以F(t)=95.45%。已知，s＝75公斤，n=25統(tǒng)計(jì)學(xué)之9抽樣推斷【例】

某儲(chǔ)蓄所6月份共有存單3000張，為了解存款數(shù)量情況，現(xiàn)隨機(jī)抽取200張進(jìn)行調(diào)查，得結(jié)果如右表，試求重復(fù)抽樣條件下：該儲(chǔ)蓄所本月存單平均存款范圍(概率保證程度為95.45%)；該儲(chǔ)蓄所本月存款額在1000元以上存單所占比重范圍。(概率保證程度為95.45%)。統(tǒng)計(jì)學(xué)之9抽樣推斷該儲(chǔ)蓄所存單平均存款額與標(biāo)準(zhǔn)差計(jì)算表統(tǒng)計(jì)學(xué)之9抽樣推斷①統(tǒng)計(jì)學(xué)之9抽樣推斷②p=40/200=20%，則統(tǒng)計(jì)學(xué)之9抽樣推斷

對(duì)我國某城市進(jìn)行居民家庭人均旅游消費(fèi)支出調(diào)查，隨機(jī)抽取400戶居民家庭，調(diào)查得知居民家庭人均年旅游消費(fèi)支出為350元，標(biāo)準(zhǔn)差為100元，要求以95%的概率保證程度，估計(jì)該市人均年旅游消費(fèi)支出額。

解：第一步，根據(jù)抽樣資料已算得：樣本戶年人均消費(fèi)支出x=350（元）樣本標(biāo)準(zhǔn)差s＝100（元），則統(tǒng)計(jì)學(xué)之9抽樣推斷第二步，根據(jù)F(t)=95%，查得t=1.96。第三步，計(jì)算則該市居民家庭年人均旅游消費(fèi)支出額的上下限為：結(jié)論：我們可以95%得概率保證程度，估計(jì)該市居民家庭年人均旅游消費(fèi)支出額在340.20元—359.80元之間。統(tǒng)計(jì)學(xué)之9抽樣推斷【例】某市電視臺(tái)為了解觀眾對(duì)某電視欄目的喜愛程度，在該市隨機(jī)對(duì)900名居民進(jìn)行調(diào)查，結(jié)果有540名喜歡該電視欄目，要求以90%的概率保證程度，估計(jì)該市居民喜歡該電視欄目的比率。解：統(tǒng)計(jì)學(xué)之9抽樣推斷根據(jù)給定的F(t)＝90%，查表得t＝1.64。結(jié)論：我們可以概率90%的保證程度，估計(jì)該市居民對(duì)此電視欄目喜愛的比率在57.33%～62.67%之間。則總體比率的上下限為：統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第四節(jié)抽樣組織形式簡單隨機(jī)抽樣類型抽樣等距抽樣整群抽樣多階段抽樣統(tǒng)計(jì)學(xué)之9抽樣推斷一、簡單隨機(jī)抽樣簡單隨機(jī)抽樣：又稱為純隨機(jī)抽樣，它是按照隨機(jī)原則直接從總體N個(gè)個(gè)體中抽取n個(gè)個(gè)體作樣本，使總體中的每個(gè)個(gè)體都有同等的機(jī)會(huì)被抽中。直接抽選法

抽簽摸球法

隨機(jī)數(shù)表法簡單隨機(jī)抽樣

統(tǒng)計(jì)學(xué)之9抽樣推斷直接抽選法是指直接從調(diào)查對(duì)象中隨機(jī)抽選。例如，從倉庫中存放的所有同類產(chǎn)品中隨機(jī)指定若干件產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn)；從糧食倉庫中不同的地點(diǎn)取出若干糧食樣本進(jìn)行含雜量、含水量的檢驗(yàn)等。抽簽法即先將全及總體各個(gè)單位按照某種自然的順序編上號(hào)，并做成號(hào)簽，再把號(hào)簽摻合起來，任意抽取所需單位數(shù)，然后按照抽中的號(hào)碼取得對(duì)應(yīng)的調(diào)查單位加以登記調(diào)查。隨機(jī)數(shù)表是指含有一系列組別的隨機(jī)數(shù)字的表格。統(tǒng)計(jì)學(xué)之9抽樣推斷簡單隨機(jī)抽樣的特點(diǎn)是抽樣調(diào)查中最基本的組織形式；遵循隨機(jī)原則直接從總體N個(gè)單位中抽取n個(gè)單位作為樣本；又稱為純隨機(jī)抽樣。簡單隨機(jī)抽樣被用作評(píng)估其他抽樣策略的效率的基準(zhǔn)；簡單隨機(jī)抽樣最原始的抽取方法是抽簽法，最常用的抽取方法是利用《隨機(jī)數(shù)表》或計(jì)算機(jī)生產(chǎn)隨機(jī)數(shù)。統(tǒng)計(jì)學(xué)之9抽樣推斷簡單隨機(jī)抽樣適用的情況：對(duì)調(diào)查對(duì)象很少了解；總體單位的排列沒有秩序；均勻總體。注：前面所討論的抽樣平均誤差的計(jì)算公式就是簡單隨機(jī)抽樣時(shí)的抽樣平均誤差的公式。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣單位數(shù)目的計(jì)算重復(fù)抽樣：不重復(fù)抽樣：統(tǒng)計(jì)學(xué)之9抽樣推斷【例】

某市開展職工家計(jì)調(diào)查，根據(jù)歷史資料該市職工家庭平均每人年收入的標(biāo)準(zhǔn)差為2400元，家庭消費(fèi)總支出中食品消費(fèi)支出比重（恩格爾系數(shù)）為54%?，F(xiàn)用重復(fù)抽樣方法，要求在95.45%的概率保證下，平均收入的抽樣極限誤差不超過200元，恩格爾系數(shù)的抽樣極限誤差不超過4%，請(qǐng)確定樣本必要數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷樣本成數(shù)的樣本必要數(shù)目：【解】根據(jù)公式，在重復(fù)抽樣條件下：樣本平均數(shù)的樣本必要數(shù)目：統(tǒng)計(jì)學(xué)之9抽樣推斷關(guān)于抽樣單位數(shù)目的幾點(diǎn)說明在同樣條件下，不重復(fù)抽樣比重復(fù)抽樣要求的抽樣單位數(shù)目少。但不重復(fù)抽樣的抽樣單位數(shù)目計(jì)算公式比較復(fù)雜。在實(shí)際工作中，一般當(dāng)n/N的抽樣比很小時(shí)（小于5%），為了簡化計(jì)算，雖然采用不重復(fù)抽樣，也可用重復(fù)抽樣計(jì)算公式計(jì)算抽樣單位數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷關(guān)于抽樣單位數(shù)目的幾點(diǎn)說明同一總體往往同時(shí)需要估計(jì)總體平均數(shù)和總體成數(shù)，對(duì)二者可以分別計(jì)算出各自抽樣單位數(shù)目，為了防止抽樣單位數(shù)目的不足，在實(shí)際工作中，往往根據(jù)抽樣單位數(shù)目比較大的一個(gè)數(shù)目進(jìn)行抽樣，以滿足共同要求。統(tǒng)計(jì)學(xué)之9抽樣推斷即問即答在重復(fù)抽樣情況下，如果其它條件保持不變，要使允許誤差范圍縮小為原來的1/2，則樣本單位數(shù)目需要擴(kuò)大為原來的多少？反之，如果允許誤差范圍要求擴(kuò)大為原來的2倍，抽樣單位數(shù)目又要如何變化？統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷二、分類（層）抽樣類型抽樣：它是先對(duì)總體各單位按某種標(biāo)志分組，然后再從各組中按隨機(jī)原則抽選一定單位構(gòu)成樣本，再對(duì)樣本總體進(jìn)行觀察。優(yōu)點(diǎn)：能夠提高樣本的代表性，可降低影響抽樣平均誤差的方差。特點(diǎn)：是統(tǒng)計(jì)分組和抽樣法的結(jié)合。統(tǒng)計(jì)學(xué)之9抽樣推斷經(jīng)過劃類分組后，確定各類型組抽樣單位數(shù)一般有兩種方法：不等比例抽樣。即各類型組所抽選的單位數(shù)，按各類型組標(biāo)志值的變動(dòng)程度來確定，變動(dòng)程度大的多抽一些單位，變動(dòng)程度小的少抽一些單位，沒有統(tǒng)一的比例關(guān)系。等比例抽樣。即按照樣本單位數(shù)在各類之間分配的比重與總體在各類之間分配相同的比重進(jìn)行抽樣。統(tǒng)計(jì)學(xué)之9抽樣推斷等比例分層抽樣的抽樣平均誤差：

N=N1+N2+…+NK

n=n1+n2+…+nK等比例抽樣：分類抽樣總的抽樣誤差取決于各層內(nèi)的抽樣誤差，而各層內(nèi)的抽樣誤差又取決于各層內(nèi)部的方差和抽樣數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣條件下的計(jì)算公式(平均組內(nèi)方差)統(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣條件下的計(jì)算公式統(tǒng)計(jì)學(xué)之9抽樣推斷注意：分層抽樣的取決于各組內(nèi)方差的平均數(shù)，而總方差=組內(nèi)方差的平均數(shù)+組間方差，故分層抽樣的小于簡單隨機(jī)抽樣的。由于總體方差是確定數(shù)，因此類型抽樣分組（層）時(shí)，應(yīng)盡量增大組（層）間差異，縮小組（層）內(nèi)差異。提高抽樣效果。統(tǒng)計(jì)學(xué)之9抽樣推斷不等比例抽樣

根據(jù)各組中標(biāo)志變異的大小確定適當(dāng)?shù)某闃訑?shù)目，差異程度大的組多抽一些單位，差異程度小的組少抽一些單位。則統(tǒng)計(jì)學(xué)之9抽樣推斷例：某鄉(xiāng)全部糧食耕地5000畝，按平原和山區(qū)分類抽取630畝，計(jì)算各組平均畝產(chǎn)和標(biāo)準(zhǔn)差i

如下表。求抽樣平均誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷解：統(tǒng)計(jì)學(xué)之9抽樣推斷三、等距抽樣(機(jī)械抽樣、系統(tǒng)抽樣)等距抽樣：是先將總體單位按某一標(biāo)志排隊(duì)，計(jì)算出抽樣間隔，并在第一個(gè)抽樣間隔內(nèi)確定一個(gè)抽樣起點(diǎn)，再按固定的順序和相同的間隔來抽取樣本單位進(jìn)行觀察的一種抽樣方法。統(tǒng)計(jì)學(xué)之9抽樣推斷系統(tǒng)抽樣的具體做法如下：從N中抽取n個(gè)樣本單位，可先排隊(duì)，算出間隔距離k=N/n，現(xiàn)從第一至k個(gè)單位中確定抽樣起點(diǎn)（即第一個(gè)樣本單位），之后，每隔k個(gè)單位抽取一個(gè)樣本單位。(圖示如下：)iNkkki+ki+2ki+(n-1)kkk統(tǒng)計(jì)學(xué)之9抽樣推斷機(jī)械抽樣的優(yōu)點(diǎn)：能提高樣本單位分布的均勻性，樣本代表性較強(qiáng)。其要小于簡單隨機(jī)抽樣時(shí)的。樣本單位的抽取工作也比較容易開展。統(tǒng)計(jì)學(xué)之9抽樣推斷無關(guān)標(biāo)志排隊(duì)：——等距抽樣據(jù)以排隊(duì)的標(biāo)志與調(diào)查內(nèi)容沒有直接關(guān)系。其是按簡單隨機(jī)抽樣的公式近似計(jì)算的。因?yàn)闊o關(guān)標(biāo)志排隊(duì)的結(jié)果，從所要調(diào)查的標(biāo)志來看，總體單位的排列順序?qū)嶋H上仍是隨機(jī)的。所以，其抽樣起點(diǎn)i可以隨機(jī)確定，即可以是第一個(gè)抽樣距離內(nèi)的任一個(gè)總體單位：1?i?k，這樣得到的樣本完全遵循了隨機(jī)原則，不會(huì)產(chǎn)生系統(tǒng)偏差。而且抽樣效果十分接近簡單隨機(jī)。統(tǒng)計(jì)學(xué)之9抽樣推斷有關(guān)標(biāo)志排隊(duì)指據(jù)以排隊(duì)的標(biāo)志與調(diào)查內(nèi)容有密切關(guān)系。由于其排隊(duì)標(biāo)志與調(diào)查內(nèi)容有密切關(guān)系，排隊(duì)后，從所要調(diào)查的變量來看，總體單位也大致呈順序排列。所以其抽樣起點(diǎn)一般不宜隨機(jī)確定。否則，若在第一個(gè)抽樣間隔內(nèi)隨機(jī)地抽取一個(gè)標(biāo)志值較?。ɑ蜉^大）的單位作為抽樣起點(diǎn)，整個(gè)樣本勢必出現(xiàn)偏低（或偏高）的系統(tǒng)偏差。統(tǒng)計(jì)學(xué)之9抽樣推斷半距起點(diǎn)等距抽樣(中心系統(tǒng)抽樣)——以第一個(gè)抽樣間隔內(nèi)的中點(diǎn)為抽樣起點(diǎn)，并每隔k個(gè)單位抽一個(gè)單位。優(yōu)點(diǎn)：樣本代表性高。不足點(diǎn)：限制了抽樣的隨機(jī)性。統(tǒng)計(jì)學(xué)之9抽樣推斷對(duì)稱等距抽樣——在第一個(gè)抽樣間隔內(nèi)隨機(jī)地確定抽樣起點(diǎn)(1?i?k)

。然后以組界［k、2k、3k、…(n-1)k]為對(duì)稱點(diǎn)兩邊對(duì)稱地抽取樣本單位。如下圖所示：依次抽取的樣本單位序號(hào)分別為i、2k+i、2k-i、4k+i、、4k-i、6i+i、6k-i、…iNk(n-1)k2k3knk2K-i2K+i統(tǒng)計(jì)學(xué)之9抽樣推斷有關(guān)標(biāo)志排隊(duì)等距抽樣的計(jì)算：有關(guān)標(biāo)志排隊(duì)等距抽樣相當(dāng)于分層較多（將總體分為同等大小的n個(gè)層），而每層只抽取一個(gè)調(diào)查單位的特殊分層抽樣，所以其抽樣效果類似于分層抽樣，其一般按分層抽樣的抽樣平均誤差公式來近似計(jì)算。統(tǒng)計(jì)學(xué)之9抽樣推斷注意：等距抽樣需要有總體的輔助信息，以便于進(jìn)行單位的排序；等距抽樣要避免抽樣間隔和現(xiàn)象本身的周期、節(jié)奏重合而引起的系統(tǒng)性偏差。工業(yè)產(chǎn)品質(zhì)量檢查時(shí)，抽樣時(shí)間間隔不宜與上下班或交接班時(shí)間一致。例如：統(tǒng)計(jì)學(xué)之9抽樣推斷四、整群抽樣（集團(tuán)抽樣）整群抽樣：是將總體全部單位分為若干部分（每一部分稱為一個(gè)群體，簡稱群），然后以群為單位，按隨機(jī)原則從中抽取若干個(gè)群構(gòu)成樣本，對(duì)中選群內(nèi)的所有單位進(jìn)行全面調(diào)查的抽樣方法。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的特點(diǎn)：整群抽樣直接抽取的不是總體中的個(gè)體而是“群”，因此總體和樣本是由“群”組成的。總體中的每一群所包含的單位數(shù)有每一群的單位數(shù)相等和不盡相等兩種情況。影響抽樣誤差的方差是群間方差，群內(nèi)方差不影響抽樣誤差。整群抽樣是不重復(fù)抽樣，應(yīng)該用不重復(fù)抽樣公式計(jì)算抽樣平均誤差。

統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的優(yōu)點(diǎn)：由于是對(duì)中選群的全面調(diào)查，抽樣單位比較集中，所以整群抽樣能大大降低數(shù)據(jù)收集的費(fèi)用；當(dāng)總體中個(gè)體自然聚合成群（例如：住戶、學(xué)校）時(shí)，整群抽樣組織更加方便；如果對(duì)于調(diào)查變量而言，群內(nèi)單元差異較大，而不同群的差異較小，整群抽樣比簡單隨機(jī)抽樣的效率更高(例如為估計(jì)性別比采用按戶的整群抽樣)。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的缺點(diǎn)：對(duì)調(diào)查變量，若群內(nèi)個(gè)體有趨同性，則整群抽樣的抽樣效率比簡單隨機(jī)抽樣低，(這正是通常遇到的情況)，但對(duì)此項(xiàng)效率的損失可通過增加群的抽取個(gè)數(shù)來彌補(bǔ)；通常無法提前控制總樣本量，因?yàn)樵谶M(jìn)行調(diào)查前，我們通常不知道一個(gè)群內(nèi)到底有多少個(gè)個(gè)體；抽樣誤差的計(jì)算可能比簡單隨機(jī)抽樣更為復(fù)雜。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的取決于2的大小整群抽樣對(duì)中選群進(jìn)行全面調(diào)查，其樣本代表性取決于抽中群體對(duì)全部群體的代表性。假設(shè)各群體之間沒有差異（即各群體的內(nèi)部結(jié)構(gòu)完全相同），則抽樣誤差為0?？梢?，整群抽樣的取決于群間差異程度的大小，而不受群體內(nèi)部差異程度的影響。整群抽樣的原則是：使群間方差盡可能小，群內(nèi)方差盡可能大。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的計(jì)算：總體未知時(shí)可用樣本指標(biāo)替代。其中：統(tǒng)計(jì)學(xué)之9抽樣推斷例：某市保險(xiǎn)公司要調(diào)查居民家庭財(cái)產(chǎn)情況。該保險(xiǎn)公司調(diào)查組把該市的街道作為群，全市共100個(gè)街道，共100群。隨機(jī)抽選了18個(gè)街道(18群)進(jìn)行了調(diào)查。調(diào)查結(jié)果樣本平均數(shù)（樣本中居民平均家庭財(cái)產(chǎn)數(shù)）為40000元，樣本群間方差為(5100元)２。試以95.45%的置信度估計(jì)全市平均家庭財(cái)產(chǎn)數(shù)。統(tǒng)計(jì)學(xué)之9抽樣推斷解：已知：，R=100，r=18，t=2則：置信區(qū)間：統(tǒng)計(jì)學(xué)之9抽樣推斷五、多階段抽樣(多級(jí)抽樣)多階段抽樣：它是先從總體中抽取一級(jí)單位，再從一級(jí)單位中抽取二級(jí)單位……如此下去，最后才抽取所要調(diào)查的基本單位的一種抽樣形式。統(tǒng)計(jì)學(xué)之9抽樣推斷優(yōu)點(diǎn)：是比整群抽樣靈活，在樣本容量相同的條件下，多階段抽樣的樣本單位在總體中的散布比整群抽樣均勻。此外，它還可以利用現(xiàn)成的行政區(qū)劃組織系統(tǒng)作為劃分各階段的依據(jù)。缺點(diǎn)：調(diào)查結(jié)果的精確性不太高，計(jì)算、分析比較復(fù)雜。統(tǒng)計(jì)學(xué)之9抽樣推斷以兩階段抽樣為例兩階段抽樣在組織技術(shù)上是整群抽樣和類型抽樣的綜合。先將總體分為R群，每群包含Mi個(gè)單位，假定N=M1+M2+M3+

+MR=RM

，n1=m1+m2+m3+

+mro=rm。在每個(gè)階段都是隨機(jī)抽取樣本，都會(huì)產(chǎn)生隨機(jī)誤差，因此計(jì)算時(shí)要綜合兩階段的誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷以xij表示第i樣本群第j個(gè)樣本單位的標(biāo)志值：第一階段抽樣平均數(shù)的方差為：第二階段抽樣平均數(shù)的方差為：統(tǒng)計(jì)學(xué)之9抽樣推斷兩階段抽樣平均誤差為：或者統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第五節(jié)必要抽樣數(shù)目的確定必要抽樣數(shù)目：是指為了完成抽樣調(diào)查任務(wù)，滿足抽樣調(diào)查的各項(xiàng)要求，也就是為了保證抽樣推斷能達(dá)到預(yù)期的可靠程度和精確度的要求，而科學(xué)計(jì)算的需要抽取的樣本單位數(shù)。即樣本單位數(shù)“n”的具體數(shù)值，也叫樣本容量。

統(tǒng)計(jì)學(xué)之9抽樣推斷一、影響必要抽樣數(shù)目的因素總體各單位間的標(biāo)志變異程度極限抽樣誤差的大小調(diào)查結(jié)果的概率保證程度抽樣方法和抽樣的組織形式。二、必要抽樣數(shù)目的計(jì)算統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣（一）簡單隨機(jī)抽樣方式下的n統(tǒng)計(jì)學(xué)之9抽樣推斷【例】1：某市對(duì)職工收入抽樣調(diào)查，已知職工平均每人每月收入的標(biāo)準(zhǔn)差為220元，要求把握度為95.45%，允許誤差為15元，則需抽查人數(shù)為：統(tǒng)計(jì)學(xué)之9抽樣推斷【例】2：調(diào)查一批帳單的差錯(cuò)率。根據(jù)以往的資料，差錯(cuò)率曾有過1%，3%，5%三種情況?，F(xiàn)在要求把握度為95%，允許誤差為１％，則需抽查的帳單數(shù)為：統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣（二）類型抽樣方式下的n統(tǒng)計(jì)學(xué)之9抽樣推斷（三）等距抽樣方式下的n

等距抽樣一般都采用不重復(fù)抽樣的方式，按無關(guān)標(biāo)志排隊(duì)的抽樣，用簡單隨機(jī)不重復(fù)抽樣公式確定樣本容量；按有關(guān)標(biāo)志排序的抽樣，用類型不重復(fù)抽樣公式確定樣本容量（公式從略）。統(tǒng)計(jì)學(xué)之9抽樣推斷（四）整群抽樣方式下的n

整群抽樣一般采用不重復(fù)抽樣，它的必要抽樣數(shù)目的計(jì)算公式和簡單隨機(jī)抽樣的計(jì)算公式從結(jié)構(gòu)上講基本上是一致的。其不同之處有兩個(gè)方面：一是標(biāo)志變異指標(biāo)不同。簡單隨機(jī)條件下必要抽樣數(shù)目計(jì)算公式中的標(biāo)志變異指標(biāo)是總體方差。而整群抽樣條件下的計(jì)算公式是群間方差。二是采用的單位數(shù)目不同。簡單隨機(jī)抽樣公式中總體單位數(shù)和樣本單位數(shù)分別用N、n表示。而整群抽樣公式中總體群數(shù)和抽樣群數(shù)分別用R、r表示。其計(jì)算公式為：統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣要計(jì)算必要抽取的群數(shù)r統(tǒng)計(jì)學(xué)之9抽樣推斷三、確定n應(yīng)該注意的問題必要抽樣數(shù)目應(yīng)大于30。實(shí)際調(diào)查時(shí)可對(duì)計(jì)算的必要抽樣數(shù)目進(jìn)行調(diào)整當(dāng)總體單位數(shù)不大時(shí)，如果采用不重復(fù)抽樣的方法抽取樣本，必須應(yīng)用不重復(fù)抽樣的計(jì)算公式計(jì)算必要抽樣數(shù)目；當(dāng)總體單位數(shù)很大時(shí)，雖然采用不重復(fù)抽樣方法，亦可采用重復(fù)抽樣的計(jì)算公式計(jì)算必要抽樣數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷當(dāng)抽樣調(diào)查是為了檢驗(yàn)全面統(tǒng)計(jì)數(shù)字的質(zhì)量時(shí)，全及總體的標(biāo)志變異指標(biāo)或p(1–p)是有實(shí)際資料的，可以直接代入公式計(jì)算必要抽樣數(shù)目。如有幾個(gè)方差可以選用時(shí)，宜選擇最大數(shù)值。一個(gè)總體往往同時(shí)計(jì)算抽樣平均數(shù)和抽樣成數(shù)。由于它們的方差和允許誤差范圍不同，因此，需要的必要抽樣數(shù)目也不相同。為了防止由于樣本單位數(shù)不足而擴(kuò)大抽樣誤差，在實(shí)際工作中往往根據(jù)比較大的必要抽樣數(shù)目進(jìn)行抽樣，以滿足共同的需要。統(tǒng)計(jì)學(xué)之

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)之9 抽樣推斷

文檔簡介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)之9 抽樣推斷

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔