抽樣調(diào)查與參數(shù)估計(jì)_第1頁(yè)
抽樣調(diào)查與參數(shù)估計(jì)_第2頁(yè)
抽樣調(diào)查與參數(shù)估計(jì)_第3頁(yè)
抽樣調(diào)查與參數(shù)估計(jì)_第4頁(yè)
抽樣調(diào)查與參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩134頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、4-1第四章第四章 抽樣調(diào)查與參數(shù)估計(jì)抽樣調(diào)查與參數(shù)估計(jì)(6課時(shí))課時(shí))n第一節(jié)第一節(jié) 有關(guān)基本概念有關(guān)基本概念 n第二節(jié)第二節(jié) 概率抽樣方法概率抽樣方法n第三節(jié)第三節(jié) 總體參數(shù)估計(jì)總體參數(shù)估計(jì)n第四節(jié)第四節(jié) 調(diào)查問(wèn)卷的設(shè)計(jì)調(diào)查問(wèn)卷的設(shè)計(jì)4-2抽樣與參數(shù)估計(jì)抽樣與參數(shù)估計(jì)有關(guān)基本概念有關(guān)基本概念概率抽樣方法概率抽樣方法調(diào)查問(wèn)卷設(shè)計(jì)調(diào)查問(wèn)卷設(shè)計(jì)總體參數(shù)估計(jì)總體參數(shù)估計(jì)總體與樣本總體與樣本總體參數(shù)與樣總體參數(shù)與樣本統(tǒng)計(jì)量本統(tǒng)計(jì)量樣本容量與樣本容量與樣本個(gè)數(shù)樣本個(gè)數(shù)重復(fù)抽樣與重復(fù)抽樣與不重復(fù)抽樣不重復(fù)抽樣抽樣框與抽樣抽樣框與抽樣單位單位概率抽樣和概率抽樣和非概率抽樣非概率抽樣多相抽樣多相抽樣分層抽樣

2、分層抽樣簡(jiǎn)單隨機(jī)簡(jiǎn)單隨機(jī)抽樣抽樣總體方差的總體方差的參數(shù)估計(jì)參數(shù)估計(jì)總體比率的參總體比率的參數(shù)估計(jì)數(shù)估計(jì)總體均值的總體均值的參數(shù)估計(jì)參數(shù)估計(jì)問(wèn)卷的措辭問(wèn)卷的措辭調(diào)查問(wèn)卷的調(diào)查問(wèn)卷的作用和結(jié)構(gòu)作用和結(jié)構(gòu)抽樣誤差和抽樣誤差和非抽樣誤差非抽樣誤差整群抽樣整群抽樣系統(tǒng)抽樣系統(tǒng)抽樣多階段抽樣多階段抽樣樣本容量的樣本容量的參數(shù)確定參數(shù)確定調(diào)查問(wèn)卷的調(diào)查問(wèn)卷的類型類型詢問(wèn)方法詢問(wèn)方法問(wèn)題的順序問(wèn)題的順序4-3n抽樣涉及的基本概念有:抽樣涉及的基本概念有:n總體與樣本總體與樣本(見第一章見第一章)n樣本容量與樣本個(gè)數(shù)樣本容量與樣本個(gè)數(shù)n總體參數(shù)與樣本統(tǒng)計(jì)量總體參數(shù)與樣本統(tǒng)計(jì)量n重復(fù)抽樣與不重復(fù)抽樣重復(fù)抽樣與不

3、重復(fù)抽樣n抽樣框與抽樣單位抽樣框與抽樣單位n概率抽樣和非概率抽樣概率抽樣和非概率抽樣n抽樣的組織方式抽樣的組織方式n抽樣誤差好非抽樣誤差抽樣誤差好非抽樣誤差n這些概念是統(tǒng)計(jì)學(xué)特有的,體現(xiàn)了統(tǒng)計(jì)學(xué)的這些概念是統(tǒng)計(jì)學(xué)特有的,體現(xiàn)了統(tǒng)計(jì)學(xué)的基本思想與方法?;舅枷肱c方法。第一節(jié)第一節(jié) 有關(guān)基本概念有關(guān)基本概念4-4一、總體和樣本總體和樣本:總體是指研究對(duì)象的全體,它是由研究對(duì)象中的單元組成的??傮w中包含單元的數(shù)目稱作總體容量(或大?。粯颖臼侵赋闃訒r(shí)按照抽樣的規(guī)則所抽中的那部分單元所組成的集合??傮w樣本抽取樣本推斷總體4-5n1.總體:又稱全及總體、母體,指所要研究對(duì)總體:又稱全及總體、母體,指所要

4、研究對(duì)象的全體,由許多客觀存在的具有某種共同象的全體,由許多客觀存在的具有某種共同性質(zhì)的單位構(gòu)成。總體單位數(shù)用性質(zhì)的單位構(gòu)成??傮w單位數(shù)用 n 表示。表示。n2.樣本:又稱子樣,來(lái)自總體,是從總體中按樣本:又稱子樣,來(lái)自總體,是從總體中按隨機(jī)原則抽選出來(lái)的部分,由抽選的單位構(gòu)隨機(jī)原則抽選出來(lái)的部分,由抽選的單位構(gòu)成。樣本單位數(shù)用成。樣本單位數(shù)用 n 表示。表示。n3.總體是唯一的、確定的,而樣本是不確定的、總體是唯一的、確定的,而樣本是不確定的、可變的、隨機(jī)的??勺兊?、隨機(jī)的。 4-6二、樣本容量與樣本個(gè)數(shù)二、樣本容量與樣本個(gè)數(shù)n樣本容量:一個(gè)樣本中所包含的單位數(shù),用樣本容量:一個(gè)樣本中所包含

5、的單位數(shù),用n表示。必要樣本量是能夠滿足估計(jì)精度要表示。必要樣本量是能夠滿足估計(jì)精度要求的最少樣本量。求的最少樣本量。n樣本個(gè)數(shù):又稱樣本可能數(shù)目,指從一個(gè)總樣本個(gè)數(shù):又稱樣本可能數(shù)目,指從一個(gè)總體中所可能抽取的樣本的個(gè)數(shù)。用體中所可能抽取的樣本的個(gè)數(shù)。用a表示。表示。對(duì)于有限總體,樣本個(gè)數(shù)可以計(jì)算出來(lái)。樣對(duì)于有限總體,樣本個(gè)數(shù)可以計(jì)算出來(lái)。樣本個(gè)數(shù)的多少與抽樣方法有關(guān)。本個(gè)數(shù)的多少與抽樣方法有關(guān)。(這個(gè)概念只這個(gè)概念只是對(duì)有限總體有意義,對(duì)無(wú)限總體沒(méi)有意是對(duì)有限總體有意義,對(duì)無(wú)限總體沒(méi)有意義!義!)n當(dāng)當(dāng)n和和n一定時(shí),一定時(shí),a的多少與抽樣方法有關(guān),的多少與抽樣方法有關(guān),其計(jì)算方法列表如下

6、:其計(jì)算方法列表如下:4-7三、總體參數(shù)和樣本統(tǒng)計(jì)量三、總體參數(shù)和樣本統(tǒng)計(jì)量n總體參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的??傮w參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的。n樣本統(tǒng)計(jì)量:根據(jù)樣本分布計(jì)算的指標(biāo)。是隨機(jī)變量。樣本統(tǒng)計(jì)量:根據(jù)樣本分布計(jì)算的指標(biāo)。是隨機(jī)變量。平均數(shù)平均數(shù)標(biāo)準(zhǔn)差、方差標(biāo)準(zhǔn)差、方差成數(shù)成數(shù)參數(shù)參數(shù) 、 2p統(tǒng)計(jì)量統(tǒng)計(jì)量s、 s2p總體總體樣本樣本x22()1x xsn22()1ffx xs四、重復(fù)抽樣和不重復(fù)抽樣四、重復(fù)抽樣和不重復(fù)抽樣n1、重復(fù)抽樣又稱放回抽樣或重置抽樣,它是指抽中、重復(fù)抽樣又稱放回抽樣或重置抽樣,它是指抽中一個(gè)單位并登記有關(guān)信息

7、后重新放回到總體中繼續(xù)一個(gè)單位并登記有關(guān)信息后重新放回到總體中繼續(xù)參加下一次的抽選,這樣逐次反復(fù),直到抽夠足夠參加下一次的抽選,這樣逐次反復(fù),直到抽夠足夠的單位為止。在重復(fù)抽樣的條件下,每個(gè)單位中選的單位為止。在重復(fù)抽樣的條件下,每個(gè)單位中選的機(jī)會(huì)在各次抽樣中都完全相等。的機(jī)會(huì)在各次抽樣中都完全相等。n2、不重復(fù)抽樣又稱不放回抽樣或不重置抽樣,它是、不重復(fù)抽樣又稱不放回抽樣或不重置抽樣,它是指抽中一個(gè)單位并登記有關(guān)信息后不再放回到總體指抽中一個(gè)單位并登記有關(guān)信息后不再放回到總體中,而是繼續(xù)從總體中余下的單位抽選樣本單位,中,而是繼續(xù)從總體中余下的單位抽選樣本單位,直到抽夠足夠的單位為止。在不重

8、復(fù)抽樣的條件下,直到抽夠足夠的單位為止。在不重復(fù)抽樣的條件下,每個(gè)單位中選的機(jī)會(huì)在各次抽樣中是不相等的,每每個(gè)單位中選的機(jī)會(huì)在各次抽樣中是不相等的,每個(gè)單位只能被抽中一次。個(gè)單位只能被抽中一次。4-84-9 五、抽樣框和樣本單位五、抽樣框和樣本單位n抽樣框是在抽樣前,為便于抽樣工作的組織,抽樣框是在抽樣前,為便于抽樣工作的組織,在可能條件下編制的用來(lái)進(jìn)行抽樣的、記錄或在可能條件下編制的用來(lái)進(jìn)行抽樣的、記錄或表明總體所有抽樣單元的框架,在抽樣框中,表明總體所有抽樣單元的框架,在抽樣框中,每個(gè)抽樣單元都被編上號(hào)碼。抽樣框可以是一每個(gè)抽樣單元都被編上號(hào)碼。抽樣框可以是一份清單(名單抽樣框)、一張地圖

9、(區(qū)域抽樣份清單(名單抽樣框)、一張地圖(區(qū)域抽樣框)??颍?。 n編制抽樣框是一個(gè)實(shí)際的、重要的問(wèn)題,因此編制抽樣框是一個(gè)實(shí)際的、重要的問(wèn)題,因此必須要認(rèn)真對(duì)待。必須要認(rèn)真對(duì)待。n常見的抽樣框問(wèn)題可以概括為四種基本類型:常見的抽樣框問(wèn)題可以概括為四種基本類型:n(1)缺失一些元素,即抽樣框涵蓋不完全;缺失一些元素,即抽樣框涵蓋不完全;n(2)多個(gè)元素對(duì)應(yīng)一個(gè)號(hào)碼;多個(gè)元素對(duì)應(yīng)一個(gè)號(hào)碼;n(3)空白或存在異類元素;空白或存在異類元素;n(4)重復(fù)號(hào)碼,即一個(gè)元素對(duì)應(yīng)多個(gè)號(hào)碼。重復(fù)號(hào)碼,即一個(gè)元素對(duì)應(yīng)多個(gè)號(hào)碼。n對(duì)抽樣框存在的缺陷要認(rèn)真對(duì)待,有效處理。對(duì)抽樣框存在的缺陷要認(rèn)真對(duì)待,有效處理。n從抽

10、樣框中直接抽取的單位稱為抽樣單位。但它不一定從抽樣框中直接抽取的單位稱為抽樣單位。但它不一定是構(gòu)成抽樣框的最小單位。根據(jù)不同的抽樣設(shè)計(jì),抽樣是構(gòu)成抽樣框的最小單位。根據(jù)不同的抽樣設(shè)計(jì),抽樣單位有較大的變動(dòng)余地。例如在電視收視率的抽樣調(diào)查單位有較大的變動(dòng)余地。例如在電視收視率的抽樣調(diào)查中,抽樣單位可以是擁有電視機(jī)的家庭,也可以是每個(gè)中,抽樣單位可以是擁有電視機(jī)的家庭,也可以是每個(gè)電視觀眾。可以將較小的抽樣單位的集合視為較大的抽電視觀眾??梢詫⑤^小的抽樣單位的集合視為較大的抽樣單位。在復(fù)雜抽樣時(shí),例如在多階段抽樣中,先抽取樣單位。在復(fù)雜抽樣時(shí),例如在多階段抽樣中,先抽取較大的抽樣單位較大的抽樣單位

11、(稱為初級(jí)單位稱為初級(jí)單位),再?gòu)倪x出的初級(jí)單位,再?gòu)倪x出的初級(jí)單位中抽取次級(jí)單位中抽取次級(jí)單位(或二級(jí)單位或二級(jí)單位),往下還可以分為更小的,往下還可以分為更小的三級(jí)單位、四級(jí)單位,等等。三級(jí)單位、四級(jí)單位,等等。n 可以把抽樣框中所包含抽樣單位信息的豐富程度作可以把抽樣框中所包含抽樣單位信息的豐富程度作為評(píng)價(jià)抽樣框質(zhì)量的一個(gè)標(biāo)準(zhǔn)。在好的抽樣框中,抽樣為評(píng)價(jià)抽樣框質(zhì)量的一個(gè)標(biāo)準(zhǔn)。在好的抽樣框中,抽樣單位的信息比較豐富,這就為采用復(fù)雜的抽樣設(shè)計(jì)單位的信息比較豐富,這就為采用復(fù)雜的抽樣設(shè)計(jì)(如如分層抽樣分層抽樣)和不同的估計(jì)方法和不同的估計(jì)方法(如比率估計(jì)如比率估計(jì))提供了條件。提供了條件。n

12、4-104-11六、概率抽樣和非概率抽樣六、概率抽樣和非概率抽樣簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣分分層層抽抽樣樣整整群群抽抽樣樣系系統(tǒng)統(tǒng)抽抽樣樣多多階階段段抽抽樣樣概概率率抽抽樣樣方方便便抽抽樣樣判判斷斷抽抽樣樣自自愿愿樣樣本本滾滾雪雪球球抽抽樣樣配配額額抽抽樣樣非非概概率率抽抽樣樣抽抽樣樣方方式式4-12(一)(一)非概率抽樣非概率抽樣1.非概率抽樣及其優(yōu)缺點(diǎn)非概率抽樣及其優(yōu)缺點(diǎn)n非概率抽樣是用非隨機(jī)的方法抽選樣本。非概率抽樣是用非隨機(jī)的方法抽選樣本。n優(yōu)點(diǎn):優(yōu)點(diǎn):n快速簡(jiǎn)便;快速簡(jiǎn)便;n費(fèi)用相對(duì)比較低;費(fèi)用相對(duì)比較低;n不需要任何抽樣框;不需要任何抽樣框;n對(duì)探索性研究和調(diào)查設(shè)計(jì)的開發(fā)很有用。對(duì)探

13、索性研究和調(diào)查設(shè)計(jì)的開發(fā)很有用。n缺點(diǎn):缺點(diǎn):n不能對(duì)總體進(jìn)行推斷;不能對(duì)總體進(jìn)行推斷;n由于不知總體單元的入樣概率,故不能計(jì)由于不知總體單元的入樣概率,故不能計(jì)算估計(jì)值的抽樣誤差。算估計(jì)值的抽樣誤差。4-132.各種非概率抽樣方法方便抽樣,又稱任意抽樣。樣本單元的選取有調(diào)查員決定,又被調(diào)查者主動(dòng)提供信息。如街道攔截訪問(wèn)。志愿者抽樣。被調(diào)查者都是自愿參與調(diào)查。如網(wǎng)上問(wèn)卷,自愿回答。判斷抽樣。由專家有目的地挑選“有代表性”的樣本進(jìn)行調(diào)查。如典型調(diào)查。配額抽樣。從總體的各個(gè)子總體中選取特定數(shù)量的樣本單元組成樣本。如市場(chǎng)調(diào)查中,規(guī)定男女消費(fèi)者的樣本各多少。 滾雪球抽樣。適合于總體中某種較為稀少的特殊

14、子總體而又缺少完整的抽樣框。抽樣時(shí)通過(guò)已知的少數(shù)個(gè)體獲得信息逐漸擴(kuò)大。4-14(二)概率抽樣(二)概率抽樣n概率抽樣是從總體中隨機(jī)抽選樣本單元,被抽概率抽樣是從總體中隨機(jī)抽選樣本單元,被抽中的單元既不取決于調(diào)查人員的愿望,也不取中的單元既不取決于調(diào)查人員的愿望,也不取決于被被調(diào)查者的態(tài)度。其次每一個(gè)單元都有決于被被調(diào)查者的態(tài)度。其次每一個(gè)單元都有一定的概率被抽中。一定的概率被抽中。n優(yōu)點(diǎn):可以對(duì)總體進(jìn)行推斷,并能計(jì)算估計(jì)值優(yōu)點(diǎn):可以對(duì)總體進(jìn)行推斷,并能計(jì)算估計(jì)值的抽樣誤差。的抽樣誤差。n缺點(diǎn):相對(duì)于非概率抽樣,設(shè)計(jì)比較復(fù)雜,而缺點(diǎn):相對(duì)于非概率抽樣,設(shè)計(jì)比較復(fù)雜,而且費(fèi)用也比較高。且費(fèi)用也比較

15、高。n常見的概率抽樣方法主要有:簡(jiǎn)單隨機(jī)抽樣、常見的概率抽樣方法主要有:簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、與大?。ɑ蛞?guī)模)成比例的概率系統(tǒng)抽樣、與大?。ɑ蛞?guī)模)成比例的概率(pps)抽樣、整群抽樣、分層抽樣(抽樣、整群抽樣、分層抽樣(str)、多)、多階抽樣、以及多相抽樣等。階抽樣、以及多相抽樣等。 七、抽樣誤差和非抽樣誤差七、抽樣誤差和非抽樣誤差n抽樣誤差是指由于抽選樣本的隨機(jī)性,用樣本數(shù)據(jù)對(duì)抽樣誤差是指由于抽選樣本的隨機(jī)性,用樣本數(shù)據(jù)對(duì)總體參數(shù)進(jìn)行估計(jì)是所引起的誤差。只有采取概率抽總體參數(shù)進(jìn)行估計(jì)是所引起的誤差。只有采取概率抽樣方式才能產(chǎn)生樣誤差,得到估計(jì)量的精度,因此我樣方式才能產(chǎn)生樣誤差,得到估

16、計(jì)量的精度,因此我們說(shuō)抽樣誤差僅僅表現(xiàn)于概率抽樣方式之中。與非概們說(shuō)抽樣誤差僅僅表現(xiàn)于概率抽樣方式之中。與非概率抽樣方式相比,能夠計(jì)算抽樣誤差是概率抽樣最突率抽樣方式相比,能夠計(jì)算抽樣誤差是概率抽樣最突出的優(yōu)點(diǎn)。出的優(yōu)點(diǎn)。n非抽樣誤差是指除抽樣誤差以外的,由于各種原因而非抽樣誤差是指除抽樣誤差以外的,由于各種原因而引起的誤差,例如抽樣框有缺陷,目標(biāo)總體單位和抽引起的誤差,例如抽樣框有缺陷,目標(biāo)總體單位和抽樣單位沒(méi)有能夠一一對(duì)應(yīng);調(diào)查中一些被調(diào)查者拒絕樣單位沒(méi)有能夠一一對(duì)應(yīng);調(diào)查中一些被調(diào)查者拒絕回答問(wèn)題,調(diào)查人員沒(méi)得到全部樣本數(shù)據(jù);由于各種回答問(wèn)題,調(diào)查人員沒(méi)得到全部樣本數(shù)據(jù);由于各種原因原因

17、(測(cè)量、遺忘或有意隱瞞等測(cè)量、遺忘或有意隱瞞等),調(diào)查中獲得的原始,調(diào)查中獲得的原始數(shù)據(jù)不正確,以及在對(duì)調(diào)查數(shù)據(jù)進(jìn)行編碼、錄入、匯數(shù)據(jù)不正確,以及在對(duì)調(diào)查數(shù)據(jù)進(jìn)行編碼、錄入、匯總過(guò)程中可能出現(xiàn)差錯(cuò),都會(huì)產(chǎn)生非抽樣誤差??傔^(guò)程中可能出現(xiàn)差錯(cuò),都會(huì)產(chǎn)生非抽樣誤差。4-15八、樣本量、費(fèi)用與精度八、樣本量、費(fèi)用與精度n樣本量是樣本中包含抽樣單位的數(shù)目,樣本量的確樣本量是樣本中包含抽樣單位的數(shù)目,樣本量的確定是抽樣中的一個(gè)重要問(wèn)題,樣本量越大,抽樣誤定是抽樣中的一個(gè)重要問(wèn)題,樣本量越大,抽樣誤差就越小,估計(jì)量的精度就越高。但樣本量有直接差就越小,估計(jì)量的精度就越高。但樣本量有直接與費(fèi)用有關(guān),樣本量越大

18、調(diào)查的費(fèi)用也就越高。樣與費(fèi)用有關(guān),樣本量越大調(diào)查的費(fèi)用也就越高。樣本量與調(diào)查費(fèi)用之間是一種線性關(guān)系,最簡(jiǎn)單的函本量與調(diào)查費(fèi)用之間是一種線性關(guān)系,最簡(jiǎn)單的函數(shù)形式為數(shù)形式為n式中,式中,c0是與樣本量是與樣本量n無(wú)關(guān)的固定費(fèi)用,如抽樣方無(wú)關(guān)的固定費(fèi)用,如抽樣方案的設(shè)計(jì)案的設(shè)計(jì),抽樣框的準(zhǔn)備,調(diào)查的組織、宣傳等項(xiàng)開抽樣框的準(zhǔn)備,調(diào)查的組織、宣傳等項(xiàng)開支,支,c是與是與n有關(guān)的費(fèi)用,包括調(diào)查本身的費(fèi)用、旅有關(guān)的費(fèi)用,包括調(diào)查本身的費(fèi)用、旅費(fèi)、禮品費(fèi)及數(shù)據(jù)處理費(fèi)等。費(fèi)、禮品費(fèi)及數(shù)據(jù)處理費(fèi)等。4-16cncc0n然而樣本量與調(diào)查精度之間是一種非線性關(guān)系。在然而樣本量與調(diào)查精度之間是一種非線性關(guān)系。在樣本

19、量較小時(shí),每增加一個(gè)樣本單位對(duì)提高精度的樣本量較小時(shí),每增加一個(gè)樣本單位對(duì)提高精度的影響比較大,隨著樣本量的增大,每增加一個(gè)樣本影響比較大,隨著樣本量的增大,每增加一個(gè)樣本單位的影響就逐漸減少。單位的影響就逐漸減少。n因此,一個(gè)好的抽樣設(shè)計(jì)必須考慮精度與費(fèi)用兩個(gè)因此,一個(gè)好的抽樣設(shè)計(jì)必須考慮精度與費(fèi)用兩個(gè)方面。這里想要說(shuō)明的一層含義是:對(duì)于不同的調(diào)方面。這里想要說(shuō)明的一層含義是:對(duì)于不同的調(diào)查項(xiàng)目,精度的要求是不同的,調(diào)查時(shí)應(yīng)以滿足需查項(xiàng)目,精度的要求是不同的,調(diào)查時(shí)應(yīng)以滿足需要的精度為原則,想要說(shuō)明的另一唱層含義是,由要的精度為原則,想要說(shuō)明的另一唱層含義是,由于不同的抽樣設(shè)計(jì)會(huì)有不同的費(fèi)用

20、和精度,因此對(duì)于不同的抽樣設(shè)計(jì)會(huì)有不同的費(fèi)用和精度,因此對(duì)于一個(gè)具體的抽樣設(shè)計(jì),應(yīng)盡量做到在一定費(fèi)用下于一個(gè)具體的抽樣設(shè)計(jì),應(yīng)盡量做到在一定費(fèi)用下使精度最高,或在達(dá)到精度條件下使總費(fèi)用最省,使精度最高,或在達(dá)到精度條件下使總費(fèi)用最省,即使設(shè)計(jì)的效率最高,這樣的抽樣設(shè)計(jì)稱為最優(yōu)抽即使設(shè)計(jì)的效率最高,這樣的抽樣設(shè)計(jì)稱為最優(yōu)抽樣設(shè)計(jì)。樣設(shè)計(jì)。4-174-18第二節(jié) 主要的概率抽樣方法 (一)簡(jiǎn)單隨機(jī)抽樣 1、定義:簡(jiǎn)單隨機(jī)抽樣是從總體的n個(gè)抽樣單元中,每次抽取一個(gè)單元時(shí),使每一個(gè)單元都有相等的概率被抽中,連續(xù)抽n次,以抽中的n個(gè)單元組成簡(jiǎn)單隨機(jī)樣本。 2、優(yōu)點(diǎn): (1)比較容易理解和掌握;(2)抽樣

21、框不需要其他輔助信息;(3)理論上比較成熟,有現(xiàn)成的方差估計(jì)公式。 3、缺點(diǎn): (1)沒(méi)有利用輔助信息;(2)樣本分散,面訪費(fèi)用較高;(3)有可能抽到較差的樣本;(4)抽選大樣本比較費(fèi)時(shí)。4-19(二)系統(tǒng)抽樣 1、定義:又稱等距抽樣,對(duì)研究的總體按一定的順序排列,每隔一定的間隔抽取一個(gè)單元的抽樣方法。 2、抽選方法:設(shè)總體單元數(shù)為n,要抽n個(gè)單元為樣本,先計(jì)算抽樣間隔k=n/n,在1到k之間抽取一個(gè)隨機(jī)起點(diǎn)r,則被抽中單元的順序位置是:r,r+k,r+2k,。起點(diǎn)rr+kr+2kr+3k4-20 圓形系統(tǒng)抽樣方法:當(dāng)n不能被n整除時(shí),用圓形系統(tǒng)抽樣法可以避免出現(xiàn)樣本量可能不一致的情況。把總體

22、單元假想排列在一個(gè)圓上,取 k = n/n 最接近的整數(shù),作為間隔,然后在1到n之間,抽取隨機(jī)起點(diǎn) r,則被抽中的單元順序號(hào)為: r,r+k,r+2k,r+(n-1)k。 如:n=55,n=9,就取k=6,在1到55之間取一個(gè)隨機(jī)起點(diǎn)。例如r=42,則被抽中的單元是42,48,54,5,11,17,23,29和35 。4-213、系統(tǒng)抽樣的優(yōu)點(diǎn)(1)沒(méi)有抽樣框時(shí)可代替簡(jiǎn)單隨機(jī)抽樣方法簡(jiǎn)單;(2)不需要輔助的抽樣框信息;(3)樣本的分布比較好;估計(jì)值容易計(jì)算。 4、系統(tǒng)抽樣的缺點(diǎn) (1)若抽樣間隔與總體的某種周期性變化一致,會(huì)得一個(gè)差的樣本;(2)不使用輔助信息使抽樣效率不高;(3)使用概念框時(shí)

23、,不能預(yù)先知道樣本量;(4)沒(méi)有一個(gè)無(wú)偏的方差估計(jì)量;(5)當(dāng)n不能被n整除時(shí)會(huì)得到樣本量不同的樣本。4-22(三)整群抽樣 1、定義:由若干個(gè)有聯(lián)系的基本單元組成的集合稱為群,抽樣時(shí)以群為抽樣單元的抽樣方法就稱為整群抽樣。 整群抽樣示意圖:黃色為總體紅色為群白點(diǎn)為基本單元4-232、整群抽樣的優(yōu)點(diǎn):(1)能大大減低收集數(shù)據(jù)的費(fèi)用;(2)當(dāng)總體單元自然形成的群時(shí),容易取得抽樣框,抽樣也更容易;(3)當(dāng)群內(nèi)單元差異大,而不同群之間的差異小時(shí),可以提高效率。3、缺點(diǎn):(1)若群內(nèi)個(gè)單元有趨同性,效率將會(huì)降低;(2)通常無(wú)法預(yù)先知道總樣本量,因?yàn)椴恢廊簝?nèi)有多少單元;(3)方差估計(jì)比簡(jiǎn)單隨機(jī)抽樣更為

24、復(fù)雜。4-24(四)分層抽樣 1、定義:在抽樣之前將總體分為同質(zhì)的、互不重疊的若干子總體,也稱為層。然后在每一個(gè)層獨(dú)立地隨機(jī)抽取樣本。 分層抽樣示意圖:4-252、優(yōu)點(diǎn):(1)由于性質(zhì)相同的單元分在同一層,層內(nèi)差異縮小,可以提高抽樣效率;(2)可以得到各層子總體的估計(jì);(3)操作與管理方便;(4)能避免得到一個(gè)“差”的樣本。3、缺點(diǎn):(1)對(duì)抽樣框的要求比較高,必須有分層的輔助信息;(2)收集或編制抽樣框的費(fèi)用比較高;(3)若調(diào)查變量與分層的變量不相關(guān),效率可能降低;(4)估計(jì)值的計(jì)算比簡(jiǎn)單隨機(jī)抽樣復(fù)雜。4-26(五)多階抽樣 1、定義:它是由兩個(gè)或更多個(gè)連續(xù)的階段抽取樣本的方法。 多階抽樣示

25、意圖:總體第一階樣本最終樣本4-272、優(yōu)點(diǎn):(1)當(dāng)群具有同質(zhì)性時(shí),多階抽樣的效率高于整群抽樣;(2)樣本的分布比簡(jiǎn)單隨機(jī)抽樣集中,采用面訪可以節(jié)約時(shí)間和費(fèi)用;(3)不需要整個(gè)總體單元的名錄框,只要群的名錄框和抽中群的單元名錄框。3、缺點(diǎn):(1)效率不如簡(jiǎn)單隨機(jī)抽樣;(2)通常不能提前知道最終的樣本量;(3)調(diào)查的組織較整群抽樣復(fù)雜;(4)估計(jì)值與抽樣方差的計(jì)算較為復(fù)雜。4-28(六)多相抽樣 1、定義:在同一個(gè)抽樣框內(nèi),先抽一個(gè)大樣本,收集基本的信息,然后在這個(gè)大樣本中再抽一個(gè)子樣本,收集調(diào)查的詳細(xì)信息。 多相抽樣示意圖:。第一相樣本第二相樣本4-29n2、優(yōu)點(diǎn):能顯著提高估計(jì)值精度(與簡(jiǎn)

26、單隨、優(yōu)點(diǎn):能顯著提高估計(jì)值精度(與簡(jiǎn)單隨機(jī)抽樣相比);能用來(lái)獲得抽樣框中所沒(méi)有機(jī)抽樣相比);能用來(lái)獲得抽樣框中所沒(méi)有的輔助信息(特別是分層信息);適用于某的輔助信息(特別是分層信息);適用于某些調(diào)查指標(biāo)的數(shù)據(jù)收集費(fèi)用特別高,或會(huì)給些調(diào)查指標(biāo)的數(shù)據(jù)收集費(fèi)用特別高,或會(huì)給被調(diào)查者帶來(lái)較重的回答負(fù)擔(dān)的情況。被調(diào)查者帶來(lái)較重的回答負(fù)擔(dān)的情況。n3、缺點(diǎn):如果需要根據(jù)第一相的結(jié)果來(lái)進(jìn)行、缺點(diǎn):如果需要根據(jù)第一相的結(jié)果來(lái)進(jìn)行第二相調(diào)查,得到整個(gè)調(diào)查結(jié)果的時(shí)間比單第二相調(diào)查,得到整個(gè)調(diào)查結(jié)果的時(shí)間比單相調(diào)查長(zhǎng);由于對(duì)某些樣本單元訪問(wèn)次數(shù)超相調(diào)查長(zhǎng);由于對(duì)某些樣本單元訪問(wèn)次數(shù)超過(guò)一次,故所需費(fèi)用比一相調(diào)查要

27、多;調(diào)查過(guò)一次,故所需費(fèi)用比一相調(diào)查要多;調(diào)查的組織會(huì)很復(fù)雜;估計(jì)值和抽樣誤差的計(jì)算的組織會(huì)很復(fù)雜;估計(jì)值和抽樣誤差的計(jì)算會(huì)相當(dāng)復(fù)雜。會(huì)相當(dāng)復(fù)雜。 4-30抽樣分布抽樣分布n抽樣分布的概念:由樣本統(tǒng)計(jì)量的全部可能取值和抽樣分布的概念:由樣本統(tǒng)計(jì)量的全部可能取值和與之相應(yīng)的概率(頻率)組成的分配數(shù)列。(主要與之相應(yīng)的概率(頻率)組成的分配數(shù)列。(主要求出樣本平均數(shù)的期望與方差)求出樣本平均數(shù)的期望與方差)n包括以下內(nèi)容包括以下內(nèi)容n重置抽樣分布重置抽樣分布n樣本平均數(shù)的分布樣本平均數(shù)的分布n樣本成數(shù)的分布樣本成數(shù)的分布n樣本方差的分布樣本方差的分布n不重置抽樣分布不重置抽樣分布n樣本平均數(shù)的分布

28、樣本平均數(shù)的分布n樣本成數(shù)的分布樣本成數(shù)的分布n樣本方差的分布樣本方差的分布4-311.總體中各元素的觀察值所形成的分布總體中各元素的觀察值所形成的分布 2.分布通常是未知的分布通常是未知的3.可以假定它服從某種分布可以假定它服從某種分布 總體分布總體分布(population distribution)4-321.一個(gè)樣本中各觀察值的分布一個(gè)樣本中各觀察值的分布 2.也稱經(jīng)驗(yàn)分布也稱經(jīng)驗(yàn)分布 3.當(dāng)樣本容量當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸逐漸增大時(shí),樣本分布逐漸接近總體的分布接近總體的分布 樣本分布樣本分布(sample distribution)4-331.樣本統(tǒng)計(jì)量的概率分布,樣本統(tǒng)

29、計(jì)量的概率分布,是一種理論分布是一種理論分布n在重復(fù)選取容量為在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布可能取值形成的相對(duì)頻數(shù)分布 2.隨機(jī)變量是隨機(jī)變量是 樣本統(tǒng)計(jì)量n樣本均值樣本均值, 樣本比例,樣本方差等樣本比例,樣本方差等3.結(jié)果來(lái)自結(jié)果來(lái)自容量相同的的所有可能樣本可能樣本4.提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)依據(jù) 抽樣分布抽樣分布 (sampling distribution)4-34抽樣分布的形成過(guò)程

30、抽樣分布的形成過(guò)程 (sampling distribution)樣本均值的抽樣分布樣本均值的抽樣分布4-361.在重復(fù)選取容量為在重復(fù)選取容量為n的樣本時(shí),由樣本均值的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布的所有可能取值形成的相對(duì)頻數(shù)分布2.一種理論概率分布一種理論概率分布3.推斷總體均值推斷總體均值 的理論基礎(chǔ)的理論基礎(chǔ)一、樣本均值的抽樣分布一、樣本均值的抽樣分布4-37樣本均值的抽樣分布樣本均值的抽樣分布(例題分析例題分析)4-38樣本均值的抽樣分布樣本均值的抽樣分布 (例題分析例題分析)n3,4n3,3n3,2n3,1n3n2,4n2,3n2,2n2,1n2n4,4n4,3

31、n4,2n4,1n4n1,4n4n1,3n3n2n1n1,2n1,1n1n第二個(gè)觀察值n第一個(gè)n觀察值n所有可能的n = 2 的樣本(共16個(gè))4-39樣本均值的抽樣分布樣本均值的抽樣分布 (例題分析例題分析)n3.5n3.0n2.5n2.0n3n3.0n2.5n2.0n1.5n2n4.0n3.5n3.0n2.5n4n2.5n4n2.0n3n2n1n1.5n1.0n1n第二個(gè)觀察值n第一個(gè)n觀察值n16個(gè)樣本的均值(x)4-40樣本均值的分布與總體分布的比較樣本均值的分布與總體分布的比較 (例題分析例題分析)4-41樣本均值的抽樣分布樣本均值的抽樣分布與中心極限定理與中心極限定理x4-42中心

32、極限定理中心極限定理(central limit theorem)4-43中心極限定理中心極限定理 (central limit theorem)4-44抽樣分布與總體分布的關(guān)系抽樣分布與總體分布的關(guān)系正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布樣本均值樣本均值正態(tài)分布正態(tài)分布樣本均值樣本均值正態(tài)分布正態(tài)分布樣本均值樣本均值非正態(tài)分布非正態(tài)分布4-451.樣本均值的數(shù)學(xué)期望樣本均值的數(shù)學(xué)期望2.樣本均值的方差樣本均值的方差n重復(fù)抽樣重復(fù)抽樣n不重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布樣本均值的抽樣分布(數(shù)學(xué)期望與方差數(shù)學(xué)期望與方差)4-46樣本均值的抽樣分布樣本均值的抽樣分布(數(shù)學(xué)期望與方差數(shù)學(xué)期望與方差

33、)4-47統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤 (standard error)1.樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差2.標(biāo)準(zhǔn)誤衡量的是統(tǒng)計(jì)量的離散程度,它測(cè)度標(biāo)準(zhǔn)誤衡量的是統(tǒng)計(jì)量的離散程度,它測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度3.以樣本均值的抽樣分布為例,在重復(fù)抽樣條以樣本均值的抽樣分布為例,在重復(fù)抽樣條件下,樣本均值的標(biāo)準(zhǔn)誤為件下,樣本均值的標(biāo)準(zhǔn)誤為4-48估計(jì)的標(biāo)準(zhǔn)誤估計(jì)的標(biāo)準(zhǔn)誤 (standard error of estimation)1.當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及

34、的總體參數(shù)未知時(shí),用當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤2.以樣本均值的抽樣分布為例,以樣本均值的抽樣分布為例,當(dāng)總體標(biāo)準(zhǔn)差當(dāng)總體標(biāo)準(zhǔn)差 未知時(shí),可用樣本標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替,則代替,則在重復(fù)抽樣在重復(fù)抽樣條件下,條件下,樣本均值的估計(jì)標(biāo)準(zhǔn)誤樣本均值的估計(jì)標(biāo)準(zhǔn)誤為為樣本比例的抽樣分布樣本比例的抽樣分布4-501.總體總體(或樣本或樣本)中具有某種屬性的單位與全部單中具有某種屬性的單位與全部單位總數(shù)之比位總數(shù)之比n不同性別的人與全部人數(shù)之比不同性別的人與全部人數(shù)之比n合格品合格品(或不合格品或

35、不合格品) 與全部產(chǎn)品總數(shù)之比與全部產(chǎn)品總數(shù)之比2.總體比例可表示為總體比例可表示為3.樣本比例可表示為樣本比例可表示為4.比例比例(proportion)4-511.在重復(fù)選取容量為在重復(fù)選取容量為n的樣本時(shí),由樣本比的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布例的所有可能取值形成的相對(duì)頻數(shù)分布2.一種理論概率分布一種理論概率分布3.當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似可用正態(tài)分布近似 4.推斷總體比例推斷總體比例 的理論基礎(chǔ)的理論基礎(chǔ)樣本比例的抽樣分布樣本比例的抽樣分布4-521.樣本比例的數(shù)學(xué)期望樣本比例的數(shù)學(xué)期望2.樣本比例的

36、方差樣本比例的方差n重復(fù)抽樣重復(fù)抽樣n不重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布樣本比例的抽樣分布(數(shù)學(xué)期望與方差數(shù)學(xué)期望與方差)樣本方差的抽樣分布樣本方差的抽樣分布4-54樣本方差的分布樣本方差的分布4-551.由阿貝由阿貝(abbe) 于于1863年首先給出,后來(lái)由海爾墨特年首先給出,后來(lái)由海爾墨特(hermert)和卡和卡皮爾遜皮爾遜(kpearson) 分別于分別于1875年和年和1900年推導(dǎo)出來(lái)年推導(dǎo)出來(lái)2.設(shè)設(shè) ,則,則3.令令 ,則,則 y 服從自由度為服從自由度為1的的 2分布,即分布,即4.當(dāng)總體當(dāng)總體 ,從中抽取容量為,從中抽取容量為n的樣本,則的樣本,則 2分布分布( 2

37、distribution)4-561.分布的變量值始終為正分布的變量值始終為正 2.分布的形狀取決于其自由度分布的形狀取決于其自由度n的大小,通常為不對(duì)的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱對(duì)稱 3.期望為期望為e( 2)=n,方差為,方差為d( 2)=2n(n為自由度為自由度) 4.可加性:若可加性:若u和和v為兩個(gè)獨(dú)立的服從為兩個(gè)獨(dú)立的服從 2分布的隨機(jī)分布的隨機(jī)變量,變量,u 2(n1),v 2(n2),則則u+v這一隨機(jī)變量這一隨機(jī)變量服從自由度為服從自由度為n1+n2的的 2分布分布 2分布分布(性質(zhì)和特點(diǎn)性質(zhì)和特點(diǎn))4

38、-57 2分布分布(圖示圖示) 選擇容量為選擇容量為n 的的簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差計(jì)算樣本方差s2計(jì)算卡方值計(jì)算卡方值 2 = (n-1)s2/2計(jì)算出所有的計(jì)算出所有的 2值值總體總體4-58 2分布分布(例題的圖示例題的圖示)16個(gè)樣本方差的分布樣本方差樣本方差s2s2取值的概率取值的概率0.04/160.56/1624/164.52/164-59 2分布分布(用用excel計(jì)算計(jì)算 2分布的概率分布的概率)4-60 2分布分布(用用excel計(jì)算計(jì)算 2分布的臨界值分布的臨界值)4-61 2分布分布(用用excel生成生成 2分布的臨界值表分布的臨界值表)4-62第三節(jié)第三

39、節(jié) 總體參數(shù)估計(jì)總體參數(shù)估計(jì)n本節(jié)主要內(nèi)容:本節(jié)主要內(nèi)容:一、總體參數(shù)估計(jì)概述一、總體參數(shù)估計(jì)概述二、總體參數(shù)的點(diǎn)估計(jì)二、總體參數(shù)的點(diǎn)估計(jì)三、參數(shù)區(qū)間估計(jì)三、參數(shù)區(qū)間估計(jì)四、樣本容量的確定四、樣本容量的確定4-63一、總體參數(shù)估計(jì)概述一、總體參數(shù)估計(jì)概述n設(shè)待估計(jì)的總體參數(shù)是設(shè)待估計(jì)的總體參數(shù)是,用以估計(jì)該參數(shù)的統(tǒng)計(jì)量是,用以估計(jì)該參數(shù)的統(tǒng)計(jì)量是 ,抽樣估計(jì)的抽樣估計(jì)的極限誤差極限誤差是是,即:,即:n極限誤差是根據(jù)研究對(duì)象的變異程度和分析任務(wù)的性質(zhì)來(lái)確極限誤差是根據(jù)研究對(duì)象的變異程度和分析任務(wù)的性質(zhì)來(lái)確定的在一定概率下的允許誤差范圍。定的在一定概率下的允許誤差范圍。n參數(shù)估計(jì)的兩個(gè)要求:參數(shù)

40、估計(jì)的兩個(gè)要求:n精度:估計(jì)誤差的最大范圍,通過(guò)極限誤差來(lái)反映。顯然,精度:估計(jì)誤差的最大范圍,通過(guò)極限誤差來(lái)反映。顯然,越小,估計(jì)的精度要求越高,越小,估計(jì)的精度要求越高,越大,估計(jì)的精度要求越大,估計(jì)的精度要求越低。極限誤差的確定要以實(shí)際需要為基本標(biāo)準(zhǔn)。越低。極限誤差的確定要以實(shí)際需要為基本標(biāo)準(zhǔn)。n可靠性:估計(jì)正確性的一個(gè)概率保證,通常稱為估計(jì)的置可靠性:估計(jì)正確性的一個(gè)概率保證,通常稱為估計(jì)的置信度。信度。4-64二、總體參數(shù)的點(diǎn)估計(jì)二、總體參數(shù)的點(diǎn)估計(jì)n點(diǎn)估計(jì)的含義:直接以樣本統(tǒng)計(jì)量作為相應(yīng)點(diǎn)估計(jì)的含義:直接以樣本統(tǒng)計(jì)量作為相應(yīng)總體參數(shù)的估計(jì)量??傮w參數(shù)的估計(jì)量。2221xpxxsn4

41、-65優(yōu)良估計(jì)量標(biāo)準(zhǔn)優(yōu)良估計(jì)量標(biāo)準(zhǔn)n優(yōu)良估計(jì)標(biāo)準(zhǔn):優(yōu)良估計(jì)標(biāo)準(zhǔn):n無(wú)偏性:要求樣本統(tǒng)計(jì)量的平均數(shù)等于被估計(jì)的總體參數(shù)本身。無(wú)偏性:要求樣本統(tǒng)計(jì)量的平均數(shù)等于被估計(jì)的總體參數(shù)本身。n一致性:當(dāng)樣本容量充分大時(shí),樣本統(tǒng)計(jì)量充分靠近總體參數(shù)本身。一致性:當(dāng)樣本容量充分大時(shí),樣本統(tǒng)計(jì)量充分靠近總體參數(shù)本身。n有效性:有效性:的樣本統(tǒng)計(jì)量。是估計(jì)是總體參數(shù),若即滿足無(wú)偏性。,)(e1)(limpn()為任意小的正數(shù)更有效。則稱的無(wú)偏估計(jì)量,而都是和若12221,21x經(jīng)經(jīng)數(shù)數(shù)學(xué)學(xué)證證明明, 是是 的的無(wú)無(wú)偏偏、一一致致且且有有效效的的估估計(jì)計(jì)量量??傮w方差的無(wú)偏估計(jì)量為樣本方差總體方差的無(wú)偏估計(jì)量為樣本

42、方差22()1xxsn點(diǎn)估計(jì)完全正確的概率通常為點(diǎn)估計(jì)完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計(jì)。因此,我們更多的是考慮用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)的范圍量去估計(jì)總體參數(shù)的范圍 區(qū)間估計(jì)。區(qū)間估計(jì)。 4-66三、參數(shù)區(qū)間估計(jì)三、參數(shù)區(qū)間估計(jì)n參數(shù)區(qū)間估計(jì)的含義:估計(jì)總體參數(shù)的區(qū)間范圍,并給出區(qū)參數(shù)區(qū)間估計(jì)的含義:估計(jì)總體參數(shù)的區(qū)間范圍,并給出區(qū)間估計(jì)成立的概率值。間估計(jì)成立的概率值。n其中:其中: 1-(01)稱為置信度;稱為置信度;是區(qū)間估計(jì)的顯著性水平,是區(qū)間估計(jì)的顯著性水平,其取值大小由實(shí)際問(wèn)題確定,經(jīng)常取其取值大小由實(shí)際問(wèn)題確定,經(jīng)常取1%、5%和和10%。12()1p注意

43、對(duì)上式的理解:注意對(duì)上式的理解:例如抽取了例如抽取了1000個(gè)樣本,根據(jù)每一個(gè)樣本均構(gòu)造了一個(gè)置信區(qū)間,這樣,個(gè)樣本,根據(jù)每一個(gè)樣本均構(gòu)造了一個(gè)置信區(qū)間,這樣,由由1000個(gè)樣本構(gòu)造的總體參數(shù)的個(gè)樣本構(gòu)造的總體參數(shù)的1000個(gè)置信區(qū)間中,有個(gè)置信區(qū)間中,有95%的區(qū)間包含的區(qū)間包含了總體參數(shù)的真值,而了總體參數(shù)的真值,而5%的置信區(qū)間則沒(méi)有包含。這里,的置信區(qū)間則沒(méi)有包含。這里,95%這個(gè)值被這個(gè)值被稱為置信水平(或置信度)。稱為置信水平(或置信度)。一般地,將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值一般地,將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例

44、稱為置信水平。的次數(shù)所占的比例稱為置信水平。4-67我們用我們用95%的置信水平得到某班學(xué)生考試成績(jī)的置信區(qū)間為的置信水平得到某班學(xué)生考試成績(jī)的置信區(qū)間為60-80分,如何理分,如何理解?解?錯(cuò)誤的理解:錯(cuò)誤的理解:60-80區(qū)間以區(qū)間以95%的概率包含全班同學(xué)平均成績(jī)的真值;或以的概率包含全班同學(xué)平均成績(jī)的真值;或以95%的概率保證全班同學(xué)平均成績(jī)的真值落在的概率保證全班同學(xué)平均成績(jī)的真值落在60-80分之間。分之間。正確的理解:如果做了多次抽樣(如正確的理解:如果做了多次抽樣(如100次),大概有次),大概有95次找到的區(qū)間包含真次找到的區(qū)間包含真值,有值,有5次找到的區(qū)間不包括真值。次找

45、到的區(qū)間不包括真值。真值只有一個(gè),一個(gè)特定的區(qū)間真值只有一個(gè),一個(gè)特定的區(qū)間“總是包含總是包含”或或“絕對(duì)不包含絕對(duì)不包含”該真值。但是,該真值。但是,用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值。用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值。如果大家還是不能理解,那你們最好這樣回答有關(guān)區(qū)間估計(jì)的結(jié)果:如果大家還是不能理解,那你們最好這樣回答有關(guān)區(qū)間估計(jì)的結(jié)果:該班同學(xué)平均成績(jī)的置信區(qū)間是該班同學(xué)平均成績(jī)的置信區(qū)間是60-80分,置信度為分,置信度為95%。4-68區(qū)間估計(jì)的基本要素區(qū)間估計(jì)的基本要素n包括:樣本點(diǎn)估計(jì)值、抽樣極限誤差、估計(jì)的可靠

46、程度包括:樣本點(diǎn)估計(jì)值、抽樣極限誤差、估計(jì)的可靠程度n樣本點(diǎn)估計(jì)值樣本點(diǎn)估計(jì)值n抽樣極限誤差:可允許的誤差范圍。抽樣極限誤差:可允許的誤差范圍。n抽樣估計(jì)的可靠程度(置信度、概率保證程度)及概率度抽樣估計(jì)的可靠程度(置信度、概率保證程度)及概率度n注意:本教材所進(jìn)行的區(qū)間估計(jì)僅指對(duì)注意:本教材所進(jìn)行的區(qū)間估計(jì)僅指對(duì)總體平均數(shù)或成數(shù)總體平均數(shù)或成數(shù)的區(qū)間估計(jì),的區(qū)間估計(jì),并且在實(shí)際計(jì)算過(guò)程中使用下面的式子。式中并且在實(shí)際計(jì)算過(guò)程中使用下面的式子。式中是極限誤差。是極限誤差。()1xxxp進(jìn)一步可以寫成x1稱為置信度(或概率保證程度)稱為概率度(因?yàn)樗c1- 密切相關(guān))()1,()1pp x 即,

47、1,1,xxxnnxxxx2222當(dāng)服從標(biāo)準(zhǔn)正態(tài)分布時(shí),通常記z=簡(jiǎn)記為z=請(qǐng)牢記該式.當(dāng)服從t分布時(shí),通常記t,z與t通常也稱為臨界值4-69區(qū)間估計(jì)的內(nèi)容區(qū)間估計(jì)的內(nèi)容 2 2 已知已知 2 2 未知未知 均均 值值方方 差差比比 例例置置 信信 區(qū)區(qū) 間間4-70平均數(shù)的區(qū)間估計(jì)平均數(shù)的區(qū)間估計(jì) n對(duì)總體平均數(shù)或成數(shù)的區(qū)間估計(jì)時(shí),使用下面的式子對(duì)總體平均數(shù)或成數(shù)的區(qū)間估計(jì)時(shí),使用下面的式子 (式中式中是極限誤差是極限誤差)n有兩種模式:有兩種模式:n1、根據(jù)置信度、根據(jù)置信度1-,求出極限誤差,求出極限誤差,并指出總體平均數(shù),并指出總體平均數(shù)的估計(jì)區(qū)間。的估計(jì)區(qū)間。n2、給定極限誤差,求

48、置信度。、給定極限誤差,求置信度。()1p x 4-71n當(dāng)當(dāng)已知時(shí),根據(jù)相關(guān)的抽樣分布定理,已知時(shí),根據(jù)相關(guān)的抽樣分布定理, 服從標(biāo)準(zhǔn)正態(tài)分布服從標(biāo)準(zhǔn)正態(tài)分布n(0,1)。查正態(tài)分布概率表,。查正態(tài)分布概率表,可得可得 (一般記為一般記為 ),則),則 ,根據(jù)重復(fù)抽樣與不,根據(jù)重復(fù)抽樣與不重復(fù)抽樣的重復(fù)抽樣的 求法的不同,進(jìn)一步可得總體平均數(shù)的估計(jì)區(qū)間:求法的不同,進(jìn)一步可得總體平均數(shù)的估計(jì)區(qū)間:n重復(fù)抽樣時(shí),區(qū)間的上下限為:重復(fù)抽樣時(shí),區(qū)間的上下限為:n不重復(fù)抽樣時(shí),區(qū)間的上下限為:不重復(fù)抽樣時(shí),區(qū)間的上下限為:平均數(shù)區(qū)間估計(jì)平均數(shù)區(qū)間估計(jì)第第1種模式種模式(求置信區(qū)間求置信區(qū)間)()1p

49、 x ()1xxxpxx/x(/)1xf/ 2xz xnzx212nnnnzx/ 2z/abs(normsinv(1/2)xexcel用函數(shù)求的值,xx 的估計(jì)區(qū)間是4-7212/2/x/2)(xzp1)(1)(xxxzpxpxz/2/?為什么記為4-73平均數(shù)區(qū)間估計(jì)平均數(shù)區(qū)間估計(jì)第第1種模式種模式(求置信區(qū)間求置信區(qū)間)n若總體方差未知,則在計(jì)算若總體方差未知,則在計(jì)算 時(shí),使用樣本方差代替總體方差,此時(shí)時(shí),使用樣本方差代替總體方差,此時(shí) 服從自由度為服從自由度為n-1的的t分布。查分布。查t分布表可得分布表可得 ,并,并記為記為n于是:于是:n重復(fù)抽樣時(shí),區(qū)間的上下限為:重復(fù)抽樣時(shí),區(qū)間

50、的上下限為:n不重復(fù)抽樣時(shí),區(qū)間的上下限為:不重復(fù)抽樣時(shí),區(qū)間的上下限為:xxx/x,12nt,12nsxtn,121nsnnxtnn()1xxxp大樣本時(shí),大樣本時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布非常接近,可直接從標(biāo)準(zhǔn)分布非常接近,可直接從標(biāo)準(zhǔn)正態(tài)分布表查臨界值正態(tài)分布表查臨界值,12nt/tinv( ,1)xexceln用函數(shù)求的值4-74例:總體平均數(shù)的區(qū)間估計(jì)例:總體平均數(shù)的區(qū)間估計(jì)1n對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表,要求估對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表,要求估計(jì)該批電子元件的平均耐用時(shí)數(shù)的置信區(qū)間(置信度計(jì)該批電子元件的平均耐用時(shí)數(shù)

51、的置信區(qū)間(置信度95%)。)。1055.5()xfxf小時(shí)2()52.17()1xxfsf小時(shí)52.175.217()100xsn小時(shí)xz( )0.951.96f zz 1055.5 10.23 1045.27x 所以1055.5 10.23 1065.73x 1045.27 1065.7395%平均耐用時(shí)數(shù)在小時(shí)間,可靠程度為。1.96 5.21710.23xz()1()1/xxxpxpsnsnabs(normsinv(1/2)excelz用函數(shù)求 值t如果查 分布表,則等于1.984,/sn注意求時(shí) 查的是標(biāo)準(zhǔn)正態(tài)分布表4-75xxx的抽樣分布68.27%的樣本的樣本p x ()1px

52、()1可以寫成p xx ()1也可以寫成xx11 xx22 xx33 xx44 1) 100%表示有(的區(qū)間包含了表示樣本均值落在表示樣本均值落在區(qū)區(qū)間的概率是間的概率是1-,例,例對(duì)總體均值區(qū)間估計(jì)的進(jìn)一步理解對(duì)總體均值區(qū)間估計(jì)的進(jìn)一步理解4-76平均數(shù)區(qū)間估計(jì)平均數(shù)區(qū)間估計(jì)第第2種模式種模式(求置信度求置信度)n給定極限誤差,求置信度給定極限誤差,求置信度()1p x ()()1xxxxpf4-77例:總體平均數(shù)的區(qū)間估計(jì)例:總體平均數(shù)的區(qū)間估計(jì)2n例:經(jīng)抽樣調(diào)查計(jì)算樣本畝產(chǎn)糧食例:經(jīng)抽樣調(diào)查計(jì)算樣本畝產(chǎn)糧食600公斤,并求得抽樣平公斤,并求得抽樣平均誤差為均誤差為3公斤,現(xiàn)給定允許極限誤

53、差為公斤,現(xiàn)給定允許極限誤差為6公斤,求置信區(qū)間公斤,求置信區(qū)間包含總體平均畝產(chǎn)的概率,即求置信水平。包含總體平均畝產(chǎn)的概率,即求置信水平。600,3,6xx已知:62,3xz簡(jiǎn)便解法:%45.95)2()(fzfxxxxp xxp xxpxf ()()()()因?yàn)榉臉?biāo)準(zhǔn)正態(tài)分布所以上式結(jié)果表明,如果多次反復(fù)抽樣,每次結(jié)果表明,如果多次反復(fù)抽樣,每次都可以由樣本值確定一個(gè)估計(jì)區(qū)間,都可以由樣本值確定一個(gè)估計(jì)區(qū)間,每個(gè)區(qū)間或者包含總體參數(shù)的真值,每個(gè)區(qū)間或者包含總體參數(shù)的真值,或者不包含總體參數(shù)的真值,包含真或者不包含總體參數(shù)的真值,包含真值的區(qū)間占值的區(qū)間占f(z),即每一萬(wàn)次抽樣,就即每一

54、萬(wàn)次抽樣,就有有9545個(gè)樣本區(qū)間包括總體畝產(chǎn),其個(gè)樣本區(qū)間包括總體畝產(chǎn),其余余455個(gè)樣本區(qū)間不包括總體平均數(shù),個(gè)樣本區(qū)間不包括總體平均數(shù),即若接受估計(jì)區(qū)間的判斷要冒即若接受估計(jì)區(qū)間的判斷要冒4.55%的的機(jī)會(huì)犯錯(cuò)誤的風(fēng)險(xiǎn)。機(jī)會(huì)犯錯(cuò)誤的風(fēng)險(xiǎn)。(2) 95.45%f4-78成數(shù)的區(qū)間估計(jì)成數(shù)的區(qū)間估計(jì)n由于總體的分布是(由于總體的分布是(0,1)分布,只有在大樣本的)分布,只有在大樣本的情況下,才服從正態(tài)分布??傮w成數(shù)可以看成是一情況下,才服從正態(tài)分布??傮w成數(shù)可以看成是一種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計(jì),種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計(jì),總體成數(shù)的區(qū)間估計(jì)的上下限是:總體

55、成數(shù)的區(qū)間估計(jì)的上下限是:n注意:在實(shí)踐中,由于總體成數(shù)常常未知,這時(shí),注意:在實(shí)踐中,由于總體成數(shù)常常未知,這時(shí),抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。 n大樣本的條件:大樣本的條件:np5且且n(1-p) 5,由于總體成數(shù),由于總體成數(shù)通通常未知,可以用樣本成數(shù)常未知,可以用樣本成數(shù)p來(lái)近似判斷。來(lái)近似判斷。pz2pn1pnnnn114-79例:總體平均數(shù)的區(qū)間估計(jì)例:總體平均數(shù)的區(qū)間估計(jì)3n對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表,對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查資料分組如下表, 設(shè)該廠的產(chǎn)品設(shè)該廠的產(chǎn)品質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)

56、規(guī)定,元件耐用時(shí)數(shù)達(dá)到質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)規(guī)定,元件耐用時(shí)數(shù)達(dá)到1000小時(shí)以上為合格品。要求估計(jì)該批電小時(shí)以上為合格品。要求估計(jì)該批電子元件的合格率,置信水平子元件的合格率,置信水平95%。9191%100p(1)(,)(1)2.86%pppnppn總體成數(shù)未知用樣本成數(shù)代替96. 1%,95)(zzf1.96 2.86% 5.61%pz 91% 5.6% 85.4%p91% 5.6% 96.6%p。間,可靠性為合格率在%95%6 .96%4 .854-80總體均值區(qū)間估計(jì)總結(jié)總體均值區(qū)間估計(jì)總結(jié)xxxp ()1p x ()1總體平均數(shù)估計(jì)區(qū)間的總體平均數(shù)估計(jì)區(qū)間的上下限上下限總體方差總體方差已知已

57、知n(0,1)重復(fù)抽樣重復(fù)抽樣不重復(fù)抽樣不重復(fù)抽樣總體方差總體方差未知未知t(n-1)大樣本時(shí)近似服從n(0,1)重復(fù)抽樣重復(fù)抽樣不重復(fù)抽樣不重復(fù)抽樣xx所服從的分布xn/sn/1nnnn1snnnn,12nsxtn,121nsnnxtnnnzx212nnnnzxn 如果是正態(tài)總體如果是正態(tài)總體4-81例:確定樣本容量例:確定樣本容量2n對(duì)某批木材進(jìn)行檢驗(yàn),根據(jù)以往經(jīng)驗(yàn),木材的合格率為對(duì)某批木材進(jìn)行檢驗(yàn),根據(jù)以往經(jīng)驗(yàn),木材的合格率為90%、92%、95%?,F(xiàn)采用重復(fù)抽樣方式,要求在?,F(xiàn)采用重復(fù)抽樣方式,要求在95.45%的概率保的概率保證程度下,抽樣合格率的極限誤差不超過(guò)證程度下,抽樣合格率的

58、極限誤差不超過(guò)5%,問(wèn)必要的樣,問(wèn)必要的樣本單位數(shù)應(yīng)該是多少?本單位數(shù)應(yīng)該是多少?樣本成數(shù)的單位數(shù)()xz ppn221.().2220 9 0 11440 05棵4-82n 如果不是正態(tài)總體,或分布未知如果不是正態(tài)總體,或分布未知總體方差已知總體方差已知且是大樣本且是大樣本總體方差未知總體方差未知且是大樣本且是大樣本 xxn(0,1)近似服從xxn(0,1)近似服從此時(shí)不考慮小樣本情況此時(shí)不考慮小樣本情況xnnnnn/1或xsnsnnnn/1或因此,大樣本情況下,直接用標(biāo)準(zhǔn)正因此,大樣本情況下,直接用標(biāo)準(zhǔn)正態(tài)分布求置信區(qū)間即可。態(tài)分布求置信區(qū)間即可。4-83總體成數(shù)估計(jì)區(qū)間估計(jì)總結(jié)總體成數(shù)估

59、計(jì)區(qū)間估計(jì)總結(jié)n總體成數(shù)估計(jì)區(qū)間的上下限總體成數(shù)估計(jì)區(qū)間的上下限只考慮大樣本情況(請(qǐng)記住大樣本條件)只考慮大樣本情況(請(qǐng)記住大樣本條件)pppzn21ppnnpznn2114-84對(duì)總量指標(biāo)的區(qū)間估計(jì)對(duì)總量指標(biāo)的區(qū)間估計(jì)n在對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)的基礎(chǔ)上,可在對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)的基礎(chǔ)上,可進(jìn)一步推斷相應(yīng)的總量指標(biāo),即用總體單位進(jìn)一步推斷相應(yīng)的總量指標(biāo),即用總體單位總數(shù)總數(shù)n分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間上限,便得到相應(yīng)總量(上限,便得到相應(yīng)總量(n)的區(qū)間范圍。)的區(qū)間范圍。()()xxxxxxn xnn x 4-85例例1n某廠對(duì)一批產(chǎn)品的質(zhì)量進(jìn)

60、行抽樣檢驗(yàn),采用重復(fù)抽樣抽取樣品某廠對(duì)一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗(yàn),采用重復(fù)抽樣抽取樣品200只,樣只,樣本優(yōu)質(zhì)率為本優(yōu)質(zhì)率為85%,試計(jì)算當(dāng)把握程度為,試計(jì)算當(dāng)把握程度為90%時(shí)優(yōu)質(zhì)品率的區(qū)間范圍。時(shí)優(yōu)質(zhì)品率的區(qū)間范圍。.%,.%,即2000 80 852000 89 151617 17834-86例例2n某商場(chǎng)從一批食品(共某商場(chǎng)從一批食品(共800袋)中隨機(jī)抽取袋)中隨機(jī)抽取40袋(假設(shè)用重復(fù)抽樣),測(cè)袋(假設(shè)用重復(fù)抽樣),測(cè)得每袋平均重量為得每袋平均重量為791.1克,標(biāo)準(zhǔn)差為克,標(biāo)準(zhǔn)差為17.136克,要求以克,要求以95%的把握程度,的把握程度,估計(jì)這批食品的平均每袋重量以及這批食品

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論