數(shù)學(xué)抽樣估計PPT課件_第1頁
數(shù)學(xué)抽樣估計PPT課件_第2頁
數(shù)學(xué)抽樣估計PPT課件_第3頁
數(shù)學(xué)抽樣估計PPT課件_第4頁
數(shù)學(xué)抽樣估計PPT課件_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、2021-11-24第七章 抽樣估計1 抽樣估計是在抽樣調(diào)查的基礎(chǔ)上,利用樣本的實際資料計算樣本指標(biāo),并據(jù)以推算總體相應(yīng)數(shù)量特征的一種統(tǒng)計分析方法。 (一)抽樣估計的概念第1頁/共101頁2021-11-242 統(tǒng)計分析的主要任務(wù),就是要反映現(xiàn)象總體的數(shù)量特征。 但在實際工作中,我們不可能、也沒有必要每次都對總體的所有單位進行全面調(diào)查。在很多情況下,我們只需抽取總體的一部分單位作為樣本,通過分析樣本的實際資料,來估計和推斷總體的數(shù)量特征,以達(dá)到對現(xiàn)象總體的認(rèn)識。 第2頁/共101頁2021-11-243第七章 抽樣估計 1抽樣推斷是由部分推算整體的一種認(rèn)識方法; 2抽樣推斷是建立在隨機取樣的基

2、礎(chǔ)之上的; 3抽樣推斷運用的是概率估計的方法; 4抽樣推斷的誤差是可以事先計算并加以控制的。(二)抽樣推斷的特點第3頁/共101頁2021-11-244第七章 抽樣估計 (一)參數(shù)估計 雖然我們不知道總體的數(shù)量特征,但我們可以依據(jù)所獲得的樣本觀察資料,對所研究對象總體的水平、結(jié)構(gòu)、規(guī)模等數(shù)量特征進行估計,這種推斷方法稱為總體參數(shù)估計。 (二)假設(shè)檢驗 由于我們對總體的變化情況不了解,不妨先對總體的狀況作某種假設(shè),然后根據(jù)抽樣推斷的原理,依據(jù)樣本觀察資料對所作假設(shè)進行檢驗,來判斷這種假設(shè)的真?zhèn)危詻Q定我們行動的取舍,這種推斷方法稱為總體參數(shù)的假設(shè)檢驗。第4頁/共101頁2021-11-245第七

3、章 抽樣估計 (一)總體和樣本 總體也稱全及總體或母體,是指所要認(rèn)識研究對象的全體。它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全體單位所組成的集合體。總體的單位數(shù)通常較大,甚至是無限的,一般用N表示全及總體的單位數(shù)。一個全及總體的指標(biāo)數(shù)值是確定的、唯一的,所以稱為參數(shù)。 樣本又稱樣本總體或子樣,它是從全及總體中隨機抽取出來的一部分單位組成的集合體,樣本的單位數(shù)是有限的,一般用n表示樣本總體的單位數(shù)。 樣本總體的指標(biāo)數(shù)值是個隨機變量,所以稱為樣本統(tǒng)計量或樣本估計量。 第5頁/共101頁2021-11-246第七章 抽樣估計總體平均數(shù)和總體方差為:XXNXFXF22()XXXN22()XXXFF總體成數(shù)

4、及方差為: 1NPN2(1)PPP(二)總體參數(shù)和樣本統(tǒng)計量第6頁/共101頁2021-11-247第七章 抽樣估計樣本統(tǒng)計量是用來估計總體參數(shù)的,因此和總體參數(shù)相對應(yīng),有樣本平均數(shù)及方差、樣本成數(shù)及方差。樣本成數(shù)及方差為: xxnxfxf22()xxxsn22()xxxfsf1npn2(1)pspp樣本平均數(shù)和方差為:第7頁/共101頁2021-11-248第七章 抽樣估計 樣本容量是指一個樣本包含的單位數(shù)。一個樣本應(yīng)包含多少單位較合適,這是抽樣設(shè)計必須考慮的問題。樣本容量的大小不但關(guān)系到抽樣調(diào)查的效果,而且關(guān)系到抽樣方法的應(yīng)用。我們通常將單位數(shù)小于30的樣本稱為小樣本,單位數(shù)等于或大于30

5、的樣本稱為大樣本。社會經(jīng)濟統(tǒng)計的抽樣調(diào)查一般都采用大樣本調(diào)查。 樣本個數(shù)又稱樣本可能數(shù)目,是指從一個總體可能抽取的樣本個數(shù)。一個總體可以抽取多少個樣本和樣本容量以及抽樣方法有關(guān)。從一個總體中能抽取多少個樣本,則樣本統(tǒng)計量就有多少種取值,從而形成了該統(tǒng)計量的分布。研究所有可能抽取的樣本及其統(tǒng)計量的分布,是抽樣推斷的基礎(chǔ)。 (三)樣本容量和樣本個數(shù)第8頁/共101頁2021-11-249第七章 抽樣估計 重復(fù)抽樣也稱回置抽樣,它是指每次抽取一個樣本登記后再將它放回總體中參加下一次抽取。 也就是說每一個樣本單位都有被重復(fù)抽取的可能。 重復(fù)抽樣的特點是: 每次抽取樣本是在完全相同的條件下進行的, 總體

6、中每個單位中選的機會在各次都完全相等。 (四)重復(fù)抽樣和不重復(fù)抽樣第9頁/共101頁2021-11-2410第七章 抽樣估計例如:總體有A、B、C共3個單位,要從中以重復(fù)抽樣的方法抽取2個單位構(gòu)成樣本, 則可能抽取的樣本數(shù)目為Nn = 32 = 9個,它們是: 從總體N個單位中,用重復(fù)抽樣的方法,隨機抽取一個容量為n的樣本,共可抽取Nn個樣本。 AA、AB、AC BA、BB、BC CA、CB、CC第10頁/共101頁2021-11-2411第七章 抽樣估計 不重復(fù)抽樣也稱不回置抽樣,它是指每次抽取一個樣本登記后不再放回總體中參加下一次抽取。也就是說每一個樣本單位只有一次被抽取的可能。 不重復(fù)抽

7、樣時,每個樣本的抽取不獨立的,因為每個樣本在抽取前總體單位數(shù)不一樣。 在實際操作中,大多數(shù)抽樣都是不重復(fù)抽樣。不重復(fù)抽樣的特點:第11頁/共101頁2021-11-2412第七章 抽樣估計例如:總體有3個單位A、B、C,要從中以不重復(fù)抽樣的方法抽取2個單位構(gòu)成樣本, 則全部可能抽取的樣本數(shù)目為32 = 6個,它們是: AB、AC、BA、BC、CA、CB從總體N個單位中,采用不重復(fù)抽樣的方法,隨機抽取一個容量為n的樣本,則全部可能抽取的樣本數(shù)目為: N(N1)(N2)(Nn + 1)個第12頁/共101頁2021-11-24第七章 抽樣估計13 抽樣誤差是指由于隨機抽樣的偶然因素使樣本各單位的結(jié)

8、構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)和全及指標(biāo)的絕對離差。 抽樣誤差不同于登記誤差: 登記誤差是人為差錯所引起的誤差,所有統(tǒng)計調(diào)查都可能發(fā)生。抽樣誤差不是人為失誤所引起的,而是隨機抽樣所特有的誤差。第13頁/共101頁2021-11-24第七章 抽樣估計14 抽樣誤差是一種代表性誤差。 用樣本統(tǒng)計量來代表總體參數(shù),必然會有誤差。因此,抽樣誤差是已遵循了隨機原則,由偶然因素引起的誤差,它是抽樣推斷所固有誤差,是無法消除的,但能事先計算并加以控制。 有時抽樣過程中可能會產(chǎn)生另一種代表性誤差,即系統(tǒng)性誤差。系統(tǒng)性誤差是由于違反了隨機原則而產(chǎn)生的數(shù)據(jù)偏大或偏小的情況,因此也叫做系統(tǒng)偏差。系統(tǒng)偏

9、差不是抽樣誤差,它是人為原因產(chǎn)生的誤差,是可以采取措施避免或加以消除的。抽樣誤差的特點:第14頁/共101頁2021-11-24第七章 抽樣估計151. 總體各單位標(biāo)志值的差異程度;2. 樣本單位數(shù);3. 抽樣方法;4. 抽樣組織方式。影響抽樣誤差大小的因素第15頁/共101頁2021-11-24第七章 抽樣估計16 抽樣平均誤差是反映抽樣誤差一般水平的指標(biāo),它是所有可能抽取的樣本平均數(shù)或成數(shù)的標(biāo)準(zhǔn)差。 由于所有樣本平均數(shù)的平均數(shù)等于總體平均數(shù),所有樣本成數(shù)的平均數(shù)等于總體成數(shù),因此,抽樣平均數(shù)或成數(shù)的標(biāo)準(zhǔn)差反映了抽樣平均數(shù)或成數(shù)與總體平均數(shù)或成數(shù)的平均離差程度。第16頁/共101頁2021-

10、11-24第七章 抽樣估計17(一)重復(fù)抽樣條件下平均數(shù)的抽樣平均誤差定義公式為:2xnn2()xxXM由定義公式導(dǎo)出的計算公式為:第17頁/共101頁2021-11-24第七章 抽樣估計18重復(fù)抽樣平均誤差計算公式的推導(dǎo):設(shè)總體變量為X1,X2,XN ,樣本變量為x1,x2,xn,根據(jù)平均數(shù)的定義和它的數(shù)學(xué)性質(zhì),有: 12( )nxxxE xEn121()()()nE xE xE xn在重復(fù)抽樣條件下,由于x1,x2,xn是相互獨立的隨機變量,每一個變量在總體中都有N種選擇,中選機會相等,概率都是1/N。即: 12( )()()nE xE xE xX 121( )( )()()nE xE x

11、E xE xn11XXXnXXnn第18頁/共101頁2021-11-24第七章 抽樣估計19根據(jù)方差的定義和它的數(shù)學(xué)性質(zhì),不重復(fù)抽樣平均誤差的計算公式可按其定義推導(dǎo)如下: 2222( )( )xxE xE xE xX212nxxxEXn21221()()()nExXxXxXn(1)2211()()()n nniijiijExXxXxXn(1)2211()()()n nniijiijE xXE xXxXn22101()niXn2221()()XnXnn第19頁/共101頁2021-11-24第七章 抽樣估計20所以平均數(shù)的抽樣平均誤差為:其中: 22211()()()NiikkE xXxXXN

12、()()ijE xXxX11()()NNikjlklxXxX110()()NNikjlklxXxX2xnnxn式中:表示平均數(shù)的抽樣平均誤差;表示總體標(biāo)準(zhǔn)差;表示樣本容量。第20頁/共101頁2021-11-24第七章 抽樣估計21重復(fù)抽樣平均誤差計算公式的特性: 從抽樣平均誤差的計算公式可以看出: 1. 抽樣平均誤差的大小和總體標(biāo)準(zhǔn)差成正比,而與樣本容量的平方根成反比變化; 2. 抽樣平均誤差比總體標(biāo)準(zhǔn)差小,僅為總體標(biāo)準(zhǔn)差的1 / /n。n第21頁/共101頁2021-11-24第七章 抽樣估計22(二)不重復(fù)抽樣平均數(shù)的抽樣平均誤差定義公式為:2()xxXM定義公式導(dǎo)出的計算公式:21xN

13、nnN當(dāng)N較大時,有:21xnnN第22頁/共101頁2021-11-24第七章 抽樣估計23不重復(fù)抽樣平均誤差計算公式的推導(dǎo):設(shè)總體變量為X1,X2,XN ,樣本變量為x1,x2,xn,根據(jù)平均數(shù)的定義和它的數(shù)學(xué)性質(zhì),有: 12( )nxxxE xEn121()()()nE xE xE xn在不重復(fù)抽樣條件下,由于x1,x2,xn不是相互獨立的,其中x1 是抽取的第1個變量,它可以在x1,x2,xn 中選擇,而總體中每個單位中選的概率都為1/N,因此:11( )E xXXN第23頁/共101頁2021-11-24第七章 抽樣估計24 x2 是抽取的第2個變量,它可以在N 1個總體單位中選擇,

14、而N 1個總體單位的組合可以有N種選擇,所以總體中每個單位中選的概率還是都為1/N,即:21111()NE xXXXNNN依此類推: 3121112()NNE xXXXNNNN 121111()nNNE xXXXNNNnN第24頁/共101頁2021-11-24第七章 抽樣估計25所以有: 121( )( )()()nE xE xE xE xn11XXXnXXnn按照抽樣平均誤差的定義:2222( )( )xxE xE xE xX212nxxxEXn21221()()()nExXxXxXn(1)2211()()()n nniijiijE xXE xXxXn第25頁/共101頁2021-11-2

15、4第七章 抽樣估計26由于在不重復(fù)抽樣條件下,樣本變量x不是互相獨立的,因此共有n(n 1)項的 2()iE xX()()ijE xXxX和的討論:0()()ijE xXxX22211()()()NiikkE xXxXXN(1)11()()()()()N Nijikjlk lE xXxXxXxXN N式中:k、l =1,2,N。 第26頁/共101頁2021-11-24第七章 抽樣估計27又由于: 2(1)211()()()()N NNNikikikjlkkk lxXxXxXxX(1)2210()()()()N NNikjlikk lkxXxXxXNX 2211()()()()()ijNXXE

16、 xXxXN NN所以: 可得: (1)22211()()()n nniijxiijE xXE xXxXn222221111()()()()xXXNnnXn nnNnN21xNnnN第27頁/共101頁2021-11-24第七章 抽樣估計28(三)成數(shù)的抽樣平均誤差成數(shù)的方差為:在重復(fù)抽樣條件下,成數(shù)的抽樣平均誤差為 :或21()pPP1()pPPn在不重復(fù)抽樣條件下,成數(shù)的抽樣平均誤差為 :11()pPPNnnN11()pPPnnN第28頁/共101頁2021-11-24第七章 抽樣估計29例7 1 假設(shè)總體有3個單位A、B、C,它們的某標(biāo)志值分別為3、5、7,樣本容量為2個單位, 試計算在

17、重復(fù)抽樣條件下和不重復(fù)抽樣條件下的抽樣平均誤差。 重復(fù)抽樣不重復(fù)抽樣樣本樣本ixixxx2()xX2()xX合計合計AAABACBABBBCCACBCCABACBABCCACB3、33、53、75、35、55、77、37、57、7 3、53、75、3 5、77、37、5 345456567 4 5 4 6 5 6 4 1 0 1 0 1 0 1 412 1 0 1 1 0 1 4本例N = 3,n = 2,易知,總體變量的平均數(shù)為5,樣本平均數(shù)的平均也等于5,即:5xX重復(fù)抽樣與不重復(fù)抽樣條件下的樣本組合及計算表第29頁/共101頁2021-11-24第七章 抽樣估計30根據(jù)抽樣平均誤差的定義

18、公式,重復(fù)抽樣時有2121.15479()xxXM根據(jù)抽樣平均誤差的計算公式,重復(fù)抽樣時有:22222(35)(55)(75)833()XXN28 31.15472/xn兩種方法計算結(jié)果是一樣的。第30頁/共101頁2021-11-24第七章 抽樣估計31不重復(fù)抽樣時根據(jù)抽樣平均誤差的定義公式,有不重復(fù)抽樣時根據(jù)抽樣平均誤差的計算公式,有:22222(35)(55)(75)833()XXN兩種方法計算結(jié)果是一樣的。240.81656()xxXM28 3320.8165231/1xNnnN第31頁/共101頁2021-11-24第七章 抽樣估計32例72 某大學(xué)調(diào)查學(xué)生某公共基礎(chǔ)課程的學(xué)習(xí)情況,

19、現(xiàn)采用不重復(fù)抽樣的方法抽取了5%的學(xué)生組成一個200人的樣本。對樣本的統(tǒng)計結(jié)果為:平均成績?yōu)?5分,標(biāo)準(zhǔn)差為17分;及格率為90%。試計算平均成績和及格率的抽樣平均誤差。 本例采用樣本方差代替總體方差,現(xiàn)分別計算如下:2217115%1.17200()xxsnnN(分)10.9 10.915%2.07%200()()1()pppnnN第32頁/共101頁2021-11-24第七章 抽樣估計33 (一)無偏性 無偏性標(biāo)準(zhǔn)就是要求在總體中所有可能抽取的樣本統(tǒng)計量的平均數(shù)應(yīng)等于被估計的總體參數(shù)。 (二)一致性 一致性標(biāo)準(zhǔn)就是要求當(dāng)樣本容量充分大時,樣本統(tǒng)計量也充分靠近總體參數(shù)。 (三)有效性 有效性

20、標(biāo)準(zhǔn)就是要求作為優(yōu)良估計量的方差應(yīng)該比其他估計量的方差小。 第33頁/共101頁2021-11-24第七章 抽樣估計34 點估計又稱定值估計,它是直接以樣本統(tǒng)計量作為相應(yīng)總體參數(shù)的估計量。例如,用樣本平均數(shù)的實際值直接估計總體平均數(shù),用樣本成數(shù)的實際值直接估計總體成數(shù)等。 在抽樣調(diào)查中,我們所抽取樣本的結(jié)構(gòu)與總體結(jié)構(gòu)應(yīng)該是一致的,樣本統(tǒng)計量的計算方法與總體參數(shù)的計算方法是相同的,只是總體參數(shù)未知,要用樣本統(tǒng)計量來估計它。無論從總體中抽取一個什么樣的樣本,用它的統(tǒng)計量來估計總體參數(shù)必然會有誤差。 但只要這個統(tǒng)計量符合無偏性、一致性和有效性三個標(biāo)準(zhǔn),我們?nèi)匀豢梢哉J(rèn)為它是優(yōu)良估計。 第34頁/共10

21、1頁2021-11-24第七章 抽樣估計35例73 某地對股民的資金帳戶余額及盈虧情況進行調(diào)查,現(xiàn)按隨機原則抽取了一個100人的樣本,對樣本的調(diào)查結(jié)果是:資金帳戶平均余額為10萬元,盈利股民比重為30%。試對該地全部股民的資金帳戶平均余額和盈利股民比重進行點估計。進行點估計就是直接用樣本統(tǒng)計量估計總體參數(shù): (萬元) 即該地全部股民的資金帳戶平均余額為10萬元,即盈利股民比重為30 %。 點估計的優(yōu)點:在于它能提供對于總體參數(shù)一個確定的估計值。點估計的不足:是這個確定的估計值有多大的誤差是未知的。10Xx30%Pp第35頁/共101頁2021-11-24第七章 抽樣估計36 我們沿用例73的資

22、料。 假如我們不是直接用樣本統(tǒng)計量資金帳戶平均余額10萬元來估計總體參數(shù),而是給定一個區(qū)間,采用10萬元左右這么一個幅度來估計該地全部股民的資金帳戶平均余額,就可以計算出相應(yīng)的可靠性程度。 (一)允許誤差范圍與估計區(qū)間第36頁/共101頁 2021-11-24第七章 抽樣估計37例如,我們在10萬元的左右都放寬2萬元, 即允許誤差范圍為 2萬元,從而可以形成一個估計區(qū)間812萬元,如下圖所示:X下限xX上限x 10 8 x 12 顯然,平均數(shù)的抽樣極限誤差 為: xxXx第37頁/共101頁2021-11-24第七章 抽樣估計38估計區(qū)間的上限和下限分別為: xXx上限xXx下限綜合起來,總體

23、平均數(shù)的估計區(qū)間為: xxXxx顯然,本例有 : 8(萬元) 12(萬元) X第38頁/共101頁 2021-11-24第七章 抽樣估計39對于成數(shù),根據(jù)例73的資料,若不是用樣本統(tǒng)計量盈利股民比重30%來直接估計該地全部股民的盈利股民比重,而是給定一個允許誤差范圍2%。如估計區(qū)間為28%32%,如下圖所示: 則成數(shù)的抽樣極限誤差可表達(dá)為: P下限pP上限ppPp估計區(qū)間為: ppppP本例有: 28%32%P 30% 28% 32% p第39頁/共101頁2021-11-24第七章 抽樣估計40引例:若總體有3個單位A、B、C,其變量值分別為3、5、7,樣本容量為2,所有樣本平均數(shù)的分布狀況

24、為:樣本平均數(shù)3 4 5 6 71 2 3 2 1x次數(shù) 概率 fff1929391929由概率的完備性原理,有:12321199999fPf(二)區(qū)間估計的基本公式樣本平均數(shù)的分布 第40頁/共101頁2021-11-24第七章 抽樣估計411. 對稱性,近似正態(tài)分布;2. 樣本平均數(shù)的分布中心就是總體平均數(shù)。所有樣本平均數(shù)的分布特點:35753X 3 1 4 25 36 27 159x xX本例有:即:第41頁/共101頁2021-11-24第七章 抽樣估計42現(xiàn)在我們引申出正態(tài)分布理論。在大樣本的條件下,樣本平均數(shù)的分布接近于正態(tài)分布: 68.27% 95.45% 99.73% x( )

25、xXix正態(tài)概率分布圖第42頁/共101頁2021-11-24第七章 抽樣估計43168.27%()F t例如:分布中心兩側(cè)各一個單位的標(biāo)準(zhǔn)差所限定的區(qū)間,對應(yīng)的概率為68.27%;分布中心兩側(cè)各二個單位的標(biāo)準(zhǔn)差所限定的區(qū)間,對應(yīng)的概率為95.45%;分布中心兩側(cè)各三個單位的標(biāo)準(zhǔn)差所限定的區(qū)間,對應(yīng)的概率為99.73%??杀磉_(dá)為:295.45%()F t399.73%()F t式中:F(t)表示估計區(qū)間的概率;t 表示概率度。 根據(jù)正態(tài)分布理論:無論一組變量的平均數(shù)和標(biāo)準(zhǔn)差大小如何,分布中心兩側(cè)以標(biāo)準(zhǔn)差為單位度量的區(qū)間與這一區(qū)間的概率是一一對應(yīng)的。第43頁/共101頁2021-11-24第七章

26、 抽樣估計44概率度又是一個確定估計區(qū)間的度量值。抽樣平均誤差 是樣本平均數(shù)的標(biāo)準(zhǔn)差,以 為單位,若給定一個區(qū)間,則可以表達(dá)為有 t 個 那么寬。xxt ppt 概率度與區(qū)間估計的基本公式概率度是測量估計可靠性程度的一個參數(shù)。概率度 t 的大小與概率的大小是一一對應(yīng)的,可通過給定的 t 值,查閱“正態(tài)分布概率表”,查得相應(yīng)的概率。由此可得總體平均數(shù)和成數(shù)區(qū)間估計的基本公式:第44頁/共101頁例如,在總體中隨機抽到了某個樣本,其平均數(shù)為 ,若它落在分布中心 右側(cè)2個 寬度的位置, 則其對應(yīng)的概率為47.725%,即:2021-11-24第七章 抽樣估計45Xix (iP xX)(ixxP x4

27、7.725%)X (iP Xx)(xP X47.725%)ixx 雖然分布中心是總體平均數(shù),但其數(shù)值大小是未知的。因此,該樣本平均數(shù)也有可能落在分布中心左側(cè)2個 寬度的位置,則其對應(yīng)的概率也為47.725%,即:第45頁/共101頁2021-11-24第七章 抽樣估計46 (iPxX)(ixxP x)ixx X一般可表達(dá)為: (iPxX)(xP xX(xP xt( )F tX考慮到對稱性,綜合有:47.725%47.725%95.45%)xt)xxt第46頁/共101頁2021-11-24第七章 抽樣估計47(三)區(qū)間估計的方法 總體參數(shù)區(qū)間估計的三要素包括樣本統(tǒng)計量、抽樣允許誤差范圍,以及概

28、率保證程度(置信度)。 樣本統(tǒng)計量由抽取樣本獲得; 抽樣誤差范圍決定了估計的準(zhǔn)確性; 概率保證程度則決定了估計的可靠性。 在已知樣本統(tǒng)計量的情況下,抽樣估計時只能對其中的一個要素提出要求。如果要對兩個要素都要提出一定的要求,只能通過增加樣本容量來解決。1. 區(qū)間估計應(yīng)具備的三要素 第47頁/共101頁2021-11-24第七章 抽樣估計48 (1)在一定的樣本條件下,給定概率保證程度,計算抽樣極限誤差; (2)在一定的樣本條件下,給定抽樣極限誤差,計算概率保證程度; (3)給定抽樣極限誤差和概率保證程度,推算出樣本容量??傮w參數(shù)區(qū)間估計的方法第48頁/共101頁2021-11-24第七章 抽樣

29、估計492. 給定概率保證程度求抽樣極限誤差 給定概率保證程度求抽樣極限誤差,就是根據(jù)區(qū)間估計的基本公式: 在已知 t、 的條件下,求 。 下面我們通過舉例來說明具體計算步驟。 t 第49頁/共101頁2021-11-24第七章 抽樣估計50例7 4 某鎮(zhèn)對居民人均月生活費支出進行抽樣調(diào)查,在全鎮(zhèn)10萬戶居民中用不重復(fù)抽樣方法隨機抽取了一個630戶的樣本,抽查資料如下表所列,試以95%(t = 1.96)的置信度對該地人均月生活費支出進行區(qū)間估計。 某地居民人均生活費支出抽查資料 人均月生活費支出 (元) 組中值(元) x戶數(shù)(戶) f x f2()xxf300以下30040040050050

30、0600600700700800800900900以上 250350450550650750850950 合計 12 55 92 117 134 106 85 29 6301 696 782.734 190 590.852 850 763.60 676 325.63 76 991.161 629 067.464 263 817.683 043 740.27 3 000 19 250 41 400 64 350 87 100 79 500 72 250 27 550 394 40018 428 079.38第50頁/共101頁2021-11-24第七章 抽樣估計51第一步,計算樣本平均數(shù)和方差:

31、 394 400626.03630 xfxf2218 428 079.3829 250.92630()sxxff(元)第二步,計算抽樣平均誤差: 229 250.926.81630 xsn第51頁/共101頁2021-11-24第七章 抽樣估計52第三步,計算抽樣極限誤差: (元)第四步,計算估計區(qū)間的限和下限: 1.96 6.8113.35xxt626.03 13.35639.38xx 上限 = 626.03 13.35612.68xx 下限 = 即在95%的概率保證程度下,估計該地居民人均月生活費支出在612.68639.38元之間。 估計精度 = 1 誤差率 1xx 13.35112.1

32、3%97.87%626.03 (元)(元)第52頁/共101頁2021-11-24第七章 抽樣估計53第一步,計算成數(shù)和方差: 第二步,計算抽樣平均誤差: 例7 5 根據(jù)例7 4的資料,試以95%(t = 1.96)的可靠性程度,對該地居民人均月生活費支出在500元以下的戶數(shù)比重進行區(qū)間估計。 112559225.24%630npn0.2524(10.2524)0.1887(1)pp0.18871.73%630(1)pppn第53頁/共101頁2021-11-24第七章 抽樣估計54第三步,計算抽樣極限誤差: 第四步,計算估計區(qū)間的限和下限: 即在95%的概率保證程度下,該地居民人均月生活費支

33、出在500元以下戶數(shù)比重的估計區(qū)間為21.85%28.63%。 1.96 1.73%3.39%ppt25.24%3.39%28.63%pp上限 = 25.24%3.39%21.85%pp下限 = 第54頁/共101頁2021-11-24第七章 抽樣估計553. 給定抽樣極限誤差求概率保證程度 給定抽樣極限誤差求概率保證程度,就是根據(jù)區(qū)間估計的基本公式: 在已知 、 的條件下,求 t,然后根據(jù)t 查表得概率保證程度。 下面我們通過舉例來說明具體計算步驟。 t 第55頁/共101頁2021-11-24第七章 抽樣估計56例7 6 根據(jù)例7 4的資料,若允許誤差范圍為16元,試對該地居民人均月生活費

34、支出進行區(qū)間估計,并通過計算概率度和查閱概率表,求出可靠性程度。626.03x6.81x第三步,計算估計區(qū)間的限和下限: 626.03 16642.03xx 上限 = 626.03 16610.03xx 下限 = (元)(元)第二步,計算抽樣平均誤差第一步,計算樣本平均數(shù)(見例7 4)(見例7 4)第56頁/共101頁2021-11-24第七章 抽樣估計57第四步,計算概率度: 162.356.81xxt即該地居民人均月生活費支出在610.03642.03元之間的可靠性程度為98.12%。 查概率表得置信度為98.12%。第57頁/共101頁2021-11-24第七章 抽樣估計58例7 7 根

35、據(jù)例7 4和例7 5的資料,若允許誤差范圍為5%,試對該地居民人均月生活費支出在500元以下的戶數(shù)比重進行區(qū)間估計,并計算和查表確定可靠性程度。第三步,計算估計區(qū)間的上限和下限: 25.24%p1.73%p25.24%5%30.24%pp上限 = 第二步,抽樣平均誤差25.24%5%20.24%pp下限 = 第一步,計算樣本成數(shù)(見例7 4)(見例7 4)第58頁/共101頁2021-11-24第七章 抽樣估計59第四步,計算概率度: 即該地居民人均月生活費支出在500元以下戶數(shù)比重的估計區(qū)間為20.24%30.24%,其概率保證程度為99.61%。查概率表得置信度為99.61%。5%2.89

36、1.73%ppt第59頁/共101頁2021-11-24第七章 抽樣估計604. 給定抽樣極限誤差和概率保證程度推算 必要的樣本容量 給定抽樣極限誤差和概率保證程度推算必要的樣本容量 ,就是根據(jù)區(qū)間估計的基本公式: 在已知 、 t 的條件下,求 的計算公式中所包含的n。t 第60頁/共101頁2021-11-24第七章 抽樣估計61在重復(fù)抽樣下,抽樣平均數(shù)區(qū)間估計的基本公式可以寫成:2xxttn 則必要的樣本容量為: 222xxtn第61頁/共101頁2021-11-24第七章 抽樣估計62在不重復(fù)抽樣下,抽樣平均數(shù)區(qū)間估計的基本公式為:則必要的樣本容量為: 21xxnttnN 22222xx

37、NtnNt 第62頁/共101頁2021-11-24第七章 抽樣估計63同理,重復(fù)抽樣和不重復(fù)抽樣的成數(shù)樣本必要容量分別為: 22(1)pxt PPn222(1)(1)pxNt PPnNt PP 第63頁/共101頁2021-11-24第七章 抽樣估計64確定樣本必要容量的注意點 第一,如何確定方差。因為總體方差是未知的,解決的方法之一是采用總體方差的歷史數(shù)據(jù)或經(jīng)驗數(shù)據(jù),當(dāng)有多個方差可供選擇時,應(yīng)選擇較大的方差;方法之二是用試驗性樣本的方差來替代。 第二,如何確定樣本容量。當(dāng)根據(jù)任務(wù)要求需要同時估計總體的平均數(shù)和成數(shù)時,應(yīng)分別計算估計平均數(shù)的必要樣本容量和估計成數(shù)的必要樣本容量,并選擇較大者作

38、為正式樣本容量,以確保將抽樣誤差控制在允許的范圍內(nèi)。第64頁/共101頁2021-11-24第七章 抽樣估計65例7 8 某機械加工廠對一批零件進行抽檢,零件數(shù)量為13 752個,根據(jù)歷史資料,這種零件平均長度的標(biāo)準(zhǔn)差在1220毫米之間,一等品率在92 %96 %之間。現(xiàn)用不重復(fù)抽樣的方法,要求在95 %(t = 1.96)的可靠性程度保證下,零件平均長度的誤差范圍不超過3毫米,一等品率的誤差范圍不超過4.7 %,求樣本必要容量。222222222213 752 1.9620169 13 752 31.9620 xxNtnNt (個)確定樣本必要容量舉例:估計零件平均長度的樣本必要容量計算如下

39、:標(biāo)準(zhǔn)差采用歷史資料較大者20毫米。第65頁/共101頁2021-11-24第七章 抽樣估計66因0.920.08 0.960.04,方差應(yīng)選擇前者22222213 752 1.960.920.08127()13 7520.0471.960.920.0811ppNt PPnNt PP 個最后,確定正式樣本容量時,應(yīng)選擇169個和127個中較大者169個,當(dāng)然還可以根據(jù)需要進行適當(dāng)調(diào)整。 估計零件一等品率的樣本必要容量計算如下:第66頁/共101頁2021-11-24第七章 抽樣估計67一、抽樣組織設(shè)計概述 在抽樣設(shè)計中,我們首先要保證隨機原則的實現(xiàn)。隨機取樣是抽樣推斷的前提,違反了隨機原則,抽

40、樣推斷的理論和方法也就失去了意義。從理論上說,隨機原則就是要保證總體每一個單位都有同等的中選機會,或樣本的抽選概率是已知的。 (一)抽樣隨機原則第67頁/共101頁2021-11-24第七章 抽樣估計68 第一,合適的抽樣框。抽樣框必須具備可實施的條件,一個合適的抽樣框必須能覆蓋總體所有的單位,還要考慮抽樣單位與總體單位的對應(yīng)問題。 第二,取樣的實施問題。在總體單位數(shù)很大甚至無限大的情況下,要保證總體中每一個單位都有均等的中選機會絕非易事。在抽樣設(shè)計時,要考慮將總體各單位加以分類、排隊,以盡量保證隨機原則的實現(xiàn)。 保證隨機原則的實現(xiàn)的注意點第68頁/共101頁2021-11-24第七章 抽樣估

41、計69 樣本容量的大小和結(jié)構(gòu)直接反映樣本的代表性好壞。 樣本的容量的大小:取決于對抽樣推斷準(zhǔn)確性、可靠性的要求。在抽樣設(shè)計時,應(yīng)重視研究現(xiàn)象的差異,允許誤差范圍的要求與樣本容量的關(guān)系,作出適當(dāng)?shù)倪x擇。 樣本容量的結(jié)構(gòu): 例如,某鄉(xiāng)鎮(zhèn)要抽取100畝播種面積,可以先抽5個村,每個村再抽20畝,也可以先抽10個村,每個村再抽10畝等。樣本容量的結(jié)構(gòu)不同,所產(chǎn)生的效果也不同。抽樣設(shè)計應(yīng)考慮通過改善和調(diào)整樣本結(jié)構(gòu)來提高抽樣效果。(二)樣本容量的結(jié)構(gòu)第69頁/共101頁2021-11-24第七章 抽樣估計70 抽樣組織方式包括:簡單隨機抽樣、等距抽樣、類型抽樣和整群抽樣等。 不同的抽樣組織方式會產(chǎn)生不同的

42、抽樣效果。 同一種抽樣組織方式,由于采用的分類標(biāo)志不同,也會產(chǎn)生不同的效果。(三)抽樣組織方式第70頁/共101頁2021-11-24第七章 抽樣估計71 二、常用的抽樣組織方式 簡單隨機抽樣是按隨機原則直接從總體N個單位中抽取n個單位作為樣本。不論是重復(fù)抽樣還是不重復(fù)抽樣,都要保證每個單位在抽選中都有相等的中選機會。 由于這種抽樣組織方式除了設(shè)計好抽樣框外,不需要其他信息,所以也被稱為單純隨機抽樣。(一)簡單隨機抽樣第71頁/共101頁2021-11-24第七章 抽樣估計72 簡單隨機抽樣是最基本也是最簡單的抽樣組織方式,它適合于分布較為均勻的總體。在抽樣之前,我們應(yīng)對總體各單位加以編號,然

43、后用抽簽的方法或根據(jù)隨機數(shù)字表來抽取必要的樣本單位數(shù)。 簡單隨機抽樣最能體現(xiàn)抽樣的隨機原則,所以抽樣平均誤差的計算方法是以它為基礎(chǔ)的,各種抽樣組織方式抽樣誤差的比較也是以它為基礎(chǔ)的。簡單隨機抽樣的特點:第72頁/共101頁2021-11-24第七章 抽樣估計73 等距抽樣也稱機械抽樣或系統(tǒng)抽樣,它是先根據(jù)某一標(biāo)志對總體各單位進行排隊,然后按一定順序和間隔來抽取樣本單位的一種抽樣組織方式。 由于這種抽樣是在總體各單位排序的基礎(chǔ)上,再按一定規(guī)則和一定間隔抽取樣本,這樣可以保證所取得的樣本單位比較均勻地分布在總體的各個部分,所以有較高的代表性。 (二)等距抽樣等距抽樣一般都是不重復(fù)抽樣。第73頁/共

44、101頁2021-11-24第七章 抽樣估計74 排序標(biāo)志可以是無關(guān)標(biāo)志,也可以是有關(guān)標(biāo)志。 所謂無關(guān)標(biāo)志,是指和單位標(biāo)志值的大小無關(guān)或不起主要作用的標(biāo)志。 所謂有關(guān)標(biāo)志,就是作為排序的標(biāo)志與單位標(biāo)志值的大小有密切的關(guān)系。等距抽樣的操作程序:首先要將總體單位排序:第74頁/共101頁2021-11-24第七章 抽樣估計75 按有關(guān)標(biāo)志排隊,將總體加以n等分之后,在每一間隔抽取一個樣本單位的方法有兩種: (1)半距中點取樣。即抽取每一間隔內(nèi)處于中間位置的單位作為樣本單位。 (2)對稱等距抽樣。即將總體按有關(guān)標(biāo)志排序后,在第一個間隔內(nèi)隨機抽取第1個樣本單位,假如第1個樣本單位在第一個間隔內(nèi)是處在第

45、k個位置,則在第二個間隔內(nèi)抽取倒數(shù)第k個單位作為樣本單位,在第三個間隔內(nèi)再抽取正數(shù)第k個單位作為樣本單位,以此類推,共抽取n個單位構(gòu)成樣本。對稱等距抽樣能從總體上把握樣本的代表性。按有關(guān)標(biāo)志排序的抽樣方法第75頁/共101頁2021-11-24第七章 抽樣估計76 總體按無關(guān)標(biāo)志排序后,若要抽取n個單位作為樣本,則可將總體等距劃分成n個間隔,在第一個間隔內(nèi)根據(jù)隨機原則抽取第一個樣本單位,然后以第一個樣本單位算起,等距地在每個間隔中抽取一個單位,共可抽取n個單位構(gòu)成樣本。 這種方法的隨機原則主要體現(xiàn)在第一個樣本單位的抽選上,當(dāng)?shù)谝粋€單位隨機確定后,其余各個單位的位置也就確定了。 按無關(guān)標(biāo)志排序的

46、等距抽樣類似于簡單隨機抽樣。按無關(guān)標(biāo)志排序的抽樣方法第76頁/共101頁2021-11-24第七章 抽樣估計77例7 9 某廠對流水線上生產(chǎn)的某產(chǎn)品進行質(zhì)量抽檢,每隔半小時抽取1個產(chǎn)品,共抽取了300個產(chǎn)品構(gòu)成一個樣本。測得樣本產(chǎn)品的一等品率為93 %,試以95%(t = 1.96)的可靠性程度對該流水線生產(chǎn)的產(chǎn)品一等品率進行區(qū)間估計。 這是按時間排序的等距抽樣。流水線上生產(chǎn)的產(chǎn)品數(shù)可視為無窮大,因此1 n/N可忽略不計。93%p0.93(10.93)1.47%300(1)pppn現(xiàn)計算如下:第77頁/共101頁2021-11-24第七章 抽樣估計781.96 1.47%2.88%ppt93%

47、2.88%95.88%pp 上限 = 93%2.88%90.12%pp 下限 = 即在95%的概率保證下,該流水線生產(chǎn)的產(chǎn)品一等品率在90.12%95.88%之間。 抽樣極限誤差及上限、下限計算如下:第78頁/共101頁2021-11-24第七章 抽樣估計79 類型抽樣又稱分層抽樣,它是將總體各單位按主要標(biāo)志進行分組,然后再從各組中按隨機原則抽取一定比例的單位構(gòu)成樣本。 類型抽樣的特點:是把分類法和隨機原則結(jié)合起來。由于它是按一定比例在每一組中抽樣,所以不存在組間誤差。(三)類型抽樣第79頁/共101頁2021-11-24第七章 抽樣估計80 由于類型抽樣只存在組內(nèi)誤差,不存在組間誤差,我們在

48、分組時應(yīng)盡量將變異較小的同類單位歸入一組,通過擴大組間差異來達(dá)到縮小組內(nèi)差異的目的。 類型抽樣分組時,為了劃分各種類型,各組單位數(shù)可多可少,但各組的抽樣比例最好保持相同,以避免各組抽樣比例不同而引起的誤差。 類型抽樣的抽樣誤差一般小于簡單隨機抽樣的誤差。類型抽樣操作上的注意點:第80頁/共101頁2021-11-24第七章 抽樣估計81xfxf22s fsf2xsn21xsnnN不重復(fù)抽樣時抽樣平均誤差為: 類型抽樣的抽樣平均誤差的計算:樣本平均數(shù)和組內(nèi)方差的平均數(shù)一般應(yīng)加權(quán)平均:重復(fù)抽樣時抽樣平均誤差為: 第81頁/共101頁2021-11-24第七章 抽樣估計82例7 10 某企業(yè)有三個車

49、間生產(chǎn)某產(chǎn)品,現(xiàn)分別從三個車間各抽取5%的產(chǎn)量進行檢驗,得檢驗結(jié)果如表7 4所示,試以90%(t = 1. 64)的可靠性程度,對該產(chǎn)品的平均每包重量和平均優(yōu)質(zhì)品率進行區(qū)間估計。 某企業(yè)三個車間產(chǎn)品樣本資料 甲乙丙 合計 車間 樣本單位數(shù) (包) 平均重量 (千克) 標(biāo)準(zhǔn)差 (千克) 優(yōu)質(zhì)品率 (%) 21341570 61.059.460.21.10.81.087.985.691.4產(chǎn)品平均每包重量的區(qū)間估計可計算分析如下: 70nf(包) 本例 第82頁/共101頁2021-11-24第七章 抽樣估計83222221.1210.8341150.8970s fsf20.8915%0.1170

50、1xsnnN(千克) 61 2159.4 3460.2 1560.0570 xfxf(千克) 第83頁/共101頁2021-11-24第七章 抽樣估計84即在90%的可靠性程度保證下,該產(chǎn)品的平均每包重量為59.8760.23千克。(千克) 60.050.1860.23xx上限 下限 60.050.1859.87xx(千克) 根據(jù)計算結(jié)果,可對三個車間生產(chǎn)的所有產(chǎn)品作出估計:1.640.110.18xxt(千克) 第84頁/共101頁2021-11-24第七章 抽樣估計85產(chǎn)品優(yōu)質(zhì)品率的區(qū)間估計計算分析如下:87.92185.6 3491.4 1587.53%70pfpf22(1)s fpp

51、fsff0.8790.121 210.8560.144340.9140.086 15700.1086第85頁/共101頁2021-11-24第七章 抽樣估計8620.108615%3.84%701psnnN1.64 3.84%6.3%ppt87.53%6.3%93.83%pp87.53%6.3%81.23%pp上限 下限 即在90%的可靠性程度保證下,該產(chǎn)品的平均優(yōu)質(zhì)品率在81.23 %93.83 %之間。 第86頁/共101頁2021-11-24第七章 抽樣估計87 整群抽樣也稱整組抽樣,它是將總體各單位劃分成若干群,然后從中隨機抽取部分群,對選中群的所有單位進行全面調(diào)查的抽樣組織方式。 整

52、群抽樣是對中選的群進行全面調(diào)查,如果想象各群濃縮成一個單位,那么整群抽樣實質(zhì)上是以各群代替各單位之后的簡單隨機抽樣。(四)整群抽樣第87頁/共101頁2021-11-24第七章 抽樣估計88 整群抽樣只存在群間方差,不存在群內(nèi)方差。 整群抽樣在分組時應(yīng)盡量擴大群內(nèi)的差異程度,以達(dá)到縮小群間方差的目的。 整群抽樣的好處:組織工作方便,確定一群便可以調(diào)查許多單位。 整群抽樣的缺點:由于抽樣單位比較集中,限制了樣本在總體分配的均勻性,所以抽樣誤差較大。通常采用增加一些群數(shù)的辦法,以減少抽樣誤差,提高估計的準(zhǔn)確性。 整群抽樣的特點:第88頁/共101頁2021-11-24第七章 抽樣估計89假設(shè)樣本各

53、群單位數(shù)相同。將總體單位數(shù)N劃分成R群,每群包括M個單位。再從R群中抽取r群構(gòu)成一個樣本,則可計算如下:xxMxxr由于n = M r ,r比n小得多,所以在計算樣本的群間方差時要減少一個自由度,即:22()1xxr整群抽樣的計算公式:第89頁/共101頁2021-11-24第七章 抽樣估計90整群抽樣為不重復(fù)抽樣。在計算抽樣平均誤差時,必須用總體群數(shù)R來替代總體單位數(shù)N,用樣本群數(shù)r來替代樣本單位數(shù)n。21xRrrR計算公式為:抽樣平均誤差的計算說明如下:第90頁/共101頁2021-11-24第七章 抽樣估計91總體成數(shù)估計時相關(guān)計算公式為: 成數(shù)的抽樣平均誤差為 :ppr22()1ppr21pRrrR第91頁/共101頁2021-11-24第七章 抽樣估計92例7 11 某鄉(xiāng)鎮(zhèn)從全鄉(xiāng)32個自然村中抽出9個自然村,調(diào)查各村人均純收入,相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論