




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第9講抽樣與參數(shù)估計(jì)一﹑抽樣方法抽樣概率抽樣非概率抽樣簡(jiǎn)單隨機(jī)抽樣分層抽樣等距抽樣整群抽樣判斷抽樣定額抽樣滾雪球抽樣2020/12/211.簡(jiǎn)單隨機(jī)抽樣(SimpleRandomSampling)
一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(n≤N),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣。假設(shè)要對(duì)某食品店內(nèi)的一批小包裝餅干進(jìn)行衛(wèi)生達(dá)標(biāo)檢驗(yàn),我們只能從中抽取一定數(shù)量的餅干作為檢驗(yàn)的樣本。得到樣本餅干的一個(gè)方法是,將這批小包裝餅干放入一個(gè)不透明的袋子中,攪拌均勻,然后不放回地摸取(這樣可以保證每一袋餅干被抽中的機(jī)會(huì)相等),這樣我們就可以得到一個(gè)簡(jiǎn)單隨機(jī)樣本。抽簽法(抓鬮法):例如,高一(2)班有45名學(xué)生,現(xiàn)要從中抽出8名學(xué)生去參加一個(gè)座談會(huì),每名學(xué)生的機(jī)會(huì)相等。我們可以把45名學(xué)生的學(xué)號(hào)寫在小紙片上,揉成小球,放到一個(gè)不透明袋子中,充分?jǐn)嚢韬?,再從中逐個(gè)抽出8個(gè)號(hào)簽,從而抽出8名參加座談會(huì)的學(xué)生。2020/12/22精品資料3你怎么稱呼老師?如果老師最后沒有總結(jié)一節(jié)課的重點(diǎn)的難點(diǎn),你是否會(huì)認(rèn)為老師的教學(xué)方法需要改進(jìn)?你所經(jīng)歷的課堂,是講座式還是討論式?教師的教鞭“不怕太陽曬,也不怕那風(fēng)雨狂,只怕先生罵我笨,沒有學(xué)問無顏見爹娘……”“太陽當(dāng)空照,花兒對(duì)我笑,小鳥說早早早……”42.分層抽樣法(類型抽樣:StratifiedSampling)
一般地,在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法是一種分層抽樣法.假設(shè)某地區(qū)有高中生2400人,初中生10900人,小學(xué)生11000人.此地區(qū)教育部門為了了解本地區(qū)中小學(xué)生的近視情況及形成原因,要從本地區(qū)中小學(xué)生中抽取1%的學(xué)生進(jìn)行調(diào)查.由于樣本容量與總體的個(gè)體數(shù)的比是1:100,因此,樣本中包含的各部分的個(gè)體數(shù)應(yīng)該是
2400/10010900/10011000/100即抽取24名高中生,109名初中生和110名小學(xué)生作為樣本.2020/12/253.等距抽樣(系統(tǒng)抽樣:SystematicSampling)
等距抽樣是在總體中每隔一定距離選取一個(gè)樣本,即從數(shù)量為N的總體中每隔k個(gè)單位就選取一個(gè)樣本,若需選擇n個(gè)樣本,則取k=N/n,k的值需取整.(如遇到N/n不是整數(shù)的情況,可以先從總體中隨機(jī)地剔除幾個(gè)個(gè)體,使得總體中剩余的個(gè)體數(shù)能被樣本容量整除)某學(xué)校為了了解高一年級(jí)學(xué)生對(duì)教師教學(xué)的意見,打算從高一年級(jí)500名學(xué)生中抽取50名進(jìn)行調(diào)查.首先將這500名學(xué)生從1開始進(jìn)行編號(hào),然后按號(hào)碼順序以一定的間隔進(jìn)行抽?。捎?00/50=10,這個(gè)間隔可以定為10,即從號(hào)碼為1~10的第一間隔中隨機(jī)地抽取一個(gè)號(hào)碼,假如抽到6號(hào),然后從第6號(hào)開始,每隔10個(gè)號(hào)碼抽取一個(gè),得到
6,16,26,36,···,496這樣我們就得到一個(gè)容量為50的樣本.2020/12/264.整群抽樣(ClusterSampling)
整群抽樣就是從總體中成群成組地抽取調(diào)查單位,而不是一個(gè)一個(gè)地抽取調(diào)查單位。整群抽樣與分層抽樣有相似之處,即它們的第一步都是根據(jù)某種標(biāo)準(zhǔn)將總體劃分為一些子群。分層抽樣是在所有子群中均要抽取樣本,作為總體樣本的一部分。而整群抽樣則不然,它是抽取若干子群并將抽出的子群中全部個(gè)體作為樣本,因此總體樣本只分布在幾個(gè)群中。某大學(xué)共有100個(gè)班級(jí),每班30人,共3000人。現(xiàn)要抽300人作為樣本,就可以采取隨機(jī)的辦法抽10個(gè)班。整群抽樣的優(yōu)點(diǎn)是可以簡(jiǎn)化抽樣的過程;降低收集資料的費(fèi)用;擴(kuò)大抽樣的應(yīng)用。其缺點(diǎn)是樣本分布不均勻,樣本的代表性較差。2020/12/275.方便抽樣(ConvenienceSampling)
方便抽樣又稱為就近抽樣、偶遇抽樣和自然抽樣,它是一種非概率抽樣方法。
方便抽樣是指調(diào)查者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對(duì)象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對(duì)象。為了調(diào)查某市的交通情況,研究者到離他最近的公共汽車站,把當(dāng)時(shí)正在那里等車的人選作調(diào)查對(duì)象。
在圖書館閱覽室對(duì)當(dāng)時(shí)正在閱讀的讀者進(jìn)行調(diào)查。2020/12/286.判斷抽樣(JudgmentSampling)
判斷抽樣又稱為主觀抽樣和立意抽樣,它是一種非概率抽樣方法。
判斷抽樣是根據(jù)合理的判斷而得到具有代表性的樣本的一種抽樣方法。如果判斷正確,使用判斷抽樣既節(jié)約時(shí)間又節(jié)省成本,但通常就一個(gè)判斷而言,有時(shí)出現(xiàn)判斷錯(cuò)誤是不可避免的。某記者可以抽取他認(rèn)為能夠代表所有參議員觀點(diǎn)的兩名或三名參議員進(jìn)行調(diào)查。2020/12/297.定額抽樣(配額抽樣:QuotaSampling)
定額抽樣是一種非概率抽樣方法。
定額抽樣與分層抽樣相似,也是按調(diào)查對(duì)象的某種屬性或特征將總體中所有個(gè)體分成若干類或?qū)樱缓笤诟鲗又谐闃?,樣本中各層(類)所占比例與他們?cè)诳傮w中所占比例一樣。定額抽樣的目的在于要抽選出一個(gè)總體的“模擬物”。
某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;一年級(jí)學(xué)生占40%,二年級(jí)、三年級(jí)、四年級(jí)學(xué)生分別占30%、20%和10%。現(xiàn)要用定額抽樣方法依上述三個(gè)變量抽取一個(gè)規(guī)模為100人的樣本??傻枚~表如下:
男生(60)女生(40)文科(30)理科(30)文科(20)理科(20)年級(jí)一二三四一二三四一二三四一二三四人數(shù)1296312963864286422020/12/2108.滾雪球抽樣(SnowballSampling)滾雪球抽樣是一種非概率抽樣方法。
在無法了解總體情況時(shí),可以從總體中的少數(shù)成員入手,對(duì)他們進(jìn)行調(diào)查,向他們?cè)儐栠€知道哪些符合條件的人;再去找那些人并詢問他們知道的人。如同滾雪球一樣,我們可以找到越來越多具有相同性質(zhì)的群體成員。這樣的抽樣方法就是滾雪球抽樣方法。要研究退休老人的生活,可以清晨到公園去結(jié)識(shí)幾位散步老人,再通過他們結(jié)識(shí)其朋友,不用很久,你就可以交上一大批老年朋友。2020/12/211二﹑抽樣分布與參數(shù)估計(jì)1.正態(tài)分布與總體均值的區(qū)間估計(jì)
(1)正態(tài)分布設(shè)連續(xù)型隨機(jī)變量X的概率密度為其中μ,σ>0為常數(shù),則稱X服從參數(shù)為μ,σ的正態(tài)分布或高斯(Gauss)分布,記為X~N(μ,σ2).當(dāng)μ=0,σ=1時(shí),為標(biāo)準(zhǔn)正態(tài)分布,記作N(0,1).
從經(jīng)驗(yàn)和理論的研究告訴我們,在實(shí)踐中遇到的隨機(jī)變量,有許多是服從或近似地服從正態(tài)分布律.
,f(X)=√2πσ1e-(x-μ)22σ2﹣∞<x<+∞2020/12/212正態(tài)分布的密度函數(shù)f(x)的曲線簡(jiǎn)稱為正態(tài)曲線.下圖給出3條正態(tài)曲線,它們的μ都等于零,但卻具有不同的σ值.從圖可以看出,正態(tài)曲線具有下述性質(zhì):1)
曲線是位于橫軸的上方,以直線x=μ為對(duì)稱軸,它向左右對(duì)稱地?zé)o窮伸延,并且以橫軸為漸進(jìn)線.當(dāng)x=μ時(shí)曲線處于最高點(diǎn),當(dāng)x向左右遠(yuǎn)離μ時(shí),曲線逐漸降低,整條曲線呈現(xiàn)“中間高,兩邊低”的形狀.參數(shù)σ決定了正態(tài)曲線的形狀特點(diǎn)2020/12/213
(2)中心極限定理
設(shè)從均值為μ,方差為σ2的一個(gè)服從任意分布的總體中,抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ,方差為σ2/n的正態(tài)分布.中心極限定理告訴我們,當(dāng)樣本總體不是正態(tài)分布或者總體的分布未知時(shí),只要樣本容量n充分大,樣本均值就服從正態(tài)分布.那么n多大才叫充分大呢?當(dāng)總體的分布未知時(shí),通常要求n≥30.2020/12/214
(3).σ2已知時(shí),總體均值μ的區(qū)間估計(jì)
設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ)的一個(gè)樣本,其中總體方差σ2已知,則統(tǒng)計(jì)量~N(0,1).對(duì)于給定的顯著性水平α(0<α<1),總體均值μ在置信水平1-α下的置信區(qū)間為:
2020/12/215本例中,雖然總體分布未知,但由于n=36,是大樣本情況,根據(jù)中心極限定理,樣本均值服從正態(tài)分布.已知:n=36,σ=1.2,1-α=0.98則α=0.02,差表得Z=2.33樣本均值X=[(3×14)+(4×8)+(2×6)+(5×5)+(1×2)+(6×1)]/36=3.31根據(jù)前面的公式,總體均值在置信水平98%下的置信區(qū)間為:=(3.31-2.33,3.31+2.33)=(2.84,3.78)也就是說,有98%的把握相信,顧客平均入住天數(shù)大約在2.8天與3.8天之間.2α(X-Z2σnX+Z)σ√nα2α√,1.2√361.2√36案例:
某飯店隨機(jī)抽取了36名顧客,對(duì)其入住天數(shù)進(jìn)行統(tǒng)計(jì)調(diào)查,其中入住3天的有14人,入?。刺斓挠校溉耍胱。蔡斓挠校度耍胱。堤斓挠校等?,入住1天的有2人,入?。短斓挠校比?,假設(shè)其總體標(biāo)準(zhǔn)差為1.2,試構(gòu)建98%的置信區(qū)間,估計(jì)顧客的平均入住天數(shù).2020/12/216n2020/12/2172.t分布與總體均值的區(qū)間估計(jì)
(1)t分布設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ2)的一個(gè)樣本,而總體方差σ2未知,樣本均值,樣本方差為S2,
X=n1ΣXii=1nS2=n-11Σ(Xi-X)i=1n2t=X-μS/√nt=X-μS/√n~t(n-1).從圖可以看出t分布是對(duì)稱分布,當(dāng)n很大時(shí)(例如當(dāng)n>30時(shí))t分布和正態(tài)分布很接近.t分布通常是在小樣本情況下,總體方差未知時(shí),對(duì)總體均值μ的估計(jì)和假設(shè)檢驗(yàn)中使用.則選取統(tǒng)計(jì)量其中2020/12/218
(2)σ2未知時(shí),總體均值μ的區(qū)間估計(jì)
設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ)的一個(gè)樣本,但總體方差σ2未知,這時(shí)要選取統(tǒng)計(jì)量,
則
對(duì)于給定的顯著性水平α(0<α<1),總體均值μ在置信水平1-α下的置信區(qū)間為:
t=X-μS/√nt=X-μS/√n~t(n-1).2020/12/219
案例:研究者從人群中隨機(jī)抽取16人,調(diào)查他們的年出游天數(shù),得到他們的年出游天數(shù)分別為13天﹑9天﹑
7天﹑
15天﹑
17天﹑
20天﹑
12天﹑
6天﹑
12天﹑
12天﹑
10天﹑9天﹑16天﹑
7天﹑
8天﹑
11天,假設(shè)其總體服從正態(tài)分布,試在α=0.1下建立年人均出游天數(shù)的置信區(qū)間.已知n=16,α=0.1
計(jì)算得:查表得:t=1.753
根據(jù)公式,總體均值μ在置信水平90%下的置信區(qū)間為:也就是說,有90%的把握相信,年人均出游天數(shù)大約在9.8天到13.2天之間.ΣXi=11.5X=n1i=1ni=1n(Xi-X)2√1n-1Σ
=3.96S=2α(X–t(n-1),α2S√nX+t(n-1))α2S√n11.5+1.7533.9616)=(11.5-1.7533.9616,=(9.77,13.24)2020/12/2202020/12/221
3.總體比例的區(qū)間估計(jì)
(1)樣本比例的分布樣本比例p是樣本中具有某種特征的單位數(shù)量X除以樣本中的單位總數(shù)n得到的.
總體中具有某種特征的單位占全部單位的比例稱為總體比例,記作p.
在大樣本情況下,樣本比例分布近似于正態(tài)分布.若從總體中抽取n個(gè)樣本,則樣本比例p的均值為p,p的方差為
p=nXn1p(1-p),即p~N(p,p(1-p))n1Z=√p-pp(1-p)n則統(tǒng)計(jì)量~N(0,1).2020/12/222
(2)總體比例的區(qū)間估計(jì)在
中,要確定p的區(qū)間估計(jì),用p代替分母中的p,得到在1-α的置信水平下,總體比例p值的置信區(qū)間為:
在上式中,是點(diǎn)估計(jì),
P(1-P)nZ=√p-p
是估計(jì)誤差.2020/12/223案例:航空公司的飛行時(shí)間和價(jià)格是商務(wù)旅行者選擇航班的重要因素,調(diào)查結(jié)果表明,商務(wù)旅行者一般將航空公司許諾的??驼劭劭闯墒亲钪匾囊蛩兀谝粋€(gè)由1993名商務(wù)旅行者組成的簡(jiǎn)單隨機(jī)樣本中,有618人認(rèn)為折扣是他們最看好的東西.試在0.95的置信水平下,估計(jì)認(rèn)為折扣最有吸引力的人數(shù)所占的比例.=(0.29,0.33)p(1-p)n(p–Z
α2√,p(1-p)np+Z
α2√
已知,n=1993,p=618/1993=0.31,1-α=0.95查表得:Z2α=Z0.025=1.96由得知,認(rèn)為折扣最有吸引力的人數(shù)所占的比例為29%~33%之間.2020/12/224pp))2020/12/225
4.樣本容量的確定
(1)估計(jì)總體均值時(shí),樣本容量的確定
在大樣本情況下,不論是正態(tài)總體還是非正態(tài)總體,在估計(jì)總體均值μ時(shí),我們都選取統(tǒng)計(jì)量其中,X-μ就是估計(jì)誤差,記估計(jì)誤差為△,
△=X-μ,則得到估計(jì)總體均值μ時(shí)的樣本容量為:
X-μZ=σ/√n,
Z=σ/√n△2Zn=α2σ2△22020/12/226
案例:某飯店為了合理配置前臺(tái)接待人員,飯店管理部門需要了解接待一名顧客所花費(fèi)的時(shí)間,要求估計(jì)誤差不超過2分鐘,假定一名服務(wù)員接待一名顧客花費(fèi)時(shí)間的標(biāo)準(zhǔn)差為4分鐘,問在99%的置信水平下,需要觀察多少名顧客?2Zα=Z0.005=2.58
查表得:n=α2σ2△2Z2=(2.58)2(4)222=26.6于是,已知估計(jì)誤差△=2,標(biāo)準(zhǔn)差σ=4,1-α=0.99,α=0.01即需要觀察27名顧客。2020/12/2272020/12/228(2)估計(jì)總體比例時(shí),樣本容量的確定估計(jì)樣本比例時(shí),選取統(tǒng)計(jì)量,估計(jì)誤差為△,△=p–p=Z2α√p(1-p)nP(1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度高等教育機(jī)構(gòu)教師聘用與創(chuàng)新創(chuàng)業(yè)教育合同
- 二零二五年度運(yùn)輸車司機(jī)雇傭與職業(yè)發(fā)展規(guī)劃合同
- 2025年度特色小吃店鋪轉(zhuǎn)讓與品牌授權(quán)合同
- 酒吧藝人合同制演出合約及檔期安排協(xié)議2025
- 二零二五年度文化藝術(shù)交流合同排版與文化輸出規(guī)范
- 2025至2031年中國牛奶沐浴露行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國椰殼耳環(huán)配件行業(yè)投資前景及策略咨詢研究報(bào)告
- 墓碑雕刻合同范本
- 2025至2031年中國多功能電視盒行業(yè)投資前景及策略咨詢研究報(bào)告
- 主材采購合同范本
- (高級(jí))工業(yè)機(jī)器人系統(tǒng)運(yùn)維員技能鑒定考試題庫(濃縮500題)
- (高清版)AQ 1038-2007 煤礦用架空乘人裝置安全檢驗(yàn)規(guī)范
- DL∕T 5210.6-2019 電力建設(shè)施工質(zhì)量驗(yàn)收規(guī)程 第6部分:調(diào)整試驗(yàn)
- 項(xiàng)賢明主編馬工程教材《教育學(xué)原理》第七章-課程
- 第1課 文明之光(課件)-2023-2024學(xué)年初中美術(shù)湘美版八年級(jí)下冊(cè)
- 2024年新改版青島版(六三制)三年級(jí)下冊(cè)科學(xué)全冊(cè)知識(shí)點(diǎn)復(fù)習(xí)資料
- 排列五歷史開獎(jiǎng)數(shù)據(jù)(2004年11月至2013年7月)
- (高清版)DZT 0282-2015 水文地質(zhì)調(diào)查規(guī)范(1:50000)
- 嬰幼兒二便,三浴等
- 項(xiàng)目利益相關(guān)者溝通計(jì)劃
- 建設(shè)項(xiàng)目安全設(shè)施“三同時(shí)”課件
評(píng)論
0/150
提交評(píng)論