版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
一、隨機(jī)抽樣與非隨機(jī)抽樣(一)隨機(jī)抽樣又稱概率抽樣隨機(jī)抽樣是按隨機(jī)原則從全部研究對象中抽取樣本進(jìn)行觀察,并根據(jù)樣本的實(shí)際數(shù)據(jù)對總體的數(shù)量特征作出具有一定可靠程度的估計和推算。
只抽取部分單位進(jìn)行調(diào)查。§1抽樣調(diào)查中常用的基本概念當(dāng)前1頁,總共43頁。隨機(jī)抽樣最基本的組織方式有:1.簡單隨機(jī)抽樣2.分層隨機(jī)抽樣3.整群抽樣4.系統(tǒng)抽樣(二)非隨機(jī)抽樣又稱非概率抽樣是從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗(yàn)、判斷或基于方便的原則,從總體中有意識地抽取樣本。當(dāng)前2頁,總共43頁。二、重復(fù)抽樣與不重復(fù)抽樣(一)重復(fù)抽樣:也叫放回抽樣。(二)不重復(fù)抽樣:也叫無放回抽樣。一個單位可能中選多次每次抽單位,概率固定,都為1/N。一個單位最多中選一次每次抽單位,概率不同,逐漸增加當(dāng)前3頁,總共43頁。三、總體分布樣本分布和抽樣分布(一)總體分布(指總體標(biāo)志值的分布)總體:也稱全及總體。指所要認(rèn)識的研究對象全體??傮w單位總數(shù)用“N”表示。
針對總體分布的指標(biāo)稱全及指標(biāo),也叫總體參數(shù)。
常用的參數(shù)有:總體平均數(shù)、總體成數(shù)P、總體標(biāo)準(zhǔn)差σ當(dāng)前4頁,總共43頁。未分組數(shù)據(jù):分組數(shù)據(jù):未分組數(shù)據(jù):分組數(shù)據(jù):總體方差公式總體標(biāo)準(zhǔn)差公式總體指標(biāo)的計算公式當(dāng)前5頁,總共43頁。樣本:也稱抽樣總體,是抽出的單位組成的整體。樣本單位總數(shù)用“n”表示。(二)樣本分布
針對樣本計算的指標(biāo)為抽樣指標(biāo),也叫統(tǒng)計量(估計量)。其值隨樣本的不同而不同,是個隨機(jī)變量。
抽樣估計就是通過統(tǒng)計量的值去估計參數(shù)的值。
常用的統(tǒng)計量有:樣本平均數(shù)、樣本成數(shù)p、樣本標(biāo)準(zhǔn)差S當(dāng)前6頁,總共43頁。樣本指標(biāo)的計算公式樣本均值當(dāng)前7頁,總共43頁。樣本方差和標(biāo)準(zhǔn)差的計算公式當(dāng)前8頁,總共43頁。
若總體單位的某種標(biāo)志只有兩種表現(xiàn)(稱為是非標(biāo)志),總體成數(shù)是指具有某種特征和屬性的單位在全部總體單位中所占比重,記為p。
以代表N個總體單位中具有某種特征的單位數(shù),代表N個總體單位中不具有某種特征的單位數(shù),N=N1+N0。則有成數(shù)屬性總體的全及指標(biāo)當(dāng)前9頁,總共43頁。
從總體中隨機(jī)抽出容量為的樣本,具有某種特征的單位數(shù)為,則樣本的成數(shù)為。例如,某工廠生產(chǎn)某種電子元件,某批產(chǎn)品共10000件,其中不合格品100件,則不合格品所占的成數(shù)。若從中按隨機(jī)的原則抽100件,其中有3件不合格品,則樣本的成數(shù)為。NEXT屬性總體的樣本指標(biāo)當(dāng)前10頁,總共43頁。推斷統(tǒng)計:利用樣本統(tǒng)計量對總體某些性質(zhì)或數(shù)量特征進(jìn)行推斷。隨機(jī)原則總體樣本總體參數(shù)統(tǒng)計量推斷估計參數(shù)估計檢驗(yàn)假設(shè)檢驗(yàn)抽樣分布抽樣估計和推斷的過程當(dāng)前11頁,總共43頁。(一)抽樣誤差抽樣誤差,是指抽樣調(diào)查中所產(chǎn)生的誤差,是調(diào)查得結(jié)果與總體真實(shí)值之間的差異。按誤差來源不同分登記性誤差和代表性誤差兩類。四、抽樣誤差當(dāng)前12頁,總共43頁。1.登記性誤差,指在調(diào)查和匯總過程中由于測量、登記、計算等方面的差錯或被調(diào)查者提供虛假資料而造成的誤差。它在任何調(diào)查中均存在。而且調(diào)查范圍越大,調(diào)查單位越多,產(chǎn)生登記性誤差的可能性也越大。2.代表性誤差,指樣本推斷總體時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致而產(chǎn)生的誤差。又分系統(tǒng)誤差與隨機(jī)誤差兩種。(一)抽樣誤差當(dāng)前13頁,總共43頁。(2)隨機(jī)誤差也叫偶然誤差。它是由偶然性因素引起的代表性誤差。它不可避免,但可計算與控制。抽樣估計中的抽樣誤差,就是指這種隨機(jī)誤差。
在計算抽樣誤差時,常常假設(shè)不存在登記性誤差和系統(tǒng)誤差。(1)系統(tǒng)誤差是非隨機(jī)因素引起的誤差,它系統(tǒng)性偏高或偏低,也稱偏差。(一)抽樣誤差當(dāng)前14頁,總共43頁。(二)抽樣平均誤差
1.抽樣誤差是指由于抽樣的隨機(jī)性而產(chǎn)生的那一部分代表性誤差(隨機(jī)性誤差),不包括登記性誤差,也不包括可能發(fā)生的偏差。主要有兩種:實(shí)際抽樣誤差,抽樣平均誤差。(1)實(shí)際抽樣誤差:指某一樣本指標(biāo)與總體參數(shù)之間的離差例8-2-1:從1、2、3中抽2個(重復(fù)),參數(shù)取總體平均數(shù)(等于2),則實(shí)際抽樣誤差如下:當(dāng)前15頁,總共43頁。例8-2-1樣本樣本統(tǒng)計量實(shí)際抽樣誤差(-)(1、1)1-1(1、2)1.5-0.5(1、3)20(2、1)1.5-0.5(2、2)20(2、3)2.50.5(3、1)20(3、2)2.50.5(3、3)31當(dāng)前16頁,總共43頁。
(2)抽樣平均誤差
是指所有可能的樣本指標(biāo)與總體指標(biāo)間的平均差異程度,即樣本統(tǒng)計量的標(biāo)準(zhǔn)差,也稱抽樣分布的標(biāo)準(zhǔn)差。在實(shí)際工作中,抽樣實(shí)際誤差是無法知道的,而抽樣平均誤差則可以計算。所以,我們在討論抽樣誤差時,通常指的是抽樣平均誤差。
計算抽樣平均誤差,得從抽樣分布談起(二)抽樣平均誤差當(dāng)前17頁,總共43頁。
抽樣分布:是指樣本指標(biāo)的概率分布,由樣本指標(biāo)的可能取值與之相應(yīng)的頻數(shù)或頻率組成。(二)抽樣平均誤差對于抽樣分布,可計算其均值和方差等來反映該分布的中心和離散趨勢。均值的抽樣平均誤差公式:成數(shù)的抽樣平均誤差公式:M表示所有可能的樣本個數(shù)。當(dāng)前18頁,總共43頁。影響抽樣平均誤差的因素
1.總體方差或標(biāo)準(zhǔn)差??傮w各單位在被研究變量上的差異程度差異越大,誤差越大。
2.樣本容量n的大小。抽取的單位數(shù)越多,誤差越小。
3.抽樣方法。重復(fù)抽樣的誤差大于不重復(fù)抽樣的誤差。
4.抽樣組織的方式。
當(dāng)一個總體給定后,總體各單位在被研究變量上的差異程度也隨之確定。所以在選定抽樣方式和方法后,要縮小抽樣平均誤差,必須保證足夠多的樣本容量n。當(dāng)前19頁,總共43頁。
又叫抽樣絕對誤差或最大允許誤差。(三)抽樣極限誤差均值的抽樣絕對誤差公式:成數(shù)的抽樣絕對誤差公式:當(dāng)前20頁,總共43頁。1.抽樣誤差系數(shù)是以抽樣極限誤差除以總體均值或成數(shù)來定義的,分別用
和rp表示。即(四)抽樣誤差系數(shù)和抽樣估計精度2.抽樣估計精度簡稱精度。分別用和表示抽樣平均數(shù)和成數(shù)的精度,則當(dāng)前21頁,總共43頁。
2.樣本平均數(shù)的平均數(shù)等于總體平均數(shù)。§2抽樣估計原理-大數(shù)定律及中心極限定理一、大數(shù)定律及中心極限定理的基本內(nèi)容
1.從正態(tài)總體中抽取的樣本,無論樣本容量n的大小,樣本平均數(shù)的分布一定是正態(tài)的。
3.樣本平均數(shù)的方差等于總體方差除以n。
4.如果總體分布未知或是非正態(tài)分布,隨著樣本容量n的增大(一般認(rèn)為n≥30就是大樣本了),樣本平均數(shù)的分布趨近于正態(tài)分布。當(dāng)前22頁,總共43頁。(二)總體均值的區(qū)間估計1.總體方差已知時,總體均值在1-α的置信度下的置信區(qū)間為:§3總體平均數(shù)和總體成數(shù)的估計一、總體均值的估計(一)總體均值的點(diǎn)估計式中,
點(diǎn)估計沒有給出估計值與未知總體參數(shù)的誤差范圍,也不能指出估計的把握程度。點(diǎn)估計的方法常用的有矩估計法、最大似然法等。當(dāng)前23頁,總共43頁。
t叫概率度。一個概率度對應(yīng)一個概率保證程度F(t),同時可通過查正態(tài)分布表得到對應(yīng)的t與F(t)。常用t值及其對應(yīng)概率99.73%395.45%268.27%95%11.96概率F(t)概率度(t)當(dāng)前24頁,總共43頁。當(dāng)n趨近于無窮大時,t分布趨近于正態(tài)分布,因此,在實(shí)際運(yùn)用中,當(dāng)n>30時,仍然用正態(tài)分布近似。2.總體方差未知時,總體均值的區(qū)間估計(二)總體均值的區(qū)間估計總體方差未知時,用樣本方差代替總體方差,總體均值在1-α的置信度下的置信區(qū)間為:當(dāng)前25頁,總共43頁。
例8-3-2:某農(nóng)場進(jìn)行小麥產(chǎn)量抽樣調(diào)查,小麥播種總面積為1萬畝,采用不重復(fù)簡單隨機(jī)抽樣,從中抽選了100畝作為樣本進(jìn)行實(shí)割實(shí)測,測得樣本平均畝產(chǎn)400斤,方差144斤。以95.45%的可靠性推斷小麥平均畝產(chǎn)的區(qū)間。解:N=10000n=100(1)計算抽樣平均誤差實(shí)例當(dāng)前26頁,總共43頁。(2)計算抽樣極限誤差(3)計算總體平均數(shù)的置信區(qū)間上限:下限:即:以95.45%的可靠性估計該農(nóng)場小麥平均畝產(chǎn)量在397.62斤至402.38斤之間.實(shí)例當(dāng)前27頁,總共43頁。
例8-3-4:對一批電子元件進(jìn)行耐用性能的檢查,隨機(jī)重置抽樣方法選取100件作耐用測試,所得結(jié)果的分組資料如下:100—合計
1855005000以上
5045004000—5000
30
35003000—4000
2
25003000以下件數(shù)(f)組中值(x)耐用時數(shù)(小時)
試以95.45%的把握程度估計這批產(chǎn)品的平均耐用時數(shù).實(shí)例當(dāng)前28頁,總共43頁。解:(1)計算樣本平均數(shù)和樣本標(biāo)準(zhǔn)差實(shí)例當(dāng)前29頁,總共43頁。(2)計算極限誤差(3)
估計區(qū)間的下限:4340-146.2=4193.8小時;估計區(qū)間的上限:4340+146.2=4486.2小時。所以,這批電子元件的平均耐用時數(shù)在4193.8小時至4486.2小時之間,可靠程度為95.45%。區(qū)間估計實(shí)例當(dāng)前30頁,總共43頁。1.重復(fù)抽樣下p208(一)總體成數(shù)與樣本成數(shù)二、總體成數(shù)的估計總體成數(shù):樣本成數(shù):總體成數(shù)的標(biāo)準(zhǔn)差:樣本成數(shù)的標(biāo)準(zhǔn)差:(二)樣本成數(shù)p的分布特征2.不重復(fù)抽樣下p208當(dāng)前31頁,總共43頁。1.重復(fù)抽樣下(三)總體成數(shù)的估計2.不重復(fù)抽樣下≤≤當(dāng)前32頁,總共43頁。
例8-3-3:某紗廠某時期內(nèi)生產(chǎn)了10萬個單位的紗,按純隨機(jī)抽樣方式抽取2000個單位檢驗(yàn),結(jié)果合格率為95%,試以95%的把握程度估計全部紗合格品率的區(qū)間。區(qū)間下限:區(qū)間上限:解:實(shí)例當(dāng)前33頁,總共43頁。
例8-3-1:設(shè)成人身高的達(dá)標(biāo)值為165厘米。從一批成年人中隨機(jī)抽7人,得身高分別為155、160、165、170、175、180、185(厘米)。要求:⑴以95.45%的概率保證度求平均身高的置信區(qū)間;⑵以99.73%的概率保證度求身高達(dá)標(biāo)率的置信區(qū)間。實(shí)例當(dāng)前34頁,總共43頁。
解:⑴=170F(t)=95.45%,則t=2所以,(厘米)(厘米)厘米實(shí)例置信區(qū)間:即平均身高95.45%的置信區(qū)間為(162.44,177.56)當(dāng)前35頁,總共43頁。⑵=17.07%所以,F(xiàn)(t)=99.73%,則t=3實(shí)例置信區(qū)間:即身高達(dá)標(biāo)率99.73%的置信區(qū)間為(20.22%,100%)當(dāng)前36頁,總共43頁。§4必要的樣本容量一、平均數(shù)的樣本容量(一)重復(fù)抽樣下的樣本容量(二)不重復(fù)抽樣下的樣本容量當(dāng)前37頁,總共43頁。不重復(fù)抽樣:n=二、成數(shù)的樣本容量重復(fù)抽樣下:n=當(dāng)前38頁,總共43頁。解:=625(戶)例8-3-6:根據(jù)歷史資料,某市職工家庭年收入的標(biāo)準(zhǔn)差為250元現(xiàn)再次調(diào)查收入狀況,要求在95.45%的把握度下平均年收入的允許誤差不超過20元,問應(yīng)抽多少戶家庭調(diào)查?實(shí)例當(dāng)前39頁,總共43頁。
例8-3-7:調(diào)查一批零件的合格率,根據(jù)過去的資料,合格率為97%。如果要求誤差不超過1%,把握程度為95%,問需抽多少個零件檢查?
解:=1118(件)實(shí)例當(dāng)前40頁,總共43頁。影響必要樣本容量的因素1.概率保證程度2.總體各單位在被研究標(biāo)志上的差異程度4.不同的抽樣方法5.不同的抽樣組織方式最后,要考慮調(diào)查的人力、物力、財力的許可情況3.允許誤差范圍當(dāng)前41頁,總共43頁。樣本容量和樣本個數(shù)的區(qū)別1.樣本容量:一個樣本包含的單位數(shù)。用“n”表示。一般要求n≥302.樣本個數(shù):從一個全及總體中可能抽取的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚丙烯成型加工課程設(shè)計
- 煙草專業(yè)知識課程設(shè)計
- 自駕貨車租賃合同范例
- 貨運(yùn)代理企業(yè)合同范例
- 電視報價合同范例
- 培訓(xùn)學(xué)校合伙人合作協(xié)議書3篇
- 合作貸款協(xié)議書版3篇
- 學(xué)校保潔員勞動協(xié)議書3篇
- 農(nóng)村宅基地協(xié)議書范本3篇
- 合同法延期交貨賠償3篇
- MOOC 國際金融-江西財經(jīng)大學(xué) 中國大學(xué)慕課答案
- 2023年考研政治真題(含答案及解析)
- 教育研究方法智慧樹知到期末考試答案2024年
- 教師職業(yè)道德與專業(yè)發(fā)展智慧樹知到期末考試答案2024年
- 會計學(xué)原理智慧樹知到期末考試答案2024年
- 幕墻工程專項(xiàng)施工方案審批流程
- 《血站業(yè)務(wù)場所建設(shè)指南 第3部分:獻(xiàn)血屋》
- 安寧護(hù)理個案
- (2024年)計算機(jī)安全培訓(xùn)
- 新視野英語教程(第四版)讀寫教程1 期末測試卷 測試卷A
- 城市地理學(xué)智慧樹知到期末考試答案2024年
評論
0/150
提交評論