統(tǒng)計學課件第七章抽樣推斷_第1頁
統(tǒng)計學課件第七章抽樣推斷_第2頁
統(tǒng)計學課件第七章抽樣推斷_第3頁
統(tǒng)計學課件第七章抽樣推斷_第4頁
統(tǒng)計學課件第七章抽樣推斷_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學概論內(nèi)容第一章統(tǒng)計總論第二章統(tǒng)計調(diào)查第三章統(tǒng)計數(shù)據(jù)的整理與顯示第四章統(tǒng)計指標第五章指數(shù)的因素分析第六章時間序列分析第七章抽樣推斷第八章相關(guān)與回歸分析第九章統(tǒng)計預測第十章統(tǒng)計的綜合評價第十一章統(tǒng)計分析報告統(tǒng)計學概論內(nèi)容第一章統(tǒng)計總論1第一節(jié)抽樣推斷概述第三節(jié)參數(shù)估計第二節(jié)隨機抽樣的概率分布第四節(jié)抽樣設(shè)計第七章抽樣推斷第一節(jié)抽樣推斷概述第三節(jié)參數(shù)估計第二節(jié)隨機抽樣的2第一節(jié)抽樣推斷概述

指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會按照隨機原則

從全部研究對象中抽取一部分單位進行調(diào)查,并以調(diào)查結(jié)果對總體數(shù)量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法。抽樣推斷第一節(jié)抽樣推斷概述指樣本單位的抽取不受主觀因素及其他3統(tǒng)計推斷全及總體指標:參數(shù)(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣推斷統(tǒng)計推斷全及總體指標:參數(shù)(未知量)樣本總體指標:統(tǒng)計量(已4隨機原則的實現(xiàn)抽簽法是將總體中每個單位的編號寫在外形完全一致的簽上,將其攪拌均勻,從中任意抽選,簽上的號碼所對應(yīng)的單位就是樣本單位。隨機數(shù)表法將總體中每個單位編上號碼,然后使用隨機數(shù)表,查出所要抽取的調(diào)查單位。計算機模擬法是將隨機數(shù)字編制為程序存儲在計算機中,需要時將總體中各單位編上號碼,啟用隨機數(shù)字發(fā)生器輸出隨機數(shù)字,然后從總體中找到相應(yīng)總體單位形成樣本。隨機原則的實現(xiàn)抽簽法是將總體中每個單位的編號寫在外形完全一致5并非所有的抽樣估計都按隨機原則抽取樣本,也有非隨機抽樣總體隨機樣本非隨機樣本與總體分布特征相同與總體分布特征不同并非所有的抽樣估計都按隨機原總體隨機樣本非隨機樣本與總體分布6按隨機原則抽取樣本單位以樣本的數(shù)量特征推斷總體的數(shù)量特征抽樣推斷產(chǎn)生抽樣誤差,但抽樣誤差可以事先計算并控制抽樣推斷的特點與全面調(diào)查相比,抽樣調(diào)查既節(jié)省了人力、物力、財力和時間,又達到了認識總體數(shù)量特征的目的。我國在1994年確立了以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)整為主體,同時輔之以重點調(diào)查、科學核算等綜合運用的統(tǒng)計調(diào)查方法體系。

按隨機原則抽取樣本單位抽樣推斷的特點與全面調(diào)查相比,7

不可能進行全面調(diào)查時

不必要進行全面調(diào)查時

來不及進行全面調(diào)查時對全面調(diào)查資料進行補充修正時抽樣推斷的應(yīng)用不可能進行全面調(diào)查時抽樣推斷的應(yīng)用8抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機觀象平均結(jié)果具有穩(wěn)定性的性質(zhì)。大數(shù)定律論證了如果獨立隨機變量總體存在有限的平均數(shù)和方差,則對于充分大的樣本可以近乎100%的概率,期望樣本平均數(shù)與總體平均數(shù)的絕對離差為任意小。

如果變量總體存在有限的平均數(shù)和方差,那么不論這個總體的分布如何,隨著樣本容量的增加,樣本平均數(shù)的分布,便趨近于正態(tài)分布。

抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機觀象平均結(jié)果9抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機觀象平均結(jié)果具有穩(wěn)定性的性質(zhì)。大數(shù)定律論證了如果獨立隨機變量總體存在有限的平均數(shù)和方差,則對于充分大的樣本可以近乎100%的概率,期望樣本平均數(shù)與總體平均數(shù)的絕對離差為任意小。

如果變量總體存在有限的平均數(shù)和方差,那么不論這個總體的分布如何,隨著樣本容量的增加,樣本平均數(shù)的分布,便趨近于正態(tài)分布。

抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機觀象平均結(jié)果10抽樣推斷的基本概念全及總體抽樣總體又稱總體或母體,是所要認識研究對象的全體,它由具有某種共同性質(zhì)或特征的單位所組成。常用N表示全及總體的單位數(shù)目。又稱樣本或子樣,是指從全及總體中按照隨機原則抽取的那部分個體的組合。抽樣總體的單位數(shù)稱為樣本容量,通常用n表示。1<n<N。抽樣推斷的基本概念全及總體抽樣總體又稱總體或母體,是所要認識11抽樣推斷的基本概念例如:在100萬戶居民中,隨機抽取1000戶居民進行家庭收支情況調(diào)查,其中的100萬戶居

民就是全及總體,而被抽中的1000戶居民則構(gòu)成抽樣總體。n≥30稱為大樣本,n

<30稱為小樣本.n/N稱為抽樣比.抽樣推斷的基本概念例如:在100萬戶居民中,隨機抽取100012設(shè)總體中個總體單位某項標志的標志值分別為,其中具有某種屬性的有

個單位,不具有某種屬性的有

個單位,則根據(jù)全及總體各個單位的標志值或標志特征所計算的反映總體某種屬性的綜合指標,又稱總體參數(shù)。全及指標設(shè)總體中個總體單位某項標志的標志值分別為13⒈總體平均數(shù)(又叫總體均值):全及指標⒉總體單位標志值的標準差:⒈總體平均數(shù)(又叫總體均值):全及指標⒉總體單位標志值的14⒊總體單位標志值的方差:⒋總體成數(shù):⒊總體單位標志值的方差:⒋總體成數(shù):15⒌總體是非標志的標準差:⒍總體是非標志的方差:⒌總體是非標志的標準差:⒍總體是非標志的方差:16設(shè)樣本中個樣本單位某項標志的標志值分別為,其中具有和不具有某種屬性的樣本單位數(shù)目分別為和個,則指根據(jù)抽樣總體各個單位的標志值或標志特征計算的綜合指標,又被稱為統(tǒng)計量,它是隨機變量。抽樣指標設(shè)樣本中個樣本單位某項標志的標志值指根據(jù)抽樣總體各個17⒈樣本平均數(shù)(又叫樣本均值):⒈樣本平均數(shù)(又叫樣本均值):18⒉樣本單位標志值的標準差:⒊樣本單位標志值的方差:為自由度為的無偏估計為的無偏估計⒉樣本單位標志值的標準差:⒊樣本單位標志值的方差:為自由19⒋樣本成數(shù):⒌樣本單位是非標志的標準差:⒍樣本單位是非標志的方差:為的無偏估計為的無偏估計⒋樣本成數(shù):⒌樣本單位是非標志的標準差:⒍樣本單位是非20抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結(jié)果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣總體單位數(shù)N不變,同一單位可能多次被抽中。根據(jù)取樣方式不同,可分為:抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為21抽樣方法的分類不重復抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數(shù)減少n,同一單位只可能被抽中一次。抽樣方法的分類不重復抽樣每次從總體中抽選一個單位后就不再將其22抽樣方法的分類根據(jù)對樣本的要求不同,可分為:考慮順序抽樣不考慮順序抽樣考慮各單位的中選順序。ABC≠CBA不考慮各單位的中選順序。ABC=CBA考慮順序的重復抽樣不考慮順序的不重復抽樣考慮順序的不重復抽樣不考慮順序的重復抽樣綜合起來共有四種抽樣方法抽樣方法的分類根據(jù)對樣本的要求不同,可分為:考慮順序抽樣不考23樣本的可能數(shù)目考慮順序的不重復抽樣不考慮順序的不重復抽樣考慮順序的重復抽樣不考慮順序的重復抽樣把填湖南風采35選7福利彩票號碼看作一次抽樣,則它屬于哪一種抽樣?中特等獎的概率是多少?(0—9選6呢?)不考慮順序的不重復抽樣樣本的可能數(shù)目考慮順序的不重復抽樣不考慮順序的不重復抽樣考慮24樣本的概率分布把某一抽樣方法的全部可能的樣本指標與其相應(yīng)的概率排列起來,就得到樣本的概率分布。若將樣本指標的取值分別記為其相應(yīng)的概率記為P1,P2,…Pn,將它們按順序排列起來,可得如下概率分布表。

…………樣本的概率分布把某一抽樣方法的全部可能的樣本指標與其相應(yīng)的概25第二節(jié)隨機抽樣的概率分布

樣本統(tǒng)計量總體未知參數(shù)樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量抽樣分布樣本統(tǒng)計量所有可能值的概率分布主要樣本統(tǒng)計量平均數(shù)比率(成數(shù))方差分布的形狀及接近總體參數(shù)的程度第二節(jié)隨機抽樣的概率分布樣本統(tǒng)計量總體未知參數(shù)樣本統(tǒng)26學生ABCDEFG成績30405060708090按隨機原則抽選出4名學生,并計算平均分數(shù)。平均數(shù)的抽樣分布樣本均值樣本均值樣本均值A(chǔ)BCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211二者均值相等學生ABCDEFG按隨機原則抽選出4名學生,并27樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445離差-15-12.5-10-7.5-5-2.50樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211離差2.557.51012.515學生ABCDEFG成績30405060708090離差-30-20-100102030樣本均值4547.55052.528平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:

從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:29比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:

從非正態(tài)總體中抽取的樣本比率,當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標準差為總體標準的。比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:30比率的抽樣分布教師是否博士A是B是C否D否E否F是具有博士學位的比率:P=0.5比率的標準差:=0.5從總體中按重復抽樣方法隨機抽?。慈?,計算其比率P和標準差比率的抽樣分布教師是否博士具有博士學位的比率:從總體31比率的抽樣分布樣本比率離差樣本比率離差ABCDABCEABCFABDEABDFABEFACDEACDF0.50.50.750.50.750.750.250.5000.2500.250.25-0.250ACEFADEFBCDEBCDFBCEFBDEFCDEF0.50.50.250.50.50.50.2500-0.25000-0.25比率的抽樣分布樣本比率離差樣本比率離差ABCD0.50A32全部可能樣本比率的均值等于總體比率,即:從非正態(tài)總體中抽取的樣本比率當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率不論容量大小其分布均為正態(tài)分布。樣本比率的標準差為總體標準差的。比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:33學生ABCD成績60708090均值=75方差2=125從中按重復抽樣方式抽?。踩?,計算樣本的均值及方差S2

。方差的抽樣分布A60B70C80D90A60606060006070652550608070100200609075225450B707060652550707070007080752550709080100200C808060701002008070752550808080008090852550D90906075225450907080100200908085255090909000學生ABCD從中按重復抽樣方式抽?。踩?,計算樣本的均34統(tǒng)計學課件第七章抽樣推斷35樣本抽樣分布原總體分布樣本抽樣分布原總體分布36抽樣誤差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高=169.8CM平均身高=174.6CM總平均身高=168.6CM抽樣誤差167CM169CM172CM160CM162CM137第三節(jié)參數(shù)估計

也叫抽樣估計,就是根據(jù)樣本指標數(shù)值對總體指標數(shù)值作出估計或推斷。

參數(shù)估計通常,把用來估計總體特征的樣本指標叫估計量或統(tǒng)計量,待估計的總體指標叫總體參數(shù)。特點1、它在邏輯上運用歸納推理而不是演繹推理。

2、在方法上運用不確定的概率估計方法,而不是運用確定的數(shù)學分析方法。3、抽樣估計存在抽樣誤差。第三節(jié)參數(shù)估計也叫抽樣估計,就是根據(jù)樣本指標數(shù)值38點估計從總體中抽取一個隨機樣本,計算與總體參數(shù)相應(yīng)的樣本統(tǒng)計量,然后把該統(tǒng)計量視為總體參數(shù)的估計值,稱為參數(shù)的點估計。簡單,具體明確優(yōu)點缺點無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況點估計從總體中抽取一個隨機樣本,計算與總體參數(shù)相應(yīng)的樣本統(tǒng)計39的抽樣分布點估計的最大好處:給出確定的值點估計的最大問題;無法控制誤差.的抽樣分布點估計的最大好處:給出確定的值點估計的最大40問題:第一,我們?yōu)槭裁匆赃@一個而不是那一個統(tǒng)計量來估計某個總體參數(shù)?估計值的優(yōu)良標準第二,如果有兩個以上的統(tǒng)計量可以用來估計某個總體參數(shù),其估計結(jié)果是否一致?是否一個統(tǒng)計量要優(yōu)于另一個?估計值的優(yōu)良標準:無偏性、有效性、一致性問題:估計值的優(yōu)良標準第二,如果有兩個以上的統(tǒng)計量可以用41抽樣估計量的優(yōu)良標準設(shè)為待估計的總體參數(shù),為樣本統(tǒng)計量,則的優(yōu)良標準為:若,則稱為的無偏估計量指樣本指標的均值應(yīng)等于被估計的總體指標無偏性抽樣估計量的優(yōu)良標準設(shè)為待估計的總體參數(shù),為樣本統(tǒng)計量42若,則稱為比更有效的估計量若越大越小,則稱為的一致估計量作為優(yōu)良的估計量,除了滿足無偏性的要求外,其方差應(yīng)比較小有效性指隨著樣本單位數(shù)的增大,樣本估計量將在概率意義下越來越接近于總體真實值一致性抽樣估計量的優(yōu)良標準若,則稱為比更有效的估計量若越大43學生ABCDEFG成績30405060708090有效性按隨機原則抽選出4名學生,并計算平均分數(shù)和中位分數(shù)。樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211樣本中位數(shù)45505560657075出現(xiàn)次數(shù)4385834學生ABCDEFG有效性按隨機原則抽選出444有效性中位數(shù)的抽樣分布平均數(shù)的抽樣分布有效性中位數(shù)的抽樣分布平均數(shù)的抽樣分布45無偏性有偏無偏無偏性有偏無偏46一致性學生ABCDEFG成績30405060708090按隨機原則抽選出5名學生,并計算平均分數(shù)。樣本均值樣本均值A(chǔ)BCDEABCDFABCDGABCEFABCEGABCFGABDEFABDEGABDFGABEFGACDEF5052545456585658606258ACDEGACDFGACEFGADEFGBCDEFBCDEGBCDFGBCEFGBDEFGCDEFG60626466606264666870樣本均值505254565860出現(xiàn)次數(shù)112233樣本均值6264666870出現(xiàn)次數(shù)32211n=4時的抽樣分布n=5時的抽樣分布一致性學生ABCDEFG按隨機原則抽選出5名學47為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。數(shù)理統(tǒng)計證明:抽樣估計量的優(yōu)良標準為的無偏、有效、一致估計量;數(shù)理統(tǒng)計證明:抽48區(qū)間估計給出一個區(qū)間(置信區(qū)間)并推斷真正的參數(shù)以一定的概率存在于這個區(qū)間的方法。抽樣平均誤差指每一個可能樣本的指標值與總體指標值之間平均離差,即一系列樣本指標的標準差式中:為樣本平均數(shù)的抽樣平均誤差;為可能的樣本數(shù)目;為第個可能樣本的平均數(shù);為總體平均數(shù)注意:不要混淆抽樣標準差與樣本標準差!區(qū)間估計給出一個區(qū)間(置信區(qū)間)并推斷真正的參數(shù)以一定的概率49抽樣平均誤差的計算⒈樣本平均數(shù)的抽樣平均誤差當N≥500時,有重復抽樣時:不重復抽樣時:抽樣平均誤差的計算⒈樣本平均數(shù)的抽樣平均誤差當N≥500時50⒉樣本成數(shù)的抽樣平均誤差重復抽樣時:不重復抽樣時:當N≥500時,有抽樣平均誤差的計算公式⒉樣本成數(shù)的抽樣平均誤差重復抽樣時:不重復抽樣時:當N≥551關(guān)于總體方差的估計方法用過去同類問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗數(shù)據(jù)代替;用樣本標準差代替總體標準差,用代替。抽樣平均誤差的計算公式關(guān)于總體方差的估計方法用過去同類問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗52影響抽樣誤差的因素總體各單位標志值的差異程度(即標準差的大小):越大,抽樣誤差越大;樣本單位數(shù)的多少:越大,抽樣誤差越小;抽樣方法:不重復抽樣的抽樣誤差比重復抽樣的抽樣誤差小;抽樣組織方式:簡單隨機抽樣的誤差最大。影響抽樣誤差的因素總體各單位標志值的差異程度(即標準差的大小53抽樣極限誤差指在一定的概率保證程度下,抽樣指標與總體指標之間抽樣誤差的最能范圍,也稱作抽樣允許誤差。常用大可△表示。上式表明:樣本平均數(shù)(成數(shù))是以總體平均數(shù)(成數(shù))為中心,,在相應(yīng)的區(qū)間內(nèi)變動。抽樣極限誤差指在一定的概率保證程度下,抽樣指標與總體指標之間54由于總體成數(shù)和總體平均數(shù)是未知的,它要求靠實測的抽樣平均數(shù)和抽樣成數(shù)來估計,因而抽樣誤差的實際意義是希望總體平均數(shù)(成數(shù))落在某個已知的范圍內(nèi)。抽樣極限誤差所以前面的不等式應(yīng)變換為:在一個特定的全及總體中,當抽樣方法和樣本容量固定時,抽樣平均誤差是一個定值,因此,抽樣極限誤差通常以抽樣平均誤差為標準單位來衡量。即抽樣極限誤差通常表示為抽樣平均誤差的多少倍。

由于t值與樣本估計值落入允許誤差范圍內(nèi)的概率有關(guān),因此,t

也稱為概率度。由于總體成數(shù)和總體平均數(shù)是未知的,它要求靠實測的抽樣平均數(shù)和55抽樣估計的置信度抽樣指標和總體指標的誤差不超過一定范圍的概率大小,我們將它稱之為概率保證程度,也叫抽樣估計的置信度,一般用F(t)表示。即:置信度t值與相應(yīng)的概率保證程度存在一一對應(yīng)關(guān),常用t值及相應(yīng)的概率保證程度為:t值概率保證程度1.000.68271.960.95002.000.95453.000.9973在大樣本下抽樣估計的置信度抽樣指標和總體指標的誤差不超過一定范圍的概率5668.27%95.45%99.73%抽樣極限誤差68.27%95.45%99.73%抽樣極限誤差57以樣本統(tǒng)計量為中心,以抽樣平均誤差為距離單位,可以構(gòu)造一個區(qū)間,并可以一定的概率保證待估計的總體參數(shù)落在這個區(qū)間之中。區(qū)間越大,則概率保證程度越高。區(qū)間估計原理以樣本統(tǒng)計量為中心,以抽樣平均誤差為距離單位,可以構(gòu)造一58區(qū)間估計原理0.6827落在范圍內(nèi)的概率為68.27%樣本抽樣分布曲線原總體分布曲線區(qū)間估計原理0.6827落在范圍內(nèi)的概率為68.2759區(qū)間估計原理0.9545落在范圍內(nèi)的概率為95.45%樣本抽樣分布曲線原總體分布曲線區(qū)間估計原理0.9545落在范圍內(nèi)的概率為95.4560區(qū)間估計原理0.9973落在范圍內(nèi)的概率為99.73%樣本抽樣分布曲線總體分布曲線區(qū)間估計原理0.9973落在范圍內(nèi)的概率為61總體平均數(shù)的區(qū)間估計表達式其中,為極限誤差總體平均數(shù)的區(qū)間估計表其中,為極限62步驟⒈計算樣本平均數(shù);⒉搜集總體方差的經(jīng)驗數(shù)據(jù);或計算樣本標準差,即總體平均數(shù)的區(qū)間估計步驟⒈計算樣本平均數(shù);⒉搜集總體方差的經(jīng)63⒊計算抽樣平均誤差:重復抽樣時:

不重復抽樣時:總體平均數(shù)的區(qū)間估計⒊計算抽樣平均誤差:重復抽樣時:不重復抽樣時:總體平均數(shù)64⒋計算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均數(shù)的區(qū)間估計⒋計算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均65【例A】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調(diào)查他們的當日產(chǎn)量,要求在95﹪的概率保證程度下,估計該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量??傮w平均數(shù)的區(qū)間估計【例A】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復66按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計—100126004144100名工人的日產(chǎn)量分組資料按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114167解:解:68則該企業(yè)工人人均產(chǎn)量及日總產(chǎn)量的置信區(qū)間為:即該企業(yè)工人人均產(chǎn)量在124.797至127.203件之間,其日總產(chǎn)量在124797至127303件之間,估計的可靠程度為95﹪則該企業(yè)工人人均產(chǎn)量及日總產(chǎn)量的69總體成數(shù)的區(qū)間估計表達式其中,為極限誤差總體成數(shù)的區(qū)間估計表其中,為極限70步驟⒈計算樣本成數(shù);⒉搜集總體方差的經(jīng)驗數(shù)據(jù);⒊計算抽樣平均誤差:重復抽樣條件下不重復抽樣條件下總體成數(shù)的區(qū)間估計步⒈計算樣本成數(shù);⒉搜集總體方差的經(jīng)驗數(shù)71⒋計算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的區(qū)間估計⒋計算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的72【例B】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95﹪的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)。總體成數(shù)的區(qū)間估計【例B】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù)73按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100100名工人的日產(chǎn)量分組資料完成定額的人數(shù)按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114174解:解:75則該企業(yè)全部工人中完成定額的工人比重及完成定額的工人總數(shù)的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計的可靠程度為95﹪。則該企業(yè)全部工人中完成定額的工人比重及完成定額的工76樣本容量的確定影響樣本容量的因素總體各單位標志值的差異程度(即標準差的大小):越大,所需樣本容量越多允許的極限誤差△的大?。骸髟酱?,所需樣本容量越小;推斷的可靠程度,即置信度:對可靠程度要求越高,所需樣本容量越大;抽樣方法和抽樣組織方式:重復抽樣比不重復抽樣所需樣本容量要多;類型抽樣比簡單隨機抽樣所需樣本容量多。樣本容量的確定影響樣本容量的因素總體各單位標志值的差異程度(77樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本容量調(diào)查精度高但費用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量確定樣本容量的意義找出在限定費用范圍內(nèi)的最大樣本容量樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本78確定方法推斷總體平均數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的S。計算結(jié)果通常向上進位確推斷總體平均數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法79⑵不重復抽樣條件下:推斷總體平均數(shù)所需的樣本容量⑵不重復抽樣條件下:推斷總體平均數(shù)所需的樣本容量80【例A】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標準差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?【例A】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根81解:在不重復抽樣下:解:在不重復抽樣下:82確定方法推斷總體成數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計算結(jié)果通常向上進位通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的;③取方差的最大值0.25。確推斷總體成數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是83⑵不重復抽樣條件下:確定方法推斷總體成數(shù)所需的樣本容量⑵不重復抽樣條件下:確推斷總體成數(shù)所需的樣本容量84【例B】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應(yīng)抽查多少件產(chǎn)品?【分析】因為共有三個過去的合格率的資料,為保證推斷的把握程度,應(yīng)選其中方差最大者,即P=93﹪?!纠鼴】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進行質(zhì)量檢查,過去85解:解:86必要樣本容量的影響因素總體方差的大??;允許誤差范圍的大??;概率保證程度;抽樣方法;抽樣的組織方式。重復抽樣條件下:不重復抽樣條件下:必要樣本容量的影響因素總體方差的大??;重復抽樣條件下:不重復87第四節(jié)抽樣設(shè)計

抽樣方案設(shè)計的基本原則隨機原則——抽取樣本單位時,應(yīng)確保每個總體單位都有被抽取的可能;在對樣本單位的資料進行搜集和整理時,不能隨意遺漏或更換樣本單位最大抽樣效果原則抽樣誤差最小——在其他條件相同的情況下,選抽樣誤差最小的方案費用最少——在其他條件相同的情況下,選費用最少的方案設(shè)計抽樣方案時,通常是在誤差達到一定要求的條件下,選擇費用最少的方案第四節(jié)抽樣設(shè)計抽樣方案設(shè)計的基本原則隨機原則——抽取88簡單隨機抽樣對總體未作任何處理的情況下,然后按隨機原則直接從總體中抽出若干單位構(gòu)成樣本抽樣平均誤差的計算公式見書:P243抽取樣本的具體方法:抽簽法是將總體中每個單位的編號寫在外形完全一致的簽上,將其攪拌均勻,從中任意抽選,簽上的號碼所對應(yīng)的單位就是樣本單位。隨機數(shù)表法將總體中每個單位編上號碼,然后使用隨機數(shù)表,查出所要抽取的調(diào)查單位。簡單隨機抽樣對總體未作任何處理的情況下,然后按隨機原則直接從89應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標志值差異較小的總體簡單隨機抽樣的特點1、直接從總體中抽取所要調(diào)查的單位,無須分組、分類、排隊等處理;2、必須事先對總體中的所有單位進行編碼和編號;3、抽取樣本時不借助有關(guān)標志的輔助信息4、當總體各單位村志值之間差異很大時,采用此方法不能保證樣本的代表性。應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標志值差異較小的總體簡單隨機90先將總體全部單位按某一標志分類,然后從各類型中按隨機原則抽取樣本單位組成樣本??傮wN樣本n等額抽取等比例抽取最優(yōu)抽取······類型抽樣實質(zhì)上是分組法與隨機原則的結(jié)合。例如,在居民生活水平調(diào)查中,先按職業(yè)分類,然后每種職業(yè)分別隨機抽取部分居民進行調(diào)查。先將總體全部單位按某一標志分類,然后從各類型中按隨機原則抽取91類型抽樣的優(yōu)點:能提高樣本的代表性;能降低影響抽樣平均誤差的總方差;組織起來較為方便;類型抽樣分組的基本原則:盡量縮小各組內(nèi)標志值之間的差異,增大組間各標志值之間的差異。類型抽樣的優(yōu)點:能提高樣本的代表性;類型抽樣分組的基本原則:92樣本在各組間的分配方法:等額分配法:每組抽取的單位數(shù)一樣。等比例分配法:按各組單位的比例分配樣本單位。最佳分配法:按各組的方差大小分配樣本單位。方差大的組分配較多的樣本單位。經(jīng)濟分配法:按各組的方差大小分配樣本單位,同時考慮各組抽樣調(diào)查的費用。實際工作中比較常用的是等比例分配法。樣本在各組間的分配方法:等額分配法:每組抽取的單位數(shù)一樣。等93類型抽樣的抽樣平均誤差一、抽樣平均數(shù)二、抽樣成數(shù)類型抽樣的抽樣平均誤差一、抽樣平均數(shù)二、抽樣成數(shù)94【例】某市有250家商店,分大中小三類,現(xiàn)從中等比例抽出50家進行銷售額調(diào)查,所得資料如下分層各層商店數(shù)Ni層權(quán)Wi各層抽取數(shù)ni各層銷售額樣本均值(萬元)樣本方差(萬元)大型商店中型商店小型商店25751500.10.30.65153017008001202800698510850合計2501.050____以95.45%的概率保證程度估計該市所有商店的平均銷售額?!纠磕呈杏?50家商店,分大中小三類,現(xiàn)從中等比例抽出5095根據(jù)題意知:N=250,W1=0.1,W2=0.3,W3=0.6,f1=f2=f3=0.2,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論