統(tǒng)計(jì)學(xué)課件第5-7章概率分布、抽樣分布及參數(shù)估計(jì)_第1頁
統(tǒng)計(jì)學(xué)課件第5-7章概率分布、抽樣分布及參數(shù)估計(jì)_第2頁
統(tǒng)計(jì)學(xué)課件第5-7章概率分布、抽樣分布及參數(shù)估計(jì)_第3頁
統(tǒng)計(jì)學(xué)課件第5-7章概率分布、抽樣分布及參數(shù)估計(jì)_第4頁
統(tǒng)計(jì)學(xué)課件第5-7章概率分布、抽樣分布及參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Monday,February6,2023StatisticalResearchOffice1第5、6、7章概率分布、抽樣分布及參數(shù)估計(jì)ProbabilityDistributions&SamplingDistributions&ParameterEstimationMonday,February6,2023StatisticalResearchOffice2本部分主要研究的問題有:●隨機(jī)變量的概率分布●常用的隨機(jī)抽樣組織方式●樣本均值的抽樣分布及總體均值的估計(jì)●樣本比率的抽樣分布及總體比率的估計(jì)Monday,February6,2023StatisticalResearchOffice3▲常見隨機(jī)變量的分布●

0-1分布模型概率分布率(概率函數(shù))數(shù)學(xué)期望方差●

二項(xiàng)分布模型概率函數(shù)Monday,February6,2023StatisticalResearchOffice4

期望方差●

幾何分布模型概率函數(shù)期望方差Monday,February6,2023StatisticalResearchOffice5●

超幾何分布-模型-概率函數(shù)

期望-方差●

泊松分布模型概率函數(shù)期望與方差Monday,February6,2023StatisticalResearchOffice6●

均勻分布模型概率函數(shù)數(shù)學(xué)期望與方差●

指數(shù)分布●正態(tài)分布●

-分布●

t-分布●

F分布Monday,February6,2023StatisticalResearchOffice7●

利用EXCEL進(jìn)行相關(guān)概率計(jì)算(略)Monday,February6,2023StatisticalResearchOffice8●

常用的隨機(jī)抽樣組織方式?簡(jiǎn)單隨機(jī)抽樣(Simplerandomsampling)?分層隨機(jī)抽樣(Stratifiedsampling)?系統(tǒng)隨機(jī)抽樣(Systematicsampling)?整群隨機(jī)抽樣(Clustersampling)

常用的隨機(jī)抽樣方法:?重復(fù)抽樣(Samplingwithreplacement)?不重復(fù)抽樣(Samplingwithoutreplacement)Monday,February6,2023StatisticalResearchOffice9★簡(jiǎn)單隨機(jī)抽樣定義:從總體中,按照隨機(jī)的原則,使得總體中每個(gè)個(gè)體都有同等被選中的機(jī)會(huì),而先后抽出的n個(gè)個(gè)體作為一個(gè)容量為n的樣本。特點(diǎn):●遵循隨機(jī)性原則;●總體中每個(gè)個(gè)體被選中的概率相同;●對(duì)總體不作任何劃分;●總體本身就是一個(gè)確定的抽樣框。-抽樣方法:重復(fù)抽樣、不重復(fù)抽樣Monday,February6,2023StatisticalResearchOffice10★系統(tǒng)隨機(jī)抽樣

定義:先將總體單位按某種變量排隊(duì)(可以按無關(guān)變量,也可以按有關(guān)變量),然后根據(jù)總體單位數(shù)N及樣本容量n的大小,將總體單位劃分為n組(段);最后,在第一組的單位中,按照隨機(jī)性原則選出第一個(gè)單位作為樣本中的一個(gè)個(gè)體,以后每隔相同的間隔保證在每一組中抽取一個(gè)個(gè)體,則由這n組中所抽取的共n個(gè)個(gè)體構(gòu)成一個(gè)樣本。Monday,February6,2023StatisticalResearchOffice11

特點(diǎn):●遵循隨機(jī)性原則---隨機(jī)性主要體現(xiàn)在第一個(gè)樣本點(diǎn)的選取;●需要一個(gè)抽樣框;●對(duì)抽樣框中的個(gè)體要排隊(duì)---若按無關(guān)變量排隊(duì),則等同于簡(jiǎn)單隨機(jī)抽樣;若按有關(guān)變量排隊(duì),則在其他條件相同的情況下,抽樣誤差要小于簡(jiǎn)單隨機(jī)抽樣?!衽抨?duì)后個(gè)體的相關(guān)特性不能有規(guī)律地或周期地出現(xiàn)。●簡(jiǎn)單易行---特別是當(dāng)總體中的個(gè)體總數(shù)相當(dāng)多時(shí)。Monday,February6,2023StatisticalResearchOffice12★分層隨機(jī)抽樣定義:將總體首先劃分為若干層(類、組),然后在每一層(類、組)內(nèi)按一定的方法抽取個(gè)體(按簡(jiǎn)單隨機(jī)抽樣或按系統(tǒng)隨機(jī)抽樣),則由每一層所抽個(gè)體構(gòu)成一個(gè)樣本。特點(diǎn):●遵循隨機(jī)性原則---體現(xiàn)在在每一層抽選中;●每一層內(nèi)應(yīng)包含足夠多的個(gè)體;●在同等條件下,抽樣誤差要小于簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣的抽樣誤差。Monday,February6,2023StatisticalResearchOffice13●要求層內(nèi)個(gè)體差異較小,而層與層之間差別較大?!镎弘S機(jī)抽樣定義:首先將總體劃分為若干群(類、組),然后根據(jù)樣本容量大小及各群所含個(gè)體數(shù)的多少,從所有群中按照隨機(jī)性原則而抽取一定數(shù)量的群作為樣本群,則由所抽樣本群中的所有個(gè)體構(gòu)成一個(gè)樣本。Monday,February6,2023StatisticalResearchOffice14-特點(diǎn):●簡(jiǎn)單易行、調(diào)查成本相對(duì)較低;●劃分的群數(shù)應(yīng)足夠多;●各群內(nèi)個(gè)體差異較大,而群與群之間差別較小。●在其他條件相同的情況下,抽樣誤差要大于分層隨機(jī)抽樣的抽樣誤差。要求:能簡(jiǎn)述各隨機(jī)抽樣組織方式的實(shí)施,及其各種方式主要實(shí)施的條件。Monday,February6,2023StatisticalResearchOffice15★

樣本均值的抽樣分布(SamplingDistributionofSampleMean)●

統(tǒng)計(jì)量:它是樣本的函數(shù),且該函數(shù)中不含未知參數(shù)。

-樣本均值(SampleMean)-樣本比率(SampleProportion)-樣本方差(SampleVariance)Monday,February6,2023StatisticalResearchOffice16★

列維–林德伯格中心極限定理可見,若一個(gè)總體的期望與方差存在,只要樣本容量足夠地大,則從總體中抽選出的簡(jiǎn)單隨機(jī)樣本的樣本均值將近似于正態(tài)分布。特別注意:本定理不要求隨機(jī)變量服從正態(tài)分布?。。onday,February6,2023StatisticalResearchOffice17★

抽樣分布:統(tǒng)計(jì)量的統(tǒng)計(jì)分布稱作抽樣分布。求統(tǒng)計(jì)量的抽樣分布,就是用已知隨機(jī)變量的分布表示統(tǒng)計(jì)量的分布?!?/p>

樣本均值的分布●

來自非正態(tài)總體的樣本均值的分布由列維–林德伯格中心極限定理知:當(dāng)樣本容量n足夠大時(shí),(通常必須是大樣本)Monday,February6,2023StatisticalResearchOffice18從而,標(biāo)準(zhǔn)化之給定α(0<α<1)則,解不等式,得即總體均值位于上述區(qū)間內(nèi)的概率是1-α.Monday,February6,2023StatisticalResearchOffice19注當(dāng)總體標(biāo)準(zhǔn)差δ已知時(shí),則可利用上述不等式求出總體均值μ的概率為1-α的取值范圍。所求區(qū)間稱作置信區(qū)間,1-α稱作置信水平。

1-α0.800.900.950.95450.980.991.271.641.962.002.332.58

當(dāng)給定1-α數(shù)值時(shí),對(duì)應(yīng)的臨界值為Monday,February6,2023StatisticalResearchOffice20當(dāng)總體標(biāo)準(zhǔn)差δ未知但采用大樣本時(shí),可以用樣本標(biāo)準(zhǔn)差s代替總體標(biāo)準(zhǔn)差δ,此時(shí),總體均值μ的概率為1-α的取值范圍為:當(dāng)采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣時(shí),抽樣標(biāo)準(zhǔn)誤差為:Monday,February6,2023StatisticalResearchOffice21其中,Monday,February6,2023StatisticalResearchOffice22●

來自正態(tài)總體的樣本均值的分布則,不管樣本容量的大小,都有:標(biāo)準(zhǔn)化之,給定α(0<α<1)有,Monday,February6,2023StatisticalResearchOffice23所以,總體均值1-α的置信區(qū)間為:其中,δ為已知。●

若δ為未知,以替代δ,因?yàn)镸onday,February6,2023StatisticalResearchOffice24給定α(0<α<1)有,解上述不等式,得即Monday,February6,2023StatisticalResearchOffice25關(guān)于t-分布的說明:且隨機(jī)變量X與Y相互獨(dú)立,則又且它們相互獨(dú)立,Monday,February6,2023StatisticalResearchOffice26所以化簡(jiǎn)得,注意:若是大樣本,樣本標(biāo)準(zhǔn)差S與修正的樣本標(biāo)準(zhǔn)差差別較小,可以用S替代若是小樣本,則不可以替代。Monday,February6,2023StatisticalResearchOffice27●來自非正態(tài)分布總體的樣本比率的分布由列維–林德伯格中心極限定理Monday,February6,2023StatisticalResearchOffice28標(biāo)準(zhǔn)化之,得給定α(0<α<1)有,所以,總體比率1-α的置信區(qū)間為:Monday,February6,2023StatisticalResearchOffice29通??傮w比率都是未知的,因此,用其樣本比率p替代π,所以有若采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣,則Monday,February6,2023StatisticalResearchOffice30★來自兩個(gè)總體的統(tǒng)計(jì)量的分布●來自兩個(gè)正態(tài)總體的樣本的分布則,且它們相互獨(dú)立Monday,February6,2023StatisticalResearchOffice31因此,有標(biāo)準(zhǔn)化之,給定α(0<α<1)由,解上述不等式,得Monday,February6,2023StatisticalResearchOffice32若兩正態(tài)總體方差已知,上述就是兩總體均值之差的1-α的置信區(qū)間。若兩正態(tài)總體的方差未知,但是,兩個(gè)樣本均為大樣本,則未知的總體方差可以直接用樣本方差替代即Monday,February6,2023StatisticalResearchOffice33若兩非正態(tài)總體,且方差均未知,但是,兩個(gè)樣本均為大樣本,則由列維-林德伯格中心極限定理,可知,來自兩個(gè)獨(dú)立非正態(tài)總體的兩個(gè)大樣本,其樣本均值均近似服從正態(tài)分布。因此,有標(biāo)準(zhǔn)化之,Monday,February6,2023StatisticalResearchOffice34同理可以求得,兩非正態(tài)總體均值之差的1-α的置信區(qū)間為:通常總體方差都是未知的,用相應(yīng)樣本方差替代之。Monday,February6,2023StatisticalResearchOffice35★求參數(shù)的置信區(qū)間應(yīng)考慮的因素-抽樣組織方式的影響-抽樣方法的影響-大樣本與小樣本的影響-從正態(tài)總體還是非正態(tài)總體選取樣本的影響若是兩個(gè)總體,還受到它們是否獨(dú)立的影響注:(1)若是正態(tài)總體,則不應(yīng)采用大樣本;若是非正態(tài)總體,則必須采用大樣本。(2)總體在本部分指變量總體Monday,February6,2023StatisticalResearchOffice36★總體均值、總體比率區(qū)間估計(jì)小結(jié)

◎一個(gè)總體均值的置信區(qū)間Monday,February6,2023StatisticalResearchOffice37◎一個(gè)總體比率的置信區(qū)間Monday,February6,2023StatisticalResearchOffice38◎兩個(gè)獨(dú)立總體均值之差的置信區(qū)間Monday,February6,2023StatisticalResearchOffice39◎兩個(gè)獨(dú)立總體比率之差的置信區(qū)間Monday,February6,2023StatisticalResearchOffice40◎兩個(gè)配對(duì)總體均值之差的置信區(qū)間Monday,February6,2023StatisticalResearchOffice41★樣本容量的確定●簡(jiǎn)單隨機(jī)重復(fù)抽樣條件下,樣本容量的確定

請(qǐng)思考(1)如何估計(jì)?(2)若樣本容量的選取對(duì)所求區(qū)間有何影響?Monday,February6,2023StatisticalResearchOffice42●在簡(jiǎn)單隨機(jī)不重復(fù)抽樣條件下,樣本容量的確定請(qǐng)問:在對(duì)總體的比率進(jìn)行估計(jì)時(shí),樣本容量又如何確定呢?Monday,February6,2023StatisticalResearchOffice43★

影響樣本容量大小的因素---抽樣方法---估計(jì)的置信水平---估計(jì)的允許誤差---總體內(nèi)部的差異程度---抽樣組織方式---調(diào)查成本(費(fèi)用、時(shí)間)Monday,February6,2023StatisticalResearchOffice44●某食品制造企業(yè)對(duì)在某一時(shí)期生產(chǎn)的產(chǎn)品進(jìn)行檢驗(yàn).按質(zhì)量規(guī)定,該批食品的重量不得低于200克,不合格率不得超過3%.該企業(yè)質(zhì)檢部門采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣的方式從中抽出200袋進(jìn)行實(shí)測(cè)檢驗(yàn)。相關(guān)數(shù)據(jù)如下:食品重量(克)頻數(shù)(袋)頻率(%)190-200200-210210-220220-230230-240240-2501026566430145132832157合計(jì)200100某食品抽樣調(diào)查數(shù)據(jù)分組Monday,February6,2023StatisticalResearchOffice45(1)試求該樣本的均值、標(biāo)準(zhǔn)差;(2)試求這批食品均值95%的置信區(qū)間;(3)試求這批食品不合格率的99%的置信區(qū)間;(4)若準(zhǔn)備采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣的方法,從該批食品中抽選出部分食品進(jìn)行調(diào)查,要求對(duì)總體均值估計(jì)的最大誤差不能超過5克,對(duì)總體合格率估計(jì)的最大誤差不能超過2%,問此次調(diào)查應(yīng)采用的樣本容量為多少(假定不考慮調(diào)查費(fèi)用)?(5)在顯著性水平為0.05下,請(qǐng)問這批產(chǎn)品是否合格?Monday,February6,2023StatisticalResearchOffice46★分層(類型)隨機(jī)抽樣---分層隨機(jī)抽樣的概念(如何組織實(shí)施)---采用分層隨機(jī)抽樣時(shí),抽樣標(biāo)準(zhǔn)誤差的估計(jì)設(shè)樣本容量采用等比例抽樣則有Monday,February6,2023StatisticalResearchOffice47設(shè)第i層的樣本均值、樣本方差分別為則全部樣本的均值為則全部樣本的方差為Monday,February6,2023StatisticalResearchOffice48所以,在重復(fù)抽樣條件下,抽樣標(biāo)準(zhǔn)誤差為在不重復(fù)抽樣條件下,抽樣標(biāo)準(zhǔn)誤差為Monday,February6,2023StatisticalResearchOffice49因此,所求總體均值的置信區(qū)間為(重復(fù)抽樣)(不重復(fù)抽樣)Monday,February6,2023StatisticalResearchOffice50同理,對(duì)于總體比率的估計(jì)設(shè)第i層樣本的比率為則,全部樣本比率方差為則,全部樣本的比率為Monday,February6,2023StatisticalResearchOffice51因此,所求總體比率的的置信區(qū)間為(不重復(fù)抽樣)(重復(fù)抽樣)Monday,February6,2023StatisticalResearchOffice52●某市城調(diào)隊(duì)想了解該市居民家庭擁有冰箱情況。該市共有90萬戶,準(zhǔn)備選取500戶作為樣本進(jìn)行調(diào)查。因事先該城調(diào)隊(duì)已從其他途徑了解到冰箱在該市市區(qū)、近郊和遠(yuǎn)郊居民家庭中有較大差異,因此,采用等比例分層隨機(jī)抽樣。調(diào)查結(jié)果發(fā)現(xiàn),在作為樣本的500個(gè)家庭中,位于市區(qū)、近郊和遠(yuǎn)郊居民家庭擁有冰箱的比率分別為90%、50%和10%。其中位于市區(qū)、近郊和遠(yuǎn)郊居的居民家庭數(shù)分別為45萬戶、27萬戶和18萬戶。Monday,February6,2023StatisticalResearchOffice53要求:1.求出每層的樣本容量;2.求出全部樣本家庭中擁有冰箱的比率;3.若采用重復(fù)(或不重復(fù))抽樣,求出平均抽樣誤差和抽樣極限誤差;4.求出該市家庭擁有冰箱的95%的置信區(qū)間;5.要達(dá)到與此次分層隨機(jī)抽樣相同的調(diào)查精度,若采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣,應(yīng)選取多少家庭調(diào)查?Monday,February6,2023StatisticalResearchOffice54★整群隨機(jī)抽樣---整群隨機(jī)抽樣的概念(如何組織實(shí)施)---采用整群隨機(jī)抽樣時(shí),抽樣平均誤差的估計(jì)設(shè)現(xiàn)采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣的方法,從中抽選出群進(jìn)行調(diào)查,則樣本容量為若每群所包含的單位數(shù)相同則樣本容量為:Monday,February6,2023StatisticalResearchOffice551.作為樣本的各群的平均數(shù)(或樣本群的比率)分別為2.全部樣本的平均數(shù)(或樣本比率)為為什么?Monday,February6,2023StatisticalResearchOffice563.樣本方差---樣本群間方差對(duì)于比率而言有4.抽樣標(biāo)準(zhǔn)誤差為---不重復(fù)抽樣Monday,February6,2023StatisticalResearchOffice57對(duì)于比率的抽樣標(biāo)準(zhǔn)誤差為5.所求總體均值的置信區(qū)間為---不重復(fù)抽樣;若采用重復(fù)抽樣,相應(yīng)區(qū)間應(yīng)為什么?Monday,February6,2023StatisticalResearchOffice58---分層隨機(jī)抽樣與整群隨機(jī)抽樣的比較1.分層隨機(jī)抽樣的隨機(jī)抽樣誤差產(chǎn)生在樣本層內(nèi),而整群隨機(jī)抽樣的隨機(jī)抽樣誤差產(chǎn)生在樣本群間。2.當(dāng)層的內(nèi)部差別相對(duì)較小而層間差別較大時(shí),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論