抽樣分布和估計(jì)講義.ppt_第1頁(yè)
抽樣分布和估計(jì)講義.ppt_第2頁(yè)
抽樣分布和估計(jì)講義.ppt_第3頁(yè)
抽樣分布和估計(jì)講義.ppt_第4頁(yè)
抽樣分布和估計(jì)講義.ppt_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,統(tǒng)計(jì)學(xué)家視數(shù)據(jù)為資源,并且試圖從數(shù)據(jù)中看出平常人所看不到的景致來(lái)。,2,第一講內(nèi)容復(fù)習(xí),統(tǒng)計(jì)學(xué)的定義、分類; 認(rèn)識(shí)數(shù)據(jù)的第一步:你得到的是什么類型的數(shù)據(jù)? 利用圖表展示數(shù)據(jù)中的信息; 運(yùn)用指標(biāo)刻畫數(shù)據(jù)的某些特征和程度; 使用EXCEL來(lái)描述數(shù)據(jù);,3,第一講作業(yè)以及案例討論,4,第二講,抽樣分布和估計(jì) 2001年9月22日,5,統(tǒng)計(jì)推斷的基本概念,總體:有限總體、無(wú)限總體; 樣本; 統(tǒng)計(jì)推斷的任務(wù):通過(guò)樣本的統(tǒng)計(jì)量來(lái)了解總體的參數(shù)。 為什么需要抽樣: 1) 總體無(wú)法得到; 2) 時(shí)間成本不允許; 3) 實(shí)驗(yàn)具有破壞性。,6,統(tǒng)計(jì)推斷的基本思想,1)選用一個(gè)概率模型來(lái)刻畫總體,使用樣本對(duì)模型

2、做出推斷; 2)樣本的獲取的可能性依賴于你選用的模型;根據(jù)這種可能性來(lái)分析我們由部分來(lái)認(rèn)識(shí)總體所可能犯的錯(cuò)誤(風(fēng)險(xiǎn))。,7,統(tǒng)計(jì)推斷的內(nèi)容之一,估計(jì)參數(shù) 點(diǎn)估計(jì)和區(qū)間估計(jì) 點(diǎn)估計(jì)的例子 居民家庭年收入,8,統(tǒng)計(jì)推斷內(nèi)容之二,假設(shè)檢驗(yàn):是否可以選用這個(gè)模型? 例子: 是否可以使用模型N(570,306)來(lái)刻畫所有居民的家庭年收入? 思想: 如果該模型是好的,那么 和570相差很多的可能性不能太大。,9,簡(jiǎn)單隨機(jī)抽樣,有限總體的簡(jiǎn)單隨機(jī)抽樣:等概率抽樣; 有放回抽樣:獨(dú)立性 無(wú)放回抽樣:非獨(dú)立性 抽樣方法:利用隨即數(shù)表 利用 Excel,10,隨機(jī)數(shù)表的使用,77191 25860 55204 7

3、3417 83920 69486 76298 26678 89334 33938 95567 29380 57099 10528 09925 89773 41335 96244 15987 46962 67342 77592 57651 95508 53122 16025 84299 53310 67380 84249 37203 64516 51530 37069 40216 61374,11,無(wú)限總體的簡(jiǎn)單隨機(jī)抽樣:獨(dú)立性; 例子:擲硬幣,12,樣本和總體分布,例子:薯片 一個(gè)箱子中有10000包薯片,其中50%標(biāo)價(jià)5元, 30%標(biāo)價(jià)10元, 10%標(biāo)價(jià)15元, 10%標(biāo)價(jià)30元。,13,

4、點(diǎn)估計(jì)的方法,估計(jì)量(統(tǒng)計(jì)量);估計(jì)值。 基于一定的準(zhǔn)則求最好的估計(jì)量。 極大似然法則; 矩估計(jì); 最小二乘估計(jì)等,14,抽樣分布,樣本不同, 值也不同。那么 取不同值的可能性分別是什么? 的概率分布稱作它的抽樣分布。 抽樣分布在統(tǒng)計(jì)推斷中的中心地位。 抽樣分布取決于總體的分布(模型)以及抽樣的方式。 抽樣方式 總體分布= 抽樣分布,15,樣本均值的抽樣分布 (無(wú)限總體),如果總體服從 , 那么簡(jiǎn)單隨機(jī)樣本的均值服從正態(tài)分布 如果樣本容量n非常大,而且總體的期望是,方差是2+,那么簡(jiǎn)單隨機(jī)樣本的均值 近似服從正態(tài)分布 (中心極限定理),16,樣本比率的抽樣分布 (無(wú)限總體),小樣本情況 x服從

5、二項(xiàng)式分布B(n,p). 大樣本情況,按照中心極限定理,近似地,17,正態(tài)分布的圖形,18,有限總體的修正系數(shù),設(shè)N是總體中個(gè)體的個(gè)數(shù),n是樣本容量, 那么樣本均值的方差是: 樣本比率的方差是: 注:如果N相比n大很多,比如n/N5%,可以視為無(wú)限總體。,19,樣本方差的抽樣分布,如果 是來(lái)自正態(tài)總體 的一個(gè)隨機(jī)樣本,定義樣本方差為:,20,認(rèn)識(shí)卡方分布,21,方差未知時(shí)樣本均值的抽樣分布,正態(tài)總體,2未知,使用樣本方差s2來(lái)替代2,則樣本均值滿足: n30時(shí),可以用標(biāo)準(zhǔn)正態(tài)分布近似。,22,正態(tài)分布和t 分布的比較,23,估計(jì)的誤差,不能以個(gè)別估計(jì)值作為評(píng)價(jià)準(zhǔn)則; 估計(jì)的誤差:,24,對(duì)估計(jì)

6、量的評(píng)價(jià),無(wú)偏性:偏差是零; 有效性:方差最??; 一致性:樣本容量增加會(huì)降低估計(jì)誤差。 樣本均值(比率)是對(duì)總體均值(比率)的一個(gè)無(wú)偏的、有效的、一致的估計(jì)量。,25,將概率模型引入統(tǒng)計(jì)推斷中來(lái)刻畫總體,可以使得我們能夠測(cè)量和控制由部分(樣本)來(lái)推斷總體時(shí)所犯的錯(cuò)誤。,26,Estimate Population,Parameter.,with Sample,Statistic,Mean,Proportion,p,Variance,s,2,Population Parameters Estimated,2,Difference, - ,1,2,x - x,1,2,_,_,_,27,的抽樣分布:

7、 1)正態(tài)總體 時(shí),,28,2)非正態(tài)總體時(shí),大樣本情況(n30),29,S2的抽樣分布: 當(dāng)總體是正態(tài)分布時(shí),,30,的抽樣分布:,31,有限總體時(shí)樣本均值和樣本比率的標(biāo)準(zhǔn)誤差,有限總體修正系數(shù)。,32,聯(lián)合食品公司的案例,針對(duì)“聯(lián)合食品公司”的案例(P.44 案例2-1),我們假設(shè)調(diào)查的100個(gè)客戶組成一個(gè)簡(jiǎn)單隨機(jī)樣本。嘗試回答下面的問(wèn)題: 1)所有客戶一次購(gòu)買金額的平均值是多少? 2)所有使用信用卡的客戶一次購(gòu)買金額的平均值是多少? 3)使用信用卡的客戶占的比例是多少?,33,34,35,1)所有客戶一次購(gòu)買金額的平均值是多少?(29.4449) 2)所有使用信用卡的客戶一次購(gòu)買金額的平

8、均值是多少?(40.8768) 3)使用信用卡的客戶占的比例是多少?(0.22),36,我們的估計(jì)值離真值有多遠(yuǎn)?,我們希望通過(guò)樣本的信息給出一個(gè)范圍,使這個(gè)范圍按足夠大的概率包含我們所感興趣的參數(shù)。 如何尋找K和L ,使得以95%的概率成立:,37,抽樣誤差:無(wú)偏點(diǎn)估計(jì)值與總體參數(shù)之差的絕對(duì)值。,38,樣本均值的抽樣分布,z,-z,1-,39,大樣本且已知的情況,40,理解置信區(qū)間的含義,抽取100個(gè)樣本,計(jì)算出100個(gè)平均值和100個(gè)區(qū)間,它們當(dāng)中至少有(1-)*100個(gè)包含了未知的總體均值。 因此,可以以(1-)的程度確信落在每一個(gè)區(qū)間里面。 邊際誤差:,41,Confidence In

9、tervals,Intervals Extend from,(1 - ) % of Intervals Contain . % Do Not.,1 -,/2,/2,X,_,x,_,Intervals H1:紅球白球不是各一半。(或者p不是0.5)。 原假設(shè); 備擇假設(shè); 選擇的態(tài)度:拒絕?接受? (To be or not to be,) 更多的例子,簡(jiǎn)單假設(shè)和復(fù)合假設(shè):,63,拒絕域,拒絕域:哪些樣本出現(xiàn)后,你會(huì)拒絕原假設(shè)? 你建立你的拒絕域的根據(jù)是什么?抽樣分布。 所謂檢驗(yàn)就是選擇一個(gè)拒絕域。為什么這是一個(gè)問(wèn)題?,64,你會(huì)犯什么錯(cuò)誤?,65,H0: Innocent,Jury Trial

10、,Hypothesis,Test,Actual Situation,Actual Situation,Verdict,Innocent,Guilty,Decision,H,0,True,H,0,False,Innocent,Correct,Error,Do Not,Reject,H,0,1 -,a,Type II,Error (,b,),Guilty,Error,Correct,Reject,H,0,Type I,Error,(,a,),Power,(1 -,b,),Result Possibilities,66,a,b,Reduce probability of one error and

11、the other one goes up.,a & b Have an Inverse Relationship,67,Neymann-Pearson原則,找一個(gè)不犯錯(cuò)誤的檢驗(yàn)??? N-P原則:控制犯第一類錯(cuò)誤的概率。 顯著水平:犯第一類錯(cuò)誤的最大概率。 啟示:拒絕原假設(shè)、接受原假設(shè)? 設(shè)置原假設(shè)和備擇假設(shè)的學(xué)問(wèn):一種藥品中含某元素超過(guò)0.01克為不合格。如何設(shè)置原假設(shè)? H0: 該藥品合格; H0:該藥品不合格。,68,一個(gè)例子,所有聯(lián)合食品公司的顧客一次購(gòu)買金額的平均值是35美圓? H0: =35. H1: ? 對(duì)容量為100的樣本,給定顯著水平=0.05, 選擇拒絕域?yàn)闈M足下列條件的樣本組成:,69,一個(gè)例子(續(xù)),計(jì)算樣本均值得到29.4449,落入拒絕域,所以拒絕原假設(shè)。 該檢驗(yàn)犯第一類錯(cuò)誤的概率是多少? 如果H0是正確的,一個(gè)樣本落在該拒絕域里面的概率是多少?如何確定?,70,本

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論