南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1課件_第1頁(yè)
南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1課件_第2頁(yè)
南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1課件_第3頁(yè)
南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1課件_第4頁(yè)
南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1課件_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,1,第五章 統(tǒng)計(jì)估計(jì)與假設(shè)檢驗(yàn),第一節(jié) 統(tǒng)計(jì)估計(jì)與置信區(qū)間 第二節(jié) 假設(shè)檢驗(yàn),南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,2,本章內(nèi)容,統(tǒng)計(jì)估計(jì)與置信區(qū)間 點(diǎn)估計(jì) 區(qū)間估計(jì)(求置信區(qū)間) 假設(shè)檢定(假設(shè)檢驗(yàn)) 雙尾檢驗(yàn)、單尾檢驗(yàn) 置信區(qū)間檢驗(yàn)法、臨界值檢驗(yàn)法、 p-值檢驗(yàn)法(后兩種是常用的方法),南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,3,第一節(jié) 統(tǒng)計(jì)估計(jì)與置信區(qū)間,一、統(tǒng)計(jì)估計(jì)概述 1、統(tǒng)計(jì)估計(jì)就是對(duì)總體參數(shù)進(jìn)行估計(jì),包括點(diǎn)估計(jì)和區(qū)間估計(jì)。 2、點(diǎn)估計(jì)就是在不考慮抽樣誤差的條件下,直接用樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值。 3、區(qū)間估計(jì)就是通過(guò)樣本

2、統(tǒng)計(jì)量來(lái)推測(cè)總體未知參數(shù)的可能范圍。它是根據(jù)概率論和抽樣原理,以一定的概率即可信程度來(lái)保證總體參數(shù)落在某一區(qū)間內(nèi)。由于區(qū)間估計(jì)這種推斷方法給出估計(jì)誤差的允許范圍和推斷的可信程度,彌補(bǔ)了點(diǎn)估計(jì)的絕對(duì)性缺陷,所以廣泛地被用于對(duì)總體參數(shù)的估計(jì)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,4,區(qū)間估計(jì),區(qū)間估計(jì)主要用于用樣本平均數(shù)估計(jì)總體平均數(shù);用樣本成數(shù)估計(jì)總體成數(shù)。 區(qū)間估計(jì)的實(shí)質(zhì)就是確定總體參數(shù)(總體平均數(shù)、總體成數(shù))的置信區(qū)間。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,5,我們用95%的置信水平得到某班學(xué)生考試成績(jī)的置信區(qū)間為60-80分,如何理解? 該班同學(xué)平均成績(jī)的置信區(qū)間是60-8

3、0分,置信度為95%。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,6,例:隨機(jī)抽樣1000位北京男性市民后,樣本平均身高為172公分,樣本標(biāo)準(zhǔn)差為30公分,在95%的置信水平下,北京男性市民的平均身高為何?,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,7,95%置信區(qū)間,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,8,這就表示在95%的置信水平下,北京男性市民的平均身高是在170.14與173.86公分之間,其抽樣誤差為 公分。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,9,99%置信區(qū)間,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,10,這就表示在99%的置信水平下,北京男性市民的平均身

4、高是在169.55與174.45公分之間,其抽樣誤差為 公分 。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,11,例:美國(guó)某家醫(yī)院隨機(jī)抽樣1024個(gè)案例,其平均醫(yī)療費(fèi)用為$810,樣本標(biāo)準(zhǔn)差為$64 建構(gòu)90%的置信區(qū)間 建構(gòu)95%的置信區(qū)間 建構(gòu)99%的置信區(qū)間,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,12,例:從選民中隨機(jī)抽取100名進(jìn)行調(diào)查,結(jié)果顯示對(duì)候選人的支持率為80%,求在95%的置信度下,候選人支持率的置信區(qū)間。 置信區(qū)間為,即72.16%87.84%,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,13,區(qū)間估計(jì)的邏輯是以概率抽樣方法自母體抽取一個(gè)樣本,計(jì)算其平均數(shù)(點(diǎn)估計(jì)值

5、) ,依照所要求的置信水平,加減 Z 個(gè) 所得到的區(qū)間。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,14,95% 和 99%就是 “置信水平” 就是抽樣極限誤差 置信水平愈高,置信區(qū)間也就愈寬 ,但太寬的置信區(qū)間會(huì)失去實(shí)際的效用,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,15,值:代表“不包含”母體特性的概率,也就是結(jié)論是錯(cuò)誤的概率。又稱為顯著程度(significance level) 在95%的置信水平下, = 1 0.95 = 0.05 在99%的置信水平下, = 1 0.99 = 0.01,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,16,“判別值”(critical value)

6、:與 值相對(duì)應(yīng)的 z 值 95%置信區(qū)間的判別值: 99%置信區(qū)間的判別值:,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,17,上述的置信區(qū)間也可以 t 分?jǐn)?shù)來(lái)建構(gòu): 置信區(qū)間,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,18,以 t 分?jǐn)?shù)來(lái)建構(gòu)置信區(qū)間 : 例:設(shè) N=1000, =.05,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,19,一個(gè)控制抽樣誤差的方法是從樣本數(shù)著手 但是,當(dāng)樣本數(shù)超過(guò)一定數(shù)目后,標(biāo)準(zhǔn)誤減少得很有限,抽樣成本會(huì)隨著樣本數(shù)增大,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,20,第二節(jié) 假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的另一種方式,它與區(qū)間估計(jì)的差別主要在于:區(qū)間估計(jì)是用給

7、定的大概率推斷出總體參數(shù)的范圍,而假設(shè)檢驗(yàn)是以小概率為標(biāo)準(zhǔn),對(duì)總體的狀況所做出的假設(shè)進(jìn)行判斷。假設(shè)檢驗(yàn)與區(qū)間估計(jì)結(jié)合起來(lái),構(gòu)成完整的統(tǒng)計(jì)推斷內(nèi)容。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,21,小概率原理:即指概率很小的事件在一次試驗(yàn)中實(shí)際上不可能出現(xiàn)。這種事件稱為“實(shí)際不可能事件”。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,22,例1:消費(fèi)者協(xié)會(huì)接到消費(fèi)者投訴,指控品牌紙包裝飲料存在容量不足,有欺騙消費(fèi)者之嫌。包裝上標(biāo)明的容量為250毫升。消費(fèi)者協(xié)會(huì)從市場(chǎng)上隨機(jī)抽取50盒該品牌紙包裝飲品,測(cè)試發(fā)現(xiàn)平均含量為248毫升,小于250毫升。這是生產(chǎn)中正常的波動(dòng),還是廠商的有意行為?消費(fèi)者協(xié)

8、會(huì)能否根據(jù)該樣本數(shù)據(jù),判定飲料廠商欺騙了消費(fèi)者呢?,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,23,消費(fèi)者協(xié)會(huì)實(shí)際要進(jìn)行的是一項(xiàng)統(tǒng)計(jì)檢驗(yàn)工作。檢驗(yàn)總體平均 =250是否成立。這就是一個(gè)原假設(shè)(null hypothesis),通常用 表示,即: : =250,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,24,與原假設(shè)對(duì)立的是備選假設(shè)(alternative hypothesis) ,備選假設(shè)是在原假設(shè)被否定時(shí)另一種可能成立的結(jié)論。備選假設(shè)比原假設(shè)還重要,一般把期望出現(xiàn)的結(jié)論作為備選假設(shè)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,25,構(gòu)造一個(gè)統(tǒng)計(jì)量來(lái)決定是“接受原假設(shè),拒絕備選假設(shè)”,還

9、是“拒絕原假設(shè),接受備選假設(shè)”。對(duì)不同的問(wèn)題,要選擇不同的檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量確定后,就要利用該統(tǒng)計(jì)的分布以及由實(shí)際問(wèn)題中所確定的顯著性水平,來(lái)進(jìn)一步確定檢驗(yàn)統(tǒng)計(jì)量拒絕原假設(shè)的取值范圍,即拒絕域。在給定的顯著性水平下,檢驗(yàn)統(tǒng)計(jì)量的可能取值范圍被分成兩部分:小概率區(qū)域與大概率區(qū)域。小概率區(qū)域就是概率不超過(guò)顯著性水平的區(qū)域,是原假設(shè)的拒絕區(qū)域;大概率區(qū)域是概率為1-的區(qū)域,是原假設(shè)的接受區(qū)域。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,26,二、兩種類型的錯(cuò)誤,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,27,總體參數(shù)檢驗(yàn),單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn),雙側(cè)檢驗(yàn),左側(cè)檢驗(yàn),右側(cè)檢驗(yàn),南京大學(xué)統(tǒng)計(jì)學(xué) ch

10、5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,28,用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),使用左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn),決定于備選假設(shè)中的不等式形式與方向。與“不相等”對(duì)應(yīng)的是雙側(cè)檢驗(yàn),與“小于”相對(duì)應(yīng)的是左側(cè)檢驗(yàn),與“大于”相對(duì)應(yīng)的是右側(cè)檢驗(yàn)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,29,在例1中,按歷史資料,總體的標(biāo)準(zhǔn)差是4毫升。我們通過(guò)檢驗(yàn)總體均值是否等于250毫升,來(lái)判斷飲料廠商是否欺騙了消費(fèi)者。程序如下:,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,30,第一步:確定原假設(shè)與備選假設(shè)。 : =250; : 250 以上的備選假設(shè)是總體均值小于250毫升,因?yàn)橄M(fèi)者協(xié)會(huì)希望通過(guò)樣本數(shù)據(jù)推斷出廠商的欺騙行為(大于250毫

11、升一般不會(huì)發(fā)生)。因此使用左側(cè)檢驗(yàn)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,31,第二步:構(gòu)造出檢驗(yàn)統(tǒng)計(jì)量。 我們知道,如果總體的標(biāo)準(zhǔn)差已知,則正態(tài)總體(正常情況下,生產(chǎn)飲料的容量服從正態(tài)分布)的抽樣平均數(shù),也服從正態(tài)分布,對(duì)它進(jìn)行標(biāo)準(zhǔn)化變換,可得到: 可用z作為檢驗(yàn)統(tǒng)計(jì)量。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,32,第三步:確定顯著性水平,確定拒絕域。 通常顯著水平由實(shí)際問(wèn)題確定,我們這里取=0.05,左側(cè)檢驗(yàn),拒絕域安排在左邊,查標(biāo)準(zhǔn)正態(tài)分布表得臨界值: - =-1.645,拒絕域是z-1.645。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,33,第四步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)

12、值。 樣本平均數(shù) ,n=50,代入檢驗(yàn)統(tǒng)計(jì)量得:,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,34,第五步:判斷。 檢驗(yàn)統(tǒng)計(jì)量的樣本取值落入拒絕域。拒絕原假設(shè),接受備選假設(shè),認(rèn)為有足夠的證據(jù)說(shuō)明該種紙包飲料的平均容量小于包裝盒上注明的250毫升,廠商有欺詐之嫌。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,35,總體標(biāo)準(zhǔn)差未知時(shí)對(duì)總體均值檢驗(yàn)經(jīng)常用t統(tǒng)計(jì)量: 但是,在大樣本場(chǎng)合(樣本容量n大于30時(shí)),t-統(tǒng)計(jì)量與標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計(jì)量近似,通常用z檢驗(yàn)代替t檢驗(yàn)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,36,總體成數(shù)的檢驗(yàn),當(dāng)樣本容量較大時(shí),下列統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布: 上式中,代表總體的

13、成數(shù),p代表樣本的成數(shù)。 以上的z統(tǒng)計(jì)量可以用作總體成數(shù)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,37,例2:某企業(yè)聲明有30%以上的消費(fèi)者對(duì)其產(chǎn)品質(zhì)量滿意。如果隨機(jī)調(diào)查600名消費(fèi)者,表示對(duì)該企業(yè)產(chǎn)品滿意的有220人。試在顯著性水平=0.05下,檢驗(yàn)調(diào)查結(jié)果是否支持企業(yè)的自我聲明。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,38,解:第一步:作出假設(shè)。 : 30%, : 30%。 以上的備選假設(shè)是企業(yè)自我聲明的結(jié)論,我們希望該企業(yè)說(shuō)的是實(shí)話。因此使用右側(cè)檢驗(yàn)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,39,第二步:構(gòu)造z檢驗(yàn)統(tǒng)計(jì)量。 第三步:確定拒絕域。 顯著水平

14、=0.05,查標(biāo)準(zhǔn)正態(tài)分布表得臨界值: =1.645,拒絕域是z1.645。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,40,第四步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)值。 樣本成數(shù)p=220/600=0.37,總體假設(shè)的成數(shù) =0.3,代入z檢驗(yàn)統(tǒng)計(jì)量得:,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,41,第五步:判斷。 檢驗(yàn)統(tǒng)計(jì)量的樣本取值z(mì)=3.51.645,落入拒絕域。拒絕原假設(shè),接受備選假設(shè),認(rèn)為樣本數(shù)據(jù)證明該企業(yè)聲明屬實(shí)。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,42,習(xí)題:某市原來(lái)成年男性中吸煙者占64%,經(jīng)過(guò)戒煙宣傳后進(jìn)行抽樣調(diào)查,發(fā)現(xiàn)100名被調(diào)查者中,有55人是吸煙者,試問(wèn)戒煙宣傳是

15、否收到明顯成效?(=0.05),南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,43,p-值檢驗(yàn),p-值檢驗(yàn)就是通過(guò)計(jì)算p-值,再將它與顯著性水平作比較,決定拒絕還是接受原假設(shè)。所謂p-值就是拒絕原假設(shè)所需的最低顯著性水平。p-值判斷的原則是:如果p-值小于給定的顯著性水平,則拒絕原假設(shè);否則,接受原假設(shè)?;蛘?,更直觀來(lái)說(shuō)就是:如果p-值很小,拒絕原假設(shè),p-值很大,接受原假設(shè)。請(qǐng)大家注意的是這里的p-值是指概率,不要與成數(shù)指標(biāo)相混淆。,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,44,例1:利用p-值檢驗(yàn)重新檢驗(yàn)例1。 解: 第一、第二步與例1完全相同,故省略之。 第三步:計(jì)算樣本統(tǒng)計(jì)的數(shù)值。 樣本平均數(shù) ,n=50,代入檢驗(yàn)統(tǒng)計(jì)量得:,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,45,第四步:計(jì)算p-值。 使用左側(cè)檢驗(yàn),p-值= 。查標(biāo)準(zhǔn)正態(tài)分布表得: p-值= 0.000 1,南京大學(xué)統(tǒng)計(jì)學(xué) ch5參數(shù)估計(jì)與假設(shè)檢驗(yàn)1,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論