高教版概率論與數(shù)理統(tǒng)計(jì)課件-第八章_第1頁(yè)
高教版概率論與數(shù)理統(tǒng)計(jì)課件-第八章_第2頁(yè)
高教版概率論與數(shù)理統(tǒng)計(jì)課件-第八章_第3頁(yè)
高教版概率論與數(shù)理統(tǒng)計(jì)課件-第八章_第4頁(yè)
高教版概率論與數(shù)理統(tǒng)計(jì)課件-第八章_第5頁(yè)
已閱讀5頁(yè),還剩113頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)假設(shè)檢驗(yàn)問(wèn)題第二節(jié)正態(tài)總體均值的假設(shè)檢驗(yàn)第三節(jié)正態(tài)總體方差的檢驗(yàn)第四節(jié)大樣本檢驗(yàn)法第五節(jié)假設(shè)檢驗(yàn)的兩類錯(cuò)誤第六節(jié)非參數(shù)假設(shè)檢驗(yàn)第八章假設(shè)檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)問(wèn)題前一章我們討論了統(tǒng)計(jì)推斷中的參數(shù)估計(jì)問(wèn)題,本章將討論另一類統(tǒng)計(jì)推斷問(wèn)題-假設(shè)檢驗(yàn).在參數(shù)估計(jì)中我們按照參數(shù)的點(diǎn)估計(jì)方法建立了參數(shù)的估計(jì)公式,并利用樣本值確定了一個(gè)估計(jì)值,認(rèn)為參數(shù)真值。由于參數(shù)是未知的,只是一個(gè)假設(shè)(假說(shuō),假想),它可能是真,也可能是假,是真是假有待于用樣本進(jìn)行驗(yàn)證(檢驗(yàn)).下面我們先對(duì)幾個(gè)問(wèn)題進(jìn)行分析,給出假設(shè)檢驗(yàn)的有關(guān)概念,然后總結(jié)給出檢驗(yàn)假設(shè)的思想和方法.一、統(tǒng)計(jì)假設(shè)某大米加工廠用自動(dòng)包裝機(jī)將大米裝袋,每袋的標(biāo)準(zhǔn)重量規(guī)定為10kg,每天開(kāi)工時(shí),需要先檢驗(yàn)一下包裝機(jī)工作是否正常.根據(jù)以往的經(jīng)驗(yàn)知道,自動(dòng)包裝機(jī)裝袋重量X服從正態(tài)分布N()。某日開(kāi)工后,抽取了8袋,如何根據(jù)這8袋的重量判斷“自動(dòng)包裝機(jī)工作是正常的”這個(gè)命題是否成立?請(qǐng)看以下幾個(gè)問(wèn)題:?jiǎn)栴}1引號(hào)內(nèi)的命題可能是真,也可能是假,只有通過(guò)驗(yàn)證才能確定。如果根據(jù)抽樣結(jié)果判斷它是真,那么我們接受這個(gè)命題,否那么就拒絕接受它,此時(shí)實(shí)際上我們接受了“機(jī)器工作不正?!边@樣一個(gè)命題。若用H0表示“”,用H1表示其對(duì)立面,即“”,則問(wèn)題等價(jià)于檢驗(yàn)是否成立,若H0不成立,則H1:成立。一架天平標(biāo)定的誤差方差為10-4(克2),重量為的物體用它稱得的重量X服從N()。某人懷疑天平的精度,拿一物體稱n次,得n個(gè)數(shù)據(jù),由這些數(shù)據(jù)(樣本)如何判斷“這架天平的精度是10-4(克2)”這個(gè)命題是否成立?問(wèn)題2記H0:=10-4,其H1:。則問(wèn)題等價(jià)于檢驗(yàn)H0成立,還是H1成立。某種電子元件的使用壽命X服從參數(shù)為的指數(shù)分布,現(xiàn)從一批元件中任取n個(gè)測(cè)得其壽命值(樣本)如何判定“元件的平均壽命不小于5000小時(shí)”這個(gè)命題是否成立?記問(wèn)題3那么問(wèn)題等價(jià)于檢驗(yàn)H0成立,還是H1成立。某種疾病,不用藥時(shí)其康復(fù)率為,現(xiàn)發(fā)明一種新藥(無(wú)不良反應(yīng)),為此抽查n位病人用新藥的治療效果,設(shè)其中有s人康復(fù),根據(jù)這些信息,能否斷定“該新藥有效”?記問(wèn)題4那么問(wèn)題等價(jià)于檢驗(yàn)H0成立,還是H1成立。自1965年1月1日至1971年2月9日共2231天中,全世界記錄到震級(jí)4級(jí)及以上的地震共計(jì)162次,問(wèn)相繼兩次地震間隔的天數(shù)X是否服從指數(shù)分布?問(wèn)題5記服從指數(shù)分布,不服從指數(shù)分布。那么問(wèn)題也等價(jià)于檢驗(yàn)H0成立,還是H1成立。在很多實(shí)際問(wèn)題中,我們常常需要對(duì)關(guān)于總體的分布形式或分布中的未知參數(shù)的某個(gè)陳述或命題進(jìn)行判斷,數(shù)理統(tǒng)計(jì)學(xué)中將這些有待驗(yàn)證的陳述或命題稱為統(tǒng)計(jì)假設(shè),簡(jiǎn)稱假設(shè).如上述各問(wèn)題中的H0和H1都是假設(shè).利用樣本對(duì)假設(shè)的真假進(jìn)行判斷稱為假設(shè)檢驗(yàn)。在總體的概率分布情形下,對(duì)分布中的未知參數(shù)作假設(shè)并進(jìn)行檢驗(yàn),稱為參數(shù)假設(shè)檢驗(yàn)假設(shè)總體的分布未知,對(duì)總體的分布形式或參數(shù)作假設(shè)并進(jìn)行檢驗(yàn),稱為非參數(shù)假設(shè)檢驗(yàn)。如上述問(wèn)題1~4為參數(shù)假設(shè)檢驗(yàn)問(wèn)題,問(wèn)題5為非參數(shù)假設(shè)檢驗(yàn)問(wèn)題. 值得注意的是,當(dāng)給定原假設(shè)后,其對(duì)立假設(shè)的形式可能有多個(gè),如H0:其對(duì)立形式有

在假設(shè)檢驗(yàn)問(wèn)題中,常把一個(gè)被檢驗(yàn)的假設(shè)稱為原假設(shè)或零假設(shè),而其對(duì)立面就稱為對(duì)立假設(shè)。上述各問(wèn)題中,H0為原假設(shè),H1為對(duì)立假設(shè)。當(dāng)H0不成立時(shí),就拒絕接受H0而接受其對(duì)立假設(shè)H1。選擇哪一種需根據(jù)實(shí)際問(wèn)題確定,因而對(duì)立假設(shè)往往也稱為備選假設(shè),即在拒絕原假設(shè)后可供選擇的假設(shè).在假設(shè)檢驗(yàn)問(wèn)題中,必須同時(shí)給出原假設(shè)和對(duì)立假設(shè).在參數(shù)假設(shè)中,不論是原假設(shè)還是對(duì)立假設(shè),若其中只含有一個(gè)參數(shù)值,則稱為簡(jiǎn)單假設(shè),否則稱為復(fù)合假設(shè),如H0:,

H1:為簡(jiǎn)單假設(shè);而H0:,

H1:為復(fù)合假設(shè)。二、假設(shè)檢驗(yàn)的思想方法如何利用從總體中抽取的樣本來(lái)檢驗(yàn)一個(gè)關(guān)于總體的假設(shè)是否成立呢?由于樣本與總體同分布,樣本包含了總體分布的信息,因而也包含了假設(shè)H0是否成立的信息,如何來(lái)獲取并利用樣本信息是解決問(wèn)題的關(guān)鍵.統(tǒng)計(jì)學(xué)中常用“概率反證法”和“小概率原理”來(lái)解決這個(gè)問(wèn)題。小概率原理概率很小的事件在一次試驗(yàn)中不會(huì)發(fā)生.如果小概率事件在一次試驗(yàn)中竟然發(fā)生了,那么事屬反常,定有導(dǎo)致反常的特別原因,有理由疑心試驗(yàn)的原定條件不成立。概率反證法欲判斷假設(shè)H0的真假,先假定H0真,在此前提下構(gòu)造一個(gè)能說(shuō)明問(wèn)題的小概率事件A。試驗(yàn)取樣,由樣本信息確定A是否發(fā)生,假設(shè)A發(fā)生,這與小概率原理相違背,說(shuō)明試驗(yàn)的前定條件H0不成立,拒絕H0,接受H1;假設(shè)小概率事件A沒(méi)有發(fā)生,沒(méi)有理由拒絕H0,只好接受H0。反證法的關(guān)鍵是通過(guò)推理,得到一個(gè)與常理(定理、公式、原理)相違背的結(jié)論。“概率反證法”依據(jù)的是“小概率原理”。那么多小的概率才算小概率呢?這要由實(shí)際問(wèn)題的不同需要來(lái)決定。以后用符號(hào)記小概率,一般取等。 在假設(shè)檢驗(yàn)中,若小概率事件的概率不超過(guò),則稱為檢驗(yàn)水平或顯著性水平。

已知某煉鐵廠的鐵水含碳量X~N(4.55,0.06),現(xiàn)改變了工藝條件,又測(cè)得10爐鐵水的平均含碳量,假設(shè)方差無(wú)變化,問(wèn)總體的均值是否有明顯改變?(取=0.05)下面舉例說(shuō)明以上檢驗(yàn)的思想與方法。例1則與4.55應(yīng)很接近事件較大,待定)不太可能發(fā)生解由問(wèn)題提出假設(shè)H0:,H1:假設(shè)H0成立由于未知用其無(wú)偏估計(jì)來(lái)代替用來(lái)衡量與4.55之間的差異如果較大則可認(rèn)為所以在H0成立的前提下即P〔A〕很小令P〔A〕=α,確定d是解決問(wèn)題的關(guān)鍵由此確定了小概率事件由可知因此在H0成立的前提下,統(tǒng)計(jì)量顯然因此即由標(biāo)準(zhǔn)正態(tài)分布上分位點(diǎn)的定義可知由=0.05,得由于說(shuō)明小概率事件A未發(fā)生,因此接受假設(shè)H0即認(rèn)為總體均值等于4.55在隨機(jī)試驗(yàn)中,小概率事件有許多,關(guān)鍵是要找一個(gè)能說(shuō)明問(wèn)題的小概率事件。由P(A)=同樣可確定d本例中,若取最后的檢驗(yàn)將出現(xiàn)這樣一種傾向越與4.55接近,越要拒絕這樣的判別方法顯然不合理,錯(cuò)誤在于:在H0成立的前提下,這樣取小概率事件A不合理。在本例中,若設(shè)則A:(X1,X2,…,X10)D是使小概率事件A發(fā)生的所有10維樣本值〔x1,…,x10〕構(gòu)成的集合則拒絕接受H0等價(jià)于一般,若拒絕接受其中D是n維空間Rn中的區(qū)域,那么稱D為假設(shè)H0的拒絕域或否認(rèn)域、臨界域稱D的補(bǔ)集為H0的接受域檢驗(yàn)中所用的統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量樣本觀測(cè)值(x1,x2,…,x10)樣本觀測(cè)值(x1,x2,…,xn)執(zhí)行統(tǒng)計(jì)判決:求統(tǒng)計(jì)量的值,并查表求出有關(guān)數(shù)據(jù),判斷小概率事件是否發(fā)生,由此作出判決提出假設(shè):根據(jù)問(wèn)題的要求,提出原假設(shè)H0與對(duì)立假設(shè)H1,給定顯著水平及樣本容量n。總結(jié)例8.1處理問(wèn)題的思想與方法,可得處理參數(shù)假設(shè)檢驗(yàn)問(wèn)題的步驟如下:〔1〕〔2〕〔3〕確定拒絕域:用參數(shù)的一個(gè)好的估計(jì)量(通常取為的無(wú)偏估計(jì))來(lái)代替,分析拒絕域D的形式,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量g(),在H0成立的前提下確定g()的概率分布,通過(guò)等式確定D其中確定拒絕域是關(guān)鍵.拒絕域的形式一般由原假設(shè)與對(duì)立假設(shè)共同確定,對(duì)同一原假設(shè)H0,不同的對(duì)立假設(shè),所得到的H0的拒絕域可能不同。請(qǐng)看下例。例2數(shù)據(jù)同例8.1,問(wèn)總體的均值是否明顯大于4.55?在統(tǒng)計(jì)學(xué)中,只有當(dāng)與4.55的偏差大到一定程度時(shí)才可認(rèn)為在本例中,拒絕H0時(shí)接受的是,因而H0的拒絕取為較合理此問(wèn)題的合理假設(shè)為解的無(wú)偏估計(jì)是的一個(gè)很好的近似值用代替在例8.1中,拒絕H0時(shí)接受的是H1:兩個(gè)數(shù)的偏差用其差的絕對(duì)值來(lái)衡量因而其拒絕域設(shè)為較合理與例8.1中的拒絕域不同在H0成立的條件下,事件發(fā)生的概率應(yīng)很小設(shè)P(A)=,統(tǒng)計(jì)量由得所以拒絕域?yàn)樗耘袥Q結(jié)果為:接受H0三、參數(shù)假設(shè)檢驗(yàn)與區(qū)間估計(jì)的關(guān)系參數(shù)的區(qū)間估計(jì)則是找一個(gè)隨機(jī)區(qū)間I,使I包含待估參數(shù)是個(gè)大概率事件參數(shù)假設(shè)檢驗(yàn)的關(guān)鍵是要找一個(gè)確定性的區(qū)域(拒絕域),使得當(dāng)H0成立時(shí),事件是一個(gè)小概率事件一旦抽樣結(jié)果使小概率事件發(fā)生,就否認(rèn)原假設(shè)H0對(duì)此兩類問(wèn)題,都是利用樣本對(duì)參數(shù)作判斷:一個(gè)是由小概率事件否定參數(shù)屬于某范圍,另一個(gè)則是依大概率事件確信某區(qū)域包含參數(shù)的真值.兩者本質(zhì)上殊途同歸,一類問(wèn)題的解決,導(dǎo)致解決另一類問(wèn)題類比方案的形成。為的置信區(qū)間如設(shè)總體已知,給定容量n的樣本則參數(shù)的置信度為樣本均值為的置信區(qū)間為假設(shè)檢驗(yàn)問(wèn)題的拒絕域?yàn)榻邮苡驗(yàn)闀r(shí),接受也就是說(shuō),當(dāng)即在區(qū)間內(nèi),此區(qū)間正是的置信度第二節(jié)正態(tài)總體均值的假設(shè)檢驗(yàn)本節(jié)討論有關(guān)正態(tài)總體的均值與方差的假設(shè)檢驗(yàn)問(wèn)題構(gòu)造適宜的檢驗(yàn)統(tǒng)計(jì)量并確定其概率分布是解決檢驗(yàn)問(wèn)題的關(guān)鍵若檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布(分布,F(xiàn)分布)那么所得到的相應(yīng)檢驗(yàn)法稱為U檢驗(yàn)法(檢驗(yàn)法,F(xiàn)檢驗(yàn)法)一、U檢驗(yàn)法〔方差〕在方差的條件下,對(duì)一個(gè)正態(tài)總體的均值或兩個(gè)正態(tài)總體均值差的假設(shè)檢驗(yàn)常用U檢驗(yàn)法。假設(shè)X1,X2,…,Xn為取自總體X的樣本設(shè)總體已知,給定顯著水平檢驗(yàn)以下不同形式的假設(shè)問(wèn)題:下面我們來(lái)求H03的拒絕域前兩個(gè)為簡(jiǎn)單假設(shè)檢驗(yàn)問(wèn)題,我們已在例8.1及例8.2中求出其拒絕域分別為和其中(1)H03的拒絕域形式為等價(jià)形式為(k待定)若H03成立,則要控制只需令由此得此處所以H03的拒絕域?yàn)椋?)比較兩種假設(shè)檢驗(yàn)問(wèn)題:可以看出盡管兩者原假設(shè)形式不同,實(shí)際意義也不一樣,但對(duì)于相同的顯著水平α,它們的拒絕域是相同的。因此,遇到H03與H13的檢驗(yàn)問(wèn)題,可歸結(jié)為H02與H12來(lái)討論。對(duì)于后面將要討論的有關(guān)正態(tài)總體的參數(shù)假設(shè)檢驗(yàn)問(wèn)題也有類似結(jié)果下面求兩個(gè)正態(tài)總體均值差檢驗(yàn)的拒絕域。設(shè)總體X與Y相互獨(dú)立已知從兩總體中分別取容量為n1、n2的樣本用、分別表示樣本均值給定顯著水平檢驗(yàn)假設(shè)的無(wú)偏估計(jì)分別為顯然,H0的拒絕形式應(yīng)為(k待定)由于若H0真,則統(tǒng)計(jì)量由得拒絕域?yàn)椋?)例1

一種燃料的辛烷等級(jí)服從正態(tài)分布,其平均等級(jí),標(biāo)準(zhǔn)差?,F(xiàn)抽取25桶新油,測(cè)試其等級(jí),算得平均等級(jí)為97.7。假定標(biāo)準(zhǔn)差與原來(lái)一樣,問(wèn)新油的辛烷平均等級(jí)是否比原燃料的辛烷平均等級(jí)偏低?()解按題意需檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量拒絕域(參閱表8-1)查正態(tài)分布表得計(jì)算統(tǒng)計(jì)值執(zhí)行統(tǒng)計(jì)判決故拒絕H0,即認(rèn)為新油的辛烷平均等級(jí)比原燃料辛烷的平均等級(jí)確定偏低。二、T檢驗(yàn)法〔方差未知〕設(shè)總體未知對(duì)顯著水平檢驗(yàn)假設(shè)拒絕域形式(k待定)注意到S2是的無(wú)偏估計(jì),用S代替由于未知,現(xiàn)在不能用來(lái)作為檢驗(yàn)統(tǒng)計(jì)量采用作為檢驗(yàn)統(tǒng)計(jì)量當(dāng)H0真時(shí),由得所以拒絕域?yàn)椋?)類似可給出假設(shè)的拒絕域?yàn)椋?)對(duì)正態(tài)總體關(guān)于的各種形式的假設(shè)檢驗(yàn)的拒絕域列于表8-1。例2一手機(jī)生產(chǎn)廠家在其宣傳廣告中聲稱他們生產(chǎn)的某種品牌的手機(jī)的待機(jī)時(shí)間的平均值至少為71.5小時(shí),一質(zhì)檢部門(mén)檢查了該廠生產(chǎn)的這種品牌的手機(jī)6部,得到的待機(jī)時(shí)間為69,68,72,70,66,75設(shè)手機(jī)的待機(jī)時(shí)間,由這些數(shù)據(jù)能否說(shuō)明其廣告有欺騙消費(fèi)者之嫌疑?()解

問(wèn)題可歸結(jié)為檢驗(yàn)假設(shè)由于方差未知,用T檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量拒絕域計(jì)算統(tǒng)計(jì)值查t分布表,得統(tǒng)計(jì)判決故接受H0,即不能認(rèn)為該廠廣告有欺騙消費(fèi)者之嫌疑下面求兩個(gè)正態(tài)總體均值相等性檢驗(yàn)的拒絕域。設(shè)總體獨(dú)立未知X1,…,Xn1取自總體X樣本方差為其樣本均值為Y1,…,Yn2取自總體Y其樣本均值為,樣本方差為給定顯著水平,檢驗(yàn)假設(shè)拒絕域形式為(k待定)由第六章的結(jié)果知:當(dāng)H0成立時(shí),統(tǒng)計(jì)量由得例3

對(duì)用兩種不同熱處理方法加工的金屬材料做抗拉強(qiáng)度試驗(yàn),得到的試驗(yàn)數(shù)據(jù)如下:方法Ⅰ:31,34,29,26,32,35,38,34,30,29,32,31方法Ⅱ:26,24,28,29,30,29,32,26,31,29,32,28設(shè)兩種熱處理加工的金屬材料的抗拉強(qiáng)度都服從正態(tài)分布,且方差相等。比較兩種方法所得金屬材料的平均抗拉強(qiáng)度有無(wú)顯著差異。()解記兩總體的正態(tài)分布為本題是要檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量為拒絕域?yàn)橛?jì)算統(tǒng)計(jì)值查t分布表,得統(tǒng)計(jì)判決:由于故拒絕H0即認(rèn)為兩種熱處理方法加工的金屬材料的平均抗拉強(qiáng)度有顯著差異。第三節(jié)正態(tài)總體方差的檢驗(yàn)設(shè)總體未知,樣本方差為給定顯著性水平,檢驗(yàn)假設(shè)的無(wú)偏估計(jì)為,若成立,則比值一般來(lái)說(shuō)應(yīng)在1附近擺動(dòng)。若與1的偏差較大,則拒絕所以可取拒絕域形式為:或當(dāng)成立時(shí),統(tǒng)計(jì)量設(shè)為計(jì)算方便,將偏大或偏小的概率看作相等令由此得拒絕域?yàn)椋夯虻谒墓?jié)大樣本檢驗(yàn)法在前面討論的所有假設(shè)檢驗(yàn)問(wèn)題中,我們都有關(guān)統(tǒng)計(jì)量的分布,并由此確定拒絕域。但在許多問(wèn)題中,很難求得檢驗(yàn)統(tǒng)計(jì)量的分布,有時(shí)即使能求出,使用上也很不方便〔如二項(xiàng)分布參數(shù)p的檢驗(yàn)問(wèn)題〕實(shí)際應(yīng)用中往往求助于統(tǒng)計(jì)量的極限分布.假設(shè)抽取大量樣本〔大樣本〕,并用檢驗(yàn)統(tǒng)計(jì)量的極限分布來(lái)近似作為其分布,由此得到的檢驗(yàn)方法稱為大樣本檢驗(yàn)法?,F(xiàn)從每一總體中各取一樣本,其樣本容量、樣本均值、樣本方差分別記為一、兩總體均值差的大樣本檢驗(yàn)

設(shè)有兩個(gè)獨(dú)立總體X,Y,其均值和方差分別為并且n1、n2很大。給顯著水平檢驗(yàn)假設(shè)假設(shè)兩總體均為正態(tài)分布,由的討論知當(dāng)已知時(shí),可用U檢驗(yàn)法來(lái)檢驗(yàn);當(dāng)未知但時(shí),可用T檢驗(yàn)法來(lái)檢驗(yàn)此處總體分布未知,即使總體為正態(tài)分布,因而也不能用T檢驗(yàn)。下面我們用大樣本方法給出此假設(shè)的近似檢驗(yàn)法。未知且與不一定相等由于當(dāng)n1很大時(shí),由中心極限定理知即同理,當(dāng)n2很大時(shí)用代替,用代替由于獨(dú)立所以分別是的很好近似值仍有由此可得拒絕域?yàn)椋╪1,n2很大)(8-9)

設(shè)P〔A〕=p,在n次獨(dú)立試驗(yàn)中事件A發(fā)生的次數(shù)為X那么X~B〔n,p〕給定顯著水平檢驗(yàn)假設(shè)H0:p=p0H1:p>p0〔0<p0<1,p0〕設(shè)那么X1,X2,…,Xn獨(dú)立,且都服從參數(shù)p的〔0-1〕分布,X=X1+X2+…+Xn由中心極限定理,當(dāng)時(shí),當(dāng)H0真,且n很大時(shí),由此可得拒絕為(8-10)第五節(jié)假設(shè)檢驗(yàn)的兩類錯(cuò)誤用概率反證法檢驗(yàn)一個(gè)假設(shè)的推理依據(jù)是小概率原理在一次抽樣中,假設(shè)小概率事件發(fā)生了,那么拒絕原假設(shè);假設(shè)小概率事件沒(méi)有發(fā)生,拒絕原假設(shè)的理由不充分,因而只好接受原假設(shè)。這樣的檢驗(yàn)結(jié)果可能出現(xiàn)以下兩種類型的錯(cuò)誤。一、犯兩類錯(cuò)誤的概率P(拒絕H0|H0真)=P(小概率事件)≤(8-12)第Ⅰ類錯(cuò)誤〔棄真〕當(dāng)原假設(shè)H0真時(shí),抽樣結(jié)果說(shuō)明小概率事件發(fā)生了,按檢驗(yàn)法將拒絕H0,這樣就犯了所謂“棄真”的錯(cuò)誤。給定顯著水平,由于所以棄真概率不超過(guò)顯著水平棄真概率為P〔拒絕H0|H0真〕(8-11)第Ⅱ類錯(cuò)誤〔取偽〕當(dāng)H0假時(shí),抽樣結(jié)果說(shuō)明小概率事件沒(méi)有發(fā)生,按檢驗(yàn)法將接受H0,這樣就犯了所謂“取偽”的錯(cuò)誤。取偽概率為P〔接受H0|H1真〕(8-13)例1

設(shè)總體,未知,求關(guān)于假設(shè)的U檢驗(yàn)法的兩類錯(cuò)誤概率。解檢驗(yàn)統(tǒng)計(jì)量拒絕域棄真概率P(拒絕H0|H0真)=P(|U|≥)=取偽概率P(拒絕H0|H0真)=P(|U|≥|H1真)其中的真值二、兩類錯(cuò)誤概率的控制前面我們處理參數(shù)假設(shè)檢驗(yàn)問(wèn)題時(shí),實(shí)際上只考慮了控制第I類(棄真)錯(cuò)誤概率不超過(guò)顯著水平

。在一些實(shí)際問(wèn)題中,如果錯(cuò)誤地接受了某個(gè)假設(shè)可能造成重大損失或由此帶來(lái)災(zāi)難性的結(jié)果,因而在接受這類假設(shè)時(shí)要特別慎重,也就是要控制第Ⅱ類(取偽)錯(cuò)誤概率。自然希望選擇一個(gè)優(yōu)良的檢驗(yàn)方法,使得出現(xiàn)兩類錯(cuò)誤的概率都很小。定義

若是參數(shù)的某檢驗(yàn)問(wèn)題的一個(gè)檢驗(yàn)法,當(dāng)H0假時(shí),1-表示取偽的概率將兩類錯(cuò)誤概率用統(tǒng)一的函數(shù)表示出來(lái):{拒絕H0}(8-14)稱為檢驗(yàn)法的功效函數(shù)當(dāng)H0真時(shí),表示棄真的概率一個(gè)優(yōu)良的檢驗(yàn)法,應(yīng)使在H0真時(shí)盡可能小,在H0假時(shí)盡可能大。這兩方面的要求是矛盾的,正如在區(qū)間估計(jì)問(wèn)題中,“置信度高”與“估計(jì)精確”是矛盾的。那里,我們采用在保證一定的置信度下使區(qū)間長(zhǎng)度盡可能小的原那么。選擇一種優(yōu)良檢驗(yàn)的策略思想與此類似,即先保證棄真的概率不超過(guò)指定值,再設(shè)法控制取偽概率。為便于說(shuō)明,繼續(xù)例8.9的討論。檢驗(yàn)的成效函數(shù){拒絕H0}其中取偽概率(記為)棄真概率(8-15)由于當(dāng)時(shí)當(dāng)時(shí)當(dāng)時(shí)取最大值當(dāng)與的偏差越大,取偽的概率越?。淮藭r(shí),越小,越大,見(jiàn)圖8-1當(dāng)與非常接受時(shí),取偽的概率幾乎等于其含義為:由此可知,當(dāng)與n都給定時(shí)不可能同時(shí)控制兩類錯(cuò)誤概率都很小下面先控制棄真的概率為再來(lái)考慮如何減小取偽概率由于要控制取為偽概率(很小)只要使足夠大有兩種方法可使增大〔1〕減小試驗(yàn)誤差;〔2〕取樣本數(shù)目n很大。在實(shí)際中,試驗(yàn)誤差不可能無(wú)限小,因而一般采用加大樣本容量n的方法來(lái)控制取偽概率,但這是以消耗大量人力、物力、財(cái)力為代價(jià)的。在實(shí)際應(yīng)用中,要根據(jù)“棄真”或“取偽”所造成的有害程度來(lái)確定、的值。第六節(jié)非參數(shù)假設(shè)檢驗(yàn)前面我們討論了參數(shù)假設(shè)檢驗(yàn)問(wèn)題,所檢驗(yàn)的對(duì)象是總體分布中的未知參數(shù),而總體分布函數(shù)的函數(shù)形式是的.假設(shè)總體分布未知,對(duì)總體分布或有關(guān)參數(shù)所作的檢驗(yàn)稱為非參數(shù)假設(shè)檢驗(yàn)本節(jié)將討論幾種重要的非參數(shù)檢驗(yàn)問(wèn)題一、分布擬合檢驗(yàn)問(wèn)題對(duì)某對(duì)象〔產(chǎn)品、元件,農(nóng)作物等〕的某特性指標(biāo)進(jìn)行測(cè)試,獲得一大批實(shí)驗(yàn)數(shù)據(jù),如何利用這些數(shù)據(jù)〔樣本〕確定此指標(biāo)〔總體〕的概率分布要解決此問(wèn)題,一般需要做以下兩方面的工作用極大似然估計(jì)法求出的估計(jì)值第一步擬合總體分布形式如果事先沒(méi)有任何關(guān)于總體分布的經(jīng)驗(yàn)或依據(jù),對(duì)連續(xù)型總體,一般先把抽樣所獲得的數(shù)據(jù)進(jìn)行整理,然后作出樣本分組頻數(shù)分布直方圖.由此確定總體分布函數(shù)形式其中是未知參數(shù)從而猜測(cè)總體的分布函數(shù)為第二步擬合好壞的檢驗(yàn)設(shè)總體的真實(shí)分布為F〔x〕,給定顯著水平及樣本觀測(cè)值x1,x2,…xn,檢驗(yàn)假設(shè)1.樣本頻率分布直方圖第六章已經(jīng)介紹了直方圖及其作法,為這里的討論方便起見(jiàn),對(duì)此再作一些介紹設(shè)總體X為連續(xù)型,下面利用樣本數(shù)值來(lái)擬合總體分布密度函數(shù)f(x)根據(jù)樣本值的情況,將其分為l組,各組范圍為其中記mi=落在[ai-1,ai)內(nèi)的樣本數(shù),那么事件Ai發(fā)生的頻率為Ai發(fā)生的概率為作表此表稱為樣本分組頻數(shù)分布表在每個(gè)區(qū)間[ai-1,ai)上,以此區(qū)間為底,以為高作一矩形〔i=1,2,…,l〕,這樣的圖形稱為樣本組頻率分布直力圖,見(jiàn)圖8.2因而每個(gè)小區(qū)間上的小矩形的面積接近于概率密度曲線之下該區(qū)間之上的曲邊梯形的面積一般來(lái)說(shuō),n越大且分組越細(xì),那么直方圖的外廓曲線越接近于總體的概率密度曲線對(duì)離散型總體,雖然不能畫(huà)樣本分組頻率直方圖,但仍可給出樣本分組頻數(shù)分布表第i個(gè)小區(qū)上矩形的面積為,由大數(shù)定律可知,當(dāng)n很大時(shí),頻率接近于概率2.?dāng)M合優(yōu)度檢驗(yàn)要檢驗(yàn)假設(shè)H0,必須利用樣本建立用以衡量F〔x〕與F0〔x〕差異的統(tǒng)計(jì)量這種統(tǒng)計(jì)量有多種選擇,下面介紹皮爾遜〔Person〕檢驗(yàn)法在H0為真的前提下,事件Ai的概率為npi稱為事件Ai的理論頻數(shù),作表此表稱為分組理論頻數(shù)分布表它與樣本分組頻數(shù)分布表的差異反映了F(x)與F0(x)的差異用統(tǒng)計(jì)量(8-16)來(lái)衡量皮爾遜證明了以下定理顯然,H0的拒絕域形式為(k待定)若n很大(),則當(dāng)H0成立時(shí),定理于是得到H0的拒絕域?yàn)槠栠d檢驗(yàn)法是基于上述定理得到的(8-17)在使用時(shí)必須注意n要足夠大,以及每個(gè)否那么應(yīng)適當(dāng)合并組,以滿足這一要求。例1

自1965年1月1日至1971年2月9日共2231天中,全世界記錄到震級(jí)4級(jí)及以上的地震共計(jì)162次,統(tǒng)計(jì)如下:試檢驗(yàn)相繼兩次地震間隔的天數(shù)服從指數(shù)分布。()86681017263150出現(xiàn)的頻數(shù)震間隔天地≥4035~3930~3425~2920~2415~1910~145~90~4相繼兩次地由于總體為連續(xù)型,我們將X的可能取值的區(qū)間分為9個(gè)互不重疊的小區(qū)間解按題意需檢驗(yàn)假設(shè)由于未知,先用極大似然估計(jì)求得的估計(jì)為取若H0真,則計(jì)算結(jié)果列于表8.2有些組的應(yīng)適當(dāng)合并組,使每組均有如第四列花括號(hào)所示。并組后的組數(shù)l=8。

0.56330.04610.78080.05688A9:39.5≤x<0.2486A8:34.5≤x<39.50.00690.20045.79960.03586A7:29.5≤x<34.50.0126-0.32688.32680.05148A6:24.5≤x<29.50.3248-1.971811.97180.073910A5:19.5≤x<24.50.0024-0.204417.20440.106217A4:14.5≤x<19.50.06441.262624.73740.152726A3:9.5≤x<14.50.5884-4.575235.57520.219631A2:4.5≤x<9.50.51754.834445.16560.278850A1:0≤x<4.5(mi-npi)2/npimi-npinpipimiAi表8-2例1的檢驗(yàn)計(jì)算表H0的拒絕域?yàn)槠渲杏捎诠试谒较陆邮蹾0,認(rèn)為總體服從指數(shù)分布。號(hào)碼0123456789出現(xiàn)的頻數(shù)74928379807377757691例8.10一臺(tái)搖獎(jiǎng)機(jī)是一個(gè)圓球形形容器,內(nèi)有10個(gè)質(zhì)地均勻的小球,分別標(biāo)有0,1,2,…,9的數(shù)碼。轉(zhuǎn)動(dòng)容量讓小球隨機(jī)分布,然后從中掉出一球,其號(hào)碼為X。如果搖獎(jiǎng)機(jī)合格,那么X的分布律應(yīng)為現(xiàn)用這臺(tái)搖獎(jiǎng)機(jī)做了800次試驗(yàn),得到如下數(shù)據(jù):試用這些數(shù)據(jù)檢驗(yàn)該搖獎(jiǎng)機(jī)是否合格?()解由題意要檢驗(yàn)假設(shè)將數(shù)據(jù)按號(hào)碼分為10組,分組為記當(dāng)H0為真時(shí)計(jì)算列于表8.3中表8-3例2的檢驗(yàn)計(jì)算表4.1250.512511800.171A90.2-4800.176A80.3125-5800.175A70.1125-3800.177A60.6125-7800.173A500800.180A40.0125-1800.179A30.11253800.183A21.812800.192A10.45-6800.174A0mi-npinpipimiAiH0的拒絕域其中由于故接受H0,即認(rèn)為搖獎(jiǎng)機(jī)是合格的。3.偏度、峰度檢驗(yàn)上面介紹的檢驗(yàn)法雖然是檢驗(yàn)總體分布的較一般方法,但用它來(lái)檢驗(yàn)總體的正態(tài)性時(shí),犯第Ⅱ類錯(cuò)誤的概率往往較大。由于正態(tài)分布廣泛地存在于客體世界,因此,當(dāng)研究一個(gè)連續(xù)型總體時(shí),人們往往先考察它是否服從正態(tài)分布。為此,統(tǒng)計(jì)學(xué)家們對(duì)檢驗(yàn)正態(tài)總體的種種方法進(jìn)行了比較,認(rèn)為其中以“偏度、峰度檢驗(yàn)法”及“夏皮羅-威爾克法”較為有效。在這里我們僅介紹偏度、峰度檢驗(yàn)法這種檢驗(yàn)法的理論依據(jù)是正態(tài)分布曲線是對(duì)稱的,且陡緩適當(dāng)為此,引入兩個(gè)量,一個(gè)表示曲線的偏斜度,另一個(gè)表示密度曲線的陡緩度。

設(shè)隨機(jī)變量X的k階中心矩為分別稱為X的偏度和峰度從總體X中取一樣本,記Bk為樣本的k階中心矩則、的矩法估計(jì)量分別為并分別稱g1,g2為樣本偏度和樣本峰度若總體X服從正態(tài)分布,則且當(dāng)樣本容量n充分大時(shí),近似地有而g2與的偏離不應(yīng)太大因此,當(dāng)n充分大時(shí),g1與的偏離不應(yīng)太大故假設(shè)H0:X服從正態(tài)分布的拒絕域形式應(yīng)為或其中k1,k2由下兩式確定當(dāng)n充分大時(shí)由此得到了H0的顯著水平為的拒絕域。二、兩總體相等性檢驗(yàn)設(shè)兩總體X,Y的分布函數(shù)分別為F1(x)與F2(x),如何檢驗(yàn)F1(x)與F2(x)是否相同呢?在總體分布類型時(shí),此問(wèn)題可以歸納為兩總體參數(shù)〔如數(shù)字特征等〕是否相等這種參數(shù)假設(shè)檢驗(yàn)問(wèn)題。在總體分布類型完全未知時(shí),我們只能采用非參數(shù)檢驗(yàn)法。下面介紹兩種簡(jiǎn)單且實(shí)用的非參數(shù)檢驗(yàn)法:符號(hào)檢驗(yàn)法與秩和檢驗(yàn)法。1.符號(hào)檢驗(yàn)法從總體X,Y中分別取容量均為N的樣本X1,X2,…,XN和Y1,Y2,…,YN檢驗(yàn)假設(shè)H0:F1(x)=F2(y)H1:F1(x)≠F2(y)將數(shù)據(jù)配對(duì)排好,列成表。當(dāng)xi>yi時(shí),取“+”號(hào);當(dāng)xi<yi時(shí),取“-”號(hào);當(dāng)xi=yi時(shí),取“0”,并用n+和n-分別表示“+”號(hào)與“-”號(hào)的個(gè)數(shù)。假設(shè)H0成立,兩總體分布相同,n+與n-應(yīng)相差不大。由于試驗(yàn)誤差,它們會(huì)有一定的差異但差異不宜過(guò)大如假設(shè)過(guò)大,就認(rèn)為不僅僅有實(shí)驗(yàn)誤差,而認(rèn)為F1(x)與F2(x)有差異。記n=n++n-,選統(tǒng)計(jì)量對(duì)于n和給定查符號(hào)檢驗(yàn)表(見(jiàn)附表6)可得相應(yīng)的當(dāng)時(shí),則拒絕H0認(rèn)為兩總體分布有顯著差異例3研究車(chē)間播放音樂(lè)對(duì)工人生產(chǎn)效率的影響。該車(chē)間有10名工廠,播放音樂(lè)前與播放音樂(lè)后各30天平均日產(chǎn)量〔件〕如表8-4所示,由此能否說(shuō)明音樂(lè)有助于提高生產(chǎn)率?〔〕表8-4播放音樂(lè)前后平均日產(chǎn)量〔件〕不放音樂(lè)x90809284888782857079播放音樂(lè)y99859783819472858289符號(hào)———++—+0——

解要檢驗(yàn)播放音樂(lè)對(duì)工人生產(chǎn)效率有無(wú)影響,就是檢驗(yàn)假設(shè)由上表可知n+=3n-=6n=9S=3查附表6,得S0.05〔9〕=1由于S>S0.05〔9〕故接受H0即認(rèn)為播放音樂(lè)對(duì)生產(chǎn)率沒(méi)有顯著影響2.秩和檢驗(yàn)從兩總體X,Y中分別取容量為n1,n2的樣本檢驗(yàn)假設(shè)將兩總體的n1+n2觀測(cè)值放在一起,按從小到大的順序排列。假設(shè)H0成立,那么總體X,Y同分布,兩總體的觀測(cè)值應(yīng)較均勻地分布在此排列中。假設(shè)分布不均勻,那么認(rèn)為H0不成立如何構(gòu)造統(tǒng)計(jì)量來(lái)描述這種均勻性呢?每個(gè)觀測(cè)值在此排列中的序號(hào)稱為這個(gè)觀測(cè)值的秩假設(shè)有幾個(gè)觀測(cè)值相同,那么每個(gè)觀測(cè)值的秩取為這幾個(gè)數(shù)的序號(hào)的平均值.求出每個(gè)觀測(cè)值的秩.將屬于總體X的樣本觀測(cè)值的秩相加,其和記為R1,稱為總體X的樣本秩和.同理,將其余觀測(cè)值的秩相加得總體Y的樣本秩和R2.顯然,R1,R2為離散型隨機(jī)變量,且有設(shè)取T=R1為統(tǒng)計(jì)量假設(shè)H0成立,秩和R1一般來(lái)說(shuō)不應(yīng)取太靠近上述不等式兩端的值.因而,當(dāng)R1的觀測(cè)值過(guò)大或過(guò)小時(shí),我們就拒絕H0拒絕域?yàn)槠渲蠺1,T2可由附表7查得或Ⅰ2.363.147.523.482.765.436.547.41Ⅱ4.384.256.543.287.216.54試問(wèn)兩總體是否同分布?(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論