社會經(jīng)濟統(tǒng)計學(xué)(8章)_第1頁
社會經(jīng)濟統(tǒng)計學(xué)(8章)_第2頁
社會經(jīng)濟統(tǒng)計學(xué)(8章)_第3頁
社會經(jīng)濟統(tǒng)計學(xué)(8章)_第4頁
社會經(jīng)濟統(tǒng)計學(xué)(8章)_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一節(jié)假設(shè)檢驗的基本思想第二節(jié)總體均值的假設(shè)檢驗第三節(jié)總體成數(shù)的假設(shè)檢驗第四節(jié)總體方差的假設(shè)檢驗(自學(xué))第八章假設(shè)檢驗第三篇統(tǒng)計分析方法第八章第一節(jié)假設(shè)檢驗的基本思想學(xué)習(xí)要點假設(shè)檢驗的基本概念假設(shè)檢驗的基本程序參數(shù)假設(shè)檢驗的相關(guān)概念一、假設(shè)檢驗基本問題

什么是假設(shè)?(hypothesis)第一節(jié)假設(shè)檢驗的基本思想第八章

對總體參數(shù)的的數(shù)值所作的一種陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述我認為該地區(qū)新生嬰兒的平均體重為3190克!一、假設(shè)檢驗基本問題什么是假設(shè)檢驗?

事先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立有參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗采用邏輯上的反證法,依據(jù)統(tǒng)計上的小概率原理第一節(jié)假設(shè)檢驗的基本思想第八章假設(shè)檢驗,是另一大類統(tǒng)計推斷問題。它是先假設(shè)總體具有某種特征(例如總體的參數(shù)為多少),然后再通過對樣本的加工,即構(gòu)造統(tǒng)計量,推斷出假設(shè)的結(jié)論是否合理。參數(shù)估計和假設(shè)檢驗不是簡單的“計算”和“驗算”的區(qū)別,假設(shè)檢驗有它獨特的統(tǒng)計思想,也就是說引入假設(shè)檢驗是完全必要的。我們來考慮下面的例子。

第八章第一節(jié)假設(shè)檢驗的基本思想教材P248

某廠家向一百貨商店長期供應(yīng)某種貨物,雙方根據(jù)廠家的傳統(tǒng)生產(chǎn)水平,定出質(zhì)量標(biāo)準(zhǔn),即若次品率超過3%,則百貨商店拒收該批貨物。今有一批貨物,隨機抽43件檢驗,發(fā)現(xiàn)有次品2件,問應(yīng)如何處理這批貨物?

如果雙方商定用點估計方法作為驗收方法,顯然2/43>3%,這批貨物是要被拒收的。但是廠家有理由反對用這種方法驗收。他們認為,由于抽樣是隨機的,在這次抽樣中,次品的頻率超過3%,不等于說這批產(chǎn)品的次品率(概率)超過了3%.因此需要用別的方法。如果百貨商店也希望在維護自己利益的前提下,不輕易地失去一個有信譽的貨源,也會同意采用別的更合理的方法。事實上,對于這類問題,通常就是采用假設(shè)檢驗的方法。具體來說就是先假設(shè)次品率,然后從抽樣的結(jié)果來說明這一假設(shè)是否合理。注意,這里用的是“合理”一詞,而不是“正確”。例

某研究所推出一種感冒特效新藥,為證明其療效,選擇200名患者為志愿者。將他們均分為兩組,分別不服藥或服藥,觀察三日后痊愈的情況,得出下列數(shù)據(jù)。是否痊愈服何種藥痊愈者未痊愈者合計未服藥者4852100服藥者5644100合計10496200例問新藥是否確有明顯療效?

這個問題就不存在估計什么的問題。從數(shù)據(jù)來看,新藥似乎有一定療效,但效果不明顯,服藥者在這次試驗中的情況比未服藥者好,完全可能是隨機因素造成的。對于新藥上市這樣關(guān)系到千萬人健康的事,一定要采取慎重的態(tài)度。這就需要用一種統(tǒng)計方法來檢驗藥效,假設(shè)檢驗就是在這種場合下的常用手段。具體來說,我們先不輕易地相信新藥的作用,因此可以提出假設(shè)“新藥無效”,除非抽樣結(jié)果顯著地說明這假設(shè)不合理,否則,將不能認為新藥有明顯的療效。這種提出假設(shè)然后做出否定或不否定的判斷通常稱為顯著性檢驗(Significancetest)。第一節(jié)假設(shè)檢驗的基本思想第八章二、假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)

=50樣本均值抽樣分布...如果這是總體的真實均值m

=50H0這個值不像我們應(yīng)該得到的樣本均值...20第一節(jié)假設(shè)檢驗的基本思想第八章總體三、假設(shè)檢驗的過程抽取隨機樣本均值

X=20我認為人口的平均年齡是50歲提出假設(shè)拒絕假設(shè)!

別無選擇.作出決策假設(shè)檢驗的步驟提出假設(shè)確定適當(dāng)?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平計算檢驗統(tǒng)計量的值作出統(tǒng)計決策第一節(jié)假設(shè)檢驗的基本思想第八章教材P249-251

某商店為搞促銷,對購買一定數(shù)額商品的顧客給予一次摸球中獎的機會,規(guī)定從裝有紅、綠兩色球各10個的暗箱中連續(xù)摸10次(摸后放回),若10次都是摸得綠球,則中大獎。某人按規(guī)則去摸10次,皆為綠球,商店認定此人作弊,拒付大獎,此人不服,最后引出官司。我們在此并不關(guān)心此人是否真正作弊,也不關(guān)心官司的最后結(jié)果,但從統(tǒng)計的觀點看,商店的懷疑是有道理的。第八章第一節(jié)假設(shè)檢驗的基本思想如果此人摸球完全是隨機的,則要正好在10次摸球中均摸到綠球的概率是一個很小的數(shù),統(tǒng)計的基本原理是在一次試驗中所發(fā)生的事件不應(yīng)該是小概率事件?,F(xiàn)在既然這樣小概率的事件發(fā)生了,就應(yīng)當(dāng)推測出此人摸球不是隨機的,換句話說有作弊之嫌。上述的這一推斷,實際上就是假設(shè)檢驗的全部過程。它一般包含了這么幾步:提出假設(shè),抽樣,并對樣本進行加工(構(gòu)造統(tǒng)計量),定出一個合理性界限,得出假設(shè)是否合理的結(jié)論。這里要說明一點的是所謂“小概率事件”。究竟多大概率為小概率事件?在一個問題中,通常是指定一個正數(shù),認為概率不超過的事件是在一次試驗中不會發(fā)生的事件,這個稱為顯著性水平(Levelofsignificance)。對于實際問題應(yīng)根據(jù)不同的需要和側(cè)重,指定不同的顯著性水平。通??蛇x取α=0.01,0.05,0.10等。

下面我們用假設(shè)檢驗的語言來模擬商店的推斷:

10

提出假設(shè):

H0:此人未作弊;H1:此人作弊。這里H0稱為原假設(shè)(Nullhypothesis),H1稱為備選假設(shè)(Alternativehypothesis)或?qū)α⒓僭O(shè)(Oppositehypothesis),備選假設(shè)也可以不寫。

20

構(gòu)造統(tǒng)計量,并由樣本算出其具體值:統(tǒng)計量取為10次模球中摸中綠球的個數(shù).由抽樣結(jié)果算出.30

求出在H0下,統(tǒng)計量N的分布,構(gòu)造對H0不利的小概率事件:易知,在H0下,即如果此人是完全隨機地摸球的話,統(tǒng)計量N服從二項分布B(10,1/2).其分布數(shù)列為,

那么此人摸到的綠球數(shù)應(yīng)該在平均數(shù)5個附近,所以對不利的小概率事件是:“綠球數(shù)大于某個較大的數(shù),或小于某個較小的數(shù)。”在此問題中,小于某個較小的數(shù)不成立,即此人作弊的話,不可能故意少摸綠球,因此只需考慮事件“大于某個較大的數(shù)”,這個數(shù)常稱為臨界值。

40

給定顯著性水平,確定臨界值:即取一數(shù)使得P{N>}=如取=0.01,由分布數(shù)列算出:

對于這種離散型概率分布,不一定能取到,取最接近的n,使當(dāng)H0成立時,,因此.該小概率事件是:

50

得出結(jié)論:

已算得,即發(fā)生了,而被視為對不利的小概率事件,它在一次試驗中是不應(yīng)該發(fā)生的,現(xiàn)在居然發(fā)生了,只能認為是不成立的,即:“此人作弊”成立。

四、參數(shù)假設(shè)檢驗的有關(guān)概念

1、原假設(shè)與備擇假設(shè)

原假設(shè)(記作H0):受檢驗的基本假設(shè),即從原總體沒有變化出發(fā),這樣就有一個總體參數(shù),而且它的分布是巳知的。

備擇假設(shè)(記作H1):是原假設(shè)的對立假設(shè)。▲原假設(shè)是決策者有意推翻的假設(shè),備擇假設(shè)是決策者試圖從樣本信息中找到“征兆”以支持其真實的一種假設(shè)

第八章第一節(jié)假設(shè)檢驗的基本思想原假設(shè)(nullhypothesis)1.待檢驗的假設(shè),又稱“0假設(shè)”2.研究者想收集證據(jù)予以反對的假設(shè)3. 總是有等號,

或4. 表示為H0H0:

某一數(shù)值指定為=號,≦或≧例如,H0:

3190(克)為什么叫0假設(shè)?

2、顯著性水平

假設(shè)檢驗依據(jù)“小概率事件在一次抽樣試驗中幾乎是不可能發(fā)生的”這一原理,這個小概率稱為顯著性水平。

樣本統(tǒng)計量與其總體參數(shù)之間存在隨機誤差,是不可避免的,但抽樣誤差是有一定規(guī)律的,它滿足于一定的概率分布。這種誤差在一定范圍內(nèi)出現(xiàn)的可能性很大,而在這個范圍以外出現(xiàn)的可能性很小如果來自樣本的信息打破了這個規(guī)律,差異過大,就不能把這種差異視為隨機誤差了。第八章第一節(jié)假設(shè)檢驗的基本思想

小概率在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)小概率由研究者事先確定什么是小概率?抽樣分布H0值臨界值臨界值a/2a/2樣本統(tǒng)計量拒絕域拒絕域1-置信水平

3、Z檢驗與t檢驗

Z檢驗:正態(tài)分布檢驗。檢驗適應(yīng)在方差已知的情況下,對期望的檢驗。

易知,在H0

成立的條件下;Z服從正態(tài)分布,因此根據(jù)正態(tài)分布的特點,在H0成立的條件下,Z的值應(yīng)以較大的概率出現(xiàn)在0的附近,因此對H0不利的小概率事件是:第八章第一節(jié)假設(shè)檢驗的基本思想檢驗統(tǒng)計量

t檢驗:t分布檢驗。當(dāng)總體方差未知,用樣本方差代替時,統(tǒng)計量第八章第一節(jié)假設(shè)檢驗的基本思想服從t分布。對H0不利的小概率事件是:

4、雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗:當(dāng)我們所關(guān)心的問題是要檢驗樣本統(tǒng)計量與總體參數(shù)有沒有顯著差異,而不問差異的方向,采用雙側(cè)檢驗。第八章第一節(jié)假設(shè)檢驗的基本思想例如:某種零件的尺寸,要求其平均長度為10cm,大于或小于10cm均屬于不合格我們想要證明(檢驗)大于或小于這兩種可能性中的任何一種是否成立建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:10H1:10

=

雙側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平樣本值雙側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值臨界值

a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平樣本值雙側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平樣本值

單側(cè)檢驗:當(dāng)我們關(guān)心的問題是檢驗樣本統(tǒng)計量與總體參數(shù)有沒有顯著差的差異,而且追究是否發(fā)生預(yù)先指定方向的差異,應(yīng)采用單側(cè)檢驗。第八章第一節(jié)假設(shè)檢驗的基本思想

例如:

一項研究表明,采用新技術(shù)生產(chǎn)后,將會使產(chǎn)品的使用壽命明顯延長到1500小時以上。檢驗這一結(jié)論是否成立研究者總是想證明自己的研究結(jié)論(壽命延長)是正確的備擇假設(shè)的方向為“>”(壽命延長)建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:1500H1:1500

單側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平左側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平樣本值左側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平樣本值右側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平樣本值右側(cè)檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量抽樣分布1-置信水平拒絕域樣本值

5、檢驗中的兩類錯誤(Twotypeserroroftests)

檢驗可能犯錯誤,所謂犯錯誤就是檢驗的結(jié)論與實際情況不符,這里有兩種情況:

α錯誤:是實際情況是成立,而檢驗的結(jié)果表明不成立,即拒絕了,這時稱該檢驗犯了第一類錯誤(typeIerror)或“棄真”的錯誤。

Β錯誤:是實際情況是不成立,而檢驗的結(jié)果表明成立,即接受了,這時稱該檢驗犯了第二類錯誤(typeIIerror),或稱“取偽”的錯誤。

H0:無罪假設(shè)檢驗中的兩類錯誤(決策結(jié)果)陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假接受H0正確決策(1–a)第二類錯誤(b)拒絕H0第一類錯誤(a)正確決策(1-b)假設(shè)檢驗就好像一場審判過程統(tǒng)計檢驗過程我們來研究一下,對于一個檢驗,這兩類錯誤有大:

我們知道,一個檢驗本質(zhì)上就是一個否定域V,所謂拒絕H0,就是通過構(gòu)造V的統(tǒng)計量計算,得出樣本點落在V內(nèi)的結(jié)論。所以,第一類錯誤的概率就是在H0成立的條件下V的概率.一般地當(dāng)時.當(dāng)形如或時,由此可知,顯著性水平α也就是檢驗犯第一類錯誤的概率。同樣,在成立的情況下接受H0,即是指樣本點落在接受域中,因此第二類錯誤的概率是H1錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小設(shè)計一個檢驗,當(dāng)然最理想的是犯兩類錯誤的概率都盡可能地小,在樣本容量一定的情況下,要使兩者都達到最小是不可能的。考慮到H0的提出既然是慎重的,否定它也要比較慎重。因此,在設(shè)計檢驗時,一般采取控制第一類錯誤的概率在某一顯著性水平α內(nèi),對于固定的n,使第二類錯誤盡可能地小,并以此來建立評價檢驗是否最優(yōu)的標(biāo)準(zhǔn)。總體參數(shù)檢驗(ParameterTestofNormalCollectivity)

第八章第二節(jié)總體均值的假設(shè)檢驗Z檢驗(單側(cè)和雙側(cè))

t檢驗(單側(cè)和雙側(cè))Z檢驗(單側(cè)和雙側(cè))

2檢驗(自學(xué))(單側(cè)和雙側(cè))教材P261-264均值一個總體比例方差z檢驗大是z檢驗

(檢驗統(tǒng)計量)正態(tài)總體是否已知?用樣本標(biāo)準(zhǔn)差S代替

t檢驗小樣本容量n否第二節(jié)總體均值的假設(shè)檢驗第八章教材P251-256總體均值的檢驗

(2

已知或2未知大樣本)假定條件總體服從正態(tài)分布若不服從正態(tài)分布,可用正態(tài)分布來近似(n30)使用Z-統(tǒng)計量已知:未知:2

2

(1)2

已知均值的檢驗

(大樣本例題分析)【例】某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為0.025。今換一種新機床進行加工,抽取n=200個零件進行檢驗,得到的橢圓度為0.076mm。試問新機床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)雙側(cè)檢驗=

(例題分析)H0:=0.081H1:

0.081=0.05n

=200臨界值(Z):檢驗統(tǒng)計量:Z01.96-1.96.025拒絕H0拒絕H0.025決策:結(jié)論:

=0.05的水平上拒絕H0有證據(jù)表明新機床加工的零件的橢圓度與以前有顯著差異(1)2

已知均值的檢驗

(小樣本例題分析)【例】根據(jù)過去大量資料,某廠生產(chǎn)的燈泡的使用壽命服從正態(tài)分布N~(1020,1002)。現(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?(=0.05)單側(cè)檢驗

(小樣本例題分析)H0:

1020H1:>1020=0.05n

=16臨界值(Z):檢驗統(tǒng)計量:在

=0.05的水平上拒絕H0有證據(jù)表明這批燈泡的使用壽命有顯著提高決策:結(jié)論:Z0拒絕域0.051.645(2)2

未知均值的檢驗

(大樣本例題分析)【例】某電子元件批量生產(chǎn)的質(zhì)量標(biāo)準(zhǔn)為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產(chǎn)的元件質(zhì)量大大超過規(guī)定標(biāo)準(zhǔn)。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標(biāo)準(zhǔn)差300小時。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)?(=0.05)單側(cè)檢驗

(例題分析)H0:1200H1:>1200=0.05n=100臨界值(Z):檢驗統(tǒng)計量:在

=0.05的水平上不拒絕H0不能認為該廠生產(chǎn)的元件壽命顯著地高于1200小時決策:結(jié)論:Z0拒絕域0.051.645(2)2

未知均值的檢驗

(小樣本)假定條件總體為正態(tài)分布-2未知,且小樣本使用t

統(tǒng)計量(2)2

未知均值的檢驗

(小樣本例題分析)【例】某機器制造出的肥皂厚度為5cm,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標(biāo)準(zhǔn)差為0.3cm,試以0.05的顯著性水平檢驗機器性能良好的假設(shè)。雙側(cè)檢驗

(例題分析)H0:=5H1:

5=0.05df=10-1=9臨界值(t):檢驗統(tǒng)計量:在

=0.05的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論