第七章 兩個(gè)總體的假設(shè)檢驗(yàn)_第1頁
第七章 兩個(gè)總體的假設(shè)檢驗(yàn)_第2頁
第七章 兩個(gè)總體的假設(shè)檢驗(yàn)_第3頁
第七章 兩個(gè)總體的假設(shè)檢驗(yàn)_第4頁
第七章 兩個(gè)總體的假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章

兩總體的假設(shè)檢驗(yàn)第一節(jié)均值差異的假設(shè)檢驗(yàn)第二節(jié)比例差異的假設(shè)檢驗(yàn)第三節(jié)均值差異比較的SPSS應(yīng)用兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn)兩個(gè)總體的檢驗(yàn)Z

檢驗(yàn)(大樣本)t

檢驗(yàn)(小樣本)t

檢驗(yàn)(小樣本)Z檢驗(yàn)F

檢驗(yàn)獨(dú)立樣本配對(duì)樣本均值比例方差兩個(gè)獨(dú)立樣本之差的抽樣分布m1s1總體1s2

m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算X1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算X2計(jì)算每一對(duì)樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布第一節(jié)均值差異的假設(shè)檢驗(yàn)假設(shè):H0:兩總體不存在差異,即u1=u2,H1:兩總體存在差異,即u1不等于u2。要求:隨機(jī)抽樣;每個(gè)總體都是正態(tài)分布;兩個(gè)總體的標(biāo)準(zhǔn)差相等。一、兩個(gè)獨(dú)立樣本均值之差的檢驗(yàn)(一)兩個(gè)總體均值之差的Z檢驗(yàn)(12、22

已知)(二)兩個(gè)總體均值之差的Z檢驗(yàn)

(12、22

未知,大樣本)(三)兩個(gè)總體均值之差的t檢驗(yàn)(12、22未知,小樣本)其中:(一)兩個(gè)總體均值之差的Z檢驗(yàn)

(12、22

已知)1、假定條件兩個(gè)樣本是獨(dú)立的隨機(jī)樣本兩個(gè)總體都是正態(tài)分布若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230;n1+n2100)2、原假設(shè):H0:1-

2

=0;備擇假設(shè):H1:1-

2

0檢驗(yàn)統(tǒng)計(jì)量為兩個(gè)總體均值之差的Z檢驗(yàn)(例子)

例1:有兩種方法可用于制造某種以抗拉強(qiáng)度為重要特征的產(chǎn)品。根據(jù)以往的資料得知,第一種方法生產(chǎn)出的產(chǎn)品其抗拉強(qiáng)度的標(biāo)準(zhǔn)差為8公斤,第二種方法的標(biāo)準(zhǔn)差為10公斤。從兩種方法生產(chǎn)的產(chǎn)品中各抽取一個(gè)隨機(jī)樣本,樣本容量分別為n1=32,n2=40,測(cè)得x2=50公斤,x1=40公斤。問這兩種方法生產(chǎn)的產(chǎn)品平均抗拉強(qiáng)度是否有顯著差別?(=0.05)兩個(gè)總體均值之差的Z檢驗(yàn)

(計(jì)算結(jié)果)H0:

1-2=0H1:

1-2

0=

0.05n1=32,n2

=

40臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

拒絕H0有證據(jù)表明兩種方法生產(chǎn)的產(chǎn)品其抗拉強(qiáng)度有顯著差異Z01.96-1.96.025拒絕H0拒絕H0.025例:某大學(xué)欲比較大學(xué)畢業(yè)后留校工作與分配到其他崗位的人工資水平的差別,因?yàn)楣べY還與工齡等其他因素有關(guān),因此抽選大學(xué)畢業(yè)后滿10年在校工作的教師50人,另外抽選大學(xué)畢業(yè)后滿10年在機(jī)關(guān)、企業(yè)工作的人員進(jìn)行比較,取得的數(shù)據(jù)如下。試比較大學(xué)畢業(yè)后留校當(dāng)教師與分配在機(jī)關(guān)企業(yè)等工作人員的工資水平是否有差異?(α=.05)大學(xué)教師機(jī)關(guān)、企業(yè)工作人員兩個(gè)總體均值之差的Z檢驗(yàn)(12、22

未知,大樣本)練習(xí):1、為了比較已婚婦女對(duì)婚后生活得態(tài)度是否因?yàn)榛辇g而有所區(qū)別,將已婚婦女按照對(duì)婚后生活得態(tài)度分為“不滿意”和“滿意”兩組,從“不滿意”組中隨機(jī)抽取500名婦女,平均婚齡為9.2年,標(biāo)準(zhǔn)差為2.8年;從“滿意”組隨機(jī)抽取600名婦女,均值為8.5年,標(biāo)準(zhǔn)差為2.3年,試問在顯著性水平為0.05情況下,兩組是否存在顯著差異?練習(xí)題2:為了比較就近上學(xué)和因家遠(yuǎn)而乘車上學(xué)的小學(xué)生學(xué)習(xí)成績(jī)是否有差別。某校從就近上學(xué)的小學(xué)生中隨機(jī)抽查800名,平均學(xué)習(xí)總成績(jī)?yōu)?20分,標(biāo)準(zhǔn)差為40分;從乘車上學(xué)的小學(xué)生中抽查1000名,其平均總成績(jī)?yōu)?05分,標(biāo)準(zhǔn)差為50分。問二者學(xué)習(xí)成績(jī)是否有差別(0.05)?如果有差別那種方式更好些?(二)兩個(gè)總體均值之差的t檢驗(yàn)

(12、22未知,小樣本)1、檢驗(yàn)具有等方差的兩個(gè)總體的均值2、假定條件兩個(gè)樣本是獨(dú)立的隨機(jī)樣本兩個(gè)總體都是正態(tài)分布兩個(gè)總體方差未知但相等12=223、檢驗(yàn)統(tǒng)計(jì)量其中:兩個(gè)總體均值之差的t

檢驗(yàn)(例子)例:一個(gè)車間研究用兩種不同的工藝組裝某種產(chǎn)品所用的時(shí)間是否相同。讓一個(gè)組的10名工人用第一種工藝組裝該產(chǎn)品,平均所需時(shí)間為26.1分鐘,樣本標(biāo)準(zhǔn)差為12分鐘;另一組8名工人用第二種工藝組裝,平均所需時(shí)間為17.6分鐘,樣本標(biāo)準(zhǔn)差為10.5分鐘。已知用兩種工藝組裝產(chǎn)品所用時(shí)間服從正態(tài)分布,且s12=s22

。試問能否認(rèn)為用第二種方法組裝比用第一中方法組裝更好?(=0.05)兩個(gè)總體均值之差的t

檢驗(yàn)H0:

1-2

0H1:

1-2>0=

0.05n1=10n2

=

8臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

接受H0沒有證據(jù)表明用第二種方法組裝更好t0拒絕域0.051.7459某市衛(wèi)生局對(duì)市場(chǎng)上出售的甲乙兩種冰激淋進(jìn)行了檢驗(yàn),甲種抽了11只,查明冰激淋含脂肪平均為127%,樣本標(biāo)準(zhǔn)差為038%;乙種抽了10只,查明冰激淋含脂肪平均為141%,樣本標(biāo)準(zhǔn)差為048%。試以5%的顯著水平檢驗(yàn)甲種的脂肪含量是否比乙種低?解:NEXT決策:接受原假設(shè)。結(jié)論:即甲種的脂肪含量不高于乙種。二、二個(gè)相關(guān)(配對(duì)或匹配)樣本的均值檢驗(yàn)(配對(duì)樣本t

檢驗(yàn))1、檢驗(yàn)兩個(gè)相關(guān)總體的均值配對(duì)或匹配重復(fù)測(cè)量(前/后)2、假定條件兩個(gè)總體都服從正態(tài)分布如果不服從正態(tài)分布,可用正態(tài)分布來近似(n1

30,n230)有時(shí)為了比較兩種產(chǎn)品,或兩種儀器、兩種方法等的差異,我們常在相同的條件下作對(duì)比實(shí)驗(yàn),得到一批成對(duì)的觀察值,然后分析觀察數(shù)據(jù)作出判斷——配對(duì)比較法。

在人事測(cè)評(píng)中,假如我們用同一套測(cè)驗(yàn)工具在不同時(shí)間對(duì)某位銷售主管施測(cè)兩次,結(jié)果如何呢?是否兩次的測(cè)評(píng)分?jǐn)?shù)會(huì)有非常顯著的差異呢?ABCEFGHI第一次16PF測(cè)試結(jié)果769871093第二次16PF測(cè)試結(jié)果87109810103LMNOQ1Q2Q3Q4第一次16PF測(cè)試結(jié)果23756282第二次16PF測(cè)試結(jié)果24636592

配對(duì)樣本的t

檢驗(yàn)(數(shù)據(jù)形式)觀察序號(hào)樣本1樣本2差值1x11x21D1=x11-x212x12x22D2=x12-x22MMMMix1ix2iDI=x1i-x2iMMMMnx1nx2nDn=x1n-x2n假設(shè)差值Di來自正態(tài)總體,若兩樣本無差異,則差值應(yīng)屬于隨機(jī)誤差,而隨機(jī)誤差可以認(rèn)為服從正態(tài)分布,均值為0。相關(guān)樣本eg:配對(duì)樣本(實(shí)驗(yàn)組與控制組);同一樣本前后時(shí)期的變化等;假設(shè)兩相關(guān)樣本間有n對(duì)個(gè)案,每對(duì)個(gè)案可能都有差異d=(X1-X2),而這些差異的均值為Xd,標(biāo)準(zhǔn)差為Sd,Xd的抽樣分布符合t分布。

配對(duì)樣本的t

檢驗(yàn)(檢驗(yàn)統(tǒng)計(jì)量)樣本均值樣本標(biāo)準(zhǔn)差自由度df=n

-1統(tǒng)計(jì)量例:一個(gè)以減肥為主要目標(biāo)的健美俱樂部聲稱,參加其訓(xùn)練班至少可以使減肥者平均體重減重8.5公斤以上。為了驗(yàn)證該宣稱是否可信,調(diào)查人員隨機(jī)抽取了10名參加者,得到他們的體重記錄如下表:配對(duì)樣本的t

檢驗(yàn)(例子)在

=0.05的顯著性水平下,調(diào)查結(jié)果是否支持該俱樂部的聲稱?訓(xùn)練前94.5101110103.59788.596.5101104116.5訓(xùn)練后8589.5101.5968680.58793.593102樣本差值計(jì)算表訓(xùn)練前訓(xùn)練后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合計(jì)—98.5配對(duì)樣本的t

檢驗(yàn)(計(jì)算表)配對(duì)樣本的t

檢驗(yàn)(計(jì)算結(jié)果)樣本均值樣本標(biāo)準(zhǔn)差H0:

m1

m2

8.5H1:

m1

m2

<8.5a=0.05df=

10-1=9臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

接受H0有證據(jù)表明該俱樂部的宣稱是可信的配對(duì)樣本的t

檢驗(yàn)(計(jì)算結(jié)果)-1.833t0拒絕域.05例:消費(fèi)者先對(duì)公司打分,再讓他們一天兩次觀看公司錄像,一周后再對(duì)公司打分。數(shù)據(jù)如下表所示,令α=0.05,檢驗(yàn)看過一周錄像后對(duì)公司的打分和之前相比是否有顯著差異?個(gè)人1234567事前32112117303814事后39153513413922d-7-4-144-11-1-81. 假定條件兩個(gè)總體是獨(dú)立的兩個(gè)總體都服從二項(xiàng)分布可以用正態(tài)分布來近似2.檢驗(yàn)統(tǒng)計(jì)量第二節(jié)兩個(gè)總體比例之差的Z檢驗(yàn)揚(yáng)州大學(xué)283.總體成數(shù)差的檢驗(yàn)步驟1.原假設(shè)

H0:pA-pB=D0

2.備擇假設(shè)H1:雙邊H1(pA-pB

)≠D0

單邊H1(

pA-pB

)>D0或H1(

pA-pB

)<D0;3.統(tǒng)計(jì)量揚(yáng)州大學(xué)29①單邊:Z>Za[H1:(

pA-pB)>D0]②單邊:Z<-Za[H1:(

pA-pB)<

D0](續(xù)3)——4.拒絕域a③雙邊a-Zaa/2a/2-Za/2Za/2兩個(gè)總體比例之差的檢驗(yàn)

(假設(shè)的形式)假設(shè)研究的問題沒有差異有差異比例1≥比例2比例1<比例2總體1≤比例2總體1>比例2H0P1–P2=0P1–P20P1–P20H1P1–P20P1–P2<0P1–P2>0兩個(gè)總體比例之差的Z檢驗(yàn)

【例】對(duì)兩個(gè)大型企業(yè)青年工人參加技術(shù)培訓(xùn)的情況進(jìn)行調(diào)查,調(diào)查結(jié)果如下:甲廠:調(diào)查60人,18人參加技術(shù)培訓(xùn)。乙廠調(diào)查40人,14人參加技術(shù)培訓(xùn)。能否根據(jù)以上調(diào)查結(jié)果認(rèn)為乙廠工人參加技術(shù)培訓(xùn)的人數(shù)比例高于甲廠?(=0.05)兩個(gè)總體比例之差的Z檢驗(yàn)

(計(jì)算結(jié)果)H0:

P1-P2

0H1:P1-P2<0=0.05n1=60,n2=40臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:接受H0沒有證據(jù)表明乙廠工人參加技術(shù)培訓(xùn)的人數(shù)比例高于甲廠-1.65Z0拒絕域練習(xí):一保險(xiǎn)機(jī)構(gòu)稱,對(duì)于新出臺(tái)的某險(xiǎn)種,沿海地區(qū)的人們與內(nèi)地人們的喜愛程度無顯著性差異。為了了解事實(shí),進(jìn)行了一次抽樣調(diào)查,在沿海地區(qū)抽查了300人,195人喜歡該險(xiǎn)種;內(nèi)地抽查了400人,220人喜歡該險(xiǎn)種。在0.05顯著性水平下檢驗(yàn)人們的態(tài)度是否有差異。

決策:拒絕H0。解:結(jié)論:

沿海和內(nèi)地人們的喜好有差異。多個(gè)樣本均值的檢驗(yàn)假設(shè):H0

:u1=u2=u3=……H1

:至少有兩個(gè)樣本的均值M是不相等的。方法:方差分析;F檢驗(yàn)法。第四節(jié)兩個(gè)變量相關(guān)的檢驗(yàn)X2檢驗(yàn)及其相關(guān)測(cè)量法;Gamma及其他級(jí)序相關(guān)的驗(yàn);

單因方差分析與F檢驗(yàn);

非參數(shù)檢驗(yàn):U檢驗(yàn)與H檢驗(yàn);第四節(jié)兩個(gè)變量相關(guān)的檢驗(yàn)兩個(gè)變量在樣本中相關(guān)并不能肯定它們?cè)诳傮w中也相關(guān),因?yàn)闃颖局械南嚓P(guān)可能是由抽樣誤差造成的。我們關(guān)心的是總體情況,因此用根據(jù)抽樣理論,用樣本資料檢驗(yàn)兩變量在總體中是否相關(guān)。在選用相關(guān)的檢驗(yàn)法時(shí),要注意檢驗(yàn)法所要求的變量的測(cè)量層次;X2檢驗(yàn)及其相關(guān)測(cè)量法X2檢驗(yàn)法(非參數(shù)檢驗(yàn)法):要求:(1)隨機(jī)樣本;(2)兩定類變量假設(shè):H0:總體中X與Y不相關(guān);H1:總體中X與Y相關(guān);公式:X2

=sum[(f-e)2/e]自由度為Df=(r-1)(c-1);f為樣本觀測(cè)的實(shí)際次數(shù),e是預(yù)期次數(shù)。X2檢驗(yàn)及其相關(guān)測(cè)量法預(yù)期次數(shù):總體中兩變量無關(guān)時(shí),每格所應(yīng)有的次數(shù);算法:相應(yīng)的兩邊緣次數(shù)的乘積除以樣本量。eg:e11=B1*A1/ne12=B1*A2/ne21=B2*A1/ne22=B2*A2/n例題:某鄉(xiāng)鎮(zhèn)研究職業(yè)代際流動(dòng)。調(diào)查了共140人,其結(jié)果如下表,問:父輩職業(yè)與子輩職業(yè)是否有關(guān)?具體相關(guān)程度如何?腦力體力農(nóng)業(yè)合計(jì)腦力205530體力10301050農(nóng)業(yè)555060合計(jì)3540651402、注意:針對(duì)2*2的列聯(lián)表,或者是某個(gè)預(yù)期次數(shù)等于或者小于5時(shí),需要對(duì)卡方檢驗(yàn)做修正;(修正值、fisher精確鑒定法)3、對(duì)單元格的要求:預(yù)期次數(shù)等于或者小于5的單元格建議不應(yīng)該超過總格數(shù)的20%。處理方法:將期望值較小的各值合并。例題:是否有顯著性差異?期望值321138724241實(shí)際值3011086235544、列聯(lián)表的檢驗(yàn)是通過頻次而不是通過相對(duì)頻次的比較進(jìn)行的。練習(xí)題:1、根據(jù)研究問題:城鄉(xiāng)分割的二元結(jié)構(gòu)是否會(huì)影響人們的消費(fèi)水平,根據(jù)經(jīng)驗(yàn)和研究的邏輯,研究假設(shè)分別為:(1)城市人的消費(fèi)與農(nóng)村人的消費(fèi)存在顯著差異;(2)城市人的消費(fèi)水平高于農(nóng)村人;(3)戶口(代表城鄉(xiāng)二元結(jié)構(gòu)的變量)對(duì)個(gè)人消費(fèi)水平有顯著影響。請(qǐng)你回答采用什么統(tǒng)計(jì)技術(shù)來驗(yàn)證這些假設(shè)。斯皮爾曼等級(jí)相關(guān)系數(shù)及其檢驗(yàn)(P320)分兩種情況:(1)n大于等于10,滿足t分布統(tǒng)計(jì)量(2)n大于等于30,滿足Z分布統(tǒng)計(jì)量Gamma及其他級(jí)序相關(guān)的檢驗(yàn)基本邏輯:以Gamma系數(shù)來求出樣本中X與Y的相關(guān),然后以Z檢驗(yàn)法或t檢驗(yàn)法來推論在總體中的Gamma是否等于0。方法:對(duì)于隨機(jī)樣本中兩個(gè)定序變量,若n大于100,G值的抽樣分布近似正態(tài)分布,若樣本較小,G值的抽樣分布近似t分布。(P331)

2、在320戶5個(gè)孩子的家庭中,男女性別比例描述如下:

問:這一結(jié)果與“男孩、女孩的出生概率相同”的假設(shè)一致嗎?

5男4男3男2男1男0男合計(jì)0女1女2女3女4女5女185611088408320例題:一下是五百名文化程度代際流動(dòng)的抽樣調(diào)查,試判斷二者是否有顯著關(guān)系(顯著性水平=0.05)大學(xué)中學(xué)小學(xué)大學(xué)1183715中學(xué)1813032小學(xué)94398Gamma及其他級(jí)序相關(guān)的檢驗(yàn)直接檢驗(yàn)S因子(S=Ns-Nd),間接檢驗(yàn)G系數(shù):較為精確。方法(了解):為使S的抽樣分布近似正態(tài)分布,S——S’;S’的標(biāo)準(zhǔn)誤se的求法;檢驗(yàn)值Z=S’/se;凡是以S=Ns-Nd作為分子的級(jí)序相關(guān)系數(shù),都可以通過S的檢定來推論總體情況。Gamma及其他級(jí)序相關(guān)的檢驗(yàn)S’的取值:Se的取值:A代表x的邊際分布,B代表y的邊際分布例題:試就一下樣本等級(jí)列聯(lián)表進(jìn)行統(tǒng)計(jì)檢驗(yàn)(顯著性水平=0.001)1234合計(jì)1810022020412824合計(jì)814121044練習(xí)題:書后練習(xí):第三題和第四題回歸系數(shù)和積距相關(guān)系數(shù)系數(shù)的檢驗(yàn)回歸系數(shù)的檢驗(yàn)知識(shí)回顧:三種變差研究假設(shè)的設(shè)置:H0:(回歸系數(shù))=0H1:0檢驗(yàn)統(tǒng)計(jì)量:F檢驗(yàn)書上例題:P354相關(guān)系數(shù)的檢驗(yàn):研究假設(shè)的設(shè)定:H0:總體相關(guān)系數(shù)為零H1:總體相關(guān)系數(shù)不為零方法一:檢驗(yàn)統(tǒng)計(jì)量:方法二:直接通過相關(guān)系數(shù)來進(jìn)行檢驗(yàn)(1)計(jì)算出r值;(2)根據(jù)給定的顯著性水平,和自由度(k=n-2),按照附表查出臨界相關(guān)系數(shù);(3)比較r值,判斷是否接受研究假設(shè)。書后練習(xí)題:P373第二題方差分析方差分析適用范圍:定類-定距變量方差分析分類:一元方差分析、二元方差分析以及多元方差分析什么是方差分析?(一個(gè)例子)表8-1該飲料在五家超市的銷售情況超市無色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超級(jí)市場(chǎng)上收集了前一時(shí)期該飲料的銷售情況,見表8-1。試分析飲料的顏色是否對(duì)銷售量產(chǎn)生影響什么是方差分析?(例子的進(jìn)一步分析)檢驗(yàn)飲料的顏色對(duì)銷售量是否有影響,也就是檢驗(yàn)四種顏色飲料的平均銷售量是否相同設(shè)1為無色飲料的平均銷售量,2粉色飲料的平均銷售量,3為橘黃色飲料的平均銷售量,4為綠色飲料的平均銷售量,也就是檢驗(yàn)下面的假設(shè)H0:1234

H1:1,2,3,4

不全相等檢驗(yàn)上述假設(shè)所采用的方法就是方差分析方差分析的基本思想和原理

(幾個(gè)基本概念)因素或因子所要檢驗(yàn)的對(duì)象稱為因子要分析飲料的顏色對(duì)銷售量是否有影響,顏色是要檢驗(yàn)的因素或因子水平因素的具體表現(xiàn)稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個(gè)因素水平下得到的樣本值每種顏色飲料的銷售量就是觀察值方差分析的基本思想和原理

(幾個(gè)基本概念)試驗(yàn)這里只涉及一個(gè)因素,因此稱為單因素四水平的試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體比如A1、A2、A3、A4四種顏色可以看作是四個(gè)總體樣本數(shù)據(jù)上面的數(shù)據(jù)可以看作是從這四個(gè)總體中抽取的樣本數(shù)據(jù)方差分析的基本思想和原理

(兩類誤差)隨機(jī)誤差在因素的同一水平(同一個(gè)總體)下,樣本的各觀察值之間的差異如同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機(jī)因素的影響,或者說是由于抽樣的隨機(jī)性所造成的,稱為隨機(jī)誤差

系統(tǒng)誤差在因素的不同水平(不同總體)下,各觀察值之間的差異如同一家超市,不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理

(兩類方差)組內(nèi)方差因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差比如,無色飲料A1在5家超市銷售數(shù)量的方差組內(nèi)方差只包含隨機(jī)誤差組間方差因素的不同水平(不同總體)下各樣本之間的方差比如,A1、A2、A3、A4四種顏色飲料銷售量之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理

(方差的比較)如果不同顏色(水平)對(duì)銷售量(結(jié)果)沒有影響,那么在組間方差中只包含有隨機(jī)誤差,而沒有系統(tǒng)誤差。這時(shí),組間方差與組內(nèi)方差就應(yīng)該很接近,兩個(gè)方差的比值就會(huì)接近1如果不同的水平對(duì)結(jié)果有影響,在組間方差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間方差就會(huì)大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異方差分析中的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每種顏色飲料的銷售量必需服從正態(tài)分布各個(gè)總體的方差必須相同對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的如四種顏色飲料的銷售量的方差都相同觀察值是獨(dú)立的如每個(gè)超市的銷售量都與其他超市的銷售量獨(dú)立方差分析中的基本假定在上述假定條件下,判斷顏色對(duì)銷售量是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等的問題如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近四個(gè)樣本的均值越接近,我們推斷四個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,我們推斷總體均值不同的證據(jù)就越充分方差分析中基本假定如果原假設(shè)成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒有系統(tǒng)誤差

這意味著每個(gè)樣本都來自均值為、方差為2的同一正態(tài)總體

Xf(X)1

2

3

4

方差分析中基本假定如果備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的有系統(tǒng)誤差

這意味著四個(gè)樣本分別來自均值不同的四個(gè)正態(tài)總體Xf(X)3

1

2

4

單因方差分析與F檢驗(yàn)單方差分析中的F檢驗(yàn):通過對(duì)各觀察數(shù)據(jù)誤差來源的分析來判斷多個(gè)總體均值是否相等;是參數(shù)檢定法的一種;目的:推算在各組總體中的均值是否相等。要求:1.隨機(jī)樣本;2.有一個(gè)變量是定距變量;3.各組總體都是正態(tài)分布;4.各組總體具有相等的方差;構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值TSS:總離差平方和RSS:組內(nèi)平方和(剩余平方和):個(gè)各觀測(cè)值對(duì)本組平均值的離差平方和BSS:組間平方和:觀測(cè)值的組平均值對(duì)總平均值的離差平方和單因方差分析與F檢驗(yàn)基本邏輯:將全部方差(以TSS估計(jì),自由度為:n-1)分解為兩個(gè)部分:消減方差(以BSS估計(jì),自由度為k-1)和剩余方差(以RSS估計(jì),自由度為n-k),然后從相互比較中推論X與Y在總體中是否相關(guān)。F=總體的消減誤差/總體的剩余誤差即F=(BSS/df1)/(RSS/df2);或F=組間方差/組內(nèi)方差單因方差分析與F檢驗(yàn)例題:20名同學(xué)的家庭職業(yè)背景對(duì)語文水平的影響語文水平(得分)干部工人農(nóng)民7852838259759173829061788580808151836454各組個(gè)案數(shù)785各組均值84.2961.7579.60各組方差4.409.642.87單因方差分析與F檢驗(yàn)問題:總體中三組家庭背景的學(xué)生是否有不同的語文成績(jī)?步驟:H0:M1=M2=M3;H1:不完全相同;E=0.84,n=20,k=3F=E2(n-k)/(1-E2)(k-1)=19.83在所要求的顯著度下查表得Fa。若F小于Fa

,則拒絕H0

,即總體中三類家庭背景的學(xué)生的語文成績(jī)存在差別。例題:1、研究地域(X)與教育年限(Y)的關(guān)系,隨機(jī)抽取96個(gè)30歲的青年。結(jié)果如下:農(nóng)村N=56,Y=11.72,城郊N=27,Y=12.63,城市N=13,Y=14.63。全部樣本均值為12.34,各分類Y平方和為804.24。試對(duì)兩變量的相關(guān)作檢驗(yàn)(顯著度0.05)P386表13-4重點(diǎn)關(guān)注書后練習(xí):P420練習(xí)題1.在0.05的顯著性水平下,檢驗(yàn)四種教學(xué)方法對(duì)學(xué)生能力是否有不同的影響。教學(xué)方法測(cè)試人數(shù)得分和得分平方和1644833,7842754242,2703641929,7194434730,203非參數(shù)檢驗(yàn)由于定類和定序變量都不具備運(yùn)算功能,因此無法對(duì)于總體分布作出假定或檢驗(yàn)總體的某種參數(shù),所以應(yīng)該采用非參數(shù)檢驗(yàn)法;非參數(shù)檢驗(yàn)方法,又稱為分布自由鑒定法,這類方法的使用不需要對(duì)總體分布作出任何事先的假定。非參數(shù)檢驗(yàn)的優(yōu)點(diǎn):對(duì)總體分布無須加以限制,計(jì)算量比較少,簡(jiǎn)單易行;非參數(shù)檢驗(yàn)的缺點(diǎn):檢驗(yàn)效率較差;非參數(shù)檢驗(yàn)較參數(shù)檢驗(yàn)需要更大的樣本量,才能獲得相似的檢驗(yàn)效力;習(xí)題研究者認(rèn)為工人的平均年齡有升高的趨勢(shì),根據(jù)五年前的統(tǒng)計(jì),總體工人的平均年齡是34歲。根據(jù)抽樣調(diào)查資料(N=374),工人的平均年齡為36.24歲,標(biāo)準(zhǔn)差為10.32歲,要求的顯著度是0.05,你認(rèn)為工人平均年齡身高了嗎?研究者認(rèn)為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論