SPSS 軟件培訓(xùn)(第二單元)解析_第1頁(yè)
SPSS 軟件培訓(xùn)(第二單元)解析_第2頁(yè)
SPSS 軟件培訓(xùn)(第二單元)解析_第3頁(yè)
SPSS 軟件培訓(xùn)(第二單元)解析_第4頁(yè)
SPSS 軟件培訓(xùn)(第二單元)解析_第5頁(yè)
已閱讀5頁(yè),還剩110頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS統(tǒng)計(jì)軟件培訓(xùn)北京工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院羅亞非luoyafei@

第二單元第五講簡(jiǎn)單推斷性分析(二)第六講方差分析模型第七講相關(guān)、回歸分析分析模型第八講聚類(lèi)分析、判別分析第九講因子分析、主成分分析第五講

簡(jiǎn)單推斷性分析什么是假設(shè)?

(HYPOTHESIS)對(duì)總體參數(shù)的的數(shù)值所作的一種陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述我認(rèn)為該地區(qū)新生嬰兒的平均體重為3190克!什么是假設(shè)檢驗(yàn)?

(HYPOTHESISTESTING)事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否成立有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)采用邏輯上的反證法,依據(jù)統(tǒng)計(jì)上的小概率原理假設(shè)檢驗(yàn)的基本思想...因此我們拒絕假設(shè)=50...如果這是總體的真實(shí)均值樣本均值m

=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20總體假設(shè)檢驗(yàn)的過(guò)程抽取隨機(jī)樣本均值

X=20我認(rèn)為人口的平均年齡是50歲提出假設(shè)

拒絕假設(shè)!

別無(wú)選擇.作出決策假設(shè)檢驗(yàn)的步驟提出假設(shè)確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量規(guī)定顯著性水平計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值作出統(tǒng)計(jì)決策提出原假設(shè)和備擇假設(shè)什么是原假設(shè)?(nullhypothesis)待檢驗(yàn)的假設(shè),又稱(chēng)“0假設(shè)”研究者想收集證據(jù)予以反對(duì)的假設(shè)總是有等號(hào),或表示為H0H0:

某一數(shù)值指定為=號(hào),即或例如,H0:

3190(克)什么是備擇假設(shè)?(alternativehypothesis)與原假設(shè)對(duì)立的假設(shè),也稱(chēng)“研究假設(shè)”研究者想收集證據(jù)予以支持的假設(shè)總是有不等號(hào):<,或>表示為H1H1:<某一數(shù)值,或>某一數(shù)值例如,H1:<3910(克),或>3910(克)提出原假設(shè)和備擇假設(shè)推斷統(tǒng)計(jì)的內(nèi)容舉例進(jìn)行分析OneSampleTtest單一樣本T檢驗(yàn)(儲(chǔ)戶一次平均存款金額的推斷)IndependentSamplesTTest獨(dú)立樣本的T檢驗(yàn)(城鄉(xiāng)儲(chǔ)戶一次存款金額的均值比較)PairedSamplesTTest配對(duì)樣本的T檢驗(yàn)(減肥茶效果檢驗(yàn))ONEWayANOVA單因素方差分析(不同廣告形式下銷(xiāo)售額的比較)練習(xí)保險(xiǎn)公司人員構(gòu)成的推斷假定保險(xiǎn)公司具有高等教育水平的員工比例的均值不低于0.8年輕人比例的均值與0.5無(wú)顯著性差異全國(guó)性保險(xiǎn)公司與外資和合資保險(xiǎn)公司具有高等教育水平員工比例的均值比較第六講

方差分析模型方差分析及其有關(guān)術(shù)語(yǔ)什么是方差分析(ANOVA)?

(ANALYSISOFVARIANCE)檢驗(yàn)多個(gè)總體均值是否相等通過(guò)分析察數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類(lèi)型自變量對(duì)數(shù)值型因變量的影響一個(gè)或多個(gè)分類(lèi)尺度的自變量2個(gè)或多個(gè)(k個(gè))處理水平或分類(lèi)一個(gè)間隔或比率尺度的因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個(gè)分類(lèi)的自變量雙因素方差分析:涉及兩個(gè)分類(lèi)的自變量什么是方差分析?

(例題分析)消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)

行業(yè)觀測(cè)值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在四個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如表什么是方差分析?

(例題分析)分析四個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等如果它們的均值相等,就意味著“行業(yè)”對(duì)投訴次數(shù)是沒(méi)有影響的,即它們之間的服務(wù)質(zhì)量沒(méi)有顯著差異;如果均值不全相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異方差分析中的有關(guān)術(shù)語(yǔ)因素或因子(factor)所要檢驗(yàn)的對(duì)象要分析行業(yè)對(duì)投訴次數(shù)是否有影響,行業(yè)是要檢驗(yàn)的因素或因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平觀察值在每個(gè)因素水平下得到的樣本值每個(gè)行業(yè)被投訴的次數(shù)就是觀察值方差分析中的有關(guān)術(shù)語(yǔ)試驗(yàn)這里只涉及一個(gè)因素,因此稱(chēng)為單因素四水平的試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個(gè)總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這四個(gè)總體中抽取的樣本數(shù)據(jù)方差分析的基本思想和原理方差分析的基本思想和原理

(圖形分析)

零售業(yè)旅游業(yè)航空公司家電制造方差分析的基本思想和原理

(圖形分析)從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)是有明顯差異的即使是在同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造也被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒(méi)有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源。方差分析的基本思想和原理1. 比較兩類(lèi)誤差,以檢驗(yàn)均值是否相等2. 比較的基礎(chǔ)是方差比3. 如果系統(tǒng)(處理)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來(lái)測(cè)度的方差分析的基本思想和原理

(兩類(lèi)誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機(jī)因素的影響,稱(chēng)為隨機(jī)誤差

系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱(chēng)為系統(tǒng)誤差方差分析的基本思想和原理

(兩類(lèi)方差)數(shù)據(jù)的誤差用平方和(sumofsquares)表示,稱(chēng)為方差組內(nèi)方差(withingroups)因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機(jī)誤差組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,四個(gè)行業(yè)被投訴次數(shù)之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理

(方差的比較)若不同不同行業(yè)對(duì)投訴次數(shù)沒(méi)有影響,則組間誤差中只包含隨機(jī)誤差,沒(méi)有系統(tǒng)誤差。這時(shí),組間誤差與組內(nèi)誤差經(jīng)過(guò)平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1若不同行業(yè)對(duì)投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間誤差平均后的數(shù)值就會(huì)大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說(shuō)明不同行業(yè)對(duì)投訴次數(shù)有顯著影響方差分析的基本假定方差分析的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每個(gè)行業(yè)被投訴的次數(shù)必需服從正態(tài)分布各個(gè)總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,四個(gè)行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立方差分析中的基本假定在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近四個(gè)樣本的均值越接近,推斷四個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中基本假定如果原假設(shè)成立,即H0:m1=m2=m3=m4四個(gè)行業(yè)被投訴次數(shù)的均值都相等意味著每個(gè)樣本都來(lái)自均值為、差為2的同一正態(tài)總體

Xf(X)1

2

3

4

方差分析中基本假定若備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的四個(gè)樣本分別來(lái)自均值不同的四個(gè)正態(tài)總體

Xf(X)3

1

2

4

問(wèn)題的一般提法問(wèn)題的一般提法設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用1、2、、k

表示要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):H0:12…k

H1:1,2,,k不全相等設(shè)1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:1234

H1:1,2,3,4不全相等單因素方差分析數(shù)據(jù)結(jié)構(gòu)分析步驟關(guān)系強(qiáng)度的測(cè)量用Excel進(jìn)行方差分析單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

(ONE-WAYANALYSISOFVARIANCE)

觀察值(j)因素(A)i

水平A1水平A2

…水平Ak12::n

x11x21…xk1x12x22…xk2::::::::x1n

x2n…xkn分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策提出假設(shè)一般提法H0:m1=m2=…=

mk自變量對(duì)因變量沒(méi)有顯著影響

H1:m1

,m2

,…

,mk不全相等自變量對(duì)因變量有顯著影響

注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值誤差平方和均方(MS)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平的均值)假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡(jiǎn)單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)計(jì)算公式為式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)

xij為第i個(gè)總體的第j個(gè)觀察值

構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個(gè)數(shù)計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(例題分析)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總誤差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計(jì)算公式為

前例的計(jì)算結(jié)果:

SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平項(xiàng)平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱(chēng)組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為

前例的計(jì)算結(jié)果:SSA=1456.608696構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算誤差項(xiàng)平方和SSE)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個(gè)樣本各觀察值的離散狀況,又稱(chēng)組內(nèi)平方和該平方和反映的是隨機(jī)誤差的大小計(jì)算公式為

前例的計(jì)算結(jié)果:SSE=2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的關(guān)系)總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSA+SSE

前例的計(jì)算結(jié)果:

4164.608696=1456.608696+2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的作用)

SST反映全部數(shù)據(jù)總的誤差程度;SSE反映隨機(jī)誤差的大??;SSA反映隨機(jī)誤差和系統(tǒng)誤差的大小如果原假設(shè)成立,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱(chēng)為方差計(jì)算方法是用誤差平方和除以相應(yīng)的自由度三個(gè)平方和對(duì)應(yīng)的自由度分別是SST

的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSE

的自由度為n-k構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)

組間方差:SSA的均方,記為MSA,計(jì)算公式為

組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)統(tǒng)計(jì)量F)將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a

F分布F(k-1,n-k)0拒絕H0不拒絕H0F統(tǒng)計(jì)決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對(duì)原假設(shè)H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F

若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響若F<F

,則不拒絕原假設(shè)H0

,不能認(rèn)為所檢驗(yàn)的因素對(duì)觀察值有顯著影響用SPSS進(jìn)行方差分析1、H0:不同行業(yè)投訴次數(shù)的均值相等H1:各行業(yè)投訴次數(shù)的均值不完全相等2、Statistics(Analysis)→CompareMeans→OneWayANOVA3.在OneWayANOVA對(duì)話框中將“投訴次數(shù)”放入DependentList欄中,將“行業(yè)”放入factor欄中。4、定義投訴次數(shù)為因變量,行業(yè)為影響變量。5、使用SPSS的系統(tǒng)默認(rèn)方差分析程序進(jìn)行分析。6、結(jié)果分析SPSS單因素方差分析的選擇項(xiàng)單因素方差分析的選擇項(xiàng)為3類(lèi):Contrasts對(duì)話框,可以指定一種要用t檢驗(yàn)來(lái)檢驗(yàn)的priori對(duì)比;Options對(duì)話框,可以指定要輸出的統(tǒng)計(jì)量、指定處理缺失值的方法;PostHoc對(duì)話框,可以指定多重比較檢驗(yàn)。在One-WayANOVA對(duì)話框中有一個(gè)Contrasts按鈕,單因素方差分析的One-WayANOVA程序,允許進(jìn)行高達(dá)5次的均值多項(xiàng)式比較。多項(xiàng)式的系數(shù)需要由使用者根據(jù)自己的研究需要輸入,具體的操作步驟如下:

(1)選擇Polynomial,該操作激活其右面的Degree小菜單。(2)單擊Degree小菜單右面的向下箭頭,展開(kāi)下拉式菜單選擇項(xiàng),可以選擇:線性Linear、二次Quadratic、三次Cubic及4th四次、5th五次多項(xiàng)式。SPSS單因素方差分析的選擇項(xiàng)(3)為多項(xiàng)式指定各組均值的系數(shù)方法是在Coefficients欄中輸入一個(gè)系數(shù),該系數(shù)將激活A(yù)dd按鈕,單擊Add按鈕,系數(shù)進(jìn)入下面的方框中。依次輸入各組均值的系數(shù),在方形顯示框中形成一列數(shù)值。因素變量分為幾組,輸入幾個(gè)系數(shù),多出的無(wú)意義。如果多項(xiàng)式中只包括第一組與第四組的均值的系數(shù),必須把第二個(gè)、第三個(gè)系數(shù)輸入為0值。如果只包括第一組與第二組的均值,則只需要輸入前兩個(gè)系數(shù),第三、四個(gè)系數(shù)可以不輸入。SPSS單因素方差分析的選擇項(xiàng)在One-WayANOVA對(duì)話框中單擊PostHoc按鈕,將打開(kāi)One-WayANOVA:PostHocMultipleComparisons對(duì)話框。在該對(duì)話框中選擇進(jìn)行均值多重比較的方法。同時(shí)還可以選擇樣本含量的估計(jì)方法。方差齊性多重比較方法有如下選擇項(xiàng):1)Least-significantdifference用T檢驗(yàn)完成各組均值間的配對(duì)比較。對(duì)多重比較誤差率不進(jìn)行調(diào)整。

2)Bonferroni用T檢驗(yàn)完成各組間均值的配對(duì)比較,但通過(guò)設(shè)置每個(gè)檢驗(yàn)的誤差率來(lái)控制整個(gè)誤差率。SPSS單因素方差分析的選擇項(xiàng)3)Sidak選擇項(xiàng),計(jì)算t統(tǒng)計(jì)量進(jìn)行多重配對(duì)比較。可以調(diào)整顯著性水平,比Bofferroni方法的界限要小。4)Scheffe選擇項(xiàng),對(duì)所有可能的組合進(jìn)行同步進(jìn)入的配對(duì)比較。這些選擇項(xiàng)可以同時(shí)選擇若干個(gè)。以使比較各種均值比較方法的結(jié)果。5)R-E-G-W-F(Ryan-Einot-Gabriel-WelschF)復(fù)選項(xiàng),用F檢驗(yàn)進(jìn)行多重比較檢驗(yàn)。6)R-E-G-WQ(Ryan-Einot-Gabriel-Welschrangetest)復(fù)選項(xiàng),正態(tài)分布范圍進(jìn)行多重配對(duì)比較。SPSS單因素方差分析的選擇項(xiàng)7)S-N-K(StudentNewman-Keuls)復(fù)選項(xiàng),用StudentRange分布進(jìn)行所有各組均值間的配對(duì)比較。如果各組樣本含量相等或者選擇了Harmonicaverageofallgroups即用所有各組樣本含量的調(diào)和平均數(shù)進(jìn)行樣本量估計(jì)時(shí)還用逐步過(guò)程進(jìn)行齊次子集(差異較小的子集)的均值配對(duì)比較。在該比較過(guò)程中,各組均值從大到小按順序排列,最先比較最末端的差異。8)TUKEY(Tuky’shoestlysignificantdifference)復(fù)選項(xiàng),用Student-Range統(tǒng)計(jì)量進(jìn)行所有組間均值的配對(duì)比較,用所有配對(duì)比較誤差率作為實(shí)驗(yàn)誤差率。SPSS單因素方差分析的選擇項(xiàng)9)Tukey’s-b復(fù)選項(xiàng),用StudntRange分布進(jìn)行組間均值的配對(duì)比較。其精確值為前兩種檢驗(yàn)相應(yīng)值的平均值。10)Duncan(Duncan’smultiplerangetest)復(fù)選項(xiàng),指定一系列的Range值,逐步進(jìn)行計(jì)算比較得出結(jié)論。11)Hochberg’sGT2復(fù)選項(xiàng),用正態(tài)最大系數(shù)進(jìn)行多重比較。12)Gabiel復(fù)選項(xiàng),用正態(tài)標(biāo)準(zhǔn)系數(shù)進(jìn)行配對(duì)比較,在單元數(shù)較大時(shí),這種方法較自由。SPSS單因素方差分析的選擇項(xiàng)13)Waller-Dunca復(fù)選項(xiàng),用t統(tǒng)計(jì)量進(jìn)行多重比較檢驗(yàn)。使用貝葉斯逼近。14)Dunnett復(fù)選項(xiàng),指定此方法進(jìn)行配對(duì)比較。方法是選擇最后一組為對(duì)照,其他各組和它比較。選定此方法后,激活下面的ControlCategory參數(shù)框,展開(kāi)小菜單,選擇對(duì)照組。SPSS單因素方差分析的選擇項(xiàng)方差不具有齊次性時(shí)(Equalvariancenotassumed),檢驗(yàn)各均數(shù)間是否有差異的方法有四種可供選擇:1)Tamhane’sT2復(fù)選項(xiàng),t檢驗(yàn)進(jìn)行配對(duì)比較。2)Dunnett’ST3復(fù)選項(xiàng),正態(tài)分布下的配對(duì)比較。3)Games-Howell復(fù)選項(xiàng),方差不具齊次性時(shí)的配對(duì)比較,該方法較靈活。4)Dunnett’SC復(fù)選項(xiàng),正態(tài)分布下的配對(duì)比較。SPSS單因素方差分析的選擇項(xiàng)在One-WayANOVA對(duì)話框中單擊Options按鈕,展開(kāi)Options對(duì)話框,在這個(gè)對(duì)話框中有兩項(xiàng)選擇,Statistics用來(lái)定義要求輸出的統(tǒng)計(jì)量,并按要求的方式顯示這些統(tǒng)計(jì)量。MissingValues用來(lái)定義對(duì)缺省值的處理要求。各組選擇項(xiàng)的含義如下:(1)Statistics輸出統(tǒng)計(jì)量的選擇項(xiàng)。

1)Descriptive要求輸出描述統(tǒng)計(jì)量,選擇此項(xiàng),會(huì)計(jì)算并輸出:記錄個(gè)數(shù)、平均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、最小值、最大值、各組中每個(gè)因變量的95%置信區(qū)間。SPSS單因素方差分析的選擇項(xiàng)2)Homogeneity-of-variance要求進(jìn)行方差齊次性檢驗(yàn),并輸出檢驗(yàn)結(jié)果。用Levenetest檢驗(yàn),即計(jì)算每個(gè)變量值與其組平均值之差,然后對(duì)這些差值進(jìn)行一維方差分析。可以同時(shí)選擇這兩個(gè)選擇項(xiàng)。(2)MissingValues對(duì)缺省值處理方法選擇。1)Excludecasesanalysisbyanalysis對(duì)含有缺省值的記錄,根據(jù)缺省值是因變量還是自變量從有關(guān)的分析中剔除。2)Excludecaseslistwise將含有缺省值的記錄從所有分析中剔除。SPSS單因素方差分析的選擇項(xiàng)(3)在該對(duì)話框中還要一個(gè)選項(xiàng)Displaylabels,選擇它輸出中使用變量標(biāo)簽或變量值值標(biāo)簽;否則使用變量名或數(shù)據(jù)文件中的原值。以上3個(gè)選擇項(xiàng)選擇完成后,單擊Continue按鈕,確認(rèn)選擇并返回One-WayANOVA對(duì)話框。單擊Cancel按鈕放棄本次選擇;單擊Help按鈕,顯示有關(guān)的幫助信息。SPSS單因素方差分析的選擇項(xiàng)第七講

相關(guān)、回歸分析模型相關(guān)關(guān)系(類(lèi)型)

散點(diǎn)圖

(SCATTERDIAGRAM)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)相關(guān)系數(shù)的計(jì)算Analyze→Correlate100對(duì)夫妻結(jié)婚年齡的相關(guān)系數(shù)計(jì)算H0:夫妻二人結(jié)婚年齡無(wú)關(guān)計(jì)算相關(guān)系數(shù)對(duì)相關(guān)系數(shù)進(jìn)行檢驗(yàn)簡(jiǎn)單一元回歸分析Regression→Linear100對(duì)夫妻結(jié)婚年齡的線性回歸H0:所有回歸系數(shù)為零→F檢驗(yàn)H0:具體回歸系數(shù)為零→T檢驗(yàn)R2

回歸方程的判別系數(shù),反映自變量對(duì)因變量的解釋程度,以此反映回歸方程的擬合程度LINER命令使用的實(shí)例(一)保險(xiǎn)公司在研究火災(zāi)損失的規(guī)律時(shí),把火災(zāi)發(fā)生地與最近的消防站的距離作為一個(gè)最主要因素,研究火災(zāi)發(fā)生地距最近消防站的距離之間的關(guān)系。假定一保險(xiǎn)公司希望確定居民住宅火災(zāi)造成的損失數(shù)額與該住戶到最近的消防站的距離之間的相關(guān)關(guān)系,以便準(zhǔn)確地定出保險(xiǎn)金額。保險(xiǎn)公司列出了15起火災(zāi)事故的損失及火災(zāi)發(fā)生地與最近的消防站的距離。這15個(gè)樣本的數(shù)據(jù)輸入在SPSS文件“火災(zāi)損失”中。以此例說(shuō)明Liner線性回歸的應(yīng)用。打開(kāi)數(shù)據(jù)文件“火災(zāi)損失”Analyze→Regression→Liner在Liner對(duì)話框中,將“火災(zāi)損失”放入因變量欄中,將“距消防站距離”放入自變量欄中。其他按系統(tǒng)默認(rèn)方式處理。LINER命令使用的實(shí)例(一)輸出結(jié)果解釋?zhuān)篤ariablesEnter/Removed表,說(shuō)明線性回歸方程建立的方法。ModelSummary表,給出了自變量與因變量的相關(guān)系數(shù)、判別系數(shù)、調(diào)整后的判別系數(shù)和估計(jì)標(biāo)準(zhǔn)誤。該表說(shuō)明火災(zāi)損失與距消防站距離之間的相關(guān)系數(shù)為0.961。判別系數(shù)為0.923,即火災(zāi)損失的92.3%可以用距消防站距離的遠(yuǎn)近來(lái)解釋。LINER命令使用的實(shí)例(一)ANOVA表,通過(guò)F檢驗(yàn)方法來(lái)檢驗(yàn)線性回歸方程是否成立。該表說(shuō)明,該線性方程的建立是有意義的。Coefficients表,通過(guò)T檢驗(yàn),來(lái)驗(yàn)證回歸系數(shù)為零的假設(shè)是否成立。并給出了非標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)化的回歸系數(shù)。Y=10.278+4.919XY=0.961XLINER命令使用的實(shí)例(一)多元線性回歸如果除了考慮人均收入還考慮糧食價(jià)格對(duì)食品支出的影響,這個(gè)問(wèn)題就是多元線性方程的問(wèn)題了。通過(guò)SPSS建立多元回歸方程:該方程表示回歸平面在y軸上的截距為-87.38元。當(dāng)價(jià)格固定時(shí),收入每上升1元,食品支出上升0.35元,或者說(shuō)收入的每1元對(duì)食品支出的貢獻(xiàn)為0.35元。而當(dāng)人均收入固定時(shí),價(jià)格每上升1元,食品支出上升206.54元,或者說(shuō)價(jià)格的每1元對(duì)食品支出的貢獻(xiàn)為206.54元。有關(guān)回歸假設(shè)檢驗(yàn)問(wèn)題多元線性回歸方程的顯著性檢驗(yàn)與一元線性回歸方程的顯著性檢驗(yàn)既有相同之處,也有不同之處。一、F檢驗(yàn)對(duì)多元線性回歸方程的顯著性檢驗(yàn)就是要看自變量x1,x2,…,xp從整體上對(duì)隨機(jī)變量y是否有明顯的影響。為此提出原假設(shè)

H0:b1=b2=...=bp=0如果H0不被拒絕,則表明隨機(jī)變量y與x1,x2,…,xp之間的關(guān)系由線性回歸模型表示不合適。在正態(tài)假設(shè)下,當(dāng)原假設(shè)H0

:b1=b2=…=bp=0成立時(shí),F(xiàn)服從自由度為(p,n-p-1)的F分布。于是,可以利用F統(tǒng)計(jì)量對(duì)回歸方程的總體顯著性進(jìn)行檢驗(yàn)。對(duì)于給定的數(shù)據(jù),i=1,2,…,n,計(jì)算出SSR和SSE,進(jìn)而得到F的值,其計(jì)算過(guò)程一般列在方差分析表中,再由給定的顯著性水平a,查F分布表,得臨界值(p,n-p-1)。有關(guān)回歸假設(shè)檢驗(yàn)問(wèn)題

當(dāng)F>Fα

(p,n-p-1)時(shí),拒絕原假設(shè)H0

,認(rèn)為在顯著性水平a下,y對(duì)x1,x2,...,xp有顯著的線性關(guān)系,也即回歸方程是顯著的。更通俗一些說(shuō),就是接受“自變量全體對(duì)因變量y產(chǎn)生線性影響”這一結(jié)論犯錯(cuò)誤的概率不超過(guò)5%;反之,當(dāng)F<Fα

(p,n-p-1)時(shí),則認(rèn)為回歸方程不顯著。與一元線性回歸一樣,也可以根據(jù)p值作檢驗(yàn)。當(dāng)p值<α?xí)r,拒絕原假設(shè)H0

;當(dāng)p值>α?xí)r,不拒絕原假設(shè)H0。有關(guān)回歸假設(shè)檢驗(yàn)問(wèn)題

二、回歸系數(shù)的顯著性檢驗(yàn)在多元線性回歸中,回歸方程顯著并不意味著每個(gè)自變量對(duì)y的影響都顯著,因此我們總想從回歸方程中剔除那些次要的、可有可無(wú)的變量,重新建立更為簡(jiǎn)單的回歸方程。所以就需要我們對(duì)每個(gè)自變量進(jìn)行顯著性檢驗(yàn)。檢驗(yàn)變量而是否顯著,等價(jià)于檢驗(yàn)假設(shè)

H0:bj=0,(j=1,2,...,p)如果不拒絕原假設(shè)H0,則xj不顯著;如果拒絕原假設(shè)H0,則xj是顯著的。有關(guān)回歸假設(shè)檢驗(yàn)問(wèn)題三種檢驗(yàn)的關(guān)系前面介紹了回歸系數(shù)顯著性的T檢驗(yàn)、回歸方程顯著性的F檢驗(yàn)、相關(guān)系數(shù)的顯著性的T檢驗(yàn)。三種檢驗(yàn)之間是否存在一定的關(guān)系?回答是肯定的。對(duì)于一元線性方程的這三種檢驗(yàn)的結(jié)果是完全一致的。因而對(duì)一元線性回歸只需做其中一種檢驗(yàn)即可。然而對(duì)多元線性回歸這三種檢驗(yàn)考慮的問(wèn)題已有不同,是三種不同的檢驗(yàn)。有關(guān)回歸假設(shè)檢驗(yàn)問(wèn)題違背基本假設(shè)的情況在建立實(shí)際問(wèn)題的回歸模型時(shí),經(jīng)常存在與此假設(shè)相違背的情況,一種是計(jì)量經(jīng)濟(jì)建模中常說(shuō)的異方差性,一種是自相關(guān)性.我們將結(jié)合實(shí)例介紹異方差性及自相關(guān)性產(chǎn)生的背景和原因,以及給回歸建模帶來(lái)的影響,異方差性及自相關(guān)性問(wèn)題的診斷及處理方法。一、異方差二、自相關(guān)性問(wèn)題及其處理三、影響值、奇異點(diǎn)(一)異方差性產(chǎn)生的背景和原因由于實(shí)際問(wèn)題是錯(cuò)綜復(fù)雜的,因而在建立實(shí)際問(wèn)題的回歸分析模型時(shí),經(jīng)常會(huì)出現(xiàn)某一因素或一些因素隨著解釋變量觀測(cè)值的變化而對(duì)被解釋變量產(chǎn)生不同的影響,導(dǎo)致隨機(jī)誤差項(xiàng)產(chǎn)生不同方差。例如:在研究城鎮(zhèn)居民收入與購(gòu)買(mǎi)量的關(guān)系時(shí),我們知道居民收入與消費(fèi)水平有著密切的關(guān)系。在此問(wèn)題中,因?yàn)楦鲬舻氖杖氩煌?,消費(fèi)觀念和習(xí)慣的差異,通常存在明顯的異方差性。一般情況下,低收入的家庭購(gòu)買(mǎi)差異性比較小,大都購(gòu)買(mǎi)生活必需品,但高收入的家庭購(gòu)買(mǎi)行為差異就很大。高檔消費(fèi)品很多,房子、汽車(chē)的規(guī)格選擇余地也很大,這樣購(gòu)買(mǎi)金額的差異就很大,導(dǎo)致消費(fèi)模型的隨機(jī)項(xiàng)εi;具有不同的方差。當(dāng)存在異方差時(shí),參數(shù)向量β的方差大于在同方差條件下的方差,如果用普通最小二乘法估計(jì)參數(shù),將出現(xiàn)低估β的真實(shí)方差的情況。進(jìn)一步將導(dǎo)致回歸數(shù)的t檢驗(yàn)值高估,可能造成本來(lái)不顯著的某些回歸系數(shù)變成顯著。這將給回方程的應(yīng)用效果帶來(lái)一定影響。當(dāng)存在異方差時(shí),普通最小二乘估計(jì)存在以下問(wèn)題:(1)參數(shù)估計(jì)值雖是無(wú)偏的,但不是最小方差線性無(wú)偏估計(jì);(2)參數(shù)的顯著性檢驗(yàn)失效;(3)回歸方程的應(yīng)用效果極不理想。(二)異方差性的檢驗(yàn)

關(guān)于異方差性的檢驗(yàn),統(tǒng)計(jì)學(xué)家們進(jìn)行了大量的研究.提出的診斷方法已有10多種,但沒(méi)有一個(gè)公認(rèn)的最優(yōu)方法。本書(shū)介紹殘差圖分析法與等級(jí)相關(guān)系數(shù)檢驗(yàn)法兩種常用方法。1.殘差圖分析法2.等級(jí)相關(guān)系數(shù)法1.等級(jí)相關(guān)系數(shù)法檢驗(yàn)設(shè)某地區(qū)的居民收入與儲(chǔ)蓄額的歷史統(tǒng)計(jì)數(shù)據(jù)1.首先用SPSS軟件建立y對(duì)x的普通最小二乘回歸。2.等級(jí)相關(guān)系數(shù)法檢驗(yàn)異方差。Transformcompute計(jì)算殘差的絕對(duì)值;然后計(jì)算殘差絕對(duì)值與自變量的等級(jí)相關(guān),發(fā)現(xiàn)存在異方差。為什么使用等級(jí)相關(guān)系數(shù)法檢驗(yàn)?計(jì)算殘差絕對(duì)值與Xi的相關(guān)性時(shí)采用Spearman等級(jí)相關(guān)系數(shù),而不采用Pearson簡(jiǎn)單相關(guān)系數(shù),是因?yàn)榈燃?jí)相關(guān)系數(shù)可以反映非線性相關(guān)的情況,簡(jiǎn)單線性相關(guān)系數(shù)不能如實(shí)反映非線性相關(guān)情況。等級(jí)相關(guān)系數(shù)可以如實(shí)地反映單調(diào)遞增或單調(diào)遞減趨勢(shì)變量間的相關(guān)性,簡(jiǎn)單相關(guān)系數(shù)只適宜衡量直線趨勢(shì)變量間的相關(guān)性。2.一元加權(quán)最小二乘法尋找最優(yōu)權(quán)數(shù)StatisticsRegressionWeightEstimation確定冪指數(shù)m的最優(yōu)取值。3.多元加權(quán)最小二乘法思路與一元加權(quán)最小二乘法相同。實(shí)例分析研究北京經(jīng)濟(jì)開(kāi)發(fā)區(qū)經(jīng)濟(jì)發(fā)展與招商投資的關(guān)系。因變量Y各個(gè)開(kāi)發(fā)區(qū)的銷(xiāo)售收入(百萬(wàn)元)兩個(gè)自變量X1到某年底開(kāi)發(fā)區(qū)累計(jì)招商數(shù)目,X2招商企業(yè)注冊(cè)資本(百萬(wàn)元)3.多元加權(quán)最小二乘法建立普通最小二乘法的多元回歸方程存儲(chǔ)殘差利用Compute命令計(jì)算殘差的絕對(duì)值自變量X1、X2與殘差絕對(duì)值做等級(jí)相關(guān),以便確定對(duì)哪個(gè)自變量構(gòu)造權(quán)函數(shù)。re2=0.721,因而選X2構(gòu)造權(quán)函數(shù)。M的取值在[1,5]之間,步長(zhǎng)0.5,得到m的最優(yōu)值m=2.5。4.多元加權(quán)最小二乘法判別系數(shù)R2=0.92163普通最小二乘法的判別系數(shù)為R2=0.918多元加權(quán)最小二乘法擬合度優(yōu)于普通最小二乘法多元加權(quán)最小二乘法回歸方程為:普通最小二乘法回歸方程為:二、自相關(guān)性問(wèn)題及其處理無(wú)論是在介紹一元還是多元線性回歸模型時(shí),我們總假定其隨機(jī)誤差項(xiàng)是不相關(guān)的,即:上式表示不同時(shí)點(diǎn)的誤差項(xiàng)之間不相關(guān)。如果一個(gè)回歸模型不滿足上式,即:則我們稱(chēng)隨機(jī)誤差項(xiàng)之間存在著自相關(guān)現(xiàn)象。這里的自相關(guān)現(xiàn)象不是指兩個(gè)或兩個(gè)以上的變量之間的相關(guān)關(guān)系,而指的是一個(gè)變量前后期數(shù)值之間存在的相關(guān)關(guān)系。本節(jié)主要討論自相關(guān)現(xiàn)象產(chǎn)生的背景和原因,自相關(guān)現(xiàn)象對(duì)回歸分析帶來(lái)的影響,診斷自相關(guān)是否存在的方法,以及如何克服自相關(guān)現(xiàn)象帶來(lái)的影響。(一)自相關(guān)性產(chǎn)生的背景和原因

在實(shí)際問(wèn)題的研究中,經(jīng)常遇到時(shí)間序列出現(xiàn)正的序列相關(guān)的情形。產(chǎn)生序列自相關(guān)的背景及其原因通常有以下幾個(gè)方面。

1.遺漏關(guān)鍵變量時(shí)會(huì)產(chǎn)生序列的自相關(guān)性。2.經(jīng)濟(jì)變量的滯后性會(huì)給序列帶來(lái)自相關(guān)性。3.采用錯(cuò)誤的回歸函數(shù)形式也可能引起自相關(guān)性。4.蛛網(wǎng)現(xiàn)象(CobwebPhenomenon)可能帶來(lái)序列的自相關(guān)性。蛛網(wǎng)現(xiàn)象是微觀經(jīng)濟(jì)學(xué)中研究商品市場(chǎng)運(yùn)行規(guī)律用的一個(gè)名詞,它表示某種商品的供給量因受前一期價(jià)格影響而表現(xiàn)出來(lái)的某種規(guī)律性,即呈蛛網(wǎng)狀收斂或發(fā)散于供需的均衡點(diǎn)。

5.因?qū)?shù)據(jù)加工整理而導(dǎo)致誤差項(xiàng)之間產(chǎn)生自相關(guān)性。

(二)自相關(guān)性帶來(lái)的問(wèn)題1.參數(shù)的估計(jì)值不再具有最小方差線性無(wú)偏性。2.均方誤差MSE可能?chē)?yán)重低估誤差項(xiàng)的方差。3.容易導(dǎo)致對(duì)t值評(píng)價(jià)過(guò)高,常用的F檢驗(yàn)和t檢驗(yàn)失效。如果忽視這一點(diǎn),可能導(dǎo)致得出回歸參數(shù)統(tǒng)計(jì)檢驗(yàn)為顯著,但實(shí)際上并不顯著的嚴(yán)重錯(cuò)誤結(jié)論。

(三)自相關(guān)性的診斷由于隨機(jī)擾動(dòng)項(xiàng)存在序列相關(guān)時(shí)給普通最小二乘法的應(yīng)用帶來(lái)了非常嚴(yán)重的后果,因

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論