《應(yīng)用數(shù)理統(tǒng)計(jì)》 課件 劉志華 6 方差分析、7 相關(guān)分析_第1頁(yè)
《應(yīng)用數(shù)理統(tǒng)計(jì)》 課件 劉志華 6 方差分析、7 相關(guān)分析_第2頁(yè)
《應(yīng)用數(shù)理統(tǒng)計(jì)》 課件 劉志華 6 方差分析、7 相關(guān)分析_第3頁(yè)
《應(yīng)用數(shù)理統(tǒng)計(jì)》 課件 劉志華 6 方差分析、7 相關(guān)分析_第4頁(yè)
《應(yīng)用數(shù)理統(tǒng)計(jì)》 課件 劉志華 6 方差分析、7 相關(guān)分析_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

方差分析主要用來(lái)檢驗(yàn)兩個(gè)以上總體均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值的總體,或不同總體間的均值是否有顯著性差異。方差分析對(duì)于比較不同生產(chǎn)工藝或設(shè)備條件下產(chǎn)量、質(zhì)量的差異,分析不同計(jì)劃方案效果的好壞和比較不同地區(qū)、不同人員有關(guān)的數(shù)量指標(biāo)差異是否顯著,是非常有用的。第六章方差分析§6.1單因素方差分析進(jìn)行方差分析的基本思路是:首先通過(guò)試驗(yàn)(試驗(yàn)或調(diào)查),取得不同因素、不同水平條件下被考察的隨機(jī)變量的樣本,然后利用樣本構(gòu)造統(tǒng)計(jì)量,檢驗(yàn)不同條件下的幾個(gè)不同總體的參數(shù)是否相等,如果參數(shù)相等的假設(shè)成立,則說(shuō)明因素及水平對(duì)該變量影響不顯著,反之則影響顯著。6.1.1問(wèn)題引入在參數(shù)假設(shè)檢驗(yàn)中,我們經(jīng)常檢驗(yàn)兩個(gè)總體分布的均值是否相同,如果有多個(gè)總體,則必須兩兩比較檢驗(yàn),十分繁瑣。而方差分析(ANOVA),可以一次完成對(duì)多個(gè)總體的均值是否相同的檢驗(yàn):

(6.1)方差分析是檢驗(yàn)多個(gè)總體均值是否相同,本質(zhì)上是研究分類(lèi)型自變量對(duì)數(shù)值型因變量的影響。在分析均值之間是否有差異時(shí),需要借助于方差,也即是數(shù)據(jù)誤差來(lái)源的分析,所以叫方差分析。第六章方差分析6.1.11、相關(guān)概念單因素方差分析的基本思想是,用方案之間的方差(服從卡方分布)與所有方案內(nèi)部的方差之和(也服從卡方分布)的比值(服從F分布)與fa

的比較,來(lái)判別s個(gè)方案的均值是否相同。設(shè)有s個(gè)技術(shù)方案,各方案的試驗(yàn)效果如表6.1所示,問(wèn)怎樣判斷這s個(gè)方案的效果是否有顯著區(qū)別?所謂單因素,就是指只有“方案”這個(gè)變量(因素)。不同方案,就是“方案”這個(gè)變量的不同取值。單因素方差分析的目的,就是一次性地檢驗(yàn)各個(gè)方案的均值是否相同

單因素方差分析所使用的統(tǒng)計(jì)量,是F統(tǒng)計(jì)量。第六章方差分析例1已知在一組給定的條件下種植油菜所得畝產(chǎn)量服從正態(tài)分布。某農(nóng)場(chǎng)欲檢驗(yàn)四塊試驗(yàn)田對(duì)油菜畝產(chǎn)量的影響是否不相同(假定已經(jīng)經(jīng)過(guò)檢驗(yàn)表明不同試驗(yàn)田下的油菜產(chǎn)量方差相等)。為此,他們對(duì)四組初始條件完全相同的油菜種子,在完全相同的其他種植條件下,分別在四塊試驗(yàn)田種植。所得到的畝產(chǎn)量數(shù)據(jù)如下表。試分析不同試驗(yàn)田下的油菜畝產(chǎn)量是否存在顯著性差異?(a=0.05)第六章方差分析試驗(yàn)田123456試驗(yàn)田1370420450490試驗(yàn)田2490380400390500410試驗(yàn)田3330340400380470試驗(yàn)田4410480400420380410通常,在方差分析中,我們把對(duì)試驗(yàn)結(jié)果發(fā)生影響和起作用的自變量稱(chēng)為因素。如果方差分析研究的是一個(gè)因素對(duì)于試驗(yàn)結(jié)果的影響和作用,就稱(chēng)為單因素方差分析。在本例中,因素就是可能影響油菜畝產(chǎn)量的不同的試驗(yàn)田。因素的不同選擇方案稱(chēng)之為因素的水平。上例中試驗(yàn)田有4種不同的選擇就說(shuō)因素有4個(gè)水平。因素的水平實(shí)際上就是因素的取值或者是因素的分組,例如,可以在施肥量、光照時(shí)間、灌溉時(shí)長(zhǎng)、商品包裝、質(zhì)量、價(jià)格和產(chǎn)地等方面取不同的值或分為不同的組,就表示因素選了不同的水平。方差分析要檢驗(yàn)的問(wèn)題就是當(dāng)因素選不同的水平時(shí),對(duì)結(jié)果有無(wú)顯著的影響。若無(wú)顯著影響,則隨便選擇哪一種方案都無(wú)所謂。否則就要選擇最終油菜畝產(chǎn)量最多的一種試驗(yàn)田方案。第六章方差分析打開(kāi)數(shù)據(jù)文件“CH6例1試驗(yàn)田”。(1)在數(shù)據(jù)文件“CH6例1試驗(yàn)田”后,點(diǎn)擊:【分析】→【比較平均值】→【單因素ANOVA】,進(jìn)入單因素方差分析模塊。(2)在單因素方差分析模塊主窗口(圖6.1)中,選中左框的變量“畝產(chǎn)量”放入右邊的“因變量列表”框中。(3)選中左框的變量“試驗(yàn)田”,放入右邊的“因子”框中,如圖6.1所示。(4)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,如表6.3所示。

(5)結(jié)果說(shuō)明:第六章方差分析表6.3方差分析表

平方和df均方F顯著性組之間7112.14332370.7141.012.412組內(nèi)39811.667172341.863

總計(jì)46923.81020

6.1.2單因素方差分析的原理1數(shù)學(xué)模型方差分析的基本假定是:每個(gè)總體都應(yīng)服從正態(tài)分布;各個(gè)總體的方差相同(SPSS操作時(shí)s個(gè)水平下的總體方差可不等,先進(jìn)行“方差齊性檢驗(yàn)”);不同水平下的樣本之間是相互獨(dú)立的。現(xiàn)設(shè)單因素A的s個(gè)水平下的總體均服從正態(tài)分布,均值分別為:

,與未知,對(duì)進(jìn)行估計(jì)和檢驗(yàn),需要重復(fù)試驗(yàn)。為了分析因素A的第i個(gè)水平,對(duì)進(jìn)行兩次分解。第一次,將分解成兩部分

(6.2)式中為因素A的第i個(gè)水平下的總體均值,試驗(yàn)誤差之間相互獨(dú)立且,是因?yàn)?/p>

(6.3)(6.4)(6.5)第六章方差分析6.1.2單因素方差分析的原理第二次,再對(duì)進(jìn)行分解,(6.6)式中,,稱(chēng)為總平均,表示因素A的第i個(gè)水平下的總體平均值與總平均的差異,習(xí)慣上將其稱(chēng)為水平Ai的效應(yīng)。由兩次分解得到單因素方差分析數(shù)學(xué)模型

第六章方差分析2方差分析檢驗(yàn)單因素方差分析的基本思想是,用方案之間的方差(服從卡方分布)與所有方案內(nèi)部的方差之和(也服從卡方分布)的比值(服從F分布),與fa的比較,來(lái)判別s個(gè)方案的均值是否相同。①求各方案之間的變差SA(用各方案的均值對(duì)所有數(shù)據(jù)的總均值的離差平方和來(lái)表達(dá))

(6.8)式中,,,為所有數(shù)據(jù)的總平均值;對(duì)應(yīng)于為第i個(gè)方案的樣本均值,SA的自由度是s-1。②求所有方案內(nèi)部變差SE(方案i的內(nèi)部變差是該方案的試驗(yàn)數(shù)據(jù)Xij對(duì)該方案試驗(yàn)數(shù)據(jù)均值的變差)

(6.9)

SE與誤差項(xiàng)相對(duì)應(yīng),SE的自由度是n-s。

第六章方差分析③計(jì)算方案間的方差與所有方案內(nèi)的方差之比

(6.10)若,則,,所以

(6.11)在上面的計(jì)算中,如果把Xij換成xij,就得到統(tǒng)計(jì)量F對(duì)應(yīng)的值f。④做假設(shè)檢驗(yàn)

從臨界值的角度考慮,若,則表明sA較大,的平方和較大,對(duì)應(yīng)的總體參數(shù)是的絕對(duì)值較大,所以,如果以a的概率(或在a水平上)拒絕H0,即至少有兩個(gè)方案之間的平均效果(均值),差異足夠大,方案之內(nèi)的差異相對(duì)小。反之,接受H0,即不同方案的效果(均值)沒(méi)有顯著差異。從p值法的角度考慮,在SPSS中,F(xiàn)檢驗(yàn)的判別和t檢驗(yàn)的類(lèi)似,也可以用統(tǒng)計(jì)值f的外側(cè)概率p(顯著性概率)與a比較大小,來(lái)判別接受還是拒絕H0。而常規(guī)的數(shù)理統(tǒng)計(jì)學(xué),是用統(tǒng)計(jì)值(如等)與統(tǒng)計(jì)值的閾值(如等)比較大小,來(lái)判別接受還是拒絕。

第六章方差分析而由圖6.2可知,從統(tǒng)計(jì)值f與a所決定的閾值的角度看,若,則表明sA較大,的平方和較大,對(duì)應(yīng)的的絕對(duì)值較大,即。所以拒絕H0。即至少有兩個(gè)方案之間的平均效果(均值)的差異足夠大,方案之間的差異相對(duì)小。反之,接受H0,即不同方案之間的平均效果(均值)沒(méi)有顯著差異。由圖6.2可知,與f的右側(cè)概率p<=a是等價(jià)的,這就是SPSS的檢驗(yàn)判別方法。圖6.2單因素方差分析F檢驗(yàn)圖a

1-a

6.1.3單因素方差分析的SPSS操作1不同方案間存在顯著性差異上面的例1中不同試驗(yàn)田方案下的油菜畝產(chǎn)量不存在顯著性差異。所以,接下來(lái)就不用再進(jìn)一步分析了,也就是采取哪種試驗(yàn)田方案都可以。但是如果不同試驗(yàn)田方案存在顯著性差異呢?仍以例1為例,增加一列數(shù)據(jù)“畝產(chǎn)量新”,數(shù)據(jù)仍見(jiàn)“CH6例1試驗(yàn)田”。(1)點(diǎn)擊:【分析】→【比較平均值】→【單因素ANOVA】,進(jìn)入單因素方差分析模塊。(2)在單因素方差分析模塊主窗口(圖6.3)中,選中左框的變量“畝產(chǎn)量新”放入右邊的“因變量列表”框中。(3)選中左框的變量“試驗(yàn)田”,放入右邊的“因子”框中。如圖6.3所示。(4)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,如表6.4所示。第六章方差分析表6.4方差分析表

平方和df均方F顯著性組之間136921.667345640.5569.570.001組內(nèi)81078.333174769.314

總計(jì)218000.00020

2使用選項(xiàng)兩兩比較在前面的步驟(3)后增加選項(xiàng)操作。(5)點(diǎn)擊【選項(xiàng)】按鈕,系統(tǒng)彈出一個(gè)對(duì)話(huà)框,見(jiàn)圖6.4。在該對(duì)話(huà)框中, 描述性:選擇需要輸出的統(tǒng)計(jì)量。 方差同質(zhì)性檢驗(yàn):如果選擇,表示要進(jìn)行方差齊次性檢驗(yàn)(Levene檢驗(yàn)),并輸出檢驗(yàn)結(jié)果。這一選擇很重要,關(guān)系到【兩兩比較】窗口如何讀取計(jì)算結(jié)果。本例選擇此項(xiàng)。(6)點(diǎn)擊【繼續(xù)】按鈕,在主窗口中點(diǎn)擊【事后多重比較】,見(jiàn)圖6.5。(7)點(diǎn)擊【繼續(xù)】按鈕,返回主窗口(圖6.3)。(8)如果不是任何兩個(gè)分別兩兩比較,某兩個(gè)比較,或多個(gè)分組比較,可以點(diǎn)擊【對(duì)比】按鈕,彈出“對(duì)比”窗口(見(jiàn)圖6.6)。點(diǎn)擊該窗口中的“多項(xiàng)式”選項(xiàng),“度”被激活,點(diǎn)擊“度”右邊的小箭頭,出現(xiàn)下拉菜單,有線(xiàn)性、二次項(xiàng)、立方、四次項(xiàng)、五次項(xiàng)的多項(xiàng)式模型,可供選擇,一般選擇“線(xiàn)性”模型。第六章方差分析在“系數(shù)”的方框中,輸人各組均值的系數(shù),確定所要比較的組均值的組合。例如輸入1,再輸入0,點(diǎn)擊“添加”,再分別輸入0和-1,點(diǎn)擊“添加”,就完成了一個(gè)組合(1,0,0,-1),表示要對(duì)照檢驗(yàn)“1=試驗(yàn)田1”的平均畝產(chǎn)量與“4=試驗(yàn)田4”的平均畝產(chǎn)量有無(wú)顯著性差異。點(diǎn)擊【下一頁(yè)】,再輸入(1,-1,-1,-1),表示要對(duì)照檢驗(yàn)“1=試驗(yàn)田1”的平均畝產(chǎn)量與“2=試驗(yàn)田2”、“3=試驗(yàn)田3”、“4=試驗(yàn)田4”之和的平均畝產(chǎn)量有無(wú)顯著性差異。(9)點(diǎn)擊【確定】按鈕,輸出結(jié)果見(jiàn)下面的表格。由于顯著性概率,表示4個(gè)組的數(shù)據(jù)都不具有方差齊性。這里的方差同質(zhì)性檢驗(yàn)請(qǐng)參照上一章5.4.2節(jié)的內(nèi)容。由于在前面的檢驗(yàn)中,得知四種試驗(yàn)田方案下的畝產(chǎn)量平均值存在顯著性差異,所以,在進(jìn)行方差同質(zhì)性檢驗(yàn)之后,下面的表6.6給出了兩兩對(duì)照的結(jié)果。第六章方差分析表6.5方差同質(zhì)性檢驗(yàn)表Levene統(tǒng)計(jì)df1df2顯著性4.717317.0141第六章方差分析

表6.6兩兩多重比較結(jié)果

(I)試驗(yàn)田(J)試驗(yàn)田平均差(I-J)標(biāo)準(zhǔn)錯(cuò)誤顯著性95%置信區(qū)間

下限值上限LSD(L)試驗(yàn)田1試驗(yàn)田2-152.500*44.578.003-246.55-58.45試驗(yàn)田348.50046.327.310-49.24146.24試驗(yàn)田415.83344.578.727-78.22109.89試驗(yàn)田2試驗(yàn)田1152.500*44.578.00358.45246.55試驗(yàn)田3201.000*41.818.000112.77289.23試驗(yàn)田4168.333*39.872.00184.21252.46試驗(yàn)田3試驗(yàn)田1-48.50046.327.310-146.2449.24試驗(yàn)田2-201.000*41.818.000-289.23-112.77試驗(yàn)田4-32.66741.818.445-120.9055.56試驗(yàn)田4試驗(yàn)田1-15.83344.578.727-109.8978.22試驗(yàn)田2-168.333*39.872.001-252.46-84.21試驗(yàn)田332.66741.818.445-55.56120.90Tamhane試驗(yàn)田1試驗(yàn)田2-152.50049.779.096-328.0423.04試驗(yàn)田348.50035.575.768-81.38178.38試驗(yàn)田415.83328.822.996-107.85139.51試驗(yàn)田2試驗(yàn)田1152.50049.779.096-23.04328.04試驗(yàn)田3201.000*49.642.02328.00374.00試驗(yàn)田4168.33345.049.056-4.52341.18試驗(yàn)田3試驗(yàn)田1-48.50035.575.768-178.3881.38試驗(yàn)田2-201.000*49.642.023-374.00-28.00試驗(yàn)田4-32.66728.585.877-140.0774.73試驗(yàn)田4試驗(yàn)田1-15.83328.822.996-139.51107.85試驗(yàn)田2-168.33345.049.056-341.184.52試驗(yàn)田332.66728.585.877-74.73140.07由于前面已經(jīng)得出了不具有方差齊性的結(jié)論,所以這里應(yīng)當(dāng)讀取Tamhane的檢驗(yàn)結(jié)果。假設(shè),則由于試驗(yàn)田2和試驗(yàn)田3之間,所以試驗(yàn)田2、3之間存在顯著性差異,該表格用*標(biāo)出了兩兩均值之間是否存在顯著性差異。接下來(lái)還可以按不同的組合進(jìn)行單因素方差分析,結(jié)果如表6.7所示。前面在判斷4塊試驗(yàn)田對(duì)應(yīng)的總體方差是否齊性時(shí),得出了不具有方差齊性的結(jié)論,那么這里兩兩多重比較,也就是兩個(gè)總體間方差的判斷是否還應(yīng)讀取“不假定等方差”的檢驗(yàn)結(jié)果?我們不妨和上一章學(xué)的“獨(dú)立樣本T檢驗(yàn)”的SPSS結(jié)果做一下對(duì)比。第六章方差分析表6.7兩兩多重比較結(jié)果對(duì)比對(duì)比值標(biāo)準(zhǔn)錯(cuò)誤tdf顯著性(雙尾)畝產(chǎn)量新假定等方差115.8344.578.35517.7272-953.17a61.123-15.59417.000不假定等方差115.8328.822.5494.803.6072-953.17a57.402-16.60511.833.000a.對(duì)比系數(shù)之和不為零。第1個(gè)組合方差的Levene檢驗(yàn)p=0.363>a=0.05,所以讀取表6.9中第一行結(jié)果,p=0.566>a=0.05,表示其組合的均值之間沒(méi)有顯著性差異,即試驗(yàn)田1和試驗(yàn)田4對(duì)油菜畝產(chǎn)量的影響無(wú)顯著性差異。結(jié)果的不同反映了SPSS內(nèi)部核心算法的不同。表6.10組統(tǒng)計(jì)量

試驗(yàn)田N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤畝產(chǎn)量新>=217466.47113.63027.559<24432.5050.58025.290表6.9獨(dú)立樣本檢驗(yàn)

方差方程的Levene檢驗(yàn)均值方程的t檢驗(yàn)FSig.tdfSig.(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95%置信區(qū)間下限上限畝產(chǎn)量新假設(shè)方差相等.930.363.5998.56615.83326.426-45.10676.773假設(shè)方差不相等

.5494.803.60715.83328.822-59.17790.844表6.11獨(dú)立樣本檢驗(yàn)

方差方程的Levene檢驗(yàn)均值方程的t檢驗(yàn)FSig.tdfSig.(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95%置信區(qū)間下限上限畝產(chǎn)量新假設(shè)方差相等1.703.208.57619.57233.97159.014-89.546157.488假設(shè)方差不相等

.90811.354.38333.97137.405-48.044115.986§6.2無(wú)重復(fù)試驗(yàn)的雙因素方差分析6.2.1問(wèn)題引入為了理解雙因素方差分析的基本思路,我們先舉一個(gè)簡(jiǎn)單的例子。例23種教學(xué)法在4個(gè)不同的學(xué)校的試驗(yàn)結(jié)果(數(shù)據(jù)見(jiàn)文件“CH6例2教學(xué)法”)如下試分析不同學(xué)校的試驗(yàn)效果是否存在顯著性差異?不同教學(xué)方法之間是否存在顯著性差異?1、雙因素方差分析模塊的SPSS操作示例:讀入數(shù)據(jù)后:(1)點(diǎn)擊:【分析】→【一般線(xiàn)性模型】→【單變量】,進(jìn)入單因素方差分析模塊。第六章方差分析學(xué)校A學(xué)校B學(xué)校C學(xué)校D方法180903020方法290804050方法31001006040§6.2無(wú)重復(fù)試驗(yàn)的雙因素方差分析6.2.1問(wèn)題引入(2)在單因素方差分析模塊主窗口(圖6.7)中,選中左框的變量“試驗(yàn)結(jié)果”放入右邊的“因變量”框中。(3)選中左框的變量“方法”和“學(xué)校”,放入右邊的“固定因子”框中,如圖6.7所示。(4)點(diǎn)擊窗口右上側(cè)的【模型】①左邊的“指定模型”中的“全因子”(建立全模型,分析所有因素變量的主效應(yīng)和交互效應(yīng)),這是系統(tǒng)的默認(rèn)值。由于本例題是無(wú)重復(fù)試驗(yàn),不存在分析交互效應(yīng)問(wèn)題,所以不選擇此項(xiàng)(點(diǎn)擊右邊的“定制”選項(xiàng))。②點(diǎn)擊【定制】(用戶(hù)自定義模型),中間的“構(gòu)建項(xiàng)”被激活,同時(shí),左邊的“因子與協(xié)變量”框中的變量也被激活。③選擇所要分析的效應(yīng):點(diǎn)擊【構(gòu)建項(xiàng)】框中的下拉組合框小箭頭,出現(xiàn)一個(gè)下拉菜單見(jiàn)圖6.8。第六章方差分析§6.2無(wú)重復(fù)試驗(yàn)的雙因素方差分析6.2.1問(wèn)題引入(5)點(diǎn)擊【繼續(xù)】,回到上一個(gè)對(duì)話(huà)窗口。(6)其它選項(xiàng)略。(7)點(diǎn)擊【確定】,輸出結(jié)果,見(jiàn)表6.8所示。第六章方差分析表6.8方差分析結(jié)果因變量:試驗(yàn)結(jié)果

源III類(lèi)平方和自由度均方F顯著性校正的模型8366.667a51673.33318.825.001截距50700.000150700.000570.375.000方法800.0002400.0004.500.064學(xué)校7566.66732522.22228.375.001錯(cuò)誤533.333688.889

總計(jì)59600.00012

校正后的總變異8900.00011

a.R平方=.940(調(diào)整后的R平方=.890)§6.2無(wú)重復(fù)試驗(yàn)的雙因素方差分析6.2.2無(wú)重雙因的算法步驟1、假設(shè)零假設(shè):備擇假設(shè):之間不完全相等(至少有兩個(gè)不等),或ai不全等于0。之間不完全相等(至少有兩個(gè)不等),或bi不全等于0。2、計(jì)算(1)算行間變差

(6.12)(2)算列間變差

(6.13)(3)算總誤差平方和

(6.14)(4)算總變差第六章方差分析可以證明,在無(wú)交互影響的雙因素模型下,有如下結(jié)論①當(dāng)H0A成立時(shí)

(6.16)②當(dāng)成立時(shí)

(6.17)(5)計(jì)算2個(gè)方差之比

(6.18)(6.19)3、做假設(shè)檢驗(yàn)對(duì)給定的a查表,若,則拒絕H0A,即至少A因素中有兩個(gè)水平之間的平均效果(均值),差異足夠大。反之,接受H0A,即A因素的不同水平之間的平均效果(均值)沒(méi)有顯著性差異。第六章方差分析§6.3有重復(fù)試驗(yàn)的雙因素方差分析6.3.1問(wèn)題引入例3三種教學(xué)法在4個(gè)不同的學(xué)校的試驗(yàn)結(jié)果,如下試分析學(xué)校、教學(xué)方法以及交互作用對(duì)試驗(yàn)結(jié)果的影響是否顯著?1、雙因素方差分析模塊的SPSS操作示例:讀入數(shù)據(jù)(數(shù)據(jù)見(jiàn)文件“CH6例3教學(xué)法有重雙因”)后:(1)點(diǎn)擊:【分析】→【一般線(xiàn)性模型】→【單變量】,進(jìn)入方差分析模塊。(2)在單因素方差分析模塊主窗口(圖6.8)中,選中左框的變量“試驗(yàn)結(jié)果”放入右邊的“因變量”框中。第六章方差分析學(xué)校A學(xué)校B學(xué)校C學(xué)校D方法1808381889091293032192022方法2899092778081394041495052方法39710010195100101586061394042§6.3有重復(fù)試驗(yàn)的雙因素方差分析6.3.1問(wèn)題引入(3)選中左框的變量“方法”和“學(xué)?!保湃胗疫叺摹肮潭ㄒ蜃印笨蛑?,如圖6.9所示。(4)默認(rèn)系統(tǒng)對(duì)窗口右上側(cè)的【模型】的選擇,即要做全分析,包括交互效應(yīng)。(5)點(diǎn)擊【選項(xiàng)】按鈕,系統(tǒng)彈出一個(gè)新窗口,見(jiàn)圖6.10。在該窗口的上半部分,選擇OVERALL,即對(duì)三個(gè)變量:方法、學(xué)校、方法*學(xué)校,都要做分析。在窗口的下半部分,選擇“方差同質(zhì)性檢驗(yàn)”。(6)點(diǎn)擊【繼續(xù)】,回到上一個(gè)對(duì)話(huà)窗口。(7)點(diǎn)擊【事后多重比較】,系統(tǒng)彈出一個(gè)新對(duì)話(huà)窗口,見(jiàn)圖6.10。(8)點(diǎn)擊【確定】,輸出結(jié)果,見(jiàn)表6.10-6.13所示。第六章方差分析§6.3有重復(fù)試驗(yàn)的雙因素方差分析6.3.2有重雙因的算法步驟第六章方差分析§6.3有重復(fù)試驗(yàn)的雙因素方差分析6.3.2有重雙因的算法步驟第六章方差分析§6.3有重復(fù)試驗(yàn)的雙因素方差分析6.3.2有重雙因的算法步驟第六章方差分析作業(yè):課后1-11題.第六章作業(yè)在數(shù)據(jù)分析中,人們常常還需要分析變量之間的關(guān)系,比如,我們會(huì)關(guān)心一個(gè)地區(qū)的經(jīng)濟(jì)增長(zhǎng)與什么變量相關(guān),一個(gè)網(wǎng)絡(luò)移動(dòng)節(jié)點(diǎn)位置的定位準(zhǔn)確性和什么因素相關(guān),企業(yè)的銷(xiāo)量和什么相關(guān)。我們還可能關(guān)心許多實(shí)證性的問(wèn)題,例如,大學(xué)生的業(yè)余偏好是否和專(zhuān)業(yè)相關(guān),在剔除了外界環(huán)境的影響之后,移動(dòng)節(jié)點(diǎn)目標(biāo)跟蹤算法的誤差和已知位置的節(jié)點(diǎn)密度是否相關(guān),技術(shù)購(gòu)買(mǎi)的決策是否與企業(yè)的技術(shù)實(shí)力相關(guān),等等。第七章相關(guān)分析§7.1相關(guān)分析的概念7.1.1相關(guān)關(guān)系的種類(lèi)1、兩個(gè)隨機(jī)變量的總體(線(xiàn)性)相關(guān)系數(shù)定義1:在概率論中,通常用協(xié)方差和相關(guān)系數(shù)來(lái)衡量?jī)蓚€(gè)隨機(jī)變量X、Y的取值之間相互關(guān)系的程度和方向,其計(jì)算公式如下式中,是一個(gè)無(wú)量綱的量,稱(chēng)為隨機(jī)變量X、Y之間的相關(guān)系數(shù)??梢宰C明,相關(guān)系數(shù)是區(qū)間[-1,1]之間的一個(gè)量。若,則稱(chēng)X、Y不相關(guān)。若X、Y相互獨(dú)立,由概率論的知識(shí)我們可以知道,即,X、Y不相關(guān)。反之,若與X、Y不相關(guān),則X、Y不一定相互獨(dú)立。但不相關(guān)的兩個(gè)服從正態(tài)分布的隨機(jī)變量,是相互獨(dú)立的。第七章相關(guān)分析§7.1相關(guān)分析的概念7.1.1相關(guān)關(guān)系的種類(lèi)2、兩組樣本的線(xiàn)性相關(guān)定義2:設(shè)是的一組樣本,則樣本的線(xiàn)性相關(guān)為

(7.3)其中,,,稱(chēng)為樣本的中心化處理結(jié)果,這里的數(shù)據(jù)是刻度級(jí)的。樣本相關(guān)系數(shù)是對(duì)總體樣本間的線(xiàn)性相關(guān)關(guān)系的描述,這種相關(guān)也稱(chēng)為Pearson積矩相關(guān),通常簡(jiǎn)稱(chēng)為Pearson相關(guān)(皮爾遜相關(guān))。樣本相關(guān)系數(shù)也是區(qū)間[-1,1]之間的一個(gè)量。第七章相關(guān)分析§7.1相關(guān)分析的概念7.1.1相關(guān)關(guān)系的種類(lèi)3、兩組樣本的Spearman等級(jí)相關(guān)對(duì)兩組配對(duì)的順序級(jí)樣本而言,無(wú)法求出Pearson積矩相關(guān)系數(shù),而應(yīng)當(dāng)采用Spearman(斯皮爾曼)等級(jí)相關(guān)來(lái)分析。定義3:設(shè)是總體的一組順序級(jí)數(shù)據(jù)樣本,則樣本的Spearman(斯皮爾曼)等級(jí)相關(guān)為

(7.4)Spearman(斯皮爾曼)等級(jí)相關(guān)又稱(chēng)為非參數(shù)相關(guān)、秩相關(guān)或名次相關(guān)。定義4:設(shè)是總體的一組刻度級(jí)數(shù)據(jù)樣本,設(shè)為Xi的名次,為Yj的名次,,,則可以用下面的方式求出等級(jí)相關(guān)系數(shù)

(7.5)第七章相關(guān)分析§7.1相關(guān)分析的概念/7.1.1相關(guān)關(guān)系的種類(lèi)4、樣本的偏相關(guān)定義5:已知變量X、Y、Z是彼此有關(guān)聯(lián)的一組變量,那么,在剔除(控制)了變量Z的影響之后,變量X、Y的偏相關(guān)系數(shù)為

(7.6)定義6:已知變量X、Y、Z1、Z2是彼此有關(guān)聯(lián)的一組變量,那么,在剔除(控制)了變量Z1、Z2的影響之后,變量X、Y的偏相關(guān)系數(shù)為

(7.7)式中,是偏相關(guān)系數(shù),下標(biāo)中逗號(hào)“,”之后的變量是被控制的變量。逗號(hào)“,”前面的變量是被計(jì)算偏相關(guān)的兩個(gè)變量。第七章相關(guān)分析§7.1相關(guān)分析的概念/7.1.2散點(diǎn)圖第七章相關(guān)分析§7.1相關(guān)分析的概念/7.1.3相關(guān)強(qiáng)度的表達(dá)要通過(guò)樣本相關(guān)系數(shù)來(lái)判斷兩個(gè)隨機(jī)變量的相關(guān)性的強(qiáng)弱,首先要做相關(guān)系數(shù)是否顯著異于0的顯著性檢驗(yàn)。例如,統(tǒng)計(jì)量的顯著性概率p值,小于你設(shè)定的顯著性水平a,你才能斷定兩個(gè)隨機(jī)變量在a水平上顯著相關(guān)。只有兩個(gè)隨機(jī)變量顯著相關(guān)的前提下,樣本相關(guān)系數(shù)的絕對(duì)值的大小才反映了兩個(gè)隨機(jī)變量關(guān)系的強(qiáng)弱。另一個(gè)反映相關(guān)性強(qiáng)弱的參考指標(biāo),是統(tǒng)計(jì)量的顯著性概率p值的大小。由于統(tǒng)計(jì)量的顯著性概率p值越小,你推斷兩個(gè)隨機(jī)變量相關(guān)時(shí),犯錯(cuò)誤的概率越小。所以,統(tǒng)計(jì)量的顯著性概率大小在一定意義上反映了兩個(gè)隨機(jī)變量相關(guān)性的強(qiáng)弱。第七章相關(guān)分析§7.2簡(jiǎn)單線(xiàn)性相關(guān)7.2.1問(wèn)題引入例1以下是7個(gè)省區(qū)人均GDP(元)和建筑合同的價(jià)值(億元),試計(jì)算兩個(gè)變量之間的相關(guān)系數(shù),并在0.05的顯著性水平下對(duì)顯著性進(jìn)行檢驗(yàn)(數(shù)據(jù)見(jiàn)文件“CH7例1-例4建筑合同”)。2、比較均值模塊的SPSS操作示例:(1)在錄入數(shù)據(jù)后(見(jiàn)CH7例1-例4建筑合同.sav),點(diǎn)擊:【圖形】→【舊對(duì)話(huà)框】→【散點(diǎn)/點(diǎn)狀】,系統(tǒng)彈出散點(diǎn)圖類(lèi)型的選擇窗口,我們選擇【簡(jiǎn)單分布】,點(diǎn)擊【定義】。(2)系統(tǒng)彈出簡(jiǎn)單散點(diǎn)圖的坐標(biāo)定義窗口,將變量“人均GDP”放入選擇框“X軸”中,“建筑合同”放入選擇框“Y軸”中,如圖7.2所示。第七章相關(guān)分析省區(qū)ABCDEFG人均GDP100705509105689588325460196678建筑合同27.4020.2425.9323.3916.2012.518.88§7.2簡(jiǎn)單線(xiàn)性相關(guān)7.2.1問(wèn)題引入例1(3)點(diǎn)擊【確定】,生成兩變量的散點(diǎn)圖,如圖7.3所示。從圖7.3可以清楚看出,變量“人均GDP”和“建筑合同”之間存在近似的正相關(guān)關(guān)系。(4)接下來(lái)點(diǎn)擊:【分析】→【相關(guān)】→【雙變量】,進(jìn)入“雙變量相關(guān)性”分析模塊。第七章相關(guān)分析§7.2簡(jiǎn)單線(xiàn)性相關(guān)/7.2.1問(wèn)題引入例1(5)在“雙變量相關(guān)性”分析模塊主窗口(圖7.4)中,在左框選擇要做相關(guān)分析的變量,本例選中左框的變量“人均GDP”和“建筑合同”放入右邊的“變量”框中。(6)在對(duì)話(huà)框“相關(guān)系數(shù)”區(qū)域?qū)υ?huà)框中,列出了三種相關(guān)系數(shù),供選擇:①Pearson相關(guān)系數(shù)(系統(tǒng)的默認(rèn)值),本例選擇此項(xiàng),因?yàn)樽鱿嚓P(guān)分析的兩列數(shù)據(jù)均為刻度級(jí);②Kandall’stau-b相關(guān)系數(shù),是一種依據(jù)配對(duì)樣本之差的正負(fù)號(hào)的個(gè)數(shù),計(jì)算出來(lái)的相關(guān)系數(shù),本書(shū)略去;③Spearman等級(jí)相關(guān)系數(shù)。(7)在對(duì)話(huà)窗口的第二組選項(xiàng)區(qū)塊,選擇單尾檢驗(yàn)還是雙尾檢驗(yàn),系統(tǒng)默認(rèn)值是雙尾。本題可以接受系統(tǒng)的默認(rèn)值,也可以選擇單尾,因?yàn)閺膱D7.3中,可以確定兩個(gè)變量是正相關(guān)關(guān)系。(8)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,如表7.2所示。(9)結(jié)果說(shuō)明:在表7.2中可見(jiàn)人均GDP和建筑合同之間的Pearson相關(guān)系數(shù)為0.694,顯著性概率p=0.084>0.05,說(shuō)明兩個(gè)隨機(jī)變量的相關(guān)系數(shù)是沒(méi)有顯著異于0的。第七章相關(guān)分析§7.2簡(jiǎn)單線(xiàn)性相關(guān)/7.2.2線(xiàn)性相關(guān)分析的原理第七章相關(guān)分析§7.2簡(jiǎn)單線(xiàn)性相關(guān)/7.2.2線(xiàn)性相關(guān)分析的原理思路還是使棄真錯(cuò)誤的概率足夠小。假設(shè)H0為真的情況下,如果由樣本計(jì)算出來(lái)的rXY偏離0很多,則我們應(yīng)該傾向于選擇,放棄H0,并讓放棄這個(gè)事件的概率很小,為a。對(duì)應(yīng)的是,t統(tǒng)計(jì)量的值大于臨界值時(shí),我們放棄原假設(shè)H0,并使得棄真的概率很小,為

a。

(7.10)④從臨界值的角度考慮,若,則表明由樣本計(jì)算出來(lái)的rXY較大,所以,以a的概率(或在a水平上)拒絕H0,即總體X和Y的總體相關(guān)系數(shù)與0的差異足夠大。反之,接受H0,即兩個(gè)總體間的相關(guān)系數(shù)與0沒(méi)有顯著差異。⑤從p值法的角度考慮,在SPSS中,相關(guān)性的判別和前面章節(jié)的假設(shè)檢驗(yàn)的方法類(lèi)似,也可以用統(tǒng)計(jì)值的外側(cè)概率p(顯著性概率)的2倍與比較大小,來(lái)判別接受還是拒絕H0。

第七章相關(guān)分析§7.2簡(jiǎn)單線(xiàn)性相關(guān)7.2.3線(xiàn)性相關(guān)分析的SPSS操作例2(讀入例1的數(shù)據(jù)文件“CH7例1-例4建筑合同”,請(qǐng)分析一下“人均GDP”和“建筑合同”與其它變量(“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”)的相關(guān)關(guān)系。(1)點(diǎn)擊:【分析】→【相關(guān)】→【雙變量】,進(jìn)入“雙變量相關(guān)性”分析模塊。(2)在“雙變量相關(guān)性”分析模塊主窗口(圖7.5)中,選中左框的變量“人均GDP”、“建筑合同”、“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”放入右邊的“因變量列表”框中。(3)在對(duì)話(huà)框的第一組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(計(jì)算Pearson相關(guān)系數(shù))。(4)在對(duì)話(huà)框的第二組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(雙尾檢驗(yàn))。(5)在對(duì)話(huà)框的第三組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(標(biāo)記顯著性相關(guān))。第七章相關(guān)分析§7.2簡(jiǎn)單線(xiàn)性相關(guān)7.2.3線(xiàn)性相關(guān)分析的SPSS操作例2(6)點(diǎn)擊【粘貼】,系統(tǒng)彈出語(yǔ)法編輯器,在“建筑合同”與“流通費(fèi)用率”之間寫(xiě)上“with”,見(jiàn)圖7.6。(7)在圖7.5中,點(diǎn)擊綠色三角按鈕“運(yùn)行選定內(nèi)容”,系統(tǒng)輸出結(jié)果,如表7.3所示。第七章相關(guān)分析表7.3相關(guān)性

流通費(fèi)用率農(nóng)業(yè)GDP占比人均GDPPearson相關(guān)性.745-.477顯著性(雙尾).055.279N77建筑合同Pearson相關(guān)性.474-.941**顯著性(雙尾).283.002N77**.在置信度(雙測(cè))為0.01時(shí),相關(guān)性是顯著的?!?.3偏相關(guān)7.3.1問(wèn)題引入例3在例2中我們分析了“人均GDP”和“建筑合同”與“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”的相關(guān)關(guān)系,那么是否可以據(jù)此得出結(jié)論,“農(nóng)業(yè)GDP占比”是“建筑合同”降低的原因呢?(1)點(diǎn)擊:【分析】→【相關(guān)】→【偏相關(guān)】,系統(tǒng)彈出一個(gè)對(duì)話(huà)窗口。(2)在“偏相關(guān)”分析模塊主窗口(圖7.7)中,選中左框的變量“農(nóng)業(yè)GDP占比”和“建筑合同”放入右邊的“變量”框中。(3)在“偏相關(guān)”分析模塊主窗口(圖7.7)中,選中左框的變量“人均GDP”與“流通費(fèi)用率”放入右邊的“控制”框中。(4)在對(duì)話(huà)框的第二組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(雙尾檢驗(yàn))。(5)在對(duì)話(huà)框的第三組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(標(biāo)記顯著性相關(guān))。(6)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,見(jiàn)表7.4。第七章相關(guān)分析§7.3偏相關(guān)7.3.1問(wèn)題引入例3在例2中我們分析了“人均GDP”和“建筑合同”與“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”的相關(guān)關(guān)系,那么是否可以據(jù)此得出結(jié)論,“農(nóng)業(yè)GDP占比”是“建筑合同”降低的原因呢?在表7.4中,偏相關(guān)系數(shù)是-0.975,顯著性概率p=0.005<0.05,說(shuō)明剔除了“人均GDP”和“流通費(fèi)用率”后,變量“農(nóng)業(yè)GDP占比”和“建筑合同”仍然存在顯著性的關(guān)系。第七章相關(guān)分析表7.4偏相關(guān)系數(shù)與顯著性檢驗(yàn)控制變量農(nóng)業(yè)GDP占比建筑合同人均GDP&流通費(fèi)用率農(nóng)業(yè)GDP占比相關(guān)性1.000-.975顯著性(雙側(cè))..005df03建筑合同相關(guān)性-.9751.000顯著性(雙側(cè)).005.df30§7.3偏相關(guān)7.3.2偏相關(guān)分析的算法步驟①求剔除(控制)了變量Z的影響之后,變量X,Y的偏相關(guān)系數(shù)②計(jì)算檢驗(yàn)偏相關(guān)系數(shù)是否顯著異于0的t統(tǒng)計(jì)量

(7.13)③做假設(shè)檢驗(yàn),設(shè)總體X和Y的總體偏相關(guān)系數(shù)為

第七章相關(guān)分析§7.3偏相關(guān)7.3.2偏相關(guān)分析的算法步驟第七章相關(guān)分析§7.4等級(jí)相關(guān)7.4.1問(wèn)題引入例4在例1中,變量“建筑合同排名”明顯是順序級(jí)的數(shù)據(jù),問(wèn):“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”與“建筑合同排名”是否等級(jí)相關(guān)(如果把“建筑合同”視為刻度級(jí)變量,就可以直接求Pearson相關(guān)系數(shù))?(1)點(diǎn)擊:【分析】→【相關(guān)】→【雙變量】,系統(tǒng)彈出一個(gè)對(duì)話(huà)窗口。(2)在對(duì)話(huà)窗口(圖7.8)中,選中左框的變量“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”與“建筑合同排名”放入右邊的“變量”框中。(3)在對(duì)話(huà)框的第一組選項(xiàng)區(qū)塊中,選擇Spearman等級(jí)相關(guān)系數(shù),(此時(shí)把“流通費(fèi)用率”、“農(nóng)業(yè)GDP占比”作為了順序級(jí)的數(shù)據(jù))。此處如果只分析“流通費(fèi)用率”和“農(nóng)業(yè)GDP占比”的相關(guān)關(guān)系的話(huà),由于這兩個(gè)變量的數(shù)據(jù)也是刻度級(jí)數(shù)據(jù),所以可以同時(shí)選擇Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)。見(jiàn)圖7.8。而本例還包括順序級(jí)數(shù)據(jù)“建筑合同排名”,所以只選擇Spearman相關(guān)系數(shù)。(4)在對(duì)話(huà)框的第二組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(雙尾檢驗(yàn))。第七章相關(guān)分析§7.4等級(jí)相關(guān)(5)在對(duì)話(huà)框的第三組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(標(biāo)記顯著性相關(guān))。(6)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果,如表7.5所示。第七章相關(guān)分析表7.5等級(jí)相關(guān)系數(shù)與顯著性檢驗(yàn)

建筑合同排名流通費(fèi)用率農(nóng)業(yè)GDP占比斯皮爾曼等級(jí)相關(guān)系數(shù)建筑合同排名相關(guān)系數(shù)1.000-.393.964**顯著性(雙尾)..383.000N777流通費(fèi)用率相關(guān)系數(shù)-.3931.000-.250顯著性(雙尾).383..589N777農(nóng)業(yè)GDP占比相關(guān)系數(shù).964**-.2501.000顯著性(雙尾).000.589.N777**.相關(guān)性在0.01級(jí)別顯著(雙尾)?!?.4等級(jí)相關(guān)7.4.2等級(jí)相關(guān)分析的算法步驟第七章相關(guān)分析§7.4等級(jí)相關(guān)7.4.2等級(jí)相關(guān)分析的算法步驟第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.1問(wèn)題引入例5打開(kāi)數(shù)據(jù)文件“CH7例5CH8非線(xiàn)性相關(guān)、曲線(xiàn)回歸.sav”,試分析變量和的相關(guān)性。按照線(xiàn)性相關(guān)性分析的方法,不難算出,線(xiàn)性相關(guān)系數(shù)為,,兩個(gè)隨機(jī)變量似乎沒(méi)什么關(guān)系,但是,畫(huà)出以為橫坐標(biāo),以y為縱坐標(biāo)的散點(diǎn)圖,不難發(fā)現(xiàn),和y存在較為明顯的二次關(guān)系。至少,從直覺(jué)上,不能因?yàn)閮蓚€(gè)變量之間不存在明顯的線(xiàn)性關(guān)系,就斷言?xún)蓚€(gè)變量之間不存在相關(guān)關(guān)系。(1)點(diǎn)擊:【圖形】→【舊對(duì)話(huà)框】→【散點(diǎn)/點(diǎn)狀】,系統(tǒng)彈出一個(gè)散點(diǎn)圖類(lèi)型的選擇對(duì)話(huà)窗口,見(jiàn)圖7.8。(2)在這個(gè)窗口中,有5種類(lèi)型的散點(diǎn)圖的選擇,接受默認(rèn)值“簡(jiǎn)單分布”。(3)點(diǎn)擊【定義】按鈕,系統(tǒng)彈出簡(jiǎn)單散點(diǎn)圖的坐標(biāo)定義窗口,見(jiàn)圖7.9。(4)在圖7.9中,分別把左框中的變量和用箭頭送入右邊的X軸和Y軸框中。(5)點(diǎn)擊【確定】,系統(tǒng)輸出散點(diǎn)圖,見(jiàn)圖7.10。第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.1問(wèn)題引入從圖7.10可以看出,變量x和y存在較為明顯的二次關(guān)系,看得出y是x的二次曲線(xiàn),圖形中散點(diǎn)的最低點(diǎn)的位置,大約在x=3的附近,于是推測(cè)。因此,在下一階段做非線(xiàn)性變換。第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.1問(wèn)題引入(6)在數(shù)據(jù)窗口中,點(diǎn)擊:【轉(zhuǎn)換】→【計(jì)算變量】,在彈出的窗口中,完成。預(yù)計(jì)之間有很高的線(xiàn)性相關(guān)性,接下來(lái),完成之間、之間的(線(xiàn)性)相關(guān)系數(shù)的計(jì)算。(7)在數(shù)據(jù)窗口中,點(diǎn)擊:【分析】→【相關(guān)】→【雙變量】,在彈出的對(duì)話(huà)窗口中,用箭頭把變量送入右框中。(8)點(diǎn)擊【粘貼】按鈕,在彈出的“語(yǔ)法編輯器”窗口中,把第一個(gè)命令句“/VARIABLES=xyz”改為“/VARIABLES=ywithzx”。注意,改動(dòng)不僅僅增加了命令詞“with”,而且變量的位置也變了。這樣做的意義是:分別計(jì)算y與x之間、y與z之間的線(xiàn)性相關(guān)系數(shù)。(9)在“語(yǔ)法編輯器”窗口中,點(diǎn)擊綠色的三角形“運(yùn)行選定內(nèi)容”。系統(tǒng)輸出結(jié)果,見(jiàn)表7.6。第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.1問(wèn)題引入從表7.6的數(shù)據(jù)可以看出,之間檢驗(yàn)顯著性概率為0.988,顯然不存在顯著性線(xiàn)性相關(guān)的關(guān)系。但是之間的線(xiàn)性相關(guān)系數(shù)(Pearson相關(guān)性)是0.994,顯著性(雙尾)值為0.000(在SPSS輸出的表格中,雙擊這個(gè)數(shù)字,會(huì)顯示更精確的值),小于0.01,說(shuō)明在1%的顯著性水平上與0有顯著性差異。這表明,可以推斷之間是以構(gòu)造的函數(shù)形式高度非線(xiàn)性相關(guān)的。第七章相關(guān)分析表7.6與

之間、

之間的線(xiàn)性相關(guān)性

zxyPearson相關(guān)性.994**-.005顯著性(雙尾).000.988N1313**.在置信度(雙測(cè))為0.01時(shí),相關(guān)性是顯著的?!?.5非線(xiàn)性相關(guān)7.5.2非線(xiàn)性相關(guān)分析的算法步驟非線(xiàn)性相關(guān)分析的基本步驟:①做兩個(gè)變量的散點(diǎn)圖;②估計(jì)兩變量的非線(xiàn)性相關(guān)的函數(shù)形式,并做相應(yīng)的非線(xiàn)性變換;③計(jì)算變換前配對(duì)變量的相關(guān)系數(shù),及非線(xiàn)性變換后的相關(guān)系數(shù);④如果變換后的函數(shù)變量和原因變量存在顯著的線(xiàn)性關(guān)系,則說(shuō)明原因變量和原自變量之間存在估計(jì)的函數(shù)形式關(guān)系的非線(xiàn)性關(guān)系。例6打開(kāi)數(shù)據(jù)文件“CH7例6GDP”,文件中是發(fā)達(dá)程度不同的10個(gè)國(guó)家的人均GDP和農(nóng)業(yè)GDP占總GDP的比重?cái)?shù)據(jù),選擇適當(dāng)?shù)姆蔷€(xiàn)性曲線(xiàn),計(jì)算它們之間的相關(guān)系數(shù)。(1)按照上面的步驟,我們先做兩個(gè)變量的散點(diǎn)圖。點(diǎn)擊:【圖形】→【舊對(duì)話(huà)框】→【散點(diǎn)/點(diǎn)狀】,系統(tǒng)彈出一個(gè)散點(diǎn)圖類(lèi)型的選擇對(duì)話(huà)窗口,見(jiàn)圖7.8。第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.2非線(xiàn)性相關(guān)分析的算法步驟(2)在這個(gè)窗口中,有5種類(lèi)型的散點(diǎn)圖的選擇,接受默認(rèn)值【簡(jiǎn)單分布】。(3)點(diǎn)擊【定義】按鈕,系統(tǒng)彈出簡(jiǎn)單散點(diǎn)圖的坐標(biāo)定義窗口,分別把左框中的變量“農(nóng)業(yè)GDP占比”用箭頭送入右邊的X軸框中,把“人均GDP”用箭頭送入右邊的Y軸框中。(4)點(diǎn)擊【確定】,系統(tǒng)輸出散點(diǎn)圖,見(jiàn)圖7.11。第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.2非線(xiàn)性相關(guān)分析的算法步驟(5)在數(shù)據(jù)窗口中,點(diǎn)擊:【轉(zhuǎn)換】→【計(jì)算變量】,在彈出的窗口中,完成z=ln"農(nóng)業(yè)GDP占比"和z1=2000/"農(nóng)業(yè)GDP占比"。預(yù)計(jì)"人均GDP"與z、z1之間有很高的線(xiàn)性相關(guān)性,接下來(lái),完成"人均GDP"與z、z1之間的(線(xiàn)性)相關(guān)系數(shù)的計(jì)算。(6)在數(shù)據(jù)窗口中,點(diǎn)擊:【分析】→【相關(guān)】→【雙變量】,在彈出的對(duì)話(huà)窗口中,用箭頭把變量"人均GDP"、"農(nóng)業(yè)GDP占比"與z、z1都送入右框中。(7)點(diǎn)擊【粘貼】按鈕,在彈出的“語(yǔ)法編輯器”窗口中,把第一個(gè)命令句“/VARIABLES=人均GDP農(nóng)業(yè)GDP占比zz1”改為“/VARIABLES=人均GDPwith農(nóng)業(yè)GDP占比zz1”。注意,改動(dòng)增加了命令詞“with”,“with”前后均有空格。這樣做的意義是:分別計(jì)算"人均GDP"與"農(nóng)業(yè)GDP占比"、z、z1之間的線(xiàn)性相關(guān)系數(shù)。(8)在“語(yǔ)法編輯器”窗口中,點(diǎn)擊綠色的三角形“運(yùn)行選定內(nèi)容”。系統(tǒng)輸出結(jié)果,見(jiàn)表7.7。第七章相關(guān)分析§7.5非線(xiàn)性相關(guān)7.5.2非線(xiàn)性相關(guān)分析的算法步驟從表7.7的數(shù)據(jù)可以看出,在1%的顯著水平上,“人均GDP”與“農(nóng)業(yè)GDP占比”、z、z1都是明顯相關(guān)的?!叭司鵊DP”與“農(nóng)業(yè)GDP占比”之間t檢驗(yàn)顯著性概率為0.002,“人均GDP”與z、z1之間的線(xiàn)性相關(guān)系數(shù)(Pearson相關(guān)性)是-0.918和0.950,顯著性(雙尾)值分別為0.000175和0.000026(在SPSS輸出的表格中,分別雙擊這兩個(gè)數(shù)字,會(huì)顯示更精確的值),均小于0.01,說(shuō)明在1%的顯著性水平上與0均有顯著性差異。這表明,“人均GDP”和“農(nóng)業(yè)GDP占比”之間的基于對(duì)數(shù)函數(shù)和反函數(shù)的非線(xiàn)性關(guān)系是顯著的,遠(yuǎn)遠(yuǎn)優(yōu)于兩者之間的線(xiàn)性關(guān)系。第七章相關(guān)分析表7.7人均GDP與農(nóng)業(yè)GDP占比、z、z1相關(guān)性

農(nóng)業(yè)GDP占比 z z1人均GDPPearson相關(guān)性-.838**-.918**.950**顯著性(雙尾).002.000.000N101010**.在置信度(雙測(cè))為0.01時(shí),相關(guān)性是顯著的?!?.6至少有一個(gè)變量是二值名義級(jí)的相關(guān)7.6.1問(wèn)題引入例7打開(kāi)數(shù)據(jù)文件“CH7例7卡路里”,文件中是不同漢堡所含卡路里和是否有奶酪(二值名義級(jí)數(shù)據(jù))兩個(gè)變量的數(shù)據(jù),請(qǐng)對(duì)兩個(gè)變量做顯著性檢驗(yàn)。為了有一個(gè)直觀的感覺(jué),我們先做一個(gè)橫坐標(biāo)為“有無(wú)奶酪”,縱坐標(biāo)為“卡路里”的散點(diǎn)圖。第七章相關(guān)分析漢堡名稱(chēng)漢堡奶酪漢堡1/4磅漢堡奶酪1/4磅漢堡BigMac卡路里270320430530530有無(wú)奶酪01011§7.6至少有一個(gè)變量是二值名義級(jí)的相關(guān)7.6.1問(wèn)題引入例7(4)點(diǎn)擊:【分析】→【相關(guān)】→【雙變量】,進(jìn)入“雙變量相關(guān)性”分析模塊。(5)在“雙變量相關(guān)性”分析模塊主窗口(圖7.4)中,選中左框的變量“有無(wú)奶酪”和“卡路里”放入右邊的“變量”框中。(6)在對(duì)話(huà)框的第一組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(計(jì)算Pearson相關(guān)系數(shù))。(7)在對(duì)話(huà)框的第二組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(雙尾檢驗(yàn))。(8)在對(duì)話(huà)框的第三組選項(xiàng)區(qū)塊中,接受系統(tǒng)的默認(rèn)值(標(biāo)記顯著性相關(guān))。(9)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果如表7.9所示。第七章相關(guān)分析表7.9點(diǎn)雙列相關(guān)系數(shù)(Correlations)

卡路里有無(wú)奶酪卡路里Pearson相關(guān)性1.506顯著性(雙尾)

.384N55有無(wú)奶酪Pearson相關(guān)性.5061顯著性(雙尾).384

N55§7.6至少有一個(gè)變量是二值名義級(jí)的相關(guān)7.6.2算法原理1、二值名義級(jí)變量與刻度級(jí)變量的相關(guān)方向與強(qiáng)度的測(cè)量:點(diǎn)雙列相關(guān)系數(shù)當(dāng)一個(gè)變量是二值名義級(jí)變量,另一個(gè)變量是刻度級(jí)變量時(shí),可以把Pearson相關(guān)系數(shù)的計(jì)算方法,延

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論