版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
StatisticalProgramforSocialSciencesSPSSforWindows2021/6/281第一章SPSS初步--數(shù)據(jù)分析實(shí)例詳解1.1數(shù)據(jù)的輸入和保存1.1.1SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.2數(shù)據(jù)的預(yù)分析1.2.1數(shù)據(jù)的簡單描述1.2.2繪制直方圖1.3按題目要求進(jìn)行統(tǒng)計(jì)分析1.4保存和導(dǎo)出分析結(jié)果1.4.1保存文件1.4.2導(dǎo)出分析結(jié)果以SPSS10.0版1.5打開其他文件格式1.5.1
直接打開1.5.2使用數(shù)據(jù)庫查詢打開1.5.3使用文本導(dǎo)入向?qū)ёx入文本文件1.6編輯數(shù)據(jù)文件1.6.1定義新變量1.6.2數(shù)據(jù)錄入技巧1.7進(jìn)一步整理數(shù)據(jù)文件--Data菜單1.7.1用于數(shù)據(jù)管理的菜單項(xiàng)1.7.2正交設(shè)計(jì)菜單項(xiàng)2021/6/28年11月30日2西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心例1.1某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同?患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.872021/6/28年11月30日3西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心讓我們把要做的事情理理順:首先要做的肯定是打開計(jì)算機(jī)(廢話),然后進(jìn)入Windows,在進(jìn)入SPSS后,具體工作流程如下:將數(shù)據(jù)輸入SPSS,并存盤以防斷電。進(jìn)行必要的預(yù)分析(分布圖、均數(shù)標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的檢驗(yàn)方法。按題目要求進(jìn)行統(tǒng)計(jì)分析。保存和導(dǎo)出分析結(jié)果。下面就按這幾步依次講解。2021/6/28年11月30日4西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.1數(shù)據(jù)的輸入和保存1.1.1SPSS的界面2021/6/28年11月30日5西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.1.2定義變量該資料是定量資料,設(shè)計(jì)為成組設(shè)計(jì),因此我們需要建立兩個(gè)變量,一個(gè)變量代表血磷值,習(xí)慣上取名為X,另一個(gè)變量代表觀察對象是健康人還是克山病人,習(xí)慣上取名為GROUP。選擇菜單Data==>InsertVariable。點(diǎn)擊VariableView,將變量名改為GROUP和X。現(xiàn)在,第一、第二列的名稱均為深色顯示,表明這兩列已經(jīng)被定義為變量,其余各列的名稱仍為灰色的“var”,表示尚未使用。同樣地,各行的標(biāo)號(hào)也為灰色,表明現(xiàn)在還未輸入過數(shù)據(jù),即該數(shù)據(jù)集內(nèi)沒有記錄。2021/6/28年11月30日6西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.1.3輸入數(shù)據(jù)在DataView中輸入相應(yīng)的數(shù)據(jù),一個(gè)單元格輸入一個(gè)數(shù)據(jù),Group中輸入1代表患者,2代表健康人。2021/6/28年11月30日7西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.1.4保存數(shù)據(jù)選擇菜單File==>Save,由于該數(shù)據(jù)從來沒有被保存過,所以彈出Saveas對話框2021/6/28年11月30日8西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.2數(shù)據(jù)的預(yù)分析1.2.1數(shù)據(jù)的簡單描述首先我們需要知道數(shù)據(jù)的基本情況,如均數(shù)、標(biāo)準(zhǔn)差等。選擇Analyze==>DescriptiveStatistics==>Descriptives菜單,系統(tǒng)彈出描述對話框如下:2021/6/28年11月30日9西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心該對話框可分為左右兩大部分,左側(cè)為所有可用的侯選變量列表,右側(cè)為選入變量列表。我們只需要描述X,用鼠標(biāo)選中X,單擊中間的,變量X的標(biāo)簽就會(huì)移入右側(cè),注意這時(shí)OK按鈕變黑,表明已經(jīng)可以進(jìn)行分析了,單擊它,系統(tǒng)會(huì)彈出一個(gè)新的界面如下所示:該窗口上方的名稱為SPSSViewer,即(結(jié)果)瀏覽窗口,整個(gè)的結(jié)構(gòu)和資源管理器類似,左側(cè)為導(dǎo)航欄,右側(cè)為具體的輸出結(jié)果。結(jié)果表格給出了樣本數(shù)、最小值、最大值、均數(shù)和標(biāo)準(zhǔn)差這幾個(gè)常用的統(tǒng)計(jì)量。從中可以看到,24個(gè)數(shù)據(jù)總的均數(shù)為1.2846,標(biāo)準(zhǔn)差為0.4687。2021/6/28年11月30日10西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日11西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心我們以上的做法對嗎?當(dāng)然有問題!光看總的描述是不夠的,還應(yīng)當(dāng)看看分組的描述情況。這里要用到文件分割功能,請切換回?cái)?shù)據(jù)管理窗口,選擇Data==>SplitFile菜單,系統(tǒng)彈出文件分割對話框如下:選擇單選按鈕Organizeoutputbygroups,將變量GROUP選入右側(cè)的選入變量框,單擊OK鈕,此時(shí)界面不會(huì)有任何改變,但請?jiān)僮鲆淮螖?shù)據(jù)描述,你就可以看到現(xiàn)在數(shù)據(jù)是分Group=1和Group=2兩種情況在描述了!從描述可知兩組的均數(shù)和標(biāo)準(zhǔn)差分別為1.5209、1.0846和0.4218、0.4221。如果定義了文件分割,則它會(huì)在以后的所有統(tǒng)計(jì)分析中起作用,直到你重新定義文件分割方式為止。2021/6/28年11月30日12西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日13西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.2.2繪制直方圖統(tǒng)計(jì)指標(biāo)只能給出數(shù)據(jù)的大致情況,沒有直方圖那樣直觀,我們就來畫個(gè)直方圖瞧瞧!選擇Graphs==>Histogram,系統(tǒng)會(huì)彈出繪制直方圖對話框如下:2021/6/28年11月30日14西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心將變量X選入Variable選擇框內(nèi),單擊OK按鈕。此時(shí)結(jié)果瀏覽窗口內(nèi)會(huì)繪制出如下兩個(gè)直方圖:2021/6/28年11月30日15西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心兩組的數(shù)據(jù)沒有特別偏的分布,也沒有十分突出的離群值,因此無須變換,可以直接采用參數(shù)分析方法來分析。綜合設(shè)計(jì)類型,最終確定采用成組設(shè)計(jì)兩樣本均數(shù)比較的t檢驗(yàn)來分析。最后,我們還要取消變量分割,免得它影響以后的統(tǒng)計(jì)分析,再次調(diào)出變量分割對話框,選擇單選按鈕中的“Analyzeallcases,donotcreatgroup”,單擊OK按鈕就可以了。2021/6/28年11月30日16西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.3按題目要求進(jìn)行統(tǒng)計(jì)分析下面我們要用SPSS來做成組設(shè)計(jì)兩樣本均數(shù)比較的t檢驗(yàn),選擇Analyze==>CompareMeans==>Independent-SamplesTtest,系統(tǒng)彈出兩樣本t檢驗(yàn)對話框如下:2021/6/28年11月30日17西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心將變量X選入test框內(nèi),變量group選入grouping框內(nèi),注意這時(shí)下面的DefineGroups按鈕變黑,表示該按鈕可用,單擊它,系統(tǒng)彈出比較組定義對話框如右圖所示:該對話框用于定義是哪兩組相比,在兩個(gè)group框內(nèi)分別輸入1和2,表明是變量group取值為1和2的兩組相比。然后單擊Continue按鈕,再單擊OK按鈕,系統(tǒng)經(jīng)過計(jì)算后會(huì)彈出結(jié)果瀏覽窗口,首先給出的是兩組的基本情況描述,如樣本量、均數(shù)等(糟糕,剛才的半天工夫白費(fèi)了),然后是t檢驗(yàn)的結(jié)果如下:2021/6/28年11月30日18西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心IndependentSamplesTestIndependentSamplesTest2021/6/28年11月30日19西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心可見該結(jié)果分為兩大部分:第一部分為Levene's方差齊性檢驗(yàn),用于判斷兩總體方差是否齊,這里的檢驗(yàn)結(jié)果為F=0.074,p=0.788,可見在本例中方差是齊的;第二部分則分別給出兩組所在總體方差齊和方差不齊時(shí)的t檢驗(yàn)結(jié)果,由于前面的方差齊性檢驗(yàn)結(jié)果為方差齊,第二部分就應(yīng)選用方差齊時(shí)的t檢驗(yàn)結(jié)果,即上面一行列出的t=2.568,ν=21,p=0.018。從而最終的統(tǒng)計(jì)結(jié)論為按α=0.05水準(zhǔn),拒絕H0,認(rèn)為克山病患者與健康人的血磷值不同,從樣本均數(shù)來看,可認(rèn)為克山病患者的血磷值較高。2021/6/28年11月30日20西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.4保存和導(dǎo)出分析結(jié)果1.4.1保存結(jié)果文件顯然,最方便快捷、最符合信息時(shí)代特征的就是第三種方法,在結(jié)果瀏覽窗口中(注意:一定要在結(jié)果瀏覽窗口中)選擇菜單File==>Save,由于該結(jié)果也從來沒有被保存過,所以彈出和前面保存數(shù)據(jù)時(shí)極為相似的一個(gè)Saveas對話框,和前面相比,他唯一的區(qū)別就是文件的保存類型只有ViewFiles(*.spo)一種。好,閑言少敘,在文件名框中鍵入“Li1_1”并回車,該結(jié)果文件就會(huì)按文件名Li1_1.spo被存儲(chǔ)。2021/6/28年11月30日21西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.4.2導(dǎo)出分析結(jié)果文件倒是保存了,但問題還沒有完全解決:我們從來寫文章什么的都用的是文字處理軟件,尤其是WORD,可WORD不能直接讀取SPO格式的文件,怎么辦呢?沒關(guān)系,SPSS提供了將結(jié)果導(dǎo)出為純文本格式或網(wǎng)頁格式的功能,在結(jié)果瀏覽窗口中選擇菜單File==>Export,系統(tǒng)會(huì)彈出ExprotOutput對話框如下2021/6/28年11月30日22西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日23西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心最上方的Export下拉式列表可以選擇輸出的內(nèi)容,可以為含圖表的輸出文檔、無圖表的輸出文檔和只有統(tǒng)計(jì)圖表三種;中部的ExprotFile對話框則填入輸出的目標(biāo)文件名;左下方的ExportWhat單選框可以選擇輸出結(jié)果的哪些部分,可以是所有結(jié)果、所有可見結(jié)果或只輸出選擇的結(jié)果,一般選輸出所有可見結(jié)果;右下方的輸出文件類型下拉式列表已被我打開,可見里面有網(wǎng)頁格式和純文本格式兩種,在一切按所需選擇完畢后按OK鈕,則結(jié)果文件就會(huì)輸出為你想要的類型。好,到這里,就象我們剛開始所說的一樣,你實(shí)際上已經(jīng)完全掌握了SPSS的基本使用方法。我們以后將要做的工作就是“百尺竿頭,更進(jìn)一步”,將從下一章開始詳細(xì)介紹SPSS各個(gè)模塊的精確用法,使大家能盡快的從SPSS新手向SPSS高手過度。2021/6/28年11月30日24西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.5打開其他格式的數(shù)據(jù)文件1.5.1
直接打開SPSS現(xiàn)在可以直接讀入許多格式的數(shù)據(jù)文件,其中就包括EXCEL各個(gè)版本的數(shù)據(jù)文件。選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的“”按鈕,系統(tǒng)就會(huì)彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式,分別是:2021/6/28年11月30日25西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.5.2使用數(shù)據(jù)庫查詢打開SPSS可以直接打開許多類型的數(shù)據(jù)文件,但這并不是說它可以打開所有類型的數(shù)據(jù)文件(廢話),比如FoxPro3.0以上版本的*.dbf文件就不能直接打開(有興趣的話你可以試試)。為此,SPSS還提供了另一個(gè)適用范圍更廣、但使用上較為專業(yè)的數(shù)據(jù)接口--數(shù)據(jù)庫查詢。實(shí)際上,SPSS在這里使用的是一種叫ODBC(OpenDatabaseCapture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件(如MSOffice)支持,通過它,應(yīng)用程序可以直接訪問以結(jié)構(gòu)化查詢語言(SQL)做為數(shù)據(jù)訪問標(biāo)準(zhǔn)的數(shù)據(jù)庫管理系統(tǒng)。由于SPSS10.0可以直接打開EXCEL所有系列的數(shù)據(jù)文件,因此數(shù)據(jù)庫查詢接口的用處不是很大。但是,在9.0及以前的版本中,該查詢?nèi)允侵苯哟蜷_EXCEL95、97及2000數(shù)據(jù)文件的唯一辦法。2021/6/28年11月30日26西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心ODBC數(shù)據(jù)引擎是獨(dú)立與各種應(yīng)用軟件,直接安裝到Windows系統(tǒng)中的,因此你所用的系統(tǒng)中ODBC所支持的數(shù)據(jù)類型取決于所安裝的ODBC引擎的情況。還好,大多數(shù)支持該接口的軟件都會(huì)在安裝光盤上附送該引擎的安裝文件(如MSOffice)。不過有一點(diǎn)要提醒大家,許多機(jī)器的OBDC數(shù)據(jù)引擎安裝有問題(尤其是D版),在SPSS中使用它往往要死機(jī)。選擇菜單File==>OpenDatabase==>NewQuery,系統(tǒng)會(huì)彈出數(shù)據(jù)庫向?qū)У牡谝粋€(gè)窗口,其中會(huì)列出你使用的機(jī)器上已安裝的所有數(shù)據(jù)庫驅(qū)動(dòng)程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)?huì)一步一步的提示你如何做,直至將數(shù)據(jù)讀入SPSS。2021/6/28年11月30日27西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.5.3使用文本導(dǎo)入向?qū)ёx入文本文件選擇菜單File==>ReadTextData,系統(tǒng)就會(huì)彈出OpenFile對話框,對!和前面的情況完全一樣,只是文件類型自動(dòng)跳到了Text(*.txt)。實(shí)際上,該功能在SPSS中已被整合到了OpenFile對話框中之所以在菜單上保留該條目有兩個(gè)原因:1.讀入純文本的情況非常普遍,放在這里更加醒目;2.為了和SPSS老版本的使用上保持兼容。例2.1現(xiàn)有一數(shù)據(jù)文件以純文本的形式存為“c:\Li2_1.txt”,且第一行為變量名,請將其讀入SPSS。解:在OpenFile對話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會(huì)自動(dòng)啟動(dòng)文本導(dǎo)入向?qū)υ捒蛉缦拢?021/6/28年11月30日28西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日29西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.6編輯數(shù)據(jù)文件在SPSS中,數(shù)據(jù)文件的編輯、整理等功能被集中在了Data和Transform兩個(gè)菜單項(xiàng)中,這兩個(gè)菜單的內(nèi)容如下所示:Data菜單項(xiàng)Transform菜單項(xiàng)2021/6/28年11月30日30西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.6.1定義新變量直接定義新變量大多數(shù)情況下我們需要從頭定義變量,在SPSS10.0中,定義變量只需單擊左下方的VariableView標(biāo)簽就可以切換到變量定義界面開始定義新變量。如Li1_1.sav的變量定義如下所示:2021/6/28年11月30日31西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心以變量x為例:變量名為x,類型為Numeric,寬度為4,小數(shù)位數(shù)2位(因小數(shù)點(diǎn)還要占一位,故整數(shù)位只有一位),變量標(biāo)簽位為“血磷值”。右側(cè)在圖中未能看到的依次為Values,用于定義具體變量值的標(biāo)簽;Missing,用于定義變量缺失值;Colomns,定義顯示列寬;Align,定義顯示對齊方式;Measure,定義變量類型是連續(xù)、有序分類還是無序分類。使用該窗口,我們可以一次定義許多新變量,不會(huì)象老版本那樣一個(gè)一個(gè)的定義了。2021/6/28年11月30日32西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心標(biāo)簽和老版本不同,現(xiàn)在變量標(biāo)簽和變量值標(biāo)簽被分開設(shè)置,變量標(biāo)簽就在Label框中直接輸入,變量值標(biāo)簽則在它右側(cè)的Value框定義。以group為例,單擊Value框右半部的省略號(hào),會(huì)彈出變量值標(biāo)簽對話框如右:上部的兩個(gè)文本框分別為變量值輸入框和變量值標(biāo)簽輸入框,分別在其中輸入“1”和“克山病患者”,此時(shí)下方的Add鈕變黑,單擊它,該變量值標(biāo)簽就會(huì)被加入下方的標(biāo)簽框內(nèi)。與此類似定義變量值“2”為“健康人”,最后按OK,變量值標(biāo)簽就設(shè)置完成。此時(shí)你做任何分析,在結(jié)果中都有相應(yīng)的標(biāo)簽出現(xiàn)。如果你現(xiàn)在就想看效果,切換回DataView界面,然后選擇菜單View==>ValueLabels,怎么樣,看到了嗎?2021/6/28年11月30日33西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心缺失值單擊missing框右側(cè)的省略號(hào),會(huì)彈出缺失值對話框如下:界面上有一列三個(gè)單選鈕,默認(rèn)值為最上方的“無缺失值”;第二項(xiàng)為“不連續(xù)缺失值”,最多可以定義3個(gè)值;最后一項(xiàng)為“缺失值范圍加可選的一個(gè)缺失值”2021/6/28年11月30日34西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心ComputeVariable對話框這主要用于對原變量通過一定的計(jì)算,產(chǎn)生新變量的方法。例3.2在li1_1.sav中建立新變量temp,令其值當(dāng)血磷值大于1時(shí)為2,否則為1。首先給變量temp均賦值為1,然后將血磷值大于1的記錄其temp變量值改為2即可。第一步:選擇菜單Transform==>Compute,彈出ComputeVariable對話框如下:2021/6/28年11月30日35西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心左上角為需要計(jì)算的變量名,在其中鍵入“temp”,此時(shí)“Type&Lable”按鈕就會(huì)變黑,喜歡精確的朋友可以在這里對temp進(jìn)行詳細(xì)的定義;左下方為候選變量列表,現(xiàn)在還用不著;中部為類似計(jì)算器的軟鍵盤,可以用鼠標(biāo)按鍵輸入數(shù)字和符號(hào),這里我們直接輸入“1”,輸入的內(nèi)容回立刻在右上方的數(shù)值表達(dá)式窗口中出現(xiàn);軟鍵盤右側(cè)為函數(shù)窗口,可以在這里找到并使用所需的SPSS函數(shù);這次也用不到。好,現(xiàn)在“OK”按鈕已經(jīng)變黑,單擊他,系統(tǒng)就會(huì)自動(dòng)生成一個(gè)新變量temp,并且取值均為1。2021/6/28年11月30日36西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心第二步,再次選擇菜單Transform==>Compute,系統(tǒng)也再次彈出這個(gè)對話框,將數(shù)值表達(dá)式窗口中的1改為2,然后單擊中下部的“If”按鈕,系統(tǒng)彈出記錄選擇對話框如下:2021/6/28年11月30日37西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Count對話框Count對話框用于計(jì)算某個(gè)值或某些值在某個(gè)變量的取值中是否出現(xiàn)(好象有點(diǎn)拗口),比如我們想看看有哪些記錄的血磷值在2~3之間,選擇菜單Transform==>Count,系統(tǒng)彈出Count對話框如下:2021/6/28年11月30日38西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日39西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心TargetVariable框中用于指定記錄變量值是否出現(xiàn)的變量名,在這里輸入temp2;選中血磷值(x),將其選入Variables窗口,此時(shí)“DefineValues”按鈕變黑,單擊它,系統(tǒng)彈出變量值定義窗口如下:2021/6/28年11月30日40西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心左半部為變量值定義窗口,可以定義某個(gè)值、系統(tǒng)缺失值、系統(tǒng)或用戶定義缺失值、變量值范圍、小于某值或大于某值。我們這里是第四種情況:選擇Range,在through兩側(cè)分別鍵入2、3,然后單擊已變黑的“Add”按鈕,“2thru3”就會(huì)被加入“ValuestoCount”框內(nèi)。然后單擊“Continue”,再單擊Count對話框的“OK”,可以看到系統(tǒng)自動(dòng)生成變量temp2,其中10、11號(hào)記錄因血磷值介于2和3之間,temp2取值為1,其余的記錄temp2取值均為0。2021/6/28年11月30日41西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Recode對話框Recode對話框用于從原變量值按照某種一一對應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量,也可以生成一個(gè)新變量。例2.3在Li1_1.sav中生成新變量temp3,當(dāng)血磷值小于1時(shí)取值為0,1~2時(shí)取值為10,大于2時(shí)取值為20。解:選擇菜單Transform==>Record==>IntoDifferentVariables,2021/6/28年11月30日42西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1、OutputVariable框:選入x2、OutputVariableName框:鍵入temp3:單擊Change鈕3、選中x->temp3:單擊OldandNewValues鈕:4、Range:Lowestthrough單選鈕:鍵入1:NewValueValue單選鈕:鍵入0:單擊Add鈕5、Range:through單選鈕:兩側(cè)分別鍵入1、2:NewValueValue單選鈕:鍵入10:單擊Add鈕6、Range:Allothervalues單選鈕:NewValueValue單選鈕:鍵入20:單擊Add鈕7、單擊Continue8、單擊OK步驟:2021/6/28年11月30日43西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心CategorizeVariables對話框CategorizeVariables對話框用于將連續(xù)性變量自動(dòng)按要求分成等間距的幾類。其界面非常簡單,許多東西都是我們所熟悉的,唯一特別的是右下方的numberofcategories框,用于輸入變量的等級數(shù),默認(rèn)為4,比如我們希望將血磷值按大小分成5個(gè)等級,先將血磷值選入CreateCategories框,然后將下面的4改為5,單擊OK,就會(huì)看到系統(tǒng)產(chǎn)生了一個(gè)新變量nx(即numberofx之意),其取值就對應(yīng)了血磷值相應(yīng)的5個(gè)等級(1~5)。重復(fù)一下,具體操作步驟為:1、reateCategories框:選入x2、Numberofcategories框:53、OK2021/6/28年11月30日44西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心RankCases對話框例2.4請分組計(jì)算血磷值的秩和。解:選擇菜單Transform==>RankCases,彈出RankCases對話框2021/6/28年11月30日45西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心將血磷值選入Variable框,分組變量選入By框,單擊OK即可。系統(tǒng)會(huì)建立一個(gè)新變量rx(即原變量名前加r表示Rank之意),其取值為x分組的秩次。解釋一下RankCases對話框的其他幾個(gè)零件:左下角的AssignRank1to框架用于選擇將秩次1賦給最小值還是最大值;中下部的Displaysummarytables復(fù)選框用于確定是否在結(jié)果窗口內(nèi)輸出結(jié)果報(bào)表;RankTypes鈕用于定義秩次類型,有Rank(秩分?jǐn)?shù))、Savage評分(新變量值按指數(shù)分布)、Fractionalrank(新變量值是秩分?jǐn)?shù)除以非缺失值觀測量的權(quán)重之和)、Fractionalrank%(新變量值是秩分?jǐn)?shù)除以非缺失值觀測量數(shù)乘100)、Sumofcaseweights(新變量值是各觀測量的權(quán)重之和)、Ntiles(新變量值是按所選變量的百分位數(shù)分組的組序號(hào)),默認(rèn)值為Rank。單擊More按鈕,還會(huì)有更多的設(shè)置,這里就不再講了。2021/6/28年11月30日46西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心AutomaticRecord對話框CreateTimeSeries對話框ReplaceMissingValue對話框該對話框用于按原變量值的大小生成新變量,變量值就是原值的大小次序,功能和RankCases對話框重復(fù)(等價(jià)于相同值觀測量當(dāng)作一個(gè)記錄處理的情況)。用于自動(dòng)生成時(shí)間序列變量用于填充缺失值,結(jié)果存入一個(gè)新變量。填充方法有:序列的均數(shù)、相鄰若干點(diǎn)的均數(shù)、相鄰若干點(diǎn)的中位數(shù)、線性內(nèi)插、線性外延,默認(rèn)值為序列的均數(shù)。2021/6/28年11月30日47西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.6.2數(shù)據(jù)錄入技巧連續(xù)多個(gè)相同值的輸入如前面group變量有連續(xù)多個(gè)1,如果直接輸入,可以在第一格內(nèi)輸入1并回車,然后回到剛才的單元格并單擊右鍵,選擇copy,最后用拖放方式選中所有應(yīng)輸入1的單元格,單擊右鍵并選擇paste,所有選中的單元格就會(huì)都被剛才拷貝的1填充。將EXCEL數(shù)據(jù)直接引入SPSSExcel已經(jīng)打開原數(shù)據(jù),并且數(shù)據(jù)量較少的時(shí)候,可以直接用拷貝粘貼的方法將數(shù)據(jù)引入SPSS:先在EXCEL中選中所有的數(shù)據(jù)(不包括變量名),然后選擇拷貝命令;然后切換到SPSS,最好使行1列1單元格成為當(dāng)前單元格,然后執(zhí)行粘貼命令,數(shù)據(jù)就會(huì)全部轉(zhuǎn)入SPSS,再定義相應(yīng)的變量即可。2021/6/28年11月30日48西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心§1.7進(jìn)一步整理數(shù)據(jù)文件--Data菜單在許多情況下,我們需要先對數(shù)據(jù)進(jìn)行一些整理(如分組、合并、加權(quán)等)才能將其用于最終的統(tǒng)計(jì)分析。這些功能基本上都集中在Data菜單項(xiàng)中,下面我們就對這些對話框做逐一介紹。2021/6/28年11月30日49西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.7.1用于數(shù)據(jù)管理的菜單項(xiàng)1.7.1SortCases對話框主要用于對數(shù)據(jù)排序。2021/6/28年11月30日50西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心例2.5對數(shù)據(jù)集li1_1.sav按group升序,x降序的次序排列。解:選擇菜單Data==>SortCases,系統(tǒng)彈出SortCases對話框,該對話框并不復(fù)雜,其中比較特殊的是下方的SortOrder單選鈕,有升序和降序兩種選擇。請注意,該單選鈕是和上方的SortBy框一起使用的,具體方法如下:確認(rèn)升序單選鈕被選擇,將Group選入SortBy框;選擇降序單選鈕,將x選入SortBy框。請注意:group和x后面分別跟著Ascending和Descending,表明前者是按升序、后者按降序排列;由于Group在前,因此排序時(shí)以Group優(yōu)先。2021/6/28年11月30日51西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Transepose對話框該對話框用于對數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置,可以在原數(shù)據(jù)文件中指定一個(gè)變量記錄轉(zhuǎn)置后的變量名。原變量名則自動(dòng)保存在系統(tǒng)產(chǎn)生的名為case_lbl的字符變量中。該對話框也非常簡單,左側(cè)為候選變量框;右上方為Variable框,用于選入需要轉(zhuǎn)置的變量,一般應(yīng)選入除名稱變量外的所有其他變量,如果有變量未選入,則轉(zhuǎn)置時(shí)會(huì)被自動(dòng)丟棄;右下方為NameVariable框,用于指定原數(shù)據(jù)文件中記錄轉(zhuǎn)置后變量名的字符變量,但不是必需的,此時(shí)系統(tǒng)會(huì)將新變量自動(dòng)按var001、var002...的順序命名。2021/6/28年11月30日52西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心MergeFiles對話框用于合并數(shù)據(jù)文件,實(shí)際上包括了兩個(gè)對話框,分別對應(yīng)了兩種合并方式:1.從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,稱為縱向合并,用AddCases對話框完成,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。選擇菜單Data==>MergeFiles==>AddCases,系統(tǒng)首先彈出打開數(shù)據(jù)文件對話框,選中需要添加的數(shù)據(jù)文件并按OK,系統(tǒng)才彈出AddCases對話框,左側(cè)顯示的是新、老數(shù)據(jù)文件中不匹配的變量名,右側(cè)顯示的是已經(jīng)匹配的變量名??梢杂肦ename按鈕對不匹配變量改名(先選中)或用鼠標(biāo)強(qiáng)行匹配(即先按Ctrl鍵選中匹配的兩個(gè)變量再單擊Pair鈕)。右下方的Indicatecasesourceasvariable復(fù)選框用于定義一個(gè)新變量以區(qū)分哪些記錄是后來添加的。選擇停當(dāng)后單擊OK,該操作就完成了。2021/6/28年11月30日53西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心實(shí)際上右側(cè)顯示的是將要包括在合并后數(shù)據(jù)集中的變量,如果有哪個(gè)你不需要,把它弄到左側(cè)框中即可。2.從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,稱為橫向合并,用AddVariable對話框完成,相互合并的數(shù)據(jù)文件中應(yīng)包含同樣的記錄。選擇菜單Data==>MergeFiles==>AddVariable對話框,系統(tǒng)同樣先彈出打開數(shù)據(jù)文件對話框,單擊OK后彈出和前面相似的AddVariable對話框。按需選擇即可。2021/6/28年11月30日54西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Aggregate對話框用于對數(shù)據(jù)進(jìn)行分類匯總,所謂分類匯總就是按指定的分類變量對觀測值進(jìn)行分組,對每組記錄的各變量值求指定的描述統(tǒng)計(jì)量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。2021/6/28年11月30日55西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日56西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心上圖中各個(gè)零件的含義如下:BreakVariables框:用于選擇分組變量;AggregateVariables框:用于選擇被匯總的變量;Name&Label鈕:用于定義新產(chǎn)生的匯總變量的名稱和標(biāo)簽;Function鈕:用于定義匯總函數(shù),共有三組函數(shù),以最常用的第一組為例,可選的函數(shù)有均數(shù)、同組的第一個(gè)觀測值、最后一個(gè)觀測值、同組記錄數(shù)、標(biāo)準(zhǔn)差、最小值、和、最大值共8個(gè);SaveNumberofcasesinbreakgroupasvariable復(fù)選框:用于定義一個(gè)新變量以存儲(chǔ)同組的記錄數(shù);Createnewdatafile單選鈕:定義一個(gè)新文件以存儲(chǔ)匯總的結(jié)果,右側(cè)的File鈕用于具體文件名的定義,默認(rèn)文件名為AGGR.sav;Replaceworkingdatafile單選鈕:用匯總的結(jié)果替換原來的數(shù)據(jù)。2021/6/28年11月30日57西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心例2.6計(jì)算Li1_1.sav中兩組的血磷值標(biāo)準(zhǔn)差。解:該題完全可以用更簡單的方法完成,這里只是演示一下匯總對話框的用法。1、BreakVariables框:Group2、AggregateVariables框:x3、Function鈕:(Standarddeviation單選鈕:Continue鈕)4、Replaceworkingdatafile單選鈕:選中5、OK2021/6/28年11月30日58西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心SplitFile對話框用于將數(shù)據(jù)文件分組進(jìn)行處理,該對話框我們在第一章時(shí)已經(jīng)使用過了,這里再介紹一下各個(gè)對話框元素的用途:Analyzeallcases單選框:和下面的兩個(gè)單選框?yàn)橐唤M,選中本框不拆分文件;Comparegroups單選框:按所選變量拆分文件,各組分析結(jié)果緊挨在一起便于相互比較;Organizeoutputbygroups單選框:按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置;Groupsbasedon框:用于選擇拆分?jǐn)?shù)據(jù)文件的變量;Sortthefilebygroupingvariables單選框:將數(shù)據(jù)按所用的拆分變量排序;Fileisalreadysorted單選框:數(shù)據(jù)保持原狀,不按所用的拆分變量排序。2021/6/28年11月30日59西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心SelectCases對話框很多時(shí)候我們不需要分析全部的數(shù)據(jù),而是按某種要求分析其中的一部分(比如只分析男性的身高、只對前200個(gè)數(shù)據(jù)進(jìn)行分析以了解大概情況),這時(shí)使用SelectCases對話框可以大大簡化工作。該對話框界面如下所示:2021/6/28年11月30日60西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2021/6/28年11月30日61西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心其中主要的對話框元素為:Allcases單選鈕:和下面的4個(gè)單選鈕為一組,選中它則分析所有的記錄;Ifconditionissatisfied單選鈕:只分析滿足條件的記錄;
If按鈕:和If單選鈕一起使用,單擊后彈出If對話框;Randomsampleofcases單選鈕:從原數(shù)據(jù)中按某種條件抽樣;
Sample按鈕:和Random單選鈕一起使用,可以設(shè)定按百分比抽取記錄,或者精確設(shè)定從前若干個(gè)記錄中抽取多少個(gè)記錄;Basedontimeorcaserange單選鈕:基于記錄序號(hào)來選擇記錄;2021/6/28年11月30日62西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Range按鈕:和Based單選鈕一起使用,用于輸入記錄序號(hào)范圍;Usefiltervariable單選鈕:使用篩選指示變量來選擇記錄,必需在下面選入一個(gè)篩選指示變量,該變量取值為非0的記錄將被選中,進(jìn)入以后的分析;Filtered單選鈕:和下面的Deleted單選鈕為一組,表示未被選中的記錄只是被隔離,這些記錄的記錄號(hào)會(huì)被加上斜杠以示區(qū)別;Deleted單選鈕:未被選中的記錄將被刪除,一般不要使用。當(dāng)對數(shù)據(jù)集做出篩選后,所做的篩選將在以后的分析中一直有效,直到再次改變選擇條件為止。同時(shí)在多數(shù)情況下,系統(tǒng)會(huì)自動(dòng)產(chǎn)生一個(gè)名為filter_$的篩選指示變量,被選中的記錄該變量取值為1,反之則為0。2021/6/28年11月30日63西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心WeightCases對話框在默認(rèn)情況下,每一行就是一條記錄,這在多數(shù)情況下沒有什么問題,但有時(shí)卻非常麻煩,想想看如果你需要計(jì)算一個(gè)四格表卡方,有100例,如果每一行就是一條記錄,你就需要輸入100條記錄!如果希望在計(jì)算過程中利用不同的變量對數(shù)據(jù)進(jìn)行加權(quán)處理,就需要用到WeightCases對話框。該對話框的使用極為簡單,界面上有兩個(gè)單選鈕,分別是不權(quán)重記錄和用某變量權(quán)重記錄,如果選擇后者,則需要選中一個(gè)權(quán)重變量。2021/6/28年11月30日64西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Data菜單中的其余對話框Definedates對話框:可以自動(dòng)生成時(shí)間變量。InsertVariable命令:在當(dāng)前列插入新變量。Insertcases命令:在當(dāng)前行插入新記錄。Gotocases對話框:到達(dá)指定記錄號(hào)的記錄,該命令在記錄數(shù)極多時(shí)(1000條以上)非常有用。2021/6/28年11月30日65西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.7.2正交設(shè)計(jì)菜單項(xiàng)正交設(shè)計(jì)不包含在SPSS/BASE模塊中,因此由于解密范圍的問題,有的盜版中不含該菜單項(xiàng)。在SPSS中可以直接進(jìn)行正交設(shè)計(jì),OrthogonalDesign子菜單項(xiàng)就是專門用于完成該任務(wù)的,具體做法用下面的例子說明如下:2021/6/28年11月30日66西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心解:選擇Data-->OrthogonalDesign-->generate,彈出的就是正交設(shè)計(jì)窗口,操作如下:1、Factorname框:輸入A;單擊ADD鈕;2、確定變量A被選中,單擊Definevalue鈕;3、Value列:頭三行分別輸入1、2和3,代表變量A的三個(gè)水平;單擊continue鈕;4、Factorname框:輸入B;單擊ADD鈕;5、確定變量B被選中,單擊Definevalue鈕;6、Value列:頭兩行分別輸入1、2,代表變量B的兩個(gè)水平;單擊continue鈕;7、單擊OK例2.7做A、B兩個(gè)因素的正交設(shè)計(jì),A因素有三個(gè)水平,B因素有兩個(gè)水平。2021/6/28年11月30日67西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心在第7步定義完后,對話框應(yīng)如下圖所示:2021/6/28年11月30日68西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心在其他沒有用到的選擇項(xiàng)中,各種LABELS當(dāng)然適用于定義相應(yīng)的各種標(biāo)簽的;DataFiles單選框組用來定義產(chǎn)生的數(shù)據(jù)文件是存為制定的文件名,還是直接替換當(dāng)前工作文件;而DefineValue對話框中的Autofit框可以自動(dòng)填充從1到你輸入的那個(gè)數(shù)值這么多個(gè)水平的定義。這里我們直接替換當(dāng)前工作文件,在這個(gè)自動(dòng)產(chǎn)生的正交設(shè)計(jì)數(shù)據(jù)集中,前兩個(gè)變量就是要分析的A和B,各個(gè)水平已經(jīng)按正交設(shè)計(jì)的要求排列好了。后面的status_和card_變量是系統(tǒng)產(chǎn)生的LOG變量,可以不管它?,F(xiàn)在你再建立一個(gè)結(jié)果變量,輸入實(shí)驗(yàn)結(jié)果,就可以進(jìn)行正交設(shè)計(jì)的分析了。2021/6/28年11月30日69西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心附件:論統(tǒng)計(jì)軟件中的數(shù)據(jù)錄入格式統(tǒng)計(jì)分析是科研中的必要環(huán)節(jié),統(tǒng)計(jì)軟件則是進(jìn)行統(tǒng)計(jì)分析的利器。但是,在計(jì)算機(jī)已逐漸普及的今天,統(tǒng)計(jì)軟件卻仍讓人感到幾分神秘:除了大型統(tǒng)計(jì)軟件都還沒有中文版這一原因,統(tǒng)計(jì)軟件在許多小的方面也有自己的特點(diǎn),往往就是這些小地方就會(huì)讓許多人深入寶山而空返。今天我們就來談?wù)勈褂媒y(tǒng)計(jì)軟件時(shí)一個(gè)最基本而又非常重要的問題--數(shù)據(jù)錄入格式。簡言之,我們平時(shí)往往用表格的形式來記錄數(shù)據(jù),這并無不妥。問題在于當(dāng)進(jìn)行統(tǒng)計(jì)分析時(shí),如果我們直接將數(shù)據(jù)按平時(shí)記錄的格式來進(jìn)行分析,那就很可能不得其門而入--因?yàn)榇蠖鄶?shù)統(tǒng)計(jì)軟件對數(shù)據(jù)格式都有著特定的格式要求,下面我們就舉一些常見的情況來解釋這一問題。2021/6/28年11月30日70西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1.單組或多組數(shù)據(jù)平時(shí)我們多記錄成"第1組、第2組、第3組..."等等,如表一左側(cè)所示。樣本含量相等或不等。主要用于成組資料比較的t、F或秩和檢驗(yàn)等。這種記錄格式姑且稱為統(tǒng)計(jì)表格格式,在各種統(tǒng)計(jì)軟件中,該數(shù)據(jù)通用的分析格式如表一右側(cè)所示,我們把這種格式稱為統(tǒng)計(jì)分析格式。2021/6/28年11月30日71西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心②統(tǒng)計(jì)分析格式
1,0.1
1,0.2
1,0.3
2,0.4
2,0.5
3,0.6
3,0.7
3,0.8
3,0.9表一①統(tǒng)計(jì)表格格式看出來區(qū)別了嗎?統(tǒng)計(jì)分析格式中第一列為“分組變量”,指示所在的組號(hào);第二列為原始數(shù)據(jù)?,F(xiàn)在再回到SPSS等統(tǒng)計(jì)軟件的菜單去,做one-wayANOVA(成組的方差分析)知道怎么選變量了吧!2021/6/28年11月30日72西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2.配伍組數(shù)據(jù)
平時(shí)的記錄格式同上面相似。主要用于配伍組資料比較或秩和檢驗(yàn)等。見表二:表二①統(tǒng)計(jì)表格格式②統(tǒng)計(jì)分析格式1,1,0.1
1,2,0.2
2,1,0.3
2,2,0.4
3,1,0.5
3,2,0.6統(tǒng)計(jì)分析格式中第一列為“第一分組變量”,指示所在的組號(hào);第二列為“第二分組變量”,指示在該組的序號(hào),第三列為原始數(shù)據(jù);2021/6/28年11月30日73西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心3.單組成對數(shù)據(jù)變量名分別為:X、Y,要求樣本含量相等。主要用于配對計(jì)量資料比較的t、秩和檢驗(yàn);直線回歸與相關(guān);曲線擬合等,格式見表三。表三①統(tǒng)計(jì)表格格式②統(tǒng)計(jì)分析格式0.1,0.40.2,0.50.3,0.6兩種格式?jīng)]有區(qū)別,但請注意,如果配對資料轉(zhuǎn)用方差分析來處理,則相應(yīng)的也要變換格式。2021/6/28年11月30日74西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心4.多組成對數(shù)據(jù)主要用于協(xié)方差分析,格式見表四。表四①統(tǒng)計(jì)表格格式②統(tǒng)計(jì)分析格式1,0.1,0.31,0.2,0.42,0.5,0.82,0.6,0.92,0.7,1.0在統(tǒng)計(jì)分析格式中,第一列為對子組號(hào),第二列與第三列分別為該組的對子X、Y。2021/6/28年11月30日75西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心第二章SPSS功能介紹及其應(yīng)用舉例描述性統(tǒng)計(jì)分析--DescriptiveStatistics菜單均數(shù)間的比較--CompareMeans菜單一般線性模型――GeneralLinearModel菜單相關(guān)分析――Correlate菜單多元線性回歸與曲線擬合――Regression菜單對數(shù)線性模型——Loglinear菜單聚類分析與判別分析——Classify菜單因子分析與對應(yīng)分析——DataReduction菜單信度分析與多維尺度分析——Scale菜單非參數(shù)檢驗(yàn)――NonparametricTests菜單Survival菜單第一節(jié)SPSS的主要分析工具——Analyze菜單2021/6/28年11月30日76西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心1、描述性統(tǒng)計(jì)分析--DescriptiveStatistics菜單1.1
Frequencies過程的特色是產(chǎn)生頻數(shù)表1.2
Descriptives過程進(jìn)行一般性的統(tǒng)計(jì)描述;1.3
Explore過程用于對數(shù)據(jù)概況不清時(shí)的探索性分析;1.4
Crosstabs過程則完成計(jì)數(shù)資料和等級資料的統(tǒng)計(jì)描述和一般的統(tǒng)計(jì)檢驗(yàn),我們常用的X2檢驗(yàn)也在其中完成。描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步,做好這第一步是下面進(jìn)行正確統(tǒng)計(jì)推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專門為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在DescriptiveStatistics菜單中,最常用的是列在最前面的四個(gè)過程:2021/6/28年11月30日77西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2、均數(shù)間的比較--CompareMeans菜單該菜單集中了幾個(gè)用于計(jì)量資料均數(shù)間比較的過程。具體有:2.1Means過程對準(zhǔn)備比較的各組計(jì)算描述指標(biāo),進(jìn)行預(yù)分析,也可直接比較。2.2One-SamplesTTest過程進(jìn)行樣本均數(shù)與已知總體均數(shù)的比較。2.3Independent-SamplesTTest過程進(jìn)行兩樣本均數(shù)差別的比較,即通常所說的兩組資料的t檢驗(yàn)。2.4Paired-SamplesTTest過程進(jìn)行配對資料的顯著性檢驗(yàn),即配對t檢驗(yàn)。2.5One-WayANOVA過程進(jìn)行兩組及多組樣本均數(shù)的比較,即成組設(shè)計(jì)的方差分析,還可進(jìn)行隨后的兩兩比較。2021/6/28年11月30日78西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心3、一般線性模型――GeneralLinearModel菜單
一般線性模型可不是用一章就可以說清楚的,因?yàn)樗ǖ膬?nèi)容實(shí)在太多了。那么,究竟我們用到的哪些分析會(huì)包含在其中呢?簡而言之:凡是和方差分析粘邊的都可以用他來做。比如成組設(shè)計(jì)的方差分析(即單因素方差分析)、配伍設(shè)計(jì)的方差分析(即兩因素方差分析)、交叉設(shè)計(jì)的方差分析、析因設(shè)計(jì)的方差分析、重復(fù)測量的方差分析、協(xié)方差分析等等。因此,能真正掌握GLM菜單的用法,會(huì)使大家的統(tǒng)計(jì)分析能力有極大地提高。實(shí)際上一般線性模型包括的統(tǒng)計(jì)模型還不止這些,我這里舉出來的只是從用SPSS作統(tǒng)計(jì)分析的角度而言的一些。2021/6/28年11月30日79西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心好了,既然一般線性模型的能力如此強(qiáng)大,那么下屬的四個(gè)子菜單各自的功能是什么呢?請看:3.1Univariate子菜單:四個(gè)菜單中的大哥大,絕大部分的方法分析都在這里面進(jìn)行。3.2Multivariate子菜單:當(dāng)結(jié)果變量(應(yīng)變量)不止一個(gè)時(shí),可用他來分析。3.3RepetedMeasures子菜單:顧名思義,重復(fù)測量的數(shù)據(jù)就要用他來分析;用前兩個(gè)菜單似乎都可以分析出來結(jié)果,但在許多情況下該結(jié)果是不正確的,應(yīng)該用重復(fù)測量的分析方法才對。3.4VarianceComponents子菜單:用于作方差成份模型的(這個(gè)模型實(shí)在太深,不是一時(shí)半會(huì)說的請的,所以我在這里就干脆不講了)。2021/6/28年11月30日80西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心4、相關(guān)分析――Correlate菜單在數(shù)據(jù)分析中經(jīng)常要遇到分析兩個(gè)或多個(gè)變量間關(guān)系的情況,有時(shí)是希望了解某個(gè)變量對另一個(gè)變量的影響強(qiáng)度,有時(shí)則是要了解變量間聯(lián)系的密切程度,前者用下一章將要講述的回歸分析來實(shí)現(xiàn),后者則需要用到本章所要講述的相關(guān)分析實(shí)現(xiàn)。SPSS的相關(guān)分析功能被集中在Analyze菜單的Correlate子菜單中,他一般包括以下三個(gè)過程:2021/6/28年11月30日81西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心4.1Bivariate過程此過程用于進(jìn)行兩個(gè)/多個(gè)變量間的參數(shù)/非參數(shù)相關(guān)分析,如果是多個(gè)變量,則給出兩兩相關(guān)的分析結(jié)果。這是Correlate子菜單中最為常用的一個(gè)過程,實(shí)際上我們對他的使用可能占到相關(guān)分析的95%以上。4.2Partial過程如果需要進(jìn)行相關(guān)分析的兩個(gè)變量其取值均受到其他變量的影響,就可以利用偏相關(guān)分析對其他變量進(jìn)行控制,輸出控制其他變量影響后的相關(guān)系數(shù),這種分析思想和協(xié)方差分析非常類似。Partial過程就是專門進(jìn)行偏相關(guān)分析的。4.3Distances過程調(diào)用此過程可對同一變量內(nèi)部各觀察單位間的數(shù)值或各個(gè)不同變量間進(jìn)行距離相關(guān)分析,前者可用于檢測觀測值的接近程度,后者則常用于考察預(yù)測值對實(shí)際值的擬合優(yōu)度。該過程在實(shí)際應(yīng)用中用的非常少。2021/6/28年11月30日82西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心5、多元線性回歸與曲線擬合――Regression菜單回歸分析是處理兩個(gè)及兩個(gè)以上變量間線性依存關(guān)系的統(tǒng)計(jì)方法。回歸分析就是用于說明這種依存變化的數(shù)學(xué)關(guān)系。下面三個(gè)過程是Regression菜單的子菜單,是SPSS提供的用于回歸分析的工具:5.1Linear過程——調(diào)用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。5.2CurveEstimation過程——CurveEstimation過程可以用與擬合各種各樣的曲線,原則上只要兩個(gè)變量間存在某種可以被它所描述的數(shù)量關(guān)系,就可以用該過程來分析。但這里我們要指出,由于曲線擬合非常的復(fù)雜,而該模塊的功能十分有限,因此最好采用將曲線相關(guān)關(guān)系通過變量變換的方式轉(zhuǎn)化為直線回歸的形式來分析,或者采用其他專用的模塊分析。2021/6/28年11月30日83西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心5.3BinaryLogistic過程——所謂Logistic模型,或者說Logistic回歸模型,就是人們想為兩分類的應(yīng)變量作一個(gè)回歸方程出來,可概率的取值在0~1之間,回歸方程的應(yīng)變量取值可是在實(shí)數(shù)集中,直接做會(huì)出現(xiàn)0~1范圍之外的不可能結(jié)果,因此就有人耍小聰明,將率做了一個(gè)Logit變換,這樣取值區(qū)間就變成了整個(gè)實(shí)數(shù)集,作出來的結(jié)果就不會(huì)有問題了,從而該方法就被叫做了Logistic回歸。隨著模型的發(fā)展,Logistic家族也變得人丁興旺起來,除了最早的兩分類Logistic外,還有配對Logistic模型,多分類Logistic模型、隨機(jī)效應(yīng)的Logistic模型等。由于SPSS的能力所限,對話框只能完成其中的兩分類和多分類模型,下面我們就介紹一下最重要和最基本的兩分類模型。2021/6/28年11月30日84西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心6、對數(shù)線性模型——Loglinear菜單對數(shù)線性模型是一種純粹應(yīng)用于分類變量分析的多元統(tǒng)計(jì)方法。它是一種比較新型的分析方法,在分析高維列聯(lián)表時(shí)優(yōu)勢尤為突出。由以下三個(gè)過程組成:6.1General過程——用于進(jìn)行一般對數(shù)線性模型分析,主要用于證實(shí)性研究。此時(shí)研究人員只對某些特定效應(yīng)感興趣,即已經(jīng)有關(guān)于模型的假設(shè),此時(shí)就可以采用一般模型來檢驗(yàn)這一假設(shè)是否正確、充分,它可以對總模型和各個(gè)參數(shù)給出詳細(xì)的檢驗(yàn)結(jié)果。對變量不分因變量自變量,在分析中一視同仁,最后在結(jié)果解釋時(shí)才由研究人員來做出判斷。6.2Logit過程——當(dāng)研究人員已經(jīng)有了一些線索,知道因變量自變量時(shí),如果應(yīng)變量為兩分類,就可以用這個(gè)過程來分析。6.3ModelSelection過程——分層對數(shù)線性模型。一般線性對數(shù)模型可以對每個(gè)系數(shù)及總模型給出非常豐富和詳細(xì)的信息,但是它要求研究人員心中已經(jīng)有了一定的思路或線索,或只對某些特定效應(yīng)項(xiàng)感興趣,即已經(jīng)有關(guān)于簡約模型的假設(shè)。如果在探索性分析中研究人員中只是設(shè)想若干分類變量之間可能有關(guān)系,但是并無明確假設(shè),也沒有具體分出哪個(gè)是應(yīng)變量、哪個(gè)是自變量,此時(shí)比較適宜采用分層對數(shù)線性模型分析。2021/6/28年11月30日85西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心7、聚類分析與判別分析——Classify菜單聚類分析和判別分析都是將記錄或變量分類的方法,所不同的是聚類分析是把沒有分類信息的資料按相似程度歸類,有一定探索性的味道;而類別分析則是從已知的分類情況中總規(guī)律,為以后判斷新觀測所屬類別提供依據(jù)。Classify菜單提供如下三個(gè)過程:7.1K-meansCluster過程——對記錄進(jìn)行快速聚類,當(dāng)明確所需要分出的類別數(shù)時(shí),采用快速聚類可以節(jié)省運(yùn)算時(shí)間。根據(jù)經(jīng)驗(yàn),如果樣本量大于100,則有必要考慮是否使用快速聚類。7.2HierarchicalCluster過程——習(xí)慣上翻譯成系統(tǒng)聚類法,該過程提供了全面而強(qiáng)大的聚類分析能力,可對記錄或變量進(jìn)行聚類。更為重要的是,參與系統(tǒng)聚類分析的變量不再像快速聚類一樣限于連續(xù)性變量,它們可以是兩分類或多分類變量。7.3Discriminant過程——提供了全面的類別分析功能,所用變量可一次進(jìn)入,也可以使用逐步法篩選出最優(yōu)類別方程。2021/6/28年11月30日86西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心8、因子分析與對應(yīng)分析——DataReduction菜單該方法主要目的都是濃縮數(shù)據(jù),或稱數(shù)據(jù)化簡,即以最少的信息丟失為代價(jià)將眾多的觀測變量濃縮為少數(shù)幾個(gè)因素,從而簡化問題,或發(fā)現(xiàn)事物的內(nèi)在聯(lián)系。8.1Factor過程——提供因子分析/主成分分析方法,它們是最為常用的數(shù)據(jù)簡化方法,用于考察多個(gè)定量變量間的內(nèi)在結(jié)構(gòu),或者提取數(shù)據(jù)的主要信息。8.2CorrespondenceAnalysis過程——進(jìn)行簡單對應(yīng)分析,該方法同樣以數(shù)據(jù)簡化的原則力圖直觀的給出各兩個(gè)分類變量各個(gè)類別之間的聯(lián)系,當(dāng)各個(gè)變量的類別越多時(shí),該方法的優(yōu)勢就越明顯。8.3OptimalScaling過程——進(jìn)行最優(yōu)尺度分析,該方法的核心目的也是力圖在低維度空間表述兩個(gè)或多個(gè)變量之間的內(nèi)在聯(lián)系。所分析的變量以分類變量為主,但也可以為連續(xù)性變量。該方法實(shí)際上包括,但不僅僅限于對應(yīng)分析方法。2021/6/28年11月30日87西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心9、信度分析與多維尺度分析——Scale菜單在Scale菜單提供的幾種統(tǒng)計(jì)方法都屬于尺度分析的范疇,它們是探索研究事物間的相似性/不相似性的專用技術(shù)。具體來說,這些方法和用途是:9.1信度分析:用于評價(jià)問卷這種測量工具的穩(wěn)定性或可靠性,具體來說就是用問卷對同一事物進(jìn)行重復(fù)測量時(shí),所得結(jié)果的一致性程度。ReliabilityAnalysis過程可以進(jìn)行內(nèi)在信度分析,即評價(jià)問卷中各個(gè)問題是否測量的是同一個(gè)概念。9.2多維尺度分析:用于反映多個(gè)研究事物間的相似(不相似)程度,通過適當(dāng)?shù)慕稻S方法,將這種相似(不相似)程度在低維空間中用點(diǎn)與點(diǎn)之間的距離表示出來,并有可能幫助識(shí)別那些影響事物間相似性的潛在因素。這種方法在市場研究中應(yīng)用得非常廣泛。MultidimensionalScaling過程和MultidimensionalScaling(PROXSCAL)過程都是專門用于多維尺度分析的過程。2021/6/28年11月30日88西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心10、非參數(shù)檢驗(yàn)――NonparametricTests菜單作為二十一世紀(jì)統(tǒng)計(jì)理論的三大發(fā)展方向之一,非參數(shù)統(tǒng)計(jì)是統(tǒng)計(jì)分析的重要組成部分??墒桥c之很不相稱的是他針對一般性統(tǒng)計(jì)分析的理論發(fā)展遠(yuǎn)遠(yuǎn)不及參數(shù)檢驗(yàn)完善,因而比較完善的可供使用的方法也不多。比如多組均數(shù)間的兩兩比較,雖然已有好幾種方法可資利用,但由于在理論上仍存在爭議,幾種權(quán)威的統(tǒng)計(jì)軟件(如SAS和SPSS)均沒有提供這方面的方法。雖然這些洋統(tǒng)計(jì)軟件沒有提供兩兩比較的非參數(shù)方法,但國產(chǎn)的統(tǒng)計(jì)軟件大都是提供了的(國情不同嘛),因此建議大家:如果真的要做這方面的非參數(shù)分析,不如直接用PEMS、SPLMWIN、NOSA等國產(chǎn)軟件,免得用SPSS等只能做一半。在SPSS中,幾乎所有的非參數(shù)分析方法都被放入了NonparametricTests菜單中,具體來講有以下幾種:2021/6/28年11月30日89西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心Chi-squaretest:用卡方檢驗(yàn)來檢驗(yàn)變量的幾個(gè)取值所占百分比是否和我們期望的比例沒有統(tǒng)計(jì)學(xué)差異。比如我們在人群中抽取了一個(gè)樣本,可以用該方法來分析四種血型所占的比例是否相同(都是25%),或者是否符合我們所給出的一個(gè)比例(如分別為10%、30%、40%和20%,我隨便寫的)。請注意該檢驗(yàn)和我們一般所用的卡方不太一樣,我們一般左的卡方要用crosstable菜單來完成,而不是這里。BinomialTest:用于檢測所給的變量是否符合二項(xiàng)分布,變量可以是兩分類的,也可以使連續(xù)性變量,然后按你給出的分界點(diǎn)一刀兩斷。RunsTest:用于檢驗(yàn)?zāi)匙兞康娜≈凳欠袷菄@著某個(gè)數(shù)值隨機(jī)地上下波動(dòng),該數(shù)值可以是均數(shù)、中位數(shù)、眾數(shù)或人為制定。一般來說,如果該檢驗(yàn)P值有統(tǒng)計(jì)學(xué)意義,則提示有其他變量對該變量的取值有影響,或該變量存在自相關(guān)。One-SampleKolmogorov-SmirnovTest:采用柯爾莫諾夫-斯米爾諾夫檢驗(yàn)來分析變量是否符合某種分布,可以檢驗(yàn)的分布有正態(tài)分布、均勻分布、Poission分布和指數(shù)分布。Two-Independent-SamplesTests:即成組設(shè)計(jì)的兩樣本均數(shù)比較的非參數(shù)檢驗(yàn)。TestsforSeveralIndependentSamples:成組設(shè)計(jì)的多個(gè)樣本均數(shù)比較的非參數(shù)檢驗(yàn),此處不提供兩兩比較方法。Two-Related-SamplesTests:配對設(shè)計(jì)兩樣本均數(shù)的非參數(shù)檢驗(yàn)。TestsforSeveralRelatedSamples:配伍設(shè)計(jì)多個(gè)樣本均數(shù)的非參數(shù)檢驗(yàn),此處同樣不提供兩兩比較。2021/6/28年11月30日90西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心11、生存分析——Survival菜單生存分析的主要研究內(nèi)容:1、描述生存過程:研究人群生存狀態(tài)的規(guī)律,如生存時(shí)間的分布的特點(diǎn),計(jì)算某個(gè)時(shí)間點(diǎn)的生存率、生存率曲線的變動(dòng)趨勢等。這是人壽保險(xiǎn)研究中的一項(xiàng)重要內(nèi)容。2、生存過程的影響因素分析:比較不同亞人群的生存狀況,進(jìn)行兩組或多組生存率的比較,以了解哪些因素會(huì)影響目標(biāo)人群的生存過程,這是生存分析方法最重要的研究內(nèi)容,在臨床醫(yī)學(xué)中應(yīng)用得非常廣泛。SPSS提供了四個(gè)過程:2021/6/28年11月30日91西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心11.1Lifetables過程:用于分析分組生存資料,求出不同組段時(shí)的生存率?;蛘弋?dāng)樣本量較大時(shí)(如n>50),可以把資料按不同時(shí)間段分成幾組,觀察不同時(shí)間點(diǎn)的生存率。11.2Kaplan-Meier過程:用于樣本含量較小時(shí),不能給出特定時(shí)間點(diǎn)的生存率。這樣就不用擔(dān)心每個(gè)時(shí)間段內(nèi)只有很少的幾個(gè)觀測,甚至沒有觀測的尷尬局面。11.3CoxRegression過程:用于擬合Cox比例風(fēng)險(xiǎn)模型,這是生存分析中最重要的一個(gè)分析方法,它的出現(xiàn)具有劃時(shí)代的意義,是多因素生存分析方法中最為常用的一種。11.4Coxw/Time-DepCox過程:是Cox比例風(fēng)險(xiǎn)模型的進(jìn)一步發(fā)展。當(dāng)所研究的危險(xiǎn)因素其取值隨時(shí)間而不斷變化,或者其作用強(qiáng)度隨時(shí)間而不斷變化時(shí),Cox模型的適用條件就被違反,此時(shí)需要對模型加以修正,就必須用到這個(gè)過程了。2021/6/28年11月30日92西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心第二節(jié)應(yīng)用舉例——主成分/因子分析多元分析處理的是多指標(biāo)的問題。由于指標(biāo)太多,使得分析的復(fù)雜性增加。觀察指標(biāo)的增加本來是為了使研究過程趨于完整,但反過來說,為使研究結(jié)果清晰明了而一味增加觀察指標(biāo)又讓人陷入混亂不清。由于在實(shí)際工作中,指標(biāo)間經(jīng)常具備一定的相關(guān)性,故人們希望用較少的指標(biāo)代替原來較多的指標(biāo),但依然能反映原有的全部信息,于是就產(chǎn)生了主成分分析、對應(yīng)分析、典型相關(guān)分析和因子分析等方法。調(diào)用DataReduction菜單的Factor過程命令項(xiàng),可對多指標(biāo)或多因素資料進(jìn)行因子分析。因子分析的基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測的,即不是具體的變量,這與上一章的聚類分析不同),以較少的幾個(gè)因子反映原資料的大部分信息。2021/6/28年11月30日93西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2.1Factor過程2.1.1模型簡介因子分析和主成分分析是不同的兩種手段,但分析過程極為相似,且它們在SPSS中都是采用Factor過程擬合。下面先給出其原理,然后介紹具有共同性的一些問題.2021/6/28年11月30日94西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心主成分分析只是一種中間手段,其背景是研究中經(jīng)常會(huì)遇到多指標(biāo)的問題,這些指標(biāo)間往往存在一定的相關(guān),直接納入分析不僅復(fù)雜,變量間難以取舍,而且可能因多元共線性而無法得出正確結(jié)論。主成分分析的目的就是通過線性變換,將原來的多個(gè)指標(biāo)組合成相互獨(dú)立的少數(shù)幾個(gè)能充分反映總體信息的指標(biāo),從而在不丟掉主要信息的前提下,避開了變量間共線性的問題,便于進(jìn)一步分析。主成分分析不能被看成是研究的結(jié)果,而應(yīng)繼續(xù)采用其他多元統(tǒng)計(jì)方法以解決實(shí)際問題。在主成分分析中,提取出的每個(gè)主成分都是原來多個(gè)指標(biāo)的線性組合,比如有兩個(gè)原始變量X1和X2,則一共提取出兩個(gè)主成分如下:Z1=b11X1+b21X2Z2=b12X1+b22X2原則上如果有n個(gè)變量,則最多可以提取出n個(gè)主成分,但如果將它們?nèi)刻崛〕鰜砭褪チ嗽摲椒ê喕瘮?shù)據(jù)的實(shí)際意義。多數(shù)情況下提取出前2~3個(gè)主成分已包含了90%以上的信息,其他的可以忽略不計(jì)。提取出的主成分能包含主要信息即可,不一定非要有準(zhǔn)確的實(shí)際含義。2.1.1.1主成分分析2021/6/28年11月30日95西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心因子分析也是一種將多變量化簡的技術(shù),它可以被看成是主成分分析的推廣。因子分析的目的是分解原始變量,從中歸納出潛在的“類別”,相關(guān)性較強(qiáng)的指標(biāo)歸為一類,不同類間變量的相關(guān)性則較低。每一類變量代表了一個(gè)“共同因子”,即一種內(nèi)在結(jié)構(gòu),因子分析就是要尋找該結(jié)構(gòu)。比如在市場調(diào)查中收集了食品的五項(xiàng)指標(biāo):味道,價(jià)格,風(fēng)味,是否快餐食品,能量。經(jīng)過因子分析后發(fā)現(xiàn)結(jié)果如下:x1=0.02z1+0.99z2+ε1x2=0.94z1-0.01z2+ε2x3=0.13z1+0.98z2+ε3x4=0.84z1+0.42z2+ε4x5=0.97z1-0.02z2+ε5x1~x5為原始變量,z1~z2為公因子。上式表明第一公因子主要影響價(jià)格、是否快餐食品,第二公因子則主要影響味道和風(fēng)味。結(jié)合實(shí)際,前一公因子代表“價(jià)廉”,后一公因子代表“味美”。式中的ε代表特殊因子(注意并非普通意義上的殘差),它只對當(dāng)前變量有影響,表示該變量中獨(dú)特的、不能被公因子所解釋的特征。因子分析一般要求提取出的公因子有實(shí)際含義,如果分析中各因子難以找到合適的意義,則可以通過適當(dāng)?shù)男D(zhuǎn),改變信息量在不同因子上的分布,最終方便對結(jié)果的解釋。2.1.1.2因子分析2021/6/28年11月30日96西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心主成分分析/因子分析的用途有:(1)解決共線性問題:如前所述,利用主成分分析提取出主要信息,然后使用提取出的主成分代替原變量進(jìn)行分析,就可以避開原變量的共線性問題。(2)評價(jià)問卷的結(jié)構(gòu)效度:通過因子分析得出問卷中哪些問題用于研究那些潛在特征(因子),從而得出該問卷結(jié)構(gòu)效度如何的評價(jià)。這在社會(huì)學(xué)和流行病學(xué)調(diào)查中是非常常用的手段。(3)尋找變量間潛在結(jié)構(gòu):許多變量是無法直接觀測到的,它們往往需要用一系列可直接觀測的相關(guān)變量來間接反映。通過因子分析,就可以將這些變量間潛在的結(jié)構(gòu)推導(dǎo)出來加以利用。(4)內(nèi)在結(jié)構(gòu)證實(shí):在有的情況下,研究者根據(jù)某些理論或其他知識(shí)已對可能的內(nèi)在結(jié)構(gòu)進(jìn)行了假設(shè),此時(shí)可利用因子分析來驗(yàn)證該假設(shè)是否成立,這種因子分析也被稱為證實(shí)性因子分析,在心理學(xué)研究中較為常見。2.1.1.3方法用途2021/6/28年11月30日97西南農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)及現(xiàn)代教育技術(shù)中心2.1.1.4適用條件主成分分析的目的是提取信息,對樣本量沒有太嚴(yán)格的要求。因子分析則不同,它更多的是尋找內(nèi)在結(jié)構(gòu),因此要求樣本量比較充足,否則可能無法得到穩(wěn)定和準(zhǔn)確的結(jié)果。根據(jù)Gorsuch(1983)的觀點(diǎn),因子分析時(shí)的樣本量要求如下:(1)樣本量與變量數(shù)的比例為5:1以上,實(shí)際上理想的樣本量應(yīng)為變量數(shù)的確10~25倍,但這很難做到。5~10倍之間雖略顯不足,但一般都能得到較好的結(jié)果。(2)總樣本量不得少于100,而且原則上越大越好。除了樣本量外,既然要從許多變量中提取出共同因素,主成分/因子分析有一個(gè)默認(rèn)的前提條件就是各變量間必須有相關(guān)性,否則各變量間沒有共享信息,就不應(yīng)當(dāng)有公因子需要提出,自然也談不上使用該方法。這是主成分/因子分析最為嚴(yán)格的前提要求。具體在該條件的判斷上,除了根據(jù)專業(yè)知識(shí)來估計(jì)外,還可以使用KMO統(tǒng)計(jì)量和Bartlett's球形檢驗(yàn)加以判定。2021/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年鋼筋市場調(diào)研與營銷服務(wù)合同2篇
- 二零二五年度企業(yè)員工股權(quán)參與計(jì)劃合作協(xié)議3篇
- 二零二五年度科研基地場地租賃與科技成果轉(zhuǎn)化合同2篇
- 第一單元活動(dòng)1、社會(huì)實(shí)踐與社區(qū)服務(wù)背景及方案 說課稿 2023-2024學(xué)年粵教版《綜合實(shí)踐活動(dòng)》八年級001
- 二零二五年度軟件開發(fā)項(xiàng)目階段性成果驗(yàn)收合同3篇
- 基于遷移學(xué)習(xí)的命名實(shí)體識(shí)別研究
- 2025年度溫泉度假村場地租賃與休閑度假經(jīng)營管理合同4篇
- 二零二五版智慧農(nóng)業(yè)物聯(lián)網(wǎng)平臺(tái)建設(shè)合同3篇
- 特崗教師專業(yè)發(fā)展問題及對策研究
- 2025年度廠房產(chǎn)權(quán)轉(zhuǎn)讓及售后服務(wù)合同范本3篇
- 副總經(jīng)理招聘面試題與參考回答(某大型國企)2024年
- PDCA循環(huán)提高護(hù)士培訓(xùn)率
- 2024年工程咨詢服務(wù)承諾書
- 青桔單車保險(xiǎn)合同條例
- 車輛使用不過戶免責(zé)協(xié)議書范文范本
- 《獅子王》電影賞析
- 2023-2024學(xué)年天津市部分區(qū)九年級(上)期末物理試卷
- DB13-T 5673-2023 公路自愈合瀝青混合料薄層超薄層罩面施工技術(shù)規(guī)范
- 河北省保定市定州市2025屆高二數(shù)學(xué)第一學(xué)期期末監(jiān)測試題含解析
- 哈爾濱研學(xué)旅行課程設(shè)計(jì)
- 2024 smart汽車品牌用戶社區(qū)運(yùn)營全案
評論
0/150
提交評論