SPS統(tǒng)計概覽數(shù)據(jù)分析詳解_第1頁
SPS統(tǒng)計概覽數(shù)據(jù)分析詳解_第2頁
SPS統(tǒng)計概覽數(shù)據(jù)分析詳解_第3頁
SPS統(tǒng)計概覽數(shù)據(jù)分析詳解_第4頁
SPS統(tǒng)計概覽數(shù)據(jù)分析詳解_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第一章SPSS概覽--數(shù)據(jù)分析實例詳解1.1數(shù)據(jù)的輸入和保存1.1.1SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.2數(shù)據(jù)的預分析1.2.1數(shù)據(jù)的簡單描述1.2.2繪制直方圖1.3按題目要求進行統(tǒng)計分析1.4保存和導出分析結果1.4.1保存文件1.4.2導出分析結果歡迎參加SPSS使用者的行列,首先祝賀你選擇了權威統(tǒng)計軟件中界面最為友好,使用最為方便的SPSS來完成自己的工作。由于該軟件極為易學易用〔當然還至少要有不太高的英語水平〕,我們準備在課程安排上做一個新的嘗試,即不急于介紹它的界面,而是先從一個數(shù)據(jù)分析實例入手:當你將這個例題做完,SPSS的根本使用方法也就已經(jīng)被你掌握了。從下一章開始,我們再詳細介紹SPSS各個模塊的精確用法。我們教學時是以SPSS10.0版為藍本講述的--什么?你還在用7.0版!那好,由于10.0版在數(shù)據(jù)治理的界面操作上和以前版本有較大區(qū)別,本章我們將特別照顧一下老版本,在數(shù)據(jù)治理界面操作上將按9.0及以前版本的情況講述,但具體的統(tǒng)計分析功能那么按10.0版本講述。沒關系,根本操作是完全一樣的。好,說了這么多廢話,等急了吧,就讓我們開始吧!希望了解SPSS10.0版具體情況的朋友請參見本網(wǎng)站的SPSS10.0版奪鮮報道。例1.1某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同〔衛(wèi)統(tǒng)第三版例4.8〕?患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87讓我們把要做的事情理理順:首先要做的肯定是翻開計算機〔廢話〕,然后進入瘟98或瘟2000〔還是廢話,以下省去廢話2萬字〕,在進入SPSS后,具體工作流程如下:將數(shù)據(jù)輸入SPSS,并存盤以防斷電。進行必要的預分析〔分布圖、均數(shù)標準差的描述等〕,以確定應摘用的檢驗方法。按題目要求進行統(tǒng)計分析。保存和導出分析結果。下面就按這幾步依次講解?!?.1數(shù)據(jù)的輸入和保存SPSS的界面當翻開SPSS后,展現(xiàn)在我們面前的界面如下:請將鼠標在上圖中的各處停留,很快就會彈出相應部位的名稱。請注意窗口頂部顯示為“SPSSforWindowsDataEditor〞,說明現(xiàn)在所看到的是SPSS的數(shù)據(jù)治理窗口。這是一個典型的Windows軟件界面,有菜單欄、工具欄。特別的,工具欄下方的是數(shù)據(jù)欄,數(shù)據(jù)欄下方那么是數(shù)據(jù)治理窗口的主界面。該界面和EXCEL極為相似,由假設干行和列組成,每行對應了一條記錄,每列那么對應了一個變量。由于現(xiàn)在我們沒有輸入任何數(shù)據(jù),所以行、列的標號都是灰色的。請注意第一行第一列的單元格邊框為深色,說明該數(shù)據(jù)單元格為當前單元格。對Windows操作界面不熟悉的朋友可參見SAS入門第一課中的相關內(nèi)容。對數(shù)據(jù)表界面操作不熟悉的朋友可先學習一下EXCEL的操作〔因為它的幫助是中文的〕。有的SPSS系統(tǒng)翻開時會出現(xiàn)一個導航對話框,請單擊右下方的Cancer按鈕,即可進入上面的主界面。定義變量該資料是定量資料,設計為成組設計,因此我們需要建立兩個變量,一個變量代表血磷值,習慣上取名為X,另一個變量代表觀察對象是健康人還是克山病人,習慣上取名為GROUP。對數(shù)據(jù)的統(tǒng)計分析格式不太熟悉的朋友請先學習統(tǒng)計軟件第一課。選擇菜單Data==>DefineVariable。系統(tǒng)彈出定義變量對話框如下:該變量定義對話框在SPSS10.0版中已被取消,這里的操作只適合9.0~7.0版的用戶。對話框最上方為變量名,現(xiàn)在顯示為“VAR00001〞,這是系統(tǒng)的默認變量名;往下是變量情況描述,可以看到系統(tǒng)默認該變量為數(shù)值型,長度為8,有兩位小數(shù)位,尚無缺失值,顯示對齊方式為右對齊;第三局部為四個設置更改按鈕,分別可以設定變量類型、標簽、缺失值和列顯示格式;第四局部實際上是用來定義變量屬于數(shù)值變量、有序分類變量還是無序分類變量,現(xiàn)在系統(tǒng)默認新變量為數(shù)值變量;最下方那么依次是確定、取消和幫助按鈕。好,先來建立分組變量GROUP。請將變量名改為GROUP,然后單擊OK按鈕。有沒有搞錯?!折騰了半天就改個名字!難道連變量格式、標簽等都不改?是這樣的,在SPSS中所有的數(shù)據(jù)均以最大位數(shù)保存〔好象是雙精度〕,也就是說,上面雖然默認只有兩位小數(shù),但那指的是計算精度,實際保存的數(shù)據(jù)位數(shù)是非常長的〔可以輸入Pi值試一下〕。在絕大多數(shù)情況下,SPSS給出的默認數(shù)據(jù)類型和數(shù)據(jù)精度完全可以滿足需要,只是不太好看而已。至于標簽等比較花哨的選項,反正我也很少用。現(xiàn)在我們才剛剛入門,一切從簡。以后我會詳細介紹各種設置的用法。在第一列灰色的“var〞上雙擊,同樣會彈出定義變量對話框?,F(xiàn)在SPSS的數(shù)據(jù)治理窗口如下所示:第一列的名稱已經(jīng)改為了“group〞,這就是我們所定義的新變量“group〞?,F(xiàn)在我們來建立變量X。單擊第一行第二列的單元格,然后選擇菜單Data==>DefineVariable,同樣,將變量名改為X,然后確認。此時SPSS的數(shù)據(jù)治理窗口如下所示:現(xiàn)在,第一、第二列的名稱均為深色顯示,說明這兩列已經(jīng)被定義為變量,其余各列的名稱仍為灰色的“var〞,表示尚未使用。同樣地,各行的標號也為灰色,說明現(xiàn)在還未輸入過數(shù)據(jù),即該數(shù)據(jù)集內(nèi)沒有記錄。輸入數(shù)據(jù)我們先來輸入變量X的值,請確認一行二列單元格為當前單元格,棄鼠標而用鍵盤,輸入第一個數(shù)據(jù)0.84,此時界面顯示如圖A所示:圖A圖B請注意:在回車之前,你輸入的數(shù)據(jù)在數(shù)據(jù)欄內(nèi)顯示,而不是在單元格內(nèi)顯示,現(xiàn)在回車,界面如圖B所示:首先,當前單元格下移,變成了二行二列單元格,而一行二列單元格的內(nèi)容那么被替換成了0.84;其次,第一行的標號變黑,說明該行已輸入了數(shù)據(jù);第三,一行一列單元格因為沒有輸入過數(shù)據(jù),顯示為“.〞,這代表該數(shù)據(jù)為缺失值。用類似的輸入方式,我們將患者的血磷值輸入完畢,并將相應的變量GROUP均取值為1,此時數(shù)據(jù)治理窗口如下所示:從第12行開始輸入健康人的數(shù)據(jù),并將相應的GROUP變量取值為2。最終該數(shù)據(jù)集應該有24條記錄。保存數(shù)據(jù)選擇菜單File==>Save,由于該數(shù)據(jù)從來沒有被保存過,所以彈出Saveas對話框如下:單擊保存類型列表框,可以看到SPSS所支持的各種數(shù)據(jù)類型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式〔*.sav文件〕。在文件名框內(nèi)鍵入Li1_1并回車,可以看到數(shù)據(jù)治理窗口左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。為什么這里的對話框會出現(xiàn)漢字?是這樣的,需要從編程的角度來解釋:SPSS在彈出該對話框時會調(diào)用Windows系統(tǒng)的公用函數(shù),由于我們用的是中文Windows系統(tǒng),所以調(diào)用出來的就是中文。§1.2數(shù)據(jù)的預分析數(shù)據(jù)的簡單描述首先我們需要知道數(shù)據(jù)的根本情況,如均數(shù)、標準差等。選擇Analyze==>DescriptiveStatistics==>Descriptives菜單,系統(tǒng)彈出描述對話框如下:如果按SPSS標準的叫法,這里應該是調(diào)用了Descriptives過程,為了防止太生硬,我們稱為調(diào)用對話框,等大家熟悉SPSS了以后,在統(tǒng)計分析各章中可能兩種稱喚會混用。該對話框可分為左右兩大局部,左側為所有可用的侯選變量列表,右側為選入變量列表。我們只需要描述X,用鼠標選中X,單擊中間的,變量X的標簽就會移入右側,注意這時OK按鈕變黑,說明已經(jīng)可以進行分析了,單擊它,系統(tǒng)會彈出一個新的界面如下所示:該窗口上方的名稱為SPSSforWindowsViewer,即〔結果〕瀏覽窗口,整個的結構和資源治理器類似,左側為導航欄,右側為具體的輸出結果。結果表格給出了樣本數(shù)、最小值、最大值、均數(shù)和標準差這幾個常用的統(tǒng)計量。從中可以看到,24個數(shù)據(jù)總的均數(shù)為1.2846,標準差為0.4687。我們以上的做法對嗎?當然有問題!光看總的描述是不夠的,還應當看看分組的描述情況。這里要用到文件分割功能,請切換回數(shù)據(jù)治理窗口,選擇Data==>SplitFile菜單,系統(tǒng)彈出文件分割對話框如下:選擇單項選擇按鈕Organizeoutputbygroups,將變量GROUP選入右側的選入變量框,單擊OK鈕,此時界面不會有任何改變,但請再做一次數(shù)據(jù)描述,你就可以看到現(xiàn)在數(shù)據(jù)是分Group=1和Group=2兩種情況在描述了!從描述可知兩組的均數(shù)和標準差分別為1.5209、1.0846和0.4218、0.4221。如果定義了文件分割,那么它會在以后的所有統(tǒng)計分析中起作用,直到你重新定義文件分割方式為止。繪制直方圖統(tǒng)計指標只能給出數(shù)據(jù)的大致情況,沒有直方圖那樣直觀,我們就來畫個直方圖瞧瞧!選擇Graphs==>Histogram,系統(tǒng)會彈出繪制直方圖對話框如下:將變量X選入Variable選擇框內(nèi),單擊OK按鈕。此時結果瀏覽窗口內(nèi)會繪制出如下兩個直方圖:兩組的數(shù)據(jù)沒有特別偏的分布,也沒有十分突出的離群值,因此無須變換,可以直接摘用參數(shù)分析方法來分析。綜合設計類型,最終確定摘用成組設計兩樣本均數(shù)比較的t檢驗來分析。最后,我們還要取消變量分割,免得它影響以后的統(tǒng)計分析,再次調(diào)出變量分割對話框,選擇單項選擇按鈕中的“Analyzeallcases,donotcreatgroup〞,單擊OK按鈕就可以了。§1.3按題目要求進行統(tǒng)計分析下面我們要用SPSS來做成組設計兩樣本均數(shù)比較的t檢驗,選擇Analyze==>CompareMeans==>Independent-SamplesTtest,系統(tǒng)彈出兩樣本t檢驗對話框如下:將變量X選入test框內(nèi),變量group選入grouping框內(nèi),注意這時下面的DefineGroups按鈕變黑,表示該按鈕可用,單擊它,系統(tǒng)彈出比較組定義對話框如右圖所示:該對話框用于定義是哪兩組相比,在兩個group框內(nèi)分別輸入1和2,說明是變量group取值為1和2的兩組相比。然后單擊Continue按鈕,再單擊OK按鈕,系統(tǒng)經(jīng)過計算后會彈出結果瀏覽窗口,首先給出的是兩組的根本情況描述,如樣本量、均數(shù)等〔糟糕,剛剛的半天工夫白費了〕,然后是t檢驗的結果如下:IndependentSamplesTest

Levene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperXEqualvariancesassumed.032.8602.52422.019.4363.17297.777E-02.7948Equalvariancesnotassumed

2.52421.353.020.4363.17297.716E-02.7954可見該結果分為兩大局部:第一局部為Levene's方差齊性檢驗,用于判斷兩總體方差是否齊,這里的戒嚴結果為F=0.032,p=0.860,可見在本例中方差是齊的;第二局部那么分別給出兩組所在總體方差齊和方差不齊時的t檢驗結果,由于前面的方差齊性檢驗結果為方差齊,第二局部就應選用方差齊時的t檢驗結果,即上面一行列出的t=2.524,ν=22,p=0.019。從而最終的統(tǒng)計結論為按α=0.05水準,拒絕H0,認為克山病患者與健康人的血磷值不同,從樣本均數(shù)來看,可認為克山病患者的血磷值較高?!?.4保存和導出分析結果保存結果文件前面我們已經(jīng)做出了分析結果,但是,可是,可但是,但可是呢?再好的結果只要一斷電就會全部消失〔廢話〕,對于這一問題人們早已想出了三種解決方法,他們分別是:需要結果的時候再運行一次分析程序。用筆將結果抄在紙上。直接保存結果文件。顯然,最方便快捷、最符合信息時代特征的就是第三種方法,在結果瀏覽窗口中〔注意:一定要在結果瀏覽窗口中〕選擇菜單File==>Save,由于該結果也從來沒有被保存過,所以彈出和前面保存數(shù)據(jù)時極為相似的一個Saveas對話框,和前面相比,他唯一的區(qū)別就是文件的保存類型只有ViewFiles(*.spo)一種。好,閑言少敘,在文件名框中鍵入“Li1_1”不是文件保存類型還有一種“ALLFiles(*.*)〞嗎?別費力了,這種類型是SPSS公司放在那里哄人的,在該對話框里無論怎么折騰,都只能按SPO文件的格式來保存。導出分析結果文件倒是保存了,但問題還沒有完全解決:我們從來寫文章什么的都用的是文字處理軟件,特別是WORD,可WORD不能直接讀取SPO格式的文件,怎么辦呢?沒關系,SPSS提供了將結果導出為純文本格式或網(wǎng)頁格式的功能,在結果瀏覽窗口中選擇菜單File==>Export,系統(tǒng)會彈出ExprotOutput對話框如下:最上方的Export下拉式列表可以選擇輸出的內(nèi)容,可以為含圖表的輸出文檔、無圖表的輸出文檔和只有統(tǒng)計圖表三種;中部的ExprotFile對話框那么填入輸出的目標文件名;左下方的ExportWhat單項選擇框可以選擇輸出結果的哪些局部,可以是所有結果、所有可見結果或只輸出選擇的結果,一般選輸出所有可見結果;右下方的輸出文件類型下拉式列表已被我翻開,可見里面有網(wǎng)頁格式和純文本格式兩種,在一切按所需選擇完畢后按OK鈕,那么結果文件就會輸出為你想要的類型。好,到這里,就象我們剛開始所說的一樣,你實際上已經(jīng)完全掌握了SPSS的根本使用方法。我們以后將要做的工作就是“百尺竿頭,更進一步〞,將從下一章開始詳細介紹SPSS各個模塊的精確用法,使大家能盡快的從SPSS新手向SPSS高手過度。第二章數(shù)據(jù)文件的治理〔上〕2.1建立與保存數(shù)據(jù)文件-File菜單2.1.1新建數(shù)據(jù)文件直接翻開使用數(shù)據(jù)庫查詢翻開使用文本導入向導讀入文本文件2.1.2翻開其他格式的數(shù)據(jù)文件2.1.3保存數(shù)據(jù)文件2.1.4File菜單中的其他條目2.2編輯數(shù)據(jù)文件2.2.1定義新變量直接定義新變量.2從原有變量計算新變量-Transform菜單2.2.2數(shù)據(jù)的錄入.1直接錄入.2數(shù)據(jù)錄入技巧2.3進一步整理數(shù)據(jù)文件-Data菜單不言而喻,一切統(tǒng)計分析都是以數(shù)據(jù)為根底的,因此統(tǒng)計軟件的數(shù)據(jù)治理能力非常重要。SPSS以其豪華的界面為依托,為用戶提供的便利的數(shù)據(jù)治理功能,下面我們就來具體看一下?!?.1建立與保存數(shù)據(jù)文件和大多數(shù)應用軟件相同,SPSS中數(shù)據(jù)文件的治理功能根本上都集中在了File菜單上,該菜單的組織結構和WORD等也極為相似,因此這里我們只介紹比較有特色的幾個菜單項。SPSS10.0有三個主要窗口界面:數(shù)據(jù)治理窗口、程序編輯窗口和結果瀏覽窗口;另有兩個不常用的窗口:結果草稿瀏覽窗口和VBs腳本語言編輯窗口。他們共享許多菜單項,如File菜單就大局部相同,這里介紹的許多內(nèi)容在五個窗口中都是通用的。2.1.1新建數(shù)據(jù)文件如果你正從頭開始進行一個新的課題,剛剛把數(shù)據(jù)收集上來,要做統(tǒng)計分析,自然需要新建一個數(shù)據(jù)庫,然后將所有的數(shù)據(jù)從紙上請到計算機里。在SPSS中,新建一個數(shù)據(jù)庫容易的不得了--已經(jīng)到了什么都不用做的地步!是這樣,當你進入SPSS系統(tǒng)時,系統(tǒng)就已經(jīng)生成了一個空數(shù)據(jù)文件,即你看到的空白的數(shù)據(jù)治理界面。你只要按自己的需要定義變量,輸入數(shù)據(jù)然后存盤就是了〔這些操作立刻會講到〕。翻開其他格式的數(shù)據(jù)文件但凡做過數(shù)據(jù)輸入工作的人都知道:這活又費眼睛又累人,出錯太多了還要挨批評,非常影響個人的光輝形象。算了,還是在有限的經(jīng)費里劃幾百美元出來雇個打字小姐吧〔怎么用美元?因為我請了個老外!〕??墒欠浅2恍遥撏局粫肊XCEL2000〔又是一個被微軟成功洗腦的家伙〕,數(shù)據(jù)現(xiàn)已輸好,怎么轉成SPSS數(shù)據(jù)文件呢?沒關系,SPSS提供了以下幾種方法來翻開其他格式的數(shù)據(jù)文件。.1直接翻開SPSS現(xiàn)在可以直接讀入許多格式的數(shù)據(jù)文件,其中就包括EXCEL各個版本的數(shù)據(jù)文件。選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的“〞按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型〞列表框,在里面能看到直接翻開的數(shù)據(jù)文件格式,分別是:SPSS(*.sav)SPSS數(shù)據(jù)文件〔6.0~10.0版〕SPSS/PC+(*.sys)SPSS4.0版數(shù)據(jù)文件Systat(*.syd)*.syd格式的Systat數(shù)據(jù)文件Systat(*.sys)*.sys格式的Systat數(shù)據(jù)文件SPSSportable(*.por)SPSS便攜格式的數(shù)據(jù)文件EXCEL(*.xls)EXCEL數(shù)據(jù)文件〔從5.0版~2000版〕Lotus(*.w*)Lotus數(shù)據(jù)文件SYLK(*.slk)SYLK數(shù)據(jù)文件dBase(*.dbf)dBase系列數(shù)據(jù)文件,〔從dBaseII~IV〕Text(*.txt)純文本格式的數(shù)據(jù)文件data(*.dat)純文本格式的數(shù)據(jù)文件選擇所需的文件類型,然后選中需要翻開的文件,SPSS就會按你的要求翻開你要使用的數(shù)據(jù)文件,并自動轉換為數(shù)據(jù)SPSS格式。也許有視力好的朋友會注意到右下方除了“翻開〞和“取消〞兩個按鈕外,中間還有一個“Paste〞按鈕,該按鈕在SPSS的大多數(shù)對話框中都存在,是用于自動生成SPSS程序的,我們以后會專門講解該問題。.2使用數(shù)據(jù)庫查詢翻開SPSS可以直接翻開許多類型的數(shù)據(jù)文件,但這并不是說它可以翻開所有類型的數(shù)據(jù)文件〔廢話〕,比方FoxPro3.0以上版本的*.dbf文件就不能直接翻開〔有愛好的話你可以試試〕。為此,SPSS還提供了另一個適用范圍更廣、但使用上較為專業(yè)的數(shù)據(jù)接口--數(shù)據(jù)庫查詢。實際上,SPSS在這里使用的是一種叫ODBC(OpenDatabaseCapture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件〔如MSOffice〕支持,通過它,應用程序可以直接訪問以結構化查詢語言〔SQL〕做為數(shù)據(jù)訪問標準的數(shù)據(jù)庫治理系統(tǒng)。由于SPSS10.0可以直接翻開EXCEL所有系列的數(shù)據(jù)文件,因此數(shù)據(jù)庫查詢接口的用處不是很大。但是,在9.0及以前的版本中,該查詢?nèi)允侵苯臃_EXCEL95、97及2000數(shù)據(jù)文件的唯一方法。ODBC數(shù)據(jù)引擎是獨立與各種應用軟件,直接安裝到Windows系統(tǒng)中的,因此你所用的系統(tǒng)中ODBC所支持的數(shù)據(jù)類型取決于所安裝的ODBC引擎的情況。還好,大多數(shù)支持該接口的軟件都會在安裝光盤上附送該引擎的安裝文件〔如MSOffice〕。不過有一點要提醒大家,許多機器的OBDC數(shù)據(jù)引擎安裝有問題〔特別是D版〕,在SPSS中使用它往往要死機。選擇菜單File==>OpenDatabase==>NewQuery,系統(tǒng)會彈出數(shù)據(jù)庫向導的第一個窗口,其中會列出你使用的機器上已安裝的所有數(shù)據(jù)庫驅動程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向導會一步一步的提示你如何做,直至將數(shù)據(jù)讀入SPSS。我原來準備舉一個具體例子,但后來發(fā)現(xiàn)不同版本的ODBC引擎所彈出的對話框并不相同!不僅如此,不同的數(shù)據(jù)驅動程序其對話框也各不相同!比方說,有的需要你的LoginID和Password,有的又不需要,因此我這里就不再講了。由于它使用上太專業(yè)〔特別在10.0版中,9.0版還好些〕,如果確實要用,請找一個對數(shù)據(jù)庫接口比較熟的人來幫你。.3使用文本導入向導讀入文本文件選擇菜單File==>ReadTextData,系統(tǒng)就會彈出OpenFile對話框,對!和前面的情況完全一樣,只是文件類型自動跳到了Text(*.txt)。實際上,該功能在SPSS中已被整合到了OpenFile對話框中之所以在菜單上保存該條目有兩個原因:1.讀入純文本的情況非常普遍,放在這里更加醒目;2.為了和SPSS老版本的使用上保持兼容。例2.1現(xiàn)有一數(shù)據(jù)文件以純文本的形式存為“c:\Li2_1.txt〞,且第一行為變量名,請將其讀入SPSS。解:在OpenFile對話框選中相應的文件名并單擊“確定〞,系統(tǒng)會自動啟動文本導入向導對話框如下:在SPSS10.0中,該向導并沒有重新設計,因此仍然有問題被截斷無法顯示完的情況出現(xiàn)。可以看到該向導共分6步,這是第一步。中部為一對單項選擇按鈕,問題為“你的文本文件和預定義格式相一致嗎?〞,下方為按預定義格式讀入的數(shù)據(jù)文件的預覽。顯然,SPSS的預定義格式并沒有正確識別該文件。因此選擇“No〞并單擊“下一步〞,系統(tǒng)彈出向導的下一個對話框如下:最上方的問題是“你的變量是如何排列的?〞,下面的選項分別為Delimite〔用某種字符區(qū)分〕和FixedWidth〔固定寬度〕,一般都是Delimite,第二個問題是“變量名包括在文件最前面了嗎?〞,我們當然選“Yes〞,單擊“下一步〞,系統(tǒng)彈出第三個對話框:最上方的句子意為“第一條記錄從第幾行開始?〞,右側可以輸入行數(shù)。由于我們所用的數(shù)據(jù)第一行為變量名,因此這里輸入2。下面的問題是“你的記錄是怎樣存儲在文件中的?〞。可以是“每一行代表一條記錄〞,或者“每**個變量代表一條記錄〞,數(shù)據(jù)一般都是第一種情況。下一個問題是“你想導入多少條記錄?〞,可以是“所有記錄〞、“前**條〞或“隨機導入**%的記錄〞。一般也選前者。單擊“下一步〞,第四個對話框如下:我這里寫的非常詳細,但實際使用中你可以不管大多數(shù)問題,因為SPSS一般都能自動正確設置。最上方的問題為“變量間用的是哪種分隔符?〞,可選的有Tab鍵、空格、逗號、分號或自行定義的其他符號。本數(shù)據(jù)摘用的是空格,可見系統(tǒng)已經(jīng)自動識別并選擇了空格,而下方的數(shù)據(jù)預覽窗口顯示出了正確的數(shù)據(jù)讀入情況。單擊“下一步〞,第五個對話框如下:上方的提示為“定義在數(shù)據(jù)預覽窗口中所選擇的變量。〞。顧名思義,在這個對話框中你可以在數(shù)據(jù)預覽窗口中選擇某一列變量,然后更改其變量名和類型。當然,在這里我們不用這樣做,直接單擊“下一步〞,系統(tǒng)彈出文本導入向導的最后一個對話框如下:最上面的問題為“你情愿保存這次的文件〔讀入〕格式設置以備下次使用嗎?〞,第二個問題為“你是否情愿將以上操作粘貼為SPSS語句?〞,一般這兩個問題我們都可以不管。單擊“完成〞,系統(tǒng)最終成功的讀入了Li2_1.txt。2.1.3保存數(shù)據(jù)文件在對數(shù)據(jù)做了修改后,保存數(shù)據(jù)文件是必不可少的工作之一。選擇菜單File==>Save,如果數(shù)據(jù)文件曾經(jīng)存儲過,那么系統(tǒng)會自動按原文件名保存數(shù)據(jù);否那么,就會彈出和選擇Saveas菜單時相同的Saveas對話框。里面可以保存的數(shù)據(jù)類型和可以翻開的幾乎一樣多,選擇適宜的類型,確定就是了。Save命令的快捷鍵為^S,如果你曾經(jīng)領教過Windows死機的巨大潛力,那么你一定會同意習慣性的隨手按^S至少不能算是一個壞習慣。如果你準備將數(shù)據(jù)存為SPSS以外的其他類型,要注意有些設置可能會喪失,如標簽和缺失值等。特別是缺失值,如果想存的數(shù)據(jù)格式不支持缺失值,那你的數(shù)據(jù)可能會變的面目全非。2.1.4File菜單中的其他條目【DispDataInfo】該菜單項用于顯示數(shù)據(jù)的根本信息,選擇它后會彈出非常類似于翻開文件的一個對話框用于選擇數(shù)據(jù)文件,選擇好后按OK,系統(tǒng)就會在結果窗口中列出所選數(shù)據(jù)的根本情況,如建立時間、標簽設置、記錄數(shù)、變量設置等?!続pplyDataDictionary】即使用數(shù)據(jù)字典,該功能使你可以直接在新數(shù)據(jù)集中套用以前定義好的變量設置〔格式、標簽等,但不包括數(shù)據(jù)類型〕,舉個例子吧:請翻開Li1_1.sav文件,將變量x的長度從8改為4,標簽刪掉,然后選擇菜單File==>ApplyDataDictionary,在文件對話框中選擇Li1_1.sav并按OK〔即將Li1_1.sav的變量設置按相同變量名一一套用在現(xiàn)在的數(shù)據(jù)集上〕,怎么樣?一切都變回去了吧?!綜acheData】建立數(shù)據(jù)緩沖區(qū)。以前SPSS每執(zhí)行一條命令都會重新讀取所需的數(shù)據(jù),如果是從遠程用SQL調(diào)用數(shù)據(jù)庫,這會非常的費時。現(xiàn)在使用CacheData,可以將數(shù)據(jù)全部讀入暫存盤,建立活動數(shù)據(jù)的緩沖區(qū)。大大加快處理速度。不過我特意試了一下,如果是處理本機數(shù)據(jù)的話,該命令對速度的提升不是非常明顯:(?!綪rint和PrintPreview】這兩個菜單項用于將數(shù)據(jù)治理窗口中的數(shù)據(jù)以表格的形式打印出來,其中PrintPreview是新增加的,使用上和WPS2000的打印預覽非常相似〔其實用的是同樣的程序〕,不過和SPSS結果的打印程序一樣,用SPSS直接打印數(shù)據(jù)非常的浪費紙張,用不用你自己決定吧。【StopProcessor】用于停止執(zhí)行當前的SPSS命令。由于SPSS處理速度非常的慢,如果你正在對一個大型的數(shù)據(jù)執(zhí)行統(tǒng)計命令,等了半天都沒有結束,此時你的另一半約你逛街的時間又要到了,可是你的結果還沒有存,執(zhí)行命令時又存不了,怎么辦呢?試試這個命令吧。并非所有的命令都可以喊停的,許多數(shù)據(jù)庫操作命令〔計算變量,合并等〕好象就停不了?!?.2編輯數(shù)據(jù)文件在SPSS中,數(shù)據(jù)文件的編輯、整理等功能被集中在了Data和Transform兩個菜單項中,這兩個菜單的內(nèi)容如下所示:Data菜單項Transform菜單項下面我們將根據(jù)其功能來分別講述。2.2.1定義新變量.1直接定義新變量大多數(shù)情況下我們需要從頭定義變量,在SPSS10.0中,定義變量的操作界面和FoxPro等數(shù)據(jù)庫非常相似,只需單擊左下方的VariableView標簽就可以切換到變量定義界面開始定義新變量。如Li1_1.sav的變量定義如下所示:以變量x為例:變量名為x,類型為Numeric,寬度為4,小數(shù)位數(shù)2位〔因小數(shù)點還要占一位,故整數(shù)位只有一位〕,變量標簽位為“血磷值〞。右側在圖中未能看到的依次為Values,用于定義具體變量值的標簽;Missing,用于定義變量缺失值;Colomns,定義顯示列寬;Align,定義顯示對齊方式;Measure,定義變量類型是連續(xù)、有序分類還是無序分類。使用該窗口,我們可以一次定義許多新變量,不會象老版本那樣一個一個的定義了。由于SPSS是英文軟件,變量名摘用中文會有潛在的沖突〔100%的兼容性是不存在的,典型的例子就是微軟公司的產(chǎn)品〕。對于喜歡搞點把戲的用戶,這里有必要介紹一下SPSS中標簽和缺失值的定義方法:標簽和老版本不同,現(xiàn)在變量標簽和變量值標簽被分開設置,變量標簽就在Label框中直接輸入,變量值標簽那么在它右側的Value框定義。以group為例,單擊Value框右半部的省略號,會彈出變量值標簽對話框如下:上部的兩個文本框分別為變量值輸入框和變量值標簽輸入框,分別在其中輸入“1〞和“克山病患者〞,此時下方的Add鈕變黑,單擊它,該變量值標簽就會被參加下方的標簽框內(nèi)。與此類似定義變量值“2〞為“健康人〞,最后按OK,變量值標簽就設置完成。此時你做任何分析,在結果中都有相應的標簽出現(xiàn)。如果你現(xiàn)在就想看效果,切換回DataView界面,然后選擇菜單View==>ValueLabels,怎么樣,看到了嗎?缺失值單擊missing框右側的省略號,會彈出缺失值對話框如下:界面上有一列三個單項選擇鈕,默認值為最上方的“無缺失值〞;第二項為“不連續(xù)缺失值保疃囁梢遠ㄒ?個值;最后一項為“缺失值范圍加可選的一個缺失值〞,文如其意,不用我多解釋了吧。第二章數(shù)據(jù)文件的治理〔下〕2.1建立與保存數(shù)據(jù)文件-File菜單2.1.1新建數(shù)據(jù)文件直接翻開使用數(shù)據(jù)庫查詢翻開使用文本導入向導讀入文本文件2.1.2翻開其他格式的數(shù)據(jù)文件2.1.3保存數(shù)據(jù)文件2.1.4File菜單中的其他條目2.2編輯數(shù)據(jù)文件2.2.1定義新變量直接定義新變量從原有變量計算新變量-Transform菜單2.2.2數(shù)據(jù)的錄入直接錄入數(shù)據(jù)錄入技巧2.3進一步整理數(shù)據(jù)文件-Data菜單2.3.1用于數(shù)據(jù)治理的菜單項2.3.2正交設計菜單項從原有變量計算新變量從頭定義變量的情況多數(shù)在建立數(shù)據(jù)集時出現(xiàn)。但是,當數(shù)據(jù)集已經(jīng)建立,需要整理、轉換變量時,碰到的更多情況是需要根據(jù)某種條件從原有變量計算新變量。下面我們將按菜單條目的順序依次講解他們的功能。但是,首先我們需要了解一下所用的對話框界面的情況?!維PSS對話框元素介紹】下面是我們在第一章曾經(jīng)見過的兩樣本t檢驗對話框:這是一個非常典型的SPSS對話框。它包含了許多具有SPSS特色的對話框元素:對話框左側為候選變量列表框,里面列出了可被該對話框使用的變量;右上方為TestVariables框,可將變量選入其中;注意在兩個框的中間用“〞相連,這是變量移動按鈕,其方向說明是將變量從那個框移動到哪個框,上圖中我們選中了變量group,兩個移動按鈕均變黑并向右指,說明變量group可以移動到他們右側的兩個框里去,改變當前框〔在其他兩個框里單擊〕,移動按鈕就會轉向、變灰等以說明不同的意思〔墻頭草一個,可別小看這個功能,我想用VB實現(xiàn)這個功能,也是費了些工夫才把它搞定了〕;右側為一排五個按鈕,分別是確定、粘貼、重置、取消和幫助。這五個兄弟也是幾乎永遠一起出現(xiàn)的,另外四個大家都比較熟悉了,重置〔Reset〕按鈕用于取消對話框內(nèi)已做的選擇,恢復到默認的狀態(tài);最下方有個Options按鈕,用于設置專門用于該對話框的選項;OK、Paste兩個按鈕為灰色,說明所需條件尚未滿足,該按鈕暫不可用。同理,GroupingVariable框下方的DefineGroups按鈕為灰色顯示,也說明暫不可用?!綜omputeVariable對話框】例3.2在li1_1.sav中建立新變量temp,令其值當血磷值大于1時為2,否那么為1。解:這里需要用到ComputeVariable對話框,外加一點技巧。首先給變量temp均賦值為1,然后將血磷值大于1的記錄其temp變量值改為2即可。選擇菜單Transform==>Compute,彈出ComputeVariable對話框如下:左上角為需要計算的變量名,在其中鍵入“temp〞,此時“Type&Lable〞按鈕就會變黑,喜歡精確的朋友可以在這里對temp進行詳細的定義,但如果你和我一樣非常懶,就可以對它視而不見〔不要生氣,聰明人大多都非常懶:)〕;左下方為候選變量列表,現(xiàn)在還用不著;中部為類似計算器的軟鍵盤,可以用鼠標按鍵輸入數(shù)字和符號,這里我們直接輸入“1〞,輸入的內(nèi)容回立刻在右上方的數(shù)值表達式窗口中出現(xiàn);軟鍵盤右側為函數(shù)窗口,可以在這里找到并使用所需的SPSS函數(shù);這次也用不到。好,現(xiàn)在“OK〞按鈕已經(jīng)變黑,單擊他,系統(tǒng)就會自動生成一個新變量temp,并且取值均為1。軟鍵盤上幾個奇奇怪怪的符號的含義如下:~=&|**~不等號,等價于<>邏輯符號AND邏輯符號OR乘方,相當于函數(shù)EXP()邏輯符號NOT在函數(shù)窗口中選中某個函數(shù)并單擊右鍵,系統(tǒng)就會彈出該函數(shù)的用法說明。函數(shù)主要是和變量名組合起來使用的,比方說ABS(x)就是取變量x的絕對值。好,現(xiàn)在開始進行第二步,再次選擇菜單Transform==>Compute,系統(tǒng)也再次彈出這個對話框--等等!注意到了嗎?該對話框自動記住了你上次輸入的內(nèi)容,幾乎所有SPSS的對話框都有這個特性,這會大大方便我們的使用。好,將數(shù)值表達式窗口中的1改為2,然后單擊中下部的“If〞按鈕,系統(tǒng)彈出記錄選擇對話框如下:不需要太多解釋,大局部內(nèi)容都是前面見過的。由于我們這里不是對所有記錄做變換,因此選中第二個單項選擇鈕“Includeifcasestatisfiesconfition:〞,此時下方的所有窗口變亮,說明現(xiàn)在可用;而“Continue〞按鈕變灰,說明當前還沒有提供所需的信息,好,我們就來提供,在左側選中血磷值(x),然后單擊“〞,x就被引入了右側的變量框,任你用鍵盤或者用鼠標,總之將下面這個算式補充完:x>1?,F(xiàn)在可見“Continue〞按鈕再度變黑。在它又變灰之前趕快單擊它〔開個玩笑〕,系統(tǒng)回到ComputeVariable對話框,請注意If按鈕右側的變化:x>2。如果你做的結果不一樣,請重來一遍。現(xiàn)在單擊“OK〞按鈕,由于我們要替換變量值,系統(tǒng)會彈出一個確認對話框,確認替換,立刻你就會看到,我們已經(jīng)把這道題做完了?!綜ount對話框】Count對話框用于計算某個值或某些值在某個變量的取值中是否出現(xiàn)〔好象有點拗口〕,比方我們想看看有哪些記錄的血磷值在2~3之間,選擇菜單Transform==>Count,系統(tǒng)彈出Count對話框如下:TargetVariable框中用于指定記錄變量值是否出現(xiàn)的變量名,在這里輸入temp2;選中血磷值(x),將其選入Variables窗口,此時“DefineValues〞按鈕變黑,單擊它,系統(tǒng)彈出變量值定義窗口如下:左半部為變量值定義窗口,可以定義某個值、系統(tǒng)缺失值、系統(tǒng)或用戶定義缺失值、變量值范圍、小于某值或大于某值。我們這里是第四種情況:選擇Range,在through兩側分別鍵入2、3,然后單擊已變黑的“Add〞按鈕,“2thru3〞就會被參加“ValuestoCount〞框內(nèi)。然后單擊“Continue〞,再單擊Count對話框的“OK〞,可以看到系統(tǒng)自動生成變量temp2,其中10、11號記錄因血磷值介于2和3之間,temp2取值為1,其余的記錄temp2取值均為0。SOS,SOS,請大家千萬注意,Count對話框有一個潛在的bugs,當你需要計算同時滿足兩個變量取值條件的記錄數(shù)有多少時,直接用該對話框會得出完全錯誤的結果。這里有一點技巧,需要對對話框生成的指令加以修改,至于怎么修改嘛,我們將在Syntax〔語法〕窗口使用詳解一章中講述:)?!綬ecode對話框】Recode對話框用于從原變量值按照某種一一對應的關系生成新變量值,可以將新值賦給原變量,也可以生成一個新變量。例2.3在Li1_1.sav中生成新變量temp3,當血磷值小于1時取值為0,1~2時取值為10,大于2時取值為20。解:選擇菜單Transform==>Record==>IntoDifferentVariables,Recode對話框如下:將血磷值(x)選入InputVariable->OutputVariable框,此時OutputVariable框變黑,在其中鍵入新變量名temp3并單擊Change,可見原來的x->?變成了x->temp3?,F(xiàn)在單擊“OldandNewValues〞,系統(tǒng)彈出變量值定義對話框如下:許多東西和前面類似,不再重復。按照題目的要求,選擇Range:Lowestthrough,在右側框中鍵入1,然后在右上方的Value右側框中鍵入對應的新變量值0,此時下方Add鍵變黑,單擊它,Old->New框中就會參加Lowestthru1->0,按照類似的方法依次參加另兩條轉換規(guī)那么,最終Old->New框中共有Lowestthru1->0、1thru2->10、Else->20三條,現(xiàn)在單擊Continue,再單擊OK,系統(tǒng)就會按要求生成新變量temp3。哎呀不得了,圖片太多了,雖然這樣非常直觀,但下載速度太慢了。等大家對根本界面操作熟悉了后,我們將比照擬簡單的對話框試著對操作用文字的方式描述,比方上面的操作我們將用文字表達為:OutputVariable框:選入xOutputVariableName框:鍵入temp3:單擊Change鈕選中x->temp3:單擊OldandNewValues鈕:Range:Lowestthrough單項選擇鈕:鍵入1:NewValueValue單項選擇鈕:鍵入0:單擊Add鈕Range:through單項選擇鈕:兩側分別鍵入1、2:NewValueValue單項選擇鈕:鍵入10:單擊Add鈕Range:Allothervalues單項選擇鈕:NewValueValue單項選擇鈕:鍵入20:單擊Add鈕單擊Continue單擊OK怎么樣,還能理解吧。【CategorizeVariables對話框】CategorizeVariables對話框用于將連續(xù)性變量自動按要求分成等間距的幾類。其界面非常簡單,許多東西都是我們所熟悉的,唯一特別的是右下方的numberofcategories框,用于輸入變量的等級數(shù),默認為4,比方我們希望將血磷值按大小分成5個等級,先將血磷值選入CreateCategories框,然后將下面的4改為5,單擊OK,就會看到系統(tǒng)產(chǎn)生了一個新變量nx〔即numberofx之意〕,其取值就對應了血磷值相應的5個等級〔1~5〕。重復一下,具體操作步驟為:CreateCategories框:選入xNumberofcategories框:5OK【RankCases對話框】例2.4請分組計算血磷值的秩和。解:選擇菜單Transform==>RankCases,彈出RankCases對話框如下:將血磷值選入Variable框,分組變量選入By框,單擊OK即可。系統(tǒng)會建立一個新變量rx〔即原變量名前加r表示Rank之意〕,其取值為x分組的秩次。解釋一下RankCases對話框的其他幾個零件:左下角的AssignRank1to框架用于選擇將秩次1賦給最小值還是最大值;中下部的Displaysummarytables復選框用于確定是否在結果窗口內(nèi)輸出結果報表;RankTypes鈕用于定義秩次類型,有Rank〔秩分數(shù)〕、Savage評分〔新變量值按指數(shù)分布〕、Fractionalrank〔新變量值是秩分數(shù)除以非缺失值觀測量的權重之和〕、Fractionalrank%〔新變量值是秩分數(shù)除以非缺失值觀測量數(shù)乘100〕、Sumofcaseweights〔新變量值是各觀測量的權重之和〕、Ntiles〔新變量值是按所選變量的百分位數(shù)分組的組序號〕,默認值為Rank。單擊More按鈕,還會有更多的設置,這里就不再講了。Ties鈕用于定義對相同值觀測量的處理方式,可以是取平均秩次、最小值、最大值或當作一個記錄處理,默認值為取平均秩次。【AutomaticRecord對話框】該對話框用于按原變量值的大小生成新變量,變量值就是原值的大小次序,功能和RankCases對話框重復〔等價于相同值觀測量當作一個記錄處理的情況〕。【CreateTimeSeries對話框】用于自動生成時間序列變量,由于太專業(yè),這里不做過多解釋。【ReplaceMissingValue對話框】用于填充缺失值,結果存入一個新變量。填充方法有:序列的均數(shù)、相鄰假設干點的均數(shù)、相鄰假設干點的中位數(shù)、線性內(nèi)插、線性外延,默認值為序列的均數(shù)。數(shù)據(jù)的錄入直接錄入我想直接錄入的問題就不用多講了吧,直接敲就是了!數(shù)據(jù)錄入技巧和其他常用統(tǒng)計軟件相比,SPSS數(shù)據(jù)界面最大的優(yōu)勢就是支持鼠標的挈放操作,以及拷貝粘貼等命令,下面的數(shù)據(jù)錄入技巧就是對這些功能的利用?!具B續(xù)多個相同值的輸入】如前面group變量有連續(xù)多個1,如果直接輸入,可以在第一格內(nèi)輸入1并回車,然后回到剛剛的單元格并單擊右鍵,選擇copy,最后用挈放方式選中所有應輸入1的單元格,單擊右鍵并選擇paste,所有選中的單元格就會都被剛剛拷貝的1填充。【將EXCEL數(shù)據(jù)直接引入SPSS】Excel已經(jīng)翻開原數(shù)據(jù),并且數(shù)據(jù)量較少的時候,可以直接用拷貝粘貼的方法將數(shù)據(jù)引入SPSS:先在EXCEL中選中所有的數(shù)據(jù)〔不包括變量名〕,然后選擇拷貝命令;然后切換到SPSS,最好使行1列1單元格成為當前單元格,然后執(zhí)行粘貼命令,數(shù)據(jù)就會全部轉入SPSS,再定義相應的變量即可。2.3進一步整理數(shù)據(jù)文件--Data菜單在許多情況下,我們需要先對數(shù)據(jù)進行一些整理〔如分組、合并、加權等〕才能將其用于最終的統(tǒng)計分析。這些功能根本上都集中在Data菜單項中,下面我們就對這些對話框做逐一介紹。2.3.1用于數(shù)據(jù)治理的菜單項【SortCases對話框】例2.5對數(shù)據(jù)集li1_1.sav按group升序,x降序的次序排列。解:選擇菜單Data==>SortCases,系統(tǒng)彈出SortCases對話框,該對話框并不復雜,其中比較特殊的是下方的SortOrder單項選擇鈕,有升序和降序兩種選擇。請注意,該單項選擇鈕是和上方的SortBy框一起使用的,具體方法如下:確認升序單項選擇鈕被選擇,將Group選入SortBy框;選擇降序單項選擇鈕,將x選入SortBy框。請注意:group和x后面分別跟著Ascending和Descending,說明前者是按升序、后者按降序排列;由于Group在前,因此排序時以Group優(yōu)先。【Transepose對話框】該對話框用于對數(shù)據(jù)進行行列轉置,可以在原數(shù)據(jù)文件中指定一個變量記錄轉置后的變量名。原變量名那么自動保存在系統(tǒng)產(chǎn)生的名為case_lbl的字符變量中。該對話框也非常簡單,左側為候選變量框;右上方為Variable框,用于選入需要轉置的變量,一般應選入除名稱變量外的所有其他變量,如果有變量未選入,那么轉置時會被自動丟棄;右下方為NameVariable框,用于指定原數(shù)據(jù)文件中記錄轉置后變量名的字符變量,但不是必需的,此時系統(tǒng)會將新變量自動按var001、var002...的順序命名。【MergeFiles對話框】用于合并數(shù)據(jù)文件,實際上包括了兩個對話框,分別對應了兩種合并方式:1.從外部數(shù)據(jù)文件中增加記錄到當前數(shù)據(jù)文件中,稱為縱向合并,用AddCases對話框完成,相互合并的數(shù)據(jù)文件中應該有相同的變量。選擇菜單Data==>MergeFiles==>AddCases,系統(tǒng)首先彈出翻開數(shù)據(jù)文件對話框,選中需要添加的數(shù)據(jù)文件并按OK,系統(tǒng)才彈出AddCases對話框,左側顯示的是新、老數(shù)據(jù)文件中不匹配的變量名,右側顯示的是已經(jīng)匹配的變量名??梢杂肦ename按鈕對不匹配變量改名〔先選中〕或用鼠標強行匹配〔即先按Ctrl鍵選中匹配的兩個變量再單擊Pair鈕〕。右下方的Indicatecasesourceasvariable復選框用于定義一個新變量以區(qū)分哪些記錄是后來添加的。選擇停當后單擊OK,該操作就完成了。實際上右側顯示的是將要包括在合并后數(shù)據(jù)集中的變量,如果有哪個你不需要,把它弄到左側框中即可。2.從外部數(shù)據(jù)文件增加變量到當前數(shù)據(jù)文件,稱為橫向合并,用AddVariable對話框完成,相互合并的數(shù)據(jù)文件中應包含同樣的記錄。選擇菜單Data==>MergeFiles==>AddVariable對話框,系統(tǒng)同樣先彈出翻開數(shù)據(jù)文件對話框,單擊OK后彈出和前面相似的AddVariable對話框。按需選擇即可。【Aggregate對話框】用于對數(shù)據(jù)進行分類匯總,所謂分類匯總就是按指定的分類變量對觀測值進行分組,對每組記錄的各變量值求指定的描述統(tǒng)計量,結果可以存入新數(shù)據(jù)文件,也可以替換當前數(shù)據(jù)文件。上圖中各個零件的含義如下:BreakVariables框:用于選擇分組變量;AggregateVariables框:用于選擇被匯總的變量;Name&Label鈕:用于定義新產(chǎn)生的匯總變量的名稱和標簽;Function鈕:用于定義匯總函數(shù),共有三組函數(shù),以最常用的第一組為例,可選的函數(shù)有均數(shù)、同組的第一個觀測值、最后一個觀測值、同組記錄數(shù)、標準差、最小值、和、最大值共8個;SaveNumberofcasesinbreakgroupasvariable復選框:用于定義一個新變量以存儲同組的記錄數(shù);Createnewdatafile單項選擇鈕:定義一個新文件以存儲匯總的結果,右側的File鈕用于具體文件名的定義,默認文件名為AGGR.sav;Replaceworkingdatafile單項選擇鈕:用匯總的結果替換原來的數(shù)據(jù)。例2.6計算Li1_1.sav中兩組的血磷值標準差。解:該題完全可以用更簡單的方法完成,這里只是演示一下匯總對話框的用法。BreakVariables框:GroupAggregateVariables框:xFunction鈕:(Standarddeviation單項選擇鈕:Continue鈕)Replaceworkingdatafile單項選擇鈕:選中OK【SplitFile對話框】用于將數(shù)據(jù)文件分組進行處理,該對話框我們在第一章時已經(jīng)使用過了,這里再介紹一下各個對話框元素的用途:Analyzeallcases單項選擇框:和下面的兩個單項選擇框為一組,選中本框不拆分文件;Comparegroups單項選擇框:按所選變量拆分文件,各組分析結果緊挨在一起便于相互比較;Organizeoutputbygroups單項選擇框:按所選變量拆分文件,各組分析結果單獨放置;Groupsbasedon框:用于選擇拆分數(shù)據(jù)文件的變量;Sortthefilebygroupingvariables單項選擇框:將數(shù)據(jù)按所用的拆分變量排序;Fileisalreadysorted單項選擇框:數(shù)據(jù)保持原狀,不按所用的拆分變量排序。【SelectCases對話框】很多時候我們不需要分析全部的數(shù)據(jù),而是按某種要求分析其中的一局部〔比方只分析男性的身高、只對前200個數(shù)據(jù)進行分析以了解大概情況〕,這時使用SelectCases對話框可以大大簡化工作。該對話框界面如下所示:其中主要的對話框元素為:Allcases單項選擇鈕:和下面的4個單項選擇鈕為一組,選中它那么分析所有的記錄;Ifconditionissatisfied單項選擇鈕:只分析滿足條件的記錄;If按鈕:和If單項選擇鈕一起使用,單擊后彈出If對話框;Randomsampleofcases單項選擇鈕:從原數(shù)據(jù)中按某種條件抽樣;Sample按鈕:和Random單項選擇鈕一起使用,可以設定按百分比抽取記錄,或者精確設定從前假設干個記錄中抽取多少個記錄;Basedontimeorcaserange單項選擇鈕:基于記錄序號來選擇記錄;Range按鈕:和Based單項選擇鈕一起使用,用于輸入記錄序號范圍;Usefiltervariable單項選擇鈕:使用篩選指示變量來選擇記錄,必需在下面選入一個篩選指示變量,該變量取值為非0的記錄將被選中,進入以后的分析;Filtered單項選擇鈕:和下面的Deleted單項選擇鈕為一組,表示未被選中的記錄只是被隔離,這些記錄的記錄號會被加上斜杠以示區(qū)別;Deleted單項選擇鈕:未被選中的記錄將被刪除,一般不要使用。當對數(shù)據(jù)集做出篩選后,所做的篩選將在以后的分析中一直有效,直到再次改變選擇條件為止。同時在多數(shù)情況下,系統(tǒng)會自動產(chǎn)生一個名為filter_$的篩選指示變量,被選中的記錄該變量取值為1,反之那么為0?!網(wǎng)eightCases對話框】在默認情況下,每一行就是一條記錄,這在多數(shù)情況下沒有什么問題,但有時卻非常麻煩,想想看如果你需要計算一個四格表卡方,有100例,如果每一行就是一條記錄,你就需要輸入100條記錄!如果希望在計算過程中利用不同的變量對數(shù)據(jù)進行加權處理,就需要用到WeightCases對話框。該對話框的使用極為簡單,界面上有兩個單項選擇鈕,分別是不權重記錄和用某變量權重記錄,如果選擇后者,那么需要選中一個權重變量?!綝ata菜單中的其余對話框】Definedates對話框:可以自動生成時間變量。InsertVariable命令:在當前列插入新變量。Insertcases命令:在當前行插入新記錄。Gotocases對話框:到達指定記錄號的記錄,該命令在記錄數(shù)極多時〔1000條以上〕非常有用。正交設計菜單項正交設計不包含在SPSS/BASE模塊中,因此由于解密范圍的問題,有的D版中不含該菜單項,不過我用的10.0版里是有的:)。以前我以為SPSS不能作正交設計,感謝網(wǎng)友edof@sh的提醒,經(jīng)研究,在SPSS中可以直接進行正交設計,OrthogonalDesign子菜單項就是專門用于完成該任務的,具體做法用下面的例子說明如下:例2.7做A、B兩個因素的正交設計,A因素有三個水平,B因素有兩個水平。解:選擇Data-->OrthogonalDesign-->generate,彈出的就是正交設計窗口,操作如下:Factorname框:輸入A;單擊ADD鈕;確定變量A被選中,單擊Definevalue鈕;

Value列:頭三行分別輸入1、2和3,代表變量A的三個水平;單擊continue鈕;Factorname框:輸入B;單擊ADD鈕;確定變量B被選中,單擊Definevalue鈕;

Value列:頭兩行分別輸入1、2,代表變量B的兩個水平;單擊continue鈕;單擊OK在第10步定義完后,對話框應如以下列圖所示:在其他沒有用到的選擇項中,各種LABELS當然適用于定義相應的各種標簽的;DataFiles單項選擇框組用來定義產(chǎn)生的數(shù)據(jù)文件是存為制定的文件名,還是直接替換當前工作文件;而DefineValue對話框中的Autofit框可以自動填充從1到你輸入的那個數(shù)值這么多個水平的定義,特別適合我這種懶人。這里我們直接替換當前工作文件,在這個自動產(chǎn)生的正交設計數(shù)據(jù)集中,前兩個變量就是要分析的A和B,各個水平已經(jīng)按正交設計的要求排列好了。后面的status_和card_變量是系統(tǒng)產(chǎn)生的LOG變量,可以不管它?,F(xiàn)在你再建立一個結果變量,輸入實驗結果,就可以進行正交設計的分析了。第三章:程序編輯窗口用法詳解3.0.1程序編輯窗口界面3.0.2邂逅Paste按鈕3.0.3用程序編輯窗口加快我們的工作3.0.4用程序編輯窗口完成對話框無法完成的工作3.0.5再羅嗦幾句在某年某月的某一天,你和你的另一半正在街上為地球外表的平整而奉獻自己的綿薄之力。突然〔也許是必然〕,你覺得有些餓了。這是一個問題,當然,不用說大家也知道解決問題的方法就是--食。不過就是食也有講究,可以隨便找個面館簡單的填飽肚子;要求高的話還可以去幾星級的地方享受一下;當然還有的人覺得自己回去做口味也適宜,花費也不多;更有些超級美食家,星級水準也不滿意,需要親自給一級廚師露一手,指點他們一下,才會食的滿意。好,使用SPSS進行統(tǒng)計分析的方式就象上面填飽肚子的方法一樣有幾種選擇,如果你烹飪工夫還欠火候,或者習慣了享受星級效勞,那么直接使用SPSS為你提供的對話框進行操作就是了;而如果你習慣了DIY,甚或對話框也無法滿足你的統(tǒng)計分析要求〔別瞪眼,下面你就會看到了〕,就請你在本章學習一下如何寫SPSS程序吧。什么?SPSS還有程序?!是的,如果大家以前用過SPSS/PC+4.0,就一定不會對SPSS的程序感到生疏:在那個非常遙遠的DOS時代〔大約15年前〕,學習SPSS程序的語法,掌握如何編寫SPSS程序是熟練使用SPSS的必要條件〔但還不充分〕。隨著Windows旋風的登陸,軟件的易操作性被推進到了前所未有的高度,而SPSS顯然是統(tǒng)計軟件中做的最成功的一個。他的操作界面是如此的成功,讓使用者可以完全無須了解SPSS的語法而使用其99%的功能,使得SPSS程序被人逐漸忘記。其實,適當?shù)氖褂肧PSS程序可以大大提高我們的工作效率,并且SPSS在設計時也充分注意到了編程功能和使用界面的結合--還記得Paste按鈕嗎?下面我們就結合幾個實例來學習如何使用程序編輯窗口。請注意:我們不準備教大家那些枯燥的SPSS語法,現(xiàn)在寫SPSS程序就象在WORD中記錄宏一樣簡單,所需要做的只是略加修改而已。3.0.1程序編輯窗口界面選擇菜單File==>new==>syntax,系統(tǒng)會開啟一個新的程序編輯窗口如下:Syntax從字面上應該翻譯為句法、語法的意思,這里從實際用途出發(fā),翻譯為程序。和以前見過的數(shù)據(jù)治理窗口相比,這個窗口簡單的不能再簡單了。菜單項中的File、Edit、View、Analyze、Graphs等菜單都是通用的,唯一特殊的是Run菜單,該窗口的特殊功能均在這里實現(xiàn)。3.0.2邂逅Paste按鈕Paste按鈕在幾乎所有SPSS對話框中均存在,它是專門為編程準備的。以第一章的那個t檢驗為例,如果最終選擇完畢后不單擊OK而是單擊Paste,那么程序編輯窗中會自動生成以下語句:T-TESTGROUPS=group(12)/MISSING=ANALYSIS/VARIABLES=x/CRITERIA=CIN(.95).這就是你剛剛想做的工作,如果運行它,就可以得到t檢驗的結果!怎么運行?選擇菜單Run==>all,看到了嗎?Paste按鈕如何能生成程序?在SPSS中,操作界面實際上起的就是“操作界面〞的作用。當你用對話框選定某項操作,單擊OK后,SPSS就將你的選擇翻譯成程序語句,然后提交系統(tǒng)執(zhí)行。如果你單擊Paste按鈕,SPSS就不將生成的程序語句提交執(zhí)行,而是傳送到程序編輯窗中供你折騰。說的再廣一些,不光SPSS,SAS等其他統(tǒng)計軟件也是這么做的。從上面的語句可以看到SPSS程序的根本結構:一條語句可占多行,最前面為語句主體,具體的選項用斜杠和語句主體相連,最后用小數(shù)點結束語句。3.0.3用程序編輯窗口加快我們的工作如果程序編輯窗口只能帶來“暫停〞功能的話,我也就不用再往下寫了。幸好,它的作用還遠不止與此。當需要成批次的處理數(shù)據(jù)時,當你需要重復進行相同的統(tǒng)計分析時,當你要做許多統(tǒng)計分析,每一步均費時較長而你又不想等時...,使用Paste按鈕是你的救命稻草。仍以第一章為例,如果從預分析一開始就連續(xù)使用Paste按鈕,那么到分析結束我們會得到如下程序:DESCRIPTIVES

VARIABLES=x

/STATISTICS=MEANSTDDEVMINMAX.

SORTCASESBYgroup.

SPLITFILE

SEPARATEBYgroup.

DESCRIPTIVES

VARIABLES=x

/STATISTICS=MEANSTDDEVMINMAX.

GRAPH

/HISTOGRAM=x.

T-TEST

GROUPS=group(12)

/MISSING=ANALYSIS

/VARIABLES=x

/CRITERIA=CIN(.95).現(xiàn)在你可以再次啟用Run菜單來一次完成所需的統(tǒng)計分析。特別的,如果你的數(shù)據(jù)還會不斷添加〔試驗尚未結束〕,就可以把該程序存為程序文件〔*.sps〕,下次讀入新數(shù)據(jù)后再運行一次就可以直接得到新的結果。Run菜單幾個選項的含義分別為:ALL運行全部程序。SELECTION運行所選擇的程序語句。CURRENT運行當前光標所在行的語句。TOEND從當前語句起一直運行到程序結束。3.0.4用程序編輯窗口完成對話框無法完成的工作如果程序編輯窗口的本領只限于上面介紹的這一點,那么在Windows時代,它仍然不配我來專門寫一章。還記得嗎?上面我提到用SPSS的圖形界面可以完成99%的工作,可有時候你偏偏需要用另外那1%的功能,請看下面的例子:例3.1請翻開SPSS提供的cars.sav數(shù)據(jù),假設每條記錄代表一輛車,現(xiàn)在將按以下條件挑選一些車出來:Year<=76、Cylinder<=4、Weight>=3000,并且要看看每輛車符合了以上三條要求中的幾條。解:沒有什么難的,從第二章的知識我們了解到Count對話框就是做這類事情的,好,在Count對話框進行操作如下:Targetvariable框:鍵入G1〔新變量名〕Numericvariable框:選入Year單擊Definevalues鈕:Rangelowestthrough:鍵入76:單擊ADD鈕單擊Continue鈕Numericvariable框:選入cylinder單擊Definevalues鈕:Rangelowestthrough:鍵入4:單擊ADD鈕單擊Continue鈕Numericvariable框:選入Weight單擊Definevalues鈕Rangethroughhigest:鍵入3000:單擊ADD鈕單擊Continue鈕單擊OK好了,做完了--不過好象不大對勁呀!怎么前面做的條件選擇在后面定義的時候仍然出現(xiàn)?再看看結果,更不對了!看來有問題。毛病出在哪里呢?請再次開啟Count對話框,選擇好的條件仍然在里面,單擊Paste鈕,可以看到這些選擇產(chǎn)生的SPSS語句如下:COUNTG1=yearcylinderweight(Lowestthru76)yearcylinderweight(Lowestthru4)yearcylinderweight(3000thruHighest).EXECUTE.仔細看看,這個語句不對呀!明明Lowestthru76應該是對變量Year的限制,怎么year、cylinder、weight這三個變量都在它前面?再看另兩個條件,一樣“大家有份〞,這還了得,改!將語句改為正確的格式如下:COUNTG1=year(Lowestthru76)cylinder(Lowestthru4)weight(3000thruHighest).EXECUTE.再次運行該語句,可以看到各個記錄G1分別被取值為0~3,代表該車滿足了0~3條要求,最終滿足全部三條要求的應為3條記錄。3.0.5再羅嗦幾句由于SPSS的大多數(shù)用戶已經(jīng)習慣了在圖形對話框界面下操作,許多人不了解程序編輯窗口的用途,編寫本章的目的主要是提醒大家:適當?shù)臅r候,程序編輯窗口可以大大簡化我們的工作。實際上,SPSS針對高級用戶〔需要編程做模擬抽樣之類的事情〕專門開發(fā)了SPSSProductionfacility模塊,確有編程需要〔或狂熱〕的朋友可參考有關書籍。第四章:SPSS結果窗口用法詳解4.1結果窗口元素介紹4.1.1結果瀏覽窗口〔Viewer〕4.1.2結果草稿瀏覽窗口〔DraftViewer〕4.1.3如何美化你的輸出結果--SPSS選項設置4.2駕馭結果瀏覽窗口4.2.1結果窗口的的一般操作4.2.2結果的導出4.2.3如何在WORD等軟件中使用輸出結果4.3文本輸出結果的編輯4.4表格編輯方法詳解4.4.1根本操作4.4.2特色菜單內(nèi)容詳解4.5圖片編輯方法詳解4.5.1根本操作4.5.2特色菜單內(nèi)容詳解§4.1結果窗口元素介紹SPSS實際上提供了兩個結果窗口--結果瀏覽窗口和結果草稿瀏覽窗口。前者最為常用,顯示美觀,但非常消耗系統(tǒng)資源;后者實際上是一個RTF格式文檔,顯示簡單樸素,但節(jié)省資源。我們可以根據(jù)所用計算機的情況選擇使用哪一種窗口。結果草稿瀏覽窗口的內(nèi)容雖然是RTF格式,但由于中、英文兼容性的問題,其中的表格讀入WORD以后會變的面目全非,因此對我們不是很適用。4.1.1結果瀏覽窗口SPSS的輸出結果美觀大方,是該軟件的一大特色,下面是一個典型的結果瀏覽窗口。相信99%的人都用過資源治理器,SPSS的結果瀏覽窗口和Windows資源治理器的結構完全相同,操作也幾乎相同。除了上面的菜單欄、工具欄以外,絕大局部窗口被縱向一分為二!左側是大綱視圖〔Outlineview〕,又稱結構視圖,右側那么顯示詳細的統(tǒng)計結果〔統(tǒng)計表、統(tǒng)計圖和文本結果〕,兩側的元素是完全一一對應的,即選中一側的某元素,在另一側該元素也會被選中。例如左側的Title圖標旁有一個紅色的箭頭,說明該內(nèi)容為結果窗口當前所在位置,相應的,右側的標題Descriptives旁也出現(xiàn)一個紅色三角,說明這就是Title圖標所代表的內(nèi)容。下面解釋一下大綱視圖的各個元素。大綱視圖顧名思義,大綱視圖用于概略顯示結果的結構,用于在宏觀上對結果進行治理,如移動,刪除等。里面摘取和資源治理器類似的層次方式排列元素,每個元素用一個小圖標來表示。常見的圖標有:大綱圖標,代表一段或整個輸出結果,含下級元素,單擊左側的減號就可以將下級元素折疊,折疊后減號變?yōu)榧犹?,圖標那么變?yōu)椤_\行記錄圖標,代表系統(tǒng)操作產(chǎn)生的一段運行記錄。警告圖標,代表輸出結果中的系統(tǒng)警告。注解圖標,代表系統(tǒng)自動產(chǎn)生的注解,默認情況下注解內(nèi)容在輸出結果中是隱藏的。標題圖標,代表輸出標題。頁標題圖標,代表輸出標題,較少出現(xiàn)。表格圖標,代表輸出結果中的統(tǒng)計表〔Pivottable,字面意思為數(shù)據(jù)透視表〕。統(tǒng)計圖圖標,代表統(tǒng)計圖。文本圖標,代表文本輸出結果。交互式統(tǒng)計圖圖標,代表交互式統(tǒng)計圖。統(tǒng)計地圖圖標,代表統(tǒng)計地圖。單擊圖標會選中所代表的一塊或一段輸出結果,雙擊圖標可以讓對應輸出在顯示、隱藏間切換,選中后單擊圖標的名稱那么可以對圖標改名。4.1.2結果草稿瀏覽窗口和它漂亮的兄弟相比,結果草稿瀏覽窗口就樸素的多了,什么把戲也沒有。當然,系統(tǒng)資源也要少占用許多,前面的輸出結果在結果草稿瀏覽窗口中的顯示如下:由于是英文軟件,里面會出現(xiàn)一些奇怪的字符,不用理會。由于該窗口用的非常少,也沒有什么復雜的操作,下面的講解將根本上以結果瀏覽窗口為主。你可以在下面講到的選項設置中設定SPSS默認使用結果瀏覽窗口還是結果草稿瀏覽窗口。如果需要使用不同于選項設置的結果窗口,那么關閉所有的結果窗口,然后用File==>New菜單新建一個所需類型的結果窗口,以后的結果會自動輸出到該窗口中。4.1.3如何美化你的輸出結果--SPSS選項設置俗話說:愛美之心,人皆有之。當人們還在溫飽線上掙扎時,美麗只能是一個遙遠的夢;一旦遠離貧困,沒有人會不想把這個夢變?yōu)楝F(xiàn)實。用著SPSS豪華的界面,我們已經(jīng)小康了,難道你不想把輸出結果弄的更漂亮一些嗎?選擇菜單Edit==>Options,彈出的Options對話框會幫你實現(xiàn)這個美麗的夢想。Options對話框可以設置SPSS的方方面面,讓他處處打上你個人的印記,由于里面內(nèi)容太多,下面分頭表達,并給出我推舉的設置方式〔在800*600辨別率下〕。General用于設置一些常規(guī)性選項,比方記錄日志〔SessionJournal〕的設定,變量列表〔Variablelists〕顯示方式、暫時文件夾〔Temporarydirectory〕的位置、結果窗口類型設置〔Outputtypeatstart-up〕、聲音提示設置等。需要修改的內(nèi)容如下:Variablelists:選中Alphabetica,即在對話框中變量按字母順序排列。Sound:SystemBeep,有新輸出結果時系統(tǒng)發(fā)出“嘀〞聲警告。Outputtypeatstart-up:請根據(jù)所用計算機的性能自行設定。Viewer用于設置結果瀏覽窗口的外觀,這是對結果美觀最重要的設置,左側用于設置各種結果元素是否顯示及對齊方式,右側設置標題、正文的文字格式,修改如下:TitleFont:魏碑〔或黑體〕,14號,加粗,紅色。TextOutputFont:宋體〔該字體可盡量保證中、英文混排時列對齊〕,12號,藍色。DraftViewer既然是草稿,也沒有什么好排的,上面的內(nèi)容和Viewer的一對應就明白了,多數(shù)不用動,只有Font可能小了點,改為10號。OutputLabels用于設置在各處是否顯示標簽,不用做任何更改。Charts設置統(tǒng)計圖的常規(guī)選項,請將Frame:inner復選框去掉。Interactive設置交互式統(tǒng)計圖的選項,一般不用更改。PivotTables設置統(tǒng)計表的格式,這里要做兩處重要的修改:Tablelook:選擇Academic(VGA).tlo格式,它最符合統(tǒng)計學和美學要求。DefaultEditingMode:選擇EditsmallandmediumtablesinViewer。最后三個為Data、Currency和Script,他們分別設置數(shù)據(jù)、貨幣和宏語言的格式,不用做修改即可。怎么樣,改完了嗎?請單擊確定,然后退出SPSS并重新進入,隨便翻開個數(shù)據(jù),做兩個分析瞧瞧,不一樣了吧!以后教程中的所有輸出結果將多數(shù)摘用這種優(yōu)化過的格式。§4.2駕馭結果瀏覽窗口4.2.1結果窗口的一般操作【翻開與保存】如果結果窗口是當前窗口,那么可以直接用快捷工具欄進行操作;否那么,可以用File菜單操作。注意SPSS提供了一項特殊的保存功能--Savewithpassword,即將輸出結果加密保存,存盤時會讓你提供PASSWORD和OEMCODE,后者隨便輸幾個數(shù)字就行了。要小心,這東西可沒有解密

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論