




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第四部分SPSS統(tǒng)計分析第1章SPSS簡介社會科學統(tǒng)計軟件包(StatisticalPackagefortheSocialScience,SPSS)是世界著名的統(tǒng)計分析軟件之一。經(jīng)近40年的發(fā)展,在全球已擁有大量的用戶。目前,SPSS使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)的方法,可方便地用于特定的科研統(tǒng)計。本章概要介紹SPSS的發(fā)展、主要版本、運行方式、啟動與退出以及幫助系統(tǒng)的使用。1.1SPSS的發(fā)展1968年,3位美國斯坦福大學的學生開發(fā)了最早的SPSS系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥合伙成立了SPSS公司。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。SPSS名為社會學統(tǒng)計軟件包,這是為了強調(diào)其社會科學應用的一面(因為社會科學研究中的許多現(xiàn)象都是隨機的,要使用統(tǒng)計學和概率論的定理來進行研究)。1.2SPSS的版本到目前為止,SPSS已成為適合于DOS,Windows,UNIX,Macintosh及OS/2等多種操作系統(tǒng)使用的產(chǎn)品,國內(nèi)常用的是其適用于DOS和Windows的版本。SPSSforDOS通常稱為SPSS/PC+,現(xiàn)已較少使用。本書以運行于Windows9X/NT/2000/XP上的SPSS16.0forWindows標準版為例,并在本書后面的內(nèi)容中簡稱為SPSS。1.3SPSS的運行方式SPSS主要有3種運行方式。1.批處理方式2.完全窗口菜單運行方式3.程序運行方式圖1-1命令(Syntax)窗口1.4SPSS的啟動、主界面和退出1.4.1啟動SPSSSPSS安裝完畢后,系統(tǒng)會自動在Windows菜單中創(chuàng)建快捷方式。1.4.2SPSS的數(shù)據(jù)編輯窗口SPSS主界面主要有兩個,一個是SPSS數(shù)據(jù)編輯窗口,另一個是SPSS輸出窗口。數(shù)據(jù)編輯窗口由標題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標簽頁和狀態(tài)欄組成,如圖1-2所示。圖1-2數(shù)據(jù)編輯窗口該窗口下方有兩個標簽:“DataView”(數(shù)據(jù)視圖)和“VariableView”(變量視圖)。如果使用過電子表格,如MicrosoftExcel等,那么數(shù)據(jù)編輯窗口中“DataView”所對應表格許多功能應該已經(jīng)熟悉。但是它和一般的電子表格處理軟件還有以下區(qū)別。(1)
一個列對應一個變量,即每一列代表一個變量(Variable)或一個被觀測量的特征。例如問卷上的每一項就是一個變量。(2)
行是觀測,即每一行代表一個個體、一個觀測、一個樣品,在SPSS中稱為事件(Case)。例如,問卷上的每一個人就是一個觀測。(3)單元包含值,即每個單元包括一個觀測中的單個變量值。單元(Cell)是觀測和變量的交叉。(4)數(shù)據(jù)文件是一張長方形的二維表。數(shù)據(jù)文件的范圍是由觀測和變量的數(shù)目決定的??梢栽谌我粏卧休斎霐?shù)據(jù)。如果在定義好的數(shù)據(jù)文件邊界以外鍵入數(shù)據(jù),SPSS將數(shù)據(jù)長方形延長到可包括那個單元和文件邊界之間的任何行和列。1.4.3SPSS結果輸出窗口SPSS結果輸出窗口名為Viewer,它是顯示和管理SPSS統(tǒng)計分析結果、報表及圖形的窗口。讀者可以將此窗口中的內(nèi)容以結果文件.spo的形式保存。圖1-3結果輸出窗口結果輸出部分分成左右兩個部分,左邊部分是索引輸出區(qū),用于顯示已有的分析結果標題和內(nèi)容索引;右邊部分是各個分析的具體結果,稱為詳解輸出區(qū)。這和Word的文檔結構視圖十分類似。輸出區(qū)是詳解輸出區(qū)的一個視圖,以簡潔的方式反映出詳解輸出區(qū)中各個內(nèi)容項,便于用戶查找操作結果??梢詫υ斀廨敵鰠^(qū)中的表格進行編輯等操作。1.4.4退出SPSS選擇數(shù)據(jù)編輯窗口的“File”菜單中的“Exit”命令,或單擊標題欄上的“關閉”按鈕退出SPSS。1.5.1Help菜單中的topics命令1.5SPSS的幫助系統(tǒng)在運行SPSS的任何時候,單擊“Help”菜單中的“topics”命令,會彈出幫助主題窗口,如圖1-4所示。在其中選擇相關的命令,即可得到所需的各種幫助。圖1-4幫助主題窗口1.5.2Help菜單中的tutorial命令選擇“Help”菜單中的“tutorial”命令,則彈出瀏覽器形式的幫助文件窗口,如圖1-5所示。在該窗口下面有4個按鈕,分別對應“目錄索引”、“幫助主頁”、“前進”、“后退”功能。圖1-5幫助窗口1.5.3各種對話框中的Help按鈕利用各種對話框中的“Help”按鈕,可以直接獲得SPSS相應命令的幫助,這是最簡單也是最有效的獲取幫助的方式。1.5.4有關統(tǒng)計方法指導SPSS對一些基本模塊中的統(tǒng)計提供了StatisticsCoach幫助,也就是“手把手”式的指導小結SPSS是在當前社會經(jīng)濟分析中應用最廣泛的軟件之一。繼SPSS13.0之后,SPSS公司又推出了SPSS16.0,這是一個功能更加強大、設計更加人性化的版本。SPSS的主界面有兩個,一個是SPSS數(shù)據(jù)編輯窗口,一個是SPSS結果輸出窗口。數(shù)據(jù)編輯窗口主要包括數(shù)據(jù)的編輯和統(tǒng)計分析;結果輸出窗口主要的功能是顯示和管理SPSS的各種統(tǒng)計分析的結果。SPSS的幫助系統(tǒng)可提供各種豐富詳盡的在線幫助。
第2章變量、數(shù)據(jù)文件、系統(tǒng)參數(shù)SPSS對數(shù)據(jù)的處理是以變量為前提的,因此本章首先介紹定義變量、輸入數(shù)據(jù),再介紹保存數(shù)據(jù)、操作數(shù)據(jù)文件,最后介紹SPSS運行環(huán)境和系統(tǒng)參數(shù)的設置。2.1定義變量啟動SPSS后,出現(xiàn)如圖2-1所示數(shù)據(jù)編輯窗口。由于目前還沒有輸入數(shù)據(jù),因此顯示的是一個空文件。圖2-1數(shù)據(jù)編輯窗口輸入數(shù)據(jù)前首先要定義變量。定義變量即要定義變量名、變量類型、變量長度(小數(shù)位數(shù))、變量標簽(或值標簽)和變量的格式。單擊數(shù)據(jù)編輯窗口左下方的“VariableView”標簽或雙擊列的題頭(Var),進入如圖2-2所示的變量定義視圖窗口,在此窗口中即可定義變量。圖2-2變量定義視圖窗口2.1.1變量的定義信息在圖2-2所示的窗口中每一行表示一個變量的定義信息,包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等。1.定義變量名(Name)SPSS默認的變量為Var00001、Var00002等,用戶也可以根據(jù)自己的需要來命名變量。SPSS變量的命名和一般的編程語言一樣,有一定的命名規(guī)則,具體內(nèi)容如下。變量名必須以字母、漢字或字符@開頭,其他字符可以是任何字母、數(shù)字或_、@、#、$等符號。變量最后一個字符不能是句號。變量名總長度不能超過8個字符(即4個漢字)。不能使用空白字符或其他特殊字符(如“!”、“?”等)。變量命名必須惟一,不能有兩個相同的變量名。在SPSS中不區(qū)分大小寫。例如,HXH、hxh或Hxh對SPSS而言,均為同一變量名稱。圖2-3定義變量類型對話框SPSS的保留字(ReservedKeywords)不能作為變量的名稱,如ALL、AND、WITH、OR等。2.定義變量類型(Type)單擊Type相應單元中的按鈕,彈出如圖2-3所示的對話框,在對話框中選擇合適的變量類型并單擊“OK”按鈕,即可定義變量類型。圖2-3定義變量類型對話框SPSS的主要變量類型如下。NumericCommaDotScientificnotationDateDollarCustomcurrencyString3.變量長度(Width)設置變量的長度,當變量為日期型時無效。4.變量小數(shù)點位數(shù)(Decimal)設置變量的小數(shù)點位數(shù),當變量為日期型時無效。5.變量標簽(Label)變量標簽是對變量名的進一步描述,變量只能由不超過8個字符組成,而8個字符經(jīng)常不足以表示變量的含義。而變量標簽可長達120個字符,變量標簽可顯示大小寫,需要時可用變量標簽對變量名的含義加以解釋。6.變量值標簽(Values)值標簽是對變量的每一個可能取值的進一步描述。7.缺失值的定義方式(Missing)SPSS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。單擊Missing相應單元中的按鈕,在彈出的如圖2-5所示的對話框中可改變?nèi)笔е档亩x方式,在SPSS中有兩種定義缺失值的方式。可以定義3個單獨的缺失值。可以定義一個缺失值范圍和一個單獨的缺失值。8.變量的顯示寬度(Columns)輸入變量的顯示寬度,默認為8。9.變量顯示的對齊方式(Align)選擇變量值顯示時的對齊方式:Left(左對齊)、Right(右對齊)、Center(居中對齊)。默認是右對齊。10.變量的測量尺度(Measure)變量按測量精度可以分為定性變量、定序變量、定距變量和定比變量幾種。(1)定性變量。(2)定序變量。(3)定距變量。(4)定比變量。2.1.2變量定義信息的復制如果有多個變量的類型相同,可以先定義一個變量,然后把該變量的定義信息復制給新變量。2.2數(shù)據(jù)的輸入與保存2.2.1錄入數(shù)據(jù)的一般方法定義了所有變量后,單擊“DataView”標簽,即可在出現(xiàn)的數(shù)據(jù)視圖(編輯)窗中輸入數(shù)據(jù)。數(shù)據(jù)錄入時可以逐行錄入,也可以逐列。2.2.2錄入帶有變量值標簽的數(shù)據(jù)在錄入帶有變量值標簽的數(shù)據(jù)時,用戶手工輸入的是實際的變量值,而屏幕上顯示的是與該變量對應的變量值標簽。圖2-6選中“ValueLables”的效果2.2.3SPSS數(shù)據(jù)文件的保存在錄入數(shù)據(jù)時,應及時保存數(shù)據(jù),防止數(shù)據(jù)的丟失,以便再次使用該數(shù)據(jù)。圖2-7保存為另外的數(shù)據(jù)格式文件用戶確定盤符、路徑、文件名以及文件格式后單擊“Save”按鈕,即可保存為指定類型的數(shù)據(jù)文件。SPSS支持的常見的數(shù)據(jù)文件存放格式如下。SPSS(*.sav)SPSS/PC+(*.sys)SPSSPortable(*.por)Tabdelimited(*.dat)Commadelimited(*.csv)FixedASCII(*.dat)Excel2.1(*.xls)1-2-3Rel3.0(*.wk3)SYLK(*.slk)dBASE4(*.dbf)dBASEⅢ(*.dbf)dBASEⅡ(*.dbf)SASv6forWindows(*.sd2)2.3數(shù)據(jù)的編輯2.3.1單元值的修改由于各種原因,已經(jīng)輸入的數(shù)據(jù)有時會需要修改,這就需要進行編輯,可用方向鍵或鼠標將黑框移動到要修改的單元,鍵入新值。圖2-8選擇行號圖2-9查找數(shù)據(jù)對話框2.3.2增加和刪除一個個案(Case)1.增加一個新的個案(即增加一個新的行)2.刪除一個個案2.3.3數(shù)據(jù)的排序在數(shù)據(jù)文件中,可根據(jù)一個或多個排序變量的值重排個案的順序。圖2-10“SortCases”(排序)對話框2.3.4數(shù)據(jù)的行列互換圖2-11“Transpose”對話框2.3.5選取個案子集在數(shù)據(jù)統(tǒng)計中可從所有資料中選擇部分數(shù)據(jù)進行統(tǒng)計分析。圖2-12“SelectCases”對話框系統(tǒng)提供的方式如下。AllcasesIfconditionissatisfiedRandomsampleofcasesBasedontimeorcaserangeUsefiltervariableOutput單選框有三個選項,分別提供如下的輸出方式。FilteroutunselectedcasesCopyselectedcasestoanewdatasetDeleteunselectedcases圖2-13“SelectCases:If”對話框2.3.6數(shù)據(jù)分類匯總用戶還可對數(shù)據(jù)編輯器中的數(shù)據(jù)按指定變量的數(shù)值進行歸類分組匯總。在SPSS中,實現(xiàn)數(shù)據(jù)文件的分類匯總需要3個步驟。首先,需要指定分類變量和匯總變量。然后,計算機根據(jù)分類變量的若干個不同取值將個案數(shù)據(jù)分成若干類,并對每類個案計算匯總變量的描述統(tǒng)計量。最后,將分類匯總計算結果保存到一個文件中。分組匯總提供的函數(shù)形式主要有以下幾種。MeanMedianSumStandarddeviationFirstLast圖2-14“AggregateData”對話框圖2-15“AggregateData:AggregateFunction”對話框MinimumMaximumWeightedWeightedMissingUnweightedUnweightedMissingNumberofcasesPercentageabovePercentagebelowPercentageinsidePercentageoutsideFractionaboveFractionbelowFractioninsideFractionoutside圖2-16結果文件中變量名和標簽2.3.7缺失值的替代對于缺失值,可采取多種手段進行科學替代。這里的缺失值必須是系統(tǒng)或用戶指定的缺失值。圖2-17“ReplaceMissingValues”對話框共有以下幾種替代方式。SeriesmeanMeanofnearbypointsMedianofnearbypointsLinearinterpolationLineartrendatpoint2.3.8數(shù)據(jù)次序確定選擇“Transform”菜單中的“RankCases”命令,彈出“RankCases”對話框,如圖2-18所示,在該對話框中可以改變數(shù)據(jù)排序的次序。圖2-18“RankCases”對話框圖2-19“RankCases:Types”對話框排序類型如下。RankFractionalrankaspercentSavagescoreSumofcaseweightsFractionalrankNtilesProportionestimatesNormalscores2.4變量的操作2.4.1增加和刪除一個變量(Variable)1.增加一個變量增加一個變量,即增加一個新的列。可以有多種操作方法,(1)菜單操作法。(2)選中某列法。(3)VariableView標簽頁法。圖2-20選中某列法圖2-21VariableView標簽頁法2.刪除一個變量刪除一個變量,即刪除一列數(shù)據(jù)。其方法和上面的增加一個變量相對應。例如,要刪除第5個變量列,則可先單擊第5列的列頭,這時整個第5列被選中(呈黑底白字狀),然后按“Delete”鍵或選擇“Edit”菜單的“Clear”命令,或者單擊鼠標右鍵,在其快捷菜單中選擇“Clear”項,該列即被刪除。也可以單擊數(shù)據(jù)編輯窗口左下方的“VariableView”標簽或雙擊列的題頭,顯示變量定義視圖窗口,然后單擊要輸出變量的行頭,這時整個行被選中,然后單擊鼠標右鍵,在其快捷菜單中選擇“Clear”項。2.4.2指定加權變量在實際的統(tǒng)計中,經(jīng)常需要計算數(shù)據(jù)的加權平均數(shù)。例如,希望了解某超市中某天售出商品的平均價格。如果僅以各種商品的單價平均數(shù)作為平均價格是不合理的,還應考慮到各商品的銷售量對平均價格的影響。因此,以商品的銷售量作為權重計算各種商品單價的加權平均數(shù),才是我們需要求的數(shù)據(jù)。在SPSS處理中就需要將商品銷售量作為加權變量。圖2-22“WeightCases”對話框2.4.3根據(jù)已存在的變量建立新變量在數(shù)據(jù)統(tǒng)計中,有時候經(jīng)常需要通過數(shù)據(jù)轉換來提示變量之間的真實關系。這時需要通過對已經(jīng)存在的變量進行處理,從而生成新的變量。選擇“Transform”菜單的“ComputeVariable”項,彈出如圖2-23所示的“ComputeVariable”(計算變量)對話框。在該對話框中的“TargetVariable(目標變量)”框中輸入符合變量命名規(guī)則的變量名,目標變量可以是現(xiàn)存變量或新變量。圖2-23“ComputeVariable”(計算變量)對話框圖2-24條件表達式對話框2.4.4產(chǎn)生計數(shù)變量在統(tǒng)計過程中,往往需要進行一些計數(shù)工作。產(chǎn)生計數(shù)變量就是實現(xiàn)計數(shù)功能,它對所有個案或滿足一定條件的個案,計算若干個變量中有幾個變量的值落在指定的區(qū)間內(nèi),并將計數(shù)結果放入一個新變量中。圖2-25“CountOccurrencesofValueswithinCases”對話框圖2-26“CountValueswithinCases:ValuestoCount”對話框圖2-27指定條件來確定參與計數(shù)的個案圖2-28增加了一個計數(shù)結果列l(wèi)j2.4.5變量的重新賦值在數(shù)據(jù)編輯過程中,用戶可對個案的某個變量的數(shù)值重新賦予新值。這種操作只適用于數(shù)值型變量。在“Transform”菜單中的有“IntoSameVariables”和“IntoDifferentVariables”兩種賦值方法供選擇。其中“IntoSameVariables”是對變量自身重新賦值;“IntoDifferentVariables”是賦值到其變量或新生成的變量。圖2-29“RecodeintoSameVariables”對話框圖2-30“RecodeintoSameVariables:OldandNewValues”對話框在上述兩種賦值情況下,用戶均可通過單擊“If”按鈕指定條件,來確定參與重新賦值的個案。與前面根據(jù)已存在的變量建立新變量方法不同的是:變量的重新賦值Recode不能進行運算,只能根據(jù)指定變量值作數(shù)值轉換,且這種轉換是單一數(shù)值的轉換。圖2-31“RecodeintoDifferentVariables”對話框圖2-32“RecodeintoDifferentVariables:OldandNewValues”對話框2.4.6變量的自動賦值(AutomaticRecode)變量的自動賦值可以將字符型、數(shù)字型數(shù)值轉變成連續(xù)的整數(shù),并將結果保存在一個新的變量中,其中字符型數(shù)據(jù)按照字母的順序排序。圖2-33“AutomaticRecode”對話框圖2-34確定變量圖2-35運行結果2.4.7變量定義信息的查詢在SPSS數(shù)據(jù)編輯窗口中的“VariableView”標簽中可以看到變量的定義信息,在其中還可以進行修改。在SPSS的“Utilities”菜單中還提供了變量信息的查詢功能。圖2-36“Variables”對話框2.4.8變量集的定義和使用在SPSS的統(tǒng)計過程中,有時候收集到的變量會有很多個。在進行各種數(shù)據(jù)處理和統(tǒng)計分析時,所有變量都會顯示在各個處理對話框的變量列表框中供用戶選擇。在眾多變量中選擇幾個變量進行處理以及分析是很麻煩的,尤其是對于某幾個經(jīng)常需要進行操作的變量。SPSS提供了變量集(VariableSet)的概念,可以很好地解決上面所提出的問題。1.變量集的定義所謂變量集是指一些變量的集合。比如我們收集了某班級同學眾多科目的成績,可以把這些科目分為理科、文科、自然科學等,這其實就是變量集的概念。SPSS變量集有兩類:系統(tǒng)變量集和用戶自定義變量集。系統(tǒng)變量集是SPSS系統(tǒng)已經(jīng)定義好的,它包括以下兩個集合。ALLVARIABLES:存放數(shù)據(jù)編輯窗口中所有的變量。NEWVARIABLES:存放數(shù)據(jù)編輯窗口中所有尚未保存的新定義變量。用戶自定義變量集是用戶根據(jù)實際數(shù)據(jù)分析需要定義的,它可以有許多個。一般把需要經(jīng)常處理的、處理過程類似的若干個變量存放在一個用戶自定義變量集中。2.定義用戶變量集要將數(shù)學、物理、化學歸到一個用戶定義變量集中,名稱為理科,具體操作的過程如下。圖2-37“DefineVariableSets”對話框3.用戶變量集的使用如果僅僅定義用戶變量集,而沒有指定SPSS使用該變量集,那么這個定義的用戶變量集是不會自動發(fā)生作用的。也就是說用戶應該告知SPSS系統(tǒng)要使用哪個變量集。SPSS默認使用系統(tǒng)變量集,也就是說,SPSS默認在數(shù)據(jù)處理中,屏幕上列出數(shù)據(jù)文件所有的變量。如指定SPSS使用用戶定義的變量集,那么在分析時,屏幕上就會只列出用戶變量集中的那幾個變量,從而簡化了變量的選擇過程。圖2-38“UseVariableSets”對話框圖2-39列出用戶變量集中變量2.5數(shù)據(jù)文件的合并和分組統(tǒng)計分析的首要任務是將數(shù)據(jù)輸入到計算機中。在數(shù)據(jù)量較大時,經(jīng)常需要將一份大的數(shù)據(jù)文件分成幾個小部分,分別由幾個人輸入,然后將若干個小的數(shù)據(jù)文件合并成一個大的數(shù)據(jù)文件。數(shù)據(jù)文件的合并有兩種方式:縱向合并和橫向合并。2.5.1數(shù)據(jù)文件的縱向合并縱向合并就是將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口當前數(shù)據(jù)的后面,然后將合并后的數(shù)據(jù)重新顯示在數(shù)據(jù)編輯窗口中。通過該方法,可以將兩個或更多個數(shù)據(jù)文件合并在一起。圖2-40數(shù)據(jù)文件縱向合并窗口圖2-41縱向合并2.5.2數(shù)據(jù)文件的橫向合并橫向連接,也就是變量值的合并。利用橫向合并可以將兩個或兩個以上的具有相同個案的數(shù)據(jù)文件連在一起。即將SPSS數(shù)據(jù)文件的內(nèi)容連接到當前數(shù)據(jù)編輯窗口的右邊,然后將合并后的數(shù)據(jù)文件顯示在數(shù)據(jù)編輯窗口中。橫向合并實質(zhì)是將兩個數(shù)據(jù)文件,按照個案對應進行左右對接。實現(xiàn)數(shù)據(jù)文件的橫向連接,必須有一個相同的公共變量,這個變量是兩個數(shù)據(jù)文件橫向?qū)B接的依據(jù)。在合并的兩個數(shù)據(jù)文件中,數(shù)據(jù)含義不同的變量,變量名不應取相同的名稱。圖2-42數(shù)據(jù)文件橫向合并窗口2.5.3數(shù)據(jù)文件的分組(Split)在統(tǒng)計中,經(jīng)常需要先按某個變量進行分組,然后再求各個組的統(tǒng)計分析。例如,想分別了解男生和女生的成績情況。這時就需要按照性別變量,進行數(shù)據(jù)文件的分組(這種分組是系統(tǒng)內(nèi)定義的,在數(shù)據(jù)管理器中并不一定明確體現(xiàn),故亦可稱之為分割)。用戶一旦設置了分組,那么此后的所有分析都將按這種分組進行,除非取消數(shù)據(jù)分組的命令。圖2-43“SplitFile”(分組設置)對話框圖2-44分組統(tǒng)計結果2.6讀入其他格式文件數(shù)據(jù)在前面的數(shù)據(jù)保存中,已經(jīng)講到SPSS數(shù)據(jù)文件可以保存成其他格式的文件,如文本文件、dbf文件等。反過來,SPSS是否可以直接讀取其他格式數(shù)據(jù)文件呢?答案是肯定的。SPSS可以讀取文本文件、數(shù)據(jù)庫文件等內(nèi)容。2.6.1讀取固定格式的文本文件文本文件是計算機各種軟件中最通用的一種格式文件。文本文件沒有保存格式,因此,其文件很小,其中的數(shù)據(jù)均以ASCII碼存儲。各種軟件,包括數(shù)據(jù)庫軟件、表格操作軟件、字處理軟件都可以將自己的格式數(shù)據(jù)轉換成文本文件。因此,如果SPSS能夠方便讀取文本文件,那么就提高了讀取其他軟件數(shù)據(jù)的能力。根據(jù)文本文件中數(shù)據(jù)的排列方式,可將文本文件分成固定格式的文本文件和自由格式的文本文件兩種。固定格式(FixedColumns)的文本文件,要求每個個案數(shù)據(jù)的變量數(shù)目、排列順序、變量取值長度固定不變,一個個案數(shù)據(jù)可以占若干行,數(shù)據(jù)項之間可以有分隔符,也可以沒有。分隔符一般為逗號、空格等。圖2-45在菜單中選擇“ReadTextData”命令圖2-46“文本文件導入向?qū)?”對話框(一)圖2-47“文本文件導入向?qū)?”對話框(一)圖2-48“文本文件導入向?qū)?”對話框(一)圖2-49“文本文件導入向?qū)?”對話框(一)圖2-50“文本文件導入向?qū)?”對話框(一)圖2-51“文本文件導入向?qū)?”對話框2.6.2讀取自由格式的文本文件自由格式的文本文件(FreeField)每個個案的變量數(shù)目、排列順序固定,一個個案數(shù)據(jù)可以占據(jù)若干行,和固定格式文本文件不同的是,自由格式文本文件的數(shù)據(jù)項之間必須有分隔符(分隔符可以是逗號、空格、Tab鍵等),但數(shù)據(jù)項的長度可以變化。圖2-52“文本文件導入向?qū)?”對話框(二)圖2-53“文本文件導入向?qū)?”對話框(二)圖2-54“文本文件導入向?qū)?”對話框(二)圖2-55“文本文件導入向?qū)?”對話框(二)圖2-56“文本文件導入向?qū)?”對話框(二)2.6.3讀取dBASE軟件文件(.dbf)dBASE數(shù)據(jù)庫軟件的文件以.dbf為擴展名保存。該文件除了保存純數(shù)據(jù)信息外,還保存了一些數(shù)據(jù)結構、屬性方面的信息。SPSS提供了與DBASE文件的接口,可以方便地將dBASE文件讀入數(shù)據(jù)編輯窗口。具體的操作過程如下。圖2-57打開dBASE數(shù)據(jù)文件2.6.4讀取Excel軟件文件(.xls)Excel軟件可能是Windows系列操作系統(tǒng)中使用最多的數(shù)據(jù)表格軟件。Excel文件以.xls為擴展名保存。該文件除了保存純數(shù)據(jù)信息外,還保存了另外一些數(shù)據(jù)信息。SPSS提供了與Excel文件的接口,可以方便地將Excel文件讀入數(shù)據(jù)編輯窗口。具體的操作過程如下。圖2-58讀取Excel文件圖2-59“OpeningExcelDataSource”對話框SPSS默認將某個sheet中所有數(shù)據(jù)都讀入到數(shù)據(jù)編輯窗口中。在“Range”框中輸入要讀取數(shù)據(jù)的范圍,也允許指定讀取一部分區(qū)域的數(shù)據(jù),如要讀入前50行數(shù)據(jù),則在該框中輸入A1:F50,表示讀取的區(qū)域是以A1單元為左上角,F(xiàn)50為右下角的矩形區(qū)域。Excel表格中每一行為SPSS的一個個案。單擊“Continue”按鈕,即可完成數(shù)據(jù)導入。2.6.5讀取數(shù)據(jù)庫文件SPSS還提供了讀取Access及FoxPro等數(shù)據(jù)庫文件的功能。圖2-60在菜單中選擇“NewQuery”命令圖2-61“DatabaseWizard”向?qū)υ捒?圖2-62文本文件選擇對話框圖2-63“DatabaseWizard”向?qū)υ捒?圖2-64“DatabaseWizard”向?qū)υ捒?圖2-65關系指定圖2-66“DatabaseWizard”向?qū)υ捒?圖2-67“DatabaseWizard”向?qū)υ捒?圖2-68“DatabaseWizard”向?qū)υ捒?2.7SPSS運行環(huán)境設置2.7.1SPSS狀態(tài)欄的顯示和隱藏數(shù)據(jù)編輯窗口最下面的狀態(tài)欄用來顯示SPSS當前的運行狀態(tài)。當SPSS等待用戶操作時,會顯示“SPSSProcessorisready”的提示信息,如圖2-69所示。圖2-69狀態(tài)欄狀態(tài)欄的顯示或隱藏可以通過“View”菜單下面的“StatusBar”子菜單項來控制,當選中“StatusBar”子菜單項時(前面有選中符號√),SPSS將顯示狀態(tài)欄。2.7.2SPSS網(wǎng)格線的顯示和隱藏數(shù)據(jù)編輯窗口默認的顯示是有網(wǎng)格線的,這樣可以分隔一個個變量和個案,如圖2-70所示。圖2-70網(wǎng)格線2.7.3SPSS菜單的增加和刪除菜單欄中列出了SPSS的命令菜單,每個菜單對應一個相應的功能,SPSS提供了一個菜單編輯器。通過該編輯器,可以增加或刪除SPSS操作界面中的菜單。菜單欄中列出了SPSS的命令菜單,每個菜單對應一個相應的功能,SPSS提供了一個菜單編輯器。通過該編輯器,可以增加或刪除SPSS操作界面中的菜單。圖2-71選擇“View”菜單的“MenuEditor”命令圖2-72“MenuEditor”對話框2.7.4SPSS字體的設置SPSS字體的設置是通過“View”菜單中的“Fonts”命令來設置的,如圖2-73所示。圖2-73選擇“View”菜單的“Font”圖2-74“Font”(字體設置)對話框小結利用SPSS進行統(tǒng)計分析,變量和數(shù)據(jù)是必不可少的。本章主要介紹數(shù)據(jù)的輸入、編輯以及針對變量的各種操作。將數(shù)據(jù)輸入SPSS中有多種方法,用戶可以逐行錄入也可以讀入其他格式文件數(shù)據(jù)。數(shù)據(jù)輸入后通常需要對數(shù)據(jù)進行進一步的處理,如排序、分類匯總或缺失值的替代等。SPSS中的分析都是針對某一特定變量進行的。熟練掌握變量的操作技巧十分有助于提升工作的效率。
第3章統(tǒng)計描述講義SPSS基本統(tǒng)計分析是進行其他統(tǒng)計分析的基礎和前提。通過基本統(tǒng)計方法的學習,可以對要分析數(shù)據(jù)的總體特征有比較準確的把握,從而有助于選擇其他更為深入的統(tǒng)計分析方法。本章主要介紹如何在SPSS中進行平均數(shù)、中位數(shù)、眾數(shù)、方差、百分位、頻數(shù)、峰度、偏度、探索分析、交叉聯(lián)列表分析、多選項分析、基本統(tǒng)計報表制作等的操作。3.1均值(Mean)和均值標準誤差(S.E.mean)3.1.1統(tǒng)計學上的定義和計算公式定義:均值(平均值、平均數(shù))表示的是某變量所有取值的集中趨勢或平均水平。例如,學生某門學科的平均成績、公司員工的平均收入、某班級學生的平均身高等。計算公式如下??傮w平均數(shù):若一組數(shù)據(jù)X1,X2,…,XN,代表一個大小為N的有限總體,則其總體平均數(shù)為樣本平均數(shù):若一組數(shù)據(jù)x1,x2,…,xn,代表一個大小為n的有限樣本,則其樣本平均數(shù)為樣本數(shù)據(jù)來自總體。樣本的統(tǒng)計描述量可以反映總體數(shù)據(jù)的特征,但由于抽樣等原因,使得樣本數(shù)據(jù)不一定能夠完全準確地反映總體,它可能與總體的真實值之間存在一定的差異。進行不同次抽樣,會得到若干個不同的樣本均值,它們與總體均值存在著不同的差異。均值標準誤差(StandardErrorofMean,S.E.mean)就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計量。3.1.2SPSS中實現(xiàn)過程研究問題求某班級學生在一次數(shù)學測驗中的平均成績,數(shù)據(jù)如表3-1所示。數(shù)學成績998879595489795689992389705067788956表3-1 某班級的數(shù)學成績實現(xiàn)步驟圖3-1在菜單中選擇“Frequencies”命令 圖3-2“Frequencies”對話框(一)圖3-3“Frequencies:Statistics”對話框(一)3.1.3結果和討論3.2中位數(shù)(Median)3.2.1統(tǒng)計學上的定義和計算公式定義:把一組數(shù)據(jù)按遞增或遞減的順序排列,處于中間位置上的變量值就是中位數(shù)。它是一種位置代表值,所以不會受到極端數(shù)值的影響,具有較高的穩(wěn)健性。計算公式:一個大小為的數(shù)列,要求其中位數(shù),首先應把該數(shù)列按大小順序排列好,如果為奇數(shù),那么該數(shù)列的中位數(shù)就是位置上的數(shù);如果N為偶數(shù),中位數(shù)則是該數(shù)列中第與第+1位置上兩個數(shù)值的平均數(shù)。3.2.2SPSS中實現(xiàn)過程研究問題求某班級學生身高的中位數(shù),數(shù)據(jù)如表3-2所示。表3-2 某班級學生的身高身高(cm)174168164174176150183162171146189167實現(xiàn)步驟圖3-4“Frequencies:Statistics”對話框(二)3.2.3結果和討論3.3眾數(shù)(Mode)3.3.1統(tǒng)計學上的定義和計算公式定義:眾數(shù)是指一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個變量值。眾數(shù)在描述數(shù)據(jù)集中趨勢方面有一定的意義。例如,制鞋廠可以根據(jù)消費者所需鞋的尺碼的眾數(shù)來安排生產(chǎn)。計算公式:手工計算眾數(shù)比較麻煩,需要統(tǒng)計數(shù)據(jù)的次數(shù)分布。3.3.2SPSS中實現(xiàn)過程研究問題求某醫(yī)院當天出生新生兒的體重的眾數(shù),數(shù)據(jù)如表3-3所示。表3-3 新生兒的體重體重(斤)8767545687564765.574實現(xiàn)步驟圖3-5“Frequencies:Statistics”對話框(三)3.3.3結果和討論3.4全距(Range)3.4.1統(tǒng)計學上的定義和計算公式定義:全距也稱為極差,是數(shù)據(jù)的最大值與最小值之間的絕對差。在相同樣本容量情況下的兩組數(shù)據(jù),全距大的一組數(shù)據(jù)要比全距小的一組數(shù)據(jù)更為分散。計算公式:最大值-最小值。3.4.2SPSS中實現(xiàn)過程研究問題求某班級學生數(shù)學成績的全距,數(shù)據(jù)如表3-4所示。表3-4 某班級的數(shù)學成績數(shù)學成績998879595489795689992389705067788956實現(xiàn)步驟圖3-6“Frequencies:Statistics”對話框(四)3.4.3結果和討論3.5方差(Variance)和標準差(StandardDeviation)3.5.1統(tǒng)計學上的定義和計算公式定義:方差是所有變量值與平均數(shù)偏差平方的平均值,它表示了一組數(shù)據(jù)分布的離散程度的平均值。標準差是方差的平方根,它表示了一組數(shù)據(jù)關于平均數(shù)的平均離散程度。方差和標準差越大,說明變量值之間的差異越大,距離平均數(shù)這個“中心”的離散趨勢越大。3.5.2SPSS中實現(xiàn)過程研究問題求某班級學生數(shù)學成績的方差和標準差,數(shù)據(jù)如表3-1所示。實現(xiàn)步驟圖3-7在菜單中選擇“Descriptives”命令圖3-8“Descriptives”對話框(一)圖3-9“Descriptives:Options”對話框(一)3.5.3結果和討論3.6四分位數(shù)(Quartiles)、十分位數(shù)(Deciles)和百分位數(shù)(Percentiles)3.6.1統(tǒng)計學上的定義定義:四分位數(shù)是將一組個案由小到大(或由大到小)排序后,用3個點將全部數(shù)據(jù)分為四等份,與3個點上相對應的變量稱為四分位數(shù),分別記為Q1(第一四分位數(shù))、Q2(第二四分位數(shù))、Q3(第三四分位數(shù))。其中,Q3到Q1之間的距離的一半又稱為四分位差,記為Q。四分位差越小,說明中間的數(shù)據(jù)越集中;四分位數(shù)越大,則意味著中間部分的數(shù)據(jù)越分散。十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝螅?個點將全部數(shù)據(jù)分為十等份,與9個點位置上相對應的變量稱為十分位數(shù),分別記為D1,D2,…,D9,表示10%的數(shù)據(jù)落在D1下,20%的數(shù)據(jù)落在D2下,…,90%落在D9下。百分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝蠓指顬?00等份,與99個分割點位置上相對應的變量稱為百分位數(shù),分別記為P1,P2,…,P99,表示1%的數(shù)據(jù)落在P1下,2%的數(shù)據(jù)落在P2下,…,99%落在P99下。3.6.2SPSS中實現(xiàn)過程研究問題1求某班級學生數(shù)學成績的四分位數(shù),數(shù)據(jù)如表3-1所示。實現(xiàn)步驟圖3-10“Frequencies:Statistics”對話框(五)研究問題2測量54個某種機械零件的重量(克),求零件重量的D6,數(shù)據(jù)如表3-5所示。表3-5 零件的重量零件重量(克)465159544653375250514944494443465647525250475549475252424540606354405550564649534655444557525049554858425259實現(xiàn)步驟圖3-11“Frequencies:Statistics”對話框(六)圖3-12“Frequencies:Statistics”對話框(七)研究問題3測量出54個某種機械零件的重量(克),求零件重量的P37,數(shù)據(jù)如表3-5所示。實現(xiàn)步驟圖3-12“Frequencies:Statistics”對話框(七)3.6.3結果和討論研究問題1的程序運行結果如下表所示。研究問題2的程序運行結果如下表所示。研究問題3的程序運行結果如下表所示。3.7頻數(shù)(Frequency)3.7.1統(tǒng)計學上的定義和計算公式定義:頻數(shù)就是一個變量在各個變量值上取值的個案數(shù)。如要了解學生某次考試的成績情況,需要計算出學生所有分數(shù)取值,以及每個分數(shù)取值有多少個人,這就需要用到頻數(shù)分析。變量的頻數(shù)分析正是實現(xiàn)上述分析的最好手段,它可以使人們非常清楚地了解變量取值的分布情況。3.7.2SPSS中實現(xiàn)過程研究問題10個學生在某次數(shù)學、語文、化學考試中成績?nèi)绫?-6所示,試求學生在3門課程上的頻數(shù)分布。表3-6 學生成績姓名數(shù)學語文化學hxh99.0098.00100.00yaju88.0089.0045.00yu99.0080.0056.00shizg89.0078.0067.00hah94.0078.0078.00lisa90.0089.0087.00watet79.0087.0089.00jess75.0076.0097.00wish89.0056.0076.00iiakii80.0076.00100.00實現(xiàn)步驟圖3-13“Frequencies”對話框(二)3.7.3結果和討論程序運行結果如下表所示。3.8峰度(Kurtosis)3.8.1統(tǒng)計學上的定義和計算公式定義:峰度是描述某變量所有取值分布形態(tài)陡緩程度的統(tǒng)計量。這個統(tǒng)計量是與正態(tài)分布相比較的量,峰度為0表示其數(shù)據(jù)分布與正態(tài)分布的陡緩程度相同;峰度大于0表示比正態(tài)分布高峰要更加陡峭,為尖頂峰;峰度小于0表示比正態(tài)分布的高峰要平坦,為平頂峰。具體的計算公式為3.8.2SPSS中實現(xiàn)過程研究問題某班級40個學生的年齡分布如表3-7所示,試求學生年齡峰度。表3-7 學生年齡年齡人數(shù)1811972022218222實現(xiàn)步驟圖3-14在Data菜單中選擇“WeightCases”命令3.8.3結果和討論3.9偏度(Skewness)3.9.1統(tǒng)計學上的定義和計算公式定義:偏度也是描述數(shù)據(jù)分布形態(tài)的,它是描述某變量取值分布對稱性的統(tǒng)計量。具體的計算公式為這個統(tǒng)計量是與正態(tài)分布相比較的量,偏度為0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布偏度x相同;偏度大于0表示正偏差數(shù)值較大,為正偏或右偏,即有一條長尾巴拖在右邊;偏度小于0表示負偏差數(shù)值大,為負偏或左偏,有一條長尾拖在左邊。而偏度的絕對值數(shù)值越大表示分布形態(tài)的偏斜程度越大。3.9.2SPSS中實現(xiàn)過程研究問題某班級41個學生的身高分布如表3-8所示,試求學生身高分布偏度。表3-8 學生身高身高(cm)人數(shù)1651168717022173817521801實現(xiàn)步驟圖3-17“Frequencies:Statistics”對話框(九)3.9.3結果和討論3.10標準化Z分數(shù)及其線性轉換3.10.1統(tǒng)計學上的定義和計算公式3.10.2SPSS中實現(xiàn)過程研究問題1求某班級學生數(shù)學成績的Z分數(shù),數(shù)據(jù)如表3-1所示。實現(xiàn)步驟圖3-18“Descriptives”對話框(二)圖3-19“Descriptives:Options”對話框(二)圖3-20數(shù)據(jù)編輯窗口研究問題2從圖3-20中可以看到學生數(shù)學成績的Z分數(shù)有正有負,而且小數(shù)點位數(shù)較多,因此可以把它線性轉換為T分數(shù)。實現(xiàn)步驟圖3-21在菜單中選擇“ComputeVariable”命令圖3-22“ComputeVariable”對話框圖3-23“ComputeVariable:Type”對話框圖3-24數(shù)據(jù)編輯窗口3.10.3結果和討論從Z分數(shù)(圖3-20)和T分數(shù)(圖3-24)的結果中可以看出此班級學生數(shù)學成績的T分數(shù)比之前的Z分數(shù)簡潔多了,比較起來一目了然。3.11探索分析3.11.1統(tǒng)計學上的定義和計算公式定義:調(diào)用此過程可對變量進行更為深入詳盡的描述性統(tǒng)計分析,故稱之為探索分析。它在一般描述性統(tǒng)計指標的基礎上,增加有關數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細致與全面,有助于用戶思考對數(shù)據(jù)進行進一步分析的方案。1.探索分析的內(nèi)容包括下面幾個方面檢查數(shù)據(jù)是否有錯誤:過大或過小的數(shù)據(jù)均有可能是奇異值、影響點或錯誤數(shù)據(jù)。要找出這樣的數(shù)據(jù),并分析原因,然后決定是否從分析中刪除這些數(shù)據(jù)。因為奇異值和影響點往往對分析的影響較大,不能真實反映數(shù)據(jù)的總體特征。對數(shù)據(jù)規(guī)律的初步觀察:通過初步觀察獲得數(shù)據(jù)的一些內(nèi)部規(guī)律,例如,兩個變量間是否線性相關。2.探索分析的考察方法探索分析一般通過數(shù)據(jù)文件在分組與不分組的情況下,獲得常用統(tǒng)計量和圖形。一般以圖形方式輸出,直觀幫助用戶確定奇異值、影響點、進行假設檢驗,以及確定用戶要使用的某種統(tǒng)計方式是否合適。3.正態(tài)分布檢驗常用的正態(tài)分布檢驗是Q-Q圖。本例中進行了正態(tài)分布檢驗。4.方差齊次性檢驗對數(shù)據(jù)分析不僅需要進行正態(tài)分布檢驗,有時候還需要比較各個分組的方差是否相同,這就要進行方差齊次性檢驗。例如,在進行獨立右邊的T檢驗之前,就需要事先確定兩個數(shù)據(jù)的方差是否相同。如果通過分析發(fā)現(xiàn)各個方差不同,還需要對數(shù)據(jù)進行方差分析,那么就需要對數(shù)據(jù)進行轉換使得方差盡可能相同。在探索分析中可以使用Levene檢驗。Levene檢驗對數(shù)據(jù)進行方差齊次性檢驗時,不強求數(shù)據(jù)必須服從正態(tài)分布,它先計算出各個觀測值減去組內(nèi)均值的差,然后再通過這些差值的絕對值進行單因素方差分析。如果得到顯著性水平小于0.05,那么就可以拒絕方差相同的假設。3.11.2SPSS中實現(xiàn)過程研究問題20名10歲少兒的身高(cm)資料,數(shù)據(jù)如表3-9所示,試作探索性分析。表3-9 身高數(shù)據(jù)Id男孩身高(cm)女孩身高(cm)1123.00126.002125.00121.003127.00120.004130.00125.005134.10139.706135.80133.007140.40140.308136.00124.009128.20125.4010137.40137.5011135.50120.9012129.00138.8013132.20138.6014140.90141.4015129.30137.5016130.00137.0017121.40133.4018131.50132.7019132.60130.1020129.20136.70實現(xiàn)步驟圖3-25在菜單中選擇“Explore”命令圖3-26“Explore”對話框圖3-27“Explore:Statistics”對話框圖3-28“Explore:Plots”對話框圖3-29“Explore:Options”對話框3.11.3結果和討論在結果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù)。(1)首先輸出如下個案觀察量摘要表,如下表所示。(2)然后輸出如下表格。(3)接著輸出如下4個不同權重下作中心趨勢的粗略最大似然確定數(shù),(4)再接著輸出百分位數(shù),也是分組后的百分位數(shù),如下表所示。(5)分別輸出兩個組中的最大5個數(shù)和最小5個數(shù),并且包括這些值對應的ID,如下表所示。(6)輸出方差齊次性檢驗結果。(7)系統(tǒng)還進行數(shù)據(jù)的莖葉情形描述。圖3-30男孩身高的莖葉圖圖3-31女孩身高的莖葉圖(8)系統(tǒng)輸出箱圖,如圖3-32所示。圖3-32箱圖(9)輸出Spreadvs.Level圖,如圖3-33所示。圖3-33Spreadvs.Level圖(10)輸出身高正態(tài)概率圖(NormalQ-QPlotof身高),如圖3-34所示。圖3-34男孩身高變量的正態(tài)概率圖圖3-35女孩身高變量的正態(tài)概率圖(11)輸出離散正態(tài)概率圖(DetrendedNormalQ-QPlotof身高),男孩身高如圖3-36所示,女孩身高如圖3-37所示。橫坐標是身高,縱坐標是和正態(tài)分布的偏離。圖3-36男孩身高離散正態(tài)概率圖圖3-37女孩身高離散正態(tài)概率圖3.12交叉列聯(lián)表分析3.12.1統(tǒng)計學上的定義和計算公式定義:前面的分析都是對單個變量的數(shù)據(jù)分布情況進行分析。但在實際分析中,還需要掌握多個變量在不同取值情況下的數(shù)據(jù)分布情況,從而進一步深入分析變量之間的相互影響和關系,這種分析就稱為交叉列聯(lián)表分析。交叉列聯(lián)表分析除了列出交叉分組下的頻數(shù)分布外,還需要分析兩個變量之間是否具有獨立性或一定的相關性。要獲得變量之間的相關性,僅僅靠頻數(shù)分布的數(shù)據(jù)是不夠的,還需要借助一些變量間相關程度的統(tǒng)計量和一些非參數(shù)檢驗的方法。常用的衡量變量間相關程度的統(tǒng)計量是簡單相關系數(shù)(參見本書有關章節(jié)),但在交叉列聯(lián)表分析中,由于行列變量往往不是連續(xù)變量,不符合計算簡單相關系數(shù)的前提條件。因此需要根據(jù)變量的性質(zhì),選擇其他的相關系數(shù),如Kendall等級相關系數(shù)、Eta值等。SPSS提供了多種適用于不同相關系數(shù)的相關關系,這些檢驗的零假設是:行和列變量之間彼此獨立,不存在顯著的相關關系。SPSS將自動給出檢驗的相伴概率,如果相伴概率小于顯著性水平0.05,那么應拒絕零假設,認為行列變量之間彼此相關。計算公式如下。(1)卡方統(tǒng)計量檢驗是常用的檢驗行列變量之間是否相關的方法。交叉列聯(lián)表的卡方檢驗零假設是:行列變量之間獨立,計算公式為卡方統(tǒng)計量服從(行數(shù)?1)×(列數(shù)?1)個自由度的卡方統(tǒng)計,SPSS在自動計算卡方統(tǒng)計量后,還會給出相應的相關概率。(2)Contingencycoefficient:列聯(lián)系數(shù)。用于名義變量之間的相關系數(shù)計算。計算公式由卡方統(tǒng)計量修改而得,公式為其中,N為樣本系數(shù)(3)PhiandCramer‘sV:ψ系數(shù)。用于名義變量之間的相關系數(shù)計算。計算公式由卡方統(tǒng)計量修改而得,公式為數(shù)值界于0~1之間,其中K為行數(shù)和列數(shù)較小的實際數(shù)。3.12.2SPSS中實現(xiàn)過程研究問題用兩個班級學生進行兩個感冒疫苗的試驗,兩個班級學生患感冒結果如表3-10所示,問兩個班級學生的患病比例有無差別。表3-10 兩班級學生的患病情況班級患病不患病153202404實現(xiàn)步驟圖3-38“WeightCases”對話框圖3-39在菜單中選擇“Crosstabs”命令圖3-40“Crosstabs”對話框圖3-41“Crosstabs:Statistics”對話框圖3-42“Crosstabs:CellDisplay”對話框圖3-43“Crosstabs:TableFormat”對話框3.12.3結果和討論(1)先輸出如下個案處理摘要表。(2)下面所示表格是“班級”變量和“患病”變量的交叉列聯(lián)表結果表格。(3)交叉分組下頻數(shù)分布圖形,如圖3-44所示。(4)輸出卡方統(tǒng)計結果表。(5)輸出相對危險度表格如下所示。3.13多選項分析3.13.1統(tǒng)計學上的定義和計算公式定義:多選項分析是對多選項問題的分析方法。所謂多選項問題,就是一個問題的答案都是順序變量或名義變量,并且允許選擇的答案可以有多種組合。對于多選項問題,分解(編碼方案)的方法有兩種。1.多選項二分法(MultipleDichotomiesMethod)這種方法將每個可能的答案設置為一個SPSS變量,變量的取值有兩個,分別表示選中或沒選中。這種方法的缺點是需要的變量數(shù)比較多。比如一道題目有6個選項,則一道多選題目就需要用6個變量來表示。好處是比較簡單。2.多選項分類法(MultipleCategoryMethod)多選項分類法首先估計多選項問題可能出現(xiàn)的答案個數(shù)。比如一個多選題,如果最多有3個答案,那么就設置3個SPSS變量,分別用來存放3個可能的答案。如果某個案的答案只有兩個,那么第3個SPSS變量取值為缺失值。采用多選項分類法,進行普通的頻數(shù)分析或交叉列聯(lián)表分析有時候不能達到我們的要求。比如,我們要了解某選項的選中次數(shù),就需要將3個變量中該選項的次數(shù)都累加起來,而不僅僅是一個變量中該選項的累加。針對這種情況,SPSS提供了多選項分析方法,專門針對多選項問題。SPSS在處理的過程中會自動地將3個變量中相同答案的頻率累加起來。3.13.2SPSS中實現(xiàn)過程研究問題1某商場對6種品牌的電視機進行消費者滿意度調(diào)查,隨機調(diào)查了20位消費者,讓他們選出最滿意的3個電視機品牌,收集到相應的數(shù)據(jù),如表3-11所示。試用多選項二分法利用SPSS對該問題進行分析,包括頻數(shù)分析和交叉列聯(lián)表分析。表3-11 20名消費者調(diào)查情況ID康佳長虹西湖TCL東芝創(chuàng)維性別110101012101100030001110410110005100101060011101701110018100011190011100100111000111110000121010011130111001141011000150011010161110000171110000180110011190111001201101001實現(xiàn)步驟圖3-45在菜單中選擇“DefineVariableSets”命令圖3-46“DefineMultipleResponseSets”對話框(一)圖3-47在菜單中選擇“Frequencies”命令圖3-48“MultipleResponseFrequencies”對話框(一)圖3-49“MultipleResponseCrosstabs”對話框(一)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度醫(yī)療健康股權分配與產(chǎn)業(yè)布局協(xié)議
- 二零二五年度酒店員工勞動合同與員工培訓及職業(yè)素養(yǎng)提升合同
- 2025年度金融控股集團間戰(zhàn)略資金借款合同
- 二零二五年度高空作業(yè)安全協(xié)議責任書(高空設備檢修安全協(xié)議)
- 二零二五年度鮮魚養(yǎng)殖與品牌營銷合作合同
- 二零二五年度電子商務平臺技術支持合同范本
- 二零二五年度汽車租賃代駕保險保障合同
- 2025年度餐廳門面租賃與地方旅游發(fā)展合作合同
- 安徽省2025年度非全日制用工勞動合同書解除與終止協(xié)議
- 數(shù)據(jù)安全保障與服務合作合同
- 部編版小學道德與法治四年級下冊課堂同步練習試題及答案(全冊)
- 2024煤礦安全規(guī)程解讀
- 德州環(huán)鋰新能源科技有限公司2萬噸年廢舊鋰電池回收項目環(huán)境影響報告書
- 2025年江蘇省中職《英語》學業(yè)水平考試核心考點試題庫500題(重點)
- 延期實習申請書
- 2025年江蘇信息職業(yè)技術學院高職單招職業(yè)適應性測試近5年??及鎱⒖碱}庫含答案解析
- 易制毒化學品理論考試試題及答案
- 2024年煙臺汽車工程職業(yè)學院高職單招職業(yè)適應性測試歷年參考題庫含答案解析
- 2024年江西旅游商貿(mào)職業(yè)學院高職單招語文歷年參考題庫含答案解析
- 2025年春新人教PEP版英語三年級下冊課件 Unit 1 Part C 第8課時 Reading time
- IIT臨床醫(yī)學項目管理
評論
0/150
提交評論