SPSS數(shù)據(jù)預(yù)處理操作_第1頁
SPSS數(shù)據(jù)預(yù)處理操作_第2頁
SPSS數(shù)據(jù)預(yù)處理操作_第3頁
SPSS數(shù)據(jù)預(yù)處理操作_第4頁
SPSS數(shù)據(jù)預(yù)處理操作_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第一講:SPSS數(shù)據(jù)預(yù)處理操作教學(xué)目的:能應(yīng)用SPSS軟件進行:數(shù)據(jù)文件的建立、數(shù)據(jù)錄入與修改、變量計算及轉(zhuǎn)換教學(xué)內(nèi)容:1)SPSS概述2) SPSS數(shù)據(jù)文件的建立3) SPSS數(shù)據(jù)整理與轉(zhuǎn)換教學(xué)重點:SPSS數(shù)據(jù)文件的建立教學(xué)難點:SPSS數(shù)據(jù)轉(zhuǎn)換教學(xué)時間:1學(xué)時SPSS概述SPSS簡介SPSS是英文StatisticalPackagefortheSocialScience(社會科學(xué)統(tǒng)計軟件包)的縮寫。SPSS名為社會科學(xué)統(tǒng)計軟件包,這是為了強調(diào)其在社會科學(xué)應(yīng)用的一面(因為社會科學(xué)研究中的許多現(xiàn)象都是隨機的,要使用統(tǒng)計學(xué)來進行研究),而實際上廣泛應(yīng)用于經(jīng)濟學(xué)、社會學(xué)、生物學(xué)、教育學(xué)、心理學(xué)、醫(yī)學(xué)以及體育、工業(yè)、農(nóng)業(yè)、林業(yè)、商業(yè)和金融等各個領(lǐng)域。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權(quán)估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。SPSS的運行環(huán)境硬件環(huán)境:能運行Windows95/NT/2000或以上版本的微機。軟件環(huán)境:SPSS能在中英文Windows9X、WindowsNT4.0、Windows2000及更高版本的Windows操作系統(tǒng)上運行。SPSS的進入和退出進入Windows后,逐一選取開始程序SPSSforWindows—SPSS11.0forWindows,單擊SPSS11.0for

Windows后,即可進入SPSS。首先是一個對話框如圖1.1,顯示最近打開的數(shù)據(jù)文件、結(jié)果文件和程序命令文件??蛇x取你要打開的文件,按OK按鈕打開。如不喜歡這個對話框,可選取對話框下方的Don’tshowthisdialoginthefuture選項則以后不會再顯示。要退出SPSS,在任一SPSS窗口下逐一選取File——Exit,或在SPSSDataEditor窗口單擊右上角關(guān)閉按鈕。若生成了新文件或?qū)σ郧拔募M行了修改,退出前會提醒你對其進行保存。5P5SforWindows間/刨國I2£1EMWhatwouldyouliketodo?RunthetutorialRunanewistingqu巳呼OpenanextstingdatasourceMoreFiles.CrestsnewqueryusingDatabaseWizardD:\wbsMeachingKnewbook\sp$sdata\l105P5SforWindows間/刨國I2£1EMWhatwouldyouliketodo?RunthetutorialRunanewistingqu巳呼OpenanextstingdatasourceMoreFiles.CrestsnewqueryusingDatabaseWizardD:\wbsMeachingKnewbook\sp$sdata\l10l.^av—CAProgramFil部舊PSS3MLsurvivalsCAProgramFiles\SP5S\Breas(cancersurvival.$av―C:\ProgramFiles\SPSSWi^iety2.savD:\wbsMsachingKnewbook\spss 1.sav\3\Openanothertypeoffile材口僧Files.DAcdromXMyDocumerits^hu\0utputl.spo廠Don'tshowthisdialoginthefuture1.4SPSS窗口及其功能OKCancelSPSS有數(shù)據(jù)編輯窗口SPSSDataEditor、結(jié)果窗口SPSSViewer和語句窗口Syntax。這里只介紹數(shù)據(jù)編輯窗口和結(jié)果窗口。1.4.1數(shù)據(jù)編輯窗口圖1.1SPSS進入對話框啟動SPSS后,首先進入數(shù)據(jù)編輯窗口SPSSDataEditor,如圖1.2的DataView窗口,可在此窗口下錄入數(shù)據(jù)、修改數(shù)據(jù)等。

點擊下方VariableView按鈕可進入變量定義窗口,如圖1.3。在此窗口下可定義、修改變量或察看變量的設(shè)置情況。在下圖中可看到變量的名字(Name)、寬度(Width)、類型(Type)、小數(shù)位數(shù)(Decimals).標(biāo)簽(Label)等。SPSS的幾個窗口菜單大致相同其中的命令也基本相同。菜單下的工具按鈕均為常用的命令。將鼠標(biāo)移至按鈕附近,則彈出該按鈕的解釋,以后就不再說明。下面將簡介,各命令的具體作用請參考實驗指導(dǎo)教材。?File菜單中常用的命令為New(創(chuàng)建新文件)、Open(打開已有文件)、Save(保存)、SaveAs(另存為)、Close(關(guān)閉窗口,SPSSDataEditor窗口下無此命令,該窗口關(guān)閉則退出SPSS)、RecentlyusedData(最近打開的數(shù)據(jù))、RecentlyusedFiles(最近打開的文件)、Exit(退出)等。I回110.1-SPSSDataEditorJalx|FileEdit'JiewDataTransFormAnalyzeGraphsUtilitiesWindowHelp芬耐昌嘎::唯irfri昌陲|匿| |?|NameTypeWidthDecimals La匕三1groupNumeric 8j0 ll2diseaseNumeric 80 1 3freqNumeric 8Q 11 9|]J DataView入VariableView/ I H

圖1.3VariableView窗口Edit菜單下的常用命令有Undo(撤銷上次操作)、Redo(重復(fù)上次操作)、Cut(剪切)、Copy(復(fù)制)、Paste(粘貼)、Clear(清除)、Find(查找)、Options(選項)、Options(可對SPSS的一些設(shè)置進行調(diào)整)等。View菜單中的命令可對窗口的設(shè)置進行調(diào)整,有StatusBar,ToolBars,F(xiàn)onts,Gridlines,ValueLabelsoData菜單中是數(shù)據(jù)進行編輯整理的命令,包括DefineDates,InsertVariable,InsertCase,GotoCase,SortCases,Transpose,MergeFiles,Aggregate等Transform中命令有:Compute;RandomNumberSeedCount;Recode;CategorizeVariable;等Utilities菜單中命令有:Variables;FileInfo;DefineSets;UseSets;RunScript;MenuEditor;Analyze;Graph等菜單下的工具按鈕均為常用的命令。將鼠標(biāo)移至按鈕附近,則彈出該按鈕的解釋,在此不再一一說明。1.4.2結(jié)果窗口該窗口中顯示SPSS處理的輸出信息。如處理成功,則顯示處理結(jié)果;如處理失敗,則顯示錯誤信息。結(jié)果窗口可分為左右兩個窗口。左窗口為大綱窗口,其內(nèi)容即結(jié)果的目錄;右窗口為內(nèi)容窗口,顯示具體結(jié)果。如點擊大綱窗口的項目,則內(nèi)容窗口會顯示相應(yīng)內(nèi)容,與資源管理器操作類似,如圖1.4。SPSS結(jié)果一般由以下幾個部分組成:題頭(Heading,即處理的名稱)、標(biāo)題(Title)、記錄(Notes,包括數(shù)據(jù)文件名、缺失值處理、操作所用時間等,默認(rèn)選項為隱藏,只有雙擊大綱窗口中該項目才顯示出來)、結(jié)果具體內(nèi)容(文本、圖形等)。單擊題頭(對準(zhǔn)題頭左邊黃色的盒狀圖標(biāo)),則可選中上述的整個處理的結(jié)果;雙擊題頭時,可使整個結(jié)果折疊或打開。單擊題頭前的“+”或“一”符號,也可達到同樣效果。雙擊大綱窗口中某個項目,則可使相應(yīng)內(nèi)容隱藏或顯示,同時大綱窗口中該項目名稱前圖標(biāo)由一本打開的書變?yōu)楹仙系臅蛳喾?。如要改變結(jié)果中表格或圖形的位置,可在大綱窗口或結(jié)果窗口單擊該項目,將它拖到指定位置即可。在此窗口中還可對結(jié)果進行編輯如選擇刪除復(fù)制等。該窗口菜單同數(shù)據(jù)編輯窗口類似,新增加項目如圖所示:File;Edit;View等群Viewer國Frequencies國Title屑Nates畝Statistics國Frequencies國Title屑Nates畝Statistics'吼的RegionAHeadingFrequencyPercentCumulativePercentEast12030.e30.BCentralFrequencyPercentCumulativePercentEast12030.e30.BCentral10141.372.1West10927.9100,0Totai390100.011圖1-4結(jié)果窗IIViewerSPSS數(shù)據(jù)文件的建立如上一章所述,建立SPSS數(shù)據(jù)文件有兩種方法:一是在SPSS中直接輸入,二是從其他數(shù)據(jù)文件轉(zhuǎn)入。重點介紹第一種方法,它類似于在FOXPRO建立數(shù)據(jù)庫。首先,在SPSSVariableView窗口中建立數(shù)據(jù)文件結(jié)構(gòu),如定義變量類型、寬度、標(biāo)簽等;然后在SPSSDataView窗口輸入數(shù)據(jù),并保存為“.sav”格式的SPSS數(shù)據(jù)文件。通常情況下,調(diào)查問卷的數(shù)據(jù)文件建立與錄入都是采用第一種方法。在問卷數(shù)據(jù)錄入前,還必須對問卷選項進行編碼。2.1問卷設(shè)計及數(shù)據(jù)編碼2.1.1問卷一份調(diào)查問卷的結(jié)果通常表現(xiàn)為文字型和數(shù)字型兩大類,其中文字型包括二項選擇問題、多項選擇問題、排序問題、開放式問題、連線問題等調(diào)查結(jié)果,而數(shù)字型包括百分比、絕對數(shù)等。對于數(shù)字型,可直接錄入數(shù)據(jù);而文字型則需要進行事前或事后編碼,且不同類型的調(diào)查結(jié)果有不同的編碼表現(xiàn)。此外,無論是數(shù)字型還是文字型,都有可能碰到調(diào)查數(shù)據(jù)缺省或不應(yīng)該有的情況。這同樣需要事先編碼。下面將以為了解大學(xué)生購書情況進行調(diào)查而獲得的一份問卷為例,介紹幾種常見問卷數(shù)據(jù)編碼。2.1.2數(shù)據(jù)編碼1、 單項選擇題的編碼由于單項選擇題的答案是唯一的,所以對各答案依次編碼為1、2、3???.。如問卷中的第1題有四個答案,可依次編碼“1”代表答案“300元以下”,“2”代表答案“300—500元”,“3”代表答案“500—700元”,“4”代表答案“700元以上”。于是,被訪問者選擇的任何答案都可以用1,或2,或3,或4來表示。2、 多項選擇題的編碼問卷中的第5題是多項選擇題,共有6個答案項。編碼時,可將6個答案看作6個變量,用“1”表示選擇了該項答案,用“0”表示沒有選擇該項答案。若第5題答案順序是從左到右、一行一行的排列,則012號問卷結(jié)果的編碼是“001110”。此外,該題的第6個答案項沒有唯一的表現(xiàn),應(yīng)該視為開放性問題的編碼(詳細解釋見后面)。3、 排序題的編碼對于排序題的編碼,其處理方法是:將每個序位當(dāng)作一個變量,而需要排序的那些選項作為每個變量的取值。如問卷中第3題有六個選項要排序,將“購書時考慮的第一因素”作為第一個變量,記為“Q301”;其取值可為“內(nèi)容”、“價格”、“包裝”“實用性”、“知名作家的作品”、“熱門暢銷書”中的任何一個,可分別編碼為“1”、“2”、“3”、“4”、“5”、“6”。同理,可將“購書時考慮的第二因素”、“購書時考慮的第三因素”等依次作為第二、第三變量等,記為“Q302”、“Q303”等;而每個變量的取值都與Q301相同,同樣也編碼為1、2、3、4、5、6。于是,012問卷第3題排序結(jié)果可轉(zhuǎn)化為6個變量的取值依次為:2,4,1,5,6,3。4、 開放式問題的編碼對于開放式問題,如第5題的“其他”選項,第7、8、9題,有的答案是數(shù)字型,可直接錄入,但有的答案則需要歸類編碼。其中第5題的“其他”選項和第7題的第一個空,由于事先不知道有多少類答案,需事后抽查部分調(diào)查問卷結(jié)果統(tǒng)計后才能初步確定與編碼。這就是“事后編碼”,它類似于二項選擇問題的編碼。至于第9題的“性別”、“專業(yè)”、“年級”等問題的所有可能答案,在事先都容易確定,可以直接編碼錄入數(shù)據(jù)。這就是“事前編碼”,如“性別”有兩個選項一一男或女,可用“1”表示“男”,“0”表示“女”,也類似于二項選擇問題的編碼。

問卷編號:012您的月收入大概有多少?■300元以下 口300—500元□500—700元 □700元以上您購書的主要目的是:■學(xué)習(xí)、考試需要 口了解時尚、熱點□休閑娛樂 口個人愛好及收藏您購書時主要考慮的因素依次是(請在選項前橫線上標(biāo)出序號)3內(nèi)容 1價格6包裝2實用性4 知名作家的作品5 熱門暢銷書您較能接受的書的價格為:■20元以下 口□50元以上 口您購書的地點一般是:(可多選)□新華書店 口■學(xué)校附近書攤 ■■商家在校園內(nèi)的圖書展銷 口您對商家來校園內(nèi)進行圖書展銷的看法是:□既方便又實惠,很好■無所謂,視其內(nèi)容、價格而定□沒興趣,寧愿到正規(guī)書店購買您最近一次購書的時間是兩個月前20—50元需要,則無所謂校內(nèi)書店菜園壩書刊市場其他跳蚤市場;花費為5.60元;8.您平均每個月的購書支出占月收入的比例為2% ;9.您的性別女,專業(yè)經(jīng)濟學(xué),年級大二,電話62650029。5、 缺失值的編碼問卷中,若遇到被調(diào)查者不回答的一些選項,則應(yīng)該當(dāng)作缺失值。缺失值又稱為用戶缺失值(UserMissingValue)。如第8題“您平均每個月的購書支出占月收入的比例”有缺失值,可編碼為99%。又如,第7題“花費”有缺失值,可編碼為9999.99。如果可以選擇的項目有9項,但被調(diào)查者正好選擇了第9個選項,則以“0”表示缺失值。當(dāng)然,缺失值也可用研究者自己能夠識別的其他數(shù)字來表示,如“0”或“9”為用戶缺失值。用戶缺失值與系統(tǒng)缺失值(SystemMissing)的含義不同。系統(tǒng)缺失值主要是指計算機默認(rèn)的缺失方式,如果在輸入數(shù)據(jù)時空缺了某些數(shù)據(jù)或輸入了非法的字符,計算機就把其界定為缺失值,這時的數(shù)據(jù)標(biāo)記為“?”,而用戶界定的缺失值則不會在數(shù)據(jù)顯示時出現(xiàn)“”'。6、 “不適用情況”的編碼當(dāng)碰到被調(diào)查者不適用的選項時,被調(diào)查者不需要對這些題進行回答,這種情況下,研究者可以用“8”、“98”等值來賦值表示“不適用”。若答案正好是8,可以以0替補。2.2在SPSS數(shù)據(jù)窗口直接輸入數(shù)據(jù)進入SPSS系統(tǒng)時,系統(tǒng)就已經(jīng)生成了一個空數(shù)據(jù)文件,即空白的數(shù)據(jù)管理界面(見圖1.2)。在輸入

數(shù)據(jù)之前,必須先在VariableView窗口下定義變量。通常的做法是:把問卷中的問題定義成變量,把答案項編碼定義成取值,并定義變量的類型、數(shù)據(jù)項寬度、標(biāo)簽、缺失值(或叫缺省值)等。然后,在)ataView窗口下輸入數(shù)據(jù),并存盤為“*.sav”文件就行了。2.2.1定義變量在VariableView窗口下,從列頂端可看到10種功能選項,分別是:Name,Type,Width,Decimals,Label,Values,Missing,Columns,Align和Measure等變量屬性。見圖2.1。?Name,即變量名。SPSS變量命名原則如下:1) SPSS變量的變量名由不多于8個字符組成;2) 首字符是字母,其后可為字母或數(shù)字,或除“?”,“!”和“*”以外的字符。但應(yīng)該注意不能以下劃線“_”和圓點“”'作為變量名的最后一個字符;3) 變量名不能與SPSS保留字相同。SPSS的保留字有all,and,by,eq,ge,gt,le,lt,ne,not,or,to,with,crosstabls,thru等。4) SPSS中雖不區(qū)別大小寫字符,但程序中的命令和關(guān)鍵詞要用大寫字母,表示系統(tǒng)內(nèi)定;變量名等宜用小寫字母,表示可人為指定。5) 可以用中文做變量名,但最好不用,因為涉及一個兼容性問題。有8種變量類型可供選擇,包括Numeric(數(shù)值型變量),Comma(帶逗號的數(shù)值型變量),Dot(帶圓點的數(shù)值型變量),Scientificnotation(科學(xué)計數(shù)法),Date(日期型變量),Dollar(貨幣型變量),Customcurrency(自定義型變量),String(字符型變量)等。其中,常用的有三種Numeric,String和Date;系統(tǒng)默認(rèn)的變量類型為標(biāo)準(zhǔn)數(shù)值型變量(Numeric)o實踐中,應(yīng)盡量采用數(shù)值型變量,以方便以后的統(tǒng)計分析。Width:變量的長度。系統(tǒng)默認(rèn)長度為8。Decimals:小數(shù)位數(shù)。若為數(shù)值型變量,必須指定小數(shù)位數(shù)。系統(tǒng)默認(rèn)小數(shù)位數(shù)為2。Label:變量標(biāo)簽,是對變量的進一步說明。變量較多時,需采用變量標(biāo)簽對變量的含義加以解釋,以免混淆。在數(shù)據(jù)統(tǒng)計分析過程中,會在變量名相對應(yīng)的位置上顯示該變量的標(biāo)簽,有利于分析結(jié)果得出結(jié)論。Values:標(biāo)簽變量值。標(biāo)簽是對變量的可能的取值所附加的進一步說明。無論是問卷結(jié)果顯示是數(shù)字型還是文字型,只要答案是分類的(也稱分類變量),如問卷中第9題“性別”,編碼后都要定義其取值的標(biāo)簽。具體操作:單擊行中Values格,再單擊格中的按鈕,即可定義值標(biāo)簽,如圖2.2。圖2.2值標(biāo)簽的定義Missing:缺失值的定義??芍付ㄈ笔е?。Columns:列寬度。Align:對齊方式,分為左對齊、右對齊、中間對齊。Measure:變量的度量類型。Scale為定量變量,Ordinal為等級變量,Nominal為定性變量。以問卷中第1題為例,可定義變量名稱Name為“Q1”,數(shù)值型變量Numeric,寬度Width默認(rèn)為8,小數(shù)位數(shù)Decimals為0,變量標(biāo)簽Label為“被調(diào)查者的月收入”,標(biāo)簽值Values為“1=300元以下”,“2=300—500元”,“3=500—700元”,“4=700元以上”,其他則均選擇系統(tǒng)默認(rèn)。此外,定義問卷中的變量時,必須定義問卷編號變量,便于差錯和統(tǒng)計分析。也就是,錄入問卷調(diào)查結(jié)果之前,應(yīng)先錄入問卷編號,如上節(jié)問卷編號為“12”。如果有許多個變量的類型相同,可以先定義一個變量,然后把該變量的定義信息復(fù)制給新變量。具體操作為:先定義一個變量,在該變量的行號上單擊右鈕,彈出如圖2.3(A)所示的快捷菜單,選擇Copy;然后用鼠標(biāo)右鈕選擇多行,彈出如圖2.3(B)所示的快捷菜單,選擇Paste;再把自動產(chǎn)生的新變量名稱(如Var0001、Var0002、Var0003、)改為所要的變量名稱。2.2.2數(shù)據(jù)的直接輸入定義好了變量就可以開始輸入數(shù)據(jù)。如果樣本不大,變量不多,可以直接在SPSS中DataView窗口輸入數(shù)據(jù)。輸入方法就如同在Excel中輸入一樣,每一個變量占一列,每一行代表一個被觀測個體的記錄或一份問卷(Case),數(shù)據(jù)就錄在行列交叉處。和其他常用統(tǒng)計軟件相比,SPSS數(shù)據(jù)界面最大的優(yōu)勢就是支持鼠標(biāo)的拖放操作,以及拷貝粘貼等命令,下面的數(shù)據(jù)輸入技巧就是對這些功能的利用。1、連續(xù)多個相同值的輸入如前面group變量有連續(xù)多個1,如果直接輸入,可以在第一格內(nèi)輸入1并回車,然后回到剛才的單元格并單擊右鍵,選擇copy,最后用拖放方式選中所有應(yīng)輸入1的單元格,單擊右鍵并選擇paste,所有選中的單元格就會都被剛才拷貝的1填充。

「Nai.|TypeWidth]Decimals|Label|橇iNujnericI8HeCuttg PastejLiise.rivariSL&xe l(A)復(fù)制(B)粘貼圖2.3復(fù)制變量定義信息2、將EXCEL數(shù)據(jù)直接引入SPSS若已有Excel數(shù)據(jù)文件,而且數(shù)據(jù)量較少,可直接打開原數(shù)據(jù),用拷貝粘貼的方法將數(shù)據(jù)引入SPSS:先在EXCEL中選中所有的數(shù)據(jù)(不包括變量名),然后選擇拷貝命令;然后切換到SPSS,最好使行1列1單元格成為當(dāng)前單元格,然后執(zhí)行粘貼命令,數(shù)據(jù)就會全部轉(zhuǎn)ASPSS,再修改相應(yīng)的變量類型、寬度、小數(shù)位數(shù)等即可。輸入完畢,從File菜單上選取SaveAs命令將其保存。SPSS數(shù)據(jù)文件擴展名為.SAV。單擊保存類型下拉菜單,可選擇保存為其他格式的數(shù)據(jù)文件,如Excel文件、dBase文件等。如圖2.4所示。:SaveDataAs13區(qū)保存在(I): :SaveDataAs13區(qū)保存在(I): SPSS二1歸囪廿1991U.S.GerLeralSucialSm-vey:diLurei:tii:i:arpetCarscuffeHCororL:±ry:±t-1erydataEmployhpdatatlyingGSS'dSsubsetGSS93forMissingVaBgilttm:±tlHomeE:ileE[byneighb01 ■■■■■■<■■■■■■I文件名?:保存類型(X):*『圖2.4SaveAs對話框Savevaluelabelsintoa.sasfile2.3從其他文件轉(zhuǎn)換成SPSS數(shù)據(jù)文件?數(shù)據(jù)讀入方法若數(shù)據(jù)文件已以其他格式存在,如EXCEL格式、LOTUS格式、dBase格式、TEXT格式等,可以在SPSSDataEditor窗口直接讀入。選擇菜單File—Open—Data或直接單擊快捷工具欄上的“旦,按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式,見表2.2。選擇所需的文件類型,然后選中需要打開的文件,SPSS就會按你的要求打開你要使用的數(shù)據(jù)文件,并自動轉(zhuǎn)換為數(shù)據(jù)SPSS格式。表2.2SPSS可讀入的數(shù)據(jù)文件列表SPSS(*.sav)SPSS數(shù)據(jù)文件(6.0?10.0版)SPSS/PC+(*.sys)SPSS4.0版數(shù)據(jù)文件Systat(*.syd)*.syd格式的Systat數(shù)據(jù)文件Systat(*.sys)*.sys格式的Systat數(shù)據(jù)文件SPSSportable(*.por)SPSS便攜格式的數(shù)據(jù)文件EXCEL(*.xls)EXCEL數(shù)據(jù)文件(從5.0版?2000版)Lotus(*.w*)Lotus數(shù)據(jù)文件SYLK(*.slk)SYLK數(shù)據(jù)文件dBase(*.dbf)dBase系列數(shù)據(jù)文件,(從dBaseII?IV)Text(*.txt)純文本格式的數(shù)據(jù)文件data(*.dat)純文本格式的數(shù)據(jù)文件?讀入EXCEL數(shù)據(jù)文件的步驟首先,選取File—Open—Data,打開已保存的SPSS數(shù)據(jù)文件或其他類型的數(shù)據(jù)文件;然后單擊文件類型,下拉菜單選擇Excel(*.xls),如圖2.6。如Excel文件第一行為變量名,則選中ReadVariableNamesfromthefirstrowofData選項,如圖2.7;并表名,如sheet2[A1:D5]。SPSS數(shù)據(jù)整理與轉(zhuǎn)換輸入數(shù)據(jù)以后,需要先對數(shù)據(jù)進行一些整理,如根據(jù)數(shù)據(jù)分析目的,按變量分組、合并、加權(quán)、重新定義或計算新變量等,以為最終的統(tǒng)計分析做準(zhǔn)備。這些功能集中在Data和Transform菜單項中,下面將以一個案例來介紹一些常用的功能。3.1一個案例有研究者為了解重慶市南坪地區(qū)促銷方式特征,進行一次“南坪商圈促銷方式及效果調(diào)研”活動,所設(shè)計的調(diào)查問卷如表3.1,收集了312份有效問卷,并建立了SPSS數(shù)據(jù)文件一一lll.sav。打開該數(shù)據(jù)文件后,圖3.1a顯示的是該文件的DataView窗口,而b圖是VariableView窗口。表3.1南坪商圈促銷方式與效果調(diào)研調(diào)查問卷你從事的職業(yè)是①銷售類(停止調(diào)查) ②非銷售類你最近一個月內(nèi)是否接受過類似調(diào)查:①是(停止調(diào)查) ②否你的性別:①男 ②女你所屬的年齡階段是:①25歲以下 ②25—35歲 ③35—45歲 ④45歲以上你的月收入屬于下列哪個階段:①1000元以下②1000—1500元③1500—2000元④2000元以上你見過哪些促銷方式:(多選)①特價銷售②免費品嘗③買商品贈禮品④買滿一定金額返代金券⑤換購⑥廣告促銷⑦其他 請將第5題的促銷方式的代號進行排序:(按喜歡程度由強到弱)你最近一次參加的促銷活動的促銷方式是什么?①特價銷售②免費品嘗③買商品贈禮品④買滿一定金額返代金券⑤換購⑥廣告促銷⑦其他 你最近一次參加促銷活動的消費元?你對商場的促銷活動的態(tài)度:①反感②不感興趣③喜歡遇到促銷活動,你會:①一次買很多②不理睬③有需要就買④認(rèn)為物美價廉就買

國111-SPSSDataEditor-□回區(qū)FileEditViewDataTr:=LTLEfi:irmArL:=LlyzeGraphsUtilitiesWindowHelp小1^^1+1國1島IM到茸|匪I耋|垂庸I朝翎I10:income 1numsexageincomeq6.1q6.2q6.3110231002212310033124100441221005511110□6612210□7712110□8811110099134100101012110111111211011212132100131312301014141341001515121100□I|\DataViewXVariableView/ I_l 1s 圖3.1aFSSFroceesoriereadvlll.sav的DataView窗口圖3.1blll.sav的VariableView窗口3.2數(shù)據(jù)整理?排序SortCases選擇菜單Data—SortCases,系統(tǒng)彈出SortCases對話框。該對話框并不復(fù)雜,左方是可用于排序的變量,中間是一個箭頭符號,右邊上面是已確定的排序變量(在Sortby下的框里),右邊下方則是SortOrder單選鈕,有升序和降序兩種選擇。具體方法是:先可選擇某一變量(如圖3.2a中的分組變量[income]),點擊中間的箭頭使選中變量到Sortby框里,然后選擇升序(Ascending)或降序(Descending)單選鈕。若還要按其他變量排序,可繼續(xù)上面的做法,只是排在前面的變量有排序優(yōu)先權(quán)。如圖3.2a中的可排序變量income和age,若Sortby框中income在age的前面(見圖3.2b),排序時就會先滿足income的排序要求,再滿足age的排序要求。a選擇income按升序排b再選擇age排序圖3.2SortCases對話框?合并數(shù)據(jù)文件MergeFiles若案例中收集到的有效問卷超過1000份,研究者就必須建立至少兩個同變量結(jié)構(gòu)的SPSS數(shù)據(jù)文件,假定除了111.sav以外,還有222.sav;或者,因為變量個數(shù)太多,研究者建立了兩個各含半數(shù)變量的SPSS數(shù)據(jù)文件一一111.sav和333.sav。現(xiàn)要把上述兩種情況下的兩個數(shù)據(jù)文件分別合并起來,就需分別采用MergeFiles中的AddCases和AddVariable,見圖3.3a。

1.從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,稱為縱向合并,用AddCases對話框完成,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。選擇菜單Data—MergeFiles—AddCases,系統(tǒng)首先彈出打開數(shù)據(jù)文件對話框。選中需要添加的數(shù)據(jù)文件并按OK,系統(tǒng)才彈出AddCases對話框(見圖3.3b),左側(cè)顯示的是新、老數(shù)據(jù)文件中不匹配的變量名(圖3.3b中顯示沒有不匹配的變量名),右側(cè)顯示的是已經(jīng)匹配的變量名??梢杂肦ename按鈕對不匹配變量改名(先選中)或用鼠標(biāo)強行匹配(即先按Ctrl鍵選中匹配的兩個變量再單擊Pair鈕)。右下方的Indicatecasesourceasvariable復(fù)選框用于定義一個新變量以區(qū)分哪些記錄是后來添加的。選擇停當(dāng)后單擊OK,該操作就完成了。圖3.3bAddCases的對話框2.從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,稱為橫向合并,用AddVariable對話框完成,相互合并的數(shù)據(jù)文件中應(yīng)包含同樣的記錄。選擇菜單Data—MergeFiles—AddVariable對話框,系統(tǒng)同樣先彈

出打開數(shù)據(jù)文件對話框,單擊OK后彈出和前面相似的AddVariable對話框(見圖3.3c)。左側(cè)是外部數(shù)據(jù)文件中多出來的變量(圖3.3c中是333.sav多余的變量,與lll.sav中的變量一致),右側(cè)是合并后新文件包含的所有變量。其他選項,可按需選擇即可。圖3.3cAddVariables的對話框?數(shù)據(jù)分類匯總Aggregate所謂分類匯總就是按指定的分類變量對觀測值進行分組,對每組記錄的各變量值求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件,見圖3.4。

b定義新匯總變量的名稱和標(biāo)簽的界面AggregateData:AggregateFunctionSummarySpecificValuesNumberofcases,■*Wean:MedianSumStandarddeviation廣First廠LastMinimumMaximumWeightedWeightedmissingUnweightedb定義新匯總變量的名稱和標(biāo)簽的界面AggregateData:AggregateFunctionSummarySpecificValuesNumberofcases,■*Wean:MedianSumStandarddeviation廣First廠LastMinimumMaximumWeightedWeightedmissingUnweightedUnweightedmissingPercentagesAboveBelowInsideOutsideHigh:[FractionsAboveBelowInsideOutsidec定義匯總函數(shù)Lq迎:圖3.4AggregateData對話框圖3.4中各個部分的含義如下:■BreakVariables圖3.4中各個部分的含義如下:■AggregateVariables框:用于選擇被匯總的變量,可選擇q9(即被訪問者最近一次參加促銷活動的消費),如圖3.4a;Name&Label鈕:用于定義新產(chǎn)生的匯總變量的名稱和標(biāo)簽,如圖3.4b;Function鈕:用于定義匯總函數(shù),共有三組函數(shù),以最常用的第一組為例,可選的函數(shù)有均值、同組的第一個觀測值、最后一個觀測值、同組記錄數(shù)、標(biāo)準(zhǔn)差、最小值、和、最大值共個,如圖3.4c;SaveNumberofcasesinbreakgroupasvariable復(fù)選框:用于定義一個新變量以存儲同組的記錄數(shù);Createnewdatafile單選鈕:定義一個新文件以存儲匯總的結(jié)果,右側(cè)的File鈕用于具體文件名的定義,默認(rèn)文件名為AGGR.sav;Replaceworkingdatafile單選鈕:用匯總的結(jié)果替換原來的數(shù)據(jù)。?數(shù)據(jù)文件分組SplitFile若要對不同群體作同類分析,可使用SplitFile將數(shù)據(jù)文件分割成不同的組來進行處理。選擇Data—SplitFiles,出現(xiàn)SplitFiles對話框,見圖3.5。圖中顯示,本次分析是按age(即被訪問者年齡)分組分析。圖3.5SplitFile對話框圖3.5種各部分的含義如下:Analyzeallcases單選框:和下面的兩個單選框為一組,選中本框不拆分文件;Comparegroups單選框:按所選變量拆分文件,各組分析結(jié)果緊挨在一起便于相互比較;Organizeoutputbygroups單選框:按所選變量拆分文件,各組分析結(jié)果單獨放置;Groupsbasedon框:用于選擇拆分?jǐn)?shù)據(jù)文件的變量;Sortthefilebygroupingvariables單選框:將數(shù)據(jù)按所用的拆分變量排序;Fileisalreadysorted單選框:數(shù)據(jù)保持原狀,不按所用的拆分變量排序。?選擇分析組SelectCases有些時候不需要分析全部的數(shù)據(jù),而是按某種要求分析其中的一部分。比如,案例中的研究者只想對年齡(age)在35-45、月收入(income)在2000元以上的女性對促銷方式的看法與行為;或者只想對200個數(shù)據(jù)進行分析以了解大概情況,等等。這時需使用SelectCases對話框,來簡化工作。選擇Data—SelectCases,彈出對話框如圖3.6a所示。其中:Allcases單選鈕:和下面的4個單選鈕為一組,選中它則分析所有的記錄;Ifconditionissatisfied單選鈕:只分析滿足條件的記錄;If按鈕:和If單選鈕一起使用,單擊后彈出If對話框;Randomsampleofcases單選鈕:從原數(shù)據(jù)中按某種條件抽樣;Sample按鈕:和Random單選鈕一起使用,可以設(shè)定按百分比抽取記錄,或者精確設(shè)定從前若干個記錄中抽取多少個記錄;Basedontimeorcaserange單選鈕:基于記錄序號來選擇記錄;Range按鈕:和Based單選鈕一起使用,用于輸入記錄序號范圍;Usefiltervariable單選鈕:使用篩選指示變量來選擇記錄,必需在下面選入一個篩選指示變量,該變量取值為非0的記錄將被選中,進入以后的分析;Filtered單選鈕:和下面的Deleted單選鈕為一組,表示未被選中的記錄只是被隔離,這些記錄的記錄號會被加上斜杠以示區(qū)別;Deleted單選鈕:未被選中的記錄將被刪除,一般不要使用。所以,先前的第一種情況應(yīng)選擇IfConditionisSatisfied,單擊If后彈出If對話框,見圖3.6b。圖中右上方框里的“sex=0andage=3andincome=4”就是需要滿足的條件,其中“sex=0”、"age=3”、“income=4”代表女性、年齡35—45歲、月收入2000元以上;而中間的“and”表明三個條件都必須滿

足,右只需滿足其中任意一項都行,則用“or”連接。此外,條件表達式也可從Functions框中選擇。當(dāng)填好條件表達式后,可單擊Continue回到圖3.6a,再單擊ok就完成了。而先前的第二種情況,則應(yīng)該選擇Basedontimeorcaserange,并單擊Range彈出對話框,見圖3.6c。在Firstcase框輸入1,在Endcase框輸入200,單擊Continue回到圖3.6a,再單擊ok就完成了。sex=0andage=3andincome=4|Selecxcases:±r秒向卷編號[num]秒被訪向者性劇[sex]秒被訪苛者年舍[age]@被訪向者月收入[inc秒是否見過特價銷曾[isex=0andage=3andincome=4|Selecxcases:±r秒向卷編號[num]秒被訪向者性?。踫ex]秒被訪苛者年舍[age]@被訪向者月收入[inc秒是否見過特價銷曾[i秒是否見過免費品嘗[I秒是否見過買商品!&禮秒是否見過買謗一定金秒是否見過換購[q6.5]秒是否見過廣告促銷[I秒掉第一位的促銷方式秒掉第二位的促銷方式秒掉第三位的促銷方式秒掉第四位的促銷方式秒掉第五位的促銷方式¥_?■?—?—___土_J3/JTIContinueZ_?J?^561230 ?DeleteABS(numexpr]ANY(testvalue^va1ue,..JARSIN(numexpr]ARTAN(numexpr)CDFNORM(zvalue]CDF.BERNOULLH^p]wFunctions:CancelHelp圖3.6bIf對話框圖3.6cRange對話框當(dāng)對數(shù)據(jù)集做出篩選后,所做的篩選將在以后的分析中一直有效,直到再次改變選擇條件為止。同時在多數(shù)情況下,系統(tǒng)會自動產(chǎn)生一個名為filter_$的篩選指示變量,被選中的記錄該變量取值為1,反之則為0。?加權(quán)分析組WeightCases當(dāng)兩組個案(Cases)數(shù)目相差懸殊(比如男多女少)時,為了盡量反映“平等”的社會現(xiàn)象,有時需要給予適當(dāng)?shù)臋?quán)重(比如對弱勢群體賦予大的權(quán)重,反之亦然),以利于統(tǒng)計分析。在默認(rèn)情況下,每一行就是一條記錄,如果希望在分析過程中利用不同的變量對數(shù)據(jù)進行加權(quán)處理,就需要用到WeightCases對話框,見圖3.7。該對話框的使用極為簡單,界面上有兩個單選鈕,分別是不權(quán)重記錄和用某變量權(quán)重記錄,如果選擇后者,則需要選中一個權(quán)重變量。圖中顯示以性別sex加權(quán)。圖3.7WeightCases對話框?Data菜單中的其余對話框Definedates對話框:可以自動生成時間變量。InsertVariable命令:在當(dāng)前列插入新變量。Insertcases命令:在當(dāng)前行插入新記錄。Gotocases對話框:到達指定記錄號的記錄,該命令在記錄數(shù)極多時(1000條以上)非常有用。3.3數(shù)據(jù)轉(zhuǎn)換從調(diào)查得來的原始數(shù)據(jù)是非常重要的。但是有些原始數(shù)據(jù)沒有歸類,比如案例中的消費,不象年齡、月收人等只有幾個取值,如果直接打印出頻率表,則既浪費紙張又欠直觀。為此,需要復(fù)制一份原始數(shù)據(jù)(即備份),再對復(fù)制后的原始數(shù)據(jù)重新編碼,比如按消費段編碼成幾組,然后分組比較和打印顯示。同樣,對原始數(shù)據(jù)也可以進行重新計算。例如從消費q9計算出一個新變量一一絕對消費差異。類似這種數(shù)據(jù)變換,可用以下4條命令。(1) COMPUTE:對原始數(shù)據(jù)進行四則運算等,進而派生出新的變量。(2) RECODE:重新編碼數(shù)據(jù),重新安排次序。

COUNT:創(chuàng)建一個新變量用以計算某些變量共同發(fā)生的頻次(即計數(shù))。IF:如果表達式成立,則可以有條件地創(chuàng)建一個新變量。以上4條數(shù)據(jù)變換的命令分別又有2種執(zhí)行方式:其一是直接采用命令來實現(xiàn)。其二是采用Transform過程中的對話框來實現(xiàn)。這里只介紹使用對話框?qū)崿F(xiàn)的操作。?計算Compute在案例中,若研究者想分析每個被訪問者最近一次參加促銷活動的消費額與經(jīng)驗平均消費額110元的絕對差異,定義變量名為absq9??刹捎萌缦虏僮鳎狐c擊Transform—Compute,進入ComputeVariable對話框,如圖3.8。Targetvariable為新產(chǎn)生的變量,可輸入新變量名absq9。該欄下方為一按鈕Type&Label,單擊該按鈕后可選擇新變量類型和定義變量標(biāo)簽。NumericExpression為表達式,有兩種方法在該欄中寫入表達式:1)直接寫出。如對SPSS中函數(shù)比較熟悉,可在此欄中直接填入abs(q9-110),即計算消費額q9與經(jīng)驗平均消費額110元的絕對差異,然后單擊OK就行了?!鯟omputeVariableTargetVariable:Type&Label-I秒是否見過換購[qG.5]a秒是否見過廣告促銷[c食惜第一位的促銷方式食惜第二位的促銷方式食惜第三位的促銷方式秒惜第四位的促銷方式秒惜第五位的促銷方式秒惜第六位的促銷方式秒被切問者最近一次參夠被切問者最近一次參秒被訪問者對促銷活動秒被切問者遇到促銷活NumericExpression:ABS(q9-110],_J3rl■ComputeVariableTargetVariable:Type&Label-I秒是否見過換購[qG.5]a秒是否見過廣告促銷[c食惜第一位的促銷方式食惜第二位的促銷方式食惜第三位的促銷方式秒惜第四位的促銷方式秒惜第五位的促銷方式秒惜第六位的促銷方式秒被切問者最近一次參夠被切問者最近一次參秒被訪問者對促銷活動秒被切問者遇到促銷活NumericExpression:ABS(q9-110],_J3rlFunctions:ANY(testvalue,value,...)ARSIN(numexpr]ARTAN(numexpr)CDFNORM(zvalue]CDF.BERNOULLIlq^p)ABSfnumex圖3.8新變量的產(chǎn)生2)從對話框選取。NumericExpression欄下方為Functions欄,該欄中列出了常用的函數(shù),可從該欄選取所要的函數(shù)。每個函數(shù)后的括號中注明了所需變量的類型或其他特殊的變量(numexpr表示數(shù)值變量,strexpr表示字符變量)。選中后單擊Functions上方的箭頭,進入NumericExpression欄。該欄對話框左下方列出了數(shù)據(jù)庫中的變量,選中所要的變量,單擊其右上方的箭頭將其選入框內(nèi),或進入函數(shù)后的括號內(nèi)。如上例,首先從Functions欄選中ABS(numexpr),單擊上方箭頭進入NumericExpression,此時ABS后的括號內(nèi)為一問號。從左下方欄中選中變量q9,單擊右上方箭頭進入ABS后的括號內(nèi),并減去110。此時NumericExpression內(nèi)表達式為abs(q9T10),如圖3.8,再單擊OK,即產(chǎn)生新變量absq9。如不明白函數(shù)意義,可在該函數(shù)名稱處單擊右鍵即彈出該函數(shù)的解釋。此外,可以單擊If按鈕,設(shè)定計算新變量的Cases范圍。比如說,只對女性計算absq9;或者只對消費q9大于50的Cases計算absq9;等等。?計數(shù)Count計數(shù)Count是計算變量值中含有相同范圍值的次數(shù)。如案例中,研究者要計算第一喜歡“特價銷售”或“購商品贈禮品”促銷方式的消費者人數(shù),諸如此類,就要采用Count。其具體操作步驟如下:1、選擇Transform—Count,彈出Count對話

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論