spss簡介和基本操作_第1頁
spss簡介和基本操作_第2頁
spss簡介和基本操作_第3頁
spss簡介和基本操作_第4頁
spss簡介和基本操作_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、SPSS應(yīng)用應(yīng)用1:基本知識:基本知識 1. SPSS簡介簡介2. SPSS菜單命令菜單命令3. SPSS數(shù)據(jù)文件的建立:變量定義及數(shù)數(shù)據(jù)文件的建立:變量定義及數(shù)據(jù)錄入據(jù)錄入4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作SPSS的基本知識的基本知識SPSSSPSS的發(fā)展的發(fā)展1.1SPSSSPSS的版本的版本1.2SPSSSPSS的運行方式的運行方式1.3SPSSSPSS的啟動、主界面和退出的啟動、主界面和退出1.41. SPSS簡介簡介SPSSSPSS是世界著名的統(tǒng)計分析軟件之一。經(jīng)近是世界著名的統(tǒng)計分析軟件之一。經(jīng)近4040余年的發(fā)展,在全球已擁有大量的用戶。目余年的發(fā)

2、展,在全球已擁有大量的用戶。目前,前,SPSSSPSS使用使用WindowsWindows的窗口方式展示各種管的窗口方式展示各種管理和分析數(shù)據(jù)的方法,可方便地用于特定的科理和分析數(shù)據(jù)的方法,可方便地用于特定的科研統(tǒng)計。概要介紹研統(tǒng)計。概要介紹SPSSSPSS的發(fā)展、主要版本、運的發(fā)展、主要版本、運行方式、啟動與退出以及幫助系統(tǒng)的使用。行方式、啟動與退出以及幫助系統(tǒng)的使用。 1968年,年,3位美國斯坦福大學(xué)的學(xué)生開發(fā)了最早的位美國斯坦福大學(xué)的學(xué)生開發(fā)了最早的SPSS系統(tǒng),并基于這一系統(tǒng)于系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥合伙成立了年在芝加哥合伙成立了SPSS公公司。司。 SPSS的基本功

3、能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸?shù)幕竟δ馨〝?shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。出管理等。 SPSS最初名為社會學(xué)統(tǒng)計軟件包(最初名為社會學(xué)統(tǒng)計軟件包(Solutions Statistical Package for the Social Sciences),這是為了強(qiáng)調(diào)其社會科學(xué)),這是為了強(qiáng)調(diào)其社會科學(xué)應(yīng)用的一面(因為社會科學(xué)研究中的許多現(xiàn)象都是隨機(jī)的,應(yīng)用的一面(因為社會科學(xué)研究中的許多現(xiàn)象都是隨機(jī)的,要使用統(tǒng)計學(xué)和概率論的定理來進(jìn)行研究)。要使用統(tǒng)計學(xué)和概率論的定理來進(jìn)行研究)。 但是隨著但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的

4、增加,SPSS公司已于公司已于2000年正式將英文全稱更改為年正式將英文全稱更改為“統(tǒng)計產(chǎn)品與服統(tǒng)計產(chǎn)品與服務(wù)解決方案務(wù)解決方案” (Statistical Product and Service Solutions)。)。 到目前為止,到目前為止,SPSS已成為適合于已成為適合于DOS,Windows,UNIX,Macintosh及及OS/2等多種操作系統(tǒng)使用的產(chǎn)品,國等多種操作系統(tǒng)使用的產(chǎn)品,國內(nèi)常用的是其適用于內(nèi)常用的是其適用于DOS和和Windows的版本。的版本。SPSS for DOS通常稱為通常稱為SPSS/PC+,現(xiàn)已較少使用。,現(xiàn)已較少使用。 2009年年4月月9日日 美國芝

5、加哥美國芝加哥SPSS公司宣布重新包裝旗下的公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為預(yù)測統(tǒng)計分析軟件產(chǎn)品線,定位為預(yù)測統(tǒng)計分析軟件(Predictive Analytics Software) PASW,IBM于于2009年年7月月28日宣布以日宣布以12億美元收購億美元收購SPSS公司,公司,SPSS正式成為正式成為IBM Information Management產(chǎn)品線下品牌。產(chǎn)品線下品牌。 2010年:隨著年:隨著SPSS公司被公司被IBM公司并購公司并購,各子產(chǎn)品家族名各子產(chǎn)品家族名稱前面不再以稱前面不再以PASW為名為名,修改為統(tǒng)一加上修改為統(tǒng)一加上IBM SPSS字樣。字樣。

6、 SPSS版本升級在近幾年非???,目前市場上已出現(xiàn)版本升級在近幾年非???,目前市場上已出現(xiàn)IBM SPSS Statistics 21.0。 spss17.0版本占用空間小且運行版本占用空間小且運行快,非常適合使用???,非常適合使用。 PASW 18.0具有過度性,具有過度性, IBM SPSS Statistics 19.0在最新教材中開始使用。在最新教材中開始使用。19.0是多國語言版。是多國語言版。 SPSS的系列產(chǎn)品有的系列產(chǎn)品有 SPSS Statistics (統(tǒng)計分析軟件),(統(tǒng)計分析軟件),SPSS Collection(數(shù)據(jù)收集產(chǎn)品),(數(shù)據(jù)收集產(chǎn)品),SPSS Modele

7、r(數(shù)據(jù)(數(shù)據(jù)挖掘產(chǎn)品)等。挖掘產(chǎn)品)等。SPSS功能強(qiáng)大,在國際學(xué)術(shù)界有條不成文功能強(qiáng)大,在國際學(xué)術(shù)界有條不成文的規(guī)定,即在國際學(xué)術(shù)交流中,凡是使用的規(guī)定,即在國際學(xué)術(shù)交流中,凡是使用SPSS完成的計算完成的計算和統(tǒng)計分析,可以不說明算法,可見該軟件的影響之大和和統(tǒng)計分析,可以不說明算法,可見該軟件的影響之大和信譽之高。信譽之高。SPSSSPSS主要有主要有3 3種運行方式:種運行方式:n完全窗口菜單運行方式:錄入數(shù)據(jù)后,大部完全窗口菜單運行方式:錄入數(shù)據(jù)后,大部分操作和統(tǒng)計方法的實現(xiàn)都是通過菜單、圖分操作和統(tǒng)計方法的實現(xiàn)都是通過菜單、圖標(biāo)和對話框來完成標(biāo)和對話框來完成n批處理方式和程序運行

8、方式是從使用者的特批處理方式和程序運行方式是從使用者的特殊的分析需求出發(fā),編寫殊的分析需求出發(fā),編寫SPSSSPSS命令程序,通命令程序,通過語句直接運行的。過語句直接運行的。1.4.1 安裝與安裝與啟動啟動SPSS SPSS SPSS安裝完畢后,系統(tǒng)會自動在安裝完畢后,系統(tǒng)會自動在WindowsWindows菜單中創(chuàng)建快捷方式菜單中創(chuàng)建快捷方式。1.4.2 SPSS的數(shù)據(jù)編輯窗口的數(shù)據(jù)編輯窗口 SPSS SPSS主界面主要有兩個,一個是主界面主要有兩個,一個是SPSSSPSS數(shù)數(shù)據(jù)編輯窗口,另一個是據(jù)編輯窗口,另一個是SPSSSPSS輸出窗口。輸出窗口。 數(shù)據(jù)編輯窗口由標(biāo)題欄、菜單欄、工具欄

9、、數(shù)據(jù)編輯窗口由標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標(biāo)簽頁編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標(biāo)簽頁和狀態(tài)欄組成,如圖和狀態(tài)欄組成,如圖1-21-2所示。所示。 標(biāo)題欄 菜單欄 編輯欄 變量名欄 內(nèi)容區(qū) 窗口切換標(biāo)簽頁 狀態(tài)欄 工具攔 該窗口下方有兩個標(biāo)簽:該窗口下方有兩個標(biāo)簽:“Data View”Data View”(數(shù)據(jù)視圖)和(數(shù)據(jù)視圖)和“Variable View”Variable View”(變量視(變量視圖)。圖)。 如果使用過電子表格,如如果使用過電子表格,如Microsoft Microsoft ExcelExcel等,那么數(shù)據(jù)編輯窗口中等,那么數(shù)據(jù)編輯

10、窗口中“Data View”Data View”所對應(yīng)表格許多功能應(yīng)該已經(jīng)熟悉。但是它和所對應(yīng)表格許多功能應(yīng)該已經(jīng)熟悉。但是它和一般的電子表格處理軟件還有以下區(qū)別。一般的電子表格處理軟件還有以下區(qū)別。 (1 1) 一個列對應(yīng)一個變量,即每一列代一個列對應(yīng)一個變量,即每一列代表一個變量(表一個變量(VariableVariable)或一個被觀測量的)或一個被觀測量的特征。例如問卷上的每一項就是一個變量。特征。例如問卷上的每一項就是一個變量。 (2 2) 行是觀測,即每一行代表一個個體、行是觀測,即每一行代表一個個體、一個觀測、一個樣品,在一個觀測、一個樣品,在SPSSSPSS中稱為事件中稱為事件

11、/ /個個案(案(CaseCase)。例如,問卷上的每一個人就是一)。例如,問卷上的每一個人就是一個觀測。個觀測。 (3 3)單元包含值,即每個單元包括一個)單元包含值,即每個單元包括一個觀測中的單個變量值。單元(觀測中的單個變量值。單元(CellCell)是觀測和)是觀測和變量的交叉。變量的交叉。 (4 4)數(shù)據(jù)文件是一張長方形的二維表。)數(shù)據(jù)文件是一張長方形的二維表。數(shù)據(jù)文件的范圍是由觀測和變量的數(shù)目決定的。數(shù)據(jù)文件的范圍是由觀測和變量的數(shù)目決定的。可以在任一單元中輸入數(shù)據(jù)。如果在定義好的可以在任一單元中輸入數(shù)據(jù)。如果在定義好的數(shù)據(jù)文件邊界以外鍵入數(shù)據(jù),數(shù)據(jù)文件邊界以外鍵入數(shù)據(jù),SPSSS

12、PSS將數(shù)據(jù)長方將數(shù)據(jù)長方形延長到可包括那個單元和文件邊界之間的任形延長到可包括那個單元和文件邊界之間的任何行和列。何行和列。1.4.3 SPSS結(jié)果輸出窗口結(jié)果輸出窗口 SPSS SPSS結(jié)果輸出窗口名為結(jié)果輸出窗口名為ViewerViewer,它是顯,它是顯示和管理示和管理SPSSSPSS統(tǒng)計分析結(jié)果、報表及圖形的窗統(tǒng)計分析結(jié)果、報表及圖形的窗口。可以將此窗口中的內(nèi)容以結(jié)果文件口??梢詫⒋舜翱谥械膬?nèi)容以結(jié)果文件.spv.spv的的形式保存。形式保存。 結(jié)果輸出部分分成左右兩個部分,左邊部分是索引結(jié)果輸出部分分成左右兩個部分,左邊部分是索引輸出區(qū),用于顯示已有的分析結(jié)果標(biāo)題和內(nèi)容索引;右輸出

13、區(qū),用于顯示已有的分析結(jié)果標(biāo)題和內(nèi)容索引;右邊部分是各個分析的具體結(jié)果,稱為詳解輸出區(qū)。這和邊部分是各個分析的具體結(jié)果,稱為詳解輸出區(qū)。這和WordWord的文檔結(jié)構(gòu)視圖十分類似。編輯輸出的表格時,可的文檔結(jié)構(gòu)視圖十分類似。編輯輸出的表格時,可以雙擊在輸出窗口中顯示,也可以在點以雙擊在輸出窗口中顯示,也可以在點“透視透視透視托透視托盤盤”在新的窗口顯示。編輯圖形可以雙擊或者點右鍵選在新的窗口顯示。編輯圖形可以雙擊或者點右鍵選擇擇 索引輸出區(qū) 詳解輸出區(qū) 1.4.4 退出退出SPSS 選擇數(shù)據(jù)編輯窗口的選擇數(shù)據(jù)編輯窗口的“File”File”菜單中的菜單中的“Exit”Exit”命令,或單擊標(biāo)題

14、欄上的命令,或單擊標(biāo)題欄上的“關(guān)閉關(guān)閉”按按鈕退出鈕退出SPSSSPSS。1.4.5 有關(guān)統(tǒng)計方法指導(dǎo)有關(guān)統(tǒng)計方法指導(dǎo) SPSSSPSS對一些基本模塊中的統(tǒng)計提供了對一些基本模塊中的統(tǒng)計提供了StatisticsStatistics CoachCoach幫助,也就是幫助,也就是“手把手手把手”式的指導(dǎo)式的指導(dǎo)2. SPSS菜單命令菜單命令2.1 基本菜單欄單欄名稱基本用途File文件操作Edit文件編輯View視圖編輯Data數(shù)據(jù)操作數(shù)據(jù)操作Transform數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換Analyze統(tǒng)計分析方法統(tǒng)計分析方法Diect Marketing直銷分析Graphs 圖形編輯圖形編輯Utiliti

15、es實用程序Add-ons附加程序Windows窗口控制Help幫助SPSS中英文界面的轉(zhuǎn)換中英文界面的轉(zhuǎn)換當(dāng)首次安裝軟件時,當(dāng)首次安裝軟件時,SPSS界面為英文顯示,此時可界面為英文顯示,此時可以采用如下方法將其轉(zhuǎn)換為中文界面。以采用如下方法將其轉(zhuǎn)換為中文界面。1. 選擇菜單欄中的【選擇菜單欄中的【Edit(編輯編輯)】菜單中的】菜單中的【Option(選項選項)】命令?!棵睢?2.2.在彈出的對話框的在彈出的對話框的【User Interface(用戶界面用戶界面)】選項卡的【選項卡的【Language(語言語言)】選項組中點選】選項組中點選【Simplified Chinese(簡體中

16、文簡體中文)】單選鈕,表】單選鈕,表示選定軟件中文界面顯示。示選定軟件中文界面顯示。3.3.最后單擊【最后單擊【OK(確定確定)】按鈕,表示】按鈕,表示SPSS軟件的界軟件的界面語言轉(zhuǎn)換過程結(jié)束。面語言轉(zhuǎn)換過程結(jié)束。 如果需要從中文界面轉(zhuǎn)換為英文界面,也可按照上如果需要從中文界面轉(zhuǎn)換為英文界面,也可按照上述操作來實現(xiàn)。述操作來實現(xiàn)。3. SPSS的數(shù)據(jù)文件建立的數(shù)據(jù)文件建立變量定義及數(shù)據(jù)錄入變量定義及數(shù)據(jù)錄入3.1 變量的定義變量的定義3.2 創(chuàng)建和讀取創(chuàng)建和讀取SPSS數(shù)據(jù)文件數(shù)據(jù)文件3.3 變量及數(shù)據(jù)顯示的相關(guān)設(shè)置變量及數(shù)據(jù)顯示的相關(guān)設(shè)置3. SPSS的變量定義及數(shù)據(jù)錄入的變量定義及數(shù)據(jù)錄

17、入1.SPSS數(shù)據(jù)的屬性及其定義方法 一個完整的一個完整的SPSS數(shù)據(jù)結(jié)構(gòu)包括數(shù)據(jù)結(jié)構(gòu)包括: 變量名、變量類型、變量名、變量類型、變量取值的長度變量取值的長度、變量名標(biāo)簽、變量的小、變量名標(biāo)簽、變量的小數(shù)點位數(shù)、變量名的標(biāo)簽、變量值的標(biāo)簽、缺失值的定義、數(shù)點位數(shù)、變量名的標(biāo)簽、變量值的標(biāo)簽、缺失值的定義、變量在數(shù)據(jù)窗口顯示的長度、變量在數(shù)據(jù)窗口顯示的長度、變量在數(shù)據(jù)格中的對齊方式、變量在數(shù)據(jù)格中的對齊方式、度量的尺度(變量取值的測量類型)、度量的尺度(變量取值的測量類型)、角色角色(定義變量在后(定義變量在后繼分析中的功能作用,目標(biāo):輸出變量;分區(qū):劃分樣本)繼分析中的功能作用,目標(biāo):輸出變量

18、;分區(qū):劃分樣本)3.1 變量的定義變量的定義3.1.1 變量名 首字符必須是字母或漢字,后面可以是除首字符必須是字母或漢字,后面可以是除(!、?、?*)之外的任之外的任意字符。意字符。 變量名的結(jié)尾不能是圓點、句點、下劃線變量名的結(jié)尾不能是圓點、句點、下劃線 變量名的長度:版本差異變量名的長度:版本差異 變量名必須唯一,不可以有空格,不區(qū)分大小寫變量名必須唯一,不可以有空格,不區(qū)分大小寫 SPSS的保留字不能作為變量名(的保留字不能作為變量名(ALL、NE、LE、BY、GE、EQ、GT、AND、OR、NOT、WITH等)等) 如不指定變量名,則系統(tǒng)默認(rèn)變量名以如不指定變量名,則系統(tǒng)默認(rèn)變量名

19、以VAR開頭后面跟開頭后面跟5個個數(shù)字?jǐn)?shù)字 為了便于記憶和理解,變量名與其所代表的具體含義最好一為了便于記憶和理解,變量名與其所代表的具體含義最好一致。致。3.1.2 變量的類型(Type) 數(shù)值型數(shù)值型:根據(jù)其功能和形式又可細(xì)分為根據(jù)其功能和形式又可細(xì)分為(標(biāo)準(zhǔn)數(shù)值型、逗號標(biāo)準(zhǔn)數(shù)值型、逗號型、句點型、科學(xué)計數(shù)型、美元型和自定義貨幣型型、句點型、科學(xué)計數(shù)型、美元型和自定義貨幣型)默認(rèn)默認(rèn)長度為長度為8,小數(shù)位數(shù)為,小數(shù)位數(shù)為2 字符串型字符串型 日期型日期型系統(tǒng)默認(rèn)為標(biāo)準(zhǔn)數(shù)值型系統(tǒng)默認(rèn)為標(biāo)準(zhǔn)數(shù)值型(1) 數(shù)值型變量 標(biāo)準(zhǔn)型標(biāo)準(zhǔn)型:是是SPSS默認(rèn)的類型,寬度默認(rèn)的類型,寬度8、小數(shù)點、小數(shù)點2

20、、小數(shù)點用圓、小數(shù)點用圓點。點。 科學(xué)計數(shù)類型:適合數(shù)值很大或很小的變量科學(xué)計數(shù)類型:適合數(shù)值很大或很小的變量,變量顯示為指數(shù)變量顯示為指數(shù)形式。如:形式。如:-1.28E+002表示表示-1.28102 逗號型逗號型(comma ):整數(shù)部分從右到左每三位用,分割:整數(shù)部分從右到左每三位用,分割 圓點型圓點型(Dot):整數(shù)部分從右到左每三位用:整數(shù)部分從右到左每三位用.分割,小數(shù)點用,分割,小數(shù)點用,表示表示 美元型美元型(Dollar) 自定義貨幣型自定義貨幣型(2) 日期型變量(Date) 用于表示日期和時間的變量類型用于表示日期和時間的變量類型SPSS提供提供了多達(dá)了多達(dá)29種日期型

21、變量的格式種日期型變量的格式.(3) 字符型變量(String) 是非數(shù)值型變量類型是非數(shù)值型變量類型,其值是由字符串組成其值是由字符串組成的的.對其定義的對話框只有一個輸入項,不對其定義的對話框只有一個輸入項,不參與運算,且區(qū)分大小寫參與運算,且區(qū)分大小寫(4) 修改數(shù)據(jù)變量的默認(rèn)值 對于對于SPSS變量的參數(shù)變量的參數(shù),系統(tǒng)都會自動給出系統(tǒng)都會自動給出默認(rèn)值默認(rèn)值.也可通過也可通過Edit菜單中的菜單中的Data對話框?qū)υ捒蛑匦略O(shè)置重新設(shè)置點擊3.1.3 變量標(biāo)簽(Label) 變量名標(biāo)簽(變量名標(biāo)簽(variable label) 對變量名含義的進(jìn)一步補充說明。對變量名含義的進(jìn)一步補充說

22、明。 變量值標(biāo)簽(變量值標(biāo)簽(alue Label) 是對數(shù)值型變量各個取值的含義給予進(jìn)一步是對數(shù)值型變量各個取值的含義給予進(jìn)一步的解釋和說明的解釋和說明3.1.4 變量缺失數(shù)據(jù)(missing value) 系統(tǒng)默認(rèn)無缺失值:如當(dāng)前變量測試值、記錄完全正確、系統(tǒng)默認(rèn)無缺失值:如當(dāng)前變量測試值、記錄完全正確、無遺漏,則可用無缺失值。無遺漏,則可用無缺失值。離散缺失值:如性別0、3、4都是非法的,可分 別填入點擊 定義缺失值范圍:這種缺失值針對連續(xù)的變量值。當(dāng)指定定義缺失值范圍:這種缺失值針對連續(xù)的變量值。當(dāng)指定某一范圍的值出現(xiàn)在當(dāng)前定義的變量中,則被當(dāng)作缺失值某一范圍的值出現(xiàn)在當(dāng)前定義的變量中

23、,則被當(dāng)作缺失值處理。如在性別變量值中輸入了處理。如在性別變量值中輸入了3、4、5、6。可以在??梢栽贚OW后面輸入后面輸入3,HIGHT后面輸入后面輸入6。注意這個定義范圍。注意這個定義范圍內(nèi)不能有合法值內(nèi)不能有合法值。”0“就是包括不了的離散值 如果不能明確數(shù)據(jù)中如果不能明確數(shù)據(jù)中可能存在的缺失值,可能存在的缺失值,可以選擇可以選擇“數(shù)據(jù)數(shù)據(jù)定義變量屬性定義變量屬性”來確來確認(rèn)。認(rèn)。 SPSS默認(rèn)缺失值用默認(rèn)缺失值用一個圓點表示一個圓點表示3.1.5 度量標(biāo)準(zhǔn) 度量(度量(S):定距):定距 (scale)以上尺度,包括定距和定比尺度以上尺度,包括定距和定比尺度,可以表示如溫度、重量等含義

24、的可以表示如溫度、重量等含義的連續(xù)性連續(xù)性數(shù)值變量數(shù)值變量,也可以表也可以表示年齡、次數(shù)等離散型變量示年齡、次數(shù)等離散型變量.還可以表示時間的日期變量或還可以表示時間的日期變量或者貨幣的貨幣型變量者貨幣的貨幣型變量,但不能是字符型變量但不能是字符型變量. 序號(序號(O):定序尺度):定序尺度(ordinal),其值表示一種順序的前后,其值表示一種順序的前后,如職稱變量可分為高中低三個檔次如職稱變量可分為高中低三個檔次,可用可用A(1)、B(2)、C(3)表示,定序型變量可以是數(shù)值型也可以字符型表示,定序型變量可以是數(shù)值型也可以字符型 名義名義(N):即定類尺度:即定類尺度(nominal)

25、,該變量不存在變量值之,該變量不存在變量值之間的大小、順序的前后等。只表示屬于的類別。如性別中間的大小、順序的前后等。只表示屬于的類別。如性別中“1”表示男,表示男,“2”表示女等表示女等,可以是數(shù)值型也可以字符型可以是數(shù)值型也可以字符型3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件 SPSS數(shù)據(jù)文件由數(shù)據(jù)數(shù)據(jù)文件由數(shù)據(jù)結(jié)構(gòu)結(jié)構(gòu)和數(shù)據(jù)和數(shù)據(jù)內(nèi)容內(nèi)容構(gòu)成,構(gòu)成, 結(jié)構(gòu)規(guī)定了數(shù)據(jù)文件的基本構(gòu)成屬性結(jié)構(gòu)規(guī)定了數(shù)據(jù)文件的基本構(gòu)成屬性 (變量名、變量類型、變量名標(biāo)簽、變量值變量名、變量類型、變量名標(biāo)簽、變量值標(biāo)簽、缺失值定義、度量尺度及數(shù)據(jù)顯示標(biāo)簽、缺失值定義、度量尺度及數(shù)據(jù)顯示屬性如寬度列寬度和對齊方式等屬性如寬

26、度列寬度和對齊方式等) 如一個班考試成績表包含姓名、考號、各科科目成績(英語、數(shù)如一個班考試成績表包含姓名、考號、各科科目成績(英語、數(shù)學(xué)、政治、專業(yè))等六個變量。對每一個變量定義其屬性,如學(xué)、政治、專業(yè))等六個變量。對每一個變量定義其屬性,如“姓名姓名”變量定義為字符型、寬度定義為變量定義為字符型、寬度定義為8個字符,度量尺度為定類型,由于個字符,度量尺度為定類型,由于變量含義清楚,無須定義變量標(biāo)簽和變量值標(biāo)簽,缺失值默認(rèn)為變量含義清楚,無須定義變量標(biāo)簽和變量值標(biāo)簽,缺失值默認(rèn)為03.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件1. 在在“變量視圖變量視圖”窗口定義變量及其變量的窗口定義變量及其變量的屬性

27、屬性2.在在“數(shù)據(jù)視圖數(shù)據(jù)視圖” 窗口錄入數(shù)據(jù)文件的內(nèi)容窗口錄入數(shù)據(jù)文件的內(nèi)容 瀏覽數(shù)據(jù)文件變量名的三種方法瀏覽數(shù)據(jù)文件變量名的三種方法 在在Variable View視區(qū)中瀏覽視區(qū)中瀏覽 在在SPSS菜單中選擇實用程序菜單中選擇實用程序Utilities Varibles 在在SPSS主界面選擇主界面選擇File Display Date File information3. 2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件 當(dāng)變量的屬性定義完成后就可以開始進(jìn)行當(dāng)變量的屬性定義完成后就可以開始進(jìn)行數(shù)據(jù)的輸入數(shù)據(jù)的輸入 切換窗口從切換窗口從Variables View Date View出出現(xiàn)了二維的空白表格如

28、現(xiàn)了二維的空白表格如Excel(見見03 Date1) Enter輸入一列相同參數(shù)輸入一列相同參數(shù) Tab 輸入一行同一案例的數(shù)據(jù)輸入一行同一案例的數(shù)據(jù)Shift+Tab光標(biāo)左移光標(biāo)左移 多項選擇題的變量定與編碼多項選擇題的變量定與編碼 不定項選擇:每個選項看作一個變量,選則編碼為不定項選擇:每個選項看作一個變量,選則編碼為1,不選則編碼為不選則編碼為0 定項選擇:限選幾項就定義幾個變量,編碼與單項定項選擇:限選幾項就定義幾個變量,編碼與單項選擇一樣選擇一樣 排序題:根據(jù)參與排序的選項數(shù)目定義變量個數(shù),排序題:根據(jù)參與排序的選項數(shù)目定義變量個數(shù),編碼與單項選擇一樣編碼與單項選擇一樣 開放式問題

29、的編碼:時候抽查部分問卷結(jié)果確定開放式問題的編碼:時候抽查部分問卷結(jié)果確定 缺失值編碼:沒有回答的問題,用研究者容易識別缺失值編碼:沒有回答的問題,用研究者容易識別的數(shù)字表示的數(shù)字表示SPSS數(shù)據(jù)的編輯 保證錄入的數(shù)據(jù)準(zhǔn)確無誤保證錄入的數(shù)據(jù)準(zhǔn)確無誤,需要對需要對SPSS數(shù)數(shù)據(jù)進(jìn)行修改、刪除、插入、復(fù)制、定位等據(jù)進(jìn)行修改、刪除、插入、復(fù)制、定位等操作。操作。3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件 缺失值的處理方法缺失值的處理方法:轉(zhuǎn)換:轉(zhuǎn)換替換缺失值替換缺失值 刪除法:刪除所有缺失值,但會減少樣本容量刪除法:刪除所有缺失值,但會減少樣本容量 插補法:在計算相關(guān)系數(shù)時,去掉這些位置上的插補法:在計算相

30、關(guān)系數(shù)時,去掉這些位置上的缺失數(shù)據(jù)上的點,以最可能的值來插補缺失值。缺失數(shù)據(jù)上的點,以最可能的值來插補缺失值。信息缺失少信息缺失少該變量的所有非缺失值的均數(shù)做替代用缺失值相鄰點的非缺失值的均數(shù)做替代用缺失值相鄰點的非缺失值的中位數(shù)做替代用該列數(shù)據(jù)缺失值前一個數(shù)據(jù)和后一個數(shù)據(jù)建立插值直線,然后用缺失點在線性插值函數(shù)的函數(shù)值填充該缺失值應(yīng)用缺失值所在的整個序列建立線性回歸方程,然后用該回歸方程在缺失點的預(yù)測值填充缺失值 例:對例:對“就業(yè)意愿就業(yè)意愿.Sav”數(shù)據(jù)中的工資缺失數(shù)據(jù)中的工資缺失值進(jìn)行替換值進(jìn)行替換 執(zhí)行如下操作,在數(shù)據(jù)窗口中會出現(xiàn)一個執(zhí)行如下操作,在數(shù)據(jù)窗口中會出現(xiàn)一個無缺失值的新變

31、量無缺失值的新變量選擇進(jìn)入缺失值分析的變量分析時按列表排除個案按配對的方式對缺失值進(jìn)行分析用Expectationt Maxiumum方法對缺失值進(jìn)行修補用線性回歸的方法對對缺失值進(jìn)行修補 缺失值的分析方法缺失值的分析方法:分析:分析缺失值分析缺失值分析3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件1. 直接通過直接通過SPSS數(shù)據(jù)編輯窗口定義變量輸數(shù)據(jù)編輯窗口定義變量輸入數(shù)據(jù)(如前所述)入數(shù)據(jù)(如前所述)2. 通過打開不同格式的數(shù)據(jù)文件,間接創(chuàng)建通過打開不同格式的數(shù)據(jù)文件,間接創(chuàng)建SPSS數(shù)據(jù)文件。數(shù)據(jù)文件。 支持支持*.doc,*.xls,*.txt等等保存SPSS數(shù)據(jù) 經(jīng)讀取、修改后把經(jīng)讀取、修改后

32、把SPSS窗口的數(shù)據(jù)以數(shù)據(jù)窗口的數(shù)據(jù)以數(shù)據(jù)文件的形式保存到外部的儲介質(zhì)中。文件的形式保存到外部的儲介質(zhì)中。3. 2創(chuàng)建和讀取SPSS數(shù)據(jù)文件3.3變量及數(shù)據(jù)顯示的相關(guān)設(shè)置變量及數(shù)據(jù)顯示的相關(guān)設(shè)置 編輯編輯選項選項3.3 變量顯示的相關(guān)設(shè)置變量顯示的相關(guān)設(shè)置在數(shù)據(jù)窗口在數(shù)據(jù)窗口及分析窗口及分析窗口順序顯示的順序顯示的規(guī)則規(guī)則角色設(shè)置:輸角色設(shè)置:輸入(自變量),入(自變量),輸出(因變輸出(因變量),分區(qū)量),分區(qū)(區(qū)分、檢驗、(區(qū)分、檢驗、驗證樣本,無驗證樣本,無(無角色分配)(無角色分配)設(shè)置單元格設(shè)置單元格的度量單位的度量單位程序運行結(jié)程序運行結(jié)果顯示方式果顯示方式設(shè)置輸出文設(shè)置輸出文字的

33、字體、字的字體、顏色、大小顏色、大小等等設(shè)置數(shù)據(jù)處設(shè)置數(shù)據(jù)處理過程的更理過程的更新方式、新新方式、新變量的顯示變量的顯示格式、隨機(jī)格式、隨機(jī)數(shù)的生成等數(shù)的生成等先掛起,先掛起,下次用到下次用到再計算,再計算,可加快速可加快速度度新的生成新的生成器器設(shè)置輸出結(jié)果中設(shè)置輸出結(jié)果中的標(biāo)簽選項(可的標(biāo)簽選項(可以方便的觀察個以方便的觀察個變量的實際意義)變量的實際意義)設(shè)置輸出窗口設(shè)置輸出窗口的圖形默認(rèn)參的圖形默認(rèn)參數(shù):比例、邊數(shù):比例、邊框、線形、顏框、線形、顏色、填充方式色、填充方式等等指定新輸出圖指定新輸出圖表的填充方式表的填充方式圖表邊框圖表邊框設(shè)置設(shè)置即:要點表,即:要點表,能方便地改變能方

34、便地改變表格行、列的表格行、列的交叉顯示方式交叉顯示方式設(shè)置樞紐表的設(shè)置樞紐表的顯示風(fēng)格、調(diào)顯示風(fēng)格、調(diào)整列款方式和整列款方式和編輯模式等編輯模式等最近使用的文件列表,最近使用的文件列表,在文件下拉菜單在文件下拉菜單最近使用的文件的顯最近使用的文件的顯示數(shù)量示數(shù)量為缺失值的標(biāo)記和生為缺失值的標(biāo)記和生成可能的數(shù)值進(jìn)行設(shè)成可能的數(shù)值進(jìn)行設(shè)定定4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.1 個案標(biāo)識個案標(biāo)識4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.1 個案標(biāo)識個案標(biāo)識 數(shù)據(jù)檢查

35、,識別無效個案、變量或數(shù)值,并采取數(shù)據(jù)檢查,識別無效個案、變量或數(shù)值,并采取糾偏措施,標(biāo)識出異常個案糾偏措施,標(biāo)識出異常個案 (1)數(shù)據(jù)驗證:)數(shù)據(jù)驗證:數(shù)據(jù)數(shù)據(jù)驗證驗證驗證數(shù)據(jù)驗證數(shù)據(jù) 首先要定義驗證規(guī)則首先要定義驗證規(guī)則 單變量規(guī)則:對單一變量的特定檢查(單變量規(guī)則:對單一變量的特定檢查(SPSS提提供了一些單變量驗證規(guī)則)供了一些單變量驗證規(guī)則) 交叉變量規(guī)則:變量之間關(guān)系,邏輯表達(dá)式交叉變量規(guī)則:變量之間關(guān)系,邏輯表達(dá)式 操作:操作: (2)標(biāo)識重復(fù)個案:)標(biāo)識重復(fù)個案:數(shù)據(jù)數(shù)據(jù)標(biāo)識重復(fù)個案標(biāo)識重復(fù)個案 (3)標(biāo)識異常個案:)標(biāo)識異常個案:數(shù)據(jù)數(shù)據(jù)標(biāo)識異常個案標(biāo)識異常個案4. SPSS

36、數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.2 個案排序:個案排序:數(shù)據(jù)數(shù)據(jù)排序個案排序個案 按照某個變量進(jìn)行排序:于數(shù)據(jù)的瀏覽,有助于了按照某個變量進(jìn)行排序:于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量的多少等;快捷的解數(shù)據(jù)的取值狀況、缺失值數(shù)量的多少等;快捷的找到數(shù)據(jù)的最值,進(jìn)而可計算數(shù)據(jù)的全距,初步把找到數(shù)據(jù)的最值,進(jìn)而可計算數(shù)據(jù)的全距,初步把握離散程度;發(fā)現(xiàn)數(shù)據(jù)的異常值等。握離散程度;發(fā)現(xiàn)數(shù)據(jù)的異常值等。 舉例:將舉例:將“休閑調(diào)查休閑調(diào)查”數(shù)據(jù)文件按照數(shù)據(jù)文件按照“年齡年齡”和和“住房住房面積面積”兩個變量重新排序。兩個變量重新排序。 應(yīng)用舉例:應(yīng)用舉例: 200

37、5GDP2005GDP. .savsav列出了列出了20052005年我國部分省份的地區(qū)年我國部分省份的地區(qū)生產(chǎn)總值及第一產(chǎn)業(yè)、第二產(chǎn)業(yè)和第三產(chǎn)業(yè)的生產(chǎn)總值,請生產(chǎn)總值及第一產(chǎn)業(yè)、第二產(chǎn)業(yè)和第三產(chǎn)業(yè)的生產(chǎn)總值,請根據(jù)這些數(shù)據(jù)分析不同省份經(jīng)濟(jì)發(fā)展?fàn)顩r的差異性。根據(jù)這些數(shù)據(jù)分析不同省份經(jīng)濟(jì)發(fā)展?fàn)顩r的差異性。 4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.3 變量排列:變量排列:數(shù)據(jù)數(shù)據(jù)排列變量排列變量 操作與個案排序相似操作與個案排序相似選擇之后可以形成一個新變量,用于恢復(fù)原來的變量排序4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.4 數(shù)據(jù)文件的

38、轉(zhuǎn)置:數(shù)據(jù)文件的轉(zhuǎn)置:數(shù)據(jù)數(shù)據(jù)轉(zhuǎn)置轉(zhuǎn)置u對社會調(diào)查結(jié)果的分析,有時既需要對變量對社會調(diào)查結(jié)果的分析,有時既需要對變量進(jìn)行分析,也需要對個案進(jìn)行分析。進(jìn)行分析,也需要對個案進(jìn)行分析。SPSS主主要是針對變量進(jìn)行分析的,而需要對個案進(jìn)行要是針對變量進(jìn)行分析的,而需要對個案進(jìn)行分析時,需要先把個案轉(zhuǎn)變成變量。分析時,需要先把個案轉(zhuǎn)變成變量。u轉(zhuǎn)置之后會形成一個新的數(shù)據(jù)文件轉(zhuǎn)置之后會形成一個新的數(shù)據(jù)文件u例:對數(shù)據(jù)文件例:對數(shù)據(jù)文件“休閑調(diào)查休閑調(diào)查1”中的中的“滿意度滿意度1”、至、至“滿意度滿意度7”、進(jìn)行轉(zhuǎn)置。、進(jìn)行轉(zhuǎn)置。名稱變量:可以使數(shù)據(jù)文件中的序號變量,也可以使在每個個案上取值都是名稱變量

39、:可以使數(shù)據(jù)文件中的序號變量,也可以使在每個個案上取值都是唯一的變量。在轉(zhuǎn)置后的文件中,名稱變量的值稱為新變量的變量名。唯一的變量。在轉(zhuǎn)置后的文件中,名稱變量的值稱為新變量的變量名。4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.5 合并文件:合并文件:數(shù)據(jù)數(shù)據(jù)合并文件合并文件u添加個案:即觀測量合并,添加個案:即觀測量合并,將兩個文件的個案合并將兩個文件的個案合并在一起,具體事把外部文件的與當(dāng)前工作文件具有在一起,具體事把外部文件的與當(dāng)前工作文件具有相同變量的觀測量添加到當(dāng)前工作文件中相同變量的觀測量添加到當(dāng)前工作文件中u添加變量:添加變量:將兩個文件的變量合并在一起

40、將兩個文件的變量合并在一起n直接合并:直接合并:n按關(guān)鍵變量合并:按關(guān)鍵變量合并:注意:按某一關(guān)鍵變量進(jìn)行合并,需要先對兩個數(shù)注意:按某一關(guān)鍵變量進(jìn)行合并,需要先對兩個數(shù)據(jù)文件按照該關(guān)鍵變量進(jìn)行升序排序據(jù)文件按照該關(guān)鍵變量進(jìn)行升序排序4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.5合并合并 文件:文件:數(shù)據(jù)數(shù)據(jù)合并文件合并文件 例例1 1:將:將“休閑調(diào)查休閑調(diào)查1”1”和和 “ “休閑調(diào)查休閑調(diào)查2”2”中的個案中的個案合并,合并過程中對不匹配的變量要作出處理(進(jìn)合并,合并過程中對不匹配的變量要作出處理(進(jìn)入新變量入新變量oror不進(jìn)入)不進(jìn)入) 例例2 2:已知:

41、已知固定投資固定投資1.sav1.sav、固定投資固定投資2.sav2.sav和和固定投固定投資資3.sav3.sav中的數(shù)據(jù)是部分省市在中的數(shù)據(jù)是部分省市在20052005年部分行業(yè)的固年部分行業(yè)的固定投資額(億元)數(shù)據(jù),分別執(zhí)行個案合并(定投資額(億元)數(shù)據(jù),分別執(zhí)行個案合并( 固定固定投資投資1.sav+1.sav+固定投資固定投資2.sav2.sav,省份不同但行業(yè)類型相,省份不同但行業(yè)類型相同)和變量合并(同)和變量合并( 固定投資固定投資1.sav1.sav、固定投資固定投資3.sav3.sav,省份相同但行業(yè)類型不同省份相同但行業(yè)類型不同 )。)。非成對變量即兩個數(shù)據(jù)非成對變量即

42、兩個數(shù)據(jù)文件不匹配的變量,兩文件不匹配的變量,兩個文件中變量名不相同個文件中變量名不相同的變量,或者變量名雖的變量,或者變量名雖相同但變量定義不同的相同但變量定義不同的變量。變量。選中則生成一個新的變量,選中則生成一個新的變量,用于表明每個個案的來源:用于表明每個個案的來源:是來自當(dāng)前文件還是外部是來自當(dāng)前文件還是外部文件文件已排除的變量:兩文件已排除的變量:兩文件中的同名變量中的同名變量關(guān)鍵變量:兩文件中的相關(guān)鍵變量:兩文件中的相同變量(變量名、變量類同變量(變量名、變量類型、變量值排序完全相同)型、變量值排序完全相同)4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.

43、64.6分割文件:數(shù)據(jù)分割文件:數(shù)據(jù)拆分文件拆分文件 (為了后繼分析)(為了后繼分析)u兩種分割形式:兩種分割形式:n比較組:分割之后,進(jìn)行其它分析,輸出分析結(jié)比較組:分割之后,進(jìn)行其它分析,輸出分析結(jié)果時,果時,各組分析結(jié)果放在同一表格中各組分析結(jié)果放在同一表格中,可對比,可對比n按組織輸出:分割之后,進(jìn)行其它分析,輸出分按組織輸出:分割之后,進(jìn)行其它分析,輸出分析結(jié)果時,析結(jié)果時,單獨顯示每一分組的分析結(jié)果單獨顯示每一分組的分析結(jié)果u 舉例:將舉例:將“職工工資職工工資.sav.sav”數(shù)據(jù)數(shù)據(jù)按按“行業(yè)類型行業(yè)類型”變量進(jìn)行分割,并分別統(tǒng)計不同組的平均值變量進(jìn)行分割,并分別統(tǒng)計不同組的平

44、均值u將將“休閑調(diào)查休閑調(diào)查1.sav”1.sav”數(shù)據(jù)數(shù)據(jù)按按“性別性別”變量進(jìn)行分割變量進(jìn)行分割可以選擇多個變量進(jìn)入可以選擇多個變量進(jìn)入4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.7數(shù)據(jù)重組:數(shù)據(jù)重組:數(shù)據(jù)數(shù)據(jù)重組重組 分析數(shù)據(jù)時,常常需要分析變量隨著某分析數(shù)據(jù)時,常常需要分析變量隨著某個條件如何變化,而在數(shù)據(jù)文件中關(guān)于個條件如何變化,而在數(shù)據(jù)文件中關(guān)于變量的信息可能位于多個列中,關(guān)于個變量的信息可能位于多個列中,關(guān)于個案的信息可能位于多個行中。如果分析案的信息可能位于多個行中。如果分析所需要的數(shù)據(jù)結(jié)構(gòu)與當(dāng)前的數(shù)據(jù)文件中所需要的數(shù)據(jù)結(jié)構(gòu)與當(dāng)前的數(shù)據(jù)文件中的結(jié)構(gòu)不

45、符合,則就需進(jìn)行重組來變換的結(jié)構(gòu)不符合,則就需進(jìn)行重組來變換數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)結(jié)構(gòu)。4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u 4.7數(shù)據(jù)重組:數(shù)據(jù)重組:數(shù)據(jù)數(shù)據(jù)重組重組個案組結(jié)構(gòu):變量與因子記錄在單獨的列中,一個因子的每個水個案組結(jié)構(gòu):變量與因子記錄在單獨的列中,一個因子的每個水平占一行或不止一行,一個因子的若干水平稱為一個個案組。在平占一行或不止一行,一個因子的若干水平稱為一個個案組。在SPSSSPSS數(shù)據(jù)分析中,當(dāng)數(shù)據(jù)以這種方式構(gòu)造時,因子通常稱為分組數(shù)據(jù)分析中,當(dāng)數(shù)據(jù)以這種方式構(gòu)造時,因子通常稱為分組變量。(變量。(單因素方差分析、多因素方差分析、獨立樣本體檢驗等

46、單因素方差分析、多因素方差分析、獨立樣本體檢驗等)變量組結(jié)構(gòu):變量與因子記錄在同一列中,一個因子的每個水平變量組結(jié)構(gòu):變量與因子記錄在同一列中,一個因子的每個水平占一列,一個因素的若干列稱為一個變量組。在占一列,一個因素的若干列稱為一個變量組。在SPSSSPSS數(shù)據(jù)分析中,數(shù)據(jù)分析中,當(dāng)數(shù)據(jù)以這種方式構(gòu)造時,因子通常稱為重復(fù)度量。(重復(fù)測量當(dāng)數(shù)據(jù)以這種方式構(gòu)造時,因子通常稱為重復(fù)度量。(重復(fù)測量的方差分析、協(xié)方差分析、配對樣本的方差分析、協(xié)方差分析、配對樣本T T檢驗)檢驗)肥肥料料的的不不同同水水平平高高度度的的不不同同水水平平變量或因素變量或因素4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)

47、的預(yù)處理:一些基本操作 以文件以文件“西紅柿西紅柿.sav”為例為例 數(shù)據(jù)數(shù)據(jù)重組重組選擇選擇“將個案將個案重組為變量重組為變量”肥肥料料的的不不同同水水平平高高度度的的不不同同水水平平變量或因素變量或因素 選擇個案組的標(biāo)識符變量或索引變量選擇個案組的標(biāo)識符變量或索引變量用于標(biāo)識個案組的用于標(biāo)識個案組的變量,以便能將每變量,以便能將每個組合并到新文件個組合并到新文件的單獨一行中的單獨一行中用于組成新變量組的變量用于組成新變量組的變量 選擇是否對當(dāng)前數(shù)據(jù)進(jìn)行排序。系統(tǒng)根據(jù)上一步選擇選擇是否對當(dāng)前數(shù)據(jù)進(jìn)行排序。系統(tǒng)根據(jù)上一步選擇的標(biāo)識符變量,每次遇到標(biāo)識值的新組合時,將創(chuàng)建一個的標(biāo)識符變量,每次遇

48、到標(biāo)識值的新組合時,將創(chuàng)建一個新行,因此當(dāng)前文件的個案應(yīng)按標(biāo)識符變量的值排序,順新行,因此當(dāng)前文件的個案應(yīng)按標(biāo)識符變量的值排序,順序與序與“標(biāo)識符變量標(biāo)識符變量”列表中列出變量的順序相同。列表中列出變量的順序相同。 選擇:是選擇:是 下一步下一步 設(shè)置應(yīng)用于重組數(shù)設(shè)置應(yīng)用于重組數(shù)據(jù)文件的選項據(jù)文件的選項用于表明觀測的一個值是用于表明觀測的一個值是出現(xiàn)(出現(xiàn)(1)還是缺失()還是缺失(2)用于在心數(shù)據(jù)文件中創(chuàng)建行的用于在心數(shù)據(jù)文件中創(chuàng)建行的當(dāng)前數(shù)據(jù)中的行數(shù)當(dāng)前數(shù)據(jù)中的行數(shù) 完成操作完成操作 還可以反過來操作,還可以反過來操作,把變量組結(jié)構(gòu)轉(zhuǎn)換把變量組結(jié)構(gòu)轉(zhuǎn)換為個案組結(jié)構(gòu)。不為個案組結(jié)構(gòu)。不再講解

49、!再講解!用于表明觀測的一個值是用于表明觀測的一個值是出現(xiàn)(出現(xiàn)(1)還是缺失()還是缺失(2)用于在心數(shù)據(jù)文件中創(chuàng)建行的用于在心數(shù)據(jù)文件中創(chuàng)建行的當(dāng)前數(shù)據(jù)中的行數(shù)當(dāng)前數(shù)據(jù)中的行數(shù)4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.8 分類匯總:分類匯總:數(shù)據(jù)數(shù)據(jù)分類匯總分類匯總u 以指定分類變量的取值為依據(jù),將另一個或多個變量按照以指定分類變量的取值為依據(jù),將另一個或多個變量按照分類的結(jié)果進(jìn)行統(tǒng)計,并將統(tǒng)計結(jié)果生成新的數(shù)據(jù)文件分類的結(jié)果進(jìn)行統(tǒng)計,并將統(tǒng)計結(jié)果生成新的數(shù)據(jù)文件u 分類變量分類變量必須為必須為定序變量或定類變量定序變量或定類變量u 匯總變量匯總變量必須為必須為

50、定序及以上的數(shù)值型變量定序及以上的數(shù)值型變量u 例:對例:對“考試成績考試成績”中的各門課程按照中的各門課程按照“班級號班級號”分類,分類,以各科成績的平均值為內(nèi)容進(jìn)行分類匯總以各科成績的平均值為內(nèi)容進(jìn)行分類匯總u 將將“班級號班級號”進(jìn)入到進(jìn)入到“分組變量分組變量”中,將五門課程進(jìn)入中,將五門課程進(jìn)入到到“匯總變量匯總變量”中,此時激活下面的兩個按鈕:中,此時激活下面的兩個按鈕:“函數(shù)函數(shù)”,“變量名和標(biāo)簽變量名和標(biāo)簽”,這兩個按鈕就是要輸出的匯總變量的描,這兩個按鈕就是要輸出的匯總變量的描述統(tǒng)計內(nèi)容。述統(tǒng)計內(nèi)容。u 選定選定“個案數(shù)個案數(shù)”,命名文件,然后選擇存放地址,命名文件,然后選擇存

51、放地址決定了按照什么量合并4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.9 選擇個案選擇個案/數(shù)據(jù):數(shù)據(jù)篩選,選出符數(shù)據(jù):數(shù)據(jù)篩選,選出符合需要的數(shù)據(jù),分析時只對這些數(shù)據(jù)進(jìn)合需要的數(shù)據(jù),分析時只對這些數(shù)據(jù)進(jìn)行分析。行分析。數(shù)據(jù)數(shù)據(jù)選擇個案選擇個案u 舉例:在舉例:在“休閑調(diào)查休閑調(diào)查1”中選擇年齡中選擇年齡50歲以上的個案歲以上的個案 ;從前;從前100個個案中隨機(jī)個個案中隨機(jī)選擇選擇30個個案;選擇第個個案;選擇第3到第到第6個個案;個個案;選擇文化程度為過濾變量選擇文化程度為過濾變量 在該變量中有在該變量中有缺失值的個案缺失值的個案將被過濾掉將被過濾掉4. SPS

52、S數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作u4.10 數(shù)據(jù)加權(quán):數(shù)據(jù)加權(quán):數(shù)據(jù)數(shù)據(jù)加權(quán)個案加權(quán)個案u 加權(quán)操作對于列聯(lián)表分析非常重要,在繪加權(quán)操作對于列聯(lián)表分析非常重要,在繪制散點圖、直方圖以及回歸分析等過程中都制散點圖、直方圖以及回歸分析等過程中都非常重要。非常重要。u某經(jīng)銷商希望掌握菜市場的蔬菜銷售的平均價格,某經(jīng)銷商希望掌握菜市場的蔬菜銷售的平均價格,收集數(shù)據(jù)見數(shù)據(jù)文件收集數(shù)據(jù)見數(shù)據(jù)文件“蔬菜銷售蔬菜銷售.sav”?,F(xiàn)請利用這。現(xiàn)請利用這些數(shù)據(jù),求出這些蔬菜的平均價格。些數(shù)據(jù),求出這些蔬菜的平均價格。 分析:由于經(jīng)銷商要求掌握蔬菜的平均價格,如果僅僅只分析:由于經(jīng)銷商要求掌握

53、蔬菜的平均價格,如果僅僅只用蔬菜的單價進(jìn)行簡單的算術(shù)平均是很不合理的,這是因用蔬菜的單價進(jìn)行簡單的算術(shù)平均是很不合理的,這是因為不同蔬菜的銷售量不同,所以要考慮銷售量對平均價格為不同蔬菜的銷售量不同,所以要考慮銷售量對平均價格的影響。因此,我們以蔬菜的銷售量為權(quán)重計算各種蔬菜的影響。因此,我們以蔬菜的銷售量為權(quán)重計算各種蔬菜銷售的平均價格更為合適。銷售的平均價格更為合適。 這里選擇這里選擇“銷售量銷售量”變量作為權(quán)重變量,將其放入頻率變量作為權(quán)重變量,將其放入頻率變量列表框中,此時就可以進(jìn)行后續(xù)的求平均值工作了。變量列表框中,此時就可以進(jìn)行后續(xù)的求平均值工作了。4. SPSS數(shù)據(jù)的預(yù)處理:一些

54、基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.11 SPSS運算符與函數(shù)運算符與函數(shù)4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.11 4.11 變量計算:轉(zhuǎn)換變量計算:轉(zhuǎn)換計算變量計算變量 目的:目的:產(chǎn)生新變量,例如根據(jù)職工的基本工資、失業(yè)保產(chǎn)生新變量,例如根據(jù)職工的基本工資、失業(yè)保險、獎金等數(shù)據(jù),計算實際月收入;險、獎金等數(shù)據(jù),計算實際月收入;對原變量進(jìn)行必要對原變量進(jìn)行必要的轉(zhuǎn)換處理(尤其是對數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換),的轉(zhuǎn)換處理(尤其是對數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換),由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)的分布有一定的要由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)的分布有一定

55、的要求,因此可以利用變量計算對原有數(shù)據(jù)的分布進(jìn)行轉(zhuǎn)換。求,因此可以利用變量計算對原有數(shù)據(jù)的分布進(jìn)行轉(zhuǎn)換。如預(yù)測問題、產(chǎn)生比率數(shù)據(jù)、偏態(tài)數(shù)據(jù)的正態(tài)處理、時間如預(yù)測問題、產(chǎn)生比率數(shù)據(jù)、偏態(tài)數(shù)據(jù)的正態(tài)處理、時間序列的平穩(wěn)處理等。序列的平穩(wěn)處理等。 包括變量的重置和計算包括變量的重置和計算4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.11 4.11 變量計算:變量計算:轉(zhuǎn)換轉(zhuǎn)換計算變量計算變量 (1 1)變量的重置:)變量的重置: 例:例:“貧困調(diào)查貧困調(diào)查”數(shù)據(jù)是數(shù)據(jù)是20062006年在哈爾濱和沈陽進(jìn)行的,當(dāng)時年在哈爾濱和沈陽進(jìn)行的,當(dāng)時詢問的是被調(diào)查者的出生年份,現(xiàn)將該

56、變量的內(nèi)容重置為年齡。詢問的是被調(diào)查者的出生年份,現(xiàn)將該變量的內(nèi)容重置為年齡。 解:定義年齡變量,年齡解:定義年齡變量,年齡=2006-=2006-出生年份,輸入出生年份,輸入“數(shù)字表達(dá)式數(shù)字表達(dá)式”內(nèi),確定即可內(nèi),確定即可 例:在上例數(shù)據(jù)中,將來自哈爾濱的個案的問卷編號前加例:在上例數(shù)據(jù)中,將來自哈爾濱的個案的問卷編號前加1 1,來,來自沈陽的個案問卷編號前加自沈陽的個案問卷編號前加2 2。 解:單擊對話框中的解:單擊對話框中的ifif按鈕,選擇按鈕,選擇”如果個案滿足條件則包如果個案滿足條件則包括括”,輸入,輸入“所在城市所在城市=1”=1”,繼續(xù),回到原對話框,在,繼續(xù),回到原對話框,在

57、“數(shù)字?jǐn)?shù)字表達(dá)式表達(dá)式”中輸入:問卷編號中輸入:問卷編號+1000+1000。同理,沈陽的也如此操作。同理,沈陽的也如此操作。4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.11 4.11 變量計算:轉(zhuǎn)換變量計算:轉(zhuǎn)換計算變量計算變量 (2 2)新變量的生成:)新變量的生成: 例:例: “貧困調(diào)查貧困調(diào)查”數(shù)據(jù)中的數(shù)據(jù)中的“糧油糧油”、“副食副食”、“水果水果”三個三個變量是貧困家庭的食品總支出,變量變量是貧困家庭的食品總支出,變量“總總支出支出”是貧困家庭一個月所有支出之和,計算貧困家庭的是貧困家庭一個月所有支出之和,計算貧困家庭的恩格爾系數(shù)。恩格爾系數(shù)。 解:恩格爾

58、系數(shù)解:恩格爾系數(shù)= =食品總支出食品總支出/ /總支出總支出 =(=(糧油糧油 + + 副食副食 + + 水果水果) / ) / 月支出月支出4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作數(shù)據(jù)的預(yù)處理:一些基本操作 4.12 4.12 計數(shù)過程:轉(zhuǎn)換計數(shù)過程:轉(zhuǎn)換對個案內(nèi)的值計數(shù)對個案內(nèi)的值計數(shù) 計算一些變量在同一個觀測量中滿足要求的特定變量計算一些變量在同一個觀測量中滿足要求的特定變量值出現(xiàn)的次數(shù)。例如:在產(chǎn)品市場調(diào)查中,要了解被值出現(xiàn)的次數(shù)。例如:在產(chǎn)品市場調(diào)查中,要了解被調(diào)查者中有多少人使用過該產(chǎn)品。調(diào)查者中有多少人使用過該產(chǎn)品。 例:利用我國城鄉(xiāng)消費價格分類指數(shù)數(shù)據(jù)(數(shù)據(jù)文件例:利用我國城鄉(xiāng)消費價格分類指數(shù)數(shù)據(jù)(數(shù)據(jù)文件“消費價格指數(shù)消費價格指數(shù).sav.sav”),請找出城市和農(nóng)村居民消),請找出城市和農(nóng)村居民消費價格指數(shù)費價格指數(shù)都都較去年上漲超

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論