spss第四章數(shù)據(jù)文件的操作與變換

上傳人：q*** IP屬地：湖北上傳時間：2022-07-04 格式：PPT 頁數(shù)：60 大小：3.31MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩55頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章數(shù)據(jù)文件操作與變換41 定義時間系列日期型變量定義時間系列日期型變量數(shù)據(jù)定義日期說明： 1、執(zhí)行后，在數(shù)據(jù)窗口中為每個時間單位對應(yīng)一個新的數(shù)值變量，變量名后帶 “_”，如 YEAR_ , DAY_ , MONTH_ 等。最后還附加了一個具有描述意義的字符變量DATE_。 2、如果在這之前已經(jīng)定義了一組時間系列變量，則新建立的變量將全部替代原有的時間系列。 3、若選擇Cases Are 框中的 Not dated，則刪除以前定義過的所有時間系列變量。4.2 排序個案排序個案數(shù)據(jù)排序個案說明： 1、排序變量可以是一個，也可以是多個。若為多個排序變量，則首先按第一個變量進(jìn)行排序，在第一個

2、排序變量的值相同時，再按第二個排序變量排序，依次類推。 2、排序方式有兩種：升序或降序。4.3 數(shù)據(jù)文件轉(zhuǎn)置變換數(shù)據(jù)文件轉(zhuǎn)置變換數(shù)據(jù)數(shù)據(jù) 變換變換說明： 1、轉(zhuǎn)置后形成一個新的數(shù)據(jù)文件，應(yīng)該保存為另一個文件名。 2、如果未將全部變量移入Variables框中，則轉(zhuǎn)置后的數(shù)據(jù)文件中會將未選擇變量的值全部丟失。 3、轉(zhuǎn)置后生成的新變量均為數(shù)值型，所以非數(shù)值型變量一般不進(jìn)行轉(zhuǎn)置。 4、轉(zhuǎn)置后生成一個新變量case_lbl, 用來存放進(jìn)行轉(zhuǎn)置的原變量名。 5、命名變量無：系統(tǒng)會自動給轉(zhuǎn)置后的新變量賦予var001 ,var002, var003 。有：以命名變量的值為基礎(chǔ)，對轉(zhuǎn)置后的新變量進(jìn)行命

3、名。 k+命名變量的值+1,2,3.或A、B、C.4.4 數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并合并數(shù)據(jù)文件有兩種方式： 1、增加觀測量 2、增加變量一、增加觀測量a.sav b.sav說明：（1）不配對合并：保留兩個數(shù)據(jù)文件中的配對變量，同時將未配對變量加入合并后的數(shù)據(jù)文件中。（2）配對合并：兩個文件中的各一個變量，其含義相同，類型也相同，但變量名不同。通過配對合并可將這兩個變量合成一個變量，其變量名仍然以工作數(shù)據(jù)文件中的變量名顯示。注意：配對合并時，兩個變量一定要具有相同的變量類型，寬度不一定相同，但當(dāng)前工作數(shù)據(jù)文件中的變量寬度應(yīng)大于或等于外部數(shù)據(jù)文件中的變量的寬度，否則合并后外部文件的觀

4、測量中相應(yīng)變量值無法顯示。（3）合并的同時可剔除變量（4）為變量改名：未配對變量框中的變量可改名。（5）可生成表明觀測量來源的新變量：選中將個案源表示為變量.4.5 分類匯總分類匯總一、分類匯總的概念分類匯總就是按分類變量的不同取值對觀測量進(jìn)行分組，對每組觀測量求描述統(tǒng)計量，生成新數(shù)據(jù)文件。在新數(shù)據(jù)文件中對應(yīng)分類變量的每一個值產(chǎn)生一個觀測量。(qxn.sav)若選擇年齡作為分類變量，身高、體重作為匯總變量，函數(shù)選擇為平均值，則分類匯總生成的數(shù)據(jù)文件如下：若選擇年齡、性別為分類變量，身高、體重作為匯總變量，函數(shù)選擇為平均值，則分類匯總生成的數(shù)據(jù)文件如下：二、分類匯總的方法1從主菜單中單擊

5、 “數(shù)據(jù)”展開下拉菜單，選擇 “匯總”，彈出“匯總數(shù)據(jù)”對話框。 2在左側(cè)的源變量框中選擇一個或多個變量作為分類變量進(jìn)入 “分組變量”框中。 3、在左側(cè)的源變量框中選擇一個或多個變量作為匯總變量進(jìn)入 “變量摘要”框中，即要求對這些變量的值進(jìn)行分類匯總。 4名稱與標(biāo)簽：單擊此按鈕可以修改分類匯總生成的新變量的名稱及標(biāo)簽。如果不選擇該選項，則系統(tǒng)自動給每個新變量賦予一個默認(rèn)的變量名：在原始變量名后面加下劃線和匯總函數(shù)名。 5函數(shù)：確定匯總變量的描述項。系統(tǒng)的默認(rèn)函數(shù)為平均值。單擊該按鈕，彈出“匯總數(shù)據(jù)：匯總函數(shù)”對話框：6 個案數(shù)：選擇此項，將源變量分組中的觀測量數(shù)目作為一個新個案數(shù)：選擇此項，

6、將源變量分組中的觀測量數(shù)目作為一個新變量保存在生成的數(shù)據(jù)文件中。在右邊的框中輸入您為該變量取的變量保存在生成的數(shù)據(jù)文件中。在右邊的框中輸入您為該變量取的變量名，也可以保留使用系統(tǒng)指定的默認(rèn)變量名。變量名，也可以保留使用系統(tǒng)指定的默認(rèn)變量名。 7關(guān)于新數(shù)據(jù)文件的存儲方式關(guān)于新數(shù)據(jù)文件的存儲方式（1）將分類匯總產(chǎn)生的新數(shù)據(jù)放在當(dāng)前文件中將分類匯總產(chǎn)生的新數(shù)據(jù)放在當(dāng)前文件中 (2) 將分類匯總產(chǎn)生的新數(shù)據(jù)以新的數(shù)據(jù)集顯示將分類匯總產(chǎn)生的新數(shù)據(jù)以新的數(shù)據(jù)集顯示 (3) 將分類匯總產(chǎn)生的新數(shù)據(jù)以新的文件名保存。將分類匯總產(chǎn)生的新數(shù)據(jù)以新的文件名保存。 8單擊單擊“確定確定”執(zhí)行分類匯總功能。執(zhí)行分類

7、匯總功能。4.6 拆分?jǐn)?shù)據(jù)文件拆分?jǐn)?shù)據(jù)文件數(shù)據(jù)數(shù)據(jù)拆分文件拆分文件4.7 選擇觀測量選擇觀測量數(shù)據(jù)選擇個案4.8 對觀測量作加權(quán)處理對觀測量作加權(quán)處理采集數(shù)據(jù)時，若相同觀測量（觀測量的各變量值均相同）出現(xiàn)采集數(shù)據(jù)時，若相同觀測量（觀測量的各變量值均相同）出現(xiàn)多次，通過設(shè)置一個頻數(shù)變量，可以使具有相同變量值的觀測量在多次，通過設(shè)置一個頻數(shù)變量，可以使具有相同變量值的觀測量在數(shù)據(jù)表中只出現(xiàn)一次。數(shù)據(jù)表中只出現(xiàn)一次。但是，在進(jìn)行統(tǒng)計分析時，為了原始數(shù)據(jù)的真實情況，必須對觀但是，在進(jìn)行統(tǒng)計分析時，為了原始數(shù)據(jù)的真實情況，必須對觀測量作加權(quán)處理。例如，如下圖所示的數(shù)據(jù)文件中，變量測量作加權(quán)處理。

8、例如，如下圖所示的數(shù)據(jù)文件中，變量“頻數(shù)頻數(shù)”中記錄的是相同觀測量出現(xiàn)的次數(shù)。若不作加權(quán)處理，則在統(tǒng)計分中記錄的是相同觀測量出現(xiàn)的次數(shù)。若不作加權(quán)處理，則在統(tǒng)計分析時將析時將“頻數(shù)頻數(shù)”當(dāng)作一個普通的變量看待，數(shù)據(jù)文件中的觀測量數(shù)當(dāng)作一個普通的變量看待，數(shù)據(jù)文件中的觀測量數(shù)總共被認(rèn)為是總共被認(rèn)為是5個。個。(qz.sav)可按下列步驟對數(shù)據(jù)文件作加權(quán)處理：可按下列步驟對數(shù)據(jù)文件作加權(quán)處理： 1在主菜單中單擊在主菜單中單擊 “數(shù)據(jù)數(shù)據(jù)”，展開下拉菜單，從下拉菜單中選擇，展開下拉菜單，從下拉菜單中選擇 “加權(quán)個案加權(quán)個案”選項，彈出對觀測量作加權(quán)處理的對話框。選項，彈出對觀測量作加權(quán)處理的對話框。

9、2選擇對觀測量作加權(quán)處理的方式。選擇對觀測量作加權(quán)處理的方式。請勿對個案加權(quán)：對數(shù)據(jù)文件不作加權(quán)處理。這是系統(tǒng)默認(rèn)狀請勿對個案加權(quán)：對數(shù)據(jù)文件不作加權(quán)處理。這是系統(tǒng)默認(rèn)狀態(tài)。態(tài)。加權(quán)個案：選擇此項表示要求作加權(quán)處理。加權(quán)個案：選擇此項表示要求作加權(quán)處理。3當(dāng)在上一步中選擇了當(dāng)在上一步中選擇了“加權(quán)個案加權(quán)個案”選項后。從左邊源變量列表選項后。從左邊源變量列表框中選擇一個作為權(quán)變量的變量名，單擊向右箭頭按鈕，送入框中選擇一個作為權(quán)變量的變量名，單擊向右箭頭按鈕，送入“頻頻率變量率變量”下面的矩形框中。在此我們選擇變量名下面的矩形框中。在此我們選擇變量名“頻數(shù)頻數(shù)”作為加權(quán)作為加權(quán)變量。變量。

10、 4單擊單擊“確定確定”，執(zhí)行觀測量加權(quán)。，執(zhí)行觀測量加權(quán)。在執(zhí)行加權(quán)處理后，從表面上看，數(shù)據(jù)文件沒有發(fā)生任何變化，在執(zhí)行加權(quán)處理后，從表面上看，數(shù)據(jù)文件沒有發(fā)生任何變化，但是在隨后進(jìn)行統(tǒng)計分析時，會將頻數(shù)變量的值重復(fù)計入到觀測量但是在隨后進(jìn)行統(tǒng)計分析時，會將頻數(shù)變量的值重復(fù)計入到觀測量出現(xiàn)的次數(shù)中。出現(xiàn)的次數(shù)中。 4.9 對個案內(nèi)的值計數(shù)對個案內(nèi)的值計數(shù) 有時候，我們要對某些變量值有時候，我們要對某些變量值出現(xiàn)在一個觀測量中出現(xiàn)在一個觀測量中的次數(shù)進(jìn)的次數(shù)進(jìn)行統(tǒng)計，例如，下圖所示是對讀者作的關(guān)于平時經(jīng)常閱讀的雜志種類的問行統(tǒng)計，例如，下圖所示是對讀者作的關(guān)于平時經(jīng)常閱讀的雜志種類的問卷調(diào)查

11、數(shù)據(jù)，其中回答卷調(diào)查數(shù)據(jù)，其中回答“ y”表示平時經(jīng)常閱讀該雜志，回答表示平時經(jīng)常閱讀該雜志，回答“n”表示不經(jīng)表示不經(jīng)常閱讀。為了了解每位被調(diào)查者經(jīng)常閱讀的雜志有幾種，需要對每個觀測常閱讀。為了了解每位被調(diào)查者經(jīng)常閱讀的雜志有幾種，需要對每個觀測量中變量值為量中變量值為“y”出現(xiàn)的次數(shù)進(jìn)行計數(shù)。這類問題可以通過菜單項出現(xiàn)的次數(shù)進(jìn)行計數(shù)。這類問題可以通過菜單項“對個對個案內(nèi)的值計數(shù)案內(nèi)的值計數(shù)”的功能予以實現(xiàn)。的功能予以實現(xiàn)。(js.sav)(js.sav) 其操作步驟如下：其操作步驟如下： 1. 在主菜單中單擊在主菜單中單擊T“轉(zhuǎn)換轉(zhuǎn)換”，展開下拉菜單，從下拉菜單中選擇，展開下拉菜單，從下拉

12、菜單中選擇“對個案對個案內(nèi)的值計數(shù)內(nèi)的值計數(shù)” ” 。 2. 2. 執(zhí)行執(zhí)行“對個案內(nèi)的值計數(shù)對個案內(nèi)的值計數(shù)”操作后，觀測量中特定變量值出現(xiàn)的次數(shù)，操作后，觀測量中特定變量值出現(xiàn)的次數(shù)，將通過創(chuàng)建一個新的變量（稱為目標(biāo)變量將通過創(chuàng)建一個新的變量（稱為目標(biāo)變量) )來保存及顯示。來保存及顯示。 3 3在主對話框左邊的源變量列表框中選擇要進(jìn)行計數(shù)的變量名（中國青在主對話框左邊的源變量列表框中選擇要進(jìn)行計數(shù)的變量名（中國青年），單擊向一右箭頭按鈕，將它送入年），單擊向一右箭頭按鈕，將它送入 “ “變量變量”下方的矩形框中。下方的矩形框中。 4 4單擊單擊 “ “定義值定義值”圖標(biāo)按鈕，彈出選擇計數(shù)

13、變量值對話框。圖標(biāo)按鈕，彈出選擇計數(shù)變量值對話框。 5、重復(fù)、重復(fù)3、4兩步，將剩下的變量送入兩步，將剩下的變量送入“變量變量”下方的矩形框下方的矩形框中，并分別定義計數(shù)變量值。中，并分別定義計數(shù)變量值。 6、使用條件表達(dá)式定義觀測量子集。、使用條件表達(dá)式定義觀測量子集。 7、單擊、單擊“確定確定”，開始統(tǒng)計觀測量中特定變量值出現(xiàn)的次數(shù)。，開始統(tǒng)計觀測量中特定變量值出現(xiàn)的次數(shù)。4.10 對變量值重新編碼對變量值重新編碼在采集數(shù)據(jù)時，得到的數(shù)據(jù)往往是多種多樣的。為了便于統(tǒng)計分析，有時候我們不得不對原始數(shù)據(jù)重新編碼。根據(jù)數(shù)據(jù)文件的具體情況，在SPSS中存在有兩種不同的編碼方式： 1、重新編碼為相

14、同變量 2、重新編碼為不同變量一、重新編碼為相同變量（e410-1)在上述數(shù)據(jù)文件中，按下列要求對salary 進(jìn)行重新編碼： salary =30000, 1 30000 salary= 45000, 2 45000 salary60000, 4 其操作步驟為：二、重新編碼為不同的變量例：e410-2要求：對口味變量進(jìn)行如下編碼：好：1 較好：2 一般：3 差：4其操作步驟如下：1、2、3、注：可一次同時對多個變量進(jìn)行編碼，但是這些變量必須具有相同的數(shù)據(jù)類型。如：4.11 個案等級排序個案等級排序個案等級排序個案等級排序是根據(jù)某變量觀測值的大小，按一定順序排秩，生成一代表其秩次的新變量，

15、數(shù)據(jù)本身順序并不改變。它與“排序個案”不同， “排序個案”是根據(jù)某變量觀測值的大小將數(shù)據(jù)重新排列，并不生成新變量。個案等級排序個案等級排序的操作步驟如下：注：此處的注：此處的“排序標(biāo)準(zhǔn)排序標(biāo)準(zhǔn)”必須是數(shù)值型的，非數(shù)值型需轉(zhuǎn)換成數(shù)值型。必須是數(shù)值型的，非數(shù)值型需轉(zhuǎn)換成數(shù)值型。結(jié)：處理同秩變量的不同方式身高低平均值高順序等級到唯一值149 1 1 1 1151 2 2.5 3 2 151 2 2.5 3 2157 4 4 4 3161 5 5 5 4163 6 6 6 5 168 7 7 7 64.12 自動重新編碼自動重新編碼在許多統(tǒng)計分析過程中，當(dāng)分類變量不是連續(xù)數(shù)時，產(chǎn)生的空在許

16、多統(tǒng)計分析過程中，當(dāng)分類變量不是連續(xù)數(shù)時，產(chǎn)生的空白單元會降低系統(tǒng)性能且增加對存儲容量的需求。而且，某些過程白單元會降低系統(tǒng)性能且增加對存儲容量的需求。而且，某些過程不允許使用字符型變量作為衡量因素水平的標(biāo)準(zhǔn)，而要求使用連續(xù)不允許使用字符型變量作為衡量因素水平的標(biāo)準(zhǔn)，而要求使用連續(xù)整數(shù)值。采用自動編碼可以將字符串和數(shù)值轉(zhuǎn)換成連續(xù)整數(shù)，以滿整數(shù)值。采用自動編碼可以將字符串和數(shù)值轉(zhuǎn)換成連續(xù)整數(shù)，以滿足某些分析過程的特殊需要。自動編碼的操作過程如下足某些分析過程的特殊需要。自動編碼的操作過程如下: (e412-1)4.13 創(chuàng)建時間變換創(chuàng)建時間變換利用已存在的時間系列變量值，通過函數(shù)變換產(chǎn)生新變量

17、，這些利用已存在的時間系列變量值，通過函數(shù)變換產(chǎn)生新變量，這些新變量的值在許多時間系列的分析過程中將要用到。時間系列變換新變量的值在許多時間系列的分析過程中將要用到。時間系列變換的操作如下：的操作如下：建立新變量時可使用的函數(shù)建立新變量時可使用的函數(shù)1、差值（差分）、差值（差分）(e413-1) 按差分的階數(shù)可分為一階差分、二階差分，其計算方法為：按差分的階數(shù)可分為一階差分、二階差分，其計算方法為：2、季節(jié)性差分、季節(jié)性差分(e413-2) 在計算季節(jié)性差分之前，必須先定義一個包含有周期成份的日期時間變量。在計算季節(jié)性差分之前，必須先定義一個包含有周期成份的日期時間變量。3、中心移動平均值中

18、心移動平均值(413-3) 圍繞當(dāng)前值在一定范圍內(nèi)對變量的值求平均值。圍繞當(dāng)前值在一定范圍內(nèi)對變量的值求平均值。跨度為跨度為2 時：時：40.75=(48+38)/2+(38+39)/ 2)/2跨度為跨度為3 時：時：41.67=(48+38+39)/34、向前移移動平均值、向前移移動平均值求當(dāng)前值的前方一定范圍內(nèi)的原始變量值的均值。求當(dāng)前值的前方一定范圍內(nèi)的原始變量值的均值。5. 運行中位數(shù)運行中位數(shù)圍繞當(dāng)前值在一定范圍內(nèi)對原始變量值求出中值。圍繞當(dāng)前值在一定范圍內(nèi)對原始變量值求出中值?？缍葹? 時：40.75=(48+38)/2+(38+39)/ 2)/2跨度為3 時：39=mid(48,38,39)6、累加求和累加求和(e413-6) 計算從第一個變量值起直到當(dāng)前變量值的總和。計算從第一個變量值起直到當(dāng)前變量值的總和。7. 延遲延遲當(dāng)前變量的值等于相隔為延遲階數(shù)的前面的變量值。當(dāng)前變量的值

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

spss第四章數(shù)據(jù)文件的操作與變換

文檔簡介

溫馨提示

最新文檔

評論

spss第四章數(shù)據(jù)文件的操作與變換

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔