spss第四章數(shù)據(jù)文件的操作與變換_第1頁
spss第四章數(shù)據(jù)文件的操作與變換_第2頁
spss第四章數(shù)據(jù)文件的操作與變換_第3頁
spss第四章數(shù)據(jù)文件的操作與變換_第4頁
spss第四章數(shù)據(jù)文件的操作與變換_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章 數(shù)據(jù)文件操作與變換41 定義時間系列日期型變量定義時間系列日期型變量 數(shù)據(jù)定義日期說明: 1、執(zhí)行后,在數(shù)據(jù)窗口中為每個時間單位對應(yīng)一個新的數(shù)值變量,變量名后帶 “_”,如 YEAR_ , DAY_ , MONTH_ 等。最后還附加了一個具有描述意義的字符變量DATE_。 2、如果在這之前已經(jīng)定義了一組時間系列變量,則新建立的變量將全部替代原有的時間系列。 3、若選擇Cases Are 框中的 Not dated,則刪除以前定義過的所有時間系列變量。4.2 排序個案排序個案 數(shù)據(jù)排序個案說明: 1、排序變量可以是一個,也可以是多個。若為多個排序變量,則首先按第一個變量進(jìn)行排序,在第一個

2、排序變量的值相同時,再按第二個排序變量排序,依次類推。 2、排序方式有兩種:升序或降序。4.3 數(shù)據(jù)文件轉(zhuǎn)置變換數(shù)據(jù)文件轉(zhuǎn)置變換 數(shù)據(jù)數(shù)據(jù) 變換變換說明: 1、轉(zhuǎn)置后形成一個新的數(shù)據(jù)文件,應(yīng)該保存為另一個文件名。 2、如果未將全部變量移入Variables框中,則轉(zhuǎn)置后的數(shù)據(jù)文件中會將未選擇變量的值全部丟失。 3、轉(zhuǎn)置后生成的新變量均為數(shù)值型,所以非數(shù)值型變量一般不進(jìn)行轉(zhuǎn)置。 4、轉(zhuǎn)置后生成一個新變量case_lbl, 用來存放進(jìn)行轉(zhuǎn)置的原變量名。 5、命名變量 無:系統(tǒng)會自動給轉(zhuǎn)置后的新變量賦予var001 ,var002, var003 。 有:以命名變量的值為基礎(chǔ),對轉(zhuǎn)置后的新變量進(jìn)行命

3、名。 k+命名變量的值+1,2,3.或A、B、C.4.4 數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并 合并數(shù)據(jù)文件有兩種方式: 1、增加觀測量 2、增加變量一、增加觀測量a.sav b.sav說明: (1)不配對合并:保留兩個數(shù)據(jù)文件中的配對變量,同時將未配對變量加入合并后的數(shù)據(jù)文件中。 (2)配對合并:兩個文件中的各一個變量,其含義相同,類型也相同,但變量名不同。通過配對合并可將這兩個變量合成一個變量,其變量 名仍然以工作數(shù)據(jù)文件中的變量名顯示。 注意:配對合并時,兩個變量一定要具有相同的變量類型,寬度不一定相同,但當(dāng)前工作數(shù)據(jù)文件中的變量寬度應(yīng)大于或等于外部數(shù)據(jù)文件中的變量的寬度,否則合并后外部文件的觀

4、測量中相應(yīng)變量值無法顯示。 (3)合并的同時可剔除變量 (4)為變量改名:未配對變量框中的變量可改名。 (5)可生成表明觀測量來源的新變量:選中將個案源表示為變量.4.5 分類匯總分類匯總一、分類匯總的概念 分類匯總就是按分類變量的不同取值對觀測量進(jìn)行分組,對每組觀測量求描述統(tǒng)計量,生成新數(shù)據(jù)文件。在新數(shù)據(jù)文件中對應(yīng)分類變量的每一個值產(chǎn)生一個觀測量。(qxn.sav)若選擇年齡作為分類變量,身高、體重作為匯總變量,函數(shù)選擇為平均值,則分類匯總生成的數(shù)據(jù)文件如下:若選擇年齡、性別為分類變量,身高、體重作為匯總變量,函數(shù)選擇為平均值,則分類匯總生成的數(shù)據(jù)文件如下:二、分類匯總的方法1從主菜單中單擊

5、 “數(shù)據(jù)”展開下拉菜單,選擇 “匯總”,彈出“匯總數(shù)據(jù)”對話框。 2在左側(cè)的源變量框中選擇一個或多個變量作為分類變量進(jìn)入 “分組變量”框中。 3、在左側(cè)的源變量框中選擇一個或多個變量作為匯總變量進(jìn)入 “變量摘要”框中,即要求對這些變量的值進(jìn)行分類匯總。 4名稱與標(biāo)簽:單擊此按鈕可以修改分類匯總生成的新變量的名稱及標(biāo)簽。 如果不選擇該選項,則系統(tǒng)自動給每個新變量賦予一個默認(rèn)的變量名:在原始變量名后面加下劃線和匯總函數(shù)名。 5函數(shù):確定匯總變量的描述項。系統(tǒng)的默認(rèn)函數(shù)為平均值。單擊該按鈕,彈出“匯總數(shù)據(jù):匯總函數(shù)”對話框:6 個案數(shù):選擇此項,將源變量分組中的觀測量數(shù)目作為一個新個案數(shù):選擇此項,

6、將源變量分組中的觀測量數(shù)目作為一個新變量保存在生成的數(shù)據(jù)文件中。在右邊的框中輸入您為該變量取的變量保存在生成的數(shù)據(jù)文件中。在右邊的框中輸入您為該變量取的變量名,也可以保留使用系統(tǒng)指定的默認(rèn)變量名。變量名,也可以保留使用系統(tǒng)指定的默認(rèn)變量名。 7關(guān)于新數(shù)據(jù)文件的存儲方式關(guān)于新數(shù)據(jù)文件的存儲方式 (1) 將分類匯總產(chǎn)生的新數(shù)據(jù)放在當(dāng)前文件中將分類匯總產(chǎn)生的新數(shù)據(jù)放在當(dāng)前文件中 (2) 將分類匯總產(chǎn)生的新數(shù)據(jù)以新的數(shù)據(jù)集顯示將分類匯總產(chǎn)生的新數(shù)據(jù)以新的數(shù)據(jù)集顯示 (3) 將分類匯總產(chǎn)生的新數(shù)據(jù)以新的文件名保存。將分類匯總產(chǎn)生的新數(shù)據(jù)以新的文件名保存。 8單擊單擊“確定確定”執(zhí)行分類匯總功能。執(zhí)行分類

7、匯總功能。4.6 拆分?jǐn)?shù)據(jù)文件拆分?jǐn)?shù)據(jù)文件 數(shù)據(jù)數(shù)據(jù)拆分文件拆分文件4.7 選擇觀測量選擇觀測量 數(shù)據(jù)選擇個案4.8 對觀測量作加權(quán)處理對觀測量作加權(quán)處理 采集數(shù)據(jù)時,若相同觀測量(觀測量的各變量值均相同)出現(xiàn)采集數(shù)據(jù)時,若相同觀測量(觀測量的各變量值均相同)出現(xiàn)多次,通過設(shè)置一個頻數(shù)變量,可以使具有相同變量值的觀測量在多次,通過設(shè)置一個頻數(shù)變量,可以使具有相同變量值的觀測量在數(shù)據(jù)表中只出現(xiàn)一次。數(shù)據(jù)表中只出現(xiàn)一次。 但是,在進(jìn)行統(tǒng)計分析時,為了原始數(shù)據(jù)的真實情況,必須對觀但是,在進(jìn)行統(tǒng)計分析時,為了原始數(shù)據(jù)的真實情況,必須對觀測量作加權(quán)處理。例如,如下圖所示的數(shù)據(jù)文件中,變量測量作加權(quán)處理。

8、例如,如下圖所示的數(shù)據(jù)文件中,變量“頻數(shù)頻數(shù)”中記錄的是相同觀測量出現(xiàn)的次數(shù)。若不作加權(quán)處理,則在統(tǒng)計分中記錄的是相同觀測量出現(xiàn)的次數(shù)。若不作加權(quán)處理,則在統(tǒng)計分析時將析時將“頻數(shù)頻數(shù)”當(dāng)作一個普通的變量看待,數(shù)據(jù)文件中的觀測量數(shù)當(dāng)作一個普通的變量看待,數(shù)據(jù)文件中的觀測量數(shù)總共被認(rèn)為是總共被認(rèn)為是5個。個。(qz.sav)可按下列步驟對數(shù)據(jù)文件作加權(quán)處理:可按下列步驟對數(shù)據(jù)文件作加權(quán)處理: 1在主菜單中單擊在主菜單中單擊 “數(shù)據(jù)數(shù)據(jù)”,展開下拉菜單,從下拉菜單中選擇,展開下拉菜單,從下拉菜單中選擇 “加權(quán)個案加權(quán)個案”選項,彈出對觀測量作加權(quán)處理的對話框。選項,彈出對觀測量作加權(quán)處理的對話框。

9、2選擇對觀測量作加權(quán)處理的方式。選擇對觀測量作加權(quán)處理的方式。 請勿對個案加權(quán):對數(shù)據(jù)文件不作加權(quán)處理。這是系統(tǒng)默認(rèn)狀請勿對個案加權(quán):對數(shù)據(jù)文件不作加權(quán)處理。這是系統(tǒng)默認(rèn)狀態(tài)。態(tài)。 加權(quán)個案:選擇此項表示要求作加權(quán)處理。加權(quán)個案:選擇此項表示要求作加權(quán)處理。3當(dāng)在上一步中選擇了當(dāng)在上一步中選擇了“加權(quán)個案加權(quán)個案”選項后。從左邊源變量列表選項后。從左邊源變量列表框中選擇一個作為權(quán)變量的變量名,單擊向右箭頭按鈕,送入框中選擇一個作為權(quán)變量的變量名,單擊向右箭頭按鈕,送入“頻頻率變量率變量”下面的矩形框中。在此我們選擇變量名下面的矩形框中。在此我們選擇變量名“頻數(shù)頻數(shù)”作為加權(quán)作為加權(quán)變量。變量。

10、 4單擊單擊“確定確定”,執(zhí)行觀測量加權(quán)。,執(zhí)行觀測量加權(quán)。 在執(zhí)行加權(quán)處理后,從表面上看,數(shù)據(jù)文件沒有發(fā)生任何變化,在執(zhí)行加權(quán)處理后,從表面上看,數(shù)據(jù)文件沒有發(fā)生任何變化,但是在隨后進(jìn)行統(tǒng)計分析時,會將頻數(shù)變量的值重復(fù)計入到觀測量但是在隨后進(jìn)行統(tǒng)計分析時,會將頻數(shù)變量的值重復(fù)計入到觀測量出現(xiàn)的次數(shù)中。出現(xiàn)的次數(shù)中。 4.9 對個案內(nèi)的值計數(shù)對個案內(nèi)的值計數(shù) 有時候,我們要對某些變量值有時候,我們要對某些變量值出現(xiàn)在一個觀測量中出現(xiàn)在一個觀測量中的次數(shù)進(jìn)的次數(shù)進(jìn)行統(tǒng)計,例如,下圖所示是對讀者作的關(guān)于平時經(jīng)常閱讀的雜志種類的問行統(tǒng)計,例如,下圖所示是對讀者作的關(guān)于平時經(jīng)常閱讀的雜志種類的問卷調(diào)查

11、數(shù)據(jù),其中回答卷調(diào)查數(shù)據(jù),其中回答“ y”表示平時經(jīng)常閱讀該雜志,回答表示平時經(jīng)常閱讀該雜志,回答“n”表示不經(jīng)表示不經(jīng)常閱讀。為了了解每位被調(diào)查者經(jīng)常閱讀的雜志有幾種,需要對每個觀測常閱讀。為了了解每位被調(diào)查者經(jīng)常閱讀的雜志有幾種,需要對每個觀測量中變量值為量中變量值為“y”出現(xiàn)的次數(shù)進(jìn)行計數(shù)。這類問題可以通過菜單項出現(xiàn)的次數(shù)進(jìn)行計數(shù)。這類問題可以通過菜單項“對個對個案內(nèi)的值計數(shù)案內(nèi)的值計數(shù)”的功能予以實現(xiàn)。的功能予以實現(xiàn)。(js.sav)(js.sav) 其操作步驟如下:其操作步驟如下: 1. 在主菜單中單擊在主菜單中單擊T“轉(zhuǎn)換轉(zhuǎn)換”,展開下拉菜單,從下拉菜單中選擇,展開下拉菜單,從下拉

12、菜單中選擇“對個案對個案內(nèi)的值計數(shù)內(nèi)的值計數(shù)” ” 。 2. 2. 執(zhí)行執(zhí)行“對個案內(nèi)的值計數(shù)對個案內(nèi)的值計數(shù)”操作后,觀測量中特定變量值出現(xiàn)的次數(shù),操作后,觀測量中特定變量值出現(xiàn)的次數(shù),將通過創(chuàng)建一個新的變量(稱為目標(biāo)變量將通過創(chuàng)建一個新的變量(稱為目標(biāo)變量) )來保存及顯示。來保存及顯示。 3 3在主對話框左邊的源變量列表框中選擇要進(jìn)行計數(shù)的變量名(中國青在主對話框左邊的源變量列表框中選擇要進(jìn)行計數(shù)的變量名(中國青年),單擊向一右箭頭按鈕,將它送入年),單擊向一右箭頭按鈕,將它送入 “ “變量變量”下方的矩形框中。下方的矩形框中。 4 4單擊單擊 “ “定義值定義值”圖標(biāo)按鈕,彈出選擇計數(shù)

13、變量值對話框。圖標(biāo)按鈕,彈出選擇計數(shù)變量值對話框。 5、重復(fù)、重復(fù)3、4兩步,將剩下的變量送入兩步,將剩下的變量送入“變量變量”下方的矩形框下方的矩形框中,并分別定義計數(shù)變量值。中,并分別定義計數(shù)變量值。 6、使用條件表達(dá)式定義觀測量子集。、使用條件表達(dá)式定義觀測量子集。 7、單擊、單擊“確定確定”,開始統(tǒng)計觀測量中特定變量值出現(xiàn)的次數(shù)。,開始統(tǒng)計觀測量中特定變量值出現(xiàn)的次數(shù)。4.10 對變量值重新編碼對變量值重新編碼 在采集數(shù)據(jù)時,得到的數(shù)據(jù)往往是多種多樣的。為了便于統(tǒng)計分析,有時候我們不得不對原始數(shù)據(jù)重新編碼。根據(jù)數(shù)據(jù)文件的具體情況,在SPSS中存在有兩種不同的編碼方式: 1、重新編碼為相

14、同變量 2、 重新編碼為不同變量一、重新編碼為相同變量(e410-1)在上述數(shù)據(jù)文件中,按下列要求對salary 進(jìn)行重新編碼: salary =30000, 1 30000 salary= 45000, 2 45000 salary60000, 4 其操作步驟為:二、重新編碼為不同的變量例:e410-2要求:對口味變量進(jìn)行如下編碼: 好:1 較好:2 一般:3 差:4其操作步驟如下:1、2、3、注:可一次同時對多個變量進(jìn)行編碼,但是這些變量必須具有相同的數(shù)據(jù)類型。如:4.11 個案等級排序個案等級排序個案等級排序個案等級排序是根據(jù)某變量觀測值的大小,按一定順序排秩,生成一代表其秩次的新變量,

15、數(shù)據(jù)本身順序并不改變。它與“排序個案”不同, “排序個案”是根據(jù)某變量觀測值的大小將數(shù)據(jù)重新排列,并不生成新變量。個案等級排序個案等級排序的操作步驟如下:注:此處的注:此處的“排序標(biāo)準(zhǔn)排序標(biāo)準(zhǔn)”必須是數(shù)值型的,非數(shù)值型需轉(zhuǎn)換成數(shù)值型。必須是數(shù)值型的,非數(shù)值型需轉(zhuǎn)換成數(shù)值型。 結(jié):處理同秩變量的不同方式身高 低 平均值 高 順序等級到唯一值149 1 1 1 1151 2 2.5 3 2 151 2 2.5 3 2157 4 4 4 3161 5 5 5 4163 6 6 6 5 168 7 7 7 64.12 自動重新編碼自動重新編碼 在許多統(tǒng)計分析過程中,當(dāng)分類變量不是連續(xù)數(shù)時,產(chǎn)生的空在許

16、多統(tǒng)計分析過程中,當(dāng)分類變量不是連續(xù)數(shù)時,產(chǎn)生的空白單元會降低系統(tǒng)性能且增加對存儲容量的需求。而且,某些過程白單元會降低系統(tǒng)性能且增加對存儲容量的需求。而且,某些過程不允許使用字符型變量作為衡量因素水平的標(biāo)準(zhǔn),而要求使用連續(xù)不允許使用字符型變量作為衡量因素水平的標(biāo)準(zhǔn),而要求使用連續(xù)整數(shù)值。采用自動編碼可以將字符串和數(shù)值轉(zhuǎn)換成連續(xù)整數(shù),以滿整數(shù)值。采用自動編碼可以將字符串和數(shù)值轉(zhuǎn)換成連續(xù)整數(shù),以滿足某些分析過程的特殊需要。自動編碼的操作過程如下足某些分析過程的特殊需要。自動編碼的操作過程如下: (e412-1)4.13 創(chuàng)建時間變換創(chuàng)建時間變換 利用已存在的時間系列變量值,通過函數(shù)變換產(chǎn)生新變量

17、,這些利用已存在的時間系列變量值,通過函數(shù)變換產(chǎn)生新變量,這些新變量的值在許多時間系列的分析過程中將要用到。時間系列變換新變量的值在許多時間系列的分析過程中將要用到。時間系列變換的操作如下:的操作如下:建立新變量時可使用的函數(shù)建立新變量時可使用的函數(shù)1、差值(差分)、差值(差分)(e413-1) 按差分的階數(shù)可分為一階差分、二階差分,其計算方法為:按差分的階數(shù)可分為一階差分、二階差分,其計算方法為:2、季節(jié)性差分、季節(jié)性差分(e413-2) 在計算季節(jié)性差分之前,必須先定義一個包含有周期成份的日期時間變量。在計算季節(jié)性差分之前,必須先定義一個包含有周期成份的日期時間變量。3、 中心移動平均值中

18、心移動平均值(413-3) 圍繞當(dāng)前值在一定范圍內(nèi)對變量的值求平均值。圍繞當(dāng)前值在一定范圍內(nèi)對變量的值求平均值。跨度為跨度為2 時:時:40.75=(48+38)/2+(38+39)/ 2)/2跨度為跨度為3 時:時:41.67=(48+38+39)/34、向前移移動平均值、向前移移動平均值 求當(dāng)前值的前方一定范圍內(nèi)的原始變量值的均值。求當(dāng)前值的前方一定范圍內(nèi)的原始變量值的均值。5. 運行中位數(shù)運行中位數(shù)圍繞當(dāng)前值在一定范圍內(nèi)對原始變量值求出中值。圍繞當(dāng)前值在一定范圍內(nèi)對原始變量值求出中值??缍葹? 時:40.75=(48+38)/2+(38+39)/ 2)/2跨度為3 時:39=mid(48,38,39)6、 累加求和累加求和(e413-6) 計算從第一個變量值起直到當(dāng)前變量值的總和。計算從第一個變量值起直到當(dāng)前變量值的總和。7. 延遲延遲 當(dāng)前變量的值等于相隔為延遲階數(shù)的前面的變量值。當(dāng)前變量的值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論