spss第四章數(shù)據(jù)文件的操作與變換_第1頁
spss第四章數(shù)據(jù)文件的操作與變換_第2頁
spss第四章數(shù)據(jù)文件的操作與變換_第3頁
spss第四章數(shù)據(jù)文件的操作與變換_第4頁
spss第四章數(shù)據(jù)文件的操作與變換_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章 數(shù)據(jù)文件操作與變換41 定義時(shí)間系列日期型變量定義時(shí)間系列日期型變量 數(shù)據(jù)定義日期說明: 1、執(zhí)行后,在數(shù)據(jù)窗口中為每個(gè)時(shí)間單位對(duì)應(yīng)一個(gè)新的數(shù)值變量,變量名后帶 “_”,如 YEAR_ , DAY_ , MONTH_ 等。最后還附加了一個(gè)具有描述意義的字符變量DATE_。 2、如果在這之前已經(jīng)定義了一組時(shí)間系列變量,則新建立的變量將全部替代原有的時(shí)間系列。 3、若選擇Cases Are 框中的 Not dated,則刪除以前定義過的所有時(shí)間系列變量。4.2 排序個(gè)案排序個(gè)案 數(shù)據(jù)排序個(gè)案說明: 1、排序變量可以是一個(gè),也可以是多個(gè)。若為多個(gè)排序變量,則首先按第一個(gè)變量進(jìn)行排序,在第一個(gè)

2、排序變量的值相同時(shí),再按第二個(gè)排序變量排序,依次類推。 2、排序方式有兩種:升序或降序。4.3 數(shù)據(jù)文件轉(zhuǎn)置變換數(shù)據(jù)文件轉(zhuǎn)置變換 數(shù)據(jù)數(shù)據(jù) 變換變換說明: 1、轉(zhuǎn)置后形成一個(gè)新的數(shù)據(jù)文件,應(yīng)該保存為另一個(gè)文件名。 2、如果未將全部變量移入Variables框中,則轉(zhuǎn)置后的數(shù)據(jù)文件中會(huì)將未選擇變量的值全部丟失。 3、轉(zhuǎn)置后生成的新變量均為數(shù)值型,所以非數(shù)值型變量一般不進(jìn)行轉(zhuǎn)置。 4、轉(zhuǎn)置后生成一個(gè)新變量case_lbl, 用來存放進(jìn)行轉(zhuǎn)置的原變量名。 5、命名變量 無:系統(tǒng)會(huì)自動(dòng)給轉(zhuǎn)置后的新變量賦予var001 ,var002, var003 。 有:以命名變量的值為基礎(chǔ),對(duì)轉(zhuǎn)置后的新變量進(jìn)行命

3、名。 k+命名變量的值+1,2,3.或A、B、C.4.4 數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并 合并數(shù)據(jù)文件有兩種方式: 1、增加觀測量 2、增加變量一、增加觀測量a.sav b.sav說明: (1)不配對(duì)合并:保留兩個(gè)數(shù)據(jù)文件中的配對(duì)變量,同時(shí)將未配對(duì)變量加入合并后的數(shù)據(jù)文件中。 (2)配對(duì)合并:兩個(gè)文件中的各一個(gè)變量,其含義相同,類型也相同,但變量名不同。通過配對(duì)合并可將這兩個(gè)變量合成一個(gè)變量,其變量 名仍然以工作數(shù)據(jù)文件中的變量名顯示。 注意:配對(duì)合并時(shí),兩個(gè)變量一定要具有相同的變量類型,寬度不一定相同,但當(dāng)前工作數(shù)據(jù)文件中的變量寬度應(yīng)大于或等于外部數(shù)據(jù)文件中的變量的寬度,否則合并后外部文件的觀

4、測量中相應(yīng)變量值無法顯示。 (3)合并的同時(shí)可剔除變量 (4)為變量改名:未配對(duì)變量框中的變量可改名。 (5)可生成表明觀測量來源的新變量:選中將個(gè)案源表示為變量.4.5 分類匯總分類匯總一、分類匯總的概念 分類匯總就是按分類變量的不同取值對(duì)觀測量進(jìn)行分組,對(duì)每組觀測量求描述統(tǒng)計(jì)量,生成新數(shù)據(jù)文件。在新數(shù)據(jù)文件中對(duì)應(yīng)分類變量的每一個(gè)值產(chǎn)生一個(gè)觀測量。(qxn.sav)若選擇年齡作為分類變量,身高、體重作為匯總變量,函數(shù)選擇為平均值,則分類匯總生成的數(shù)據(jù)文件如下:若選擇年齡、性別為分類變量,身高、體重作為匯總變量,函數(shù)選擇為平均值,則分類匯總生成的數(shù)據(jù)文件如下:二、分類匯總的方法1從主菜單中單擊

5、 “數(shù)據(jù)”展開下拉菜單,選擇 “匯總”,彈出“匯總數(shù)據(jù)”對(duì)話框。 2在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為分類變量進(jìn)入 “分組變量”框中。 3、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為匯總變量進(jìn)入 “變量摘要”框中,即要求對(duì)這些變量的值進(jìn)行分類匯總。 4名稱與標(biāo)簽:單擊此按鈕可以修改分類匯總生成的新變量的名稱及標(biāo)簽。 如果不選擇該選項(xiàng),則系統(tǒng)自動(dòng)給每個(gè)新變量賦予一個(gè)默認(rèn)的變量名:在原始變量名后面加下劃線和匯總函數(shù)名。 5函數(shù):確定匯總變量的描述項(xiàng)。系統(tǒng)的默認(rèn)函數(shù)為平均值。單擊該按鈕,彈出“匯總數(shù)據(jù):匯總函數(shù)”對(duì)話框:6 個(gè)案數(shù):選擇此項(xiàng),將源變量分組中的觀測量數(shù)目作為一個(gè)新個(gè)案數(shù):選擇此項(xiàng),

6、將源變量分組中的觀測量數(shù)目作為一個(gè)新變量保存在生成的數(shù)據(jù)文件中。在右邊的框中輸入您為該變量取的變量保存在生成的數(shù)據(jù)文件中。在右邊的框中輸入您為該變量取的變量名,也可以保留使用系統(tǒng)指定的默認(rèn)變量名。變量名,也可以保留使用系統(tǒng)指定的默認(rèn)變量名。 7關(guān)于新數(shù)據(jù)文件的存儲(chǔ)方式關(guān)于新數(shù)據(jù)文件的存儲(chǔ)方式 (1) 將分類匯總產(chǎn)生的新數(shù)據(jù)放在當(dāng)前文件中將分類匯總產(chǎn)生的新數(shù)據(jù)放在當(dāng)前文件中 (2) 將分類匯總產(chǎn)生的新數(shù)據(jù)以新的數(shù)據(jù)集顯示將分類匯總產(chǎn)生的新數(shù)據(jù)以新的數(shù)據(jù)集顯示 (3) 將分類匯總產(chǎn)生的新數(shù)據(jù)以新的文件名保存。將分類匯總產(chǎn)生的新數(shù)據(jù)以新的文件名保存。 8單擊單擊“確定確定”執(zhí)行分類匯總功能。執(zhí)行分類

7、匯總功能。4.6 拆分?jǐn)?shù)據(jù)文件拆分?jǐn)?shù)據(jù)文件 數(shù)據(jù)數(shù)據(jù)拆分文件拆分文件4.7 選擇觀測量選擇觀測量 數(shù)據(jù)選擇個(gè)案4.8 對(duì)觀測量作加權(quán)處理對(duì)觀測量作加權(quán)處理 采集數(shù)據(jù)時(shí),若相同觀測量(觀測量的各變量值均相同)出現(xiàn)采集數(shù)據(jù)時(shí),若相同觀測量(觀測量的各變量值均相同)出現(xiàn)多次,通過設(shè)置一個(gè)頻數(shù)變量,可以使具有相同變量值的觀測量在多次,通過設(shè)置一個(gè)頻數(shù)變量,可以使具有相同變量值的觀測量在數(shù)據(jù)表中只出現(xiàn)一次。數(shù)據(jù)表中只出現(xiàn)一次。 但是,在進(jìn)行統(tǒng)計(jì)分析時(shí),為了原始數(shù)據(jù)的真實(shí)情況,必須對(duì)觀但是,在進(jìn)行統(tǒng)計(jì)分析時(shí),為了原始數(shù)據(jù)的真實(shí)情況,必須對(duì)觀測量作加權(quán)處理。例如,如下圖所示的數(shù)據(jù)文件中,變量測量作加權(quán)處理。

8、例如,如下圖所示的數(shù)據(jù)文件中,變量“頻數(shù)頻數(shù)”中記錄的是相同觀測量出現(xiàn)的次數(shù)。若不作加權(quán)處理,則在統(tǒng)計(jì)分中記錄的是相同觀測量出現(xiàn)的次數(shù)。若不作加權(quán)處理,則在統(tǒng)計(jì)分析時(shí)將析時(shí)將“頻數(shù)頻數(shù)”當(dāng)作一個(gè)普通的變量看待,數(shù)據(jù)文件中的觀測量數(shù)當(dāng)作一個(gè)普通的變量看待,數(shù)據(jù)文件中的觀測量數(shù)總共被認(rèn)為是總共被認(rèn)為是5個(gè)。個(gè)。(qz.sav)可按下列步驟對(duì)數(shù)據(jù)文件作加權(quán)處理:可按下列步驟對(duì)數(shù)據(jù)文件作加權(quán)處理: 1在主菜單中單擊在主菜單中單擊 “數(shù)據(jù)數(shù)據(jù)”,展開下拉菜單,從下拉菜單中選擇,展開下拉菜單,從下拉菜單中選擇 “加權(quán)個(gè)案加權(quán)個(gè)案”選項(xiàng),彈出對(duì)觀測量作加權(quán)處理的對(duì)話框。選項(xiàng),彈出對(duì)觀測量作加權(quán)處理的對(duì)話框。

9、2選擇對(duì)觀測量作加權(quán)處理的方式。選擇對(duì)觀測量作加權(quán)處理的方式。 請(qǐng)勿對(duì)個(gè)案加權(quán):對(duì)數(shù)據(jù)文件不作加權(quán)處理。這是系統(tǒng)默認(rèn)狀請(qǐng)勿對(duì)個(gè)案加權(quán):對(duì)數(shù)據(jù)文件不作加權(quán)處理。這是系統(tǒng)默認(rèn)狀態(tài)。態(tài)。 加權(quán)個(gè)案:選擇此項(xiàng)表示要求作加權(quán)處理。加權(quán)個(gè)案:選擇此項(xiàng)表示要求作加權(quán)處理。3當(dāng)在上一步中選擇了當(dāng)在上一步中選擇了“加權(quán)個(gè)案加權(quán)個(gè)案”選項(xiàng)后。從左邊源變量列表選項(xiàng)后。從左邊源變量列表框中選擇一個(gè)作為權(quán)變量的變量名,單擊向右箭頭按鈕,送入框中選擇一個(gè)作為權(quán)變量的變量名,單擊向右箭頭按鈕,送入“頻頻率變量率變量”下面的矩形框中。在此我們選擇變量名下面的矩形框中。在此我們選擇變量名“頻數(shù)頻數(shù)”作為加權(quán)作為加權(quán)變量。變量。

10、 4單擊單擊“確定確定”,執(zhí)行觀測量加權(quán)。,執(zhí)行觀測量加權(quán)。 在執(zhí)行加權(quán)處理后,從表面上看,數(shù)據(jù)文件沒有發(fā)生任何變化,在執(zhí)行加權(quán)處理后,從表面上看,數(shù)據(jù)文件沒有發(fā)生任何變化,但是在隨后進(jìn)行統(tǒng)計(jì)分析時(shí),會(huì)將頻數(shù)變量的值重復(fù)計(jì)入到觀測量但是在隨后進(jìn)行統(tǒng)計(jì)分析時(shí),會(huì)將頻數(shù)變量的值重復(fù)計(jì)入到觀測量出現(xiàn)的次數(shù)中。出現(xiàn)的次數(shù)中。 4.9 對(duì)個(gè)案內(nèi)的值計(jì)數(shù)對(duì)個(gè)案內(nèi)的值計(jì)數(shù) 有時(shí)候,我們要對(duì)某些變量值有時(shí)候,我們要對(duì)某些變量值出現(xiàn)在一個(gè)觀測量中出現(xiàn)在一個(gè)觀測量中的次數(shù)進(jìn)的次數(shù)進(jìn)行統(tǒng)計(jì),例如,下圖所示是對(duì)讀者作的關(guān)于平時(shí)經(jīng)常閱讀的雜志種類的問行統(tǒng)計(jì),例如,下圖所示是對(duì)讀者作的關(guān)于平時(shí)經(jīng)常閱讀的雜志種類的問卷調(diào)查

11、數(shù)據(jù),其中回答卷調(diào)查數(shù)據(jù),其中回答“ y”表示平時(shí)經(jīng)常閱讀該雜志,回答表示平時(shí)經(jīng)常閱讀該雜志,回答“n”表示不經(jīng)表示不經(jīng)常閱讀。為了了解每位被調(diào)查者經(jīng)常閱讀的雜志有幾種,需要對(duì)每個(gè)觀測常閱讀。為了了解每位被調(diào)查者經(jīng)常閱讀的雜志有幾種,需要對(duì)每個(gè)觀測量中變量值為量中變量值為“y”出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù)。這類問題可以通過菜單項(xiàng)出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù)。這類問題可以通過菜單項(xiàng)“對(duì)個(gè)對(duì)個(gè)案內(nèi)的值計(jì)數(shù)案內(nèi)的值計(jì)數(shù)”的功能予以實(shí)現(xiàn)。的功能予以實(shí)現(xiàn)。(js.sav)(js.sav) 其操作步驟如下:其操作步驟如下: 1. 在主菜單中單擊在主菜單中單擊T“轉(zhuǎn)換轉(zhuǎn)換”,展開下拉菜單,從下拉菜單中選擇,展開下拉菜單,從下拉

12、菜單中選擇“對(duì)個(gè)案對(duì)個(gè)案內(nèi)的值計(jì)數(shù)內(nèi)的值計(jì)數(shù)” ” 。 2. 2. 執(zhí)行執(zhí)行“對(duì)個(gè)案內(nèi)的值計(jì)數(shù)對(duì)個(gè)案內(nèi)的值計(jì)數(shù)”操作后,觀測量中特定變量值出現(xiàn)的次數(shù),操作后,觀測量中特定變量值出現(xiàn)的次數(shù),將通過創(chuàng)建一個(gè)新的變量(稱為目標(biāo)變量將通過創(chuàng)建一個(gè)新的變量(稱為目標(biāo)變量) )來保存及顯示。來保存及顯示。 3 3在主對(duì)話框左邊的源變量列表框中選擇要進(jìn)行計(jì)數(shù)的變量名(中國青在主對(duì)話框左邊的源變量列表框中選擇要進(jìn)行計(jì)數(shù)的變量名(中國青年),單擊向一右箭頭按鈕,將它送入年),單擊向一右箭頭按鈕,將它送入 “ “變量變量”下方的矩形框中。下方的矩形框中。 4 4單擊單擊 “ “定義值定義值”圖標(biāo)按鈕,彈出選擇計(jì)數(shù)

13、變量值對(duì)話框。圖標(biāo)按鈕,彈出選擇計(jì)數(shù)變量值對(duì)話框。 5、重復(fù)、重復(fù)3、4兩步,將剩下的變量送入兩步,將剩下的變量送入“變量變量”下方的矩形框下方的矩形框中,并分別定義計(jì)數(shù)變量值。中,并分別定義計(jì)數(shù)變量值。 6、使用條件表達(dá)式定義觀測量子集。、使用條件表達(dá)式定義觀測量子集。 7、單擊、單擊“確定確定”,開始統(tǒng)計(jì)觀測量中特定變量值出現(xiàn)的次數(shù)。,開始統(tǒng)計(jì)觀測量中特定變量值出現(xiàn)的次數(shù)。4.10 對(duì)變量值重新編碼對(duì)變量值重新編碼 在采集數(shù)據(jù)時(shí),得到的數(shù)據(jù)往往是多種多樣的。為了便于統(tǒng)計(jì)分析,有時(shí)候我們不得不對(duì)原始數(shù)據(jù)重新編碼。根據(jù)數(shù)據(jù)文件的具體情況,在SPSS中存在有兩種不同的編碼方式: 1、重新編碼為相

14、同變量 2、 重新編碼為不同變量一、重新編碼為相同變量(e410-1)在上述數(shù)據(jù)文件中,按下列要求對(duì)salary 進(jìn)行重新編碼: salary =30000, 1 30000 salary= 45000, 2 45000 salary60000, 4 其操作步驟為:二、重新編碼為不同的變量例:e410-2要求:對(duì)口味變量進(jìn)行如下編碼: 好:1 較好:2 一般:3 差:4其操作步驟如下:1、2、3、注:可一次同時(shí)對(duì)多個(gè)變量進(jìn)行編碼,但是這些變量必須具有相同的數(shù)據(jù)類型。如:4.11 個(gè)案等級(jí)排序個(gè)案等級(jí)排序個(gè)案等級(jí)排序個(gè)案等級(jí)排序是根據(jù)某變量觀測值的大小,按一定順序排秩,生成一代表其秩次的新變量,

15、數(shù)據(jù)本身順序并不改變。它與“排序個(gè)案”不同, “排序個(gè)案”是根據(jù)某變量觀測值的大小將數(shù)據(jù)重新排列,并不生成新變量。個(gè)案等級(jí)排序個(gè)案等級(jí)排序的操作步驟如下:注:此處的注:此處的“排序標(biāo)準(zhǔn)排序標(biāo)準(zhǔn)”必須是數(shù)值型的,非數(shù)值型需轉(zhuǎn)換成數(shù)值型。必須是數(shù)值型的,非數(shù)值型需轉(zhuǎn)換成數(shù)值型。 結(jié):處理同秩變量的不同方式身高 低 平均值 高 順序等級(jí)到唯一值149 1 1 1 1151 2 2.5 3 2 151 2 2.5 3 2157 4 4 4 3161 5 5 5 4163 6 6 6 5 168 7 7 7 64.12 自動(dòng)重新編碼自動(dòng)重新編碼 在許多統(tǒng)計(jì)分析過程中,當(dāng)分類變量不是連續(xù)數(shù)時(shí),產(chǎn)生的空在許

16、多統(tǒng)計(jì)分析過程中,當(dāng)分類變量不是連續(xù)數(shù)時(shí),產(chǎn)生的空白單元會(huì)降低系統(tǒng)性能且增加對(duì)存儲(chǔ)容量的需求。而且,某些過程白單元會(huì)降低系統(tǒng)性能且增加對(duì)存儲(chǔ)容量的需求。而且,某些過程不允許使用字符型變量作為衡量因素水平的標(biāo)準(zhǔn),而要求使用連續(xù)不允許使用字符型變量作為衡量因素水平的標(biāo)準(zhǔn),而要求使用連續(xù)整數(shù)值。采用自動(dòng)編碼可以將字符串和數(shù)值轉(zhuǎn)換成連續(xù)整數(shù),以滿整數(shù)值。采用自動(dòng)編碼可以將字符串和數(shù)值轉(zhuǎn)換成連續(xù)整數(shù),以滿足某些分析過程的特殊需要。自動(dòng)編碼的操作過程如下足某些分析過程的特殊需要。自動(dòng)編碼的操作過程如下: (e412-1)4.13 創(chuàng)建時(shí)間變換創(chuàng)建時(shí)間變換 利用已存在的時(shí)間系列變量值,通過函數(shù)變換產(chǎn)生新變量

17、,這些利用已存在的時(shí)間系列變量值,通過函數(shù)變換產(chǎn)生新變量,這些新變量的值在許多時(shí)間系列的分析過程中將要用到。時(shí)間系列變換新變量的值在許多時(shí)間系列的分析過程中將要用到。時(shí)間系列變換的操作如下:的操作如下:建立新變量時(shí)可使用的函數(shù)建立新變量時(shí)可使用的函數(shù)1、差值(差分)、差值(差分)(e413-1) 按差分的階數(shù)可分為一階差分、二階差分,其計(jì)算方法為:按差分的階數(shù)可分為一階差分、二階差分,其計(jì)算方法為:2、季節(jié)性差分、季節(jié)性差分(e413-2) 在計(jì)算季節(jié)性差分之前,必須先定義一個(gè)包含有周期成份的日期時(shí)間變量。在計(jì)算季節(jié)性差分之前,必須先定義一個(gè)包含有周期成份的日期時(shí)間變量。3、 中心移動(dòng)平均值中

18、心移動(dòng)平均值(413-3) 圍繞當(dāng)前值在一定范圍內(nèi)對(duì)變量的值求平均值。圍繞當(dāng)前值在一定范圍內(nèi)對(duì)變量的值求平均值。跨度為跨度為2 時(shí):時(shí):40.75=(48+38)/2+(38+39)/ 2)/2跨度為跨度為3 時(shí):時(shí):41.67=(48+38+39)/34、向前移移動(dòng)平均值、向前移移動(dòng)平均值 求當(dāng)前值的前方一定范圍內(nèi)的原始變量值的均值。求當(dāng)前值的前方一定范圍內(nèi)的原始變量值的均值。5. 運(yùn)行中位數(shù)運(yùn)行中位數(shù)圍繞當(dāng)前值在一定范圍內(nèi)對(duì)原始變量值求出中值。圍繞當(dāng)前值在一定范圍內(nèi)對(duì)原始變量值求出中值。跨度為2 時(shí):40.75=(48+38)/2+(38+39)/ 2)/2跨度為3 時(shí):39=mid(48,38,39)6、 累加求和累加求和(e413-6) 計(jì)算從第一個(gè)變量值起直到當(dāng)前變量值的總和。計(jì)算從第一個(gè)變量值起直到當(dāng)前變量值的總和。7. 延遲延遲 當(dāng)前變量的值等于相隔為延遲階數(shù)的前面的變量值。當(dāng)前變量的值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論