




已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
,數(shù)據(jù)管理,在數(shù)據(jù)文件建立好之后,還需要對數(shù)據(jù)進(jìn)行必要的加工處理。對同一個數(shù)據(jù)往往需要從各種不同的側(cè)面進(jìn)行研究,采取多種統(tǒng)計方法進(jìn)行分析,而不同的統(tǒng)計方法對數(shù)據(jù)文件結(jié)構(gòu)的要求不盡相同,這就需要對數(shù)據(jù)文件的結(jié)構(gòu)進(jìn)行重新調(diào)整或轉(zhuǎn)換,以便適合于相同的統(tǒng)計方法。,數(shù)據(jù)管理,文件級別的數(shù)據(jù)管理變量級別的數(shù)據(jù)管理,文件級別的數(shù)據(jù)管理(1),SPSS中的Data菜單提供了文件級別的數(shù)據(jù)管理,可以對整個數(shù)據(jù)文件進(jìn)行加工整理。,InsertVariable:插入變量InsertCases:插入記錄GotoCase:到達(dá)某條記錄,簡單命令(這些功能都可以用鼠標(biāo)在數(shù)據(jù)表界面直接完成,很少用菜單操作,在此不詳述),SortCases:記錄排序SplitFile:記錄拆分SelectCases:記錄篩選WeightCases:記錄加權(quán),常用的簡單過程(使用頻繁,必須掌握),文件級別的數(shù)據(jù)管理(2),DefineVariableProperties:定義數(shù)據(jù)字典CopyVariableProperties:將預(yù)定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件,即復(fù)制外部數(shù)據(jù)文件屬性到當(dāng)前數(shù)據(jù)文件,變量與數(shù)據(jù)文件屬性向?qū)В▽Υ笮突蜻B續(xù)性數(shù)據(jù)分析項目非常有用),Transpose:數(shù)據(jù)轉(zhuǎn)置Restructure:數(shù)據(jù)文件的重新排列,數(shù)據(jù)重構(gòu)向?qū)?文件級別的數(shù)據(jù)管理(3),AddCases:縱向合并AddVariable:橫向合并,文件合并過程(MergeFiles),DefineDates:定義日期變量過程,用于時間序列數(shù)據(jù)Aggregate:數(shù)據(jù)匯總過程IdentifyDuplicateCases:查找重復(fù)記錄,其他過程,文件級別的數(shù)據(jù)管理(4),正交設(shè)計過程(OrthogonalDesign),單變量排序:SPSS提供了一種簡易操作方法,即在數(shù)據(jù)表格的變量名處單擊右鍵,彈出右圖多變量排序:使用SortCases過程來進(jìn)行,查看詳情,記錄排序,記錄排序,選中District,選擇升序選鈕(默認(rèn)),將District選入Sortby框,選中Region,選擇降序選鈕,將Region選入Sortby框,記錄排序,注意:在多重排序中,指定排序變量名的次序很關(guān)鍵,首先安第一個變量排序,對于與第一個變量取值相同的記錄考慮按第二個變量排序排序后,原來記錄數(shù)據(jù)的排序?qū)⒈淮騺y,對于時間序列數(shù)據(jù),若未存放有記錄標(biāo)志的變量,應(yīng)注意保存原數(shù)據(jù)的排列順序,以免數(shù)據(jù)混亂,記錄排序,記錄拆分,1.選中此框不拆分文件,2.按所選變量拆分文件,各組分析結(jié)果放在一起便于比較,3.按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置,4.用于選擇拆分?jǐn)?shù)據(jù)文件的變量,5.要求將數(shù)據(jù)按所用拆分變量排序,6.數(shù)據(jù)集很大,且拆分變量已排序,選此可節(jié)省運(yùn)行時間,1,2,3,4,5,6,記錄拆分,記錄篩選,1,2,3,4,5,1.分析所有記錄,2.分析滿足條件的記錄,按If按鈕設(shè)定篩選條件,3.從原數(shù)據(jù)中按某種條件抽樣,按Sample進(jìn)行設(shè)定,4.基于時間或記錄序號選擇記錄,按Range進(jìn)行設(shè)定,5.使用篩選指示變量選擇記錄,非0值的記錄被選中,6.未選中的記錄被隔離,7.未選中的記錄被刪除,6,7,記錄篩選,記錄篩選,記錄加權(quán),設(shè)置作為權(quán)重的變量,如第一行表示agecat1gender1的人共33個,accid表示人數(shù),應(yīng)設(shè)為權(quán)重,記錄加權(quán),定義數(shù)據(jù)字典,變量名、測量尺度等,變量列表,頻數(shù)、標(biāo)簽、缺失值設(shè)定等,拷貝變量屬性,自動生成值標(biāo)簽,定義數(shù)據(jù)字典,數(shù)據(jù)轉(zhuǎn)置,Transpose:該過程用于對數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置,即原來的一條記錄轉(zhuǎn)成為一個變量,而變量則轉(zhuǎn)成為一個記錄,兩次Transpose過程后數(shù)據(jù)集會恢復(fù)原樣(點此見具體操作)。,數(shù)據(jù)轉(zhuǎn)置,將變量Group、x選入variable框,再點擊OK鍵,轉(zhuǎn)置前的數(shù)據(jù)集,轉(zhuǎn)置后的數(shù)據(jù)集,注:未選中的變量id其數(shù)據(jù)信息在轉(zhuǎn)置后丟失,數(shù)據(jù)轉(zhuǎn)置,數(shù)據(jù)文件重新排列,Restructure:此過程是用來改變數(shù)據(jù)的排列格式,即長型格式和寬型格式之間的互轉(zhuǎn)。,數(shù)據(jù)文件重新排列,數(shù)據(jù)文件重新排列,數(shù)據(jù)anxiety轉(zhuǎn)換前后的長型格式和型格式,數(shù)據(jù)文件重新排列,文件縱向合并,*:當(dāng)前數(shù)據(jù)集中的變量+:新添加數(shù)據(jù)集中的變量,左框:新、老數(shù)據(jù)文件中不匹配的變量名,右框:已匹配的變量名,選擇完成后單擊OK即可,AddCases:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。,文件縱向合并,文件橫向合并,1.未被納入的變量列2.被納入合并后新數(shù)據(jù)集的變量列表3.記錄匹配使用的關(guān)鍵變量,AddVariables:橫向合并,從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,兩個數(shù)據(jù)集要有一個一一對應(yīng)的關(guān)鍵變量進(jìn)行匹配合并,且記錄應(yīng)按關(guān)鍵變量升序后再合并。,1,2,3,文件橫向合并,數(shù)據(jù)匯總,分組變量,被匯總變量,數(shù)據(jù)匯總,定義匯總函數(shù),定義新產(chǎn)生匯總變量的名稱和標(biāo)簽,Function,Name&Label,數(shù)據(jù)匯總,查找重復(fù)記錄,希望查找重復(fù)值的變量,重復(fù)記錄按該變量的取值排序,設(shè)定第一個還是最后一個重復(fù)記錄為主記錄,查找重復(fù)記錄,PrimaryLast0表示相應(yīng)的記錄為重復(fù)記錄,查找重復(fù)記錄,變量級別的數(shù)據(jù)管理(1),SPSS中的Transform菜單提供了變量級別的數(shù)據(jù)管理,可以對變量進(jìn)行操作。,計算新變量(Compute):最常用,Recode:對變量值進(jìn)行分組合并VisualBander:連續(xù)變量的可視化分段Count:表示某個變量的取值中是否出現(xiàn)某個值,或某個區(qū)間RankCases:變量編秩AutomaticRecode:對記錄按某個變量值的大小排序,變量轉(zhuǎn)換,變量級別的數(shù)據(jù)管理(2),CreateTimeSeries:建立時間序列ReplaceMissingValues:缺失值替代RandomNumberSeed:設(shè)定隨機(jī)種子,專用過程,變量級別的數(shù)據(jù)管理(3),控制命令,RunPendingTransforms:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作,專用于時間序列模型,例1數(shù)據(jù)fee.sav是上海和杭州16名住院病人的費(fèi)用數(shù)據(jù),計算上海的住院病人平均每天的住院費(fèi)用,要求結(jié)果取整。,計算新變量,輸入新變量名perfee,計算新變量,計算新變量,輸入條件表達(dá)式,計算新變量,選擇函數(shù),輸入函數(shù)表達(dá)式,計算新變量,例2在數(shù)據(jù)fee.sav中生成新變量grade,當(dāng)住院總費(fèi)用小于5000元時取值為“相對較低”,大于等于5000元且小于7000元取值為“中等”,大于等于7000元且小于10000元為“較高”,大于等于10000元為“很高”。,變量值分組合并,新變量名grade,選入原變量total,變量值分組合并,變量值分組合并,三種Range的設(shè)置,所有的范圍均包含了端點,而前面設(shè)定的變換會優(yōu)于后面的變換,因此應(yīng)該將大于等于10000元最先設(shè)定,而將小于5000元最后設(shè)定。,變量值分組合并,變量值分組合并,變量值分組合并,變量值分組合并,務(wù)必選上該項,變量值分組合并,變量值分組合并,recode過程提供了精確分組的功能,但如果希望進(jìn)行的分組是有規(guī)律的,比如等距分組,或等樣本量分組,使用recode過程進(jìn)行操作就顯得非常麻煩,且可視化程度不高。此時可以考慮使用visualbander過程進(jìn)行可視化分段。,連續(xù)變量的可視化分段,例3仍以數(shù)據(jù)fee.sav為例,按變量total將病人分為5組,5000元以下為第一組,5000元以上的按等間距的方式分4組。,連續(xù)變量的可視化分段,連續(xù)變量的可視化分段,連續(xù)變量的可視化分段,設(shè)定分段規(guī)則,連續(xù)變量的可視化分段,連續(xù)變量的可視化分段,自動填充值標(biāo)簽,連續(xù)變量的可視化分段,例4仍以數(shù)據(jù)fee.sav為例,查看變量total中是否出現(xiàn)值6890。,查看特定變量值,查看特定變量值,查看特定變量值,查看特定變量值,查看特定變量值,例5仍以數(shù)據(jù)fee.sav為例,根據(jù)城市分組計算住院總費(fèi)用的秩次。,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 城市道路路面工程行業(yè)直播電商戰(zhàn)略研究報告
- 橋梁工程建筑行業(yè)跨境出海戰(zhàn)略研究報告
- 人造石制墓碑行業(yè)直播電商戰(zhàn)略研究報告
- 釣魚線行業(yè)直播電商戰(zhàn)略研究報告
- 乒乓球球臺行業(yè)直播電商戰(zhàn)略研究報告
- NN-二(2-氯乙基)甲胺行業(yè)跨境出海戰(zhàn)略研究報告
- 日常辦公用品購買合同二零二五年
- 二零二五版土地承包租賃協(xié)議書
- 二零二五辦公桌椅采購合同范例
- 二零二五版夫妻婚內(nèi)忠誠協(xié)議書范例
- 《偉大的友誼》(配套PPT)課件
- GB 13326-1991組合式空氣處理機(jī)組噪聲限值
- 2023年廣東省中學(xué)生生物學(xué)聯(lián)賽試題解析(word)及答案(掃描版)
- 治理理論課件
- APQP及五大工具課件
- 食品銷售流程圖
- 版匹茲堡睡眠質(zhì)量指數(shù)問卷附評分標(biāo)準(zhǔn)2
- 每周安全安全檢查記錄表
- 2. 精準(zhǔn)醫(yī)學(xué)與支氣管哮喘治療
- DB11-T 1812-2020既有玻璃幕墻安全性檢測與鑒定技術(shù)規(guī)程
- 第四節(jié) 張益-髁突骨折
評論
0/150
提交評論