版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第三章 SPSS數(shù)據(jù)的預處理數(shù)據(jù)的排序變量計算數(shù)據(jù)選取計數(shù)分類匯總數(shù)據(jù)分組數(shù)據(jù)預處理的其他功能第一節(jié)數(shù)據(jù)的排序數(shù)據(jù)排序的目的數(shù)據(jù)排序的基本操作數(shù)據(jù)排序的應用舉例數(shù)據(jù)排序的目的SPSS數(shù)據(jù)排序是將數(shù)據(jù)編輯窗口按照某個或多個指定變量的變量值升序或降序重新排列。排序目的便于數(shù)據(jù)的瀏覽,了解數(shù)據(jù)的取值狀況、缺失值數(shù)量等快捷找到數(shù)據(jù)的最大值和最小值快捷發(fā)現(xiàn)數(shù)據(jù)的異常值數(shù)據(jù)排序的基本操作(以職工數(shù)據(jù).sav為例)菜單數(shù)據(jù)排序個案以職稱主排序變量升序、工資收入第二排序變量升序為排序依據(jù)數(shù)據(jù)排序應用舉例(居民儲蓄調(diào)查數(shù)據(jù).sav)練習把年人均消費支出和教育.sav中的數(shù)據(jù)按照年人均可支配收入為主排序變量進行降序排列,教育支出為第二排序變量進行降序排列。第二節(jié)變量計算變量計算的目的SPSS算術(shù)表達式條件表達式函數(shù)變量計算的基本操作變量計算的目的數(shù)據(jù)的轉(zhuǎn)換處理對數(shù)據(jù)的原有分布狀態(tài)進行轉(zhuǎn)換SPSS變量計算后會得到一系列新變量,需注意:變量計算針對所有個案的,每條個案都有自己的計算結(jié)果。變量計算的結(jié)果應保存到一個指定變量中,該變量的數(shù)據(jù)類型與計算結(jié)果的數(shù)據(jù)類型要一致。SPSS算術(shù)表達式由常量、變量、算術(shù)運算符、圓括號、函數(shù)等組成的式子條件表達式簡單條件表達式由關(guān)系運算符、常量、變量以及算術(shù)表達式等組成的式子復合條件表達式由邏輯運算符號、圓括號和簡單條件表達式等組成的式子。函數(shù)算術(shù)函數(shù)統(tǒng)計函數(shù)分布函數(shù)邏輯函數(shù)字符函數(shù)日期函數(shù)缺失值函數(shù)其他函數(shù)變量計算的基本操作(以職工數(shù)據(jù).sav為例)菜單【轉(zhuǎn)換】【計算變量】第三節(jié)數(shù)據(jù)選取數(shù)據(jù)選取:即為樣本抽樣。目的:提高數(shù)據(jù)分析效率檢驗模型的需要按指定條件抽樣隨機抽樣選取某一區(qū)域內(nèi)的樣本通過過濾變量選取樣本SPSS中四種抽樣方法四種抽樣方法菜單【數(shù)據(jù)】【選擇個案】按指定條件抽樣隨機抽樣基于時間或個案全距通過過濾變量選取樣本第四節(jié)計數(shù)SPSS計數(shù)是指對所有個案或滿足其條件的部分個案,計算若干個變量中有幾個變量的值落在特定的區(qū)間內(nèi),并將計數(shù)結(jié)果存入一個新變量中的過程。關(guān)鍵步驟指定哪些變量參與計數(shù),計數(shù)的結(jié)果存入哪個變量中。指定計數(shù)區(qū)間單個變量值系統(tǒng)缺失值系統(tǒng)缺失值或用戶缺失值
給定最大值和最小值的區(qū)間小于等于某指定值的區(qū)間
大于等于某指定值的區(qū)間計數(shù)區(qū)間計數(shù)的基本操作以居民儲蓄調(diào)查數(shù)據(jù)(存款).sav為例菜單【轉(zhuǎn)換】
【對個案內(nèi)的值計數(shù)】以學生成績.sav為例對兩門課中成績在優(yōu)良以上(分數(shù)大于等于80分)的計數(shù)第五節(jié)分類匯總分類匯總是按照某分類進行的匯總計算。SPSS實現(xiàn)分類匯總需要明確:按照哪個變量進行分類對哪個變量進行匯總,并指定對哪些統(tǒng)計量進行計算分類匯總的基本操作菜單【數(shù)據(jù)】 【分類匯總】指定分類變量指定匯總變量單擊函數(shù)按鈕獲得指定分類結(jié)果保存到何處單擊變量名與標簽得到若要保存各分類組的個案數(shù)分類匯總后的結(jié)果練習將數(shù)據(jù)文件商品房購買意向調(diào)查模擬數(shù)據(jù).sav進行分類匯總。要求按照居住類型對月住房開銷進行分類匯總。并計算其均值和標準差,保存各分類組的個案數(shù),將保存結(jié)果選擇為:創(chuàng)建只包含匯總變量的新數(shù)據(jù)集。第六節(jié)數(shù)據(jù)分組數(shù)據(jù)分組就是根據(jù)統(tǒng)計研究的需要,將數(shù)據(jù)按照某種標準重新劃分為不同的組別。分組目的對數(shù)值型數(shù)據(jù)進行整理和粗略把握數(shù)據(jù)分布情況在數(shù)據(jù)分組基礎(chǔ)上對數(shù)據(jù)進行頻數(shù)分析實現(xiàn)數(shù)據(jù)的離散化處理SPSS的數(shù)據(jù)分組方法單變量值分組組距分組分位數(shù)分組單變量值分組SPSS單變量值分組是把每一個變量值作為一組,這種分組方法通常只適合于離散變量且變量值較少的情況?;静僮鞑藛巍巨D(zhuǎn)換】【自動重新編碼】以職工數(shù)據(jù).sav為例將分組變量基本工資(sr)選擇到右邊的框中在新名稱后輸入存放分組結(jié)果的變量名在重新編碼的起點中選擇是最低值進行還是最高值進行最低值表示升序,最高值表示降序組距分組組距分組是將全部變量值依次劃分為若干個區(qū)間,并將這一區(qū)間的變量值作為一組。在連續(xù)變量或變量值較多的情況下適用。分組關(guān)鍵分組數(shù)目的確定組數(shù)K=1+lgn/lg2 n為數(shù)據(jù)個數(shù)組距的確定
組距=(max-min)/k指定分組變量定義分組區(qū)間指定存放分組結(jié)果的變量SPSS分組操作應注意:基本操作一:【轉(zhuǎn)換】【重新編碼為相同變量】以職工數(shù)據(jù).sav為例把分組變量基本工資(sr)選到數(shù)字變量中單擊舊值和新值得到定義分組區(qū)間先指定區(qū)間范圍,再在“值”中添加對應的分組基本操作二、菜單轉(zhuǎn)換重新編碼為不同變量將分組變量基本工資(sr)選入數(shù)字變量定義輸出變量先指定區(qū)間范圍,再在“值”中添加對應的分組練習現(xiàn)有數(shù)據(jù)集學生成績.sav,要求對學生的數(shù)學成績進行分組,分為5組,依次為:不及格(60分以下)、及格(60~70)、中(70~80)、良(80~90)、優(yōu)(90分以上),且要求輸出變量為math1,標簽為
“分組后的數(shù)學成績”。Spss的分位數(shù)分組各組的下限值和上限值有分位數(shù)決定,且分位數(shù)中的個案數(shù)大致相當。關(guān)鍵:分組數(shù)目,相應的分位數(shù)的確定分位數(shù):是將全部數(shù)據(jù)按升序排序后并等分成n份后相應分位點上的變量值?;静僮鳎骸巨D(zhuǎn)換】—【可視離散化】【要離散的變量】命名離散的變量上端點,采用“上組限不在內(nèi)”的原則選擇【基于已掃描個案的等百分位】確定【分割點數(shù)量】點【生成分割點】和【生成標簽】Eg:職工數(shù)據(jù)按工資收入按四分位數(shù)進行分組。第七節(jié)數(shù)據(jù)預處理的其他功能數(shù)據(jù)轉(zhuǎn)置加權(quán)處理數(shù)據(jù)拆分SPSS變量集數(shù)據(jù)轉(zhuǎn)置(行列互換)以年人均消費支出和教育.Sav為例把變量和名稱變量分別選入對應位置標記變量加權(quán)處理數(shù)據(jù)拆分以數(shù)據(jù)加工(職工數(shù)據(jù)).sav為例SPSS數(shù)據(jù)文件的合并
當數(shù)據(jù)量較多時經(jīng)常會把一份大的數(shù)據(jù)分成幾個小的部分,有幾個錄入員分別錄入,以期加快數(shù)據(jù)錄入速度,但一份完整的數(shù)據(jù)被分別存儲在幾個數(shù)據(jù)文件中,如果要分析這份數(shù)據(jù)就必須首先將若干個小的數(shù)據(jù)文件合并起來。要實現(xiàn)兩個或多個
SPSS數(shù)據(jù)文件的合并,應首先將其中的某個數(shù)據(jù)文件讀入數(shù)據(jù)編輯窗口中,然后依次與其他數(shù)據(jù)文件合并。合并的方式有兩種:縱向合并和橫向合并??v向合并數(shù)據(jù)文件從外部數(shù)據(jù)文件中增加個案到當前數(shù)據(jù)文件中,稱為縱向合并,相互合并的數(shù)據(jù)文件應該有相同的變量。步驟:打開一個數(shù)據(jù)文件;菜單:【數(shù)據(jù)】+【合并文件】+【增加個案】注意:有變量的Pair(配對)問題,新的活動數(shù)據(jù)集中的變量框中顯示的變量名是兩個數(shù)據(jù)文件中都有的變量名,非成對變量框中的變量名是兩個文件中的不同變量名,其中變量名后面的*表示該變量是當前數(shù)據(jù)編輯窗口中的變量,+表示該變量是待合并文件中的變量。如果希望在合并后的數(shù)據(jù)文件中看出個案的來源,可以選擇將個案來源表示為項將自動生成一個變量名為
source01取值0或1的變量。橫向合并數(shù)據(jù)文件從外部數(shù)據(jù)文件增加變量到當前數(shù)據(jù)文件,稱為橫向合并,橫向合并文件時要注意以下三個問題:1、相互合并的數(shù)據(jù)文件必須至少有一個名稱相同的變量,該變量是兩文件橫向合作的依據(jù),稱為關(guān)鍵變量;2、兩個數(shù)據(jù)文件都必須先按關(guān)鍵變量進行升序排列;3、不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB 15605-2024粉塵爆炸泄壓規(guī)范
- 2025年度消防安全評估與咨詢服務合同3篇
- 2025年度高端裝備制造與出口總合同3篇
- 二零二五年度礦山地質(zhì)災害防治合同匯編3篇
- 2024版大學學生宿舍樓物業(yè)承包合同
- 二零二五年飯店客房經(jīng)營權(quán)及客房用品定制合同3篇
- 2024環(huán)保技術(shù)研發(fā)合同成果轉(zhuǎn)化
- 2024物流公司與倉儲企業(yè)之間的貨物運輸合同
- 2024行政訴訟刑事上訴狀案件調(diào)解與和解合同2篇
- 2024年精簡版勞動協(xié)議樣本模板版B版
- 第2課《濟南的冬天》課件-2024-2025學年統(tǒng)編版語文七年級上冊
- 2024年水利工程高級工程師理論考試題庫(濃縮400題)
- 增強現(xiàn)實技術(shù)在藝術(shù)教育中的應用
- TD/T 1060-2021 自然資源分等定級通則(正式版)
- 《創(chuàng)傷失血性休克中國急診專家共識(2023)》解讀
- 倉庫智能化建設(shè)方案
- 海外市場開拓計劃
- 供應鏈組織架構(gòu)與職能設(shè)置
- 幼兒數(shù)學益智圖形連線題100題(含完整答案)
- 七上-動點、動角問題12道好題-解析
- 2024年九省聯(lián)考新高考 數(shù)學試卷(含答案解析)
評論
0/150
提交評論