版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
應(yīng)用統(tǒng)計學(xué)軟件第3章數(shù)據(jù)文件、變量與函數(shù)第4章數(shù)據(jù)預(yù)處理SPSS數(shù)據(jù)文件的管理SPSS數(shù)據(jù)的錄入與編輯
讀取其他格式的數(shù)據(jù)文件SPSS數(shù)據(jù)的保存SPSS數(shù)據(jù)文件的合并SPSS數(shù)據(jù)的錄入與編輯1數(shù)據(jù)的錄入2數(shù)據(jù)的編輯錄入是在數(shù)據(jù)視圖和變量視圖編輯主要在菜單欄的編輯數(shù)據(jù)的錄入錄入操作在數(shù)據(jù)編輯窗口中的dataview中實現(xiàn),與excel基本類似;逐行錄入按tab鍵;逐列錄入按enter鍵;錄入帶有變量值標(biāo)簽的數(shù)據(jù)通過下拉按鈕完成;數(shù)據(jù)的編輯數(shù)據(jù)的定位插入和刪除一個個案插入和刪除一個變量數(shù)據(jù)的移動、復(fù)制和刪除數(shù)據(jù)的定位人工定位自動定位1按個案號碼定位2按變量值自動定位插入和刪除一個個案插入個案data-insertcase刪除個案cut插入和刪除一個變量插入一個新變量Data-insertvariable刪除一個變量cut數(shù)據(jù)的移動、復(fù)制和刪除定義源數(shù)據(jù)塊單擊鼠標(biāo)右鍵指定目標(biāo)單元讀取其他格式的數(shù)據(jù)文件直接讀入其他格式的數(shù)據(jù)文件使用文本向?qū)ёx入文本文件SPSS可以直接打開和保存下述類型的文件:*.sav:SPSSforwindows的數(shù)據(jù)文件;*.sys:SPSS/PC+數(shù)據(jù)文件;*.syd:Systat軟件包的系統(tǒng)文件;*.por:SPSSforWindows版本的ASCII碼數(shù)據(jù)文件;*.xls,*.xlsx,*.xlsm:Excel數(shù)據(jù)文件;*.dbf:數(shù)據(jù)庫dBase,F(xiàn)oxbase格式數(shù)據(jù)文件;*.sas7dbat,*.sd7,*.sd2,*.ssd01,*.ssd07,*.xpt:SAS文件*.txt,*.dat:文本文件數(shù)據(jù)文件;*.dta:數(shù)據(jù)管理統(tǒng)計繪圖軟件數(shù)據(jù)文件。直接讀入其他格式的數(shù)據(jù)文件操作:File-open-data如果讀入dbase數(shù)據(jù)文件,則數(shù)據(jù)庫文件中的字段名、字段類型將自動轉(zhuǎn)成SPSS中的變量名和變量類型;如果讀入excel文件,可以選擇某個區(qū)域的數(shù)據(jù)文件,還可以選擇變量名的保存;EXCEL數(shù)據(jù)讀入1)按【文件】→【打開】→【數(shù)據(jù)】的順序使用菜單命令調(diào)出打開數(shù)據(jù)對話框,在文件類型下拉列表中選擇“Excel(*.xls,*.xlsx,*.xlsm)”;2)選擇需要打開的數(shù)據(jù)文件,單擊“打開”按鈕,打開“Excel數(shù)據(jù)源”對話框;使用文本向?qū)ёx入文本文件操作file-readtextdata通過例題來實現(xiàn)(例題庫)原始數(shù)據(jù)讀取*.txt數(shù)據(jù)1)、按【文件】→【打開】→【數(shù)據(jù)】的順序使用菜單命令調(diào)出打開數(shù)據(jù)對話框,在文件類型下拉列表中選擇“文本格式(*.txt,*.dat),系統(tǒng)會自動啟動文本倒入向?qū)υ捒?;“住房狀況調(diào)查.txt”中的數(shù)據(jù),讀入SPSS系統(tǒng)中,如果在導(dǎo)入數(shù)據(jù)之前,做了變量的預(yù)定義,則選擇“是”,如果沒有做預(yù)定義,則選擇“否”該區(qū)域顯示的是文本文件中的數(shù)據(jù)預(yù)覽變量名是否在文件頂部,如果在則選“是”使用固定寬度進(jìn)行內(nèi)容識別以某種分割符進(jìn)行內(nèi)容識別如果第一行包含“變量名”,這里必須從2開始設(shè)定個案的表示方式,按行還是按編號設(shè)定需要導(dǎo)入的個案,可自行設(shè)定,默認(rèn)是全部個案。設(shè)定變量之間的分割符設(shè)定選中列數(shù)據(jù)的變量名稱設(shè)定選中列數(shù)據(jù)的變量類型黃色列為目前所選擇的列是否需要對該操作的文件格式和語法進(jìn)行保存數(shù)據(jù)的保存數(shù)據(jù)讀入習(xí)題1、請將“住房狀況調(diào)查.txt”數(shù)據(jù)讀入到SPSS中;2、請將“學(xué)生管理數(shù)據(jù)庫中的數(shù)據(jù).xls”讀入到SPSS中;3、請將“學(xué)生情況.txt”數(shù)據(jù)讀入到SPSS中(固定列寬);SPSS數(shù)據(jù)的保存SPSS支持的數(shù)據(jù)格式SPSS格式文件,擴(kuò)展名.savExcel格式文件,擴(kuò)展名.xlsDbf格式文件,擴(kuò)展名.dbf文本格式文件,擴(kuò)展名.dat注意:非spss數(shù)據(jù)文件可以被相應(yīng)軟件讀取,但是不會保存變量的屬性,因此保存spss文件時,一般保存兩種格式,便于分析和共享。保存數(shù)據(jù)文件的基本操作File-savedata或saveas可以選擇保存那些變量保存為excel文件格式時注意變量的保存可選擇SPSS數(shù)據(jù)文件的合并原因數(shù)據(jù)量比較大的時候,需要把龐大的數(shù)據(jù)分成若干份,同時由幾個錄入員工作,然后再進(jìn)行合并。定義將一個(或多個)已存儲在磁盤上的spss數(shù)據(jù)文件分別依次合并到spss數(shù)據(jù)編輯窗口中的數(shù)據(jù)文件中。兩種方式縱向合并橫向合并縱向合并數(shù)據(jù)文件定義將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個spss數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行首尾對接,也就是依據(jù)變量名進(jìn)行追加。舉例應(yīng)用縱向合并案例有兩份關(guān)于職工基本情況的spss數(shù)據(jù)文件,變量名不盡相同,合并數(shù)據(jù)。注意:變量名和缺失值問題兩個待合并的數(shù)據(jù)文件的內(nèi)容合并應(yīng)有意義;為方便合并數(shù)據(jù),不同的數(shù)據(jù)文件相同的數(shù)據(jù)項最好其相同的變量名;首先打開其中一個數(shù)據(jù)文件在該文件中操作
data-mergefile-addcases數(shù)據(jù)-合并文件-添加個案橫向合并數(shù)據(jù)將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個spss數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行左右對接,拼到右邊應(yīng)用案例職工基本情況的數(shù)據(jù)文件橫向合并問題:1、兩個數(shù)據(jù)文件至少有一個名稱相同的變量,叫關(guān)鍵變量,是橫向合并的依據(jù),此處為zgh;2、兩個數(shù)據(jù)文件都必須按照關(guān)鍵變量進(jìn)行升序排序3、不同的數(shù)據(jù)文件數(shù)據(jù)含義不同的變量名應(yīng)該不同操作:Data-mergefile-addvariables第4章SPSS數(shù)據(jù)的預(yù)處理問題缺失值和異常數(shù)據(jù)的處理數(shù)據(jù)的轉(zhuǎn)換處理數(shù)據(jù)抽樣選取變量[1]數(shù)據(jù)的排序[2]變量的計算[3]數(shù)據(jù)的選取[1]數(shù)據(jù)排序作用便于瀏覽,掌握取值狀況和缺失值快速定位最值,把握離散狀況快捷發(fā)現(xiàn)異常值操作data-sortcases注意:整行排序次序分主次應(yīng)注意備份應(yīng)用案例應(yīng)用案例利用居民儲蓄調(diào)查數(shù)據(jù),通過排序分別找到城鎮(zhèn)戶口和農(nóng)村戶口儲戶一次存取款金額的最大值和最小值
結(jié)果分析從排序后的數(shù)據(jù)庫可以看出無論城鎮(zhèn)居民還是農(nóng)村居民,他們一次存款金額的差距都是非常大的,分別為1元和100001元,在一個側(cè)面上反映出一定的貧富差距。[2]變量計算目的數(shù)據(jù)的轉(zhuǎn)換處理比如利用基本工資、三金計算實際收入;對數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換1對數(shù)、多項式轉(zhuǎn)換對非正態(tài)或非線性數(shù)據(jù)進(jìn)行處理;2時間序列進(jìn)行平穩(wěn)化處理;3區(qū)間變換壓縮數(shù)據(jù)取值范圍和標(biāo)準(zhǔn)化處理注意:1變量計算針對所有個案(或指定個案),每個個案都有自己的計算結(jié)果;2變量計算的結(jié)果應(yīng)保存到一個指定變量幾個概念變量計算的幾個概念SPSS算術(shù)表達(dá)式SPSS條件表達(dá)式SPSS函數(shù)SPSS算術(shù)表達(dá)式由常量、變量、算術(shù)運(yùn)算符、圓括號、函數(shù)等組成的式子字符型常量應(yīng)加引號算術(shù)運(yùn)算的次序:先計算乘方,再計算乘除,最后計算加減。從左往右順序計算,圓括號優(yōu)先;數(shù)據(jù)類型應(yīng)該一致SPSS條件表達(dá)式目的變量計算中對不同SPSS組(類)的個案分別按不同的方法進(jìn)行計算分類簡單條件表達(dá)式<>=~=<=>=復(fù)合條件表達(dá)式&或AND|或OR~或NOT注意運(yùn)算優(yōu)先級例(nl<=35)andnot(zc<3)表示年齡不大于35且職稱不低于3,符合該條件的判斷結(jié)果為真。其余為假。SPSS函數(shù)具體形式函數(shù)名(參數(shù))函數(shù)分類(八大類)算術(shù)函數(shù)統(tǒng)計函數(shù)分布函數(shù)邏輯函數(shù)字符函數(shù)日期函數(shù)缺失值函數(shù)其他函數(shù)基本操作Transform-compute應(yīng)用舉例應(yīng)用舉例利用職工基本情況數(shù)據(jù),依據(jù)職稱級別計算實發(fā)工資。假設(shè)職稱1至4職工的工資分別上調(diào)50%,30%,20%,10%;實發(fā)工資=(基本工資-失業(yè)保險)x(1+?)[3]數(shù)據(jù)選取目的選取的基本方式基本操作應(yīng)用舉例目的提高數(shù)據(jù)分析效率抽取的樣本應(yīng)具有總體代表性檢驗?zāi)P偷男枰徊糠謽颖緟⑴c建模,剩余的用于檢驗選取的基本方式按指定條件選取(ifconditionissatisfied)隨機(jī)抽樣(randomsampleofcases)1、近似抽樣(隨機(jī)數(shù)發(fā)生器)2、精確抽樣某一區(qū)域內(nèi)的樣本通過過濾變量選取樣本Data-selectcases基本操作選擇“數(shù)據(jù)”|“選擇個案”命令,打開對話框:系統(tǒng)默認(rèn)選項,關(guān)閉所有的過濾情況當(dāng)前數(shù)據(jù)視圖中的所有變量,黃色為選中變量使用條件表達(dá)式進(jìn)行指定條件的選擇進(jìn)行隨機(jī)抽樣選擇指定個案的選擇范圍根據(jù)的指定變量,過濾其值為0或缺失值的個案指定被過濾個案的處理方式如果條件滿足設(shè)定欄目條件表達(dá)式的正確寫法:30<年齡<50(錯誤寫法)隨機(jī)個案樣本設(shè)定欄目指定一個1-100的值,作為隨機(jī)抽樣的比例:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國長輸油柔性管市場調(diào)查研究報告
- 2025年中國濕法印刷革市場調(diào)查研究報告
- 2025年草莓水果冰糕項目可行性研究報告
- 2025年中國塑料打包帶機(jī)組市場調(diào)查研究報告
- 2025年回熔爐項目可行性研究報告
- 2025年博落回生物總堿項目可行性研究報告
- 2025至2030年葛花原生茶項目投資價值分析報告
- 2025至2030年生物醫(yī)藥制劑項目投資價值分析報告
- 2025至2030年水冷恒溫恒濕機(jī)項目投資價值分析報告
- 2025至2030年托槽去除鉗項目投資價值分析報告
- 關(guān)于合同知識的全面解讀
- Unit 6 Beautiful landscapes Integration 說課稿 -2024-2025學(xué)年譯林版英語七年級下冊001
- 2024年常德職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫
- 2025 年福建省中考語文試題:作文試題及范文
- 短視頻運(yùn)營績效考核表KPI-企業(yè)管理
- 【譯林】九下英語單詞默寫表
- IEC 62368-1標(biāo)準(zhǔn)解讀-中文
- 第八節(jié) 元代散曲
- 《自動化專業(yè)導(dǎo)論》課程教學(xué)大綱
- 消防設(shè)施維護(hù)與日常檢查培訓(xùn)講義
- 良性陣發(fā)性位置性眩暈完整版本課件
評論
0/150
提交評論