SPSS統(tǒng)計(jì)分析—SPSS數(shù)據(jù)文件的建立和整理_第1頁
SPSS統(tǒng)計(jì)分析—SPSS數(shù)據(jù)文件的建立和整理_第2頁
SPSS統(tǒng)計(jì)分析—SPSS數(shù)據(jù)文件的建立和整理_第3頁
SPSS統(tǒng)計(jì)分析—SPSS數(shù)據(jù)文件的建立和整理_第4頁
SPSS統(tǒng)計(jì)分析—SPSS數(shù)據(jù)文件的建立和整理_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2022-5-4創(chuàng)建新數(shù)據(jù)文件創(chuàng)建新數(shù)據(jù)文件定義變量名定義變量名指定各變量屬性指定各變量屬性輸入數(shù)據(jù)輸入數(shù)據(jù)保存保存2022-5-4一、變量類型與測(cè)量尺度一、變量類型與測(cè)量尺度變量類型:變量類型:數(shù)值型數(shù)值型 和和 字符型字符型 數(shù)值型數(shù)值型:如分?jǐn)?shù)、收入、銷售額等如分?jǐn)?shù)、收入、銷售額等 字符型字符型:如血型、性別等如血型、性別等 Tips:SPSSSPSS默認(rèn)的是數(shù)值型默認(rèn)的是數(shù)值型2022-5-4變量類型變量類型 vs 測(cè)量尺度測(cè)量尺度例:例:“性別性別”變量:變量: 1男,男, 2女女 “成績等級(jí)成績等級(jí)”變量:變量:1最高最高,2中等中等,3最低最低Question:“1” ” 在不同

2、變量中意義有何不在不同變量中意義有何不同?同?2022-5-4測(cè)量尺度:測(cè)量尺度:數(shù)據(jù)的測(cè)量尺度表現(xiàn)為:數(shù)據(jù)的測(cè)量尺度表現(xiàn)為: 定類尺度定類尺度定序尺度定序尺度定距尺度定距尺度定比尺度定比尺度 計(jì)量水平由低級(jí)到高級(jí)計(jì)量水平由低級(jí)到高級(jí) 定類尺度定類尺度Nominal 定序尺度定序尺度Ordinal定距尺度定距尺度Interval定比尺度定比尺度Scale表示類別或?qū)俦硎绢悇e或?qū)傩孕员硎绢悇e和表示類別和順順序序表示類別、順表示類別、順序、序、距離距離表示類別、順表示類別、順序、距離、序、距離、比值比值性別性別/宗教信宗教信仰仰產(chǎn)品等級(jí)產(chǎn)品等級(jí)/學(xué)學(xué)歷歷分?jǐn)?shù)分?jǐn)?shù)/溫度溫度收入收入/身高身高等于或不

3、等于等于或不等于比較大小比較大小加減運(yùn)算加減運(yùn)算加減乘除加減乘除2022-5-4一般來說,數(shù)據(jù)的等級(jí)越高,應(yīng)用范圍越廣泛,等級(jí)越低,應(yīng)用范圍越受限。不同測(cè)度級(jí)別的數(shù)據(jù),應(yīng)用范圍不同。等級(jí)高的數(shù)據(jù),可以兼有等級(jí)低的數(shù)據(jù)的功能,而等級(jí)低的數(shù)據(jù),不能兼有等級(jí)高的數(shù)據(jù)的功能。2022-5-4二、二、定義新變量定義新變量(進(jìn)入變量編輯窗口進(jìn)入變量編輯窗口)名稱名稱:名稱長度控制在名稱長度控制在8 8位以位以內(nèi)內(nèi), ,并盡量使用英文名稱。并盡量使用英文名稱。類型類型:寬度寬度:小數(shù)小數(shù):標(biāo)簽標(biāo)簽:對(duì)變量進(jìn)行解釋對(duì)變量進(jìn)行解釋值值:可簡化數(shù)據(jù)錄入例可簡化數(shù)據(jù)錄入例:性別性別 1男男 2女女缺失缺失:缺失值的

4、處理方法缺失值的處理方法,多多用于嚴(yán)格的大型調(diào)查用于嚴(yán)格的大型調(diào)查列列:對(duì)齊對(duì)齊:測(cè)量測(cè)量:變量的測(cè)量尺度變量的測(cè)量尺度2022-5-4二、定義新變量二、定義新變量練習(xí)題:練習(xí)題:ID城市城市 北京北京 廣州廣州 上海上海 深圳深圳 武漢武漢性別性別 男男 女女文化程度文化程度 大專及以下大專及以下 大專大專 本科本科 碩士研究生碩士研究生 碩士研究生以上碩士研究生以上職位等級(jí)職位等級(jí) 一般員工一般員工 基層管理者基層管理者 中層管理者中層管理者 高層管理者高層管理者企業(yè)規(guī)模企業(yè)規(guī)模 小型(小型(50人以下)人以下) 中型(中型(50-200人)人) 大型(大型(200人以上)人以上)企業(yè)性質(zhì)

5、企業(yè)性質(zhì) 國企國企 機(jī)關(guān)機(jī)關(guān) 事業(yè)單位事業(yè)單位 外資外資 合資合資年總收入年總收入月基本工資月基本工資1月月-12月份加班工資月份加班工資1月月-12月獎(jiǎng)金月獎(jiǎng)金 虛擬100人隨機(jī)數(shù)據(jù)的產(chǎn)生(RAND)2022-5-4Problems: 名稱:盡可能用英文名稱:盡可能用英文 變量類型:字符變量類型:字符 or or 數(shù)值型,寬度,小數(shù)數(shù)值型,寬度,小數(shù)點(diǎn)點(diǎn) 模擬數(shù)據(jù)的合理性模擬數(shù)據(jù)的合理性數(shù)據(jù)檢查數(shù)據(jù)檢查 無數(shù)據(jù)無數(shù)據(jù) vsvs 缺失值缺失值 變量命名必須唯一,不能有兩個(gè)相同的變量命名必須唯一,不能有兩個(gè)相同的變量名變量名2022-5-4Exercise1 1、導(dǎo)入、導(dǎo)入SPSSSPSS自帶的

6、自帶的demo.xlsdemo.xls文件,導(dǎo)入時(shí)只文件,導(dǎo)入時(shí)只要包含要包含demodemo中的前三個(gè)變量中的前三個(gè)變量2 2、導(dǎo)入、導(dǎo)入SPSSSPSS自帶的自帶的demo.txtdemo.txt文件文件TipsTips:C:Program Files SPSS tutorial sample_filesdemo(.xls/.txt)2022-5-4Problems: 名稱:盡可能用英文名稱:盡可能用英文 變量類型:字符變量類型:字符 or or 數(shù)值型,寬度,數(shù)值型,寬度,小數(shù)點(diǎn)小數(shù)點(diǎn) 模擬數(shù)據(jù)的合理性模擬數(shù)據(jù)的合理性數(shù)據(jù)檢查數(shù)據(jù)檢查 無數(shù)據(jù)無數(shù)據(jù) vsvs 缺失值缺失值2022-5-4

7、三、數(shù)據(jù)的錄入和修改三、數(shù)據(jù)的錄入和修改(進(jìn)入數(shù)據(jù)編輯的數(shù)據(jù)窗口進(jìn)入數(shù)據(jù)編輯的數(shù)據(jù)窗口data view) 1. 在在SPSS中直接錄入中直接錄入Tips:使用鍵盤而非鼠標(biāo)進(jìn)行操作使用鍵盤而非鼠標(biāo)進(jìn)行操作2022-5-4三、數(shù)據(jù)的錄入和修改三、數(shù)據(jù)的錄入和修改2. 從外部文件導(dǎo)入從外部文件導(dǎo)入(1)Excel(.xls):): 菜單菜單:file open data選擇.xls文件類型 直接從excel中copy,paste到spssTips:簡單但不智能,如變量名空缺,字符型變量缺失簡單但不智能,如變量名空缺,字符型變量缺失(2)文本文檔(文本文檔(.txt) 菜單菜單:fileRead t

8、ext data2022-5-4 第一步:第一步:“你的文本文件和預(yù)定義你的文本文件和預(yù)定義格式是否相一致格式是否相一致”2022-5-4 第二步:第二步:“變量如何排列變量如何排列”? “變量名包括在文件最前面么?變量名包括在文件最前面么?”2022-5-4 第三步:第三步:“第一條記錄從第幾行開始第一條記錄從第幾行開始”“你的記錄是怎樣存儲(chǔ)在文件中的?你的記錄是怎樣存儲(chǔ)在文件中的?” “你想導(dǎo)入多少條記錄?你想導(dǎo)入多少條記錄?” 2022-5-4 第四步:第四步:“變量間用的是哪種分變量間用的是哪種分隔符?隔符?” 2022-5-4 第五步:第五步:“定義在數(shù)據(jù)預(yù)覽窗口中所定義在數(shù)據(jù)預(yù)覽窗

9、口中所選擇的變量。選擇的變量?!?2022-5-4 第六步:第六步:“你愿意保存這次的文件(讀入)格式設(shè)置你愿意保存這次的文件(讀入)格式設(shè)置以備下次使用嗎?以備下次使用嗎?” “你是否愿意將以上操作粘貼為你是否愿意將以上操作粘貼為SPSS語語句?句?” 2022-5-4Exercise1 1、導(dǎo)入、導(dǎo)入SPSSSPSS自帶的自帶的demo.xlsdemo.xls文件,導(dǎo)入時(shí)只文件,導(dǎo)入時(shí)只要包含要包含demodemo中的前三個(gè)變量中的前三個(gè)變量2 2、導(dǎo)入、導(dǎo)入SPSSSPSS自帶的自帶的demo.txtdemo.txt文件文件TipsTips:C:Program Files SPSS tu

10、torial sample_filesdemo(.xls/.txt)2022-5-4三、數(shù)據(jù)的錄入和修改三、數(shù)據(jù)的錄入和修改 數(shù)據(jù)必須輸入正確才能保證正確的數(shù)據(jù)必須輸入正確才能保證正確的分析結(jié)果。分析結(jié)果。 但很難一次輸入正確,所以就需要但很難一次輸入正確,所以就需要進(jìn)行修改,一般包括數(shù)據(jù)的進(jìn)行修改,一般包括數(shù)據(jù)的插入、插入、刪除、修改刪除、修改等。等。2022-5-4三、數(shù)據(jù)的錄入和修改三、數(shù)據(jù)的錄入和修改 找到單元格找到單元格 - 重新輸入數(shù)據(jù)重新輸入數(shù)據(jù)查找辦法:查找辦法:1 1、移動(dòng)指針到指定序號(hào)的觀測(cè)值、移動(dòng)指針到指定序號(hào)的觀測(cè)值Data Go to Case2 2、查找指定變量中的

11、指定數(shù)據(jù)(定位、查找指定變量中的指定數(shù)據(jù)(定位到單元格)到單元格)Edit+Find(或(或工具欄上的工具欄上的Find圖標(biāo)按鈕圖標(biāo)按鈕) 2022-5-4三、數(shù)據(jù)的錄入和修改三、數(shù)據(jù)的錄入和修改 插入一個(gè)變量插入一個(gè)變量在現(xiàn)存變量的右邊:在現(xiàn)存變量的右邊:直接在直接在Variable View中定義中定義在現(xiàn)存變量的中間:在現(xiàn)存變量的中間: Data View或或Variable View 點(diǎn)擊右鍵點(diǎn)擊右鍵“insert variables” 菜單:菜單:Data Insert Variable Tips:所添加的變量都在現(xiàn)存變量前一個(gè)位置所添加的變量都在現(xiàn)存變量前一個(gè)位置 刪除一個(gè)變量刪除

12、一個(gè)變量 Data View選中一列數(shù)據(jù),右鍵選中一列數(shù)據(jù),右鍵clear Variable View選中一變量名,右鍵選中一變量名,右鍵clear2022-5-4三、數(shù)據(jù)的錄入和修改三、數(shù)據(jù)的錄入和修改 插入一個(gè)觀測(cè)值插入一個(gè)觀測(cè)值在最后在最后:直接輸入:直接輸入在中間在中間 :Data Insert CasesTips:結(jié)果是直接插入一空白行 刪除一個(gè)觀測(cè)值刪除一個(gè)觀測(cè)值 選中觀測(cè)量序號(hào),后按選中觀測(cè)量序號(hào),后按Del,或右鍵,或右鍵clear批量數(shù)據(jù)調(diào)整批量數(shù)據(jù)調(diào)整 選中一列數(shù)據(jù),鼠標(biāo)右鍵選中一列數(shù)據(jù),鼠標(biāo)右鍵cut,copy,paste Exercise:數(shù)據(jù)的錄入和修改:數(shù)據(jù)的錄入和

13、修改2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 SPSS的一個(gè)重要功能的一個(gè)重要功能 File, Data, Transform 三大菜單三大菜單2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之File菜單詳解菜單詳解 一、新建數(shù)據(jù)文件(略)一、新建數(shù)據(jù)文件(略) 二、導(dǎo)入外部數(shù)據(jù)(重點(diǎn))二、導(dǎo)入外部數(shù)據(jù)(重點(diǎn)) 三、保存數(shù)據(jù)文件三、保存數(shù)據(jù)文件 Save Save 保存為同一數(shù)據(jù)文件 Save as Save as 保存為不同數(shù)據(jù)文件,或者只保存文件中的部分變量 Example in SPSSExample in SPSS2022-5-4 四、四、File File 菜單中的其他菜單中的

14、其他條目條目 Display Data InfoDisplay Data Info 系統(tǒng)會(huì)在結(jié)果窗口中顯示所選數(shù)據(jù)文件的詳細(xì)情況,包括建立時(shí)間、標(biāo)簽設(shè)置、變量設(shè)置等信息Give ExampleGive Example Cache Data Cache Data 緩沖區(qū)加快處理速度,用于處理遠(yuǎn)程數(shù)據(jù) Print Print 和和 Print viewPrint view打印和打印預(yù)覽 2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Utilities菜單詳解菜單詳解 一、一、 Utilities Variables 菜單項(xiàng):菜單項(xiàng): 該菜單項(xiàng)用于顯示各個(gè)變量的基本信息該菜單項(xiàng)用于顯示各個(gè)變量的

15、基本信息 注:與注:與FILE菜單中的菜單中的Display Data Info 有所不同,前者單獨(dú)顯示各個(gè)變量的信息,后有所不同,前者單獨(dú)顯示各個(gè)變量的信息,后者顯示整個(gè)文件的信息者顯示整個(gè)文件的信息Give example二、二、 Utilities File info菜單項(xiàng):菜單項(xiàng):Thinking:比較比較File菜單中的菜單中的display data info與與Utilities菜單中的菜單中的variables以及以及Display data info 三者功能有何不同三者功能有何不同?2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Utilities菜單詳解菜單詳解三、三、

16、 UtilitiesDefine Sets :定義定義變量集變量集用途用途:當(dāng)數(shù)據(jù)文件中涉及到大量的變量,當(dāng)數(shù)據(jù)文件中涉及到大量的變量,而我們所做的統(tǒng)計(jì)分析而我們所做的統(tǒng)計(jì)分析僅用到文件中的僅用到文件中的某幾個(gè)變量時(shí)某幾個(gè)變量時(shí)常常需要定義變量集,即常常需要定義變量集,即將所要將所要用到的變量定義成一個(gè)集合用到的變量定義成一個(gè)集合。 Exercise:定義工資表中的變量集:定義工資表中的變量集2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Data菜單詳解菜單詳解 【Sort Cases對(duì)話框?qū)υ捒颉坑猛居猛荆簩?shù)據(jù)按照某一變量或某幾個(gè)變量將數(shù)據(jù)按照某一變量或某幾個(gè)變量進(jìn)行排序進(jìn)行排序 Gi

17、ve Example2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Data菜單詳解菜單詳解【Transpose對(duì)話框?qū)υ捒颉?對(duì)數(shù)據(jù)進(jìn)行對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)置行列轉(zhuǎn)置原文件中的一行數(shù)據(jù)原文件中的一行數(shù)據(jù)變?yōu)樾挛募械囊涣袛?shù)據(jù),反之亦然變?yōu)樾挛募械囊涣袛?shù)據(jù),反之亦然 可以在原數(shù)據(jù)文件中指定一個(gè)變量記錄轉(zhuǎn)置后可以在原數(shù)據(jù)文件中指定一個(gè)變量記錄轉(zhuǎn)置后的變量名的變量名 Give Example:性別為新變量名,將第一季度獎(jiǎng)金:性別為新變量名,將第一季度獎(jiǎng)金進(jìn)行轉(zhuǎn)置進(jìn)行轉(zhuǎn)置 2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Data菜單詳解菜單詳解【Merge Files對(duì)話框?qū)υ捒颉?Add cas

18、es 從外部數(shù)據(jù)文件中從外部數(shù)據(jù)文件中增加記錄(僅觀測(cè)值)增加記錄(僅觀測(cè)值)到當(dāng)前數(shù)據(jù)文件中,稱為到當(dāng)前數(shù)據(jù)文件中,稱為縱向合并縱向合并兩文件兩文件需具有相同的變量需具有相同的變量 Give Example Add variables 從外部數(shù)據(jù)文件從外部數(shù)據(jù)文件增加變量增加變量到當(dāng)前數(shù)據(jù)文到當(dāng)前數(shù)據(jù)文 件,稱為件,稱為橫向合并橫向合并 Give Example 2022-5-4Exercise Exercise DataData1 1:以文化程度(升)和職業(yè)等級(jí)(降)將:以文化程度(升)和職業(yè)等級(jí)(降)將工資表排序工資表排序TipsTips:注意當(dāng)兩個(gè)變量的排序相反時(shí),:注意當(dāng)兩個(gè)變量的排

19、序相反時(shí),SPSSSPSS如何處如何處理?理?2 2:以城市類型為新變量名,將工人全年加:以城市類型為新變量名,將工人全年加班費(fèi)(班費(fèi)(1212個(gè)變量)進(jìn)行行列轉(zhuǎn)置個(gè)變量)進(jìn)行行列轉(zhuǎn)置 TipsTips:注意轉(zhuǎn)換后文件的變量名:注意轉(zhuǎn)換后文件的變量名2022-5-4Exercise Exercise DataData3 3:新建一個(gè)數(shù)據(jù)文件,其中含有:新建一個(gè)數(shù)據(jù)文件,其中含有“城市城市”和和“地區(qū)地區(qū)”兩個(gè)變量,每個(gè)變量有兩個(gè)變量,每個(gè)變量有1010個(gè)觀測(cè)值個(gè)觀測(cè)值(數(shù)值為隨機(jī)數(shù)),然后將新文件的(數(shù)值為隨機(jī)數(shù)),然后將新文件的“城市城市”變量中所有觀測(cè)值合并到變量中所有觀測(cè)值合并到“工資表

20、工資表”中中4 4:新建一個(gè)數(shù)據(jù)文件,其中含有:新建一個(gè)數(shù)據(jù)文件,其中含有“id”id”和和“area”area”兩個(gè)變量。其中兩個(gè)變量。其中idid變量的數(shù)值為變量的數(shù)值為100100110110,areaarea變量的數(shù)值為隨機(jī)數(shù)。然后變量的數(shù)值為隨機(jī)數(shù)。然后以以idid為為key variablekey variable將新數(shù)據(jù)文件中的將新數(shù)據(jù)文件中的“area”area”變量合并到變量合并到“工資表工資表”中中TipsTips:注意有無:注意有無key variablekey variable的結(jié)果差異的結(jié)果差異2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Data菜單詳解菜單詳解

21、【Aggregate對(duì)話框?qū)υ捒颉?用于對(duì)數(shù)據(jù)進(jìn)行用于對(duì)數(shù)據(jù)進(jìn)行分類匯總分類匯總即按指定即按指定的分類變量對(duì)觀測(cè)值進(jìn)行分組,對(duì)每組的分類變量對(duì)觀測(cè)值進(jìn)行分組,對(duì)每組記錄的各變量值求指定的記錄的各變量值求指定的描述統(tǒng)計(jì)量描述統(tǒng)計(jì)量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。當(dāng)前數(shù)據(jù)文件。 2022-5-4 Break Variables:用于選擇分組變量;用于選擇分組變量; Aggregate Variables框:框:用于選擇被匯總的變量;用于選擇被匯總的變量; Name&Label鈕:鈕:用于定義新產(chǎn)生的匯總變量的名稱和標(biāo)簽用于定義新產(chǎn)生的匯總

22、變量的名稱和標(biāo)簽 Function鈕:鈕:用于定義匯總函數(shù)用于定義匯總函數(shù) Save Number of cases in break group as variable復(fù)選復(fù)選框:框:用于定義一個(gè)新變量以存儲(chǔ)同組的記錄數(shù);用于定義一個(gè)新變量以存儲(chǔ)同組的記錄數(shù); Create new data file單選鈕:單選鈕:定義一個(gè)新文件以存儲(chǔ)匯總定義一個(gè)新文件以存儲(chǔ)匯總結(jié)果結(jié)果 Replace working data file單選鈕:用單選鈕:用匯總的結(jié)果替換原來匯總的結(jié)果替換原來的數(shù)據(jù)的數(shù)據(jù)2022-5-4Aggregate對(duì)話框提供的函數(shù)形式:對(duì)話框提供的函數(shù)形式: Give Example

23、:不同城市工人的平均年總收入不同城市工人的平均年總收入求數(shù)值概況求數(shù)值概況求特殊值求特殊值求觀測(cè)值數(shù)求觀測(cè)值數(shù)求百分比求百分比求百分?jǐn)?shù)求百分?jǐn)?shù)2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Data菜單詳解菜單詳解【Split File對(duì)話框?qū)υ捒颉?用于將數(shù)據(jù)文件分組用于將數(shù)據(jù)文件分組為進(jìn)一步處理做準(zhǔn)備為進(jìn)一步處理做準(zhǔn)備 Analyze all cases單選框:單選框:選中本框不拆分文件選中本框不拆分文件; Compare groups單選框:單選框:結(jié)果緊挨在一起便于相互比較;結(jié)果緊挨在一起便于相互比較; Organize output by groups單選框:單選框:各組分析結(jié)果單

24、獨(dú)放各組分析結(jié)果單獨(dú)放置;置; Groups based on框:框:用于選擇拆分?jǐn)?shù)據(jù)文件的變量;用于選擇拆分?jǐn)?shù)據(jù)文件的變量; Sort the file by grouping variables單選框:單選框:將數(shù)據(jù)按所將數(shù)據(jù)按所用的拆分變量排序;用的拆分變量排序; File is already sorted單選框:單選框:數(shù)據(jù)保持原狀,不按所用數(shù)據(jù)保持原狀,不按所用的拆分變量排序。的拆分變量排序。 Give Example: 根據(jù)文化程度對(duì)工資表進(jìn)行拆分根據(jù)文化程度對(duì)工資表進(jìn)行拆分2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Data菜單詳解菜單詳解【Select Cases對(duì)話框

25、】當(dāng)不需要分析全部數(shù)據(jù),而是按某種要求分析其中當(dāng)不需要分析全部數(shù)據(jù),而是按某種要求分析其中的一部分時(shí)使用的一部分時(shí)使用例如:數(shù)據(jù)庫中包括全省所有學(xué)生高考語文成績。例如:數(shù)據(jù)庫中包括全省所有學(xué)生高考語文成績。由于數(shù)據(jù)量太大,現(xiàn)在我們想只選取數(shù)據(jù)庫中前由于數(shù)據(jù)量太大,現(xiàn)在我們想只選取數(shù)據(jù)庫中前50005000個(gè)學(xué)生的成績進(jìn)行統(tǒng)計(jì),以得到一個(gè)粗略個(gè)學(xué)生的成績進(jìn)行統(tǒng)計(jì),以得到一個(gè)粗略的估計(jì)。的估計(jì)。 2022-5-4All cases:分析所有的記錄;分析所有的記錄;If condition is satisfied:只分析滿足條件的記錄;只分析滿足條件的記錄;Random sample of cas

26、es:從原數(shù)據(jù)中按某種條件抽樣從原數(shù)據(jù)中按某種條件抽樣;Based on time or case range:基于記錄序號(hào)來選擇記錄;基于記錄序號(hào)來選擇記錄;Use filter variable:使用篩選指示變量來選擇記錄,該變量取使用篩選指示變量來選擇記錄,該變量取值為非值為非0的記錄將被選中的記錄將被選中Filtered:未被選中的記錄只是被隔離未被選中的記錄只是被隔離Deleted:未被選中的記錄將被刪除未被選中的記錄將被刪除,一般不要使用。一般不要使用。2022-5-4Exercise Exercise DataData5 5:計(jì)算工資表中不同性別的一月份平均加班:計(jì)算工資表中不同

27、性別的一月份平均加班費(fèi)和一月份加班費(fèi)總值費(fèi)和一月份加班費(fèi)總值6 6:只選取觀測(cè)值中男性的數(shù)據(jù),再計(jì)算不同:只選取觀測(cè)值中男性的數(shù)據(jù),再計(jì)算不同性別的一月份加班費(fèi)總值性別的一月份加班費(fèi)總值TipsTips:注意觀察最后的結(jié)果與練習(xí):注意觀察最后的結(jié)果與練習(xí)4 4最后的結(jié)果有最后的結(jié)果有何差異?何差異?2022-5-4數(shù)據(jù)文件的管理數(shù)據(jù)文件的管理 之之Transform菜單詳解菜單詳解 Transform:主要針對(duì)數(shù)據(jù)中主要針對(duì)數(shù)據(jù)中變量變量的變的變換,如根據(jù)已知變量產(chǎn)生一個(gè)新的變量換,如根據(jù)已知變量產(chǎn)生一個(gè)新的變量 Data:主要針對(duì)主要針對(duì)數(shù)據(jù)庫數(shù)據(jù)庫的維護(hù),如數(shù)的維護(hù),如數(shù)據(jù)文件的合并、拆分

28、、匯總等據(jù)文件的合并、拆分、匯總等。2022-5-4Transform菜單菜單Compute:計(jì)算一個(gè)新變量計(jì)算一個(gè)新變量Count:計(jì)數(shù),比如計(jì)數(shù),比如60分以下有幾人分以下有幾人Recode:變量數(shù)值重新編碼,比如考試分?jǐn)?shù)轉(zhuǎn)為及格或不及格變量數(shù)值重新編碼,比如考試分?jǐn)?shù)轉(zhuǎn)為及格或不及格Categorize:歸類歸類Rank case:對(duì)調(diào)查對(duì)象進(jìn)行排序,如對(duì)考分進(jìn)行排名對(duì)調(diào)查對(duì)象進(jìn)行排序,如對(duì)考分進(jìn)行排名Automatic recode:自動(dòng)編碼自動(dòng)編碼 Create time series:創(chuàng)造時(shí)間系列創(chuàng)造時(shí)間系列 Replace missing valuve:缺失數(shù)據(jù)替代(用某一個(gè)數(shù)字)

29、缺失數(shù)據(jù)替代(用某一個(gè)數(shù)字)2022-5-41、【、【Compute對(duì)話框?qū)υ捒颉孔畛S米畛S?022-5-4Compute菜單中的函數(shù)介紹:菜單中的函數(shù)介紹:1、Arithmetic 函數(shù)函數(shù)數(shù)學(xué)函數(shù)數(shù)學(xué)函數(shù) Abs (?)Abs (?) 返回變量的絕對(duì)值返回變量的絕對(duì)值 ArsinArsin(?)(?)返回變量的反三角函數(shù)值返回變量的反三角函數(shù)值 RndRnd(?)(?)返回?cái)?shù)值表達(dá)式四舍五入后返回?cái)?shù)值表達(dá)式四舍五入后得到的整數(shù)值得到的整數(shù)值 TruncTrunc (?) (?) 返回?cái)?shù)值表達(dá)式截尾以后返回?cái)?shù)值表達(dá)式截尾以后得到的整數(shù)值得到的整數(shù)值2022-5-4Compute菜單中的函數(shù)

30、介紹:菜單中的函數(shù)介紹:2、 Random numbers隨機(jī)變量函數(shù)隨機(jī)變量函數(shù) RV.Normal(mean,stddevRV.Normal(mean,stddev) )返回來自指定均值和標(biāo)準(zhǔn)離差的正態(tài)分布的隨機(jī)數(shù)返回來自指定均值和標(biāo)準(zhǔn)離差的正態(tài)分布的隨機(jī)數(shù) RV.EXPRV.EXP(shapeshape)返回服從指定參數(shù)的指數(shù)分布隨機(jī)數(shù)返回服從指定參數(shù)的指數(shù)分布隨機(jī)數(shù) RV.PossionRV.Possion(meanmean) 返回服從指定均值的泊松分布的隨機(jī)數(shù)返回服從指定均值的泊松分布的隨機(jī)數(shù) RV.Uniform ( min,maxRV.Uniform ( min,max) )返回

31、指定最小值和最大值的均勻分布的隨機(jī)數(shù)返回指定最小值和最大值的均勻分布的隨機(jī)數(shù)EgEg:如有如有100100個(gè)個(gè)case, case, 想打亂它們的順序,該如何解決?想打亂它們的順序,該如何解決? 方法:方法:首先產(chǎn)生一個(gè)均勻分布的隨機(jī)數(shù),首先產(chǎn)生一個(gè)均勻分布的隨機(jī)數(shù), 然后按隨機(jī)數(shù)進(jìn)行排序后即可。然后按隨機(jī)數(shù)進(jìn)行排序后即可。2022-5-4Compute菜單中的函數(shù)介紹:菜單中的函數(shù)介紹:3、統(tǒng)計(jì)函數(shù)、統(tǒng)計(jì)函數(shù) CFVARCFVAR(標(biāo)準(zhǔn)離差(標(biāo)準(zhǔn)離差/ /均值)均值) MAX/MAX/最大值最大值 MIN/MIN/最小值最小值 MEAN/MEAN/均值均值 SD/SD/標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 SUM

32、/SUM /求和求和 VARIANCE/VARIANCE/方差方差2022-5-4Compute菜單中的函數(shù)介紹:菜單中的函數(shù)介紹: 4、日期和時(shí)間函數(shù)、日期和時(shí)間函數(shù) Eg:Date 5、邏輯函數(shù)、邏輯函數(shù) Eg:ANY 6、字符串函數(shù)、字符串函數(shù) Eg:String 7、轉(zhuǎn)換函數(shù)、轉(zhuǎn)換函數(shù) converse 主要用于字主要用于字符型變量與數(shù)值型變量的轉(zhuǎn)換符型變量與數(shù)值型變量的轉(zhuǎn)換2022-5-4Demo: 1 1、將、將“職位等級(jí)職位等級(jí)” ” 由由一般員工一般員工 基層管理者基層管理者 中中層管理者層管理者 高層管理者高層管理者 這四個(gè)等級(jí)改變?yōu)檫@四個(gè)等級(jí)改變?yōu)橐话銌T一般員工工 基層管理

33、者基層管理者 中高層管理者中高層管理者 三個(gè)等級(jí)三個(gè)等級(jí) 2 2、計(jì)算所有工人的第一月總收入,命名為、計(jì)算所有工人的第一月總收入,命名為sum_Jansum_Jan 3 3、計(jì)算前五十名工人第一季度的月平均獎(jiǎng)金,命、計(jì)算前五十名工人第一季度的月平均獎(jiǎng)金,命名為名為mean_bonmean_bon 4 4、將廣州市工人的年總收入值增加、將廣州市工人的年總收入值增加10000100002022-5-4 計(jì)數(shù)計(jì)數(shù)用于標(biāo)示某個(gè)值或某些值在某個(gè)變量的取值中用于標(biāo)示某個(gè)值或某些值在某個(gè)變量的取值中是否出現(xiàn)。是否出現(xiàn)。 SPSS會(huì)自動(dòng)用數(shù)字會(huì)自動(dòng)用數(shù)字1來標(biāo)注滿足所需條件的記錄。來標(biāo)注滿足所需條件的記錄。例:例:如果想知道月基本工資在如果想知道月基本工資在10001000元以下的記錄元以下的記錄 注意:注意: 千萬注意,千萬注意,Count對(duì)話框有一個(gè)潛在的對(duì)話框有一個(gè)潛在的bug,當(dāng)需要計(jì)算,當(dāng)需要計(jì)算同時(shí)滿足兩個(gè)變量取值條件的記錄數(shù)有多少時(shí),直接用同時(shí)滿足兩個(gè)變量取值條件的記錄數(shù)有多少時(shí),直接用該對(duì)話框會(huì)得出完全錯(cuò)誤的結(jié)果。該對(duì)話框會(huì)得出完全錯(cuò)誤的結(jié)果。 2、【、【Count對(duì)話框?qū)υ捒颉縀g:如果想知道月基本工資在:如果想知道月基本工資在1000元以下的元以下的北京工人有哪些記錄?北京工人有哪些記錄?2022-5-43、【、【Recode對(duì)話框?qū)υ?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論