第三章 Transform——Data 菜單詳解課件_第1頁
第三章 Transform——Data 菜單詳解課件_第2頁
第三章 Transform——Data 菜單詳解課件_第3頁
第三章 Transform——Data 菜單詳解課件_第4頁
第三章 Transform——Data 菜單詳解課件_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章 Transform/Data菜單詳解本章主要介紹數(shù)據(jù)管理的基本內(nèi)容,包括數(shù)據(jù)的合并、拆分、轉(zhuǎn)置、編碼等內(nèi)容,是進(jìn)行正式統(tǒng)計(jì)分析前的重要一步。Transform菜單主要針對(duì)數(shù)據(jù)中變量的變換,如根據(jù)已知變量產(chǎn)生一個(gè)新的變量,Data 菜單主要針對(duì)數(shù)據(jù)庫的維護(hù),如數(shù)據(jù)文件的合并、拆分、匯總等。3.1 SPSS對(duì)話框元素介紹下面所介紹的是在SPSS所有的統(tǒng)計(jì)分析中都會(huì)出現(xiàn)的典型的對(duì)話框,了解對(duì)話框的基本結(jié)構(gòu)有助于更好的掌握SPSS。一、一級(jí)對(duì)話框元素介紹1、 候選變量列表框 2、選入變量列表框 3、變量移動(dòng)鈕 4、五個(gè)標(biāo)準(zhǔn)按鈕 5、其他按鈕二、二級(jí)對(duì)話框元素介紹1、單選框 2、復(fù)選框 3、下拉

2、列表框 4、文本框 以回歸分析(AnalyzeRegression)三、對(duì)話框常用操作技巧 (略)見書P303.2 Transform 菜單詳解 本菜單功能豐富,主要針對(duì)數(shù)據(jù)文件中的變量進(jìn)行各種轉(zhuǎn)換。一、Compute過程(重點(diǎn)掌握)Compute過程是Transform菜單中最常用的一個(gè)過程,功能是用于給變量賦值。例1:見書P31(演示操作過程)方法一:第一步:產(chǎn)生一個(gè)新變量“new” ,并給該變量賦值1;第二步:對(duì)該新變量進(jìn)行修改,修改條件:當(dāng)血磷值超過1的時(shí)候,令“new”的取值為2方法二:用邏輯函數(shù)any例2 :打開cars.sav文件,對(duì)產(chǎn)地為歐洲的汽車的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,將“馬力”增加

3、20函數(shù)介紹:1、Arithmetic 函數(shù)數(shù)學(xué)函數(shù)Abs (?) 返回變量的絕對(duì)值A(chǔ)rsin(?)返回變量的反三角函數(shù)值Mod (?,?) 返回?cái)?shù)值表達(dá)式除以模數(shù)后的余數(shù),要求模數(shù)不能為0Rnd(?)返回?cái)?shù)值表達(dá)式四舍五入后得到的整數(shù)值Trunc (?) 返回?cái)?shù)值表達(dá)式截尾以后得到的整數(shù)值2、CDF 返回累積分布函數(shù)的累積概率值 如:CDF.Normal(X1, 0, 1) =X2X1X2-20.02-10.1600.510.8420.98 3、日期和時(shí)間函數(shù)(略)4、隨機(jī)變量函數(shù) (Random numbers) RV.Normal(mean,stddev)返回來自指定均值和標(biāo)準(zhǔn)離差的正態(tài)

4、分布的隨機(jī)數(shù)RV.EXP(shape)返回服從指定參數(shù)的指數(shù)分布隨機(jī)數(shù)RV.Possion(mean) 返回服從指定均值的泊松分布的隨機(jī)數(shù)RV.Uniform ( min,max) 返回指定最小值和最大值的均勻分布的隨機(jī)數(shù)(1) 產(chǎn)生一系列隨機(jī)數(shù)(操作講解)(2) 應(yīng)用:如有100個(gè)case, 想打亂它們的順序,該如何解決?方法:首先產(chǎn)生一個(gè)均勻分布的隨機(jī)數(shù),然后按隨機(jī)數(shù)進(jìn)行排序后即可。 如:從編號(hào)為1300的燈泡中隨機(jī)抽20個(gè)進(jìn)行檢驗(yàn),如何實(shí)現(xiàn)? 方法:運(yùn)用計(jì)算機(jī)產(chǎn)生20個(gè)1到600間的隨機(jī)數(shù),取出他們對(duì)應(yīng)的燈泡進(jìn)行檢驗(yàn)即可。5、統(tǒng)計(jì)函數(shù)CFVAR(標(biāo)準(zhǔn)離差/均值);MAX/最大值;MIN/

5、最小值;MEAN/均值;SD/標(biāo)準(zhǔn)差;SUM /求和; VARIANCE/方差例: 運(yùn)用產(chǎn)生隨機(jī)數(shù)的方法產(chǎn)生一個(gè)數(shù)據(jù)文件,文件命名為chengji.sav,包含學(xué)號(hào)(x1),語文(x2)、數(shù)學(xué)(x3)、英語(x4)四個(gè)變量名,計(jì)算各門功課的平均成績/總分。6、邏輯函數(shù)ANY 7、字符串函數(shù)8、轉(zhuǎn)換函數(shù) converse 主要用于字符型變量與數(shù)值型變量的轉(zhuǎn)換二、Count過程該過程用于標(biāo)示某個(gè)值或某些值在某個(gè)變量的取值中是否出現(xiàn)。標(biāo)示:SPSS會(huì)自動(dòng)用數(shù)字1來標(biāo)注滿足所需條件的記錄。例1:見書P32如果想知道哪些記錄的血磷脂在23之間,則可以通過count過程實(shí)現(xiàn)。(操作)例2 :在cars.s

6、av文件中標(biāo)出美國產(chǎn)的汽車馬力在135以下的記錄注意:Count 在標(biāo)示數(shù)據(jù)的過程中,不能對(duì)同時(shí)滿足多個(gè)取值條件的記錄進(jìn)行標(biāo)示,只能對(duì)滿足某一個(gè)條件的變量進(jìn)行標(biāo)示。三、Recode過程該過程用于將原變量按照某種一一對(duì)應(yīng)的關(guān)系生成新變量,可以將新值賦給原變量也可以生成一個(gè)新變量。例1:見書P33(操作)例2:打開cars.sav,將美國產(chǎn)的汽車進(jìn)行編碼,馬力在100以下的取值為0,馬力在100200的取值為10,馬力在200以上的取值20,生成新變量temp四、Rank Cases過程該過程是專門履行排次序的功能的。因?yàn)樵诜菂?shù)統(tǒng)計(jì)中,經(jīng)常要用到秩次這個(gè)統(tǒng)計(jì)量。例:請(qǐng)分組計(jì)算血磷脂的秩次。五、其

7、他菜單1、Random Number Seed 該過程用于隨機(jī)種子的設(shè)定,可以保證隨機(jī)數(shù)重復(fù)出現(xiàn)操作:固定隨機(jī)種子,并產(chǎn)生20個(gè)隨機(jī)數(shù) 不固定隨機(jī)種子,并產(chǎn)生20個(gè)隨機(jī)數(shù)2、Automatic Recode(與Rank case 過程相似,略)3、Replace Missing Value 與Create Times Series均屬于針對(duì)于時(shí)間序列數(shù)據(jù),此處略。3.3 Data菜單詳解Transform傾向于對(duì)變量進(jìn)行處理操作,而Data傾向于對(duì)整個(gè)數(shù)據(jù)文件進(jìn)行處理操作該菜單所履行的功能分為下列三類:簡單命令:包括插入變量、插入記錄和到達(dá)某條記錄,直接用鼠標(biāo)拖放就可以快速完成,無需調(diào)用菜單。

8、上述命令也可以通過優(yōu)化工具欄,將上述命令設(shè)置在工具欄中直接調(diào)用。方法:單擊工具欄,右鍵toolbarscustomize ,然后按照需要進(jìn)行設(shè)置。簡單過程:包括排序、拆分文件、選擇觀測(cè)和加權(quán)觀測(cè),使用頻繁。專用過程:包括定義日期變量、數(shù)據(jù)轉(zhuǎn)置、文件的合并、數(shù)據(jù)匯總等。一、Sort Case過程當(dāng)我們調(diào)用該過程時(shí),多半是針對(duì)多變量排序,如果僅對(duì)單變量排序,右鍵即可。例1:見書P37例2:請(qǐng)將chengji.sav按學(xué)號(hào)升序、總分成績降序排列數(shù)據(jù)。二、Merge Files過程(重點(diǎn)掌握)該過程用于合并多個(gè)來自SPSS的數(shù)據(jù)文件1、縱向合并(記錄合并)從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,要求

9、兩文件具有相同的變量。例1:見書P39 右側(cè)列表框中顯示的是合并后新數(shù)據(jù)文件中顯示的變量,若不需要那么多變量,直接將其選入左側(cè)列表框。例2:運(yùn)用隨機(jī)數(shù)產(chǎn)生服從均值為1,方差為2的正態(tài)分布的隨機(jī)數(shù)( x1) 10個(gè),其中前5個(gè)為第一組,后5個(gè)為第二組。令組別變量為group. 將該數(shù)據(jù)文件合并到xuelin.sav中2、橫向合并(增加變量)從外部文件中增加變量到當(dāng)前數(shù)據(jù)文件,稱為橫向合并。對(duì)數(shù)據(jù)要求較高: 默認(rèn)按照相同記錄號(hào)進(jìn)行合并 如果按照一個(gè)一一對(duì)應(yīng)的關(guān)鍵變量進(jìn)行匹配合并,則記錄要按照該變量進(jìn)行升序排列例1:見書P40例2 :練習(xí):運(yùn)用隨機(jī)數(shù)產(chǎn)生兩個(gè)SPSS數(shù)據(jù)文件,命名為merge1.sav和merge2.sav并將其合并。其中第一個(gè)文件包含學(xué)號(hào)(x1,取值1-10),語文(x2),數(shù)學(xué)(x3);第二個(gè)文件包含學(xué)號(hào)(x1,取值為1020),化學(xué)(x4),生物(x5) 三、Aggregate過程(重點(diǎn)掌握)該過程主要用于對(duì)數(shù)據(jù)進(jìn)行分類匯總,即對(duì)數(shù)據(jù)文件按照分組變量(如性別、宗教信仰等)進(jìn)行分組,然后對(duì)給各組進(jìn)行匯總統(tǒng)計(jì),結(jié)果可以存入新的數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件例1:見書例1:見書P42例2 :打開cars.sav,按照產(chǎn)地求出各個(gè)國家的汽車平均馬力和重量。四、Split File過程該過程用于將數(shù)據(jù)文件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論