數(shù)據(jù)的選取與操作_第1頁(yè)
數(shù)據(jù)的選取與操作_第2頁(yè)
數(shù)據(jù)的選取與操作_第3頁(yè)
數(shù)據(jù)的選取與操作_第4頁(yè)
數(shù)據(jù)的選取與操作_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、莊文忠 副教授2022/9/251數(shù)據(jù)的選取與操作課程大綱2022/9/252數(shù)據(jù)選取與操作的意涵選擇觀察值(Select)分割檔案(Split files)變量的重新編碼(Recode)計(jì)算(Compute)計(jì)數(shù)(Count)數(shù)據(jù)選取與操作的意涵2022/9/253研究者在進(jìn)行數(shù)據(jù)分析時(shí),有時(shí)可能需要對(duì)數(shù)據(jù)的結(jié)構(gòu)做某些改變或創(chuàng)造新的變數(shù),以符合研究的需求,尤其是研究者所使用的原始資料文件是他人基于不同研究目的而搜集的資料,例如ICPSR數(shù)據(jù)庫(kù)、中研院學(xué)術(shù)調(diào)查數(shù)據(jù)庫(kù)。即使是研究者自己所搜集的資料,為了進(jìn)行某些較為特殊的分析,也有可能需要對(duì)數(shù)據(jù)的格式或變量的屬性作某些改變,例如政治世代的比較;甚

2、至有些根本的改變可能在資料搜集之初,就已經(jīng)有所預(yù)期或規(guī)劃,例如指數(shù)(index)或量表(scale)的建構(gòu)。數(shù)據(jù)選取與操作的意涵2022/9/254在數(shù)據(jù)操作過(guò)程中,個(gè)案的個(gè)數(shù)保持不變,變量的數(shù)目也不會(huì)減少(事實(shí)上,變量的數(shù)目反而會(huì)增加)。數(shù)據(jù)操作涉及到現(xiàn)有變量的處理,例如: 1.利用某種方式變更變數(shù)的原始數(shù)值/編碼; 2.利用某種方式結(jié)合2個(gè)或2個(gè)以上變數(shù)的數(shù)值/編碼的邏輯條件陳述來(lái)建立一個(gè)新的變量。選擇觀察值(Select)2022/9/255研究者有時(shí)會(huì)發(fā)現(xiàn)在進(jìn)行某項(xiàng)研究或特定分析時(shí),并不見(jiàn)得需要使用數(shù)據(jù)文件中所包含的全部信息,分析時(shí)必須選擇某些值得分析的個(gè)案或變量 。操作的步驟: 1.

3、設(shè)定篩選的標(biāo)準(zhǔn); 2.選取所需要的觀察值; 3.暫時(shí)或永久的刪除未選擇的觀察值。在完成特定的分析之后,記得恢復(fù)選擇全部觀察值。選擇觀察值2022/9/256有工作(v27=1)且學(xué)歷為??埔陨?degree =4)2022/9/2572022/9/2582022/9/259選擇觀察值:V27=1 & degree=4全部觀察值分割檔案(split files)2022/9/2510有時(shí)利用類別變量的組別來(lái)切割一個(gè)檔案是非常有幫助的,如此一來(lái),計(jì)算機(jī)就會(huì)自動(dòng)地分別對(duì)每一層別的數(shù)據(jù)進(jìn)行分析。最多可以設(shè)定8個(gè)分組變數(shù)。兩種分割檔案方式: (1)比較群組 (2)依群組組織輸出在完成特定的分析之后,記得

4、恢復(fù)選擇分析所有觀察值,勿建立群組。(1)比較群組2022/9/25112022/9/2512(2)依群組組織輸出2022/9/25132022/9/2514變量的重新編碼(Recode)2022/9/2515利用改變實(shí)際的單一編碼數(shù)值或?qū)⒁蝗壕幋a合并成較大之集合體的方式,來(lái)變更變量的單一編碼或一組編碼,這是數(shù)據(jù)操作的基本形式之一。重新編碼的類型: 1.重新編碼成同一變數(shù)(不建議) 2.重新編碼成不同變數(shù) 3.自動(dòng)重新編碼例:年齡重新編碼2022/9/2516年齡歲數(shù)年齡類別181929(1)年輕人303164(2)壯年人6592(3)老年人重新編碼成同一變數(shù)(不建議)2022/9/25172

5、022/9/2518重新編碼成不同變量數(shù)字變量2022/9/2519重新編碼成不同變量數(shù)字變量2022/9/25202022/9/2521原始數(shù)值重新編碼后重新編碼成不同變量類別變量2022/9/2522重新編碼成不同變量類別變量2022/9/25232022/9/2524原始分類重新編碼后自動(dòng)重新編碼2022/9/25252022/9/2526計(jì)算(Compute)2022/9/2527如果一個(gè)或多個(gè)變量的數(shù)字編碼是代表真實(shí)的數(shù)量而非只是類別的標(biāo)記,那么,這些編碼就可以成為算術(shù)運(yùn)算的標(biāo)的。計(jì)算是產(chǎn)生新變量的方法之一,也可以提供更有意義的變量,例如以身高和體重的比值換算成身體質(zhì)量指數(shù)(BMI)

6、。 BMI=(體重)/(身高)2如果有些個(gè)案是遺漏值,在計(jì)算時(shí)便會(huì)被排除,成為系統(tǒng)遺漏值。簡(jiǎn)單的計(jì)算周工作時(shí)數(shù)轉(zhuǎn)換為年工作時(shí)數(shù)2022/9/2528利用計(jì)算建立量表工作成就感2022/9/2529年工作時(shí)數(shù)2022/9/2530工作成就感計(jì)數(shù)(Count)2022/9/2531在許多不同的變量之中,有時(shí)可能會(huì)想要知道某一個(gè)編碼或某一范圍內(nèi)的編碼發(fā)生的次數(shù)。計(jì)數(shù)的結(jié)果也可用以建立新的量表。例如:各種參與政治的行為(投票、投書(shū)、聯(lián)署、call-in),可結(jié)合成政治參與量表計(jì)數(shù)2022/9/25322022/9/2533操作練習(xí)&提問(wèn)時(shí)間2022/9/2534作業(yè):2022/9/2535利用觀察值摘要、選擇觀察值和分割檔案的作法,比較男性和女性的教育程度(degree)和接受教育年數(shù)(educyrs)有何不同?找一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論