第3章 問(wèn)卷數(shù)據(jù)的錄入與清理.ppt_第1頁(yè)
第3章 問(wèn)卷數(shù)據(jù)的錄入與清理.ppt_第2頁(yè)
第3章 問(wèn)卷數(shù)據(jù)的錄入與清理.ppt_第3頁(yè)
第3章 問(wèn)卷數(shù)據(jù)的錄入與清理.ppt_第4頁(yè)
第3章 問(wèn)卷數(shù)據(jù)的錄入與清理.ppt_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程基于SPSS和Excel的調(diào)查數(shù)據(jù)分析,第3章 問(wèn)卷數(shù)據(jù)的錄入與清理,本章內(nèi)容,3.1 問(wèn)卷數(shù)據(jù)的錄入 3.2 在Excel中錄入數(shù)據(jù) 3.3 核對(duì)和清理數(shù)據(jù) 3.4 在Excel中核對(duì)數(shù)據(jù) 3.5 在SPSS中錄入數(shù)據(jù) 3.6 在SPSS中核對(duì)數(shù)據(jù) 附錄 Excel數(shù)據(jù)分析工具 附錄 在Excel中生成隨機(jī)數(shù),問(wèn)卷數(shù)據(jù)的錄入與清理,進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析之前,必須先將問(wèn)卷數(shù)據(jù)錄入計(jì)算機(jī)。 為了保證不“GIGO,Garbage In Garbage Out”(垃圾進(jìn)垃圾出),在統(tǒng)計(jì)分析之前,需要對(duì)錄入的數(shù)據(jù)進(jìn)行核對(duì)和清理。,3.1 問(wèn)卷數(shù)據(jù)的錄入,數(shù)據(jù)輸入就是將問(wèn)卷數(shù)據(jù)所對(duì)應(yīng)的編

2、碼通過(guò)掃描或用鍵盤(pán)輸入計(jì)算機(jī),建立數(shù)據(jù)文件的過(guò)程。 目前,數(shù)據(jù)輸入的方式主要有三種: 人工輸入 計(jì)算機(jī)輔助系統(tǒng)轉(zhuǎn)換 光電輸入,3.1問(wèn)卷數(shù)據(jù)的錄入(人工輸入),人工輸入的注意事項(xiàng): 要規(guī)定統(tǒng)一的輸入內(nèi)容和輸入格式。 挑選和培訓(xùn)數(shù)據(jù)輸入人員。 數(shù)據(jù)輸入過(guò)程中需要注意: 第一,統(tǒng)一規(guī)定數(shù)據(jù)文件名。 第二,數(shù)據(jù)輸入時(shí)要為每一個(gè)輸入人員提供一份有關(guān)輸入內(nèi)容和格式的手冊(cè)。 第三,要為每個(gè)輸入人員提供足夠的空間擺放問(wèn)卷,避免不同輸入人員的問(wèn)卷或者同一輸入人員已輸入和未輸入的問(wèn)卷發(fā)生混淆,造成漏輸或重復(fù)輸入,影響問(wèn)卷的質(zhì)量。 第四,每個(gè)輸入人員在完成各自負(fù)責(zé)的問(wèn)卷的輸入任務(wù)后,由研究者把他們的數(shù)據(jù)合并成一個(gè)

3、總的數(shù)據(jù)文件,以供統(tǒng)計(jì)分析使用。為了避免數(shù)據(jù)丟失,要把每個(gè)輸入人員輸入的數(shù)據(jù)單獨(dú)存檔,以備查找。,3.2 在Excel中錄入數(shù)據(jù)(單選題),1確定取得單一答案 2盡可能使用單選題 3單選題如何編碼和輸入 Q1.請(qǐng)問(wèn)您現(xiàn)在是否擁有手機(jī)? 1.有2.沒(méi)有(跳至Q12題) 例3-1 在Excel中錄入單選題Q1的數(shù)據(jù) 單選題的編碼和輸入(用文字當(dāng)列名,圖3-1) 單選題的編碼和輸入(用題號(hào)當(dāng)列名,圖3-2),3.2 在Excel中錄入數(shù)據(jù)(單選題),例3-1 在Excel中錄入單選題Q1的數(shù)據(jù) 單選題的編碼和輸入(用文字當(dāng)列名,圖3-1) 單選題的編碼和輸入(用題號(hào)當(dāng)列名,圖3-2),3.2 在Ex

4、cel中錄入數(shù)據(jù)(多選題),多選題分為多項(xiàng)限選題、多項(xiàng)排序題、多項(xiàng)任選題。 Q2.請(qǐng)問(wèn)您當(dāng)初購(gòu)買(mǎi)手機(jī)的原因是什么?(可多選,最多3項(xiàng)) 1.方便與家人聯(lián)絡(luò) 2.方便與朋友同學(xué)聯(lián)絡(luò) 3.追求流行 4.工作需要 5.同學(xué)間比較的心理 6. 別人贈(zèng)送 7.手機(jī)價(jià)格下降 8.廠商推出的促銷(xiāo)方案 9.網(wǎng)內(nèi)互打較便宜 10.其他 例3-2 在Excel中錄入多選題Q2的數(shù)據(jù) 多選題的編碼有2種:分類(lèi)法和二分法。 “分類(lèi)法”編碼和輸入(圖3-3) “二分法”編碼和輸入 有關(guān)“分類(lèi)法”和“二分法”編碼,請(qǐng)參見(jiàn)P7274 凍結(jié)窗格(比較圖3-4和圖3-5),3.2 在Excel中錄入數(shù)據(jù)(多選題),例3-2 在

5、Excel中錄入多選題Q2的數(shù)據(jù) “分類(lèi)法”編碼和輸入(圖3-3),3.2 在Excel中錄入數(shù)據(jù)(多選題),例3-2 在Excel中錄入多選題Q2的數(shù)據(jù) 凍結(jié)窗格(比較圖3-4和圖3-5),3.2 在Excel中錄入數(shù)據(jù)(填空題),填空題也稱(chēng)開(kāi)放題,不提示任何答案,要求使用者直接填寫(xiě)。 對(duì)數(shù)值型的數(shù)據(jù),為了取得其真正的數(shù)字(如:55),而非只取得區(qū)間(如:4160),會(huì)采用填空題的方式取得數(shù)據(jù)(定量數(shù)據(jù),數(shù)值型數(shù)據(jù)),例如: 請(qǐng)問(wèn)您平均每個(gè)月手機(jī)的話費(fèi)約 元? 定量數(shù)據(jù)可不經(jīng)任何轉(zhuǎn)換,即可計(jì)算各種統(tǒng)計(jì)量:均值、標(biāo)準(zhǔn)差、最大值、最小值等,而且也可以直接進(jìn)行均值比較與檢驗(yàn),甚至可以作為回歸分析的

6、因變量或自變量。 如果為了取得數(shù)據(jù)的方便,就設(shè)計(jì)成選擇題(單選題): 請(qǐng)問(wèn)您平均每個(gè)月手機(jī)的話費(fèi)約多少錢(qián)? 1.20元及以下2.2140元3.4160元 4.6180元5.81100元6.101元及以上 例3-3 在Excel中錄入填空題的數(shù)據(jù)(圖3-6),3.2 在Excel中錄入數(shù)據(jù)(填空題),例3-3 在Excel中錄入填空題的數(shù)據(jù)(圖3-6),3.2 在Excel中錄入數(shù)據(jù)(量表),量表其實(shí)是一種順序尺度(有序變量),只有大小先后的關(guān)系,無(wú)倍數(shù)關(guān)系。 量表有多種編碼方式,如P60的表3-2是量表常用的三種編碼方式。 例3-4 在Excel中錄入量表的數(shù)據(jù)(圖3-7),補(bǔ)充:輸入數(shù)據(jù)時(shí),

7、對(duì)于量表編碼,要取得同向,如P34的例2-26,反向題要正向編碼后再輸入,3.2 在Excel中錄入數(shù)據(jù)(量表),例3-4 在Excel中錄入量表的數(shù)據(jù)(圖3-7),3.2 在Excel中錄入數(shù)據(jù)(排名題),排名(多項(xiàng)排序)是一種衡量的方式。如: 下列幾種手機(jī)的入網(wǎng)方式,請(qǐng)問(wèn)您認(rèn)為哪一種的收費(fèi)最便宜? 請(qǐng)依排名順序,填入1、2、3、4、5: 全球通 神州行 如意通 動(dòng)感地帶 新時(shí)空 分 此種類(lèi)型的問(wèn)卷,作為被排名的對(duì)象也不宜太多。否則,受訪者也無(wú)法排列好。排個(gè)5、6項(xiàng)基本就是上限了。 例3-5 在Excel中錄入排名題的數(shù)據(jù)(圖3-8) 可將排名題改為單選題,3.2 在Excel中錄入數(shù)據(jù)(排

8、名題),例3-5 在Excel中錄入排名題的數(shù)據(jù)(圖3-8),3.3 核對(duì)和清理數(shù)據(jù),數(shù)據(jù)有效范圍的清理 對(duì)數(shù)據(jù)中的奇異值進(jìn)行清理。 數(shù)據(jù)邏輯一致性的清理 依據(jù)問(wèn)卷中的問(wèn)題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來(lái)檢查前后數(shù)據(jù)之間的合理性,主要針對(duì)的是相倚問(wèn)題和多項(xiàng)限選題。 數(shù)據(jù)質(zhì)量的抽查,個(gè)案(Case):一份問(wèn)卷的數(shù)據(jù)在計(jì)算機(jī)中的編碼值,占一行,3.4 在Excel中核對(duì)數(shù)據(jù),篩選出范圍不合理的單列 例3-6 在Excel中核對(duì)“大小適中”的數(shù)據(jù) 用自動(dòng)篩選找出不合理的關(guān)聯(lián)題 例3-7 在Excel中核對(duì)關(guān)聯(lián)題“是否有手機(jī)”與“平均月費(fèi)”的數(shù)據(jù) 用高級(jí)篩選找出重復(fù)的記錄 例3-8 用Excel

9、處理重復(fù)的記錄,3.4 在Excel中核對(duì)數(shù)據(jù),篩選出范圍不合理的單列 例3-6 在Excel中核對(duì)“大小適中”的數(shù)據(jù),3.4 在Excel中核對(duì)數(shù)據(jù),用自動(dòng)篩選找出不合理的關(guān)聯(lián)題 例3-7 在Excel中核對(duì)關(guān)聯(lián)題“是否有手機(jī)”與“平均月費(fèi)”的數(shù)據(jù),沒(méi)有手機(jī)但有手機(jī)話費(fèi),有手機(jī)但沒(méi)有手機(jī)話費(fèi),3.4 在Excel中核對(duì)數(shù)據(jù),用高級(jí)篩選找出重復(fù)的記錄 例3-8 用Excel處理重復(fù)的記錄,3.5 在SPSS中錄入數(shù)據(jù),手工建立數(shù)據(jù)文件 例3-9 在SPSS中,手工建立調(diào)查問(wèn)卷的數(shù)據(jù)文件 1.調(diào)查問(wèn)卷(P6869) 2.確定變量的個(gè)數(shù) 3.在SPSS中定義變量 4.單選題的變量定義 5.多選題的

10、變量定義:二分法和分類(lèi)法 從Excel獲取數(shù)據(jù)文件 例3-10 將Excel中的數(shù)據(jù)導(dǎo)入到SPSS數(shù)據(jù)文件中 方法一:先在SPSS中定義好變量,然后通過(guò)“復(fù)制粘貼”方式將數(shù)據(jù)從Excel復(fù)制到SPSS中。 方法二:利用打開(kāi)數(shù)據(jù)文件的方法直接把Excel中的數(shù)據(jù)導(dǎo)入到SPSS中,然后再定義變量屬性。,3.5 在SPSS中錄入數(shù)據(jù),多選題的變量定義:二分法和分類(lèi)法 二分法(Multiple Dichotomies Method):將每個(gè)可能的答案設(shè)為一個(gè)變量,變量的取值最多有兩個(gè)(1和0),分別表示“選”或“不選”(在實(shí)際應(yīng)用中,經(jīng)常只有一個(gè)取值1,表示“選”,而用空值表示“不選”)。這種方法的缺

11、點(diǎn)是需要的變量個(gè)數(shù)比較多;優(yōu)點(diǎn)是比較簡(jiǎn)單。二分法常用于“不限選” 和 “限選不排名” 。 分類(lèi)法(Multiple Category Method):分類(lèi)法常用于“限選”(很少用于“不限選”),包括“限選不排名” 和“限選排名” 。按照限選的最多答案設(shè)置變量個(gè)數(shù),每個(gè)變量的取值為選項(xiàng)值。比如,一個(gè)多選題,如果最多可選3個(gè)答案,那就設(shè)置3個(gè)變量,分別用來(lái)存放3個(gè)可能的答案。如果某受訪者只填答兩個(gè),那么第3個(gè)變量的取值為缺失值;如果某受訪者只填答一個(gè),那么第2、3個(gè)變量的取值均為缺失值。分類(lèi)法的優(yōu)點(diǎn)是需要的變量個(gè)數(shù)比較少。,補(bǔ)充:限選不排序多選題的兩種編碼三種組合方式,以問(wèn)題5(Q5)限選不排序多

12、選題為例 方式1:二分法編碼:P73的表3-5(4個(gè)變量,編碼為1) 方式2:分類(lèi)法編碼:P73的表3-6(2個(gè)變量,編碼為1、2、3、4) 補(bǔ)充方式3:變量個(gè)數(shù)采用二分法(4個(gè)變量),編碼采用分類(lèi)法(1、2、3、4),具體如下:,建議:應(yīng)用案例實(shí)驗(yàn)1,如果限選不排序多選題的選項(xiàng)超過(guò)了2項(xiàng)(如:可多選,最多3項(xiàng)),建議采用方式3,這樣的好處是核對(duì)容易。請(qǐng)參見(jiàn)“補(bǔ)充:多選題兩種編碼和核對(duì).xls”,實(shí)際應(yīng)用中,建議采用方式2。 因?yàn)橐话阒缓藢?duì)單列數(shù)據(jù)有效范圍,很少核對(duì)邏輯一致性,改錯(cuò):P74的表39改為,由于采用“分類(lèi)法”編碼,所以在SPSS中的Values也應(yīng)該是分類(lèi)法編碼,而不是簡(jiǎn)單的“選”

13、或空白。 修改的目的:在用SPSS進(jìn)行多選變量的頻率分析時(shí)(具體見(jiàn)第六章),SPSS的輸出結(jié)果可讀性好。,3.5 在SPSS中錄入數(shù)據(jù),從Excel獲取數(shù)據(jù)文件 例3-10 將Excel中的數(shù)據(jù)導(dǎo)入到SPSS數(shù)據(jù)文件中 方法一:先在SPSS中定義好變量,然后通過(guò)“復(fù)制粘貼”方式將數(shù)據(jù)從Excel復(fù)制到SPSS中。 方法二:利用打開(kāi)數(shù)據(jù)文件的方法直接把Excel中的數(shù)據(jù)導(dǎo)入到SPSS中,然后再定義變量屬性。具體如下:在SPSS中,單擊菜單“File”-“Open”-“Data”,進(jìn)入“Open File”對(duì)話框,在最下面的“文件類(lèi)型”框中選擇“Excel(*.xls)”,然后選擇錄入好數(shù)據(jù)的Ex

14、cel文件(要求該文件暫時(shí)沒(méi)有被Excel打開(kāi)),單擊“打開(kāi)”,進(jìn)入“Opening Excel Data Source”對(duì)話框,單擊“OK”。 定義變量屬性:對(duì)每個(gè)變量進(jìn)行進(jìn)一步的定義(如變量名標(biāo)簽、變量值標(biāo)簽等),以期達(dá)到SPSS分析所要求的目的,3.6 在SPSS中核對(duì)數(shù)據(jù),利用SPSS的一維頻率分析Frequencies命令可以發(fā)現(xiàn)單變量范圍不合理的數(shù)據(jù)。 利用SPSS的交叉表分析Crosstabs命令可以發(fā)現(xiàn)兩個(gè)變量之間的邏輯一致性問(wèn)題。,實(shí)踐題,1999年關(guān)于外商投資企業(yè)雇員調(diào)查問(wèn)卷(P8081) 要求: (1)確定問(wèn)卷中每個(gè)問(wèn)題應(yīng)該設(shè)置的變量的個(gè)數(shù),并區(qū)分是定性(分類(lèi))變量還是定

15、量(數(shù)值型)變量。 (2)給每個(gè)變量定義變量名、數(shù)據(jù)類(lèi)型、變量名標(biāo)簽。 (3)對(duì)于定性(分類(lèi))變量,定義相應(yīng)的變量值標(biāo)簽(類(lèi)別編碼含義)。 (4)自己填寫(xiě)一份問(wèn)卷,并把有關(guān)信息輸入數(shù)據(jù)文件中。 (5)利用Excel隨機(jī)數(shù)發(fā)生器,按照問(wèn)題的編碼,隨機(jī)生成900份問(wèn)卷數(shù)據(jù),并對(duì)生成的數(shù)據(jù)進(jìn)行核對(duì)。 (6)保存這901份問(wèn)卷的數(shù)據(jù)。,請(qǐng)參見(jiàn)實(shí)驗(yàn)3.4,隨機(jī)數(shù) 生成方法 請(qǐng)參見(jiàn) 實(shí)驗(yàn)3.1 實(shí)驗(yàn)3.2,附錄 Excel數(shù)據(jù)分析工具,1. Excel數(shù)據(jù)分析工具及其安裝 (1)工作表函數(shù)與數(shù)據(jù)分析工具的區(qū)別 (2)數(shù)據(jù)分析工具的安裝(兩種方法) 方法二有2個(gè)要求 Excel軟件的菜單“工具”“宏” “安全性”為“中”; Analysis文件夾下的5個(gè)文件都要有 2. 統(tǒng)計(jì)分析工具的內(nèi)容 3. 統(tǒng)計(jì)分析工具的使用,更詳細(xì)的安裝步驟請(qǐng)參

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論