




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第八章
調(diào)查資料的處理第八章
調(diào)查資料的處理1調(diào)查資料的整理的主要內(nèi)容
原始資料的審核和復(fù)查1
數(shù)據(jù)清理3
統(tǒng)計(jì)表與統(tǒng)計(jì)圖4
資料轉(zhuǎn)化與錄入2調(diào)查資料的整理的主要內(nèi)容原始資料的審核和第一節(jié)原始資料的審核與復(fù)查1、資料的審核
定義:它是指研究者對調(diào)查所收集回的原始資料(主要是問卷)進(jìn)行初步的審查和核實(shí),校正錯(cuò)填、誤填的答案,剔除亂填、空白和嚴(yán)重缺答的廢卷目的:使得原始資料具有較好的準(zhǔn)確性、完整性和真實(shí)性,從而為后續(xù)資料整理錄入與統(tǒng)計(jì)分析工作打下較好的基礎(chǔ)。第一節(jié)原始資料的審核與復(fù)查1、資料的審核檢查出文件資料中存在的問題重新向被調(diào)查者核實(shí)
資料的審核工作資料審核有兩種不同的做法:一種是實(shí)地審核;另一種是系統(tǒng)審核或集中審核檢查出文件資料中存在的問題重新向被調(diào)查者核實(shí)資料的審核工作實(shí)地審核:在調(diào)查的過程中進(jìn)行,即邊調(diào)查邊審核優(yōu)點(diǎn):特別及時(shí),且效果較好;缺點(diǎn):要求調(diào)查工作的組織和安排要特別仔細(xì),調(diào)查員個(gè)人處理各種情況的能力要比較強(qiáng)實(shí)地審核:在調(diào)查的過程中進(jìn)行,即邊調(diào)查邊審核集中審核:先將調(diào)查資料全部收集回來,然后再集中時(shí)間進(jìn)行審核優(yōu)點(diǎn):調(diào)查工作便于統(tǒng)一組織安排和管理,審核工作也可以統(tǒng)一在研究者的指導(dǎo)下進(jìn)行,審核的標(biāo)準(zhǔn)比較一致,檢查的質(zhì)量也相對好一些;缺點(diǎn):整個(gè)調(diào)查工作的周期則會(huì)相對拉長,少數(shù)個(gè)案的重新詢問和核實(shí)工作有時(shí)因時(shí)間相隔較長或調(diào)查地點(diǎn)較遠(yuǎn)而無法落實(shí)。集中審核:先將調(diào)查資料全部收集回來,然后再集中時(shí)間進(jìn)行審核
2、資料的復(fù)查定義:指的是研究者在調(diào)查資料收回后,又由其他人對所調(diào)查的樣本中的一部分個(gè)案進(jìn)行第二次調(diào)查,以檢查和核實(shí)第一次調(diào)查的質(zhì)量基本做法:從原來的調(diào)查員所調(diào)查過的樣本中,隨機(jī)抽取5%-15%的個(gè)案重新進(jìn)行調(diào)查調(diào)查內(nèi)容:一方面核實(shí)原來的調(diào)查員是否真的對個(gè)案進(jìn)行過調(diào)查;另一方面可將兩次調(diào)查的結(jié)果進(jìn)行對比,以檢查第一次調(diào)查的質(zhì)量
通過審核和復(fù)查,研究者可以發(fā)現(xiàn)并糾正原始資料中所存在的一些錯(cuò)誤,可以剔除一些無法進(jìn)行再調(diào)查但又有明顯錯(cuò)誤的問卷,還可以普遍了解整個(gè)資料收集工作的質(zhì)量,從而對資料的真實(shí)性和準(zhǔn)確性具有更大的信心。通過審核和復(fù)查,研究者可以發(fā)現(xiàn)并糾正原始資料中所存在的一些錯(cuò)第二節(jié)資料轉(zhuǎn)換與錄入1、問卷資料轉(zhuǎn)換編碼手冊:為了減少資料轉(zhuǎn)換工作中的誤差,保證數(shù)據(jù)的質(zhì)量,研究者需要編制一份編碼手冊(也稱編碼簿)發(fā)給從事問卷資料轉(zhuǎn)換工作的人員,以便他們按編碼手冊的要求,統(tǒng)一進(jìn)行資料轉(zhuǎn)換工作第二節(jié)資料轉(zhuǎn)換與錄入1、問卷資料轉(zhuǎn)換在編碼手冊中,研究者要將需要編碼的項(xiàng)目和問題一一列出,逐一規(guī)定它們的代碼、寬度、欄碼、簡要名稱、答案賦值方式及其他特殊規(guī)定等等。整個(gè)編碼手冊的格式要規(guī)范統(tǒng)一,指示要明確,且容易理解,便于操作。在編碼手冊中,研究者要將需要編碼的項(xiàng)目和問題一一列出,逐一規(guī)
“項(xiàng)目名稱”所列的是問卷中的問題或有關(guān)項(xiàng)目;“變量名”則是調(diào)查問卷中所實(shí)際測量的一個(gè)變量;“含義”是簡要地指出該變量的內(nèi)涵,它往往是變量的核心內(nèi)容的反映;“答案賦值”一項(xiàng)十分關(guān)鍵,它可以說是編碼手冊的真正內(nèi)容。在這一欄中,研究者要詳細(xì)地標(biāo)明每一種答案的賦值安排,以及某些特殊形式的答案賦值方法“項(xiàng)目名稱”所列的是問卷中的問題或有關(guān)項(xiàng)目;2、數(shù)據(jù)錄入經(jīng)過前述的資料轉(zhuǎn)換處理,調(diào)查所收回的問卷中的一個(gè)個(gè)具體答案都已成功地、系統(tǒng)地轉(zhuǎn)換成了由0-9這10個(gè)阿拉伯?dāng)?shù)字構(gòu)成的數(shù)碼,接下來的任務(wù)就是將這些數(shù)碼輸入計(jì)算機(jī)內(nèi),以便進(jìn)行統(tǒng)計(jì)分析了。這就是數(shù)據(jù)錄入的工作2、數(shù)據(jù)錄入第八章資料處理--史亞蕾-課件數(shù)據(jù)錄入的方式主要有兩種:一種是直接從問卷上將編好碼的數(shù)據(jù)輸入計(jì)算機(jī);另一種是先將問卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到專門的登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計(jì)算機(jī)。登錄表的橫欄為問題及變量名,且都有給定的欄碼,縱欄為不同的個(gè)案記錄數(shù)據(jù)數(shù)據(jù)錄入的方式主要有兩種:第八章資料處理--史亞蕾-課件目前運(yùn)用較普遍的統(tǒng)計(jì)分析軟件主要有SPSS,SAS等,尤其是SPSS應(yīng)用更為廣泛。從目前情況看,研究者主要采用兩種方法來輸入數(shù)據(jù)。一種方法是直接在SPSS軟件上輸入數(shù)據(jù)。另一類是采用比較專門的數(shù)據(jù)庫管理軟件,如FOXBASE,Excel等,兩種方法各有特點(diǎn)目前運(yùn)用較普遍的統(tǒng)計(jì)分析軟件主要有SPSS,SAS等,尤其是第八章資料處理--史亞蕾-課件在SPSS中輸入比較直觀,打開SPSS后,顯示的是一個(gè)數(shù)據(jù)錄入窗口,每一個(gè)縱欄表示一個(gè)變量,每一橫行代表一個(gè)個(gè)案。輸入前需要定義變量,做法是先用鼠標(biāo)點(diǎn)擊表下面的Variableview,進(jìn)入到到變量定義窗口(橫行上面分別為變量名、變量類型、變量寬度、小數(shù)點(diǎn)位數(shù)、變量標(biāo)簽等、縱欄的1、2、3等表示個(gè)案)再用鼠標(biāo)點(diǎn)擊表下方Dataview,返回?cái)?shù)據(jù)錄入窗口。在SPSS中輸入比較直觀,打開SPSS后,顯示的是一個(gè)數(shù)據(jù)錄第八章資料處理--史亞蕾-課件這時(shí)就可以第一行開始,直接將每一個(gè)個(gè)案的數(shù)據(jù)逐行一個(gè)一個(gè)地敲到方格中,數(shù)據(jù)錄完后存盤。然后就可以隨時(shí)調(diào)用作分析了。但是,直接輸入有時(shí)候很容易出錯(cuò),且輸入時(shí)也不容易發(fā)現(xiàn);而另一類專門性的數(shù)據(jù)庫管理軟件則往往更能保證輸入的正確性,更能減少輸入數(shù)據(jù)時(shí)產(chǎn)生的差錯(cuò)這時(shí)就可以第一行開始,直接將每一個(gè)個(gè)案的數(shù)據(jù)逐行一個(gè)一個(gè)地敲由于一項(xiàng)問卷調(diào)查的數(shù)據(jù)總量(每份問卷的欄碼總數(shù)乘以全部問卷,即為輸入數(shù)碼或字符總數(shù))往往是很大的,故實(shí)踐中常常是有多人共同輸入來完成的。因此,研究者必須對數(shù)據(jù)的輸入工作進(jìn)行精心組織和安排。具體說來,他要做好以下幾方面工作:由于一項(xiàng)問卷調(diào)查的數(shù)據(jù)總量(每份問卷的欄碼總數(shù)乘以全部問卷,①挑選和培訓(xùn)輸入人員。數(shù)據(jù)輸入人員應(yīng)該是熟悉計(jì)算機(jī)操作,熟悉調(diào)查問卷的人,通??蓮拇髮W(xué)生調(diào)查員中挑選。對選出的錄入人員要進(jìn)行一定的培訓(xùn),熟悉輸入方式和具體軟件,并合理分工和加強(qiáng)管理。①挑選和培訓(xùn)輸入人員。數(shù)據(jù)輸入人員應(yīng)該是熟悉計(jì)算機(jī)操作,熟悉②統(tǒng)一規(guī)定數(shù)據(jù)輸入格式和數(shù)據(jù)文件名。由于多人輸入,每個(gè)輸入人員應(yīng)采取統(tǒng)一的輸入格式,并各自規(guī)定自己存放數(shù)據(jù)的文件名,以防與他人輸入的數(shù)據(jù)格式不同或發(fā)生混淆和丟失。尤其是輸入格式一旦確定,每個(gè)輸入人員都必須嚴(yán)格遵守執(zhí)行,否則以后很難處理,這一點(diǎn)十分關(guān)鍵。②統(tǒng)一規(guī)定數(shù)據(jù)輸入格式和數(shù)據(jù)文件名。由于多人輸入,每個(gè)輸入人③每個(gè)輸入人員獨(dú)立完成各自所輸?shù)哪且徊糠謫柧恚煌斎肴藛T的問卷相互之間,以及同一個(gè)輸入人員已輸和未輸?shù)膯柧碇g,千萬不要混淆搞亂,以免造成漏輸或重復(fù)輸入,影響數(shù)據(jù)質(zhì)量。④在每個(gè)輸入人員完成各自所負(fù)責(zé)的問卷輸入任務(wù)后,由研究者把他們的數(shù)據(jù)合起來形成一個(gè)總的數(shù)據(jù)文件,以供統(tǒng)計(jì)分析時(shí)調(diào)用。③每個(gè)輸入人員獨(dú)立完成各自所輸?shù)哪且徊糠謫柧?,不同輸入人員的第三節(jié)數(shù)據(jù)清理第三節(jié)數(shù)據(jù)清理271、有效范圍清理對于問卷中的任何一個(gè)變量來說,它的有效的編碼值往往都有某種范圍,而當(dāng)數(shù)據(jù)中的數(shù)字超出了這一范圍時(shí),可以肯定這個(gè)數(shù)字一定是錯(cuò)誤的1、有效范圍清理當(dāng)然,這種錯(cuò)誤數(shù)字的出現(xiàn)可以發(fā)生在資料處理的每一個(gè)階段。首先,發(fā)生在原始問卷中的回答上;其次,發(fā)生在編碼員對問卷的編碼結(jié)果上;第三,發(fā)生在計(jì)算機(jī)錄入員輸入數(shù)據(jù)的過程中。當(dāng)然,這種錯(cuò)誤數(shù)字的出現(xiàn)可以發(fā)生在資料處理的每一個(gè)階段。要檢查出所有不符合要求的超出有效范圍的編碼值,我們只需在計(jì)算機(jī)上用SPSS軟件(或其他軟件)執(zhí)行一條統(tǒng)計(jì)各變量頻數(shù)分布的命令,計(jì)算機(jī)很快就給出下列形式的結(jié)果:要檢查出所有不符合要求的超出有效范圍的編碼值,我們只需在計(jì)算第八章資料處理--史亞蕾-課件找有問題的個(gè)案的方法同樣離不開計(jì)算機(jī)及SPSS軟件的運(yùn)用。在SPSS軟件中,我們先打開數(shù)據(jù)文件,然后執(zhí)行“查找數(shù)據(jù)”命令。選擇數(shù)據(jù)中的A5欄,讓計(jì)算機(jī)逐個(gè)查找在這一變量欄中編碼值為6的那9個(gè)個(gè)案。再根據(jù)這9個(gè)個(gè)案的編號找出原始問卷,進(jìn)行核對找有問題的個(gè)案的方法同樣離不開計(jì)算機(jī)及SPSS軟件的運(yùn)用。在如果原始問卷上的回答是2,而編碼為6,則是編碼員的錯(cuò)誤,將數(shù)據(jù)中的這個(gè)6改為2即可;如果原始問卷上是2,編碼也是2,則是錄入員的錯(cuò)誤,也直接將數(shù)據(jù)改正即可;如果核對時(shí),發(fā)現(xiàn)是原始問卷中的填答錯(cuò)誤,則只能將該個(gè)案在這一變量上的回答記為0(即無回答),作為缺省值處理如果原始問卷上的回答是2,而編碼為6,則是編碼員的錯(cuò)誤,將數(shù)2、邏輯一致性清理其基本思路是依據(jù)問卷中的問題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來檢查前后數(shù)據(jù)之間的合理性。2、邏輯一致性清理比如,一項(xiàng)對青年夫婦進(jìn)行的社會(huì)調(diào)查中,有這樣一對相倚問題。其過濾性問題是:“你們有孩子嗎?”答案為“有(編碼為1”和“沒有(編碼為2。而后續(xù)性問題是:“請問你們的孩子今年多大了?”那么,對于那些在前一問題中的回答“沒有”的人(即編碼為2的人),在后一問題中的回答應(yīng)該是空白(即為缺省值,用0表示)。如果在這些人中,有的人的第二個(gè)答案上出現(xiàn)了4、6等數(shù)字,則這些個(gè)案的數(shù)據(jù)就可能有毛病比如,一項(xiàng)對青年夫婦進(jìn)行的社會(huì)調(diào)查中,有這樣一對相倚問題。其3、數(shù)據(jù)質(zhì)量抽查采用隨機(jī)抽樣的方法,從樣本的全部個(gè)案中,抽取一部分個(gè)案,進(jìn)行校對工作。用這一部分個(gè)案校對的結(jié)果,來估計(jì)和評價(jià)全部數(shù)據(jù)的質(zhì)量。根據(jù)樣本中個(gè)案數(shù)目的多少,以及每份問卷中變量數(shù)和總字符數(shù)的多少,研究者往往抽取2%-5%的個(gè)案進(jìn)行校對3、數(shù)據(jù)質(zhì)量抽查一項(xiàng)調(diào)查樣本規(guī)模為1000個(gè)個(gè)案,一份問卷的字符數(shù)(數(shù)據(jù)的個(gè)數(shù))為200。研究者從中隨機(jī)抽取3%的個(gè)案(即30份問卷)進(jìn)行對照檢查,結(jié)果發(fā)現(xiàn)有2個(gè)字符輸入錯(cuò)誤,這樣可知錯(cuò)誤率在0.03%左右。也就是說在總共20萬個(gè)數(shù)據(jù)中,大約有60個(gè)左右的錯(cuò)誤。一項(xiàng)調(diào)查樣本規(guī)模為1000個(gè)個(gè)案,一份問卷的字符數(shù)(數(shù)據(jù)的個(gè)第四節(jié)統(tǒng)計(jì)表與統(tǒng)計(jì)圖第四節(jié)統(tǒng)計(jì)表與統(tǒng)計(jì)圖381、統(tǒng)計(jì)表的構(gòu)成與制作(1)統(tǒng)計(jì)表的構(gòu)成從統(tǒng)計(jì)表的結(jié)構(gòu)上看,通常都由表號、總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題、數(shù)字注釋和資料來源等要素所構(gòu)成表號:表的序號,位于表頂端左角。其作用是便于指示和查找1、統(tǒng)計(jì)表的構(gòu)成與制作總標(biāo)題:是表的名稱,它位于表的頂端,緊接在表號后面。橫行標(biāo)題:是橫行的名稱,又稱橫標(biāo)目。它位于表的左側(cè),對于頻數(shù)統(tǒng)計(jì)表來說,橫行標(biāo)題一般用來統(tǒng)計(jì)所要說明的主題;而對于交互分類統(tǒng)計(jì)表來說,則表示其中一個(gè)變量類別總標(biāo)題:是表的名稱,它位于表的頂端,緊接在表號后面??v欄標(biāo)題:是縱欄的名稱,又稱縱標(biāo)目,位于表的最上一格。對于一般的頻數(shù)統(tǒng)計(jì)表,它指示調(diào)查指標(biāo)或統(tǒng)計(jì)指標(biāo)的名稱;而對于交互分類表來說,它也是表示其中的一個(gè)變量的類別數(shù)字:是統(tǒng)計(jì)表的實(shí)質(zhì)性內(nèi)容,是對調(diào)查資料進(jìn)行統(tǒng)計(jì)匯總、整理和計(jì)算的結(jié)果體現(xiàn)。它位于由橫行標(biāo)題與縱欄標(biāo)題所包圍的范圍中??v欄標(biāo)題:是縱欄的名稱,又稱縱標(biāo)目,位于表的最上一格。對于一注釋或資料來源是對表中資料的一種說明,位于表的下端。注釋或資料來源是對表中資料的一種說明,位于表的下端。(2)統(tǒng)計(jì)表的制作統(tǒng)計(jì)表制作原則是:科學(xué)、規(guī)范、簡明、實(shí)用、美觀。具地說,在制作統(tǒng)計(jì)表時(shí),應(yīng)注意以下幾個(gè)方面:首先,表的標(biāo)題要簡短明了,其次,表的縱欄標(biāo)題與橫行標(biāo)題要準(zhǔn)確反映變量取值的含義,(2)統(tǒng)計(jì)表的制作第三,表中的數(shù)據(jù)資料必須注明計(jì)量單位,第三,表中的數(shù)據(jù)資料必須注明計(jì)量單位,第四,對于一般頻數(shù)分布表,則應(yīng)列出合計(jì)欄,以便獲得整體情況的資料。總計(jì)或合計(jì)欄往往放在表的最下一格;對于交互分類表,則將各種專門的統(tǒng)計(jì)量放在表的最下面一格第四,對于一般頻數(shù)分布表,則應(yīng)列出合計(jì)欄,以便獲得整體情況的最后,各種表格均應(yīng)以橫線為主,能夠不用豎線則盡量不用。即便需要用豎線的表格,也應(yīng)是開口式的,即表的左右兩端不劃豎線在不致混淆的情況下,也可將其豎線去掉,成為以下形式最后,各種表格均應(yīng)以橫線為主,能夠不用豎線則盡量不用。即便需而交互分類表則可制成以下表8-7形式除表的最上面一條橫線與最下面一條橫線用粗線外,其余橫線均用細(xì)線而交互分類表則可制成以下表8-7形式2、統(tǒng)計(jì)圖統(tǒng)計(jì)圖具有直觀、形象、一目了然、通俗易懂的特點(diǎn),它主要用于調(diào)查資料初級統(tǒng)計(jì)結(jié)果的描述,特別適合于對調(diào)查總體的內(nèi)部構(gòu)成進(jìn)行描述,對不同現(xiàn)象的分布進(jìn)行比較以及對現(xiàn)象變化的趨勢進(jìn)行展示等。統(tǒng)計(jì)圖主要有條形圖、圓形圖和折線圖三種2、統(tǒng)計(jì)圖(1)條形圖條形圖又稱矩形圖,它是以寬度相等、長度不等的長條來表示不同的統(tǒng)計(jì)數(shù)字,如表示頻數(shù)或百分比的多少等等(1)條形圖簡單條形圖第八章資料處理--史亞蕾-課件復(fù)雜條形圖:復(fù)雜條形圖:(2)圓形圖又稱扇形圖,它是以圓內(nèi)不同扇形面積的大小來表示總體中不同部分所占的比重,形象地反映總體的內(nèi)部結(jié)構(gòu)。由于一個(gè)圓的圓心角度數(shù)為360,用360乘以每一部分所占的百分比,即可得出該部分的圓心角度角度數(shù)為數(shù),再在圓中按這些角度畫出各個(gè)不同的扇形(2)圓形圖第八章資料處理--史亞蕾-課件它是通過上下變化的線段來反映所研究現(xiàn)象隨時(shí)間變化的過程和發(fā)展趨勢的圖形,包括單式曲線圖和復(fù)式曲線圖。它是通過上下變化的線段來反映所研究現(xiàn)象隨時(shí)間變化的過程和發(fā)展第八章資料處理--史亞蕾-課件第八章資料處理--史亞蕾-課件
謝謝大家!謝謝大家!57第八章
調(diào)查資料的處理第八章
調(diào)查資料的處理58調(diào)查資料的整理的主要內(nèi)容
原始資料的審核和復(fù)查1
數(shù)據(jù)清理3
統(tǒng)計(jì)表與統(tǒng)計(jì)圖4
資料轉(zhuǎn)化與錄入2調(diào)查資料的整理的主要內(nèi)容原始資料的審核和第一節(jié)原始資料的審核與復(fù)查1、資料的審核
定義:它是指研究者對調(diào)查所收集回的原始資料(主要是問卷)進(jìn)行初步的審查和核實(shí),校正錯(cuò)填、誤填的答案,剔除亂填、空白和嚴(yán)重缺答的廢卷目的:使得原始資料具有較好的準(zhǔn)確性、完整性和真實(shí)性,從而為后續(xù)資料整理錄入與統(tǒng)計(jì)分析工作打下較好的基礎(chǔ)。第一節(jié)原始資料的審核與復(fù)查1、資料的審核檢查出文件資料中存在的問題重新向被調(diào)查者核實(shí)
資料的審核工作資料審核有兩種不同的做法:一種是實(shí)地審核;另一種是系統(tǒng)審核或集中審核檢查出文件資料中存在的問題重新向被調(diào)查者核實(shí)資料的審核工作實(shí)地審核:在調(diào)查的過程中進(jìn)行,即邊調(diào)查邊審核優(yōu)點(diǎn):特別及時(shí),且效果較好;缺點(diǎn):要求調(diào)查工作的組織和安排要特別仔細(xì),調(diào)查員個(gè)人處理各種情況的能力要比較強(qiáng)實(shí)地審核:在調(diào)查的過程中進(jìn)行,即邊調(diào)查邊審核集中審核:先將調(diào)查資料全部收集回來,然后再集中時(shí)間進(jìn)行審核優(yōu)點(diǎn):調(diào)查工作便于統(tǒng)一組織安排和管理,審核工作也可以統(tǒng)一在研究者的指導(dǎo)下進(jìn)行,審核的標(biāo)準(zhǔn)比較一致,檢查的質(zhì)量也相對好一些;缺點(diǎn):整個(gè)調(diào)查工作的周期則會(huì)相對拉長,少數(shù)個(gè)案的重新詢問和核實(shí)工作有時(shí)因時(shí)間相隔較長或調(diào)查地點(diǎn)較遠(yuǎn)而無法落實(shí)。集中審核:先將調(diào)查資料全部收集回來,然后再集中時(shí)間進(jìn)行審核
2、資料的復(fù)查定義:指的是研究者在調(diào)查資料收回后,又由其他人對所調(diào)查的樣本中的一部分個(gè)案進(jìn)行第二次調(diào)查,以檢查和核實(shí)第一次調(diào)查的質(zhì)量基本做法:從原來的調(diào)查員所調(diào)查過的樣本中,隨機(jī)抽取5%-15%的個(gè)案重新進(jìn)行調(diào)查調(diào)查內(nèi)容:一方面核實(shí)原來的調(diào)查員是否真的對個(gè)案進(jìn)行過調(diào)查;另一方面可將兩次調(diào)查的結(jié)果進(jìn)行對比,以檢查第一次調(diào)查的質(zhì)量
通過審核和復(fù)查,研究者可以發(fā)現(xiàn)并糾正原始資料中所存在的一些錯(cuò)誤,可以剔除一些無法進(jìn)行再調(diào)查但又有明顯錯(cuò)誤的問卷,還可以普遍了解整個(gè)資料收集工作的質(zhì)量,從而對資料的真實(shí)性和準(zhǔn)確性具有更大的信心。通過審核和復(fù)查,研究者可以發(fā)現(xiàn)并糾正原始資料中所存在的一些錯(cuò)第二節(jié)資料轉(zhuǎn)換與錄入1、問卷資料轉(zhuǎn)換編碼手冊:為了減少資料轉(zhuǎn)換工作中的誤差,保證數(shù)據(jù)的質(zhì)量,研究者需要編制一份編碼手冊(也稱編碼簿)發(fā)給從事問卷資料轉(zhuǎn)換工作的人員,以便他們按編碼手冊的要求,統(tǒng)一進(jìn)行資料轉(zhuǎn)換工作第二節(jié)資料轉(zhuǎn)換與錄入1、問卷資料轉(zhuǎn)換在編碼手冊中,研究者要將需要編碼的項(xiàng)目和問題一一列出,逐一規(guī)定它們的代碼、寬度、欄碼、簡要名稱、答案賦值方式及其他特殊規(guī)定等等。整個(gè)編碼手冊的格式要規(guī)范統(tǒng)一,指示要明確,且容易理解,便于操作。在編碼手冊中,研究者要將需要編碼的項(xiàng)目和問題一一列出,逐一規(guī)
“項(xiàng)目名稱”所列的是問卷中的問題或有關(guān)項(xiàng)目;“變量名”則是調(diào)查問卷中所實(shí)際測量的一個(gè)變量;“含義”是簡要地指出該變量的內(nèi)涵,它往往是變量的核心內(nèi)容的反映;“答案賦值”一項(xiàng)十分關(guān)鍵,它可以說是編碼手冊的真正內(nèi)容。在這一欄中,研究者要詳細(xì)地標(biāo)明每一種答案的賦值安排,以及某些特殊形式的答案賦值方法“項(xiàng)目名稱”所列的是問卷中的問題或有關(guān)項(xiàng)目;2、數(shù)據(jù)錄入經(jīng)過前述的資料轉(zhuǎn)換處理,調(diào)查所收回的問卷中的一個(gè)個(gè)具體答案都已成功地、系統(tǒng)地轉(zhuǎn)換成了由0-9這10個(gè)阿拉伯?dāng)?shù)字構(gòu)成的數(shù)碼,接下來的任務(wù)就是將這些數(shù)碼輸入計(jì)算機(jī)內(nèi),以便進(jìn)行統(tǒng)計(jì)分析了。這就是數(shù)據(jù)錄入的工作2、數(shù)據(jù)錄入第八章資料處理--史亞蕾-課件數(shù)據(jù)錄入的方式主要有兩種:一種是直接從問卷上將編好碼的數(shù)據(jù)輸入計(jì)算機(jī);另一種是先將問卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到專門的登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計(jì)算機(jī)。登錄表的橫欄為問題及變量名,且都有給定的欄碼,縱欄為不同的個(gè)案記錄數(shù)據(jù)數(shù)據(jù)錄入的方式主要有兩種:第八章資料處理--史亞蕾-課件目前運(yùn)用較普遍的統(tǒng)計(jì)分析軟件主要有SPSS,SAS等,尤其是SPSS應(yīng)用更為廣泛。從目前情況看,研究者主要采用兩種方法來輸入數(shù)據(jù)。一種方法是直接在SPSS軟件上輸入數(shù)據(jù)。另一類是采用比較專門的數(shù)據(jù)庫管理軟件,如FOXBASE,Excel等,兩種方法各有特點(diǎn)目前運(yùn)用較普遍的統(tǒng)計(jì)分析軟件主要有SPSS,SAS等,尤其是第八章資料處理--史亞蕾-課件在SPSS中輸入比較直觀,打開SPSS后,顯示的是一個(gè)數(shù)據(jù)錄入窗口,每一個(gè)縱欄表示一個(gè)變量,每一橫行代表一個(gè)個(gè)案。輸入前需要定義變量,做法是先用鼠標(biāo)點(diǎn)擊表下面的Variableview,進(jìn)入到到變量定義窗口(橫行上面分別為變量名、變量類型、變量寬度、小數(shù)點(diǎn)位數(shù)、變量標(biāo)簽等、縱欄的1、2、3等表示個(gè)案)再用鼠標(biāo)點(diǎn)擊表下方Dataview,返回?cái)?shù)據(jù)錄入窗口。在SPSS中輸入比較直觀,打開SPSS后,顯示的是一個(gè)數(shù)據(jù)錄第八章資料處理--史亞蕾-課件這時(shí)就可以第一行開始,直接將每一個(gè)個(gè)案的數(shù)據(jù)逐行一個(gè)一個(gè)地敲到方格中,數(shù)據(jù)錄完后存盤。然后就可以隨時(shí)調(diào)用作分析了。但是,直接輸入有時(shí)候很容易出錯(cuò),且輸入時(shí)也不容易發(fā)現(xiàn);而另一類專門性的數(shù)據(jù)庫管理軟件則往往更能保證輸入的正確性,更能減少輸入數(shù)據(jù)時(shí)產(chǎn)生的差錯(cuò)這時(shí)就可以第一行開始,直接將每一個(gè)個(gè)案的數(shù)據(jù)逐行一個(gè)一個(gè)地敲由于一項(xiàng)問卷調(diào)查的數(shù)據(jù)總量(每份問卷的欄碼總數(shù)乘以全部問卷,即為輸入數(shù)碼或字符總數(shù))往往是很大的,故實(shí)踐中常常是有多人共同輸入來完成的。因此,研究者必須對數(shù)據(jù)的輸入工作進(jìn)行精心組織和安排。具體說來,他要做好以下幾方面工作:由于一項(xiàng)問卷調(diào)查的數(shù)據(jù)總量(每份問卷的欄碼總數(shù)乘以全部問卷,①挑選和培訓(xùn)輸入人員。數(shù)據(jù)輸入人員應(yīng)該是熟悉計(jì)算機(jī)操作,熟悉調(diào)查問卷的人,通??蓮拇髮W(xué)生調(diào)查員中挑選。對選出的錄入人員要進(jìn)行一定的培訓(xùn),熟悉輸入方式和具體軟件,并合理分工和加強(qiáng)管理。①挑選和培訓(xùn)輸入人員。數(shù)據(jù)輸入人員應(yīng)該是熟悉計(jì)算機(jī)操作,熟悉②統(tǒng)一規(guī)定數(shù)據(jù)輸入格式和數(shù)據(jù)文件名。由于多人輸入,每個(gè)輸入人員應(yīng)采取統(tǒng)一的輸入格式,并各自規(guī)定自己存放數(shù)據(jù)的文件名,以防與他人輸入的數(shù)據(jù)格式不同或發(fā)生混淆和丟失。尤其是輸入格式一旦確定,每個(gè)輸入人員都必須嚴(yán)格遵守執(zhí)行,否則以后很難處理,這一點(diǎn)十分關(guān)鍵。②統(tǒng)一規(guī)定數(shù)據(jù)輸入格式和數(shù)據(jù)文件名。由于多人輸入,每個(gè)輸入人③每個(gè)輸入人員獨(dú)立完成各自所輸?shù)哪且徊糠謫柧恚煌斎肴藛T的問卷相互之間,以及同一個(gè)輸入人員已輸和未輸?shù)膯柧碇g,千萬不要混淆搞亂,以免造成漏輸或重復(fù)輸入,影響數(shù)據(jù)質(zhì)量。④在每個(gè)輸入人員完成各自所負(fù)責(zé)的問卷輸入任務(wù)后,由研究者把他們的數(shù)據(jù)合起來形成一個(gè)總的數(shù)據(jù)文件,以供統(tǒng)計(jì)分析時(shí)調(diào)用。③每個(gè)輸入人員獨(dú)立完成各自所輸?shù)哪且徊糠謫柧恚煌斎肴藛T的第三節(jié)數(shù)據(jù)清理第三節(jié)數(shù)據(jù)清理841、有效范圍清理對于問卷中的任何一個(gè)變量來說,它的有效的編碼值往往都有某種范圍,而當(dāng)數(shù)據(jù)中的數(shù)字超出了這一范圍時(shí),可以肯定這個(gè)數(shù)字一定是錯(cuò)誤的1、有效范圍清理當(dāng)然,這種錯(cuò)誤數(shù)字的出現(xiàn)可以發(fā)生在資料處理的每一個(gè)階段。首先,發(fā)生在原始問卷中的回答上;其次,發(fā)生在編碼員對問卷的編碼結(jié)果上;第三,發(fā)生在計(jì)算機(jī)錄入員輸入數(shù)據(jù)的過程中。當(dāng)然,這種錯(cuò)誤數(shù)字的出現(xiàn)可以發(fā)生在資料處理的每一個(gè)階段。要檢查出所有不符合要求的超出有效范圍的編碼值,我們只需在計(jì)算機(jī)上用SPSS軟件(或其他軟件)執(zhí)行一條統(tǒng)計(jì)各變量頻數(shù)分布的命令,計(jì)算機(jī)很快就給出下列形式的結(jié)果:要檢查出所有不符合要求的超出有效范圍的編碼值,我們只需在計(jì)算第八章資料處理--史亞蕾-課件找有問題的個(gè)案的方法同樣離不開計(jì)算機(jī)及SPSS軟件的運(yùn)用。在SPSS軟件中,我們先打開數(shù)據(jù)文件,然后執(zhí)行“查找數(shù)據(jù)”命令。選擇數(shù)據(jù)中的A5欄,讓計(jì)算機(jī)逐個(gè)查找在這一變量欄中編碼值為6的那9個(gè)個(gè)案。再根據(jù)這9個(gè)個(gè)案的編號找出原始問卷,進(jìn)行核對找有問題的個(gè)案的方法同樣離不開計(jì)算機(jī)及SPSS軟件的運(yùn)用。在如果原始問卷上的回答是2,而編碼為6,則是編碼員的錯(cuò)誤,將數(shù)據(jù)中的這個(gè)6改為2即可;如果原始問卷上是2,編碼也是2,則是錄入員的錯(cuò)誤,也直接將數(shù)據(jù)改正即可;如果核對時(shí),發(fā)現(xiàn)是原始問卷中的填答錯(cuò)誤,則只能將該個(gè)案在這一變量上的回答記為0(即無回答),作為缺省值處理如果原始問卷上的回答是2,而編碼為6,則是編碼員的錯(cuò)誤,將數(shù)2、邏輯一致性清理其基本思路是依據(jù)問卷中的問題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來檢查前后數(shù)據(jù)之間的合理性。2、邏輯一致性清理比如,一項(xiàng)對青年夫婦進(jìn)行的社會(huì)調(diào)查中,有這樣一對相倚問題。其過濾性問題是:“你們有孩子嗎?”答案為“有(編碼為1”和“沒有(編碼為2。而后續(xù)性問題是:“請問你們的孩子今年多大了?”那么,對于那些在前一問題中的回答“沒有”的人(即編碼為2的人),在后一問題中的回答應(yīng)該是空白(即為缺省值,用0表示)。如果在這些人中,有的人的第二個(gè)答案上出現(xiàn)了4、6等數(shù)字,則這些個(gè)案的數(shù)據(jù)就可能有毛病比如,一項(xiàng)對青年夫婦進(jìn)行的社會(huì)調(diào)查中,有這樣一對相倚問題。其3、數(shù)據(jù)質(zhì)量抽查采用隨機(jī)抽樣的方法,從樣本的全部個(gè)案中,抽取一部分個(gè)案,進(jìn)行校對工作。用這一部分個(gè)案校對的結(jié)果,來估計(jì)和評價(jià)全部數(shù)據(jù)的質(zhì)量。根據(jù)樣本中個(gè)案數(shù)目的多少,以及每份問卷中變量數(shù)和總字符數(shù)的多少,研究者往往抽取2%-5%的個(gè)案進(jìn)行校對3、數(shù)據(jù)質(zhì)量抽查一項(xiàng)調(diào)查樣本規(guī)模為1000個(gè)個(gè)案,一份問卷的字符數(shù)(數(shù)據(jù)的個(gè)數(shù))為200。研究者從中隨機(jī)抽取3%的個(gè)案(即30份問卷)進(jìn)行對照檢查,結(jié)果發(fā)現(xiàn)有2個(gè)字符輸入錯(cuò)誤,這樣可知錯(cuò)誤率在0.03%左右。也就是說在總共20萬個(gè)數(shù)據(jù)中,大約有60個(gè)左右的錯(cuò)誤。一項(xiàng)調(diào)查樣本規(guī)模為1000個(gè)個(gè)案,一份問卷的字符數(shù)(數(shù)據(jù)的個(gè)第四節(jié)統(tǒng)計(jì)表與統(tǒng)計(jì)圖第四節(jié)統(tǒng)計(jì)表與統(tǒng)計(jì)圖951、統(tǒng)計(jì)表的構(gòu)成與制作(1)統(tǒng)計(jì)表的構(gòu)成從統(tǒng)計(jì)表的結(jié)構(gòu)上看,通常都由表號、總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題、數(shù)字注釋和資料來源等要素所構(gòu)成表號:表的序號,位于表頂端左角。其作用是便于指示和查找1、統(tǒng)計(jì)表的構(gòu)成與制作總標(biāo)題:是表的名稱,它位于表的頂端,緊接在表號后面。橫行標(biāo)題:是橫行的名稱,又稱橫標(biāo)目。它位于表的左側(cè),對于頻數(shù)統(tǒng)計(jì)表來說,橫行標(biāo)題一般用來統(tǒng)計(jì)所要說明的主題;而對于交互分類統(tǒng)計(jì)表來說,則表示其中一個(gè)變量類別總標(biāo)題:是表的名稱,它位于表的頂端,緊接在表號后面??v欄標(biāo)題:是縱欄的名稱,又稱縱標(biāo)目,位于表的最上一格。對于一般的頻數(shù)統(tǒng)計(jì)表,它指示調(diào)查指標(biāo)或統(tǒng)計(jì)指標(biāo)的名稱;而對于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房地產(chǎn)項(xiàng)目增資入股投資協(xié)議
- 二零二五年度辦公室文員聘用與企業(yè)文化融合協(xié)議
- 二零二五年度新能源汽車碰撞責(zé)任免除合同
- 2025年度現(xiàn)代農(nóng)業(yè)病蟲害防治藥害賠償協(xié)議書
- 二零二五年度勞動(dòng)局標(biāo)準(zhǔn)合同:養(yǎng)老服務(wù)業(yè)員工就業(yè)保障協(xié)議范本
- 2025年度賬戶變更補(bǔ)充服務(wù)協(xié)議
- 高性能計(jì)算中心設(shè)備采購及安裝合同
- 企業(yè)辦公室裝飾設(shè)計(jì)與施工服務(wù)合同
- 教育培訓(xùn)行業(yè)線上課程開發(fā)與運(yùn)營計(jì)劃書
- 電氣設(shè)備安裝工程施工合同新
- 石膏幾何體結(jié)構(gòu)素描教案
- 祥康健康快車王晗老師講座收集驗(yàn)方
- 禮儀與教化 課件-2023-2024學(xué)年高中美術(shù)湘美版(2019)美術(shù)鑒賞
- 新生兒早期基本保健課件
- 采礦學(xué)課程設(shè)計(jì)硯北煤礦新井設(shè)計(jì)全套圖紙
- 第19章-城市設(shè)計(jì)課件
- 人事管理管理制度
- 大型儲罐計(jì)算書
- 2022-2023學(xué)年廣東省廣州市荔灣區(qū)統(tǒng)考初三第一次模考數(shù)學(xué)試題含解析
- 針對本項(xiàng)目售后服務(wù)方案
- 2022年桂林電子科技大學(xué)高等學(xué)歷繼續(xù)教育學(xué)士學(xué)位英語考試真
評論
0/150
提交評論