版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
目錄
內容簡介
目錄
第一章導論
1.1復習筆記
1.2課后習題詳解
第二章抽樣設計
2.1復習筆記
2.2課后習題詳解
第二章抽樣實務及問題
3.1復習筆記
3.2課后習題詳解
第四章題目設計方法
41復習筆記
42課后習題詳解
第五章問卷設計與評估
5.1復習筆記
5.2課后習題詳解
第六章資料搜集方法的選擇
6.1復習筆記
6.2課后習題詳解
第七章標準化訪問
7.1復習筆記
7.2課后習題詳解
第八章數(shù)據(jù)處理
8.1復習筆記
8.2課后習題詳解
第九章調查中的其他議題
9.1復習筆記
9.2課后習題詳解
第一章導論
1.1復習筆記
一、調查研究概述
調查研究方法的界定
(1)調查研究方法的含義
調查研究方法是一種量化的社會研究方法,是通過向被訪者詢問問題來搜集資料,然后對
資料進行編碼整理和統(tǒng)計分析的社會研究方法;其中,詢問既可以是由被訪者自己填答問
卷,也可以是通過當面訪問或電話訪問進行。
(2)調查研究方法定義的理解
關于調查方法的定義,可以從以下三方面來理解:
①詢問作為調查研究的基本要素,是一個科學測量過程
a.在調查研究中,詢問是一個科學測量過程,對于詢問的每一個步驟,都要進行理論上
的檢驗。
b.經(jīng)過對每個步驟的檢驗,確定得到的詢問結果在多大程度上受到進行詢問時的環(huán)境條
件的影響。
c.要想實現(xiàn)對詢問過程的理論檢驗,必須先確立標準化詢問規(guī)范。
②選取有代表性的被訪者,是調查研究成功的關鍵
a.在調查研究中,如果不是無一遺漏地詢問每一位被訪者,而是從目標總體中抽出一部
分來詢問,就存在一個合理挑選樣本的過程。如果抽出的樣本能夠代表總體,那么這個抽
樣過程就是合理的;如果不能代表總體,則是不合理的。
b.由于樣本狀態(tài)總是或多或少地偏離總體狀態(tài),因此,只要進行抽樣就有抽樣誤差存在
。所以,在抽樣調查中,如何通過抽樣設計來減少抽樣誤差,提高樣本的代表性,是調查
研究成功的關鍵。
c.在實踐中,可以按照不同原則設計抽樣方法,但唯有按隨機原則設計的概率抽樣方法
,才能根據(jù)統(tǒng)計理論比較精確地估算出抽樣誤差,實現(xiàn)由樣本推論總體。
③資料的統(tǒng)計分析是完成調查研究的必要環(huán)節(jié)
進行一項研究,目的就是要說明事物及事物間的關聯(lián)性。調查研究是從有關過去事實的問
題中推論出時間順序,并利用控制變量及統(tǒng)計相關分析,排除其他可能的解釋,檢驗因果
關系。因此,調查研究通常又稱相關研究。由于各種統(tǒng)計方法和模型內容繁復,特別是一
些高級統(tǒng)計模型,需要大量的統(tǒng)計知識,即在講調查方法時,主要是談如何搜集資料。
2.調查研究法的發(fā)展簡史
按時間順序,調查研究的發(fā)展大體可以劃分為近代和現(xiàn)代兩個階段。近代調查研究主要包
括行政統(tǒng)計和社會問題調查,而現(xiàn)代調查研究則主要包括民意測驗、市場調查和研究性調
查。雖然存在著多種調查形式,但從內在發(fā)展脈絡看,無論是在近代還是現(xiàn)代,始終貫穿
著實地觀測和統(tǒng)計量化兩條線索,因此,了解調查研究的發(fā)展過程,要始終把握住這兩條
線索。
(1)近代調查研究
作為一種社會研究方法,調查研究肇始于近代的行政統(tǒng)計調查。
①進入18世紀后,歐洲各國紛紛開展行政統(tǒng)計調查,并逐漸制度化。從18世紀后半葉直至
20世紀初,社會調查開始被廣泛用于社會事業(yè),特別是用來記錄工業(yè)化所帶來的都市貧窮
狀況。
②近代社會調查大多是針對某個特定地區(qū)所進行的詳細經(jīng)驗研究,其目的是為了提供令人
印象深刻的社區(qū)日常生活圖像。在調查中,研究者還大量采用參與觀察、訪談和問卷調查
等實地觀測方法,搜集第一手經(jīng)驗資料,給調查研究打上了鮮明的經(jīng)驗性社會研究的烙印
o但這些調查大多沒有明確的理論框架,因此調查結果很難形成一般的社會理論。
③在獲取調查對象時,這些調查也缺少科學的抽樣方法。
(2)現(xiàn)代調查研究
進入20世紀后,社會調查與社會理論的結合,導致研究性調查的出現(xiàn)。隨著小樣本檢驗和
抽樣理論的建立,抽樣調查方法日益完善。而社會統(tǒng)計調查模式和多變量分析方法的出現(xiàn)
,標志著量化調查研究方法已成為一項成熟的經(jīng)驗社會研究方法。
①研究性調查模式的確立
早期研究性調查將社會調查與社會理論研究相結合,使研究性調查不再僅僅是搜集經(jīng)驗資
料,更重要的是服務于社會理論,檢驗或建立某種社會理論。但是這些調查的研究對象的
涉及范圍相對較小,基本上都是個案調查或社區(qū)調查。調查研究的操作往往是由某個中心
人物(老師傅),在一兩名助手(徒弟)幫助下完成的。調查研究方法經(jīng)常帶有一種秘傳
性質,雖然也很具體、周密,但通常缺少一套經(jīng)過檢驗的標準化程序、技巧和工具。
②抽樣方法的完善
以往的調查形式看,經(jīng)驗性及研究性社會調查,由于主要以個案和社區(qū)研究為主,不能處
理大量調查對象。在抽樣調查的早期階段,“代表性調查”,它指的是一種局部調查,希望
以局部作為總體的縮影來代表總體。但基本上都是采用非概率抽樣。非概率抽樣最大的問
題是無法事先估計抽樣誤差的大小,無法根據(jù)樣本情況對總體情況做出正確的推論。
抽樣調查最早被應用于民意測驗中,而非概率抽樣方法的不足,也正是通過民意測驗失敗
的例子被逐漸認識到的。非概率抽樣方法的失敗刺激了概率抽樣方法在調查研究中的應用
。概率抽樣是按照隨機原則來選取對象,這樣就能根據(jù)概率理論來計算抽樣誤差,從而對
總體進行推論。完成概率抽樣必須解決兩個問題:
a.如何選取對象才能保證每一個總體元素單位都有同等被抽選的機會;
b.如何確定樣本與總體的關系,或者說怎樣保證樣本的代表性。
③問卷與多變量分析技術的提高
除抽樣技術外,問卷測量和多變量分析方法也是最終促成當代調查方法形成的重要因素。
從某種意義上講,調查實際上就是通過詢問或觀察完成的一個測量過程。早期調查在分析
資料時,基本上限于單變量或雙變量分析,而現(xiàn)代調查研究中常用的多變量分析方法,分
析技術提高。
縱觀調查研究發(fā)展簡史,不難看出它是一項綜合了多項技術的研究方法。調查本質上是一
個測量過程,抽樣和統(tǒng)計分析技術的完善,進一步擴展了調查的應用范圍。
3.調查研究的局限性
(1)缺少彈性
①調查研究總是事先完成研究設計,并在研究中保持不變。這使得研究者無法察覺新的變
量,有時即使察覺到了,也很難做出相應的處理。這一點在很大程度上限制了研究者進一
步深化研究。
②利用標準化問卷進行測量,是調查研究的特色之一。但這種標準化問卷,一方面對于許
多被訪者來說適用程度可能都不是最高的,同時也使得調查研究難以處理比較復雜的議題。
(2)無法了解被訪者具體的生活情境
調查研究是用問卷來搜集被訪者信息的,調查訪問僅限于問卷設定的內容,而且調查的時
間很短。因此,研究者很難進入到被訪者的生活情境中,深入細致地把握被訪者在真實生
活情境中的行為和想法。
(3)容易受到人為因素的影響
一般說來,被調查對象會比較準確地回答諸如年齡、職業(yè)和教育等有關人口統(tǒng)計指標。但
是,對于態(tài)度的調查就很難說有十分的把握,因為人們的態(tài)度很容易受到他人的影響,而
問卷訪問時又很難發(fā)現(xiàn)。并且研究行為本身可能就會影響被訪者的態(tài)度。
總體看來,作為一種測量過程,標準化測量和概率抽樣使調查研究具有較高的信度,但標
準化測量、情境缺失和人為因素的影響,卻使其效度較低。克服調查研究局限性的一個有
效方法,就是將它與其他研究方法結合使用,特別是與實地觀察研究結合,這樣就能取長
補短,大大提升研究結果的效度。
二、調查研究的分類
按調查對象的范圍分類
按調查對象涉及的范圍分類,可以將量化調查研究分為普查和抽樣調查兩種形式。
(1)普查是指對構成總體的所有個體無一例外地逐個進行調查。最常見的普查是人口調
查,它也是最早進行的量化調查。
(2)抽樣調查是指從所研究的總體中,按一定規(guī)則抽取部分元素進行調查,并根據(jù)調查
結果,對總體情況進行推斷。由于抽樣調查只詢問目標人群中的一部分對象,因此,投
入的人力、財力較少,調查周期也縮短了許多。抽樣調查的準確性較高。
抽樣調查只需要少量的工作人員,可以盡量使用那些具有一定專業(yè)素養(yǎng)的工作人員,同時
對他們進行充分的訓練,而且還可以在實際調查中給予嚴密的督導檢查,最大限度地控制
非抽樣誤差的發(fā)生。這樣,只要抽樣方法科學得當,與普查中非抽樣誤差產(chǎn)生的損失相比
,抽樣誤差所引起的損失反而小些,從而使得抽樣調查的資料更準確、更可靠。
2.按研究目的分類
按研究目的分類,可以將調查研究分成探索、描述和解釋三類。探索性研究中,基本不用
問卷形式,最主要的原因是問卷調查太貴。問卷調查主要用于描述性和解釋性研究。
(1)描述性調查是指對總體特征的分布情況進行詳細的描述,它關注的焦點集中在事情
是如何發(fā)生的,有誰牽涉在里面。進行描述性調查,要求研究者對議題有一定程度的了
解,而且一般會隨機抽取一個較大的樣本。
(2)解釋性調查希望找出事情發(fā)生的原因,它關注的是事情為什么會以現(xiàn)在這個樣子呈
現(xiàn)出來。解釋性調查通常是與描述性調查結合進行的,一項大規(guī)模的調查,先是進行總
的描述,然后再針對某些具體問題進行解釋。解釋性調查通常是與描述性調查結合進行
的,一項大規(guī)模的調查,先是進行總的描述,然后再針對某些具體問題進行解釋。
3.按執(zhí)行方式分類
按執(zhí)行方式,可以將調查研究劃分為三種主要形式:自填問卷、當面訪問和電話訪問。
(1)自填問卷方法是研究者將問卷直接交給被訪者,或用郵寄的方式寄給被訪者,由
他們自己閱讀問卷,然后根據(jù)填答說明,寫下自己的答案。自填問卷也可以將多個被訪者
召集到同一地點,在研究者的指導下統(tǒng)一填答問卷。
(2)當面訪問是研究者雇用一些訪問員,由他們根據(jù)問卷內容,當面地向被訪者口頭提
問,同時逐一記錄下被訪者的回答。
(3)電話訪問是當面訪問的一種轉化形式,訪問員不再直接面對被訪者,而是通過電話
向被訪者進行提問。
4.按時間維度分類
按進行調查的時間維度,量化調查研究可以分為兩大類:單一時點的橫剖調查和多重時點
的縱貫調查。
(1)橫剖調查是在某一個特定時間一次性抽樣,然后對樣本進行調查訪問。它是在某個
單一固定的時點上搜集有關信息,特別適合進行描述性調查。橫剖調查得到的資料,也
被用來進行解釋性研究。由于解釋性研究大多需要進行時間順序上的因果分析,單一時
點資料無法滿足這一要求。因此,研究者通常會再設計一些回溯性問題,用回憶的方法
,獲取被訪者以往的信息。
(2)縱貫調查至少在兩個以上時點進行抽樣,然后對樣本在不同時點之間所展現(xiàn)的特性
進行調查。進行大規(guī)模的縱貫問卷調查是比較困難的,特別是跨時段的抽樣,技術上不
太容易操作。由于在不同時點獲取資料,縱貫調查比較適合進行因果分析,尤其適合探
求社會變遷問題的解答。
按抽樣的對象和目的,縱貫調查可具體分為趨勢調查、同期群調查與追蹤調查三種形式。
①趨勢調查是指研究者通過搜集總體在不同時期同一種類型的資料,來比較分析總體特性
在一個較長時間段內的變化趨勢。趨勢調查中,每個時點用來搜集資料的問卷應保持一致
性,而且樣本也應該從同一個總體中抽出,但入樣的被訪者可以是不同的。
②同期群調查是指研究者在不同時點,對某個特定時段內共享相似生活經(jīng)驗的那些人的調
查,這群人被稱為同期群。同期群調查并不關心某個特殊的個人,它關注的是具有某種時
間標識的一類人,把他們視為目標總體。每個時點被抽中的被訪者只要具有共同的生活經(jīng)
驗即可,并不一定需要完全相同。
③追蹤調查是指研究者在不同時點,調查完全相同的一群人、一個團體或一個組織。追蹤
調查也將趨勢變化作為重點內容,所以使用的問卷也應保持內在的一致性。
5.按應用領域分類
除了人口調查,抽樣調查方法還經(jīng)常被應用于以下一些領域:
(1)民意調查
民意調查是指從一定范圍內的社會民眾中,抽取具有代表性的部分民眾作為樣本,直接詢
問他們對某些問題的看法,然后用這些民眾的看法來推論全體民眾的看法。
(2)市場調查
廣義的市場調查又稱市場研究,它包含了從認識市場到制定營銷決策的一切有關市場營銷
活動的分析和研究;狹義的市場調查則更偏重于搜集和分析市場信息。市場調查的對象主
要是各式各樣購買或使用商品的消費者,以及潛在的消費者;除此之外,還包括消費者以
外的人群。市場調查可以被用來研究消費者行為和對產(chǎn)品的滿意度,也可以用來研究產(chǎn)品
品牌、企業(yè)形象、廣告宣傳效果以及產(chǎn)品營銷環(huán)境等。
(3)社會問題調查
它是針對社會中存在的各種社會問題進行的系統(tǒng)調查。調杳的目的是為了對問題現(xiàn)狀加以
描述,同時分析問題的形成機制,進而找到解決問題的辦法。
(4)居民家計調查
它是一項基本國情調查,以居民家庭為調查對象,搜集整理有關居民家庭人口、就業(yè)狀況
、貨幣收入、消費構成,以及主要生活消費品實物量等方面的資料,從而反映出居民生活
水平的變動情況,進而為一些影響居民生活的決策提供依據(jù)。
(5)學術性專業(yè)調查
它是社會科學專業(yè)研究人員從事的調查,其目的是探索社會現(xiàn)象背后的社會規(guī)律。這種調
查在設計以及資料分析上,始終是以滿足某個專業(yè)學科自身理論發(fā)展需求為目標的,即它
是以學科理論建設為主要任務的。
三、調查研究的一般過程
調查設計
調查設計主要包括三方面內容:調查工作的總體規(guī)劃、抽樣設計、資料搜集和處理方案。
(1)調查研究的整個過程,工作項目相當繁雜,又牽涉到相當多的人員,因此必須對整
個調查工作有一個總體規(guī)劃,調查的總體規(guī)劃應以書面形式,形成一份計劃書。
①總體規(guī)劃的內容主要包括對調查目的、調查內容和范圍、調查經(jīng)費預算和進度安排的說
明。
②調查工作流程表
為了能更有效地完成下一步的調查執(zhí)行工作,最好能在調查設計階段,形成一份比較詳細
的調查工作流程表,把調查訪問過程所需進行的工作分類,盡量完整列出每一類中的工作
項目,并預設各工作項目的完成期限。
調查工作流程表是一個標準化調查程序,它在調查執(zhí)行過程中能起到工作檢查表的作用,
能幫助研究者關注每一個調查環(huán)節(jié),以免因遺漏某項工作而發(fā)生難以補救的缺失。
(2)抽樣設計是調查設計的另一項重要工作
設計抽樣方案首先要解決的問題是界定總體的范圍,明確調查對象是什么。在界定總體時
,真正有操作意義的是確定抽樣框。接下來要確定樣本規(guī)模。然后確定是否需要分階段或
者分層次。再有就是確定參數(shù)與誤差的估計方法,并推導出相應的估計公式。
(3)設計資料搜集和處理方案
①選擇資料搜集方式,是用自填問卷,還是進行調查訪問
選擇資料搜集方式,主要考慮的因素包括調查成本、抽樣、抽樣總體、調查內容和調查周
期等幾項。
②設計調查問卷
在調查研究中,問卷設計的好壞對調查結果影響很大,因此對于問卷設計應該予以特別注
意。從設計問卷初稿開始,就要針對調查主題,邀請相關專業(yè)研究人員進行認真細致的研
討。而在完成問卷初稿后,應對其進行相應的測試,包括實驗室測試和實地的預調查,以
有效保障問卷的效度與信度。
③設計資料處理方案
主要內容包括確定資料編碼的格式,一般適宜用預編碼的形式,與問卷設計結合在一起。
另外,還要確定數(shù)據(jù)錄入的軟件類型,落實計算機設備。
2.實地抽樣
實地抽樣是指根據(jù)抽樣方案,實地抽取調查對象的過程。實地抽樣通常包括以下的具體步
驟:
(1)訓練抽樣人員
無論是自填問卷,還是調查訪問,實際抽取調查對象的工作量都很大,而且具有一定的技
術難度,因此需要對有關人員進行專門訓練。另外,在當面訪問中,為了防止出現(xiàn)訪問員
誤差造成的樣本偏差,一般是將抽樣與訪問兩項工作分開進行。
(2)與抽樣方案中各級抽樣單位取得聯(lián)系
(3)具體執(zhí)行抽樣工作
在進行正式抽樣時,抽樣員應攜帶由調查單位出具的各種身份證明文件或抽樣員聘書,到
各級抽樣單位進行抽樣。詳細的身份證明文件能減輕相關單位及被調查對象的疑慮,有利
于抽樣工作的進行。在實地抽樣時,抽樣員應使用統(tǒng)一印制的樣本記錄表,詳細記錄抽樣
中的各種相關信息,這些信息可以再現(xiàn)完整的抽樣過程,并為檢查樣本的正確性提供依據(jù)。
(4)檢查樣本的正確性
抽樣員完成抽樣工作后,督導人員應對樣本的正確性進行檢查。檢查內容包括:
①抽樣人員所記錄之樣本表中的資料的完整性;
②抽樣方法運用的正確性。
3.資料搜集
(1)調查訪問
①招募訪問員
對于調查訪問而言,資料搜集工作的具體操作是由訪問員完成的,因此訪問工作一啟動,
就要招募和培訓訪問員。可以通過登報、張貼海報或在互聯(lián)網(wǎng)上公告的方式,公開征求訪
問員。
b.對訪問員的錄取,最好采取面試的方式進行。
②培訓已錄用的訪問員
a.研究者要制定詳細的培訓程序,并將訪問員培訓程序表事先交給各個培訓項目的主講
人,使其對培訓的時間地點做到心中有數(shù)。
b.要注意培訓內容的選擇。
c.在培訓課程結束后,還應由經(jīng)驗豐富的督導員分組帶領訪問員進行模擬訪問,
③與被訪者取得聯(lián)系
由于當面訪問的成本很高,故研究者最好在派遣訪問員進行實地的訪問前,寄一封通知信
給被訪者。
④進行實地訪問
進行實地訪問是整個調查研究最關鍵的工作環(huán)節(jié),因為只有訪問員嚴格按照規(guī)定的內容和
形式完成了訪問,搜集到高質量數(shù)據(jù)資料,才真正達到了調查的預定目標。
⑤對訪問過程和問卷進行復查
為了保證訪問過程的真實、有效,保證問卷資料的質量,調查執(zhí)行單位應有相應的復查程
序。
a.復查工作既可以在訪問結束后進行,也可以在訪問進行中隨時展開。
b.復查主要內容
第一,確認訪問員是否真實地進行了訪問,是否訪問了符合要求的被訪者,被訪者對訪問
員工作態(tài)度的評價;
第二,從問卷中選一些比較敏感、回答比較困難或事實性的問題,對被訪者進行回訪,以
檢驗訪問員是否自行填答。
(2)自填問卷
自填問卷采用的是通過郵局或派專人將問卷發(fā)送給被訪者的形式來搜集資料的方法,所面
臨的最大挑戰(zhàn)是回收率偏低。因此,采用郵寄問卷方法時,一般應保證有較大的樣本量。
4.資料整理
資料搜集完成后,還必須對資料進行處理,由于調查對象的數(shù)目巨大,因此資料處理都是
通過計算機完成的。
(1)給每個變量的每個相關類別一個獨一無二的編碼;
(2)用計算機軟件錄入數(shù)據(jù);
(3)對錄入完的數(shù)據(jù)進行清理,并處理缺失數(shù)據(jù),才能最終形成可以進行分析的數(shù)據(jù)文
件。
資料處理中最重要的原則是確保每一個環(huán)節(jié)的正確性。因此在進行資料處理時,必須謹慎
規(guī)劃及細心操作,才能將訪問成功的問卷轉換成可以使用的數(shù)據(jù)。
5.撰寫報告
調查研究的最后一步是撰寫調查報告,調查報告可以分為兩種形式:
(1)對調查數(shù)據(jù)的說明,包括對調查抽樣、問卷、資料搜集過程、數(shù)據(jù)編碼的說明,以
及對數(shù)據(jù)信度和效度的分析結果、調查局限性分析。這主要是為數(shù)據(jù)使用者提供的,通
常是公布在互聯(lián)網(wǎng)上,供數(shù)據(jù)使用者查閱。
(2)向調查委托方提交的有關調查問題的分析報告,包括對研究問題的界定、相關文獻
的討論、對概念和變量的定義說明,以及對數(shù)據(jù)分析結果的討論等內容,通常是以論文
的形式,發(fā)表在學術期刊上。
1.2課后習題詳解
如何理解抽樣方法在現(xiàn)代調查研究方法形成中的關鍵作用?
答:抽樣調查的準確性較高,彌補了普查的部分缺陷,在現(xiàn)代調查研究方法中發(fā)揮了關鍵
作用。
(1)普查的缺陷
20世紀2()年代以后,隨著經(jīng)濟、政治的發(fā)展,全面、精確地了解選民的意愿,了解快速變
化的市場動態(tài),成為調查方法面臨的新議題。新的調查形式必須能處理大量的調查對象,
而且調查周期不能太長。從以往的調查形式看,經(jīng)驗性及研究性社會調查,由于主要以個
案和社區(qū)研究為主,不能處理大量調查對象。行政統(tǒng)計雖然能處理大量調查對象,但直到
19世紀末,統(tǒng)計學家還沒有清楚地在總體和樣本之間做出區(qū)分,當時普查幾乎是唯一的方
法。而普查的周期一般較長,成本也很高,很難滿足此類調查議題的需要。抽樣調查形式
的出現(xiàn),一定程度上解決了以上的難題。
(2)抽樣方法的優(yōu)勢
在抽樣調查的早期階段,基本上都是采用非概率抽樣。非概率抽樣最大的問題是無法事先
估計抽樣誤差的大小,無法根據(jù)樣本情況對總體情況做出正確的推論。抽樣調查最早被應
用于民意測驗中,而非概率抽樣方法的不足,也正是通過民意測驗失敗的例子被逐漸認識
到的。非概率抽樣方法的失敗刺激了概率抽樣方法在調查研究中的應用。概率抽樣是按照
隨機原則來選取對象,這樣就能根據(jù)概率理論來計算抽樣誤差,從而對總體進行推論。
(3)抽樣和統(tǒng)計分析技術的完善,進一步擴展了調查的應用范圍,抽樣調查逐漸成為社
會調查的主要形式。
調查研究方法主要存在哪些局限?
答:調查研究方法的局限主要有以下三點:
(1)缺少彈性
①調查研究總是事先完成研究設計,并在研究中保持不變。這使得研究者無法察覺新的變
量,有時即使察覺到了,也很難做出相應的處理。這一點在很大程度上限制了研究者進一
步深化研究。
②利用標準化問卷進行測量,是調查研究的特色之一。但這種標準化問卷,一方面對于許
多被訪者來說適用程度可能都不是最高的,同時也使得調查研究難以處理比較復雜的議題。
(2)無法了解被訪者具體的生活情境
調查研究是用問卷來搜集被訪者信息的,調查訪問僅限于問卷設定的內容,而且調查的時
間很短。因此,研究者很難進入到被訪者的生活情境中,深入細致地把握被訪者在真實生
活情境中的行為和想法。
(3)容易受到人為因素的影響
人們的態(tài)度很容易受到他人的影響,而問卷訪問時很難發(fā)現(xiàn)。并且研究行為本身可能就會
影響被訪者的態(tài)度。
總的看來,作為一種測量過程,標準化測量和概率抽樣使調查研究具有較高的信度,但標
準化測量、情境缺失和人為因素的影響,卻使其效度較低。
縱貫調查包括哪兒種具體形式?
答:按抽樣的對象和目的,縱貫調查可具體分為趨勢調查、同期群調查與追蹤調查三種形
式,具體闡述如下:
(1)趨勢調查是指研究者通過搜集總體在不同時期同一種類型的資料,來比較分析總體
特性在一個較長時間段內的變化趨勢。趨勢調查中,每個時點用來搜集資料的問卷應保
持一致性,而且樣本也應該從同一個總體中抽出,但入樣的被訪者可以是不同的。
(2)同期群調查是指研究者在不同時點,對某個特定時段內共享相似生活經(jīng)驗的那些人
的調查,這群人被稱為同期群。同期群調查并不關心某個特殊的個人,它關注的是具有
某種時間標識的一類人,把他們視為目標總體。每個時點被抽中的被訪者只要具有共同
的生活經(jīng)驗即可,并不一定需要完全相同。
(3)追蹤調查是指研究者在不同時點,調查完全相同的一群人、一個團體或一個組織。
怎樣完成實地抽樣工作?
答:實地抽樣是指根據(jù)抽樣方案,實地抽取調查對象的過程。實地抽樣通常包括以下的具
體步驟:
(I)訓練抽樣人員
無論是自填問卷,還是調查訪問,實際抽取調查對象的工作量都很大,而且具有一定的技
術難度,因此需要對有關人員進行專門訓練。另外,在當面訪問中,為了防止出現(xiàn)訪問員
誤差造成的樣本偏差,一般是將抽樣與訪問兩項工作分開進行。
(2)與抽樣方案中各級抽樣單位取得聯(lián)系
(3)具體執(zhí)行抽樣工作
在進行正式抽樣時,抽樣員應攜帶由調查單位出具的各種身份證明文件或抽樣員聘書,到
各級抽樣單位進行抽樣。詳細的身份證明文件能減輕相關單位及被調查對象的疑慮,有利
于抽樣工作的進行。在實地抽樣時,抽樣員應使用統(tǒng)一印制的樣本記錄表,詳細記錄抽樣
中的各種相關信息,這些信息可以再現(xiàn)完整的抽樣過程,并為檢查樣本的正確性提供依據(jù)。
(4)檢查樣本的正確性
抽樣員完成抽樣工作后,督導人員應對樣本的正確性進行檢查。檢查內容包括:抽樣人員
所記錄之樣本表中的資料的完整性,以及抽樣方法運用的正確性。
實地訪問中應注意哪些問題?
答:進行實地訪問是整個調查研究最關鍵的工作環(huán)節(jié),因為只有訪問員嚴格按照規(guī)定的內
容和形式完成了訪問,搜集到高質量數(shù)據(jù)資料,才真正達到了調查的預定目標。雖然在此
時期,訪問是以訪問員與被訪者為中心,但當訪問員獨自在外進行訪問時,也需要隨時與
督導人員或研究人員取得聯(lián)系,以妥善處理那些訪問員訓練手冊以外的情況。
從實地訪問的工作流程看,實地訪問有以下步驟:
(1)查找被訪者
查找被訪者首先要找到他的住處,可能會出現(xiàn)找不到或被訪者搬遷的情況。有時即使找到
了住處,也可能被拒之門外。訪問員的儀表和談話方式,對獲準人戶有很大影響,不難想
象衣冠不整、言辭粗俗的訪問員,一定會遭遇較高的拒訪率。在找不到被訪者或拒訪的情
況下,訪問員如果隨意更換樣本,就很有可能使得實際調查樣本偏離計劃樣本,影響樣本
的代表性。因此在抽樣時,就應對拒訪和樣本遺失情況做出統(tǒng)一解決方案,如事先多抽取
一些備用樣本,并規(guī)定好更換樣本的規(guī)則。
(2)獲準入戶后,就要確認合格的被訪者
當前Kish表是比較流行的篩選被訪者方法。
(3)一旦確認了被訪者,接下來就是正式的問答過程。標準化訪問一般涉及三項技巧:
詢問、追問和記錄。這些技巧能有效地防止調查員將個人偏見帶入訪問。
另外,調查訪問實踐表明,許多被訪者對自己是否真的在以匿名身份回答問題心存疑慮,
這種疑慮會降低被訪者的合作意愿,影響訪問資料的信度和效度。因此在訪問中,訪問員
要向被訪者做出保密性承諾,并杜絕將被訪者的名字和住址抄在問卷上。
(4)在結束訪問時?,訪問員一定要向被訪者表示感謝,同時別忘記將禮物贈送給被訪者。
第二章抽樣設計
2.1復習筆記
抽樣設計包括以下幾點內容:第一,定義總體和編制抽樣框,即給目標總體下一個操作化
定義。第二,根據(jù)不同的目標總體,選擇合適的抽樣方法。第三,對總體的變異性作出估
計,即估計抽樣誤差。第四,確定樣本所含個體數(shù)目,即樣本規(guī)模的大小。
一、抽樣概述
抽樣的概念
抽樣是指根據(jù)某種既定規(guī)則從一個總體中選取一組元素的過程,由此產(chǎn)生的元素集合稱為
樣本。即每一個具體的研究對象被稱為元素,全體研究對象被稱為總體,樣本則代表一部
分研究對象。
(1)抽樣的必要性
①在社會調查中,經(jīng)費是一項硬約束,多增加一個調查對象,就意味著多花一份錢。因此
,如果總體太大,限于資源,無法逐一對每個總體元素進行調查。
②即使有充足的調查經(jīng)費,當總體太大時,也很難找到足夠多訓練有素的研究人員完成調
查。
(2)抽樣方法的分類
①非概率抽樣
即依據(jù)研究者的主觀意愿、判斷或是否方便等因素來選取對象。
在非概率抽樣中,研究者無法知道抽出的樣本是否具有代表性,因為,非概率抽樣的代表
性只有將抽出的少數(shù)對象的情況與總體的情況比較后才能得知,但總體的情況又是不知道
的。因此,非概率抽樣無法估算出抽樣誤差。
②概率抽樣
即按照隨機原則來選取對象,完全不帶研究者的主觀因素。
概率抽樣能夠比較精確地估算出抽樣誤差。在概率抽樣中,研究者根據(jù)抽樣誤差,便能夠
判斷出樣本的代表性,進而根據(jù)被抽出的少數(shù)對象的情況,對全體對象的情況進行推論。
(3)應用概率抽樣方法時的注意事項
①要注意被抽出的少數(shù)對象與全體對象是不同的,因此,無論怎樣精致的抽樣設計,抽樣
誤差都是無法避免的,抽樣得到的少數(shù)對象的情況很可能并不一定完全符合全體對象的情
況。即根據(jù)抽樣結果來推斷全體對象的情況,可能是對的也可能出錯。問題是推論中的對
或錯的可能性是多少。如果出錯的機會很小,便可以接受推論;否則,就無法接受推論。
②在有些情況下,可能無法使用概率抽樣方法。
2.非概率抽樣
(1)非概率抽樣的含義
非概率抽樣,即放棄隨機原則,依據(jù)研究者的主觀意愿、判斷或是否方便等因素來抽取樣
本。非概率抽樣的成本比較低,操作也比較方便,但無法預先估計抽樣誤差,因此,很難
對總體情況做出可靠的推斷。
(2)幾種常見的非概率抽樣方法
①方便抽樣
方便抽樣即偶遇抽樣,是指研究者使用對自己最為便利的方法來選取樣本。這種方法很容
易產(chǎn)生系統(tǒng)誤差,樣本代表性很差,因此,在使用時要特別小心,總體的情況越復雜,方
便抽樣的效果就越差。
②配額抽樣
a.配額抽樣首先要根據(jù)某些參數(shù)值,確定不同總體類別中的樣本配額比例,然后按比例
在各類別中進行方便抽樣。
b.配額抽樣的邏輯是通過樣本配額,使樣本結構盡可能與總體結構保持一致,對總體進
行“克隆”。配額矩陣所依據(jù)的總體參數(shù)值越多,樣本元素的分類也越細I,樣本與總體的結
構也越接近。但隨著參數(shù)值的增加,配額矩陣的分布會越來越復雜,抽取到符合條件的對
象也就越來越困難。
c.配額抽樣中經(jīng)常采用的參數(shù)值包括性別、年齡、教育程度、婚姻狀況、收入和職業(yè)類
別等。
d.配額抽樣的不足
第一,為了不偏離總體,配額矩陣中的數(shù)字必須十分準確,要做到這一點,就必須掌握總
體的最新資料?,但這并不容易做到。
第二,盡管配額方法是一種改進,但最后抽樣仍由訪問員根據(jù)方便原則執(zhí)行,他們從某些
特定的矩陣格子中選擇樣本時,有很大的隨意性。
③判斷抽樣
判斷抽樣即立意抽樣,是指研究者根據(jù)研究目的或專家判斷來選取樣本。在這種抽樣中,
樣本是否能滿足研究目的的要求,是否能正確反映總體情況,很大程度上依賴于研究者的
主觀判斷,因此,對研究者個人的研究素質有較高的要求。判斷抽樣經(jīng)常被用于以下三種
研究場景:
a.研究者用判斷抽樣來選擇特別能提供信息的獨特個案;
b.研究者用判斷抽樣來選取難以接近的特殊人群;
c.研究者用判斷抽樣來選取某種特殊個案類型,以便進行深入探究。這種研究是希望獲
得對這種類型的深入了解,它的作用在于發(fā)現(xiàn)問題,提出假設,而不在于對總體做出概括
,因此,無需根據(jù)樣本對總體進行推論。
④雪球抽樣
a.內涵
雪球抽樣即網(wǎng)絡抽樣,是一種根據(jù)已有研究對象的介紹,不斷辨識和找出其他研究對象的
累積抽樣方法。雪球抽樣開始時,樣本可能只有一個或少數(shù)幾個人,但在隨后的時段里,
這幾個人會憑借自己的社會關系,介紹新人加入,新人也有社會關系,于是,隨著關系網(wǎng)
絡的不斷擴大,樣本也越滾越大,可見雪球抽樣是一種多階段的技術。
b.適用人群
第一,適合用來對成員難以找到的總體進行抽樣,如城市中的散工、無家可歸的流浪者和
吸毒者等。
第二,可以用雪球抽樣對具有一定網(wǎng)絡聯(lián)系的總體進行抽樣。
c.雪球抽樣的結果
雪球抽樣理想的結果是“雪球”滾到了大于所需樣本規(guī)模的人群,這時可在某個時點中止“
雪球''的滾動。如果“雪球”滾到一定數(shù)量的對象后,樣本無法再擴大,就需要找圈子以外
的人,以他們?yōu)楹诵睦^續(xù)“雪球”的滾動,直至“雪球”達到樣本規(guī)模為止。
3.概率抽樣設計要點
抽樣設計包含以下內容:編制抽樣框,選擇抽樣方法,估計抽樣誤差,確定樣本規(guī)模。
(1)編制抽樣框
研究者進行概率抽樣,必須先找到一份近似涵蓋所有總體元素的清單,然后從中抽取部分
元素,這份元素清單被稱為抽樣框。不同的調查形式,會形成不同的抽樣框。對于整群抽
樣,不需要編制整個總體元素的清單,只需要編制完整的群的清單即可。而對于多級抽樣
只是在最后一級才需要編制總體元素的清單,此前各級則只需要編制相應的各級抽樣單位
(群)的清單就行了。應最大限度保證抽樣框的完整性,一旦抽樣框出現(xiàn)總體元素缺失情
況,便會產(chǎn)生非抽樣誤差,進而直接影響總體推論的精度。
(2)選擇抽樣方法
①概率抽樣是按照隨機原則從總體中抽取部分元素構成樣本來推斷總體數(shù)量特征的方法。
隨機原則是指抽樣時總體的每個元素都有一個已知的、非零的被抽取選擇的概率。給每個
總體元素以相等的抽取概率的抽樣設計稱作等概率抽樣,如果總體中至少有一個元素的抽
取概率與其他元素的抽取概率不相等,就是不等概率抽樣。對于不等概率樣本,通常需要
利用加權技術對其數(shù)據(jù)進行修正。
②常見的概率抽樣方法包括:簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣和多級抽樣
等。
③在調查中究竟選擇何種抽樣方法則與抽樣框的獲得、目標總體的相關信息及地理分布、
抽樣效率和實地調查的執(zhí)行方式等因素有關。在實際抽樣設計中,經(jīng)常綜合采用幾種抽樣
方法。
(3)估計抽樣誤差
①抽樣誤差的含義
抽樣調查的一個主要目的是通過由抽樣獲得的統(tǒng)計值來估計未知的總體參數(shù)值。統(tǒng)計值與
參數(shù)值之間的差異被稱為抽樣誤差,它是由抽樣變異性,即由隨機選擇過程引起的樣本統(tǒng)
計值圍繞總體參數(shù)值波動所致。
②抽樣誤差的決定因素
抽樣誤差的大小主要取決于總體的異質性程度和樣本規(guī)模,總體異質性高或樣本規(guī)模小,
都可能產(chǎn)生較大的抽樣變異性,反之,則產(chǎn)生較小的抽樣變異性。
③可容忍的抽樣誤差和估計效應
在抽樣設計中,考慮到抽樣變異性的存在,必須事先確定可容忍的抽樣誤差和估計效應的
大小。
a.可容忍誤差取決于某一置信度下預期統(tǒng)計值的置信區(qū)間的大小,而置信度則代表了置
信區(qū)間包含參數(shù)值的概率。
b.估計效應的大小是指自變量可能給因變量造成的變化。只有明確了估計效應的大小,
才能判斷出因變量的變化究竟是由自變量的影響所致,還是僅僅是抽樣變異性的作用結果。
(4)確定樣本規(guī)模
由于樣本規(guī)模的大小直接影響到抽樣變異性,因此抽樣設計需要事先估計有效樣本規(guī)模。
用于有效樣本規(guī)模計算的方法有以下兩種:
①與可容忍誤差有關,主要用于描述性研究
②效力檢驗,主要用于分析性研究
a.它主要與估計效應有關,即確定某一特定的樣本規(guī)模,能否使所關注的因變量的變化
對自變量的影響具有足夠的敏感性。增加樣本規(guī)模能夠減少標準誤差,進而提高拒絕零假
設的可能性。
b.有效樣本規(guī)模還會受到抽樣方案變動和子群體數(shù)量較小等因素的影響。所以,在考慮
到多種因素之后,抽樣設計中樣本規(guī)模的確定通常是一個多次更改的迭代過程,設計之初
未考慮到的后續(xù)影響因素,往往會改變前面做出的決定。
二、總體與抽樣框
定義總體
編制抽樣框工作的第一步是定義總體,只有對總體構成及邊界有一個清晰的認識,才能最
大限度地使抽樣框與總體保持一致。
(1)總體的分類
①目標總體
目標總體是指理論上具有研究者所考察特征的全體總體元素的集合體。
②抽樣總體
在實際抽樣中,有些總體元素并不一定都能有機會被抽取到。由那些有機會被抽取到的總
體元素構成的集合體,就是抽樣總體或調查總體,它是排除了研究總體中的一些特例后的
總體。
(2)定義總體的步驟
①明確分析單位
即要搞清楚調查研究所關注的是個人、家庭住戶、集體住戶,還是其他類型的居住單位。
研究者采用何種分析單位,主要取決于他的研究問題。
②定義總體邊界
a.對總體涉及的地理或行政邊界加以說明。
b.對被調查對象進行必要的說明,包括合格的被調查對象的年齡、居住類型等。
2.編制抽樣框
對于抽樣而言,真正有操作意義的是確定抽樣框,沒有抽樣框實際抽樣就無法進行。
(1)抽樣框的分類
①名單抽樣框,即把抽樣總體中所有能找到的調查對象名單排列起來。
②區(qū)域或面積構成的區(qū)域抽樣框。區(qū)域抽樣框由定義明確的區(qū)域組成,除少數(shù)由純區(qū)域構
成的區(qū)域抽樣框外,在大多數(shù)情況下,區(qū)域都是由個體單位組成的。前者的抽樣單位就是
區(qū)域本身;而后者的抽樣單位則是區(qū)域內的個體單位,這時可以有兩種抽樣方法:
a.抽出區(qū)域后對其中的所有單位進行調查,即整群抽樣;
b.抽出區(qū)域后對區(qū)域內的單位再抽樣,即多階段抽樣,經(jīng)常用于抽樣總體較大,編制全
體抽樣單位的名單很困難的情況。
(2)抽樣單位
抽樣框中的總體元素又稱抽樣單位,有時抽樣單位與分析單位是相同的。但在較大范圍的
多階段抽樣中,可能有多個層次的抽樣單位。在各式各樣的抽樣框中,人口普查數(shù)據(jù)是比
較完整、比較可信的抽樣框。特別是對于全國抽樣調查來說,缺少人口普查數(shù)據(jù)可能會使
抽樣框產(chǎn)生無法克服的誤差。
三、概率抽樣
基本抽樣方法包括簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣、不等概率抽樣和多階
段抽樣等幾種形式。
1.簡單隨機抽樣
(1)簡單隨機抽樣的含義
簡單隨機抽樣即純隨機抽樣,是嚴格按照隨機化原則從含有N個單位的總體中抽取n個單
位組成樣本(N>n),在抽樣過程中總體的每個單位都有同等的機會入選樣本,而且每
個單位的抽取都是相互獨立的。
(2)簡單隨機抽樣的分類
根據(jù)被抽中的元素是否放回總體,又可分為放回簡單隨機抽樣和不放回簡單隨機抽樣,在
實際抽樣中大多采用不放回抽樣。簡單隨機抽樣是概率抽樣的最基本形式,其他概率抽樣
方法都是在此基礎上派生出來的。常用的簡單隨機抽樣方法包括:抽簽法和隨機數(shù)法。
(3)常用的簡單隨機抽樣方法
①抽簽法
當總體數(shù)目不大時,可以采用抽簽法。具體操作方法是:
a.用均質材料做成N個簽,給每個簽編一個號碼,將這N個簽充分混合;
b.一次抽出n個簽;或每次抽取一個但不放回,再抽另一個直至抽到n個簽為止。這抽出
的n個簽上的號碼就是入樣的單位號碼。
②隨機數(shù)法
當總體單位很多時,通常采用隨機數(shù)法。具體操作可以利用隨機數(shù)表、隨機數(shù)骰子、計算
機產(chǎn)生的偽隨機數(shù)等進行抽樣。
a.隨機數(shù)表
在幾種操作方式中,最經(jīng)常用到的是隨機數(shù)表。隨機數(shù)表是由范圍在00001?99999內的5
位數(shù)的隨機數(shù),按行和列排序構成的。用隨機數(shù)表產(chǎn)生隨機數(shù),需要解決以下一系列問題:
第一,確定選出的隨機數(shù)的位數(shù);
第二,決定從5位數(shù)組中選擇哪幾位數(shù)字,這里關鍵是要預先約定好規(guī)則,然后一直按此
規(guī)則行事;
第三,確定在表中選擇數(shù)字的順序,這里關鍵是要預先約定好規(guī)則,然后一直按此規(guī)則行
事;
第四,確定開始選擇的5位數(shù)組起點;
第五,處理大于總體規(guī)?;蛑貜偷碾S機數(shù)。
b.隨機數(shù)骰子
除了隨機數(shù)表,隨機數(shù)骰子也是一種產(chǎn)生隨機數(shù)的工具,它是由均勻材料制成的正20面體
,每一面上分別標有0?9的數(shù)字各2個。使用時,可根據(jù)總體規(guī)模N的位數(shù),決定使用兒
枚骰子,并同時規(guī)定好不同顏色骰子所代表的位數(shù)。將骰子放入盒內搖勻,然后打開盒蓋
,讀取各枚骰子面朝上的數(shù)字,即可獲得一個隨機數(shù)。
c.計算機
由于許多統(tǒng)計軟件都有產(chǎn)生隨機數(shù)的程序,因此利用計算機產(chǎn)生隨機數(shù)是一種方便、快捷
的方法。但必須指出的是由統(tǒng)計軟件產(chǎn)生的隨機數(shù)是偽隨機數(shù),在通常情況下有循環(huán)周期
,故一般無法保證其隨機性。盡管有些統(tǒng)計軟件產(chǎn)生的偽隨機數(shù)有較長的循環(huán)周期,但為
了保證抽樣的隨機性,在有條件的情況下,最好還是使用隨機數(shù)表或隨機數(shù)骰子來產(chǎn)生隨
機數(shù)。
2.系統(tǒng)抽樣
系統(tǒng)抽樣即機械抽樣。即將N個總體單位按一定順序排列,然后先隨機抽取一個單位作為
起始單位,再按某種確定的規(guī)則抽取其他n—1個樣本單位。系統(tǒng)抽樣是獨立于簡單隨機抽
樣的另一種隨機抽樣方法,其效果與簡單隨機抽樣相近,但操作起來卻容易得多。
在系統(tǒng)抽樣中,等間距抽取是最常用的規(guī)則,故系統(tǒng)抽樣經(jīng)常被稱為等距抽樣。由于抽樣
使用的是抽樣間距,而不是隨機數(shù),故等距抽樣是一種準隨機抽樣方法。常用的等距抽樣
方法包括:直線等距抽樣和循環(huán)等距抽樣,二者的區(qū)別在于總體規(guī)模N是否為樣本規(guī)模n
的整數(shù)倍。
(1)整數(shù)抽樣間距
當N是n的整數(shù)倍,即抽樣間距k=N/n是整數(shù),可使用直線等距抽樣。即在算出抽樣間距
后,先在1?k范圍內抽取一個隨機數(shù)r作為起點,然后每隔k個單位抽出一個單位,直到抽
出n個單位。抽中單位的號碼分別為:
r,r+k,r+(n—1)k
(2)非整數(shù)抽樣間距
當N不是n的整數(shù)倍,即抽樣間距k=N/n不是整數(shù),若再利用直線等距抽樣就無法保證每
個總體單位以相等的概率入樣。為了使樣本均值為無偏估計,可以采用以下兩種方法進行
抽樣:
①循環(huán)等距抽樣方法
先將N個總體單位首尾相接排成一個封閉圓,抽樣間距k取最接近N/n的整數(shù),再從1?N
中隨機抽取一個隨機起點作為起始單位,然后每隔k抽取一個單位,直到抽滿n個單位為止
o由于隨機起點是1?N中的任意一個,因此每個總體單位入樣的概率是相等的。
②調整直線等距抽樣
a.將非整數(shù)的抽樣間距k的小數(shù)點后移一位,使其成為整數(shù)(k*10),然后在10?(k*l()
)之間選定一個整數(shù)的隨機起點(r*10);
b.將(r*10)的小數(shù)點移回來,成為非整數(shù)的隨機起點r。由r開始每隔k個單位抽出一個
單位,直到抽出n個單位。抽中號碼分別為:
r,r+k,r+(n—1)k
c.將上面號碼的小數(shù)部分略去,得到相應地入樣單位的號碼。
(3)總體單位的排列
簡單隨機抽樣為基礎的概率抽樣,在抽取樣本之前需要對總體單位編號,如果總體單位很
多,則工作量較大。而使用系統(tǒng)抽樣則無需對總體單位編號,所需要的只是將總體單位按
順序排列。不過并非所有排列順序都能滿足系統(tǒng)抽樣的要求,與系統(tǒng)抽樣有關的單位排列
有以下幾種情況:
①總體單位隨機排列
總體單位按隨機順序排列的系統(tǒng)抽樣稱為無序系統(tǒng)抽樣,其效果等價于簡單隨機抽樣。
②總體單位線性趨勢排列
即總體單位按某個輔助變量的大小順序排列,而這個輔助變量與所研究的指標值線性相關
o對線性趨勢總體進行系統(tǒng)抽樣稱為有序系統(tǒng)抽樣,其效果優(yōu)于簡單隨機抽樣。
③總體單位周期排列
即總體單位指標值按其順序呈周期性變化。對于周期排列的總體,系統(tǒng)抽樣的估計效果與
抽樣間距以及單位指標值的變化周期有關。
a.當抽樣間距等于周期倍數(shù)時,抽到的任意一個樣本單位都有相同的取值,相當于從總
體中隨機抽取了一個單位,這時樣本的代表性最差。
b.當抽樣間距等于半周期倍數(shù)時,大部分情況下,樣本會依次重復地取兩個高低不等值
,系統(tǒng)抽樣會得到無偏的均值估計,樣本的代表性會有所改善。
c.抽樣間距不等于周期倍數(shù)或半周期倍數(shù),在掌握了總體周期結構的基礎上,選擇合適
的抽樣間距,可以抽到周期排列總體中的大部分指標值,得到代表性較好的樣本。
3.分層抽樣
(1)分層抽樣的含義
分層抽樣即類型抽樣,是先將總體N個單位,按某種特征劃分成若干個子總體,稱為層,
然后在每個層中分別獨立地進行抽樣,最后,將抽出的子樣本合起來構成總體的樣本。
(2)分層抽樣的邏輯
如果單位之間差異很大,那就對它們進行分組,使得各組內的差異變小,這樣在各組內進
行抽樣就會提高精度,增加樣本的代表性。分層抽樣并不是一種獨立的抽樣方法,它實際
上是一種重新組織總體單位的方法,最終各層內的抽樣仍要采用簡單隨機抽樣或系統(tǒng)抽樣
進行。
(3)分層抽樣的優(yōu)點
①降低總體異質性程度;
②便于對各層指標進行推算;
③有利于抽樣工作的組織。
(4)對總體進行分層需要考慮以下幾個問題
①樣本規(guī)模在各層的分配
a.樣本規(guī)模按比例分配,即各層的子樣本單位在總樣本中所占的比例,與各層單位在總
體中所占的比例完全相同,按比例分配是自加權的,這時樣本結構與總體結構完全一樣。
b.樣本規(guī)模非比例分配,非比例分配設計最常見的目的如下:
第一,對總體中規(guī)模太小的層進行比較研究。
當某些層的單位在總體中的比例太小,如果按比例分配樣本,則這些層的樣本規(guī)模會很少
,無法進行統(tǒng)計分析,這時可以加大該層的樣本規(guī)模,即使用較大的抽樣比,以便對這些
層的子總體進行研究和比較。
第二,在費用一定的情況下,獲得盡可能高的抽樣精度,又稱為最優(yōu)分配。
當各層的單位調查費用相等時,最優(yōu)分配的原則是:層內單位標準差越大的層,抽樣比越
高。這時抽樣比與層內單位標準差成正比。當各層的單位調查費用差異較大時,最優(yōu)分配
的原則是:單位調查費用越低的層,抽樣比越高。這時抽樣比與層內單位平均調查費用的
平方根成反比。
c.一般說來,如果各層均值有很大差異,則采用按比例分配較好;而如果各層標準差有
很大差異,則最優(yōu)分配較好。
②層的劃分
a.分層變量
理論上,按調查目標變量進行分層是最好的,但在調查之前目標變量的值是不知道的,因
此只能是根據(jù)與目標變量盡可能相關的輔助變量進行分層,常用的輔助變量包括性別、年
齡、職業(yè)、教育程度、收入、地域、民族和宗教等。
b.層數(shù)
除非層的劃分是按自然層或單位類型進行的,否則分層時層的數(shù)量越多越好,因為層越多
就越容易形成層內個體的相似性。但在實際抽樣中,層的數(shù)量受到以下限制:
第一,樣本規(guī)模的限制
因為要考慮估計量方差的無偏估計,故每層至少要有兩個樣本單位,這樣層數(shù)就不能超過
n/2。
第二,調查經(jīng)費的限制
i.增加層數(shù)勢必會增加調查的管理費用,而當層數(shù)增加到一定的時候,在精度上的收益
將非常小,這就是收益遞減現(xiàn)象;
ii.在調查費用一定的情況下,增加層數(shù)必然導致降低樣本規(guī)模,而每層的樣本規(guī)模越小
,對總體方差的估計值也就越不精確,這時就要考慮增加層數(shù)而降低樣本規(guī)模在精度上是
不公笆
口口O
③分層抽取樣本的方法
在分層抽樣中,有兩種常見的樣本抽取方法。
a.將所有總體元素按分層變量進行分層,并計算各層在總體中的比例。接著如果采用等
比例分層抽樣,則直接將總體比例視為樣本比例;如果采用不等比例分層抽樣,則需要對
樣本比例做一定的調整。最后,再按確定的樣本比例,用簡單隨機或系統(tǒng)抽樣的方法,抽
出適量的樣本元素。
b.先將所有總體元素按分層變量進行分層,然后將各層的總體元素一層一層連續(xù)排列,
最后對連續(xù)排列的總體元素進行等距抽樣。這種方法被稱為分層等距抽樣,適用于等比例
分層抽樣。
4.整群抽樣
(1)整群抽樣的含義
整群抽樣是先將總體劃分成若干個群(視為初級單位),每個群包含若干個次級單位,然
后以一定方式從總體中抽取一部分群,并由中選群中的所有次級單位構成總體的樣本。通
常情況下,整群抽樣的抽樣誤差大于簡單隨機抽樣。但進行簡單隨機抽樣或分層抽樣需要
包括所有總體單位的抽樣框,這在實際抽樣中由于缺乏足夠的信息資料,往往是難以實現(xiàn)
的。而編制群的抽樣框相對是比較容易的。而且在大范圍調查中,抽取群也使得調查單位
的分布相對集中。
(2)群的性質
①自然群,即由行政或地域區(qū)劃形成的群。
②調查人員人為劃定的群,需要考慮如何劃分群,使得調查費用一定時抽樣誤差最小。群
的劃分遵循以下原則:群內方差盡可能大,群間方差盡可能小。
(3)規(guī)模不等的群
在社會調查中,總體中的群大多是規(guī)模不等的,這時不同的抽樣可能會抽中不同的群,因
此樣本規(guī)模也不再是常數(shù)了。
為了保證樣本單位滿足等概率原則,可以采取以下相應措施來控制樣本規(guī)模的變動:
①按群的大小進行分層,然后對各個層使用相同的抽樣比。這樣可以保證抽樣結果中總是
分別包括一定數(shù)量規(guī)模不等的群,進而使得樣本規(guī)模不至于有很大的變化;
②重新組合大小不等的自然群,形成一些新的規(guī)模相差不大的人工群,進而使得樣本規(guī)模
約等于常數(shù)。通常用在總體中大多數(shù)群相差不大,只有少數(shù)群較大或較小需要重新組合的
情況下,如果有太多的群需要重新組合的話,則工作量太大,不合算。
5.不等概率抽樣
(1)不等概率抽樣的含義
不等概率抽樣是指在抽樣過程中,總體每個抽樣單位有一個被抽中的概率值,這些概率值
可能不相等,即不同的總體抽樣單位人樣的可能性可以是大小不等的。之所以采用不等概
率抽樣方法,主要是因為當總體抽樣單位之間差異較大時,等概率抽樣可能會增大估計誤
差,降低估計精度,從而對抽樣效果產(chǎn)生不良影響。
(2)不等概率抽樣的實施方法
①代碼法
代碼法比較適合于總體抽樣單位的規(guī)模N不太大時。
②拉希里法
當總體抽樣單位的規(guī)模N很大時可以使用拉希里法。其方法是:設M,=max(MJ。每次
從[1,N]中抽取一個隨機數(shù)i,并在[1,M*]中抽取一個隨機數(shù)m,如果M2m,則第i個抽樣
單位入樣,如果MVm,則依照上述步驟,重新抽取i,mo第i個抽樣單位是否被抽中與m
有關,只有mWMi時它才能被抽中。
6.多階段抽樣
(1)多階段抽樣的含義
多階段抽樣是指按總體內的層級關系,把抽樣分成幾個階段來進行。
最初從總體中抽出的群被稱為初級抽樣單位(PSU),如果PSU的規(guī)模相等,用簡單隨機
抽樣或等距抽樣方法,直接進行第二階段的抽樣,這時第二級單位是等概率入樣的,而且
樣本規(guī)模是常數(shù)。
如果群規(guī)模不等,則存在樣本規(guī)模隨機變動問題。多階段抽樣樣本中規(guī)模隨機變動問題,
是由于要保持抽樣的等概率條件,即保持總抽樣比不變產(chǎn)生的。具體處理方法包括:分層
多階段等概率抽樣和多階段PPS抽樣。
(2)分層多階段等概率抽樣
①將總體中規(guī)模不等的群按規(guī)模(或重要性)分層;
②在不同階段對不同的層使用不同的抽樣比。
(3)多階段PPS抽樣
多階段PPS抽樣關鍵是在第一階段抽取PSU時,要先放棄等概率抽樣條件,采用PPS抽樣
方法,即賦予規(guī)模不等的群與其規(guī)模(或輔助變量)成比例的入樣概率,然后以一個固定
的樣本規(guī)模從抽中的PSU內抽取樣本單位。需要說明的是,在用PPS方法進行多階段抽樣
時,第一階段以及中間各個階段的抽樣都是PPS抽樣,只是最后階段的抽樣才抽取固定數(shù)
量的抽樣單位。
(4)規(guī)模測量值
進行PPS抽樣的一個前提條件是,要在具體抽樣前知道各級抽樣單位的規(guī)模??墒窃诔闃?/p>
前一般無法確切知道抽樣單位的實際規(guī)模,為了能使用PPS方法,只能代之以各級抽樣單
位規(guī)模的估計值M,稱為規(guī)模測量值。
四、抽樣誤差與樣本規(guī)模
實際抽樣中影響樣本代表性的有兩類誤差:抽樣誤差和非抽樣誤差。
抽樣誤差是一種隨機誤差,它是由于樣本范圍與總體范圍的差異而引起的誤差,無論怎樣
精致的抽樣設計,都會產(chǎn)生抽樣誤差。不過在概率抽樣中,抽樣誤差是可以估算出來的。
1.簡單隨機抽樣的抽樣誤差
(1)放回簡單隨機抽樣
根據(jù)中心極限定理,在放回抽樣條件下,如果樣本規(guī)模為n,總體標準差為則樣本平
SE=隼
y/n
均值M的抽樣分布的標準差,即標準誤差SE為:
毋嚕
在樣本規(guī)模很大的情況下,通??梢杂脴颖镜臉藴什頢作為總體標準差的近似值,于是有:
在實際抽樣中,還經(jīng)常用到樣本比例P的標準誤差。在放回抽樣條件下,如果樣本規(guī)模為
°=yp(i-F)
n,總體比例為P,總體標準差為:
樣本比例P的標準誤差為:
SE=J-1產(chǎn)-
當樣本規(guī)模很大時,可以用樣本比例p來代替總體比例P,于是有:
(2)不放回簡單隨機抽樣
在不放回抽樣中,計算標準誤差要在放回簡單隨機抽樣基礎上,引入一個不放回抽樣校正
/N-n
VN77'!
因子:
sc*S[N—n
這時樣本均值和樣本比例的標準誤差分別為:
鴕二眄尹思三
式中N為總體容量。
SE=71-n/N
Jn
由于社會調查中N一般較大,N?1近似等于N,于是有:
式中n/N=f稱為抽樣比。
不放回抽樣主要用于總體較小時.,如果N較大(n/NV0.05),則校正因子可以忽略。另
外,由于(1一n/N)<1,所以放回抽樣的抽樣誤差總是大于不放回抽樣的抽樣誤差。
(3)標準誤差的意義
由中心極限定理可知,如果樣本規(guī)模很大,則抽樣分布近似為正態(tài)分布抽樣分布的均值M
就是總體的均值如由于抽樣分布近似為正態(tài)分布,因此任意兩個樣本均值差之間,樣本
均值頻數(shù)所占的比例是可以知道的。
2.簡單隨機抽樣的樣本規(guī)模
樣本規(guī)模又稱樣本容量,是指樣本中所包含元素的數(shù)量。樣本規(guī)模一方面會影響到樣本的
代表性,另一方面會直接影響到調查成本的大小。因此,在實際抽樣中,選擇合適的樣本
規(guī)模是非常重要的。
(1)影響樣本規(guī)模的因素
如果不考慮經(jīng)費問題,那么樣本規(guī)模主要取決于抽樣精度和總體標準差。一般說來,抽樣
希望達到的精確度越高,總體的異質性程度越顯著,所需的樣本規(guī)模就越大。
①抽樣精度是指抽樣中希望達到的精確度,即能夠容忍的抽樣誤差。
抽樣誤差是樣本統(tǒng)計量與總體參數(shù)值之間的偏差,而偏差是由于樣本與總體不一致造成的
o樣本越小,與總體差異就越大,因此,誤差也越大。能夠容忍的抽樣誤差越小,即要求
的抽樣精度越高,則樣本規(guī)模也越大,反之亦然。
②總體標準差。是反映總體元素間異質性程度的指標,一般說來,在給定抽樣精度后,總
體異質性程度越小,所需樣本規(guī)模也越小,反之,則越大。這是因為異質性越小,總體參
數(shù)的分布越集中,波動性越小,大小相同的樣本的代表性就越好。
(2)樣本規(guī)模的估算
假設研究目的是要求出某個變量(X)在總體中的均值p-M。從一個隨機樣本(n)計算
出來的均值(X)與總體均值(M)的差就是抽樣誤差P,EPe=IX-M|
M=X-±e
又假定總體標準差為。,則在置信度給定時,置信區(qū)間為M=X一士ZSE=X±e
而
在放回抽樣中
M=(7)
樣本規(guī)模為:
e=71-n/N
4n
在不放回抽樣中
_必/
樣本規(guī)模為:
2.2課后習題詳解
為什么要進行抽樣?
答:抽樣是指根據(jù)某種既定規(guī)則從一個總體中選取一組元素的過程,由此產(chǎn)生的元素集合
稱為樣本。即在抽樣的專業(yè)化表述中,每一個具體的研究對象被稱為元素,全體研究對象
被稱為總體,樣本則代表一部分研究對象,它可以是個人、家庭、學校、醫(yī)院、地塊、交
易事件,也可以是文章、雜志,甚至是歌曲。之所以要抽樣,主要是考慮調查項目的可行
性。
(1)在社會調查中,經(jīng)費是一項硬約束,多增加一個調查對象,就意味著多花一份錢。
因此,如果總體太大,限于資源,無法逐一對每個總體元素進行調查。而借助抽樣就能
克服這個困難,因為,根據(jù)抽樣理論,無論社會調查涉及的總體有多大規(guī)模,只要抽樣
是按隨機原則實施的,則被抽出的少數(shù)元素的情況,就能夠比較準確地代表總體的情況。
(2)即使有充足的調查經(jīng)費,當總體太大時,也很難找到足夠多訓練有素的研究人員完
成調查。這時如果聘用訓練不足的工作人員,或對調查主題進行過于簡單的調查,勢必
會降低調查質量。而抽樣由于只涉及較少的元素,因此可以集中使用資源,從而增加每
一個研究人員調查的元素數(shù)量,進而提高調查的質量。
為什么說“街頭攔人”不是隨機抽樣?
答:“街頭攔人”這種碰到誰就選誰的抽樣方法并不是隨機抽樣,原因如下:
(1)電視臺、電臺和報紙記者的“街頭攔人”調查,采用的就是方便抽樣。方便抽樣即偶
遇抽樣,是指研究者使用對自己最為便利的方法來選取樣本。這種方法很容易產(chǎn)生系統(tǒng)
誤差,樣本代表性很差,因此,在使用時要特別小心,總體的情況越復雜,方便抽樣的
效果就越差。
(2)雖然方便抽樣旨在排除主觀因素的影響,純粹依靠客觀機遇來抽取對象,但它并沒
有通過隨機過程,使總體中的每一個元素有相等的被抽中概率。那些最先被碰到的、最
容易見到的、最方便找到的對象,具有比其他對象大得多的機會被抽中。與“正?!钡难?/p>
究對象相比,那些衣著破爛、年紀太大、不擅辭令的研究對象,很少有機會進入電視鏡
頭。
判斷抽樣比較適合用于哪些場合?
答:判斷抽樣經(jīng)常被用于以下三種研究場景:
(1)研究者用判斷抽樣來選擇特別能提供信息的獨特個案。
例如,在問卷設計階段,為檢驗問題設計是否得當,常有意地選擇一些觀點差異懸殊的人
作為研究對象。
(2)研究者用判斷抽樣來選取難以接近的特殊人群。
例如,在娼妓研究中,研究者可以通過搜尋一些主觀信息,如娼妓聚集的地區(qū),與娼妓相
關的社會團體,也可以訪問“專家”,如“紅燈區(qū)”執(zhí)勤的警察、老鴇和皮條客等,來界定研
究計劃所包含的娼妓樣本。
(3)研究者用判斷抽樣來選取某種特殊個案類型,以便進行深入探究。
例如,選擇一些收入遠高于農(nóng)民人均收入水平的農(nóng)民作為研究對象,深入分析他們的致富
途徑。這種研究是希望獲得對這種類型的深入了解,它的作用在于發(fā)現(xiàn)問題,提出假設,
而不在于對總體做出概括,因此,無需根據(jù)樣本對總體進行推論。
目標總體與抽樣總體之間有哪些差異?
答:總體可以進一步劃分為目標總體和抽樣總體,具體闡述如下:
(1)目標總體是理論上具有研究者所考察特征的全體總體元素的集合體。
(2)在實際抽樣中,有些總體元素并不一定都能有機會被抽取到。由那些有機會被抽取
到的總體元素構成的集合體,就是抽樣總體或調查總體,它是排除了研究總體中的一些
特例后的總體。
簡單隨機抽樣中,有哪幾種方法可以產(chǎn)生隨機數(shù)?彼此之間有何差異?
答:(1)當總體單位很多時,通常采用隨機數(shù)法。
(2)具體操作可以利用隨機數(shù)表、隨機數(shù)骰子、計算機產(chǎn)生的偽隨機數(shù)等進行抽樣。在
幾種操作方式中,最經(jīng)常用到的是隨機數(shù)表。由統(tǒng)計軟件產(chǎn)生的隨機數(shù)是偽隨機數(shù),在
通常情況下有循環(huán)周期,故一般無法保證其隨機性。
(3)盡管有些統(tǒng)計軟件產(chǎn)生的偽隨機數(shù)有較長的循環(huán)周期,但為了保證抽樣的隨機性,
在有條件的情況下,最好還是使用隨機數(shù)表或隨機數(shù)骰子來產(chǎn)生隨機數(shù)。
為什么說等距抽樣是一種準隨機抽樣方法?
答:在系統(tǒng)抽樣中,等間距抽取是最常用的規(guī)則,故系統(tǒng)抽樣經(jīng)常被稱為等距抽樣。由于
抽樣使用的是抽樣間距,而不是隨機數(shù),故等距抽樣是一種準隨機抽樣方法。
為什么系統(tǒng)抽樣的代表性與總體單位的排列順序有關?
答:系統(tǒng)抽樣需要將總體單位按順序排列。并非所有排列順序都能滿足系統(tǒng)抽樣的要求,
例如,當單位的排列存在周期性的變化,樣本的代表性就可能很差。與系統(tǒng)抽樣有關的單
位排列大致有以下幾種情況:
(1)總體單位隨機排列
總體單位按隨機順序排列的系統(tǒng)抽樣稱為無序系統(tǒng)抽樣,其效果等價于簡單隨機抽樣。
(2)總體單位線性趨勢排列
即總體單位按某個輔助變量的大小順序排列,而這個輔助變量與所研究的指標值線性相關
o對線性趨勢總體進行系統(tǒng)抽樣稱為有序系統(tǒng)抽樣,其效果優(yōu)于簡單隨機抽樣。
(3)總體單位周期排列,即總體單位指標值按其順序呈周期性變化
對于周期排列的總體,系統(tǒng)抽樣的估計效果與抽樣間距以及單位指標值的變化周期有關。
為什么分層抽樣中,各層的樣本規(guī)模要進行非比例分配?
答:非比例分配設計最常見的目的如下:
(1)對總體中規(guī)模太小的層進行比較研究
當某些層的單位在總體中的比例太小,如果按比例分配樣本,則這些層的樣本規(guī)模會很少
,無法進行統(tǒng)計分析,這時可以加大該層的樣本規(guī)模,即使用較大的抽樣比,以便對這些
層的子總體進行研究和比較。
(2)在費用一定的情況下,獲得盡可能高的抽樣精度,又稱為最優(yōu)分配
①當各層的單位調查費用相等時,最優(yōu)分配的原則是:層內單位標準差越大的層,抽樣比
越高。這時抽樣比與層內單位標準差成正比。
②當各層的單位調查費用差異較大時,最優(yōu)分配的原則是:單位調查費用越低的層,抽樣
比越高。這時抽樣比與層內單位平均調查費用的平方根成反比。
分層抽樣中,層的數(shù)目要受到哪些因素的限制?
答:在實際抽樣中,層的數(shù)量受到以下限制:
(1)樣本規(guī)模的限制
因為要考慮估計量方差的無偏估計,故每層至少要有兩個樣本單位,這樣層數(shù)就不能超過
n/2?
(2)調查經(jīng)費的限制
①增加層數(shù)勢必會增加調查的管理費用,而當層數(shù)增加到一定的時候,在精度上的收益將
非常小,這就是收益遞減現(xiàn)象;
②在調查費用一定的情況下,增加層數(shù)必然導致降低樣本規(guī)模,而每層的樣本規(guī)模越小,
對總體方差的估計值也就越不精確,這時就要考慮增加層數(shù)而降低樣本規(guī)模在精度上是否
合算。
群的劃分原則與分層原則有什么不同之處?
答:(1)群的劃分遵循以下原則:群內方差盡可能大,群間方差盡可能小。
(2)分層抽樣遵循的原則是:如果單位之間差異很大,那就對它們進行分組,使得各組
內的差異變小,這樣在各組內進行抽樣就會提高精度,增加樣本的代表性。
PPS抽樣是如何保證大小不等的群中的元素以相等概率入樣的?
答:多階段PPS抽樣關鍵是在第一階段抽取PSU時,要先放棄等概率抽樣條件,采用PPS
抽樣方法,即賦予規(guī)模不等的群與其規(guī)模(或輔助變量)成比例的入樣概率。由于抽取P
SU的過程是不等概率抽樣,因此如果這樣大概率抽取群,小概率抽取樣本單位,一大一
小相互抵消,就保證了總體單位抽取的等概率性。要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 虛擬拍攝與綠幕技術-洞察分析
- 線粒體遺傳與疾病診斷-洞察分析
- 鄉(xiāng)村治理與綠色發(fā)展-洞察分析
- 膝關節(jié)韌帶損傷力學特性研究-洞察分析
- 醫(yī)院調崗位申請書(6篇)
- 辦公室環(huán)境的實驗室安全與標準實施策略
- 創(chuàng)新設計思維在廣告行業(yè)的作用
- 化學實驗操作的安全隱患及應對措施
- 辦公環(huán)境下的孕婦如何進行合理飲食搭配
- 企業(yè)內部創(chuàng)新與創(chuàng)意產(chǎn)業(yè)結構的優(yōu)化
- 人教版數(shù)學小學二年級上冊無紙筆測試題
- 小學科學實驗圖片和文字
- 項目總監(jiān)簡歷模板
- 拉薩硫氧鎂凈化板施工方案
- 施工單位自查自糾記錄表
- 產(chǎn)品合格證出廠合格證A4打印模板
- IEC60287中文翻譯版本第一部分課件
- 《公路隧道設計細則》(D70-2010 )【可編輯】
- 東南大學高數(shù)實驗報告
- 農(nóng)業(yè)開發(fā)有限公司章程范本
- 化工企業(yè)隱患排查與治理
評論
0/150
提交評論