5傳播學(xué)研究方法第五講研究生_第1頁
5傳播學(xué)研究方法第五講研究生_第2頁
5傳播學(xué)研究方法第五講研究生_第3頁
5傳播學(xué)研究方法第五講研究生_第4頁
5傳播學(xué)研究方法第五講研究生_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

傳播學(xué)研究方法第五講

抽樣鐘智錦中山大學(xué)傳播與設(shè)計學(xué)院抽樣第一節(jié) 抽樣的意義與作用第二節(jié) 概率抽樣的原理與程序第三節(jié) 概率抽樣方法第四節(jié) 非概率抽樣第五節(jié) 樣本規(guī)模與抽樣誤差抽樣的意義與作用一、抽樣的概念1、總體(population)——構(gòu)成總體的全部單位或元素,可以是個人、群體、組織甚至社區(qū)。一般用大寫字母N表示。如婦女-“2005年年滿15-49歲的中國婦女”-“2005年10月1日零時(除臺灣、西藏、香港、澳門)外28個省自治區(qū)15-49歲的婦女”,同時還將醫(yī)院、精神病院、監(jiān)獄、勞教所、軍隊(duì)中的婦女除外。2、樣本(sample)——從總體中按一定方式抽取出的一部分元素的集合。按照概率論,樣本是可以代表總體的。樣本數(shù)目一般用小寫字母n表示。3、抽樣(sampling)——從總體中按一定方式選擇或抽取樣本的過程。4、抽樣單位(samplingunit)——一次直接的抽樣所使用的基本單位。注意:抽樣單位可以是個人、群體、組織或社區(qū)。5、抽樣框(samplingframe)——又稱抽樣范圍,指一次直接抽樣時總體中所有抽樣單位的名單。即“花名冊”。抽樣框可以是多極的。6、參數(shù)值(parameter)——也稱總體值,它是關(guān)于總體中某一變量的綜合描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)。如,中山大學(xué)教師的平均收入。7、統(tǒng)計值(statistic)——也稱樣本值,它是關(guān)于樣本中某一變量的綜合描述,或者說是樣本中所有元素的某種特征的綜合數(shù)量表現(xiàn)。參數(shù)值和統(tǒng)計值重要區(qū)別:參數(shù)值是確定不變的、唯一的,并且通常是未知的;統(tǒng)計值則是變化的,即對于同一個總體來說,不同樣本所得的統(tǒng)計值是有差別的。同時,對于任一特定的樣本來說,統(tǒng)計值是已知的,或者說是可以通過計算得到的。

8.置信區(qū)間與置信度置信區(qū)間:用樣本統(tǒng)計量構(gòu)造的一個區(qū)間去估計總體參數(shù)的范圍。置信度:總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率,也稱為置信水平。置信度反映的是推論的可信度或可靠性;置信區(qū)間反映的是推論的準(zhǔn)確性。在一次調(diào)查中發(fā)現(xiàn),參加大選的某位候選人的支持率為55%,而置信度0.95上的置信區(qū)間是(50%,60%),那么他的真實(shí)支持率有95%的機(jī)率落在50%-60%之間,因此他的真實(shí)支持率不足一半的可能性小于5%。9.抽樣誤差和非抽樣誤差抽樣誤差:當(dāng)用樣本統(tǒng)計值推論總體參數(shù)值時產(chǎn)生的偏差。非抽樣誤差:發(fā)生在測量、記錄、填答、匯總等過程中的誤差,或者指標(biāo)設(shè)計有誤、觀察不當(dāng)、造假、回答不實(shí)等。抽樣的特點(diǎn)1.抽樣調(diào)查是非全面調(diào)查方法中用來推論總體的最完善、最具科學(xué)依據(jù)的方法。隨即抽樣原則使得被抽取的單位在總體中的分布能夠反映總體的結(jié)構(gòu),對總體具有充分的代表性,不至于出現(xiàn)傾向性偏差。2.抽樣調(diào)查成本低、時間短、資料詳細(xì)、應(yīng)用范圍廣泛。3.準(zhǔn)確性高。抽樣調(diào)查的準(zhǔn)確性在于它是建立在對抽樣誤差估計的基礎(chǔ)上,研究者可以根據(jù)置信度和置信區(qū)間等方法判斷抽樣調(diào)查的結(jié)果或數(shù)據(jù)的準(zhǔn)確性。抽樣分布1、含義:抽樣分布是根據(jù)概率的原則而成立的理論分布,它顯示:從一個總體中不斷抽取樣本時,各種可能出現(xiàn)的樣本統(tǒng)計值的分布情況。2、例:一個總體為10個個案的平均數(shù)分布。假如:這10個人參加工作的年限分別為6、7、8、9、10、11、12、13、14、15年,那么這一總體的成員平均工作年限為10.5年。(1)用容量為1的樣本來估計總體的平均數(shù)(2)用容量為2的樣本來估計總體的平均數(shù)(3)用容量為3的樣本來估計總體的平均數(shù)(4)用容量為4的樣本來估計總體的平均數(shù)(5)用容量為5的樣本來估計總體的平均數(shù)樣本容量增大時,樣本平均數(shù)的分布變化趨勢:平均數(shù)的范圍將逐步縮小,相同的平均數(shù)會相應(yīng)增多;全部平均數(shù)的分布向總體平均數(shù)集中。/central_limit_theorem.htm中心極限定理在一個含有N個元素且平均數(shù)為μ,標(biāo)準(zhǔn)差為σ

的總體中,抽取所有可能含有n(樣本數(shù))個元素的m組樣本組合。樣本平均數(shù)的以標(biāo)準(zhǔn)誤(SE)σ/

圍繞著總體均值μ波動。隨著n增大,樣本平均值的波動越來越小,也越來越接近正態(tài)分布。這一定理說明:當(dāng)n足夠大時(通常假定大于30),無論總體的分布如何,其樣本的平均數(shù)所構(gòu)成的分布都趨于正態(tài)分布。方差(variance)與標(biāo)準(zhǔn)差(standarddeviation)方差(variance):將各數(shù)據(jù)與平均數(shù)的差加以平方,然后求和,再除以數(shù)據(jù)總次數(shù),最后所得的商。

標(biāo)準(zhǔn)差(StandardDeviation)是總體中各數(shù)據(jù)偏離平均數(shù)的距離的平均數(shù),用σ表示。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個數(shù)據(jù)集的離散程度。標(biāo)準(zhǔn)差越大,數(shù)據(jù)越分散,曲線越平坦。Theheights(attheshoulders)are:600mm,470mm,170mm,430mmand300mm.Mean=(600+470+170+430+300)/5=

394TocalculatetheVariance,takeeachdifference,squareit,andthenaveragetheresult:Variance:σ2=(2062+762+(-224)2+362+(-94)2

)/5=

108,520/5

=21,704StandardDeviation:σ=√21,704=147back正態(tài)分布的特點(diǎn)(1)單峰、對稱。其平均數(shù)(mean)、眾數(shù)(次數(shù)最多的值,mode)、中位數(shù)(其兩邊的樣本數(shù)相同,median)都相同。(2)全部樣本平均數(shù)的平均值正好等于總體的平均數(shù);全部樣本平均數(shù)的標(biāo)準(zhǔn)誤(SE)則等于總體標(biāo)準(zhǔn)差(SD)除以。(3)正態(tài)曲線下面積的大小,等于隨機(jī)變量X取對應(yīng)范圍的值得概率。正態(tài)分布曲線下的全部面積恒等于1。(4)正態(tài)分布是很多統(tǒng)計分析的基礎(chǔ)在正態(tài)分布中,如果進(jìn)行反復(fù)觀測有68%的樣本統(tǒng)計值落在u±SE(樣本平均數(shù)的標(biāo)準(zhǔn)誤)之間有90%的樣本統(tǒng)計值落在u±1.65SE(樣本平均數(shù)的標(biāo)準(zhǔn)誤)之間;有95%的樣本統(tǒng)計值落在u±1.96SE之間;有98%的樣本統(tǒng)計值落在u±2.33SE之間;有99%的樣本統(tǒng)計值落在u±2.58SE之間。其中,百分?jǐn)?shù)表示置信水平,u±1.65SE等表示置信區(qū)間。back正態(tài)分布圖美國男性的平均身高是178厘米,標(biāo)準(zhǔn)誤(SE)為8厘米,呈正態(tài)分布。請計算68%的美國男性的身高范圍和95%的美國男性的身高范圍。178+-8=170-----186178+-8*1.96=162.32-----193.68抽樣的類型(1)概率抽樣:簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣、多段抽樣、PPS抽樣、戶內(nèi)抽樣(2)非概率抽樣:偶遇抽樣、判斷抽樣、定額抽樣、雪球抽樣概率抽樣的原理與程序一、概率抽樣的基本原理1、總體的同質(zhì)性與異質(zhì)性同質(zhì)性:如果某個總體中的每一個成員在所有方面都相同,那么,我們就說這個總體具有完全的同質(zhì)性。否則,就存在不同程度的異質(zhì)性。社會各種總體的異質(zhì)性決定了嚴(yán)格的概率抽樣的必要性。概率抽樣的原理——等概率原則(1)每一個個體的抽取都是一個隨機(jī)事件,即保證總體中的每一個個體都有相同的機(jī)會入選樣本?;蛘哒f,每一個個體的抽取都是相互獨(dú)立的,被抽中的概率相等。(2)各種隨機(jī)事件的背后,存在著事件發(fā)生的客觀概率,正是這種概率決定著隨機(jī)事件的發(fā)展變化規(guī)律。(例:投擲硬幣)(3)概率抽樣之所以能夠保證樣本對總體的代表性,其原理就在于它能夠很好地按照總體內(nèi)在結(jié)構(gòu)中所蘊(yùn)涵的各種隨機(jī)事件的概率來構(gòu)成樣本,使樣本成為總體的縮影。抽樣的程序1、界定總體:《文摘》雜志的錯誤弗蘭克林.羅斯福vs阿爾夫.蘭登2、決定抽樣方案:根據(jù)研究目的、總體特征、客觀條件選擇不同的抽樣方案。并同時根據(jù)調(diào)查的精確程度和可靠性的要求,確定樣本規(guī)模。3、制定抽樣框:根據(jù)抽樣方案分階段制定。4、實(shí)際抽取樣本。5.樣本評估。將能夠反映總體一般狀況的指標(biāo)(通常是年齡、性別)與樣本的同類指標(biāo)進(jìn)行比較,差異較大的就需要重新抽樣。概率抽樣方法

p.122-135抽樣方法涉及到研究問題的性質(zhì)、抽樣框的獲得、經(jīng)費(fèi)的多少、樣本的代表性要求、調(diào)查資料的獲取等等因素。不同的方法適用不同的情形。一、簡單隨機(jī)抽樣(simplerandomsampling)又稱純隨機(jī)抽樣,是概率抽樣的基本形式。1、抽簽??傮w的每一元素編號(抽樣框)——將號碼寫在一張張紙條上——攪拌均勻——抽出紙條——找出編號所對應(yīng)的元素2、隨機(jī)表:抽樣框——編號——確定從隨機(jī)表中選取幾位數(shù)——逐一取舍——找出所選中的編碼的對應(yīng)元素隨機(jī)數(shù)表抽樣舉例二、系統(tǒng)抽樣(systematicsampling)1、含義:又稱等距抽樣、機(jī)械抽樣。它是把總體的單位進(jìn)行編號排序后,再計算出某種間隔,然后從間距以內(nèi)的任意一個數(shù)字開始按照間距的大小來抽取樣本。2、步驟:(1)制定抽樣框(2)計算抽樣間隔K=總體規(guī)模N/樣本規(guī)模n(3)在間隔數(shù)字以內(nèi)選擇隨機(jī)起點(diǎn)A(4)抽取個體:自A開始,每隔K個個體抽取一個個體。A,A+K,A+2K……(5)將n個個體合起來,構(gòu)成一個樣本(6)如果抽樣間距不是整數(shù)?如總體為5012,樣本為200,間隔為25.06在5012內(nèi)隨即選取起抽號,如4842,除以200,得24.21樣本1:24.21-----25樣本2:24.21+25.06=49.27------------50樣本3:24.21+2*25.06=74.33---------75尤其注意以下兩種情況:(1)總體名單中,個體的排列具有某種秩序上的先后、等級上的高低。(最好不要按照一定的標(biāo)準(zhǔn)編號,以免出現(xiàn)較大的抽樣誤差。)(2)總體名單中,個體的排列上有與抽樣間隔相對應(yīng)的周期性分布。二戰(zhàn)士兵的研究:中士、下士、二等兵,以一班一班的方式編排,每班10人

分層抽樣(stratifiedsampling)1、步驟:又稱類型抽樣(1)先將總體所有單位按某種特征或標(biāo)志(如性別、年齡、職業(yè)、地域等)劃分成若干類型或?qū)哟危?)然后再在各個類型或?qū)哟沃胁捎煤唵坞S機(jī)抽樣或系統(tǒng)抽樣的辦法抽取一個子樣本(3)最后將這些子樣本合起來構(gòu)成總體的樣本。分類隨機(jī)抽樣如5000人總體內(nèi),男性有3000人,女性有2000人,樣本為200人。2、優(yōu)點(diǎn):(1)在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣精度。子總體內(nèi)部同質(zhì)性較強(qiáng)、子總體之間異質(zhì)性較強(qiáng)。(2)便于了解總體內(nèi)不同層次的情況,便于對總體中不同類別進(jìn)行單獨(dú)研究或比較。3、注意:(1)分層的標(biāo)準(zhǔn)如何選擇:主要變量或相關(guān)變量;突出總體內(nèi)在結(jié)構(gòu)的變量;已有明顯層次區(qū)分的變量。如大學(xué)生的生活狀況(家庭收入)大學(xué)生的學(xué)習(xí)方法(專業(yè))(2)分層的標(biāo)準(zhǔn)要能夠反映層次或類型的主要特征,要既能保證層次內(nèi)部有較大的同質(zhì)性,又能保證層次之間有較大的異質(zhì)性。如:大學(xué)生的價值觀念(生源地、家庭背景vs年齡、專業(yè))(2)分層的比例問題5000人的總體中,男性為4500人(平均收入2000),女性為500人(平均收入1000)??傮w平均收入(2000*4500+1000*500)/5000=1900樣本為200人。樣本中的男女?dāng)?shù):180:20異比抽樣:男女各100人異比抽樣后的平均收入:(2000*100+1000*100)/200=1500加權(quán)處理:男(180/100=1.8),女(20/100=0.2)計算其平均收入:1.8(2000*100)+0.2(1000*100)/200=1900整群抽樣(clustersampling)1、含義:抽樣單位為群體,而非個體。它是從總體中抽?。刹捎秒S機(jī)抽樣、系統(tǒng)抽樣、分層抽樣方法)一些小群體,然后由所抽出的若干小群體的所有元素構(gòu)成調(diào)查樣本。劃分子群隨機(jī)抽樣從全校20000名學(xué)生中抽取1000名可按班級分群整群抽樣的優(yōu)點(diǎn):可以簡化抽樣過程,降低收集資料的費(fèi)用,還能相對地擴(kuò)大抽樣的應(yīng)用范圍。缺點(diǎn):樣本分布面不廣,樣本對總體的代表性相對較差。整群抽樣所獲得的樣本是分布在總體內(nèi)的幾個點(diǎn)上,而其他三種抽樣方法所獲得的樣本是彌散在總體之中。適用整群抽樣的情況:子群體之間差別不大,而內(nèi)部差異大中學(xué)生、大學(xué)生、老年人、白領(lǐng)、藍(lán)領(lǐng)要考慮調(diào)查對象是否有集中填答的條件多段抽樣(multistagesampling)1、含義:又稱多級抽樣或分段抽樣,它是按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣過程分成幾個階段進(jìn)行。2、步驟:(1)從總體中隨機(jī)抽取若干大群;(2)再從這幾個大群內(nèi)抽取幾個小群……(3)直到抽到最基本的抽樣元素為止。在每個階段中,都要采用簡單隨機(jī)抽樣、系統(tǒng)抽樣或分層抽樣方法。調(diào)查對象:廣東省大學(xué)生市——高?!獙W(xué)院——班級——學(xué)生調(diào)查對象:報紙記者省(直轄市)——市——報社——記者2、注意:如何確定每一級抽樣的單位數(shù)目?要在類別和個體之間保持合適的比例。一般來說,類別相對較多、每一個類別中個體相對較少的抽樣效果較好??紤]因素有三:(1)各抽樣階段中的子總體同質(zhì)性程度;(2)各層子總體的人數(shù);(3)研究者擁有的人力和經(jīng)費(fèi)3、多段抽樣的優(yōu)缺點(diǎn)優(yōu)點(diǎn):抽樣比較容易進(jìn)行缺點(diǎn):由于每一級抽樣都會產(chǎn)生誤差,故誤差較大。在同等條件下減少多段抽樣誤差的方法是:相對增加開頭階段的樣本數(shù)目,適當(dāng)減少最后階段的樣本數(shù)目。PPS抽樣(samplingwithprobabilitypropotionaltosize)全稱:概率與元素的規(guī)模大小成比例的抽樣1、PPS抽樣的必要性:元素在總體中的地位不同時,需要采取不等概率抽樣方法,以最終使調(diào)查總體的每一元素都有同等被抽中的概率。步驟(1)在確定的總體內(nèi),編制單位的抽樣框,給每個單位按序編號,并且統(tǒng)計好每個單位的人數(shù)(2)把每個單位的人數(shù)累積相加,根據(jù)累積人數(shù)確定每個單位的號碼范圍。(3)確定樣本需要的抽樣元素數(shù)量和每個元素里包含的調(diào)查對象的數(shù)量。(4)采用隨機(jī)抽樣或系統(tǒng)抽樣的方法選擇號碼,號碼所對應(yīng)的元素入選第一階段樣本;(5)再從所選元素樣本中進(jìn)行第二階段抽樣,抽出需要的調(diào)查對象。要從全市100家企業(yè),總共20萬名職工中,抽取1000名職工進(jìn)行調(diào)查。最大的企業(yè)有16000名職工,而最小的企業(yè)只有200名職工。如果用多段抽樣法:多段抽樣的方法,首先從100家企業(yè)中隨機(jī)抽取20家;然后再從這20家企業(yè)中分別抽取50名職工(50X20=1000)構(gòu)成樣本。最大企業(yè)員工被抽中的概率:第一階段20÷100=20%;第二階段50÷16000=0.3125%;總概率=20%×0.3125%=0.0625%最小企業(yè)員工被抽中的概率:第一階段20÷100=20%;第二階段50÷200=25%;總概率=20%×25%=5%。PPS抽樣法:1.首先將各個企業(yè)的員工按編碼排列起來,然后寫出它們的規(guī)模、計算它們的規(guī)模在總體規(guī)模中所占的比例;2.確定每個企業(yè)對應(yīng)的可選擇的號碼范圍.3.確定抽樣元素為20個,每個元素中含有50個號碼。4.然后采用隨機(jī)數(shù)表的方法或系統(tǒng)抽樣的方法選擇號碼,號碼所對應(yīng)的元素人選第一階段樣本。5.最后再從所選樣本中進(jìn)行第二階段抽樣(即從每個被抽中的元素中抽取50名職工)。企業(yè)編號規(guī)模選擇號碼范圍所選號碼入樣元素企業(yè)130001-30001228元素1企業(yè)220003001-5001企業(yè)3160005002-210025976,15782元素2、3企業(yè)420021003-212003企業(yè)51200212004-21320421033元素4企業(yè)6企業(yè)7企業(yè)8企業(yè)9企業(yè)10企業(yè)11企業(yè)100800199200-200000

PPS抽樣中最大企業(yè)和最小企業(yè)的員工被抽中的概率最大企業(yè)第一階段被抽中概率20*(16000/200000)=

1.6第二階段被抽中概率50/16000=

0.003125總概率=

1.6*0.003125=0.005最小企業(yè)第一階段被抽中概率20*(200/200000)=

0.02第二階段被抽中概率50/200=

0.25總概率=0.02*0.25=

0.005單位規(guī)模越大被抽取的概率越大,但單位內(nèi)部各個體被抽取的概率越小,兩相抵消,PPS仍然是等概率抽樣。戶內(nèi)抽樣(samplingwithinhoushold)1、含義:如要研究家庭結(jié)構(gòu)、生活方式等方面的內(nèi)容,通過多段抽樣市、縣-區(qū)、鄉(xiāng)-街、村-居委會、居民組-戶,最后,還要從戶中抽取一個成年人構(gòu)成訪談對象的樣本。最后一階段的抽樣可以采取被稱作戶內(nèi)抽樣。P.133生日法:根據(jù)調(diào)查實(shí)施的具體時間和家庭成員出生時間的匹配程度選擇調(diào)查對象。如果間隔相等,則用抽簽法。非概率抽樣非隨機(jī)抽樣方法,不是按等概率原理抽取樣本,而是根據(jù)研究者的主觀判斷或條件便利等因素選擇樣本。總體中的每個單位被抽取的機(jī)會是不相等的,無法用統(tǒng)計方法對抽樣誤差加以控制。常用于定性研究和定量研究總體無法界定時。一、偶遇抽樣(accidentalorconveniencesampling)又稱方便抽樣或自然抽樣。指研究者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象。街頭攔人,往往用于流動性較高的群體,如游客,商場顧客學(xué)生樣本二、判斷抽樣(judgmentalorpurposesampling)又稱立意抽樣。它是調(diào)查者根據(jù)研究目標(biāo)和自己的主觀分析來選擇和確定調(diào)查對象的方法。

主要原則:1.依據(jù)研究者對總體的了解程度,直接選擇自己需要調(diào)查的對象,被選擇對象具有一定的代表性2.根據(jù)研究目的或?qū)颖镜奶厥庖筮x擇對象3.避免抽取極端的例子,而應(yīng)該以“多數(shù)型”或“平均型”的樣本為對象多用于定性研究三、配額抽樣(quotasampling)首先,研究者對總體進(jìn)行分層,并找出具有各種不同特征的成員在總體中所占的比例。然后選擇研究對象,使樣本成員在各種特征上的構(gòu)成盡量接近總體的結(jié)構(gòu)。假設(shè)某高校有2000名學(xué)生,其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論