民意調(diào)查的抽樣_第1頁(yè)
民意調(diào)查的抽樣_第2頁(yè)
民意調(diào)查的抽樣_第3頁(yè)
民意調(diào)查的抽樣_第4頁(yè)
民意調(diào)查的抽樣_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

民意調(diào)查的抽樣第1頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月課程大綱抽樣原理隨機(jī)抽樣等距抽樣分層分段抽樣非隨機(jī)抽樣第2頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月抽樣原理(1)由於我們不可能訪問(wèn)母體中所有的個(gè)體,所以必須進(jìn)行抽樣。抽樣一定會(huì)有誤差,也就是根據(jù)樣本的調(diào)查結(jié)果跟真實(shí)母體之間有一定的差距,稱為抽樣誤差。抽樣誤差代表一種區(qū)間,也就是樣本估計(jì)的結(jié)果被包含在一定的上下限。第3頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月抽樣原理(2)抽樣誤差的估計(jì)為若干個(gè)樣本標(biāo)準(zhǔn)誤σ/sqrt(n)。當(dāng)我們做無(wú)數(shù)次抽樣之後,所得到的每一個(gè)樣本平均值將形成一個(gè)常態(tài)分布。而這些樣本平均值的離散程度就是樣本標(biāo)準(zhǔn)誤。如果樣本抽的次數(shù)夠多,真正的母體平均值μ應(yīng)該等於所有樣本平均值的平均值加減一定的標(biāo)準(zhǔn)誤。但是我們不可能抽無(wú)限次的樣本,只能假定單一抽樣就代表無(wú)限次抽樣後的平均值。因此我們對(duì)母體平均值的估計(jì)就是依照抽樣結(jié)果。第4頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月常態(tài)分布圖第5頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月抽樣原理(3)根據(jù)上圖,我們知道,68%的樣本平均值會(huì)落在μ加減一個(gè)標(biāo)準(zhǔn)誤的範(fàn)圍中。如果是μ加減兩個(gè)標(biāo)準(zhǔn)誤的範(fàn)圍,則會(huì)包含95%的樣本平均值。如果是μ加減三個(gè)標(biāo)準(zhǔn)誤的範(fàn)圍,則會(huì)包含99%的樣本平均值。換句話說(shuō),68%的樣本平均值加減一個(gè)標(biāo)準(zhǔn)誤會(huì)包含μ。以此類推。第6頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月抽樣原理(4)而σ又是從樣本的資料估計(jì)得來(lái):

σ=sqrt(n/n-1)*s.s為標(biāo)準(zhǔn)差,計(jì)算方式為sqrt[∑(xi-x_bar)2/n-1]。其中xi表示每一個(gè)觀察值。通常一個(gè)簡(jiǎn)化的公式為設(shè)定σ等於0.5,而抽樣誤差公式可以快速計(jì)算為1/sqrt(n).也就是樣本數(shù)的開(kāi)根號(hào)的倒數(shù)。第7頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月信心水準(zhǔn)與抽樣誤差剛剛提到的68%或95%或99%通常稱為信心水準(zhǔn)。意思為抽100次樣本,有多少比率的樣本是我們確定會(huì)以一個(gè)特定區(qū)間包含母體平均數(shù)μ。信心水準(zhǔn)越高,所需要的區(qū)間也就越大,μ的上下限也就差距越大。所以信心水準(zhǔn)跟抽樣誤差之間必須取捨。通常我們是用95%信心水準(zhǔn),對(duì)應(yīng)兩個(gè)標(biāo)準(zhǔn)誤的抽樣誤差第8頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月信心水準(zhǔn)與抽樣誤差試算信心水準(zhǔn)68%95%99%標(biāo)準(zhǔn)誤正負(fù)1正負(fù)2正負(fù)3抽樣誤差0.5/sqrt(n)1/sqrt(n)1.5/sqrt(n)試算抽樣誤差(假設(shè)n=900)正負(fù)1.6%正負(fù)3.3%正負(fù)5%第9頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月信心水準(zhǔn)與抽樣誤差例子第10頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月信心水準(zhǔn)與抽樣誤差注意事項(xiàng)上述的公式完全不考慮母體大小,只考慮樣本數(shù)大小

。根據(jù)上述的公式可以逆向推估需要的樣本。當(dāng)母體非常小的時(shí)候,例如低於100,抽樣誤差已經(jīng)沒(méi)有意義,可以考慮全查。第11頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月單純隨機(jī)抽樣將每一個(gè)觀察值加以編號(hào)依照亂數(shù)表選中一個(gè)號(hào)碼每個(gè)觀察值應(yīng)該有同樣的中選機(jī)率第12頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月第13頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月等距抽樣(1)把全體總數(shù)N除以樣本數(shù)n得到K,起始為隨機(jī)亂數(shù)抽出R,然後每隔K個(gè)抽出一個(gè)樣本,

R,

R+K,R+2K,R+3K,一直到R+(n-1)K。如果觀察值本身有分組,則是依照各組人數(shù)從小而大排列,然後各組內(nèi)再編號(hào)以方便抽出。假如我們有4800個(gè)觀察值如下表,如何抽出16個(gè)樣本?先抽一個(gè)亂數(shù)6,然後每隔300就抽一個(gè)。第14頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月等距抽樣(2)分組人數(shù)累積人數(shù)抽出樣本130030062500800306,60636001400906,1206480022001506,1806,21065120034002406,2706,3006,33066140048003606,3906,4206,4506總數(shù)480016第15頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月分層分段抽樣(1)主動(dòng)將樣本分成若干層,原則為層內(nèi)同質(zhì)性越大越好,層外同質(zhì)性越小越好。

例如:依照都市化程度分鄉(xiāng)鎮(zhèn);依照學(xué)院特性分科系;依照學(xué)校特色分學(xué)校

。人數(shù)越多的層應(yīng)該分到越多樣本;在各層之下再分段以簡(jiǎn)化抽樣。每一人的中選機(jī)率仍然會(huì)相同。第16頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月分層分段抽樣(2)例如調(diào)查政大的學(xué)生對(duì)政大的認(rèn)同感。

根據(jù)資料,博士班學(xué)生約834人,碩士班約4,570人,大學(xué)生約9,404人,總共14,808人。若想抽出樣本1,200人,則博士班學(xué)生約分配到67人,碩士班約368人,大學(xué)生約765人。第17頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月分層分段抽樣(3)學(xué)院個(gè)數(shù)累積教育233233國(guó)際事務(wù)274507理6161123法6421765中選1153傳播7912556文8353391中選1153外語(yǔ)1,1184509中選1153社科2,2816790中選2306商2,6149404總數(shù)9,404765第18頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月分層分段抽樣(4)先決定要抽出五個(gè)學(xué)院,K為1880

。

然後抽出起始亂數(shù)為1203,落在法學(xué)院。接下來(lái)為文學(xué)院,最後是社科院,有兩個(gè)中選。

每個(gè)中選單位必須訪問(wèn)153人,共765人。

以傳播學(xué)院為例,中選機(jī)率公式為(5*2556/9404)*(153/2556)=765/9404。而博士班以及碩士班中選機(jī)率皆同。

第19頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月假設(shè)某一層涵蓋以下鄉(xiāng)鎮(zhèn)市鄉(xiāng)鎮(zhèn)市永和161139161139*新店175331336470三重244979581449*中和259824841273桃園1619021003175中壢1899821193157*鳳山1976501390807板橋3380371738844新莊1945921923496*第20頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月分層分段抽樣應(yīng)用每個(gè)鄉(xiāng)鎮(zhèn)市抽出同樣數(shù)目的樣本例如永和預(yù)計(jì)抽出60個(gè)樣本,便預(yù)計(jì)抽出3個(gè)里,每個(gè)里20個(gè)樣本,假設(shè)永和有25個(gè)里,假設(shè)每個(gè)里人口為M,每一人的被抽取率為[4*161139/1923496]*[3*M/161139]*[20/M]=60/480874第21頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月加權(quán)分層抽樣後,要對(duì)每一層做加權(quán)。加權(quán)的權(quán)值為:Wi=(Ni/N)╳(n/ni)。因?yàn)椋簄i=(nNi)/N,即每一層的樣本數(shù)等於全部樣本數(shù)乘以每一層所佔(zhàn)的比例。而每一層佔(zhàn)總樣本的比例為權(quán)值ni/n,乘以每一層的平均數(shù)(Σxi/ni),相乘後將得到Σxi/n,亦即全部樣本的平均數(shù),也就是對(duì)母體平均數(shù)的估計(jì)。第22頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月加權(quán)方式通常我們?nèi)绻心阁w的交叉資料,例如每一個(gè)縣市的教育程度或性別,我們可以做「事後加權(quán)」。如果沒(méi)有的話,我們做「反覆加權(quán)」,即先對(duì)一個(gè)類別做加權(quán),通過(guò)檢定後再做下一個(gè)加權(quán),一直到全部通過(guò)為止。第23頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月反覆加權(quán)反覆加權(quán)的意思為先對(duì)某一變數(shù)加權(quán),若通過(guò)卡方檢驗(yàn),儲(chǔ)存資料後,再對(duì)另一變數(shù)加權(quán),然後再檢驗(yàn),然後再對(duì)另一變數(shù)加權(quán)通常加權(quán)的變數(shù)為性別、教育程度、年齡、地區(qū)等第24頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月電話訪問(wèn)之抽樣(一)

電話號(hào)碼簿抽樣—根據(jù)每個(gè)縣市之人口比例決定樣本數(shù),再根據(jù)電話號(hào)碼簿之頁(yè)數(shù)決定平均每幾頁(yè)抽出一個(gè)樣本,在那一頁(yè)以隨機(jī)方式?jīng)Q定那一欄第幾個(gè)號(hào)碼為中選號(hào)碼抽出中選號(hào)碼後可在尾數(shù)或後兩位尾數(shù)加1或隨機(jī)處理,以找到未登記的號(hào)碼第25頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月電話訪問(wèn)之抽樣(二)電話號(hào)碼由局碼及後面幾位數(shù)字組合而成,若已

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論