第六章 不等概率抽樣ppt課件_第1頁
第六章 不等概率抽樣ppt課件_第2頁
第六章 不等概率抽樣ppt課件_第3頁
第六章 不等概率抽樣ppt課件_第4頁
第六章 不等概率抽樣ppt課件_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第六章 不等概率抽樣1 概述一、不等概率抽樣的定義和特點一定義: 假設(shè)總體中每個單元進入樣本的能夠性是不相等的,那么這種隨機抽樣方式就稱為不等概率隨機抽樣,簡稱不等概率抽樣。 二特點:將總體中每個單元的入樣概率與其“規(guī)模大小聯(lián)絡(luò)起來,使得“大單元被抽到的概率大,“小單元被抽到的概率小。.二、不等概率抽樣的優(yōu)點和局限性一優(yōu)點:可以大大提高抽樣精度,減少抽樣誤差。 二局限性:必需具有可以闡明單元規(guī)模大小的輔助變量來確定各個單元的入樣概率或包含概率。三、不等概率的適用場所:總體單元之間的差別較大。四、不等概率抽樣分類: 我們最關(guān)懷也是最重要的情形是抽樣容量 n固定時,單元入樣的概率不放回抽樣或每次抽

2、樣的概率有放回抽樣與單元的大小嚴厲成比例。這種情況下的有放回抽樣稱為 抽樣不放回抽樣稱為 抽樣。.2 放回的不等概率抽樣 1、多項抽樣、 抽樣及其實施方法 既然是不等概率抽樣,那么就應(yīng)該在抽樣之前給總體中的每一個單元賦予一定的抽取概率,在放回抽樣的每一次抽取中,設(shè)第 個單元入樣的概率為且 ,按此規(guī)定有放回地獨立抽取 n 次,構(gòu)成所謂的多項抽樣。. 假設(shè)第 個單元在 n次抽樣中被抽中 次,那么是一個隨機向量,其結(jié)合分布為:這是我們熟習的多項分布,多項抽樣其名正出于此。(7.1) 多項分布(7.1)具有如下性質(zhì):倘假設(shè)單元有一個數(shù)值度量其大小,諸如職工人數(shù)、工廠產(chǎn)值商店銷售額等,或者感興趣的調(diào)查目

3、的在上一次普查時的數(shù)據(jù)也可以作為其單元大小的一種度量。記 為第 個單元的“大小,并記. 多項抽樣是最簡單的不等概率抽樣,它的實施方法通常有兩種,以pps抽樣為例。那么可取此時多項抽樣表達了每次抽樣時單元的入樣概率與單元的大小成比例,即為pps抽樣。 1代碼法 它適宜于 N不太大的情形。假定一切的 為整數(shù),倘假設(shè)在實踐中存在 不是整數(shù)的話,那么可以乘以一個倍數(shù)使一切 為整數(shù)對普通的多項抽樣,也總可找到整數(shù) ,使一切 成為整數(shù)。對于具整數(shù) 的第 個單元賦予一個與 相等的代碼數(shù),見表71。.單元單元大小代碼數(shù)表71 pps 抽樣時各單元的代碼數(shù)每次抽樣前,先在整數(shù) 里面隨機等能夠的選取一個整數(shù),設(shè)為

4、m ,假設(shè)代碼 m 屬于第 j個單元擁有的代碼數(shù),那么第 j個單元入樣。整個過程反復 n次,得到 n個單元入樣當然存在反復的能夠性構(gòu)成 pps 樣本。.例7.1 設(shè)某總體共有N=8個單元,相應(yīng) 及代碼如表所示123456782/51/22/34/38/53/52/3 11215204048182030累計12274787153173203代碼11213272847488788153154173174203.假設(shè)取 n=3,在1203中隨機有放回地產(chǎn)生3個隨機整數(shù),不妨設(shè)為45、89、101,那么第 3 個單元入樣一次,第 5 個單元入樣 2 次。2Lahiri拉希里 方法 當 N 相當大時,累

5、計的 將很大,給代碼法的實施帶來很多不方便。Lahiri提出以下方法:令每次抽取 1N 中一個隨機整數(shù) 及 1 內(nèi)一個隨機整數(shù) ,假設(shè) ,那么第 個單元入樣;假設(shè) ,那么按前面步驟重抽 ,顯然,第 個單元的入樣與否遭到 的影響,只需 時它才入樣,因此第 個單元入樣的概率與 的大小成正比,此時m.2、Hansen-Hurwitz 漢森赫維茨估計量 假設(shè) 是按 為入樣概率的多項抽樣而得的樣本數(shù)據(jù),它們相應(yīng)的 值自然記為 ,那么對總體總和, Hansen-Hurwitz 給出了如下的估計量:(7.4)且 ,即 是總體總和 的無偏估計。(7.6)的無偏估計為(7.7).2 不放回的不等概率抽樣 上一節(jié)

6、講述了有放回不等概率抽樣,無論從實施上還是從估計計算以及精度估計都顯得非常方便。但是,一個單元被抽中兩次以上總會使樣本的代表性打折扣,從而引起抽樣誤差的添加。因此,實踐調(diào)查任務(wù)者普通傾向于運用不放回方式。 最簡單的不放回不等概率抽樣方式自然會想到逐一抽樣這在第一次抽樣時不會發(fā)生問題,但在抽第二個樣本時面臨的情況與有放回時大不一樣,余下的 ( N-1 ) 個單元以什么樣的概率參與第二次抽樣就是個問題;再在抽第三個樣本時又面臨新問題,如此下去,一是抽樣實施的復雜,二是估計量及其方差計算的復雜,因此,在本節(jié)僅討論 n固定,尤其是n=2時的情形。同時,我們只對使總體中每個單元的入樣概率嚴厲地與其“大小

7、成比例感興趣,這就是所謂的 抽樣。.1、包含概率 不放回不等概率抽樣中,總體中每個單元被包含到樣本的概率,即入樣概率 是個重要的概念,而且恣意兩個單元包含到樣本中去的概率 也是個重要的概念,可以想象,估計量的方差等計算會與 有著親密的關(guān)系 既然 表示第 個單元在 n個樣本中出現(xiàn)的能夠性,那么一切 N個單元在樣本中出現(xiàn)的能夠性之和自然等于 n,這就是 的一個眾所周知的性質(zhì): 我們所思索的嚴厲 抽樣,既然 與 成比例,假設(shè)n固定的話,顯然有:(7.8)(7.9). 對于 ,我們有(7.11)2、HorvitzThompson霍維茨湯普森估計量(7.12)HT估計量與HH估計量是及其類似的。由于 ,

8、它們在方式上似乎完全一樣,但是HH估計量中的 可以相互反復,而HT中的 卻是絕對地互不一樣。 對于不放回不等概率抽樣,關(guān)于總體總和 由Horvitz和Thompson提出如下的估計量:.當 n 固定時,HT估計量的方差為:(7.13)3、幾種嚴厲的不放回 抽樣方法 前面曾經(jīng)指出,所謂“嚴厲不放回 是指樣本容量n 固定,嚴厲不放回、 的抽樣。僅引見n=2的情形。1Brewer布魯爾方法1963 假設(shè)對一切 ,均有 ,現(xiàn)抽取兩個樣本,最通常的方法是逐個選取。先以正比于 的概率從N個單元中抽取 1 個樣本,然后在余的N1個單元中按與 成正比的概率抽取第2樣本.這種抽樣方法可以保證每個單元入樣概率為:而(7.17)其中.2Durbin德賓方法1967的概率抽取第二

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論