




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、多目標(biāo)抽樣迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用講評 應(yīng)用統(tǒng)計陳濤 顧晶晶目 錄 問題的提出 迭代方法(Raking)及相關(guān)理論 實證研究規(guī)模以下工業(yè)抽樣調(diào)查一、問題的提出n概念概念 多目標(biāo)變量問題,是指用一套樣本估計多個目標(biāo)變量的總量、均值、比率和比例等。在實際中,任何一項調(diào)查都不可能僅僅調(diào)查一個指標(biāo)(即變量)。解決多目標(biāo)變量問題的關(guān)鍵是在抽樣設(shè)計中選擇合適的輔助變量。 多目標(biāo)總體問題,是指要求用一套樣本估計多組目標(biāo)子總體的總量、均值、比率或比例等估計量,而且要求滿足一定的精度設(shè)計要求。 解決多目標(biāo)總體問題的總體思路:解決多目標(biāo)總體問題的總體思路:在總樣本量被控制在一定數(shù)量的前提下,科學(xué)地進行
2、樣本分配,使得各在總樣本量被控制在一定數(shù)量的前提下,科學(xué)地進行樣本分配,使得各目標(biāo)總體中有足夠的有效樣本量,從而滿足抽樣精度設(shè)計要求。目標(biāo)總體中有足夠的有效樣本量,從而滿足抽樣精度設(shè)計要求。n多目標(biāo)總體問題多目標(biāo)總體問題比如在規(guī)模以下的工業(yè)抽樣調(diào)查中,全國規(guī)模以下工業(yè)總體可以分割為31個省(市)子總體,同時還可以分割成39個行業(yè)子總體,如果要求31個省子總體的工業(yè)總產(chǎn)值等指標(biāo)的估計量控制在一定精度范圍內(nèi)的同時,要求39個行業(yè)子總體的工業(yè)總產(chǎn)值等指標(biāo)的估計量也控制在一定精度范圍內(nèi)。二、迭代方法(Raking)及相關(guān)理論n迭代加權(quán)調(diào)整法迭代加權(quán)調(diào)整法 迭代加權(quán)調(diào)整法是利用已知的總體外部輔助信息對樣
3、本的權(quán)數(shù)進行調(diào)整,使樣本的某些變量的邊際分布與已知總體的對應(yīng)變量的邊際分布一致,以達到糾正估計量偏倚或者改善估計量精度的目的。 一般來說,在總體的多個輔助變量的具體交叉分組分布未知而這些輔助變量的邊際分布已知的情況下,采用迭代方法進行權(quán)數(shù)調(diào)整是最佳的選擇。 迭代加權(quán)調(diào)整法能夠確保有回答樣本單位的調(diào)整后權(quán)數(shù)符合已知的每個外部輔助變量的邊際分布。迭代加權(quán)調(diào)整過程是運用比例相稱運算法則進行權(quán)數(shù)的反復(fù)調(diào)整過程。n具體的迭代具體的迭代過程:過程:首先,樣本的權(quán)數(shù)被乘上一個恰當(dāng)?shù)谋嚷适怪系谝粋€輔助變量的邊際分布;第二步,這些調(diào)整后的權(quán)數(shù)被乘上另一個比率使之符合第二個輔助變量的邊際分布;依次類推,當(dāng)樣本
4、調(diào)整后的權(quán)數(shù)被乘上某個比率使之符合最后一個輔助變量的邊際分布的時候,第一次迭代過程結(jié)束。繼續(xù)執(zhí)行這樣的迭代過程,直至樣本調(diào)整后的權(quán)數(shù)符合所有輔助變量的邊際分布。 表1表2表3表4表5n用迭代方法進行樣本分配用迭代方法進行樣本分配 從上面關(guān)于迭代方法在權(quán)數(shù)調(diào)整領(lǐng)域的應(yīng)用的文字敘述和實例演示可以總結(jié)出一種迭代思想,即當(dāng)已知兩個或者多個邊際控制量時,通過迭代過程能夠得到兩維或者多維平衡表。在多目標(biāo)總體抽樣中,將測算出來的各組子總體樣本量作為邊際控制量(通常作為已知條件),利用迭代思想進行樣本量分配,實際上相當(dāng)于將多目標(biāo)問題簡化成單目標(biāo)問題。下面以兩組目標(biāo)子總體為例,闡述用迭代方法解決多目標(biāo)總體問題的
5、具體步驟。 測算樣本量 首先分別測算各目標(biāo)子總體滿足一定精度設(shè)計要求的樣本量,然后計算兩組子總體的樣本量和,選擇樣本量和較大者作為總體樣本量,同時等比例地擴大另一組子總體的樣本量。 例如,測算得到第一組子總體的樣本量分別為 , 其樣本量和為 ,第二組子總體的樣本量分別為 其樣本量和為 ,假設(shè) ,則以第一組子總體的樣本量和作為總體樣本量,即 ,第一組子總體的樣本量保持不變,即 ,用調(diào)整因子 等比例擴大第二組子總體的樣本量,即 。于是, 。 初始樣本分配用迭代方法進行初始樣本分配,一般以各交叉分組的單元總數(shù)為初始數(shù)據(jù),以兩組子總體的樣本量為邊際控制量,通過迭代過程,得到各交叉分組應(yīng)分配的樣本量,并
6、且使得各子總體的樣本總數(shù)等于邊際控制量,即事先給定的各子總體的樣本量。表6為迭代前的初始數(shù)據(jù)表,。數(shù)據(jù)不一致 有效樣本量問題及改善方法有效樣本量問題及改善方法用迭代方法進行樣本分配的過程中,只考慮了各個單元格內(nèi)的單元總數(shù)以及在相關(guān)兩個子總體中所占的比重,而沒有考慮各個交叉分組之間的方差差異,樣本在各交叉分組之間不符合最優(yōu)分配,因此,各組子總體的加權(quán)設(shè)計效應(yīng)都會大于1,從而有效樣本量小于設(shè)計樣本量。在不等比例分層抽樣設(shè)計中,如果樣本在各層之間不符合最優(yōu)分配(即奈曼分配),會降低有效樣本量,從而導(dǎo)致估計量精度損失。我們可以通過計算 加權(quán)設(shè)計效應(yīng)(deff)來測算有效樣本量 計算公式表達: 其中:
7、為第h層的總體單位數(shù); 為總體單位數(shù); 為第h層的樣本數(shù); 為全部樣本量; 為各層單位數(shù)占總體單位數(shù)的比重; 為各層的抽樣比。 于是我們可以將上述公式化簡為:各層之間的抽樣比越接近,deff值越小,相反,各層之間的抽樣比越懸殊,deff值越大。特殊地,當(dāng)各層的抽樣比相同時,即 ,deff值達到最小,等于1。有效樣本量等于設(shè)計樣本量與加權(quán)設(shè)計效應(yīng)之比,用公式表達為: 因此,當(dāng)deff= 1時,有效樣本量才等于設(shè)計樣本量,否則,有效樣本量小于設(shè)計樣本量。因此,提高有效樣本量的有效途徑是通過縮小各層抽樣比之間的差距,從而降低加權(quán)設(shè)計效應(yīng)。三、實證研究規(guī)模以下工業(yè)抽樣調(diào)查1.樣本分配樣本分配 確定子總
8、體確定子總體 由于有部分行業(yè)的企業(yè)數(shù)特別少,單獨作為一個子總體進行樣本量測算和分配,會導(dǎo)致抽樣效率降低,因此,將6個特別小的行業(yè)層合并成兩個行業(yè)組合(具體見文獻) 樣本量確定樣本量確定 首先,確定滿足一定精度要求的各個省子總體和行業(yè)大類子總體的樣本量,然后,分別將30個省子總體和35個行業(yè)大類(組合)子總體的樣本量相加,取兩者中的大者作為全國規(guī)模以下工業(yè)抽樣調(diào)查的總樣本量,并等比例擴大另一組子總體的樣本量。 樣本初次分配樣本初次分配 以每個“地區(qū)行業(yè)”單元格中的總體企業(yè)數(shù)為初始數(shù)據(jù),以30個省子總體和35個行業(yè)子總體的樣本量為兩組邊際控制量,用迭代過程進行分地區(qū)、分行業(yè)的樣本初次分配。 一些特
9、殊情況處理一些特殊情況處理如果某些交叉分組的單元總數(shù)較少,通過上述迭代過程,該組應(yīng)分配到的樣本量可能很少(小于2),由于在分層抽樣設(shè)計中每個交叉分組至少被分成一層,為了滿足計算方差的要求,需要對這些交叉分組進行特殊處理。實踐中,一般將四舍五入前小于1的交叉分組的樣本量賦值為0,將四舍五入前在1和1.5之間的交叉分組的樣本量賦值為2。如果某個交叉分組中的單元總數(shù)大于0,而應(yīng)分配到的樣本量為0,也就是說,沒有樣本來代表這些總體單元,從而導(dǎo)致樣本代表性不全,因此,需要對這些交叉分組進行特殊處理。在實踐中,一般是將這些交叉分組與相臨的樣本量大于0的交叉分組進行合并。2.有效樣本量及改善有效樣本量及改善
10、由于用迭代方法進行樣本分配沒有考慮各個交叉分組(30個省和35個行業(yè)(組合)之間形成的1050個交叉分組)之間的方差差異,樣本在各交叉分組之間不符合最優(yōu)分配,因此,各省子總體和各行業(yè)子總體的加權(quán)設(shè)計效應(yīng)都大于1,從而有效樣本量小于設(shè)計樣本量。 為了確保實現(xiàn)各省和各行業(yè)估計量的精度要求,需要適當(dāng)增加樣本量,以降低加權(quán)設(shè)計效應(yīng),提高有效樣本量。增加樣本量的原則和方法是,在抽樣比較小的交叉分組內(nèi)適當(dāng)增加樣本,縮小各交叉分組之間的抽樣比差距。對于某個省來說,就是在抽樣比較小的行業(yè)層內(nèi)增加樣本,縮小各行業(yè)層之間的抽樣比差距。在不斷試算的過程中,有效樣本量達到目前的設(shè)計樣本量即可。由于大部分省在設(shè)計樣本量基礎(chǔ)上增加了樣本量由于大部分省在設(shè)計樣本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國錦綸切片行業(yè)競爭格局規(guī)劃研究報告
- 2025-2030年中國銅礦采選行業(yè)發(fā)展?fàn)顩r及營銷戰(zhàn)略研究報告
- 2025-2030年中國蜂窩紙板市場運營狀況及投資戰(zhàn)略研究報告
- 2025-2030年中國藥學(xué)教育發(fā)展模式及未來投資戰(zhàn)略分析報告
- 2025-2030年中國聚碳酸酯pc行業(yè)運行狀況規(guī)劃分析報告
- 2025-2030年中國粗雜糧行業(yè)競爭格局及發(fā)展前景分析報告
- 2025-2030年中國空氣污染治理設(shè)備市場經(jīng)營狀況及發(fā)展趨勢分析報告
- 2025-2030年中國碼垛機器人市場運行動態(tài)及發(fā)展前景分析報告
- 幼兒健康有營養(yǎng)的蔬菜教案(12篇)
- 中國傳媒大學(xué)《電子與電工技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 哈弗汽車品牌全案策略及營銷推廣方案
- 04J008 擋土墻(重力式 衡重式 懸臂式)
- 《哈佛經(jīng)典談判術(shù)》讀書筆記思維導(dǎo)圖
- 質(zhì)量管理小組活動準(zhǔn)則TCAQ10201-2020
- 扶梯人行道檢驗驗收作業(yè)指導(dǎo)書
- GB/T 41855-2022小型游樂設(shè)施轉(zhuǎn)椅
- 2023年蘇州衛(wèi)生職業(yè)技術(shù)學(xué)院高職單招(英語)試題庫含答案解析
- GB/T 20308-2020產(chǎn)品幾何技術(shù)規(guī)范(GPS)矩陣模型
- 男孩女孩動起來健康運動知識PPT模板
- 鐵路道岔知識課件
- 自考公共關(guān)系學(xué)課件
評論
0/150
提交評論