版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、多目標(biāo)抽樣迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用講評 應(yīng)用統(tǒng)計(jì)陳濤 顧晶晶目 錄 問題的提出 迭代方法(Raking)及相關(guān)理論 實(shí)證研究規(guī)模以下工業(yè)抽樣調(diào)查一、問題的提出n概念概念 多目標(biāo)變量問題,是指用一套樣本估計(jì)多個目標(biāo)變量的總量、均值、比率和比例等。在實(shí)際中,任何一項(xiàng)調(diào)查都不可能僅僅調(diào)查一個指標(biāo)(即變量)。解決多目標(biāo)變量問題的關(guān)鍵是在抽樣設(shè)計(jì)中選擇合適的輔助變量。 多目標(biāo)總體問題,是指要求用一套樣本估計(jì)多組目標(biāo)子總體的總量、均值、比率或比例等估計(jì)量,而且要求滿足一定的精度設(shè)計(jì)要求。 解決多目標(biāo)總體問題的總體思路:解決多目標(biāo)總體問題的總體思路:在總樣本量被控制在一定數(shù)量的前提下,科學(xué)地進(jìn)行
2、樣本分配,使得各在總樣本量被控制在一定數(shù)量的前提下,科學(xué)地進(jìn)行樣本分配,使得各目標(biāo)總體中有足夠的有效樣本量,從而滿足抽樣精度設(shè)計(jì)要求。目標(biāo)總體中有足夠的有效樣本量,從而滿足抽樣精度設(shè)計(jì)要求。n多目標(biāo)總體問題多目標(biāo)總體問題比如在規(guī)模以下的工業(yè)抽樣調(diào)查中,全國規(guī)模以下工業(yè)總體可以分割為31個?。ㄊ校┳涌傮w,同時還可以分割成39個行業(yè)子總體,如果要求31個省子總體的工業(yè)總產(chǎn)值等指標(biāo)的估計(jì)量控制在一定精度范圍內(nèi)的同時,要求39個行業(yè)子總體的工業(yè)總產(chǎn)值等指標(biāo)的估計(jì)量也控制在一定精度范圍內(nèi)。二、迭代方法(Raking)及相關(guān)理論n迭代加權(quán)調(diào)整法迭代加權(quán)調(diào)整法 迭代加權(quán)調(diào)整法是利用已知的總體外部輔助信息對樣
3、本的權(quán)數(shù)進(jìn)行調(diào)整,使樣本的某些變量的邊際分布與已知總體的對應(yīng)變量的邊際分布一致,以達(dá)到糾正估計(jì)量偏倚或者改善估計(jì)量精度的目的。 一般來說,在總體的多個輔助變量的具體交叉分組分布未知而這些輔助變量的邊際分布已知的情況下,采用迭代方法進(jìn)行權(quán)數(shù)調(diào)整是最佳的選擇。 迭代加權(quán)調(diào)整法能夠確保有回答樣本單位的調(diào)整后權(quán)數(shù)符合已知的每個外部輔助變量的邊際分布。迭代加權(quán)調(diào)整過程是運(yùn)用比例相稱運(yùn)算法則進(jìn)行權(quán)數(shù)的反復(fù)調(diào)整過程。n具體的迭代具體的迭代過程:過程:首先,樣本的權(quán)數(shù)被乘上一個恰當(dāng)?shù)谋嚷适怪系谝粋€輔助變量的邊際分布;第二步,這些調(diào)整后的權(quán)數(shù)被乘上另一個比率使之符合第二個輔助變量的邊際分布;依次類推,當(dāng)樣本
4、調(diào)整后的權(quán)數(shù)被乘上某個比率使之符合最后一個輔助變量的邊際分布的時候,第一次迭代過程結(jié)束。繼續(xù)執(zhí)行這樣的迭代過程,直至樣本調(diào)整后的權(quán)數(shù)符合所有輔助變量的邊際分布。 表1表2表3表4表5n用迭代方法進(jìn)行樣本分配用迭代方法進(jìn)行樣本分配 從上面關(guān)于迭代方法在權(quán)數(shù)調(diào)整領(lǐng)域的應(yīng)用的文字?jǐn)⑹龊蛯?shí)例演示可以總結(jié)出一種迭代思想,即當(dāng)已知兩個或者多個邊際控制量時,通過迭代過程能夠得到兩維或者多維平衡表。在多目標(biāo)總體抽樣中,將測算出來的各組子總體樣本量作為邊際控制量(通常作為已知條件),利用迭代思想進(jìn)行樣本量分配,實(shí)際上相當(dāng)于將多目標(biāo)問題簡化成單目標(biāo)問題。下面以兩組目標(biāo)子總體為例,闡述用迭代方法解決多目標(biāo)總體問題的
5、具體步驟。 測算樣本量 首先分別測算各目標(biāo)子總體滿足一定精度設(shè)計(jì)要求的樣本量,然后計(jì)算兩組子總體的樣本量和,選擇樣本量和較大者作為總體樣本量,同時等比例地?cái)U(kuò)大另一組子總體的樣本量。 例如,測算得到第一組子總體的樣本量分別為 , 其樣本量和為 ,第二組子總體的樣本量分別為 其樣本量和為 ,假設(shè) ,則以第一組子總體的樣本量和作為總體樣本量,即 ,第一組子總體的樣本量保持不變,即 ,用調(diào)整因子 等比例擴(kuò)大第二組子總體的樣本量,即 。于是, 。 初始樣本分配用迭代方法進(jìn)行初始樣本分配,一般以各交叉分組的單元總數(shù)為初始數(shù)據(jù),以兩組子總體的樣本量為邊際控制量,通過迭代過程,得到各交叉分組應(yīng)分配的樣本量,并
6、且使得各子總體的樣本總數(shù)等于邊際控制量,即事先給定的各子總體的樣本量。表6為迭代前的初始數(shù)據(jù)表,。數(shù)據(jù)不一致 有效樣本量問題及改善方法有效樣本量問題及改善方法用迭代方法進(jìn)行樣本分配的過程中,只考慮了各個單元格內(nèi)的單元總數(shù)以及在相關(guān)兩個子總體中所占的比重,而沒有考慮各個交叉分組之間的方差差異,樣本在各交叉分組之間不符合最優(yōu)分配,因此,各組子總體的加權(quán)設(shè)計(jì)效應(yīng)都會大于1,從而有效樣本量小于設(shè)計(jì)樣本量。在不等比例分層抽樣設(shè)計(jì)中,如果樣本在各層之間不符合最優(yōu)分配(即奈曼分配),會降低有效樣本量,從而導(dǎo)致估計(jì)量精度損失。我們可以通過計(jì)算 加權(quán)設(shè)計(jì)效應(yīng)(deff)來測算有效樣本量 計(jì)算公式表達(dá): 其中:
7、為第h層的總體單位數(shù); 為總體單位數(shù); 為第h層的樣本數(shù); 為全部樣本量; 為各層單位數(shù)占總體單位數(shù)的比重; 為各層的抽樣比。 于是我們可以將上述公式化簡為:各層之間的抽樣比越接近,deff值越小,相反,各層之間的抽樣比越懸殊,deff值越大。特殊地,當(dāng)各層的抽樣比相同時,即 ,deff值達(dá)到最小,等于1。有效樣本量等于設(shè)計(jì)樣本量與加權(quán)設(shè)計(jì)效應(yīng)之比,用公式表達(dá)為: 因此,當(dāng)deff= 1時,有效樣本量才等于設(shè)計(jì)樣本量,否則,有效樣本量小于設(shè)計(jì)樣本量。因此,提高有效樣本量的有效途徑是通過縮小各層抽樣比之間的差距,從而降低加權(quán)設(shè)計(jì)效應(yīng)。三、實(shí)證研究規(guī)模以下工業(yè)抽樣調(diào)查1.樣本分配樣本分配 確定子總
8、體確定子總體 由于有部分行業(yè)的企業(yè)數(shù)特別少,單獨(dú)作為一個子總體進(jìn)行樣本量測算和分配,會導(dǎo)致抽樣效率降低,因此,將6個特別小的行業(yè)層合并成兩個行業(yè)組合(具體見文獻(xiàn)) 樣本量確定樣本量確定 首先,確定滿足一定精度要求的各個省子總體和行業(yè)大類子總體的樣本量,然后,分別將30個省子總體和35個行業(yè)大類(組合)子總體的樣本量相加,取兩者中的大者作為全國規(guī)模以下工業(yè)抽樣調(diào)查的總樣本量,并等比例擴(kuò)大另一組子總體的樣本量。 樣本初次分配樣本初次分配 以每個“地區(qū)行業(yè)”單元格中的總體企業(yè)數(shù)為初始數(shù)據(jù),以30個省子總體和35個行業(yè)子總體的樣本量為兩組邊際控制量,用迭代過程進(jìn)行分地區(qū)、分行業(yè)的樣本初次分配。 一些特
9、殊情況處理一些特殊情況處理如果某些交叉分組的單元總數(shù)較少,通過上述迭代過程,該組應(yīng)分配到的樣本量可能很少(小于2),由于在分層抽樣設(shè)計(jì)中每個交叉分組至少被分成一層,為了滿足計(jì)算方差的要求,需要對這些交叉分組進(jìn)行特殊處理。實(shí)踐中,一般將四舍五入前小于1的交叉分組的樣本量賦值為0,將四舍五入前在1和1.5之間的交叉分組的樣本量賦值為2。如果某個交叉分組中的單元總數(shù)大于0,而應(yīng)分配到的樣本量為0,也就是說,沒有樣本來代表這些總體單元,從而導(dǎo)致樣本代表性不全,因此,需要對這些交叉分組進(jìn)行特殊處理。在實(shí)踐中,一般是將這些交叉分組與相臨的樣本量大于0的交叉分組進(jìn)行合并。2.有效樣本量及改善有效樣本量及改善
10、由于用迭代方法進(jìn)行樣本分配沒有考慮各個交叉分組(30個省和35個行業(yè)(組合)之間形成的1050個交叉分組)之間的方差差異,樣本在各交叉分組之間不符合最優(yōu)分配,因此,各省子總體和各行業(yè)子總體的加權(quán)設(shè)計(jì)效應(yīng)都大于1,從而有效樣本量小于設(shè)計(jì)樣本量。 為了確保實(shí)現(xiàn)各省和各行業(yè)估計(jì)量的精度要求,需要適當(dāng)增加樣本量,以降低加權(quán)設(shè)計(jì)效應(yīng),提高有效樣本量。增加樣本量的原則和方法是,在抽樣比較小的交叉分組內(nèi)適當(dāng)增加樣本,縮小各交叉分組之間的抽樣比差距。對于某個省來說,就是在抽樣比較小的行業(yè)層內(nèi)增加樣本,縮小各行業(yè)層之間的抽樣比差距。在不斷試算的過程中,有效樣本量達(dá)到目前的設(shè)計(jì)樣本量即可。由于大部分省在設(shè)計(jì)樣本量基礎(chǔ)上增加了樣本量由于大部分省在設(shè)計(jì)樣本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東外語外貿(mào)大學(xué)《企業(yè)生產(chǎn)物流》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東松山職業(yè)技術(shù)學(xué)院《項(xiàng)目管理與案例分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東水利電力職業(yè)技術(shù)學(xué)院《書法基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級上冊《5.2.3 解一元一次方程 去括號》課件與作業(yè)
- 廣東南華工商職業(yè)學(xué)院《花式跳繩》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東梅州職業(yè)技術(shù)學(xué)院《創(chuàng)業(yè)經(jīng)營與廣告公司管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東嶺南職業(yè)技術(shù)學(xué)院《文獻(xiàn)檢索及研究方法》2023-2024學(xué)年第一學(xué)期期末試卷
- 八年級上冊英語課本
- 從起跑線出發(fā):小學(xué)一年級班主任的教學(xué)策略分享
- 【KS5u原創(chuàng)】2021年理綜生物試題4(解析版)
- 腰椎骨折病人的護(hù)理ppt
- 《保障農(nóng)民工工資支付條例》口袋書課件
- 2020 新ACLS-PCSA課前自我測試-翻譯版玉二醫(yī)【復(fù)制】附有答案
- 危險化學(xué)品安全周知卡氧氣
- DB13∕T 5517-2022 大田作物病蟲草害防控關(guān)鍵期植保無人飛機(jī)作業(yè)技術(shù)規(guī)程
- 《編譯原理》考試試習(xí)題及答案(匯總)
- 贏在執(zhí)行力:團(tuán)隊(duì)執(zhí)行力-下
- 鉆孔灌注樁后注漿施工方案(最全版)
- 政工干部年度述職報告
- 1000MW電廠水處理DCS控制系統(tǒng)設(shè)計(jì)
- 硬件設(shè)計(jì)checklist
評論
0/150
提交評論