綜合變量法在多目標分層抽樣中的應用_第1頁
綜合變量法在多目標分層抽樣中的應用_第2頁
綜合變量法在多目標分層抽樣中的應用_第3頁
綜合變量法在多目標分層抽樣中的應用_第4頁
綜合變量法在多目標分層抽樣中的應用_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、綜合變量法在多指標分層抽樣中的應用摘 要本文采用綜合變量法對多目標總體進行分層抽樣,并設計了T變量作為估計量,比較了綜合變量法和簡單隨機抽樣的優(yōu)劣性。而后通過案例證明了上述結論。關鍵詞:多指標抽樣 分層抽樣 主成分分析 綜合變量法引言抽樣調查作為認識社會現(xiàn)象的工具已經得到了廣泛應用,其在政治、經濟、文化、軍事、人口等領域已經成為了廣泛使用的有效方法。并且絕大部分的抽樣調查都是希望能在一次調查中得到多個結論,因此多目標抽樣是普遍使用的方法,關于這方面的研究已經有了很多成果,但依然不能滿足現(xiàn)實的需要,所以對多目標抽樣進行研究是很有現(xiàn)實意義的。本文將在已有理論的基礎上,試圖對多目標的分層抽樣問題進行

2、研究,采用主成分方法處理輔助信息,而后用綜合變量法分層,研究該方法的性質。一、模型介紹將進行主成分變換后,計算求得綜合變量,即其中為主成分的貢獻率。以作為分層標志,進行綜合變量法分層抽樣。這種變換將原來的多指標轉換為了單指標,而后就可以用單指標的方法進行分層抽樣。層數(shù)的確定可以按照如下準則:至于分層的界限,只要滿足下面關系:就可以使達到最小?,F(xiàn)實中仍然采用戴倫紐斯和霍奇斯(Dalenius and Hodges)提出的快速近似法計算。抽樣方法若總的樣本量固定,如何把這個樣本進行分配到各層,在各層的分配取決于層的規(guī)模、層內的方差和抽樣的費用。這里只討論最優(yōu)分配,至于比例分配和內曼分配是最優(yōu)分配的

3、特例。最優(yōu)分配為確定了在各層的樣本量后,在各層的抽樣方式這里采用簡單隨機抽樣。分層抽樣中,樣本量的確定不僅取決于精度要求和費用的限制,而且取決于如何分層和樣本在各層的分配方式。這里精度要求的上限設定為,第層的每單元抽樣費用為,采用最優(yōu)分配方式下,樣本量計算公式如下:二、多目標分層抽樣估計量設計目標變量的均值估計量為,其簡單估計量為是的無偏估計量,即該估計量的方差為由于多個研究變量的量綱并不完全相同,并且的均值估計量的方差不止一個,所以不同方法求得的均值估計量的方差協(xié)方差矩陣無法進行比較,也就無法對各種抽樣設計方法進行評價和進一步研究。因此這里提出了一種解決上述問題的方法,為消除量綱影響,將均值

4、估計量的方差比上均值估計量的平方,至于多目標變量無法比較的問題,可以將消除了量綱的方差加總求和,由此定義一個新的變量。定義:在多目標抽樣中,目標變量之間量綱不同,其樣本均值的方差無法直接比較,為的變異系數(shù),將其平方求和得到值是消除了量綱影響的方差之和,它將作為多目標抽樣的精度指標。顯然,值的大小就可以說明抽樣設計效果的好壞,值越小,表明抽樣精度越高,反之,抽樣精度越低。在分層抽樣中,的表達式為:根據前面的假設條件和有關主成分分析的性質,基于主成分綜合的方法,求得的有如下性質:證明:也可以用矩陣的跡的形式來表示,即為當和極小,可以忽略時已知有 所以 證畢為了方便,下面對進行討論 綜合變量法根據上

5、面的介紹,綜合變量法是將綜合變量排序后,進行分層抽樣,分層的結果是保證了最小。即 (3.3)是最小的。在滿足什么條件時,可以采用綜合變量法抽樣,而使值達到最小??梢钥闯霎斉c成反比例關系時,采用綜合變量法抽樣會更優(yōu)。證明:對3.2式進行整理,有 (3.4)對比3.3式與3.4式,3.4式是在3.3式的基礎上加了權重。當與成反比例關系,即時,值就是綜合變量的方差的倍數(shù),可以表示為,顯見,與成反比例關系時,采用綜合變量法抽樣最優(yōu)。當與不成反比例關系時,即不全相等,此時,若采用綜合變量法進行分層,使得達到最小,不能保證值是最小的。綜上,采用綜合變量法抽樣的條件是與成反比例關系 證畢其中 ,所以,從而證

6、明了多指標情況下無論是超空間區(qū)域法還是綜合變量法分層抽樣的方差都是小于等于簡單隨機抽樣的方差。三、與簡單分層抽樣比較這里定義簡單分層抽樣為:在多指標抽樣中,只用一個指標作為抽樣標志的分層抽樣方法。這里我們假定使用作為分層標志,將樣本分為個層,其他指標的證明同理。下面將分別將此方法與超空間區(qū)域法和綜合變量法分層抽樣進行比較,比較他們在何種條件下,他們的值更小。上一節(jié)已經說明,用進行分層得到的均值估計量的分層抽樣方差為。其設計效應為簡稱為。用綜合變量法進行分層,即用作為分層標志,將樣本分為層。這種方法的設計效應為簡稱為?,F(xiàn)在分別采用簡單分層抽樣和綜合變量法抽樣,之后得到的值分別用和表示,即已知采用

7、這兩種抽樣方法計算的估計量都是的無偏估計量,即,因此,假設上式的相等,而后就可以比較和的大小。和作差有可以看出差值的大小主要取決于與的大小,而,所以上式分解為:其中,而,所以的大小并不是固定的,這要取決于每一主成分變量的設計效應,以及設計效應對應的權重(方差與均值之比)。根據經驗,在綜合變量法中,欲使的分層抽樣方差最小,被賦予較大權重的應該得到較小的設計效應。所以,與的大小應該差不多,這樣就會有由此判斷,會是更為常見的狀態(tài)。通常情況下,綜合變量法還是優(yōu)于簡單分層抽樣的,但是這個結論并不是確定的,也會有特殊情況出現(xiàn)。綜上,綜合變量法和簡單分層比較來看,在費用方面,兩種方法沒有什么區(qū)別,它們都是將

8、總體劃分成了層,而后在層中進行簡單隨機抽樣。在精度方面,綜合變量法可能會有更大的優(yōu)勢,通常情況下,綜合變量法會比簡單分層抽樣更優(yōu)。四、案例分析本文研究的兩種方法都是基于主成分綜合的,因此,首先將原數(shù)據進行主成分變換,原變量主成分變換為,表達式如下: (5-1)使用SPSS19.0對數(shù)據進行相關性分析,從表5.1可以看出指標之間存在著一定的相關性,需要通過主成分分析法將相關的指標轉換為相互獨立的指標,主成分分析得到的表5.2解釋的總方差表,這里保留了所有主成分,四個主成分的方差貢獻率分別為38.849%、24.984%、22.802%和13.366%,由表5.3成分矩陣表可以得到結果如下: (5

9、-2)由此便得到了變換之后的主成分數(shù)據。表5.1 相關系數(shù)表食品衣著居住交通和通信相關食品1.000.442.187.113衣著.4421.000.046.142居住.187.0461.000.019交通和通信.113.142.0191.000Sig.(單側)食品.000.000.000衣著.000.039.000居住.000.039.232交通和通信.000.000.232表5.2 解釋的總方差表成份初始特征值提取平方和載入合計方差的 %累積 %合計方差的 %累積 %11.55438.84938.8491.55438.84938.8492.99924.98463.833.99924.9846

10、3.8333.91222.80286.634.91222.80286.6344.53513.366100.000.53513.366100.000提取方法:主成份分析表5.3 成份矩陣表成 份1234食品.821.103-.213-.520衣著.781-.186-.343.487居住.355.789.475.162交通和通信.379-.577.723-.029提取方法:主成份分析表5.4 超空間區(qū)域法均值及比較總體均值樣本均值相對誤差(%)標準差食品6997.34 6997.770.0062651.37衣著2206.242148.96-2.5961411.33居住1980.951920.08-

11、3.0733513.61交通和通信2329.391852.00-20.4941753.25綜合變量法也是基于主成分分析的抽樣設計方法,由式5-2和表5.2中的方差貢獻率可以求出綜合變量的值,而后以作為分層標志,為方便與超空間區(qū)域法進行對比,在該方法下,將總體分為16層,臨界值同樣采用快速近似法確定,每一層的個數(shù)為,按照10%的抽樣比進行抽樣后,各層的樣本數(shù)分別為,運用SPSS19.0里的復雜抽樣功能進行一次抽樣后有表5.5所示結論。表5.5 綜合變量法均值及比較總體均值樣本均值相對誤差(%)標準差食品6997.34 7004.460.1022897.92衣著2206.242107.55-4.4

12、731693.09居住1980.951752.32-11.5411328.44交通和通信2329.391762.20-24.3491262.34五、結論本文所研究的抽樣方法是基于主成分分析方法而設計的超空間區(qū)域法和綜合變量法,介紹了兩種抽樣方法的實施過程,粗略地說明了兩種的優(yōu)勢和劣勢,為多目標分層抽樣理論提供了一個新的思路,其創(chuàng)新之處表現(xiàn)為:一、證明了W.G.Cochran的的結論在多變量抽樣中同樣有效。二、采用了多元統(tǒng)計分析中的主成分分析方法研究多目標分層抽樣。三、豐富了多目標分層抽樣方法。本文試圖將輔助信息充分利用到分層抽樣的抽樣設計階段,通過主成分變換實現(xiàn)了這一目標,取得了一定的效果,但

13、仍然存在很多未解決的問題。參考文獻1馮士雍,施錫銓.抽樣調查理論、方法與實踐M.上海:上??茖W技術出版社 ,1996,54-99.2何曉群.多元統(tǒng)計分析M.北京:中國人民大學出版社,2009,152-190.3施錫銓.抽樣調查的理論與方法M. 上海:上海財經大學出版社,1996, 44-63.4金勇進,杜子芳,蔣 妍.抽樣技術M.北京:中國人民大學出版社,2008,75-132,239-2615劉建平.輔助信息在抽樣調查中的應用模型與方法M.中國統(tǒng)計出版社,2007,89-1086劉建平,陳光慧.通過對輔助變量的線性轉化來改進比率估計M.統(tǒng)計研究,2006,69-717劉建平,陳光慧.MPPS

14、抽樣下Hansen-Hurwitz估計量的擴展J統(tǒng)計研究, 2005,50-52.8劉建平,陳光慧.輔助信息在二重抽樣中的應用J.理論新探.2006第3期,16-17.9林才生. 多目標分層次復合抽樣設計研究D.2006.10盧山.迭代方法在多目標總體抽樣調查中的應用J.統(tǒng)計研究,2005,53-5711劉建平, 陳光慧. 利用輔助信息提高事后分層估計量的精度J. 理論新探,2007.11-13.12彭念一,陳曜.對分層抽樣設計的改進J.統(tǒng)計研究,2001年第3期51-54.13龐新生.多目標雙重事后分層抽樣中輔助變量的選擇J.統(tǒng)計與信息論壇2001第45期,63-64,77.14魏利東,閏在

15、在,洪志敏.以多輔助指標線性組合為輔助信息的比估計法J.數(shù)理統(tǒng)計與管理, 2009 ,443-448.15王學民.多指標分層抽樣中樣本容量折衷分配的加權方法J.理論新探,2006,27.16王佐仁,張維群,耿宏強. 高低成本指標廣義相關下的多目標復合抽樣方法的設計與應用J. 統(tǒng)計與信息論壇,2004,22-26.17王國明,石慶焱.成本條件下多目標復合抽樣設計J.統(tǒng)計研究.2002第11期17-20.18魏航,陳沁群.多變量分層抽樣技術的改進與應用J.科學技術與工程.2010第12期2980-2983.19肖玲. 多主題分層抽樣的分層技術J.統(tǒng)計研究,1994,74-76.20俞純權. 多指標

16、目錄抽樣的排列標識與最優(yōu)分界點J.廣西商專學報,1993.21張維群. 多目標抽樣調查的模型選擇J. 統(tǒng)計理論與方法,1999,39-42.22張維群.均勻設計在多指標抽樣調查方案設計中的應用J.統(tǒng)計與信息論壇.2009, 第10 期,18-23.23曾五一.統(tǒng)計調查體系與調查方法問題研究M.中國統(tǒng)計出版社.2009,84-12224W.G. 科克倫著 張堯庭、吳輝譯.抽樣技術M. 北京:中國統(tǒng)計出版社,1985.25 Bengt Rosen. On sampling with probability proportional to size. Journal of Statistical P

17、lanning and Inference 62 (1997) 159-191.26 Kuk,A.Y.C.A .Kernel Method for Estimating Finite Population Distribution Functions Using Auxiliary Information.Biometrika.199327 Sen, P.K., 1953.On the estimate of the variance in sampling with varying probabilities. J. Indian Soc.Agricultural Statist. 5, 1

18、19127.28 Sengupta . S. 1989. On Chaos unequal probability sampling plan J. Biometrika 76: 192196.29 Wu Chang Hun, Zhang Run Chu. Empirical Likelihood Method under Stratified Random Sampling Using Auxiliary Information and the Information in the Strata Population Size. Chinese Journal of Applied Probability and Statistics V61.22 No.4 Nov.2006.30張勇,周魏,涂玉娟.MPPS 抽樣設計方差估計的比較研究J.統(tǒng)計研究,2006,(4):64-68.31虞明娟.多目標抽樣若干問題探討D.2007.1.32 On Two Different Aspects of the Representative Method: The Method of Stratified Sampling

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論