綜合變量法在多目標(biāo)分層抽樣中的應(yīng)用_第1頁(yè)
綜合變量法在多目標(biāo)分層抽樣中的應(yīng)用_第2頁(yè)
綜合變量法在多目標(biāo)分層抽樣中的應(yīng)用_第3頁(yè)
綜合變量法在多目標(biāo)分層抽樣中的應(yīng)用_第4頁(yè)
綜合變量法在多目標(biāo)分層抽樣中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、綜合變量法在多指標(biāo)分層抽樣中的應(yīng)用摘 要本文采用綜合變量法對(duì)多目標(biāo)總體進(jìn)行分層抽樣,并設(shè)計(jì)了T變量作為估計(jì)量,比較了綜合變量法和簡(jiǎn)單隨機(jī)抽樣的優(yōu)劣性。而后通過案例證明了上述結(jié)論。關(guān)鍵詞:多指標(biāo)抽樣 分層抽樣 主成分分析 綜合變量法引言抽樣調(diào)查作為認(rèn)識(shí)社會(huì)現(xiàn)象的工具已經(jīng)得到了廣泛應(yīng)用,其在政治、經(jīng)濟(jì)、文化、軍事、人口等領(lǐng)域已經(jīng)成為了廣泛使用的有效方法。并且絕大部分的抽樣調(diào)查都是希望能在一次調(diào)查中得到多個(gè)結(jié)論,因此多目標(biāo)抽樣是普遍使用的方法,關(guān)于這方面的研究已經(jīng)有了很多成果,但依然不能滿足現(xiàn)實(shí)的需要,所以對(duì)多目標(biāo)抽樣進(jìn)行研究是很有現(xiàn)實(shí)意義的。本文將在已有理論的基礎(chǔ)上,試圖對(duì)多目標(biāo)的分層抽樣問題進(jìn)行

2、研究,采用主成分方法處理輔助信息,而后用綜合變量法分層,研究該方法的性質(zhì)。一、模型介紹將進(jìn)行主成分變換后,計(jì)算求得綜合變量,即其中為主成分的貢獻(xiàn)率。以作為分層標(biāo)志,進(jìn)行綜合變量法分層抽樣。這種變換將原來的多指標(biāo)轉(zhuǎn)換為了單指標(biāo),而后就可以用單指標(biāo)的方法進(jìn)行分層抽樣。層數(shù)的確定可以按照如下準(zhǔn)則:至于分層的界限,只要滿足下面關(guān)系:就可以使達(dá)到最小。現(xiàn)實(shí)中仍然采用戴倫紐斯和霍奇斯(Dalenius and Hodges)提出的快速近似法計(jì)算。抽樣方法若總的樣本量固定,如何把這個(gè)樣本進(jìn)行分配到各層,在各層的分配取決于層的規(guī)模、層內(nèi)的方差和抽樣的費(fèi)用。這里只討論最優(yōu)分配,至于比例分配和內(nèi)曼分配是最優(yōu)分配的

3、特例。最優(yōu)分配為確定了在各層的樣本量后,在各層的抽樣方式這里采用簡(jiǎn)單隨機(jī)抽樣。分層抽樣中,樣本量的確定不僅取決于精度要求和費(fèi)用的限制,而且取決于如何分層和樣本在各層的分配方式。這里精度要求的上限設(shè)定為,第層的每單元抽樣費(fèi)用為,采用最優(yōu)分配方式下,樣本量計(jì)算公式如下:二、多目標(biāo)分層抽樣估計(jì)量設(shè)計(jì)目標(biāo)變量的均值估計(jì)量為,其簡(jiǎn)單估計(jì)量為是的無偏估計(jì)量,即該估計(jì)量的方差為由于多個(gè)研究變量的量綱并不完全相同,并且的均值估計(jì)量的方差不止一個(gè),所以不同方法求得的均值估計(jì)量的方差協(xié)方差矩陣無法進(jìn)行比較,也就無法對(duì)各種抽樣設(shè)計(jì)方法進(jìn)行評(píng)價(jià)和進(jìn)一步研究。因此這里提出了一種解決上述問題的方法,為消除量綱影響,將均值

4、估計(jì)量的方差比上均值估計(jì)量的平方,至于多目標(biāo)變量無法比較的問題,可以將消除了量綱的方差加總求和,由此定義一個(gè)新的變量。定義:在多目標(biāo)抽樣中,目標(biāo)變量之間量綱不同,其樣本均值的方差無法直接比較,為的變異系數(shù),將其平方求和得到值是消除了量綱影響的方差之和,它將作為多目標(biāo)抽樣的精度指標(biāo)。顯然,值的大小就可以說明抽樣設(shè)計(jì)效果的好壞,值越小,表明抽樣精度越高,反之,抽樣精度越低。在分層抽樣中,的表達(dá)式為:根據(jù)前面的假設(shè)條件和有關(guān)主成分分析的性質(zhì),基于主成分綜合的方法,求得的有如下性質(zhì):證明:也可以用矩陣的跡的形式來表示,即為當(dāng)和極小,可以忽略時(shí)已知有 所以 證畢為了方便,下面對(duì)進(jìn)行討論 綜合變量法根據(jù)上

5、面的介紹,綜合變量法是將綜合變量排序后,進(jìn)行分層抽樣,分層的結(jié)果是保證了最小。即 (3.3)是最小的。在滿足什么條件時(shí),可以采用綜合變量法抽樣,而使值達(dá)到最小??梢钥闯霎?dāng)與成反比例關(guān)系時(shí),采用綜合變量法抽樣會(huì)更優(yōu)。證明:對(duì)3.2式進(jìn)行整理,有 (3.4)對(duì)比3.3式與3.4式,3.4式是在3.3式的基礎(chǔ)上加了權(quán)重。當(dāng)與成反比例關(guān)系,即時(shí),值就是綜合變量的方差的倍數(shù),可以表示為,顯見,與成反比例關(guān)系時(shí),采用綜合變量法抽樣最優(yōu)。當(dāng)與不成反比例關(guān)系時(shí),即不全相等,此時(shí),若采用綜合變量法進(jìn)行分層,使得達(dá)到最小,不能保證值是最小的。綜上,采用綜合變量法抽樣的條件是與成反比例關(guān)系 證畢其中 ,所以,從而證

6、明了多指標(biāo)情況下無論是超空間區(qū)域法還是綜合變量法分層抽樣的方差都是小于等于簡(jiǎn)單隨機(jī)抽樣的方差。三、與簡(jiǎn)單分層抽樣比較這里定義簡(jiǎn)單分層抽樣為:在多指標(biāo)抽樣中,只用一個(gè)指標(biāo)作為抽樣標(biāo)志的分層抽樣方法。這里我們假定使用作為分層標(biāo)志,將樣本分為個(gè)層,其他指標(biāo)的證明同理。下面將分別將此方法與超空間區(qū)域法和綜合變量法分層抽樣進(jìn)行比較,比較他們?cè)诤畏N條件下,他們的值更小。上一節(jié)已經(jīng)說明,用進(jìn)行分層得到的均值估計(jì)量的分層抽樣方差為。其設(shè)計(jì)效應(yīng)為簡(jiǎn)稱為。用綜合變量法進(jìn)行分層,即用作為分層標(biāo)志,將樣本分為層。這種方法的設(shè)計(jì)效應(yīng)為簡(jiǎn)稱為。現(xiàn)在分別采用簡(jiǎn)單分層抽樣和綜合變量法抽樣,之后得到的值分別用和表示,即已知采用

7、這兩種抽樣方法計(jì)算的估計(jì)量都是的無偏估計(jì)量,即,因此,假設(shè)上式的相等,而后就可以比較和的大小。和作差有可以看出差值的大小主要取決于與的大小,而,所以上式分解為:其中,而,所以的大小并不是固定的,這要取決于每一主成分變量的設(shè)計(jì)效應(yīng),以及設(shè)計(jì)效應(yīng)對(duì)應(yīng)的權(quán)重(方差與均值之比)。根據(jù)經(jīng)驗(yàn),在綜合變量法中,欲使的分層抽樣方差最小,被賦予較大權(quán)重的應(yīng)該得到較小的設(shè)計(jì)效應(yīng)。所以,與的大小應(yīng)該差不多,這樣就會(huì)有由此判斷,會(huì)是更為常見的狀態(tài)。通常情況下,綜合變量法還是優(yōu)于簡(jiǎn)單分層抽樣的,但是這個(gè)結(jié)論并不是確定的,也會(huì)有特殊情況出現(xiàn)。綜上,綜合變量法和簡(jiǎn)單分層比較來看,在費(fèi)用方面,兩種方法沒有什么區(qū)別,它們都是將

8、總體劃分成了層,而后在層中進(jìn)行簡(jiǎn)單隨機(jī)抽樣。在精度方面,綜合變量法可能會(huì)有更大的優(yōu)勢(shì),通常情況下,綜合變量法會(huì)比簡(jiǎn)單分層抽樣更優(yōu)。四、案例分析本文研究的兩種方法都是基于主成分綜合的,因此,首先將原數(shù)據(jù)進(jìn)行主成分變換,原變量主成分變換為,表達(dá)式如下: (5-1)使用SPSS19.0對(duì)數(shù)據(jù)進(jìn)行相關(guān)性分析,從表5.1可以看出指標(biāo)之間存在著一定的相關(guān)性,需要通過主成分分析法將相關(guān)的指標(biāo)轉(zhuǎn)換為相互獨(dú)立的指標(biāo),主成分分析得到的表5.2解釋的總方差表,這里保留了所有主成分,四個(gè)主成分的方差貢獻(xiàn)率分別為38.849%、24.984%、22.802%和13.366%,由表5.3成分矩陣表可以得到結(jié)果如下: (5

9、-2)由此便得到了變換之后的主成分?jǐn)?shù)據(jù)。表5.1 相關(guān)系數(shù)表食品衣著居住交通和通信相關(guān)食品1.000.442.187.113衣著.4421.000.046.142居住.187.0461.000.019交通和通信.113.142.0191.000Sig.(單側(cè))食品.000.000.000衣著.000.039.000居住.000.039.232交通和通信.000.000.232表5.2 解釋的總方差表成份初始特征值提取平方和載入合計(jì)方差的 %累積 %合計(jì)方差的 %累積 %11.55438.84938.8491.55438.84938.8492.99924.98463.833.99924.9846

10、3.8333.91222.80286.634.91222.80286.6344.53513.366100.000.53513.366100.000提取方法:主成份分析表5.3 成份矩陣表成 份1234食品.821.103-.213-.520衣著.781-.186-.343.487居住.355.789.475.162交通和通信.379-.577.723-.029提取方法:主成份分析表5.4 超空間區(qū)域法均值及比較總體均值樣本均值相對(duì)誤差(%)標(biāo)準(zhǔn)差食品6997.34 6997.770.0062651.37衣著2206.242148.96-2.5961411.33居住1980.951920.08-

11、3.0733513.61交通和通信2329.391852.00-20.4941753.25綜合變量法也是基于主成分分析的抽樣設(shè)計(jì)方法,由式5-2和表5.2中的方差貢獻(xiàn)率可以求出綜合變量的值,而后以作為分層標(biāo)志,為方便與超空間區(qū)域法進(jìn)行對(duì)比,在該方法下,將總體分為16層,臨界值同樣采用快速近似法確定,每一層的個(gè)數(shù)為,按照10%的抽樣比進(jìn)行抽樣后,各層的樣本數(shù)分別為,運(yùn)用SPSS19.0里的復(fù)雜抽樣功能進(jìn)行一次抽樣后有表5.5所示結(jié)論。表5.5 綜合變量法均值及比較總體均值樣本均值相對(duì)誤差(%)標(biāo)準(zhǔn)差食品6997.34 7004.460.1022897.92衣著2206.242107.55-4.4

12、731693.09居住1980.951752.32-11.5411328.44交通和通信2329.391762.20-24.3491262.34五、結(jié)論本文所研究的抽樣方法是基于主成分分析方法而設(shè)計(jì)的超空間區(qū)域法和綜合變量法,介紹了兩種抽樣方法的實(shí)施過程,粗略地說明了兩種的優(yōu)勢(shì)和劣勢(shì),為多目標(biāo)分層抽樣理論提供了一個(gè)新的思路,其創(chuàng)新之處表現(xiàn)為:一、證明了W.G.Cochran的的結(jié)論在多變量抽樣中同樣有效。二、采用了多元統(tǒng)計(jì)分析中的主成分分析方法研究多目標(biāo)分層抽樣。三、豐富了多目標(biāo)分層抽樣方法。本文試圖將輔助信息充分利用到分層抽樣的抽樣設(shè)計(jì)階段,通過主成分變換實(shí)現(xiàn)了這一目標(biāo),取得了一定的效果,但

13、仍然存在很多未解決的問題。參考文獻(xiàn)1馮士雍,施錫銓.抽樣調(diào)查理論、方法與實(shí)踐M.上海:上??茖W(xué)技術(shù)出版社 ,1996,54-99.2何曉群.多元統(tǒng)計(jì)分析M.北京:中國(guó)人民大學(xué)出版社,2009,152-190.3施錫銓.抽樣調(diào)查的理論與方法M. 上海:上海財(cái)經(jīng)大學(xué)出版社,1996, 44-63.4金勇進(jìn),杜子芳,蔣 妍.抽樣技術(shù)M.北京:中國(guó)人民大學(xué)出版社,2008,75-132,239-2615劉建平.輔助信息在抽樣調(diào)查中的應(yīng)用模型與方法M.中國(guó)統(tǒng)計(jì)出版社,2007,89-1086劉建平,陳光慧.通過對(duì)輔助變量的線性轉(zhuǎn)化來改進(jìn)比率估計(jì)M.統(tǒng)計(jì)研究,2006,69-717劉建平,陳光慧.MPPS

14、抽樣下Hansen-Hurwitz估計(jì)量的擴(kuò)展J統(tǒng)計(jì)研究, 2005,50-52.8劉建平,陳光慧.輔助信息在二重抽樣中的應(yīng)用J.理論新探.2006第3期,16-17.9林才生. 多目標(biāo)分層次復(fù)合抽樣設(shè)計(jì)研究D.2006.10盧山.迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用J.統(tǒng)計(jì)研究,2005,53-5711劉建平, 陳光慧. 利用輔助信息提高事后分層估計(jì)量的精度J. 理論新探,2007.11-13.12彭念一,陳曜.對(duì)分層抽樣設(shè)計(jì)的改進(jìn)J.統(tǒng)計(jì)研究,2001年第3期51-54.13龐新生.多目標(biāo)雙重事后分層抽樣中輔助變量的選擇J.統(tǒng)計(jì)與信息論壇2001第45期,63-64,77.14魏利東,閏在

15、在,洪志敏.以多輔助指標(biāo)線性組合為輔助信息的比估計(jì)法J.數(shù)理統(tǒng)計(jì)與管理, 2009 ,443-448.15王學(xué)民.多指標(biāo)分層抽樣中樣本容量折衷分配的加權(quán)方法J.理論新探,2006,27.16王佐仁,張維群,耿宏強(qiáng). 高低成本指標(biāo)廣義相關(guān)下的多目標(biāo)復(fù)合抽樣方法的設(shè)計(jì)與應(yīng)用J. 統(tǒng)計(jì)與信息論壇,2004,22-26.17王國(guó)明,石慶焱.成本條件下多目標(biāo)復(fù)合抽樣設(shè)計(jì)J.統(tǒng)計(jì)研究.2002第11期17-20.18魏航,陳沁群.多變量分層抽樣技術(shù)的改進(jìn)與應(yīng)用J.科學(xué)技術(shù)與工程.2010第12期2980-2983.19肖玲. 多主題分層抽樣的分層技術(shù)J.統(tǒng)計(jì)研究,1994,74-76.20俞純權(quán). 多指標(biāo)

16、目錄抽樣的排列標(biāo)識(shí)與最優(yōu)分界點(diǎn)J.廣西商專學(xué)報(bào),1993.21張維群. 多目標(biāo)抽樣調(diào)查的模型選擇J. 統(tǒng)計(jì)理論與方法,1999,39-42.22張維群.均勻設(shè)計(jì)在多指標(biāo)抽樣調(diào)查方案設(shè)計(jì)中的應(yīng)用J.統(tǒng)計(jì)與信息論壇.2009, 第10 期,18-23.23曾五一.統(tǒng)計(jì)調(diào)查體系與調(diào)查方法問題研究M.中國(guó)統(tǒng)計(jì)出版社.2009,84-12224W.G. 科克倫著 張堯庭、吳輝譯.抽樣技術(shù)M. 北京:中國(guó)統(tǒng)計(jì)出版社,1985.25 Bengt Rosen. On sampling with probability proportional to size. Journal of Statistical P

17、lanning and Inference 62 (1997) 159-191.26 Kuk,A.Y.C.A .Kernel Method for Estimating Finite Population Distribution Functions Using Auxiliary Information.Biometrika.199327 Sen, P.K., 1953.On the estimate of the variance in sampling with varying probabilities. J. Indian Soc.Agricultural Statist. 5, 1

18、19127.28 Sengupta . S. 1989. On Chaos unequal probability sampling plan J. Biometrika 76: 192196.29 Wu Chang Hun, Zhang Run Chu. Empirical Likelihood Method under Stratified Random Sampling Using Auxiliary Information and the Information in the Strata Population Size. Chinese Journal of Applied Probability and Statistics V61.22 No.4 Nov.2006.30張勇,周魏,涂玉娟.MPPS 抽樣設(shè)計(jì)方差估計(jì)的比較研究J.統(tǒng)計(jì)研究,2006,(4):64-68.31虞明娟.多目標(biāo)抽樣若干問題探討D.2007.1.32 On Two Different Aspects of the Representative Method: The Method of Stratified Sampling

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論