版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
美國人口普查后獨(dú)立組織一次調(diào)查估計(jì)覆蓋誤差率的估計(jì)
0全國真實(shí)人口數(shù)字與全國普查數(shù)字的差分離為了評(píng)估人類普查的質(zhì)量,人們通常應(yīng)在進(jìn)行人口普查后,注意進(jìn)行目的是評(píng)估人類普查質(zhì)量的調(diào)查。根據(jù)本研究的結(jié)果,計(jì)算人類普查數(shù)據(jù)的誤差率,即國家的實(shí)際人口數(shù)字與國家的實(shí)際人口數(shù)字之間的差異,以及該國的實(shí)際人口數(shù)字。那么怎樣得到“真實(shí)人口數(shù)”呢?目前的做法是,在人口普查的事后質(zhì)量檢查中抽取樣本,在樣本中追溯人口普查時(shí)點(diǎn)的人口數(shù)并將其與每一樣本單位在人口普查時(shí)登記的人口數(shù)兩套資料結(jié)合在一起來構(gòu)造全國“真實(shí)人口數(shù)”的估計(jì)量,稱之為“雙系統(tǒng)估計(jì)量”。本文將解讀美國2000年人口普查以及即將到來的2010年人口普查中應(yīng)用“雙系統(tǒng)估計(jì)量”進(jìn)行普查質(zhì)量評(píng)估的做法,以期對(duì)我國這方面的工作提供參考。1“恢復(fù)和恢復(fù)”模型的應(yīng)用于人口研究的基本概念1.1多次捕撈的樣品的估計(jì)“雙系統(tǒng)估計(jì)量”是依據(jù)“捕獲-再捕獲”模型構(gòu)造的?!安东@-再捕獲”模型敘述的是:我們想要知道一個(gè)封閉的魚塘中有多少條魚,為此,先做一次隨機(jī)的捕撈,把捕到的每一條魚都做上記號(hào),然后把它們放回魚塘,充分混勻后,再做一次隨機(jī)捕撈,清點(diǎn)此次所捕的魚中有多少條是做上記號(hào)的,用這些數(shù)據(jù)便可得到對(duì)魚塘中魚的數(shù)目的估計(jì)。假若兩次捕撈的結(jié)果如表1:用上面的數(shù)據(jù)得到魚的數(shù)目N的估計(jì)為280-288由式(1)給出的估計(jì)量是多項(xiàng)分布未知參數(shù)的一個(gè)極大似然估計(jì)量。在這里,未知參數(shù)是樣本量N,所依據(jù)的多項(xiàng)分布樣本數(shù)據(jù)是一個(gè)不完備四格表(缺少x22)。既然“捕獲-再捕獲”問題引用了多項(xiàng)分布的估計(jì)量,那么,“捕獲-再捕獲”的實(shí)際行為就應(yīng)當(dāng)符合多項(xiàng)分布的試驗(yàn)背景。這主要包括以下要點(diǎn):第一,每一次捕撈,必須要保證魚塘里所有的魚都有可能被捕到,并且有相等的被捕到的概率。第二,魚塘中的每條魚進(jìn)入表1同一個(gè)格子的概率相等,進(jìn)入不同格子的概率不一定相同。第三,魚塘封閉。即魚塘中的魚不會(huì)增加也不會(huì)減少。第四,兩次捕撈相互獨(dú)立。1.2做到根據(jù)一個(gè)國家的人口中有小數(shù)構(gòu)造全國人口數(shù)字的雙系統(tǒng)估計(jì)量的基本思路是,把人口普查時(shí)對(duì)人口的登記看作第一次捕撈,把事后質(zhì)量檢查時(shí)對(duì)人口普查時(shí)點(diǎn)上人口的追溯登記看作第二次捕撈,把在兩次登記中都出現(xiàn)的人口看作第二次捕到的做上記號(hào)的魚,把總體真實(shí)人口數(shù)看作魚塘中魚的數(shù)目。然而,一個(gè)國家的人口與一個(gè)魚塘中的魚是顯然有不小的差別的。怎樣使人口調(diào)查滿足“捕獲-再捕獲”模型的理論要求呢?1.2.1ccm方法“捕獲-再捕獲”模型要求所有的魚具有相同的被捕到的概率。然而,不同的人口在人口普查中(以及事后質(zhì)量檢查中)被登記的概率并不相同,例如,老人和兒童被登記的概率與勞動(dòng)年齡的人口被登記的概率就不相同,前者要比后者大。這樣,“捕獲-再捕獲”模型的理論要求便不能得到滿足。怎樣解決這個(gè)問題呢?美國2000年人口普查事后質(zhì)量檢查中是這樣做的:把人口總體按照每個(gè)人被登記概率的不同來分層,劃分成若干個(gè)“子總體”,分別在一個(gè)個(gè)“子總體”中應(yīng)用“捕獲-再捕獲”模型。在實(shí)際操作中,這件分層的事情是在事后質(zhì)量檢查的樣本被抽出后,在樣本中進(jìn)行的,所以叫做“事后分層”。在美國2000年人口普查事后質(zhì)量檢查實(shí)施方案中選擇了7個(gè)與被登記概率有關(guān)的標(biāo)志,用這7個(gè)標(biāo)志做交叉分層,形成了416個(gè)事后層。對(duì)樣本做事后分層,實(shí)際上相當(dāng)于對(duì)總體進(jìn)行了相應(yīng)的分層。由于調(diào)查工作是在各州分別進(jìn)行的,所以,實(shí)際上是在每一個(gè)州,把全州人口總體劃分為416個(gè)層(后面把其中的某一層記做v層)。美國2000年人口普查事后質(zhì)量檢查實(shí)施方案命名為ACE方案。ACE的英文全文是AccuracyandCoverageEvaluation。在這里,“Coverage”的本意是“覆蓋”。將其用于人口統(tǒng)計(jì)的時(shí)候,意思是什么呢?文獻(xiàn)中指出,在人口統(tǒng)計(jì)中,“Coverage”是當(dāng)人們談到對(duì)“人頭”計(jì)數(shù)的準(zhǔn)確性方面存在的諸如計(jì)數(shù)不足、額外計(jì)數(shù)以及人口成員缺失等等錯(cuò)誤的時(shí)候所使用的一個(gè)人口統(tǒng)計(jì)學(xué)的一般術(shù)語。所以,筆者認(rèn)為,把它翻譯成“計(jì)數(shù)覆蓋正確性”可能比較合適。事后分層方法在實(shí)際應(yīng)用中有明顯的局限性:由于每增加一個(gè)分層標(biāo)志就會(huì)將每一個(gè)事后層的樣本量減少一半,因而,分層標(biāo)志不能選得太多,否則,在一定的樣本量下,可能會(huì)導(dǎo)致有的事后層樣本量過少甚至沒有樣本單位。在此種限制下,一些重要的分層標(biāo)志不得不被舍棄(例如,地方政府對(duì)待人口普查的態(tài)度無疑會(huì)影響居民被登記的概率,ACE方案不得已把它舍掉了)。針對(duì)這個(gè)缺點(diǎn),美國2010年人口普查事后質(zhì)量檢查實(shí)施方案(命名為CCM方案,CCM的英文全文是CensusCoverageMeasurement)設(shè)計(jì)了用羅吉斯蒂回歸模型來實(shí)現(xiàn)事后分層目標(biāo)的方法:把我們選擇的事后分層標(biāo)志全部設(shè)置為羅吉斯蒂回歸模型的自變量,該多元自變量的一個(gè)值等同于這些變量交叉分層體系下的一個(gè)組格(一個(gè)事后層)。羅吉斯蒂回歸方法與直接進(jìn)行事后分層相比,優(yōu)越性在于:它可以不受樣本量的限制選擇較多的變量;它可以直接使用連續(xù)型變量(而不必要將其降級(jí)為分類變量)。1.2.2考慮未來克氏原螯蝦人口密度與普查時(shí)正確登記的人數(shù)的雙系統(tǒng)估計(jì)量模型人口普查的事后質(zhì)量檢查工作是抽取樣本來進(jìn)行的?,F(xiàn)在,為便于說明問題,我們暫時(shí)先假定人口普查的事后質(zhì)量檢查工作是重新對(duì)全國所有的普查小區(qū)作調(diào)查,調(diào)查內(nèi)容是追溯它們在普查時(shí)點(diǎn)上的人口數(shù)。現(xiàn)在,(拿美國2000年ACE調(diào)查來說)州的某一個(gè)事后層相當(dāng)于一個(gè)魚塘。文獻(xiàn)(7.1-7.2)中給出了與“捕獲-再捕獲”模型式(1)相對(duì)應(yīng)的(州的)v事后層真實(shí)人口數(shù)目估計(jì)量的概念性結(jié)構(gòu)式為式(2)中,“普查時(shí)正確登記人數(shù)”不同于“普查登記人數(shù)”。從后者中剔除了錯(cuò)誤登記人數(shù)之后才是前者。所謂錯(cuò)誤登記人數(shù)是指,重復(fù)登記人數(shù),本不應(yīng)登記卻進(jìn)行了登記的人數(shù)(如,在普查時(shí)點(diǎn)以后出生卻被登記為普查時(shí)點(diǎn)人口的人數(shù)),等等。之所以在式(2)中不使用“普查登記人數(shù)”而使用“普查時(shí)正確登記人數(shù)”,是因?yàn)?在“鋪獲-再捕獲”模型中只有遺漏(未被捕到)問題,而不會(huì)出現(xiàn)錯(cuò)誤登記問題。美國2010年CCM方案所構(gòu)造的仍然是基于“捕獲-再捕獲”模型的雙系統(tǒng)估計(jì)量。在該方案所用的羅吉斯蒂回歸方法中,首先分別以每一個(gè)個(gè)人在普查中被正確登記的概率以及在事后質(zhì)量檢查中被觀察到并且同時(shí)在普查中被正確登記的概率(稱之為匹配概率)為因變量建立兩個(gè)羅吉斯蒂回歸模型(自變量是我們選出的影響登記概率的若干個(gè)因素)?,F(xiàn)在我們暫時(shí)假定建立模型所依據(jù)的樣本是全國人口的每一個(gè)人(實(shí)際操作中當(dāng)然只能使用從中抽出的一個(gè)概率樣本,不過,那是后話)。依據(jù)樣本,可以獲得這兩個(gè)模型參數(shù)的估計(jì)。這樣,就得到了兩個(gè)預(yù)測模型。把某人的諸自變量取值代入預(yù)測模型,可計(jì)算出在普查中正確登記的概率的模型預(yù)測值(記作πce(j))以及匹配概率(記作πm(j))的模型預(yù)測值。模型預(yù)測值是諸自變量取該種值條件下所論概率的數(shù)學(xué)期望值。由文獻(xiàn)(89-90),寫出CCM方案下全國真實(shí)人口數(shù)目估計(jì)量的概念性結(jié)構(gòu)式如下:式(3)中,CDD是普查中所有符合普查數(shù)據(jù)定義者人數(shù)。所謂“符合普查數(shù)據(jù)定義的人”指的是至少填寫了人口普查表所有調(diào)查項(xiàng)目(姓名、性別、種族、年齡、拉美血統(tǒng)、與戶主的關(guān)系)中的兩個(gè)的人。式(3)中πce(j)和πm(j)的下標(biāo)ce是CorrectEnumeration的縮寫,翻譯為“正確計(jì)數(shù)”,下標(biāo)m是Match的縮寫,翻譯為“匹配”,下標(biāo)j表示“第j人”?,F(xiàn)在來解讀式(3)與式(2)的聯(lián)系。πce(j)和πm(j)是兩個(gè)個(gè)人行為概率的期望值,它們也就是j人所應(yīng)該歸屬的事后層(層標(biāo)記作v)的層概率。用整個(gè)人口總體來估計(jì)這兩個(gè)概率,寫出(我們略去估計(jì)量的記號(hào))于是,式(3)可以寫做式(6)∑υ內(nèi)是v層的真實(shí)人口數(shù)的估計(jì)量,它和式(2)是一致的。2利用錯(cuò)誤進(jìn)行人口普查的事后質(zhì)量檢查是從總體的街區(qū)群中抽取概率樣本來進(jìn)行的。為解讀后面的計(jì)算公式,必須要了解ACE和CCM中的抽樣設(shè)計(jì),因?yàn)?公式中要用到的樣本單位進(jìn)入樣本的概率是同它被抽取的過程緊密聯(lián)系在一起的。2.12樣本設(shè)計(jì)1000年4月美國有50個(gè)州,外加哥倫比亞特區(qū),相當(dāng)于共有51個(gè)州。在每一個(gè)州,分別獨(dú)立抽取樣本。各自都是實(shí)行三步抽樣。2.1.1采用獨(dú)立的安于基層街區(qū)群的街區(qū)群對(duì)州內(nèi)的全體街區(qū)群,按其規(guī)模(大、中、小)分層(另外單列“由美洲印第安人居留地街區(qū)群組成的層”)。在每一個(gè)抽樣層,分別使用等概率等距(視作簡單隨機(jī))抽樣方式以街區(qū)群為單位抽取樣本。2.1.2街區(qū)群層的劃分在第一步抽樣所得到的樣本的各層中,分別作不同的進(jìn)一步分層:在中型街區(qū)群層、大型街區(qū)群層中進(jìn)一步將街區(qū)群劃分為6個(gè)層;在小型街區(qū)群層中進(jìn)一步將街區(qū)群劃分為9個(gè)層;在“由美洲印第安人居留地街區(qū)群組成的層”中不再進(jìn)一步分層。在經(jīng)過細(xì)分后的每一個(gè)抽樣層,分別使用等概率等距(視作簡單隨機(jī))抽樣方式以街區(qū)群為單位抽取樣本。2.1.3研究樣本的獲取在進(jìn)行第三步抽樣的操作之前,先在州的范圍內(nèi)將第二步樣本中的街區(qū)群劃分為7個(gè)層。另外,每一個(gè)街區(qū)群都有一份在普查時(shí)登記的居住單位地址目錄,將其稱作E樣本;與此平行地,在ACE第一、二步樣本抽出后,要對(duì)每個(gè)街區(qū)群中的居住地址進(jìn)行調(diào)查,調(diào)查內(nèi)容是對(duì)普查時(shí)在該地址居住的居住單位進(jìn)行回溯性登記(若居住單位現(xiàn)在已經(jīng)遷移,則由鄰居代為登記),最后形成一份與E樣本獨(dú)立的居住單位ACE地址目錄,稱之為P樣本。第三步抽樣視街區(qū)群規(guī)模大小做不同的處理。判定街區(qū)群規(guī)模大小,以ACE調(diào)查編制的居住單位地址目錄(即P樣本)為準(zhǔn)。2.1.3.1個(gè)居住區(qū)組的單位數(shù)不超過80個(gè),p樣本區(qū)單位數(shù)量不足80個(gè)此時(shí)不再進(jìn)行第三步抽樣。2.1.3.2號(hào)區(qū)組的單位數(shù)超過80個(gè)單位此時(shí),先從P樣本中抽取子樣本,然后,再產(chǎn)生E樣本的子樣本。(1)小區(qū)群內(nèi)片劃分的數(shù)和精密度為實(shí)施抽取P樣本子樣本的操作,先在P樣本居住單位名單的單位數(shù)目均超過80的街區(qū)群(今后簡稱為“大街區(qū)群”)內(nèi)將居住單位劃分為“片”?!捌庇纱蠼謪^(qū)群內(nèi)鄰近的若干居住單位組成,片的劃分分別在各個(gè)大街區(qū)群內(nèi)單獨(dú)進(jìn)行。劃分片的時(shí)候,首先分別在各個(gè)大街區(qū)群內(nèi)計(jì)算需要?jiǎng)澐值钠臄?shù)目(在某個(gè)大街區(qū)群內(nèi)計(jì)算這個(gè)數(shù)目的方法是:把中型街區(qū)群的居住單位通過各個(gè)抽樣步驟以后的總抽樣比率作為大街區(qū)群的總抽樣比率的標(biāo)準(zhǔn),用以推算在該大街區(qū)群第三步抽樣應(yīng)當(dāng)抽取的居住單位數(shù)目,再將所得結(jié)果除以該街區(qū)群P樣本居住單位名單的單位數(shù)目得到該大街區(qū)群第三步抽樣需要的抽樣比率,如果它小于0.5那末它的倒數(shù),如果它大于0.5那末用1減去它之后的倒數(shù),便是在該大街區(qū)群內(nèi)需要?jiǎng)澐值钠臄?shù)目);然后分別將各個(gè)大街區(qū)群P樣本居住單位名單的單位數(shù)目除以該街區(qū)群內(nèi)需要?jiǎng)澐值钠臄?shù)目,得到各街區(qū)群各自需要?jiǎng)澐值钠瑧?yīng)包含的居住單位數(shù)目。最后,分別在各街區(qū)群內(nèi)用圖上作業(yè)與現(xiàn)場勘查相結(jié)合的方法具體進(jìn)行片的劃分。顯然,各街區(qū)群中,片的大小是不一樣的。以州為范圍,分別在事先劃分的7個(gè)抽樣層中,分層獨(dú)立以片為單位,等概率等距抽取樣本(注意,抽樣操作是在整個(gè)層中而不是在街區(qū)群中進(jìn)行)。這樣,便得到了全州的大街區(qū)群P樣本的子樣本。(2)是否與ad名單有連接的普登記居住單位的片當(dāng)州內(nèi)各個(gè)大街區(qū)群完成了劃分片的操作之后,每個(gè)街區(qū)群中E樣本的居住單位(也就是普查登記的居住單位)應(yīng)當(dāng)相應(yīng)地分別納入適當(dāng)?shù)钠?。用圖上作業(yè)與現(xiàn)場勘查相結(jié)合的方法將普查登記的居住單位名單與ACE登記的居住單位名單相比對(duì),會(huì)發(fā)現(xiàn)普查登記的居住單位名單中的居住單位有兩種情形。一種情形是:有些居住單位在ACE登記的居住單位名單中也可以找到它們,稱這些居住單位與ACE名單有連接;另一種情形是:有些居住單位在ACE名單中找不到它們,稱這些居住單位與ACE名單無連接。顯然,與ACE名單有連接的那些普查登記居住單位,順理成章地進(jìn)入與之相連接的ACE居住單位所在的片。至于與ACE名單無連接的那些普查登記居住單位,為了將它們各自納入適當(dāng)?shù)钠?首先對(duì)所有的普查登記居住單位(包括與ACE有連接的單位)按普查區(qū)代號(hào)、街道名稱、房屋號(hào)碼(或普查區(qū)代號(hào)、地理位置)分類,于是,無連接單位便隨同本類中的有連接單位進(jìn)入其所在的片。大街區(qū)群P樣本的子樣本抽出之后,所抽中的片中已被納入的普查登記居住單位便成為E樣本的子樣本。偶爾會(huì)有這樣的情況,在一個(gè)街區(qū)群中被選的片(一個(gè)或多個(gè))里面的與ACE名單無連接的普查登記居住單位的數(shù)目超過了80,此時(shí),進(jìn)一步從中(用等概率等距方式)抽取40個(gè)居住單位作為E樣本的最終的子樣本。這里,用40作為進(jìn)一步的次級(jí)抽樣所用樣本量的前提是:這個(gè)進(jìn)一步的次級(jí)抽樣的抽樣比率大于25%。為了避免抽樣權(quán)數(shù)的過大變化,規(guī)定這個(gè)進(jìn)一步的次級(jí)抽樣的抽樣比率不得低于25%。如果在某一個(gè)街區(qū)群,按照這個(gè)規(guī)定算出的需要抽取的進(jìn)一步的次級(jí)樣本的樣本量大于40,那么,就把這個(gè)街區(qū)群中所有的(不只是被抽出的片的)與ACE名單有連接的普查登記居住單位作為由該街區(qū)群所產(chǎn)生的E樣本的子樣本,同時(shí)刪去在該街區(qū)群中被選的片里面的與ACE名單無連接的普查登記居住單位。2.1.4e樣本的界定今后稱樣本中ACE居住單位為P樣本居住單位,稱樣本中普查登記居住單位為E樣本居住單位。嚴(yán)格地說,P樣本指的是整個(gè)有限總體的ACE調(diào)查(假定進(jìn)行了全面調(diào)查)居住單位,E樣本指的是整個(gè)有限總體的普查登記居住單位,它們是無限超總體的隨機(jī)樣本。現(xiàn)在這里所說的樣本是有限總體的概率樣本,應(yīng)該叫做P樣本、E樣本的子樣本(有限總體概率抽樣中第二步、第三步抽樣所得到的次級(jí)樣本則應(yīng)叫做次級(jí)子樣本)。我們?yōu)榱吮阌跀⑹?把有限總體概率樣本簡單地叫做“P樣本”、“E樣本”。式中在各步抽樣中的概率的計(jì)算,須根據(jù)所論各個(gè)居住單位被施行的不盡相同的具體抽樣操作來具體考慮。2.22各州的測算、分配和抽樣美國2010年CCM方案采用與2000年ACE方案基本相同的抽樣設(shè)計(jì),在樣本量的測算、樣本量在各州之間的分配、樣本的抽取過程等這幾個(gè)方面各自與2000年方案都僅僅有一些微小的差別。其中,關(guān)于樣本的抽取過程,2010年CCM方案中對(duì)大型和中型街區(qū)群取消了第二個(gè)抽樣步驟,對(duì)小型街區(qū)群則保留了第二個(gè)抽樣步驟。3采用有限概率模型進(jìn)行估計(jì)3.1限系統(tǒng)的估計(jì)美國2000年ACE方案所作的設(shè)計(jì)是:在經(jīng)過事后分層的有限總體概率樣本的每一個(gè)事后層構(gòu)造雙系統(tǒng)估計(jì)量;再將每一個(gè)事后層合成來估計(jì)整個(gè)州(或州中的縣、普查制表區(qū)、街區(qū))的真實(shí)人口數(shù);在此基礎(chǔ)上估計(jì)人口普查凈遺漏率(或凈重復(fù)率)。3.1.1在“創(chuàng)普”的基礎(chǔ)上增加了“普式(2)給出了(州的)v事后層真實(shí)人口數(shù)數(shù)字的雙系統(tǒng)估計(jì)量的概念性結(jié)構(gòu)式。下面用普查以及ACE調(diào)查的有關(guān)統(tǒng)計(jì)指標(biāo)把式(2)進(jìn)一步具體化。一個(gè)普查小區(qū)在普查時(shí)點(diǎn)與進(jìn)行事后質(zhì)量檢查時(shí)這段時(shí)間內(nèi)人口狀態(tài)可能會(huì)有變化:一些人在這個(gè)期間內(nèi)從外部移入本小區(qū)(稱作向內(nèi)移動(dòng)者);另外一些人在這個(gè)期間內(nèi)從本小區(qū)移出(稱作向外移動(dòng)者);還有一些人始終屬于本小區(qū)(稱作無移動(dòng)者)。顯然,式(2)中分式的分子“事后質(zhì)量檢查時(shí)追溯的普查時(shí)點(diǎn)人數(shù)”應(yīng)當(dāng)是“無移動(dòng)者人數(shù)+向外移動(dòng)者人數(shù)”。但是,向外移動(dòng)者的信息若由他所在原居住地的鄰居來提供,難免會(huì)有偏差,到他的遷入地去核實(shí)又不方便,因此,一個(gè)普查小區(qū)的向外移動(dòng)者人數(shù)往往不準(zhǔn)確。為了回避這個(gè)缺陷,美國ACE方案規(guī)定用“向內(nèi)移動(dòng)者人數(shù)”代替“向外移動(dòng)者人數(shù)”。這種代替在全國范圍內(nèi)來看是合理的,因?yàn)?若把“出國”這類向外移動(dòng)者忽略不計(jì),那末,全國總計(jì)的“向內(nèi)移動(dòng)者人數(shù)”與“向外移動(dòng)者人數(shù)”是相等的。與分子相對(duì)應(yīng),分母自然應(yīng)該是“無移動(dòng)者中與普查登記匹配的人數(shù)+向內(nèi)移動(dòng)者中與普查登記匹配的人數(shù)”。但是,這里的第二項(xiàng)其實(shí)沒有數(shù)據(jù),因?yàn)?在進(jìn)行普查登記時(shí),向內(nèi)移動(dòng)者們還沒有來到本小區(qū)。為解決這個(gè)問題,美國方案規(guī)定用“向外移動(dòng)者的匹配率”來推算這里所需要的數(shù)字。即,“向內(nèi)移動(dòng)者中與普查登記匹配的人數(shù)”等于“向外移動(dòng)者中與普查登記匹配的人數(shù)”與“向外移動(dòng)者人數(shù)”的比值乘以“向內(nèi)移動(dòng)者人數(shù)”。于是,式(2)就變成了下面的式(9)。式(9)等號(hào)右邊的各項(xiàng),是人口有限總體的總體值,它們其實(shí)都是不知道的?,F(xiàn)在抽取了有限總體的一個(gè)概率樣本,那么,就用概率樣本來估計(jì)式(9)中有限總體的各個(gè)總體值。首先構(gòu)造“v層人口總體普查時(shí)正確登記的人數(shù)”的比估計(jì)量。即其次,式(9)等號(hào)右邊的其他各項(xiàng)也都改為用有限總體概率樣本構(gòu)造的估計(jì)量。于是,式(9)改變?yōu)橄旅娴氖?11)。式(11)中包含有7個(gè)估計(jì)量,它們都是總體總值估計(jì)量,有共同的構(gòu)造形式。假若把h層的一個(gè)街區(qū)群在其中被劃分的事后層v觀察到的標(biāo)志值記為yvhi(對(duì)于大型街區(qū)群,進(jìn)行了以居住單位“片”為抽樣單位的第三步抽樣,那么,這里的yvhi表示用本街區(qū)群第三步樣本構(gòu)造的本街區(qū)群總值的估計(jì)量),ACE方案給出了事后層v的總體總值(指雙系統(tǒng)估計(jì)量中7個(gè)組成部分中的某一個(gè))的下列線性估計(jì)量:式(12)中,v表示某一個(gè)事后層;h表示在抽取第一步樣本時(shí)以街區(qū)群為單位事先劃分的抽樣層;g表示在總體的每一個(gè)h層內(nèi)以街區(qū)群為單位進(jìn)一步劃分的抽樣層(劃分的方法如第二步抽樣時(shí)的分層設(shè)計(jì));i是街區(qū)群的代號(hào);nh是第一步抽樣時(shí)在h層抽出的樣本街區(qū)群數(shù);xhg指示nh樣本中被分入g層的那些街區(qū)群(稱之為“示性因子”,單位屬于所指示的情況取1,否則取0);Ihgi也是示性因子,它指示nh樣本中被分入g層的街區(qū)群中進(jìn)一步被抽入第二步樣本的那些街區(qū)群;αhgi是抽樣權(quán),它的表達(dá)式為式(13)中第一個(gè)因子Whi是層h的街區(qū)群i被抽入第一步樣本的概率的倒數(shù),第二個(gè)因子的分子是層h的街區(qū)群被抽入第一步樣本的數(shù)目總體值的估計(jì)量,第二個(gè)因子的分母是層h的街區(qū)群被抽入第二步樣本的數(shù)目總體值的估計(jì)量,分子與分母之比是層h的街區(qū)群i在被抽入第一步樣本的條件下被抽入第二步樣本的概率的倒數(shù),兩個(gè)因子的乘積是層h的街區(qū)i被抽入第二步樣本的總概率的倒數(shù);總之,式(12)等號(hào)右邊的第一項(xiàng)是依照街區(qū)群被觀察到的標(biāo)志值yvhi計(jì)算的事后層v的某種(雙系統(tǒng)估計(jì)量中7個(gè)組成部分中的某一個(gè))總體總值的估計(jì)量。在ACE方案中規(guī)定,假若在人口普查時(shí)把屬于本街區(qū)群的一個(gè)居住單位錯(cuò)誤地登記在相鄰的另外街區(qū)群,或是把屬于相鄰街區(qū)群的一個(gè)居住單位錯(cuò)誤地登記在本街區(qū)群,都不算作普查錯(cuò)誤。為此,在完成了第二步抽樣之后,要抽選樣本中的一些街區(qū)群,在這些街區(qū)群的相鄰區(qū)域?qū)ふ沂欠裼猩鲜銮闆r。這種工作被稱之為“目標(biāo)延伸搜索”。在ACE方案中,把全國進(jìn)入第二步樣本的11303個(gè)街區(qū)群劃分成三個(gè)部分(子群),用c表示。其中,c=1子群不進(jìn)行目標(biāo)延伸搜索;c=3子群全體進(jìn)行目標(biāo)延伸搜索;c=2子群抽取一部分街區(qū)群進(jìn)行目標(biāo)延伸搜索(這三個(gè)子群已經(jīng)打破了h層、g層的界限,不是它們的次級(jí)層)。式(12)等號(hào)右邊第二項(xiàng)中,Δvhi是h層的一個(gè)街區(qū)群在其中被劃分的事后層v進(jìn)行了目標(biāo)延伸搜索以后的校正量;shic是nh樣本中i街區(qū)群是否屬于c=2子群(或c=3子群)的示性因子,αhic是nh樣本中i街區(qū)群能否被選為進(jìn)行目標(biāo)延伸搜索的示性因子,通過這兩個(gè)示性因子,使得式(12)等號(hào)右邊第二項(xiàng)僅僅是對(duì)整個(gè)總體(某一個(gè)州)第二步樣本中進(jìn)入目標(biāo)延伸搜索的街區(qū)群標(biāo)志值求和;是i街區(qū)群在進(jìn)入第二步樣本且屬于c子群條件下進(jìn)入目標(biāo)延伸搜索的概率的倒數(shù),它的表達(dá)式為式(14)的分子是總體(某一個(gè)州)中進(jìn)入第二步樣本且屬于某一個(gè)c子群的街區(qū)群的數(shù)目,分母是總體(某一個(gè)州)中進(jìn)入第二步樣本屬于某一個(gè)c子群的街區(qū)群中被選進(jìn)行目標(biāo)延伸搜索的街區(qū)群的數(shù)目;總之,式(12)等號(hào)右邊第二項(xiàng)是進(jìn)行目標(biāo)延伸搜索工作之后事后層v的某種總體總值校正量的估計(jì)量。利用式(12)分別算出事后層v的雙系統(tǒng)估計(jì)量中7個(gè)組成部分的估計(jì)值,將它們代入式(11),便得到(州的)v事后層真實(shí)人口數(shù)的雙系統(tǒng)估計(jì)值。在ACE方案中,式(11)方差的近似估計(jì)是用大折刀方法給出的?!按笳鄣丁狈椒ǖ囊话愠绦蚴?將計(jì)算估計(jì)量所用的樣本隨機(jī)地劃分成單位數(shù)目相同的K個(gè)組,輪流地從樣本中切掉一個(gè)組k(k=1,2,…,K),用剩余的樣本單位依照與相同的計(jì)算公式計(jì)算估計(jì)量,全部操作完成之后用下面的公式計(jì)算方差的估計(jì)量:其中的定義為ACE方案中,第一級(jí)樣本的樣本量29136個(gè)街區(qū)群,在使用“大折刀”方法時(shí)將樣本劃分了K=29136個(gè)組,每組1個(gè)街區(qū)群。每一次切除一個(gè)組(第一步樣本的1個(gè)街區(qū)群)之后,用余下的K-1個(gè)街區(qū)群計(jì)算(復(fù)制)式(12)得到式(11)中所需要的7個(gè)估計(jì)量,然后將復(fù)制結(jié)果代入式(11),算出(復(fù)制出)在該次切除條件下的式(11)的值,就是式(16)中的。關(guān)于計(jì)算的更詳細(xì)的問題,可閱讀文獻(xiàn)(7.14-7.16)。3.1.2合成法修正估計(jì)值的計(jì)算ACE方案設(shè)計(jì)的把事后層的估計(jì)合成為某一級(jí)別區(qū)域(州、縣、普查制表區(qū)、街區(qū))估計(jì)量的方法如下:首先,用式(11)所給出的“真實(shí)人口數(shù)字”估計(jì)量計(jì)算事后層v的州一級(jí)的“人口普查數(shù)字修正因子”。它是:ACE方案在進(jìn)行區(qū)域人口數(shù)字估計(jì)的時(shí)候,假定同一個(gè)事后層的各個(gè)街區(qū)“人口普查數(shù)字修正因子”相同。在此假定下,事后層v的州、各個(gè)縣、各個(gè)普查制表區(qū)、各個(gè)街區(qū)的“人口普查數(shù)字修正因子”統(tǒng)一都是由式(17)計(jì)算出來的同一個(gè)值,今后統(tǒng)稱為“事后層v的人口普查數(shù)字修正因子”。然后,用事后層v的上述“人口普查數(shù)字修正因子”估計(jì)值推出該事后層州、各個(gè)縣、各個(gè)普查制表區(qū)、各個(gè)街區(qū)的“真實(shí)人口數(shù)字”的估計(jì)值(稱之為“合成法修正估計(jì)值”)。計(jì)算公式為:最后,把用式(18)得出的州的、某縣的、某普查制表區(qū)的、某街區(qū)的所有事后層的計(jì)算結(jié)果相加匯總,便得出“整個(gè)州、州中某縣、州中某普查制表區(qū)、州中某街區(qū)真實(shí)人口數(shù)字的合成法修正估計(jì)值”。關(guān)于“整個(gè)州、州中某縣、州中某普查制表區(qū)、州中某街區(qū)真實(shí)人口數(shù)字的合成法修正估計(jì)量”的方差的估計(jì)方法,可閱讀文獻(xiàn)(8.1-8.5)。3.1.3域的人口普查凈編碼中心把整個(gè)州、州中某縣、州中某普查制表區(qū)、州中某街區(qū)統(tǒng)一記做g區(qū)域。g區(qū)域的人口普查凈遺漏率用下面的式(19)定義(當(dāng)計(jì)算結(jié)果為負(fù)數(shù)時(shí),其絕對(duì)值表示凈重復(fù)率)。由于“真實(shí)人口數(shù)”使用的是估計(jì)量,所以式(19)是所定義的“率”的估計(jì)量。把式(19)的分母看作常量,求該式的方差,得到3.2美國2010年的ccm方案3.2.1羅吉斯蒂回歸模型的建立及模型擬合美國2010年CCM方案是通過羅吉斯蒂回歸方法來達(dá)到事后分層的要求并完成基于“捕獲-再捕獲”模型的雙系統(tǒng)估計(jì)量的構(gòu)造?;静襟E是:首先分別以個(gè)人在普查中正確登記的概率和匹配概率為因變量,以2000年ACE方案中所用的事后分層標(biāo)志為自變量建立兩個(gè)羅吉斯蒂回歸模型;然后依據(jù)樣本數(shù)據(jù)獲得這兩個(gè)模型參數(shù)的估計(jì),從而得到兩個(gè)預(yù)測模型;再后把樣本中某人的諸自變量取值代入預(yù)測模型,計(jì)算出樣本中每個(gè)人在普查中正確登記的概率的模型預(yù)測值πcе(j)和匹配概率的模型預(yù)測值πm(j);最后用這兩個(gè)模型預(yù)測值的樣本所有人的數(shù)據(jù)構(gòu)造總體真實(shí)人口數(shù)目的估計(jì)量。3.2.2分組標(biāo)志的設(shè)置假若選用2000年ACE方案事后分層標(biāo)志中的“種族/拉美血統(tǒng)與居留地的交叉”、“年齡與性別的交叉”,“房屋所有權(quán)”這3個(gè)項(xiàng)目作為羅吉斯蒂回歸模型的自變量(這是CCM方案所使用的諸種自變量設(shè)置計(jì)劃中的一種)。在ACE方案中,第一個(gè)分組標(biāo)志下設(shè)置了7個(gè)組,具體是:(1)居留地上的美洲印第安人或阿拉斯加土著居民,(2)非居留地上的美洲印第安人或阿拉斯加土著居民,(3)拉美血統(tǒng)居民,(4)非拉美血統(tǒng)黑人,(5)土著夏威夷人或太平洋島居民,(6)非拉美血統(tǒng)亞裔人,(7)非拉美血統(tǒng)白人或其他人;第二個(gè)分組標(biāo)志下設(shè)置了7個(gè)組,具體是:(1)18歲以下男性和女性,(2)18-29歲男性,(3)18-29歲女性,(4)30-49歲男性,(5)30-49歲女性,(6)50歲以上男性,(7)50歲以上女性;第三個(gè)分組標(biāo)志下設(shè)置了2個(gè)組,具體是:(1)房屋所有者,(2)非房屋所有者。將三個(gè)分組標(biāo)志交叉組合,形成98個(gè)組,從中略去一個(gè),在羅吉斯蒂回歸模型中設(shè)置97個(gè)啞變量形式的自變量如果單位是第111組,取值1,否則取值0;X2-如果單位是第112組,取值1,否則取值0,等等)。3.2.3基于采樣區(qū)設(shè)置的匹配概率關(guān)于這個(gè)問題,文獻(xiàn)中做了概略的交代,我們在這里進(jìn)行解讀。記Pcе,j∈E為E樣本中的某人j正確計(jì)數(shù)(CorrectEnumeration,作下標(biāo)時(shí)縮寫為ce)的概率,記Pm,j∈P為P樣本中的某人j匹配的(Match,作下標(biāo)時(shí)縮寫為m)概率。由于所謂“正確計(jì)數(shù)”指的是一個(gè)人在普查中是否正確地在他應(yīng)該進(jìn)行被登記的地點(diǎn)進(jìn)行了登記,所以,這應(yīng)該是對(duì)E樣本中的人進(jìn)行的觀察,正確計(jì)數(shù)概率中的j要屬于E樣本;所謂“匹配”指的是察看在事后質(zhì)量檢查中被登記的一個(gè)人是否在普查中也進(jìn)行了相應(yīng)的登記,所以,這應(yīng)該是對(duì)P樣本中的人進(jìn)行的觀察,匹配概率中的j要屬于P樣本。Pcе,j∈E和Pm,j∈P的取值規(guī)則如下:前面說過,羅吉斯蒂回歸模型的參數(shù)估計(jì)應(yīng)當(dāng)用整個(gè)的人口有限總體充當(dāng)樣本,然而,現(xiàn)在我們所觀察到的是人口有限總體的概率樣本。為滿足羅吉斯蒂回歸模型參數(shù)估計(jì)用整個(gè)人口有限總體充當(dāng)樣本的要求,需要對(duì)觀察到的有限總體概率樣本數(shù)據(jù)進(jìn)行加權(quán),使其“上升到”有限總體層次。為此,首先計(jì)算j人所在街區(qū)群(BlockCluster)的用抽樣權(quán)數(shù)加權(quán)的加權(quán)平均概率。它們是:式(23)中,我們把cell譯做“集區(qū)”,這個(gè)術(shù)語來自ACE方案的下列工作環(huán)節(jié):完成第二步抽樣之后,要在各個(gè)街區(qū)群的普查登記的居住單位名單(E樣本名單)與ACE調(diào)查登記的居住單位名單(P樣本名單)之間進(jìn)行“居住單位初始比較”(通過計(jì)算機(jī)操作以及案頭手工操作),一是仔細(xì)地把兩個(gè)名單中都有(稱之為匹配)的居住單位挑出來,二是發(fā)現(xiàn)在同一個(gè)名單中的重復(fù)居住單位名稱,三是把各種可疑而又無法由計(jì)算機(jī)或手工操作落實(shí)的問題送到現(xiàn)場去以便通過后續(xù)調(diào)查加以確認(rèn)。在居住單位初始比較的基礎(chǔ)上,把居住單位(相應(yīng)地連同居住單位內(nèi)的人)劃分到7個(gè)互斥的并且涵蓋了整個(gè)總體的稱之為“初始比較編碼群”的集區(qū)(cell)中去,這7個(gè)集區(qū)是:1=匹配但需要后續(xù)調(diào)查;2=可能匹配;3=家庭中有一部分人沒有匹配需要后續(xù)調(diào)查;4=整個(gè)家庭沒有匹配需要后續(xù)調(diào)查,家庭名稱不重復(fù);5=不匹配,來自名稱重復(fù)的家庭;6=在后續(xù)調(diào)查之前狀態(tài)已能確定;7=比較信息不足。這就是“集區(qū)”的來源。式(23)中其他記號(hào)繼續(xù)說明如下:cell(j∈E)表示E樣本中的某人j所在的集區(qū);Pce,cell(j∈E)表示E樣本中的某人j所在集區(qū)平均的正確計(jì)數(shù)概率(稱之為E樣本中的某人j修正的正確計(jì)數(shù)概率);∑j∈cell表示在集區(qū)范圍內(nèi)對(duì)人(j)求和;ωE,i(j∈E)叫做抽樣權(quán)數(shù),它是E樣本中的某人j人所在的居住單位i進(jìn)入E樣本的概率的倒數(shù),居住單位i進(jìn)入E樣本的概率用式(8)根據(jù)它本身經(jīng)歷的抽樣過程計(jì)算。式(24)有關(guān)記號(hào)的含義與上面相仿,不再贅述。式(23)給出了一個(gè)集區(qū)中屬于E樣本的人的平均正確計(jì)數(shù)概率,在估計(jì)羅吉斯蒂回歸模型參數(shù)的時(shí)候,把它當(dāng)作該集區(qū)每個(gè)人的正確計(jì)數(shù)概率(稱之為每個(gè)人“修正的”正確計(jì)數(shù)概率)來使用。把式(23)應(yīng)用到所有的集區(qū)后得到樣本中所有屬于E樣本的人每個(gè)人修正的正確計(jì)數(shù)概率。同理,把式(24)應(yīng)用到所有的集區(qū)后得到樣本中所有屬于P樣本的人每個(gè)人修正的匹配概率。分別記Pce,cеll(j∈E)的羅吉斯蒂變換和Pm,cеll(j∈P)的羅吉斯蒂變換為ycе,j∈E和ym,j∈P。即用ycе,j∈E和ym,j∈P的總體估計(jì)量的加權(quán)數(shù)值作因變量,分別寫出E樣本的正確計(jì)數(shù)概率羅吉斯蒂回歸模型式(27)和P樣本的匹配概率羅吉斯蒂回歸模型式(28)。依據(jù)樣本資料用加權(quán)最小平方法來估計(jì)模型中的參數(shù),得到羅吉斯蒂回歸函數(shù)的估計(jì)式在上述過程中,用經(jīng)過加權(quán)的值估計(jì)模型中的參數(shù),所得到的估計(jì)量可以視為用有限總體所有人的資料構(gòu)造的估計(jì)量,這樣就滿足了羅吉斯蒂回歸模型參數(shù)估計(jì)用整個(gè)人口有限總體充當(dāng)樣本的要求。3.2.4計(jì)算模型預(yù)測值將樣本中某一個(gè)j∈E的X1、X2、…、X97的值代入式(29),算出相應(yīng)的,將其代入式(25),求得j∈E人正確計(jì)數(shù)概率的模型預(yù)測值,記作;同樣,將樣本中某一個(gè)j∈P的X1、X2、…、X97的值代入式(30),算出相應(yīng)的,將其代入式(26),求得j∈P人匹配概率的模型預(yù)測值,記作。3.2.5降階模型的確定文獻(xiàn)中給出了CCM方案中區(qū)域(州、縣,等等)真實(shí)人口數(shù)的五個(gè)估計(jì)量。第一個(gè)估計(jì)量式(31)是式(3)所給出的估計(jì)量的估計(jì)式。在那里,分式的分子和分母是用人口有限總體資料估計(jì)羅吉斯蒂回歸模型后算出,而這里是用人口有限總體的概率樣本估計(jì)羅吉斯蒂回歸模型后算出。在那里已經(jīng)論證過式(3)的實(shí)質(zhì)是基于“捕獲-再捕獲”模型的雙系統(tǒng)估計(jì)量,現(xiàn)在,式(31)自然具有相同的實(shí)質(zhì)。式(31)中,是普查中所有數(shù)據(jù)定義者人數(shù),式中的含義是,其中的指的是將普查總體中所有數(shù)據(jù)定義的人的X1、X2、…、X97的值代入式(29)或式(30)所算出的與整個(gè)有限總體中每個(gè)人相應(yīng)的值。第二個(gè)估計(jì)量顯然,式(32)是式(31)的線性估計(jì)量。在那里,是將普查總體中所有數(shù)據(jù)定義的人的X1、X2、…、X97的值代入式(29)或式(30)算出與該有限總體每個(gè)人相應(yīng)的值,而這里的是僅僅將有限總體概率樣本中的人員的值代入式(29)或式(30)算出來的;這里的加權(quán)和是用有限總體概率樣本中的E樣本構(gòu)造的關(guān)于式(31)的線性估計(jì)量。第三個(gè)估計(jì)量文獻(xiàn)中對(duì)這個(gè)估計(jì)量作了如下說明:“第三個(gè)估計(jì)量類似于第二個(gè)估計(jì)量,因?yàn)樗彩侵皇鞘褂脴颖緮?shù)據(jù)。在這個(gè)估計(jì)量中用E樣本每個(gè)人的正確計(jì)數(shù)概率代替了(第二個(gè)估計(jì)量中的)來自模型的預(yù)測值。另外,這里的匹配狀態(tài)預(yù)測概率是用E樣本的每個(gè)人來估計(jì)的。如果只使用樣本數(shù)據(jù),這個(gè)估計(jì)量優(yōu)于第二個(gè)估計(jì)量,因?yàn)闃颖局械腻e(cuò)誤計(jì)數(shù)被指定為正確計(jì)數(shù)的0概率。在這里,wE,i(j∈e)是E樣本中j人的抽樣權(quán),Pce,j∈E是E樣本中j人的正確計(jì)數(shù)概率,是匹配概率的模型預(yù)測值?!惫P者考慮,羅吉斯蒂回歸模型旨在完成相當(dāng)于ACE方案中事后分層的工作,這個(gè)估計(jì)量中的Pce,j∈E沒有經(jīng)過羅吉斯蒂回歸模型的“加工”,那么,估計(jì)量就是對(duì)一個(gè)未經(jīng)過事后分層的總體構(gòu)造的,這顯然有悖于“捕獲-再捕獲”模型的基本要求。第四個(gè)估計(jì)量文獻(xiàn)中指出,若在的基礎(chǔ)上構(gòu)造比率估計(jì)量,將會(huì)減小偏斜、降低方差,并對(duì)比率估計(jì)量作了文字描述,這就是第四和第五兩個(gè)估計(jì)量。文獻(xiàn)中未給出表達(dá)式,筆者通過對(duì)文獻(xiàn)的解讀,在這里寫出它們的表達(dá)式。第四個(gè)估計(jì)量為第五個(gè)估計(jì)量式(34)和式(35)中,CDD是人口普查總體的數(shù)據(jù)定義者人數(shù),CDD(i)是第i街區(qū)群的數(shù)據(jù)定義者人數(shù),∑i∈Esample是在E樣本中對(duì)各個(gè)街區(qū)群i求和,是在街區(qū)群i中對(duì)各個(gè)有數(shù)據(jù)定義的人j求和。關(guān)于上述5個(gè)估計(jì)量的方差,CCM方案規(guī)定都使用“大折刀”方法來估計(jì)。在使用“大折刀”方法時(shí),該方案把樣本劃分成K=100個(gè)隨機(jī)組,而形成100個(gè)隨機(jī)組的方法是,把樣本單位編號(hào)最后二位數(shù)字相同者分入同一組。3.2.6人口有限總體模型的估計(jì)量與匹配概率羅吉斯蒂回歸模型中的自變量是那些會(huì)影響被正確計(jì)數(shù)概率(以及匹配概率)的變量。事實(shí)上,2000年ACE方案中用于事后分層的各個(gè)分組標(biāo)志就是這些變量。現(xiàn)在的問題是,即將在2010年實(shí)施的CCM方案中所使用的羅吉斯蒂回歸模型是否有必要把那里的所有的事后分層標(biāo)志都設(shè)置為模型的自變量?可否刪去一些變量以便使模型變得精簡些?當(dāng)然,前提是這種精簡不能影響模型的預(yù)測功能。為了回答這個(gè)問題,目前已完成的CCM方案設(shè)計(jì)初始研究中安排了這樣一個(gè)環(huán)節(jié):羅吉斯蒂回歸模型選擇的探索性研究。在這個(gè)環(huán)節(jié)中,研究人員設(shè)計(jì)了6個(gè)羅吉斯蒂回歸模型(本文3.2.2小節(jié)選用的是其中的一個(gè)),其中有一個(gè)包含了ACE方案中用于事后分層的全部分組變量,另外的5個(gè)是刪去了這些或那些變量以后的不同的精簡模型。他們用2000年數(shù)據(jù)資料分別對(duì)6個(gè)模型進(jìn)行試算,然后根據(jù)試算結(jié)果使用判別性統(tǒng)計(jì)量對(duì)6個(gè)模型的預(yù)測功能進(jìn)行了評(píng)估。下面對(duì)CCM方案選擇羅吉斯蒂回歸模型時(shí)所使用的判別性統(tǒng)計(jì)量進(jìn)行解讀。前面說過,應(yīng)用羅吉斯蒂回歸模型構(gòu)造總體真實(shí)人口數(shù)目估計(jì)量的過程:用樣本資料估計(jì)模型的參數(shù)得到回歸方程估計(jì)式;把樣本中j人的自變量值代入方程估計(jì)式,得到j(luò)人正確計(jì)數(shù)概率和匹配概率的模型預(yù)測值;用樣本所有人的模型預(yù)測值構(gòu)造總體真實(shí)人口數(shù)目估計(jì)量。j人正確計(jì)數(shù)概率(和匹配概率)的模型預(yù)測結(jié)果是隨機(jī)變量。一個(gè)羅吉斯蒂回歸模型的預(yù)測功能如何,所要看的是,用該模型得到的第j人正確計(jì)數(shù)概率(和匹配概率)的模型預(yù)測結(jié)果不確定性的大小,當(dāng)然,它們其實(shí)也就是第j人“是否正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《教育與經(jīng)濟(jì)的關(guān)系》課件
- 少兒美術(shù)加盟合同范例
- 購物公園轉(zhuǎn)讓合同范例
- 轉(zhuǎn)讓葡萄果園合同范例
- 貨物銷毀合同范例
- 銅門采購合同范例
- 貨物配送承運(yùn)合同范例
- 外架大包合同范例
- 床板維修施工合同范例
- 造價(jià)咨詢 服務(wù)合同范例
- 招標(biāo)代理及政府采購常識(shí)匯編
- 塔吊噴淋降塵系統(tǒng)施工方案
- 人工智能引論智慧樹知到課后章節(jié)答案2023年下浙江大學(xué)
- 歌曲演唱 萬疆
- 人教版六年級(jí)道德與法治上冊第四單元作業(yè)設(shè)計(jì)
- 50205-2020-鋼結(jié)構(gòu)工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)
- 六年級(jí)上冊美術(shù)教學(xué)設(shè)計(jì) 第15課 壯錦圖案 |廣西版
- 2023-2024學(xué)年河南省洛陽市洛龍區(qū)數(shù)學(xué)四年級(jí)第一學(xué)期期末預(yù)測試題含答案
- 項(xiàng)目管理績效考核管理辦法
- 冀教版九年級(jí)下英語單詞表(漢譯英)
- 亞馬遜跨境電商運(yùn)營與廣告實(shí)戰(zhàn)
評(píng)論
0/150
提交評(píng)論