版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
抽樣估計和假設檢驗第1頁/共68頁第5章抽樣估計和假設檢驗在數理統(tǒng)計學中,統(tǒng)計推斷常包含兩個方面的內容,一是已知條件:所研究問題的總體、總體分布(部分未知或未知)、樣本;二是推斷結論:通過樣本(觀測數據)作出與未知分布有關的某種結論。例如,某一群人的身高構成一個總體,通常認為身高服從正態(tài)分布,但不知道這個總體的均值,隨機抽部分人,測得身高的值,用這些數據來估計這群人的平均身高,即屬參數估計問題。若感興趣的問題是“平均身高是否超過170cm”,就需要通過樣本檢驗此命題是否成立,即假設檢驗。第2頁/共68頁第5章抽樣估計和假設檢驗本章要介紹的內容由抽樣估計和假設檢驗兩部分組成。抽樣估計包括總體均值的抽樣估計和總體比率的抽樣估計第3頁/共68頁第5章抽樣估計和假設檢驗§5.1抽樣估計概述§5.1.1抽樣估計的概念1.抽樣估計抽樣估計就是按照隨機抽樣的原則,從總體中抽出一部分單位作為樣本,并利用樣本的實際資料計算樣本指標值,然后根據樣本指標對總體的數量特征(總體指標)做出具有一定可靠程度的估計和判斷的一種統(tǒng)計分析方法。第4頁/共68頁第5章抽樣估計和假設檢驗§5.1.12.總體和樣本總體也稱全及總體,指所要認識研究對象的全體。它是由所研究范圍內具有某種共同性質的全體單位所組成的集合體??傮w的單位數通常是很大的,甚至是無限的,一般用N表示總體的單位數。樣本又稱子樣,它是從全及總體中隨機抽取出來的們作為代表這一總體的哪部分單位組成的集合體,樣本的單位數是有限的,相對值或標志屬性決定的。第5頁/共68頁第5章抽樣估計和假設檢驗§5.1.13.總體參數和樣本統(tǒng)計量總體參數是總體的數量特征。對于某個總體來說,其參數是定值。但是在某一實際問題中,總體參數通常是未知的,這就需要通過樣本數據所提供的總體的有關信息對參數進行推斷。一個全及指標的指標數值是確定的、唯一的,所以稱為參數。一個總體常常有多個參數,這些參數從各個不同的角度反映總體分布的基本情況和特征。通常最關心的就是表示總體分布集中趨勢和分散趨勢的兩個參數,即總體的均值和方差。第6頁/共68頁第5章抽樣估計和假設檢驗§5.1.1樣本統(tǒng)計量是樣本的數量特征。它隨樣本的不同而變化,是一個不包含任何未知參數的樣本函數,因此是個隨機變量。樣本統(tǒng)計量一方面表示樣本本身的分布狀況和特征,另一方面也是總體參數的估計量。第7頁/共68頁第5章抽樣估計和假設檢驗§5.1.14.樣本容量和樣本數目樣本容量是一個樣本所包含的單位數,一般用n表示。通常認為n≥30為大樣本,n<30為小樣本。樣本數目是從一個總體中按照一定樣本容量可能抽取的樣本的數目。第8頁/共68頁第5章抽樣估計和假設檢驗§5.1.15.抽樣的方法⑴重復抽樣(重置抽樣)從具有N個單位的總體中隨機抽取一個單位(登記其序號和相應的標志值)之后,又將它重新放回總體,參加下一次抽選,依次連續(xù)進行n次抽選,便構成一個容量為n的樣本,這樣的抽樣方法稱為重復抽樣。總體每個單位在各次抽樣中被抽取的概率都相同。第9頁/共68頁第5章抽樣估計和假設檢驗§5.1.1⑵不重復抽樣(不重置抽樣)從具有N個單位的總體中隨機抽取一個單位,不再將它重新放回總體參加下一次的抽選,這樣的抽樣方法稱為不重復抽樣。從抽樣分布角度來看,這種抽樣分布實際上等同于一次從總體中同時抽取n個單位組成一個樣本。第10頁/共68頁第5章抽樣估計和假設檢驗§5.1.2抽樣估計的理論依據抽樣估計是通過樣本對總體的推算,這樣統(tǒng)計量與被估算的總體指標之間的關系,就是推算的關鍵。而兩者的關系主要通過統(tǒng)計量的分布來反映,且因樣本量的大小而有所差別。第11頁/共68頁第5章抽樣估計和假設檢驗1.大數定律大數定律是指一切關于大量隨機現象平均結果穩(wěn)定性的定理,包含馬爾可夫定理、辛欽定理、車貝雪夫定理、貝努里定理、普阿松定理等等,它為均值穩(wěn)定性的存在及整個抽樣估計提供了最基本的理論依據。大數定律的本質是盡管單個隨機現象的具體表現不可避免地引起隨機偏差,然而在大量隨機現象共同作用時,由于這些隨機偏差互相抵消,致使總的平均結果趨于穩(wěn)定。第12頁/共68頁第5章抽樣估計和假設檢驗2.中心極限定理中心極限定理是指在一定的條件下,大量相互獨立的隨機現象的概率分布以正態(tài)分布為極限的定理。因正態(tài)分布在概率論中占有中心地位,所以把以正態(tài)分布為極限的定理叫做中心極限定理。中心極限定理表明,在實際問題中,隨機變量不論來自什么樣分布的總體,都可用正態(tài)分布的理論來說明和估計平均數的問題。當然原分布與正態(tài)分布的差異越大,抽樣數目就要越多,這樣才能保證平均數的分布接近正態(tài)分布。第13頁/共68頁第5章抽樣估計和假設檢驗大數定律揭示了大量隨機變量的平均結果,但并沒有涉及到隨機變量的分布規(guī)律。而中心極限定理則說明了許多隨機變量的分布是正態(tài)或近似正態(tài)的,這就可以簡化抽樣估計中許多統(tǒng)計量的分布問題,所以它是統(tǒng)計學中的重要工具之一。第14頁/共68頁第5章抽樣估計和假設檢驗§5.2抽樣分布§5.2.1抽樣分布1.抽樣分布樣本統(tǒng)計量的所有可能取值及其概率所形成的概率分布稱為抽樣分布。某個樣本統(tǒng)計量(如均值、比例、方差等)的抽樣分布,從理論上說就是在重復選取容量為n的樣本時,由每一個樣本計算出的該統(tǒng)計量數值的相對頻數分布或概率分布。第15頁/共68頁第5章抽樣估計和假設檢驗§5.2.1抽樣分布2.樣本均值的抽樣分布若總體服從均值為,方差為的正態(tài)分布,則從總體中抽取出的樣本均值仍然服從正態(tài)分布,即。如果總體不是正態(tài)分布,根據統(tǒng)計學中的中心極限定理,隨著樣本容量的增加,的抽樣分布近似服從正態(tài)分布。第16頁/共68頁第5章抽樣估計和假設檢驗§5.2.1抽樣分布3.樣本方差的分布當總體服從正態(tài)分布時,服從分布(將在下一節(jié)中介紹),其中樣本方差為第17頁/共68頁第5章抽樣估計和假設檢驗§5.2.1抽樣分布4.樣本比例的分布總體中具有某種屬性的單位數與總體全部單位數之比稱為總體的比例,記作。而樣本中具有某種屬性的單位數與樣本總數之比稱為樣本比例,記作。若從總體中隨機抽取出容量為n的樣本,發(fā)現其中具有某種屬性的單位數為,則樣本中具有某種屬性的單位的比例為當樣本容量很大時,樣本比例近似地服從正態(tài)分布第18頁/共68頁第5章抽樣估計和假設檢驗§5.2.1抽樣分布5.兩個樣本平均數之差的分布統(tǒng)計學中還經常用到分別來自兩個正態(tài)總體的樣本均值差的分布問題。如果有兩個正態(tài)分布的總體和,其均值分別為和,方差分別為和,若從這兩個正態(tài)總體中分別抽取容量為n1和n2的兩個獨立樣本,則兩個樣本平均數之差也一定服從均值為,方差為的正態(tài)分布,即第19頁/共68頁第5章抽樣估計和假設檢驗第20頁/共68頁第5章抽樣估計和假設檢驗§5.2.2t分布當樣本容量小于30時,樣本均值的分布與正態(tài)分布之間的誤差較大,此時可用分布來描述。分布與正態(tài)分布一樣也是對稱的。一般地,分布比正態(tài)分布更平坦一些。隨著樣本容量的增加,分布的形狀由平坦逐漸變得接近于正態(tài)分布。通常認為當樣本容量時,可以用正態(tài)分布代替分布。第21頁/共68頁第5章抽樣估計和假設檢驗不同大小的樣本對應于不同的分布,這是因為分布與自由度有關。所謂自由度就是可以自由選樣的數值的個數。比如樣本容量是n,在樣本均值確定的條件下,對樣本中的數據能夠自由決定數值的個數就只有n-1個了。實際上,當把n-1個數值選定以后,第n個數據的值也就自動確定了。由此可見,大小為n的樣本的自由度就是n-1。圖3-2是自由度分別為1和10的t分布曲線并與標準正態(tài)分布曲線比較。第22頁/共68頁第5章抽樣估計和假設檢驗第23頁/共68頁第5章抽樣估計和假設檢驗§5.2.3分布設總體服從于標準正態(tài)分布,即,又為取自該總體的一個樣本,它們的平方和記作,即=++…+則稱統(tǒng)計量為服從自由度為n的分布,記作。分布的密度曲線與自由度有關。從圖5-5可以看出,當自由度很小時,分布密度曲線向右伸展。隨著自由度的增加,分布的密度曲線變得愈來愈對稱,當自由度達到相當大時,分布的密度曲線接近正態(tài)分布。第24頁/共68頁第5章抽樣估計和假設檢驗§5.2.4F分布設X和Y分別服從自由度為n1-1和n2-1的分布,即,且相互獨立,則稱統(tǒng)計量服從自由度為n1-1和n2-1的F分布。F分布有兩個自由度,一個是分子的自由度,一個是分母的自由度。第25頁/共68頁第5章抽樣估計和假設檢驗§5.3.1抽樣誤差的概念抽樣誤差是指由于隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起樣本指標與總體指標之間的絕對離差。表示如下:第26頁/共68頁第5章抽樣估計和假設檢驗抽樣實際誤差是指每次抽樣所得的樣本指標與總體指標之間的離差,它隨著樣本的不同而不同,是一個隨機變量,即有多少種可能的樣本就有多少種可能的實際抽樣誤差。因此,在抽樣估計中要結合所有可能的樣本來研究所有可能的實際抽樣誤差。但是在現實的抽樣估計中,抽樣實際誤差是不可能得到的,我們只能通過抽樣分布推算抽樣誤差。第27頁/共68頁第5章抽樣估計和假設檢驗抽樣平均誤差是指所有可能出現的樣本統(tǒng)計量的標準差。對于一個特定的總體和樣本容量來說,它是固定的、可以計算的。其定義公式如下第28頁/共68頁第5章抽樣估計和假設檢驗§5.3.2抽樣平均誤差的計算抽樣平均誤差是反映抽樣誤差一般水平的指標,即所有可能出現的樣本指標與總體指標的標準差。1.抽樣平均誤差的計算方法樣本平均數的抽樣平均誤差⑴重復抽樣:⑵不重復抽樣:第29頁/共68頁第5章抽樣估計和假設檢驗2.樣本比例的抽樣平均誤差⑴重復抽樣:⑵不重復抽樣:在實際計算抽樣平均誤差時,當總體比例P未知時,可用樣本比例p來代替,即:第30頁/共68頁第5章抽樣估計和假設檢驗3.影響抽樣(平均)誤差的因素⑴總體標志變異程度的大?。傮w標準差σ的大?。┡cμ成正比例關系。⑵樣本容量的平方與μ成反比例關系。例如:要使抽樣誤差減少為原來的一半,則樣本容量將為原來的4倍。⑶抽樣方法的不同。重復抽樣的μ總是大于不重復抽樣的μ。⑷抽樣的組織形式。抽樣的組織形式不同,抽樣誤差也不同。第31頁/共68頁第5章抽樣估計和假設檢驗§5.3.2抽樣極限誤差抽樣極限誤差是從另外一個角度來考慮抽樣誤差的問題,又稱為允許誤差或抽樣誤差范圍。用樣本指標估計總體指標,必須要考慮抽樣誤差的大小。抽樣極限誤差是指抽樣指標與總體指標之間抽樣誤差可允許的范圍,它等于樣本指標可允許變動的上下限與總體指標的絕對值。第32頁/共68頁第5章抽樣估計和假設檢驗§5.3.3概率度
或稱為抽樣誤差的概率度。
第33頁/共68頁第5章抽樣估計和假設檢驗如例5.7,已知某鄉(xiāng)糧食畝產量的標準差為σ=80公斤,總體單位數N=20000畝,樣本單位數n=400畝,求得其抽樣平均誤差為:如果確定抽樣極限誤差為5公斤,則,我們可以用概率度:表示抽樣極限的誤差范圍,即用1.25μx來規(guī)定誤差范圍的大小。第34頁/共68頁第5章抽樣估計和假設檢驗§5.3.3置信度抽樣估計的置信度是樣本指標與總體指標的誤差不超過一定范圍的概率,用F(t)表示,又稱抽樣估計的概率保證程度。1.總體平均數抽樣估計的置信度2.總體比例抽樣估計的置信度第35頁/共68頁第5章抽樣估計和假設檢驗若反復抽樣多次,每個樣本值確定一個區(qū)間[],每個這樣的區(qū)間要么包含的真值,要么不包含的真值,據Bernoulli大數定律,在這樣多的區(qū)間中,包含真值的約占,不包含真值的約僅占,比如,=0.005,反復抽樣1000次,則得到的1000個區(qū)間中不包含真值的區(qū)間僅為5個。第36頁/共68頁第5章抽樣估計和假設檢驗置信度1-α越大,則臨界值的絕對值就越大,估計區(qū)間的精度就越低;反之,置信度愈小,則區(qū)間精度就愈高。同時,樣本容量n愈大,精度愈高,容量提高到4倍,精度才提高1倍。其實在樣本容量一定時,估計的精度和置信度是彼此矛盾的,提高精度(即縮小區(qū)間)就降低了置信度;而提高置信度,往往需要擴大置信區(qū)間,從而又降低了估計的精度。統(tǒng)計學家尼曼(Neyman、J)提出的原則是:先保證可靠性,以接近1的概率來確定估計區(qū)間,然后再盡可能的提高精度。所以人們常給α以較小的概率值(如0.01或0.05),使置信度1-α較高。第37頁/共68頁第5章抽樣估計和假設檢驗§5.3抽樣估計的方法§5.3.1總體參數的點估計1.點估計的概念點估計指用樣本統(tǒng)計量直接代替總體總體參數的估計方法。2.抽樣估計的優(yōu)良標準在對總體特征做出估計時,并非所有估計量都是優(yōu)良的,從而產生了評價估計量是否優(yōu)良的標準。衡量一個樣本統(tǒng)計量是否是總體參數的優(yōu)良的估計量一般有如下三條標準,即:無偏性、一致性和有效性。第38頁/共68頁第5章抽樣估計和假設檢驗§5.3.2總體參數的區(qū)間估計1.區(qū)間估計的概念在統(tǒng)計分析中,我們常常用一個區(qū)間及其出現的概率來估計總體參數。這種估計總體參數的方法稱為區(qū)間估計。具體地說,區(qū)間估計是用估計量所構成的區(qū)間來估計總體參數,并以一定的概率保證總體參數將落在所估計的區(qū)間內。這一概率保證程度稱為置信度,這種估計區(qū)間稱為置信區(qū)間。例如,第39頁/共68頁第5章抽樣估計和假設檢驗2.區(qū)間估計的方法及要素⑴總體平均數的區(qū)間估計或⑵總體比例的區(qū)間估計或由上述區(qū)間估計公式可概括出區(qū)間估計的基本要素,即:⑴估計值;⑵抽樣極限誤差;⑶置信度(概率保證程度)。第40頁/共68頁第5章抽樣估計和假設檢驗3.區(qū)間估計的步驟⑴置信度約束下的區(qū)間估計步驟。根據抽樣估計原理自總體中抽取容量為n的樣本,在置信度一定的情況下,我們可以采取如下步驟進行區(qū)間估計:第41頁/共68頁第5章抽樣估計和假設檢驗①明確置信水平1-α或。常用的置信水平主要有95%,95.45%,99.73%等;②確定概率度t(即臨界值水平)。根據置信度,查標準正態(tài)概率雙側臨界值表確定概率度(臨界值)±t;③計算統(tǒng)計量的值。對總體平均數進行估計時,要計算樣本平均數及抽樣平均誤差μx和允許誤差Δx;對總體比例(比重)進行估計時,要計算樣本比例p和抽樣平均誤差μp及允許誤差Δp;對總體方差進行估計時,要計算樣本修正方差及其抽樣誤差和允許誤差。④構造置信區(qū)間。置信區(qū)間是優(yōu)良的統(tǒng)計量±允許誤差構成的,對于總體平均數在某置信度約束下的置信區(qū)間就是樣本平均數±允許誤差。第42頁/共68頁第5章抽樣估計和假設檢驗§5.3.3總體總量的抽樣估計抽樣調查的如期完成,能使我們得到兩個重要的抽樣指標:一個是代表抽樣總體(樣本)一般特征的樣本平均數,或稱抽樣平均數;一個是反映某一標志的單位數在樣本中所占的比重,或稱抽樣比例。有了這兩個表示抽象調查結果的綜合指標,就可以對于某些未知的結果進行預測與預算。第43頁/共68頁第5章抽樣估計和假設檢驗抽樣調查的功能和作用,在于它能以點推面。所謂“以點推面”就是用樣本所包括的點來推算總體所代表的面,即用樣本平均數來代表總體平均指標或用樣本比例來代表某一標志在總體中所占的比重。這里的樣本平均數的求得并不是最終目的,而是通過它門來反映和代替統(tǒng)計總體的平均指標或相對數。如果結合總體中已知的有關總量指標(即絕對數)還可以通過樣本平均數和樣本比例來推算總體中未知的其它總量指標。根據抽樣結果,推算總體的總量指標可以有如下兩種方法:第44頁/共68頁第5章抽樣估計和假設檢驗§5.4抽樣的組織形式§5.4.1抽樣設計的有關問題抽樣估計是建立在隨機抽樣的基礎上的,而隨機抽樣的中心是抽樣調查方案的設計,主要包括抽樣技術和試驗設計兩項主要內容。抽樣技術是指為保證樣本的隨機性和代表性而選擇抽樣方法和制定抽樣方案等應遵循的基本原則的研究。試驗設計是指對試驗方案的選擇和對試驗數據的統(tǒng)計分析等。試驗設計主要是對自然現象進行觀察的方法,在社會經濟統(tǒng)計學中應用較少,為此我們不作詳細介紹。第45頁/共68頁第5章抽樣估計和假設檢驗§5.4.1抽樣設計的有關問題抽樣調查方案的主要內容:確定調查的目的。確定調查對象、調查單位和報告單位。擬定調查提綱、確定調查項目、并設計調查表。確定調查的時間。確定調查的組織實施計劃。第46頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式抽樣組織方式是指在抽樣時對總體的加工整理形式,根據對總體的加工整理形式不同,在隨機抽樣中抽樣的組織形式很多,如:簡單純隨機抽樣、分類抽樣、等距抽樣、整群抽樣和多階段抽樣等。第47頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式1.簡單隨機抽樣簡單隨機抽樣又稱為純隨機抽樣,它是不對總體作任何加工整理,直接從總體中隨機抽取調查單位的抽樣調查方法。所以也叫簡單隨機抽樣。簡單隨機抽樣是最常用的純隨機抽樣。它必須滿足下列兩條要求:①代表性,即要求樣本(x1,x2……,xn)中的每個x
都與總體X具有相同的概率分布,簡稱為同分布。②獨立性,即要求樣本(x1,x2……,xn)中的各x是相互獨立的。在前面講解中我們所使用抽樣概念都是簡單純隨機抽樣,在以后的學習中如果不說明抽樣的形式,則都是指簡單隨機抽樣。簡單隨機抽樣是抽樣中最基本的方式,它適用于均勻總體,即具有某種特征的單位均勻地分布于總體的各個部分。第48頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式簡單隨機抽樣的平均誤差⑴簡單重復隨機抽樣:
⑵簡單不重復隨機抽樣:第49頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式2.類型抽樣⑴類型抽樣的概念類型抽樣又稱分層或分類抽樣。它是先對總體各單位按主要標志加以分組,然后再從各組中按隨機原則抽取一定單位構成樣本的抽樣組織方式。第50頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式類型抽樣是應用于總體內各單位在被研究標志上有明顯差別或差別懸殊的總體的抽樣。如:研究農作物產量時,耕地有平原、丘陵和山地等;研究職工的工資水平時,各行業(yè)之間有明顯的差別;研究居民家庭收支情況時,家庭的收入水平差距很大。類型抽樣實質上是把統(tǒng)計分組和抽樣原理有機結合的抽樣組織方式。通過分組,使組中具有同質性,組間具有差異性,然后從各組中簡單隨機抽樣。這樣可以保證樣本對總體具有更高的代表性,所以計算出的抽樣誤差就比較小。類型抽樣應掌握的主要原則是:分組時應使組內差異盡可能小,使組間差異盡可能大。第51頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式⑵類型抽樣的方法按樣本單位在各組中的分配狀況,類型抽樣可分為等比例抽樣和不等比例抽樣。等比例抽樣就是按同樣的抽樣比n/N,確定各組中應抽的樣本單位數。如各組單位數為Ni,則從中抽取的樣本單位數為ni。各組樣本單位數確定后,按隨機原則從各組中抽取各類單位組成樣本。不等比例抽樣多指某類單位在總體中占的比重過小時,按比例抽不到或只能抽到很少單位,為了保證樣本中各類單位的代表性而采取不等比例抽樣的方法。第52頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式⑶類型抽樣的抽樣平均數和抽樣平均誤差①抽樣平均數:②重復抽樣的平均誤差:③不重復抽樣的平均誤差:⑷類型抽樣的優(yōu)點:①它提高了樣本代表性;②降低了影響抽樣平均誤差的總體方差。第53頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式3.等距抽樣⑴等距抽樣的概念等距抽樣又稱機械抽樣或系統(tǒng)抽樣它是先將總體單位按某一標志排序,然后按照固定的順序和相同的間隔來抽選樣本單位的抽樣組織形式。①無關標志抽樣是指排序的標志與研究的標志無關。如觀察學生考試成績,用姓氏筆劃排序;觀察產品的質量,按生產的先后順序等。無關標志排序可以保證抽樣的隨機性。它實質上相當于簡單隨機抽樣。②有關標志排序抽樣是指排序的標志與被研究標志相關。如農產品產量調查時,將地塊按過去連續(xù)幾年的畝產排序;家庭消費水平調查中,按收入額排序等。按有關標志排序可以利用輔助的信息,使抽樣估計的效率提高,但必須采用科學的方法,避免由于抽樣間隔與排序標志的周期性變化的重合所產生的系統(tǒng)性誤差。第54頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式①無關標志抽樣是指排序的標志與研究的標志無關。如觀察學生考試成績,用姓氏筆劃排序;觀察產品的質量,按生產的先后順序等。無關標志排序可以保證抽樣的隨機性。它實質上相當于簡單隨機抽樣。②有關標志排序抽樣是指排序的標志與被研究標志相關。如農產品產量調查時,將地塊按過去連續(xù)幾年的畝產排序;家庭消費水平調查中,按收入額排序等。按有關標志排序可以利用輔助的信息,使抽樣估計的效率提高,但必須采用科學的方法,避免由于抽樣間隔與排序標志的周期性變化的重合所產生的系統(tǒng)性誤差。第55頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式⑵等距抽樣的優(yōu)點按等距抽樣組織形式抽取樣本單位,能夠使抽出的樣本單位更均勻地分布在總體中,等距抽樣的誤差一般較簡單隨機抽樣的誤差小,特別是當研究的現象標志變異程度較大時,更能顯示出等距抽樣的優(yōu)越性。⑶等距抽樣的抽樣平均誤差等距抽樣均為不重復抽樣,其平均誤差的計算可分為兩類,一是按無關標志排序時,可用簡單隨機不重復抽樣的平均誤差公式計算。按有關標志排序時,可用類型抽樣的平均誤差公式計算。第56頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式4.整群抽樣⑴整群抽樣的概念。整群抽樣也叫分群抽樣或集團抽樣,是將總體劃分為若干群,然后以群為單位從中隨機抽取部分群。對中選群中的所有單位進行全面調查的抽樣組織方式。第57頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式在大規(guī)模的抽樣調查中,如果總體單位多,且分布區(qū)域廣,缺少進行抽樣的抽樣框,或按經濟效益原則不宜編制這種抽樣框的情況下,宜采用這種形式。因為整群抽樣將抽樣單位由總體單位擴大到群,所以它的抽樣框是很簡單的。如:對某市居民的家庭收入進行調查,采用整群抽樣,就可以按行政區(qū)域分為街道,然后隨機抽取一些街道,進行全面調查,相對于以上的三種抽樣更加適宜。整群抽樣中的群,主要是自然形成的,如按行政區(qū)域,地理區(qū)域等。由于整群抽樣的樣本單位的分布集中于群內,所以同樣條件下,較簡單隨機抽樣的樣本代表性差,所以應適當增加樣本單位,以提高估計的精確度。第58頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式⑵整群抽樣的估計方法。設總體中的全部單位劃為R群,每群中所包含單位數為m,現從群中隨機抽?。蛉航M成樣本。則各群的平均數為:第59頁/共68頁第5章抽樣估計和假設檢驗各群的樣本平均數:全樣本平均數:群間方差為:整群抽樣一般為不重復抽樣,其抽樣誤差為:第60頁/共68頁第5章抽樣估計和假設檢驗§5.4.2抽樣組織方式5.多階段抽樣前面所介紹的幾種抽樣方式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年高中政治第3單元思想方法與創(chuàng)新意識課時作業(yè)18用對立統(tǒng)一的觀點看問題含解析新人教版必修4
- 2024-2025學年新教材高中歷史第三單元遼宋夏金多民族政權的并立與元朝的統(tǒng)一單元評估課后作業(yè)含解析新人教版必修中外歷史綱要上
- 2025年度盤扣建筑構件質量控制檢測合同4篇
- 2025年度汽車制造企業(yè)總經理聘請及智能制造合同范本4篇
- 二零二五年度智慧社區(qū)安防系統(tǒng)安裝施工合同范本3篇
- 二零二五年度窗簾產業(yè)園區(qū)建設與管理合同3篇
- 二零二五年度四人合伙企業(yè)股權投資合同3篇
- 2025年度餐飲多人合伙經營營銷推廣合同范本3篇
- 二手房購買補充合同:2024年定制版版B版
- 二零二五年度2025版二手設備存量買賣服務協(xié)議2篇
- 產品共同研發(fā)合作協(xié)議范本5篇
- 風水學的基礎知識培訓
- 2024年6月高考地理真題完全解讀(安徽省)
- 吸入療法在呼吸康復應用中的中國專家共識2022版
- 1-35kV電纜技術參數表
- 信息科技課程標準測(2022版)考試題庫及答案
- 施工組織設計方案針對性、完整性
- 2002版干部履歷表(貴州省)
- DL∕T 1909-2018 -48V電力通信直流電源系統(tǒng)技術規(guī)范
- 2024年服裝制版師(高級)職業(yè)鑒定考試復習題庫(含答案)
- 門診部縮短就診等候時間PDCA案例-課件
評論
0/150
提交評論