關(guān)于抽樣與抽樣分布第一頁(yè),共三十五頁(yè),2022年,8月28日常見(jiàn)抽樣方法1·簡(jiǎn)單隨機(jī)抽樣(純隨機(jī)抽樣)(simplerandomsampling)方法:將總體單位編成抽樣框,而后用抽簽或隨機(jī)數(shù)表抽取樣本單位。適用:總體規(guī)模不大;總體內(nèi)部差異小第二頁(yè),共三十五頁(yè),2022年,8月28日常見(jiàn)抽樣方法2·類(lèi)型抽樣(分層抽樣)(stratifiedsampling)方法:將總體全部單位分類(lèi),形成若干個(gè)類(lèi)型組,后從各類(lèi)型中分別抽取樣本單位,合成樣本總體N樣本n等額等比例最優(yōu)······第三頁(yè),共三十五頁(yè),2022年,8月28日3·等距抽樣(機(jī)械抽樣)(systematicsampling)無(wú)關(guān)標(biāo)志等距抽樣有關(guān)標(biāo)志等距抽樣半距起點(diǎn)等距抽樣對(duì)稱(chēng)等距抽樣排序依據(jù)的標(biāo)志:(1)無(wú)關(guān)標(biāo)志;(2)有關(guān)標(biāo)志(總體單位按某一標(biāo)志排序按一定的間隔抽取樣本單位)············第四頁(yè),共三十五頁(yè),2022年,8月28日4·整群抽樣(clustersampling)方法:將總體全部單位分為許多個(gè)““群”,然后隨機(jī)抽取若干““群”,對(duì)被抽中的各““群”內(nèi)的所有單位登記調(diào)查。第五頁(yè),共三十五頁(yè),2022年,8月28日總體群數(shù)R=16樣本群數(shù)r=4樣本容量例:ABCDEFGHIJKLMNOPLHPD第六頁(yè),共三十五頁(yè),2022年,8月28日例:在某省100多萬(wàn)農(nóng)戶(hù)抽取1000戶(hù)調(diào)查農(nóng)戶(hù)生產(chǎn)性投資情況。5·多階段抽樣第一階段:從省內(nèi)部縣中抽取5個(gè)縣第二階段:從抽中的5個(gè)縣中各抽4個(gè)鄉(xiāng)
第三階段:從抽中的20個(gè)鄉(xiāng)中各抽5個(gè)村
第四階段:從抽中的100個(gè)村中各抽10戶(hù)樣本n=100×10=1000(戶(hù))抽樣方法1·放回抽樣:抽出樣本單位登記后放回總體,再抽時(shí)總體不變2·不放回抽樣:抽出樣本單位登記后不放回總體,再抽時(shí)總體漸次減少第七頁(yè),共三十五頁(yè),2022年,8月28日例題1、采取抽樣方法調(diào)查某大學(xué)大學(xué)生的消費(fèi)支出,如果不易獲得全校學(xué)生名單,比較合適的抽樣方法是2、為了調(diào)查某大學(xué)大學(xué)生的購(gòu)書(shū)費(fèi)用支出情況,從男生中抽取60名同學(xué)調(diào)查,女生中抽取40名同學(xué)調(diào)查,這種調(diào)查方法是()3、為了調(diào)查某大學(xué)大學(xué)生的購(gòu)書(shū)費(fèi)用支出情況,從全校抽取4個(gè)班級(jí)的學(xué)生進(jìn)行調(diào)查,這種調(diào)查方法是i()4、為了調(diào)查某大學(xué)大學(xué)生的購(gòu)書(shū)費(fèi)用支出情況,將全校學(xué)生的名單按拼音順序排序后,每隔50個(gè)人抽取1名進(jìn)行調(diào)查,這種調(diào)查方法是()第八頁(yè),共三十五頁(yè),2022年,8月28日抽樣分布抽樣分布單樣本抽樣分布兩個(gè)樣本抽樣分布樣本均值樣本比率樣本方差均值之差比率之差方差之比第九頁(yè),共三十五頁(yè),2022年,8月28日一、抽樣分布-概念概念:抽樣分布(samplingdistribution)就是由樣本n個(gè)觀察值計(jì)算的統(tǒng)計(jì)量的概率分布總體N容量為n的所有樣本計(jì)算出每一個(gè)x并形成分布0xf(x)第十頁(yè),共三十五頁(yè),2022年,8月28日一、抽樣分布-概念(例題)例4-1設(shè)一個(gè)總體只有4個(gè)個(gè)體,即總體單位個(gè)數(shù)N=4,取值分別為x1=1,x2=2,x3=3,x4=4。假設(shè)采取重復(fù)抽樣方式抽取n=2的隨機(jī)樣本,求抽樣均值得抽樣分布。解(1)總體分布是均勻分布總體均值和方差0xf(x)12340.10.20.3第十一頁(yè),共三十五頁(yè),2022年,8月28日一、抽樣分布-概念(例題)(2)重復(fù)抽樣方法隨機(jī)抽取2個(gè),可形成16個(gè)隨機(jī)樣本。這些樣本的均值和方差如下表編號(hào)樣本單位樣本均值樣本方差編號(hào)樣本單位樣本均值樣本方差11,11.0093,12.0221,21.50.5103,22.50.531,32.02113,33.0041,42.54.5123,43.50.552,11.50.5134,12.54.562,22.00144,23.0272,32.50.5154,33.50.582,43.02164,44.00第十二頁(yè),共三十五頁(yè),2022年,8月28日一、抽樣分布-概念(例題)(3)樣本均值得分布如下表編號(hào)樣本均值的取值樣本均值的個(gè)數(shù)均值取值的概率11.011/1621.522/1632.033/1642.544/1653.033/1663.522/1674.011/160xf(x)1.02.00.10.20.31.52.53.03.54.0第十三頁(yè),共三十五頁(yè),2022年,8月28日一、抽樣分布-概念均值抽樣分布的形式0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)0xf(x)總體分布n=2n=5n=30第十四頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-均值抽樣分布的基本形式總體分布正態(tài)分布非正態(tài)分布正態(tài)分布t分布大樣本小樣本大樣本小樣本第十五頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-均值抽樣分布的基本形式均值抽樣分布的特征樣本均值和方差樣本的均值和方差與兩個(gè)因素關(guān)聯(lián):總體分布的均值和方差抽樣的方式——重復(fù)抽樣還是不重復(fù)抽樣第十六頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-均值抽樣分布的基本形式設(shè),總體有N個(gè)單位,其均值為μ,方差為σ2抽取樣本數(shù)n,樣本均值的數(shù)學(xué)期望為E(x),樣本方差為重復(fù)抽樣E(x)=μσx2
=σ2/n不重復(fù)抽樣E(x)=μ第十七頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-均值抽樣分布的基本形式例1:假設(shè)智商得分服從均值為100,標(biāo)準(zhǔn)差為16的正態(tài)分布。從總體中抽取容量為n的樣本,樣本標(biāo)準(zhǔn)差為2,則樣本容量為()A、16B、64C、8D無(wú)法確定例2:某大學(xué)的一家快餐店記錄了過(guò)去5年每天的營(yíng)業(yè)額,得到每天營(yíng)業(yè)額的均值為2500元,標(biāo)準(zhǔn)差為400。由于某些節(jié)日營(yíng)業(yè)額偏高,因此每日營(yíng)業(yè)額的分布是右偏的。假設(shè)從這5年里隨機(jī)抽取100天,計(jì)算平均營(yíng)業(yè)額。則樣本均值的抽樣分布是()A、正態(tài)分布,均值250元,標(biāo)準(zhǔn)差為40元;B、正態(tài)分布,均值2500元,標(biāo)準(zhǔn)差為40元;C、右偏,均值2500元,標(biāo)準(zhǔn)差400元;D、正態(tài)分布,均值2500元,標(biāo)準(zhǔn)差400元答案:BB第十八頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-均值抽樣分布的基本形式例3:總體共有1000個(gè)單位,均值為100,標(biāo)準(zhǔn)差為10,從中抽取一個(gè)容量為64的簡(jiǎn)單隨機(jī)樣本用于獲取總體的信息,則樣本均值得標(biāo)準(zhǔn)差為()A、0.91B、0.86C、1.21D0.58例2:如果上題中采用重復(fù)抽樣方式抽取樣本,則樣本均值的標(biāo)準(zhǔn)差為()A、0.97B、0.86C、1.25D1.45答案:CC第十九頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本比率的抽樣分布設(shè),總體有N個(gè)單位,具有某種屬性的單位數(shù)量為N0,具有另一種屬性的為N1則總體比率π=N0/N,N1/N=1-π相應(yīng)的樣本比率為p=n0/n,n1/n=1-p當(dāng)樣本容量足夠大,即np>=5和n(1-p)>=5的時(shí)候,樣本比率分布近似為正態(tài)分布重復(fù)抽樣E(p)=π
σp2
=π(1-π)/n不重復(fù)抽樣E(p)=π
第二十頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本比率的抽樣分布例:在某大學(xué)中,經(jīng)濟(jì)學(xué)專(zhuān)業(yè)的學(xué)生占20%。如果從該大學(xué)中隨機(jī)抽取100名學(xué)生進(jìn)行調(diào)查,樣本中經(jīng)濟(jì)學(xué)專(zhuān)業(yè)學(xué)生所占比例的期望值為()A、20%B、16%C、80%D、10%樣本中經(jīng)濟(jì)學(xué)專(zhuān)業(yè)學(xué)生所占比例的標(biāo)準(zhǔn)差為()A、0.04B、0.4C、0.5D、0.25答案:AA第二十一頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本方差的抽樣分布設(shè),總體有N個(gè)單位,方差為σ2
,樣本方差s2
,則設(shè)第二十二頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本方差的抽樣分布分布的特征分布形狀取決于自由度n的大小,通常為不對(duì)稱(chēng)的右偏分布,隨著自由度的增大逐漸趨于對(duì)稱(chēng)。第二十三頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本方差的抽樣分布例:假設(shè)總體服從分布,從該總體總抽取容量為100的樣本,則樣本均值的抽樣分布()A、服從分布B、近似正態(tài)分布C、二項(xiàng)分布D、F分布樣本方差與總體方差的比值的抽樣分布為()答案:BAA、服從分布B、近似正態(tài)分布C、二項(xiàng)分布D、F分布第二十四頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本方差的抽樣分布例:第一個(gè)分布的方差為10,第二個(gè)分布的方差為20,則它們的和的分布是(),方差是()A、服從分布B、近似正態(tài)分布C、二項(xiàng)分布D、F分布答案:ACBA、10B、20C、30D、15例:如果分布的均值為32,其標(biāo)準(zhǔn)差為()A、32B、8C、4D、16第二十五頁(yè),共三十五頁(yè),2022年,8月28日二、抽樣分布-樣本統(tǒng)計(jì)量的抽樣分布(總結(jié))樣本統(tǒng)計(jì)量樣本均值x樣本方差s2樣本比率pt分布正態(tài)總體或非正態(tài)總體大樣本非正態(tài)總體(小樣本)大樣本正態(tài)分布正態(tài)分布x2分布第二十六頁(yè),共三十五頁(yè),2022年,8月28日樣本均值之差的抽樣分布三、兩個(gè)樣本統(tǒng)計(jì)量的抽樣分布第二十七頁(yè),共三十五頁(yè),2022年,8月28日樣本均值之差的抽樣分布三、兩個(gè)樣本統(tǒng)計(jì)量的抽樣分布總體分布是非正態(tài)分布,n1>=30,n2>=30第二十八頁(yè),共三十五頁(yè),2022年,8月28日三、兩個(gè)統(tǒng)計(jì)樣本的抽樣分布(例題)例:當(dāng)兩個(gè)總體服從正態(tài)分布時(shí)候,從這兩個(gè)總體中分布抽取的兩個(gè)樣本均值的差服從分布()A、正態(tài)分布B、分布C、F分布D、無(wú)法確定例:對(duì)于任何分布的總體,當(dāng)樣本容量足夠大時(shí),兩個(gè)樣本均值之差的分布可以用()來(lái)近似。答案:AAA、正態(tài)分布B、分布C、F分布D、無(wú)法確定第二十九頁(yè),共三十五頁(yè),2022年,8月28日兩個(gè)樣本比率之差的抽樣分布三、兩個(gè)樣本統(tǒng)計(jì)量的抽樣分布兩個(gè)總體分布是二項(xiàng)分布,在重復(fù)選取容量為n1,n2的樣本,n1>=30,n2>=30第三十頁(yè),共三十五頁(yè),2022年,8月28日三、兩個(gè)統(tǒng)計(jì)樣本的抽樣分布(例題)例:甲校中男生所占比例為60%,乙校中男生所占比例40%,若果從甲校中隨機(jī)抽取100名學(xué)生,從乙校中隨機(jī)抽取100名學(xué)生,則甲乙兩校樣本中男生比例之差的期望值為()A、20%B、10%C、30%D、15%例:同上,甲乙兩校樣本中男生比例之差的方差為()答案:ACA、0.0024B、0.0025C、0.0048D、0.0055第三十一頁(yè),共三十五頁(yè),2022年,8月28日樣本方差比的抽
評(píng)論
0/150
提交評(píng)論