版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第九章統(tǒng)計(jì)9.1.2分層隨機(jī)抽樣復(fù)習(xí)
抽樣調(diào)查最核心的問(wèn)題是樣本的代表性.簡(jiǎn)單隨機(jī)抽樣是使總體中每一個(gè)個(gè)體都有相等的機(jī)會(huì)被抽中,但因?yàn)槌闃拥碾S機(jī)性,有可能會(huì)出現(xiàn)比較“極端”的樣本.例如,在對(duì)樹人中學(xué)高一年級(jí)學(xué)生身高的調(diào)查中,可能出現(xiàn)樣本中50個(gè)個(gè)體大部分來(lái)自高個(gè)子或矮個(gè)子的情形,這種“極端”樣本的平均數(shù)會(huì)大幅度地偏離總體平均數(shù),從而使得估計(jì)出現(xiàn)較大的誤差.能否利用總體中的一些額外信息對(duì)抽樣方法進(jìn)行改進(jìn)呢?問(wèn)題1:為了估計(jì)某班全體學(xué)生(共有50人,其中男生30人,女生20人)的平均身高,從班級(jí)學(xué)生中抽取出容量為10的樣本進(jìn)行調(diào)查,有幾種抽樣方法?方法1:用簡(jiǎn)單隨機(jī)抽樣從50人中抽取10人.方法2:從男生中抽取6人,從女生中抽取4人合成10人的樣本.思考2:剛剛得出的這兩種方法,哪種方法更為合理?為什么?方法2較好,因?yàn)槟信纳砀叽嬖诿黠@的差異.思考1:高一階段,影響學(xué)生身高的主要因素是什么呢?性別由于在男生和女生兩個(gè)群體中都抽取了相應(yīng)的個(gè)體,這樣就能有效地避免“極端”樣本.思考3:方法2考慮到了性別的因素,不會(huì)出現(xiàn)男女生人數(shù)偏多或偏少的問(wèn)題,但為什么男生、女生抽出的人數(shù)是6人和4人,而不是各抽5人呢?因?yàn)榭傮w中的男女生人數(shù)之比是3:2,而樣本是要反映總體,所以樣本中男女生之比是3:2.男生樣本量=×總樣本量女生樣本量=×總樣本量無(wú)論是男生還是女生,每個(gè)學(xué)生被抽到的可能性相等.問(wèn)題在樹人中學(xué)高一年級(jí)的712名學(xué)生中,男生有326名、女生有386名.能否利用這個(gè)輔助信息改進(jìn)簡(jiǎn)單隨機(jī)抽樣方法,減少“極端”樣本的出現(xiàn),從而提高對(duì)整個(gè)年級(jí)平均身高的估計(jì)效果呢?當(dāng)樣本量為50時(shí),應(yīng)如何分配?當(dāng)總樣本量為50時(shí),可以計(jì)算出從男生、女生分別應(yīng)抽取的人數(shù)為一般地,按一個(gè)或多個(gè)變量把總體劃分成若干個(gè)子總體,每個(gè)個(gè)體屬于且僅屬于一個(gè)子總體,在每個(gè)子總體中獨(dú)立地進(jìn)行簡(jiǎn)單隨機(jī)抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機(jī)抽樣.層:每一個(gè)子總體稱為層.在分層抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.思考:如何進(jìn)行分層抽樣?步驟是什么?
每一層抽取的個(gè)體數(shù)=抽樣比×該層個(gè)體數(shù)分層——計(jì)算抽樣比——定數(shù)——抽樣——成樣我們按照上述方法抽取了一個(gè)容量為50的樣本,其觀測(cè)數(shù)據(jù)(單位:cm)如下:通過(guò)計(jì)算,得出男生和女生身高的樣本平均數(shù)分別為170.6,160.6.
男生:173.0174.0166.0172.0170.0165.0165.0168.0164.0173.0172.0
173.0175.0168.0170.0172.0176.0175.0168.0173.0167.0170.0175.0女生:163.0164.0161.0157.0162.0165.0158.0155.0164.0162.5154.0154.0164.0
149.0159.0161.0170.0171.0155.0148.0172.0162.5158.0155.5157.0163.0172.0根據(jù)男生、女生身高的樣本平均數(shù)以及它們各自的人數(shù),可以估計(jì)總體平均數(shù)為即估計(jì)樹人中學(xué)高一年級(jí)學(xué)生的平均身高在165.2cm左右.上面我們按性別變量,把高一學(xué)生劃分為男生、女生兩個(gè)身高差異較小的子總體分別進(jìn)行抽樣,進(jìn)而得到總體的估計(jì).問(wèn)題5:為什么分層隨機(jī)抽樣能用樣本平均數(shù)估計(jì)總體平均數(shù)?在分層隨機(jī)抽樣中,如果層數(shù)分為2層,第1層和第2層包含的個(gè)體數(shù)分別為M和N,抽取的樣本量分別為m和n.我們用X1,X2,…,XM表示第1層各個(gè)個(gè)體的變量值,用x1,x2,…,xm表示第1層被抽取樣本的各個(gè)個(gè)體的變量值;用Y1,Y2,…,YN表示第2層各個(gè)個(gè)體的變量值,用y1,y2,…,yn表示第2層被抽取樣本的各個(gè)個(gè)體的變量值,總體平均數(shù)樣本平均數(shù)第1層第2層總體
探究:與考察簡(jiǎn)單隨機(jī)抽樣估計(jì)效果類似,小明也想通過(guò)多次抽樣考察一下分層隨機(jī)抽樣的估計(jì)效果.他用比例分配的分層隨機(jī)抽樣方法,從高一年級(jí)的學(xué)生中抽取了10個(gè)樣本量為50的樣本,計(jì)算出樣本平均數(shù)如下表所示,與上一小節(jié)“探究”中相同樣本量的簡(jiǎn)單隨機(jī)抽樣的結(jié)果比較,小明有了一個(gè)重要的發(fā)現(xiàn).你是否也有所發(fā)現(xiàn)?抽樣序號(hào)12345678910男生樣本的平均數(shù)170.0170.7169.8171.7172.7171.9171.6170.6172.6170.9女生樣本的平均數(shù)162.2160.3159.7158.1161.1158.4159.7160.0160.6160.2總樣本的平均數(shù)165.8165.1164.3164.3166.4164.6165.2164.9166.1165.1我們把分層隨機(jī)抽樣的平均數(shù)與上一小節(jié)樣本量為50的簡(jiǎn)單隨機(jī)抽樣的平均數(shù)用下圖形進(jìn)行表示,其中粉紅線表示整個(gè)年級(jí)學(xué)生身高的平均數(shù).從試驗(yàn)結(jié)果看,分層隨機(jī)抽樣的樣本平均數(shù)圍繞總體平均數(shù)波動(dòng),與簡(jiǎn)單隨機(jī)抽樣的結(jié)果比較,分層抽樣并沒(méi)有明顯優(yōu)于簡(jiǎn)單隨機(jī)抽樣.但相對(duì)而言,分層隨機(jī)抽樣的樣本平均數(shù)波動(dòng)幅度更均勻,簡(jiǎn)單隨機(jī)抽樣中出現(xiàn)了(第2個(gè))偏離總體平均數(shù)的幅度較大的樣本平均數(shù),即出現(xiàn)了比較“極端”的樣本,而分層隨機(jī)抽樣沒(méi)有出現(xiàn).實(shí)際上,在個(gè)體之間差異較大的情形下,只要選取的分層變量合適,使得各層間差異明顯、層內(nèi)差異不大,分層隨機(jī)抽樣的效果一般會(huì)好于簡(jiǎn)單隨機(jī)抽樣,也好于很多其他抽樣方法.分層隨機(jī)抽樣的組織實(shí)施也比簡(jiǎn)單隨機(jī)抽樣方便,而且除了能得到總體的估計(jì)外,還能得到每層的估計(jì).選擇抽樣方法的規(guī)律:(1)當(dāng)總體的個(gè)體數(shù)和樣本量都較小時(shí),可采用抽簽法.(2)當(dāng)總體的個(gè)體數(shù)較大,樣本量較小時(shí),可采用隨機(jī)數(shù)法.(3)當(dāng)總體按一個(gè)或多個(gè)變量可劃分為若干個(gè)層時(shí),采用分層隨機(jī)抽樣.第九章統(tǒng)計(jì)9.1.3獲取數(shù)據(jù)的途徑
獲取數(shù)據(jù)的途徑獲取數(shù)據(jù)的基本途徑有:(1)通過(guò)________獲取數(shù)據(jù);(2)通過(guò)________獲取數(shù)據(jù);(3)通過(guò)________獲取數(shù)據(jù);(4)通過(guò)________獲取數(shù)據(jù).調(diào)查試驗(yàn)觀察查詢練習(xí)1:要得到某鄉(xiāng)鎮(zhèn)的貧困人口數(shù)據(jù),應(yīng)采取的方法是 (
)A.通過(guò)調(diào)查獲取數(shù)據(jù)
B.通過(guò)試驗(yàn)獲取數(shù)據(jù)C.通過(guò)觀察獲取數(shù)據(jù)
D.通過(guò)查詢獲取數(shù)據(jù)【答案】A
【解析】某鄉(xiāng)鎮(zhèn)的貧困人口數(shù)據(jù)屬于有限總體問(wèn)題,所以可以通過(guò)調(diào)查獲取數(shù)據(jù).練習(xí)2:利用統(tǒng)計(jì)報(bào)表和年鑒屬于哪種獲取數(shù)據(jù)的途徑?屬于通過(guò)查詢獲取數(shù)據(jù)的途徑.當(dāng)堂檢測(cè)2.有A,B,C三種零件,分別為a個(gè)、300個(gè)、200個(gè),采取分層抽樣法抽取一個(gè)容量為45的樣本,A種零件被抽取20個(gè),則此三種零件共有()A.700個(gè)B.800個(gè)C.900個(gè)D.1000個(gè)
C3.某工廠生產(chǎn)A、B、C三種不同型號(hào)的產(chǎn)品,產(chǎn)品數(shù)量之比依次為2∶3∶5.現(xiàn)用分層抽樣方法抽出一
個(gè)容量為n的樣本,樣本中A種型號(hào)產(chǎn)品有16件,那么此樣本的容量______.
804.我校高中生共有2700人,其中高一年級(jí)900人,高二年級(jí)1200人,高三年級(jí)600人,現(xiàn)采取分層抽樣法抽取容量為135的樣本,那么高一、高二、高三各年級(jí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 辦公室租賃合同模板
- 招標(biāo)文件范本的標(biāo)準(zhǔn)制作流程
- 軟件采購(gòu)合同樣式
- 碎石采購(gòu)協(xié)議書格式
- 創(chuàng)新服務(wù)采購(gòu)協(xié)議
- 租房合同解除協(xié)議書范文
- 工程分包合同中的勞務(wù)培訓(xùn)計(jì)劃與實(shí)施
- 蔬菜購(gòu)銷合同的解除注意事項(xiàng)
- 礦機(jī)設(shè)備購(gòu)買合同示范
- 三方協(xié)議服務(wù)共贏
- 寵物醫(yī)療創(chuàng)新創(chuàng)業(yè)
- 報(bào)價(jià)單(產(chǎn)品報(bào)價(jià)單)
- 項(xiàng)目經(jīng)理及主要管理人員能力水平
- 工程倫理-工程案例分析
- 纜車合唱鋼琴伴奏譜
- 小學(xué)四年級(jí)上冊(cè)數(shù)學(xué)集體備課-記錄
- 《國(guó)家心力衰竭指南 2023》解讀
- 人才教育培訓(xùn)部門KPI設(shè)計(jì)
- 醫(yī)療設(shè)備培訓(xùn)方案
- 基層醫(yī)院外科發(fā)展現(xiàn)狀及展望
- 天津市天津市河?xùn)|區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末地理試題(含答案解析)
評(píng)論
0/150
提交評(píng)論