9.1.2-3分層抽樣和獲取數(shù)據(jù)的途徑公開課_第1頁
9.1.2-3分層抽樣和獲取數(shù)據(jù)的途徑公開課_第2頁
9.1.2-3分層抽樣和獲取數(shù)據(jù)的途徑公開課_第3頁
9.1.2-3分層抽樣和獲取數(shù)據(jù)的途徑公開課_第4頁
9.1.2-3分層抽樣和獲取數(shù)據(jù)的途徑公開課_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

人教A版2019高中數(shù)學(xué)必修第二冊9.1.2分層隨機抽樣9.1.3獲取數(shù)據(jù)的途徑1知識回顧抽簽法

2.最常用的簡單隨機抽樣隨機數(shù)法

一般地,設(shè)一個總體含有N個個體,從中逐個地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,這種抽樣方法叫做簡單隨機抽樣.1.簡單隨機抽樣的概念3.總體均值與樣本均值2分層隨機抽樣

抽樣調(diào)查最核心的問題是樣本的代表性.簡單隨機抽樣是使總體中每一個個體都有相等的機會被抽中,但因為抽樣的隨機性,有可能會出現(xiàn)比較“極端”的樣本.

能否利用總體中的一些額外信息對抽樣方法進行改進呢?例如,在對樹人中學(xué)高一年級學(xué)生身高的調(diào)查中,可能出現(xiàn)樣本中50個個體大部分來自高個子或矮個子的情形,這種“極端”樣本的平均數(shù)會大幅度地偏離總體平均數(shù),從而使得估計出現(xiàn)較大的誤差.2分層隨機抽樣問題1

在樹人中學(xué)高一年級的712名學(xué)生中,男生有326名、女生有386名.能否利用這個輔助信息改進簡單隨機抽樣方法,減少“極端”樣本的出現(xiàn),從而提高對整個年級平均身高的估計效果呢?

對男生、女生分別進行簡單隨機抽樣,樣本量在男生、女生中應(yīng)如何分配?2分層隨機抽樣

自然地,為了使樣本的結(jié)構(gòu)與總體的分布相近,人數(shù)多的群體應(yīng)多抽一些,人數(shù)少的群體應(yīng)少抽一些因此,按男生、女生在全體學(xué)生中所占的比例進行分配是一種比較合理的方式,即男生樣本量=×總樣本量女生樣本量=×總樣本量

這樣無論是男生還是女生,每個學(xué)生抽到的概率都相等.當(dāng)總樣本量為50時,可以計算出從男生、女生中分別應(yīng)抽取的人數(shù)為n男=×50≈23,n女=×50≈27.2分層隨機抽樣173.0174.0166.0172.0170.0165.0165.0168.0164.0173.0172.0173.0175.0168.0170.0172.0176.0175.0168.0173.0167.0170.0175.0163.0164.0161.0157.0162.0165.0158.0155.0164.0162.5154.0154.0164.0149.0159.0161.0170.0171.0155.0148.0172.0162.5158.0155.5157.0163.0172.0

通過計算,得出男生和女生身高的樣本平均數(shù)分別為170.6、160.6.根據(jù)男生、女生身高的樣本平均數(shù)以及他們各自的人數(shù),可以估計總體平均數(shù)為165.2,即估計樹人中學(xué)高一年級學(xué)生的平均身高在165.2cm左右.

這樣我們按性別變量,把高一學(xué)生劃分為男生、女生兩個身高差異較小的子總體分別進行抽樣,進而得到總體的估計.我們按上述方法抽取了一個容量為50的樣本,其觀測數(shù)據(jù)(單位:cm)如下:女生男生2分層隨機抽樣

一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.分層隨機抽樣的概念2分層隨機抽樣分層隨機抽樣的步驟(1)分層:按某種特征將總體分成若干層;(2)確定每層抽取個體的個數(shù);(3)各層分別按簡單隨機抽樣方法抽取;(4)綜合每層抽樣,組成樣本.2分層隨機抽樣例1.某校高三年級有男生500人,女生400人,為了解該年級學(xué)生的健康狀況,從男生中任意抽取25人,從女生中任意抽取20人進行調(diào)查.這種抽樣方法是()A.簡單隨機抽樣B.抽簽法C.隨機數(shù)表法D.分層隨機抽樣D例2、某高中共有900人,其中高一年級300人,高二年級200人,高三年級400人,現(xiàn)采用比例分配的分層隨機抽樣抽取容量為45的樣本,那么高一、

高二、高三各年級抽取的人數(shù)分別為()

A.15,5,25B.15,15,15

C.10,5,30D.15,10,20D每一層抽取的樣本數(shù)=×總樣本量該層個體數(shù)總體個體數(shù)=抽樣比例×該層個體數(shù)2分層隨機抽樣例3.某企業(yè)三月中旬生產(chǎn)A,B,C三種產(chǎn)品共3000件,根據(jù)樣本量比例分配的分層隨機抽樣的結(jié)果,企業(yè)統(tǒng)計員制作了如下的統(tǒng)計表格:由于不小心,表格中A,C產(chǎn)品的有關(guān)數(shù)據(jù)已被污染看不清楚了,統(tǒng)計員只記得A產(chǎn)品的樣本量比C產(chǎn)品的樣本量多10,根據(jù)以上信息,可得C產(chǎn)品的數(shù)量是

件.

2分層隨機抽樣(練習(xí))1.某中學(xué)有高中生3500人,初中生1500人.為了解學(xué)生的學(xué)習(xí)情況,用分層抽樣的方法從該校學(xué)生中抽取一個容量為n的樣本,已知從高中生中抽取70人,則n為()A.100B.150C.200D.250A(練習(xí))2.某大學(xué)為了解在校本科生對參加某項社會實踐活動的意向,擬采用分層抽樣的方法,從該校四個年級的本科生中抽取一個容量為300的樣本進行調(diào)查.已知該校一年級、二年級、三年級、四年級的本科生人數(shù)之比為4∶5∶5∶6,則應(yīng)從一年級本科生中抽取____名學(xué)生.602分層隨機抽樣分層隨機抽樣的平均數(shù)例1.某地區(qū)有居民600戶,其中普通家庭450戶、高收入家庭150戶.為了調(diào)查該地區(qū)居民奶制品月消費支出,決定采用分層隨機抽樣的方法,按普通家庭、高收入家庭進行分層,如果樣本量為60,那么在普通家庭、高收入家庭中分別抽取了多少戶?得到普通家庭、高收入家庭的奶制品平均月消費支出分別為40元和90元.在這種情況下,請估計該地區(qū)全體居民奶制品的平均月消費支出.例1.某地區(qū)有居民600戶,其中普通家庭450戶、高收入家庭150戶.為了調(diào)查該地區(qū)居民奶制品月消費支出,決定采用分層隨機抽樣的方法,按普通家庭、高收入家庭進行分層,如果樣本量為60,那么在普通家庭、高收入家庭中分別抽取了多少戶?得到普通家庭、高收入家庭的奶制品平均月消費支出分別為40元和90元.在這種情況下,請估計該地區(qū)全體居民奶制品的平均月消費支出.2分層隨機抽樣分層隨機抽樣的平均數(shù)1.在簡單隨機抽樣中如何估計總體平均數(shù)?2.那么在分層隨機抽樣中如何估計總體平均數(shù)呢?是否也可以直接用樣本平均數(shù)進行估計?

在分層隨機抽樣中,如果層數(shù)分為2層,第1層和第2層包含的個體數(shù)分別為M和N,抽取的樣本量分別m和n.我們用X1,X2,…,XM表示第1層各個個體的變量值,用x1,x2,…,xm表示第1層被抽取樣本的各個個體的變量值;用Y1,Y2,…,YN表示第2層各個個體的變量值,用y1,y2,…,yn表示第2層被抽取樣本的各個個體的變量值,這樣:2分層隨機抽樣第1層的總體平均數(shù)和樣本平均數(shù)分別為第2層的總體平均數(shù)和樣本平均數(shù)分別為總體平均數(shù)和樣本平均數(shù)分別為2分層隨機抽樣

由于可以用第1層的樣本平均數(shù)估計第1層的總體平均數(shù),可以用第2層的樣本平均數(shù)估計第2層的總體平均數(shù),因此我們可以用估計總體平均數(shù).在比例分配的分層隨機抽樣中,可得

因此,在比例分配的分層隨機抽樣中,我們可以直接用樣本平均數(shù)估計總體平均數(shù).練習(xí).

某地區(qū)有高中生7200人,初中生11800人,小學(xué)生12000人.當(dāng)?shù)亟逃块T為了了解本地區(qū)中小學(xué)生的近視率,決定采用分層隨機抽樣的方法,按高中生、初中生、小學(xué)生進行分層,得到高中生、初中生、小學(xué)生的近視率分別為80%,70%和36%.(1)如果在各層中按比例分配樣本,總樣本量為310,那么在高中生、初中生、小學(xué)生中分別抽取了多少人?在這種情況下,請估計該地區(qū)全體中小學(xué)生的近視率.在比例分配的分層隨機抽樣中,我們直接用樣本平均數(shù)估計總體平均數(shù),所以可以估計該地區(qū)全體中小學(xué)生的近視率為59%.練習(xí).

某地區(qū)有高中生7200人,初中生11800人,小學(xué)生12000人.當(dāng)?shù)亟逃块T為了了解本地區(qū)中小學(xué)生的近視率,決定采用分層隨機抽樣的方法,按高中生、初中生、小學(xué)生進行分層,得到高中生、初中生、小學(xué)生的近視率分別為80%,70%和36%.(2)如果從高中生、初中生、小學(xué)生中抽取的樣本量分別為60,100和150,那么在這種情況下,抽取的樣本的近視率是多少?該地區(qū)全體中小學(xué)生的近視率約為多少?2分層隨機抽樣選擇抽樣方法的規(guī)律:(1)當(dāng)總體的個體數(shù)和樣本量都較小時,可采用抽簽法.(2)當(dāng)總體的個體數(shù)較大,樣本量較小時,可采用隨機數(shù)法.(3)當(dāng)總體按一個或多個變量可劃分為若干個層時,采用分層隨機抽樣.2分層隨機抽樣分層隨機抽樣的步驟(1)分層:按某種特征將總體分成若干層;(2)確定每層抽取個體的個數(shù);(3)各層分別按簡單隨機抽樣方法抽取;(4)綜合每層抽樣,組成樣本.3獲取數(shù)據(jù)的途徑1.通過調(diào)查獲取數(shù)據(jù):對于有限總體問題,一般通過抽樣調(diào)查或普查的方法獲取數(shù)據(jù).2.通過試驗獲取數(shù)據(jù):通過試驗獲取數(shù)據(jù)時,我們需要嚴格控制試驗環(huán)境,通過精心的設(shè)計安排試驗,以提高數(shù)據(jù)質(zhì)量,為獲得好的分析結(jié)果奠定基礎(chǔ).3獲取數(shù)據(jù)的途徑3.通過觀察獲取數(shù)據(jù):通過觀察自然現(xiàn)象所獲取的數(shù)據(jù)性質(zhì)比較復(fù)雜,其中蘊含著所觀察現(xiàn)象的本質(zhì)信息,這些信息十分寶貴,統(tǒng)計學(xué)理論和方法是挖掘這些信息的強有力的工具之一.3獲取數(shù)據(jù)的途徑4.通過查詢獲得數(shù)據(jù):我們可以收集前人的勞動成果并加以利用,從而減少收集數(shù)據(jù)的成本.我們往往把這樣獲得的數(shù)據(jù)叫做二手數(shù)據(jù).隨著信息技術(shù)的發(fā)展,通過互聯(lián)網(wǎng)獲取數(shù)據(jù)越來越成為獲取二手數(shù)據(jù)的主要方式.但從網(wǎng)絡(luò)上查找的數(shù)據(jù),因為數(shù)據(jù)來歷和渠道多樣,所以質(zhì)量會參差不齊,必須根據(jù)問題背景知識“清洗”數(shù)據(jù),去偽存真,為進一步的數(shù)據(jù)分析奠定基礎(chǔ)。3獲取數(shù)據(jù)的途徑3獲取數(shù)據(jù)的途徑例1.為了了解某市2019年高考各高中學(xué)校本科上線人數(shù),收集數(shù)據(jù)進行統(tǒng)計,其中獲取數(shù)據(jù)的途徑采用什么樣的方法比較合適(

)A.通過調(diào)查獲取數(shù)據(jù)B.通過試驗獲取數(shù)據(jù)C.通過觀察獲取數(shù)據(jù)D.通過查詢獲取數(shù)據(jù)【答案】D3獲取數(shù)據(jù)的途徑例2.下列收集數(shù)據(jù)的方法比較恰當(dāng)?shù)挠校?/p>

)A.為了了解某年級學(xué)生每天參加體育鍛煉的時間,采用問卷調(diào)查的方法獲取數(shù)據(jù)B.銀行對公司10萬元存款的現(xiàn)鈔的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論