隨機抽樣與正態(tài)分布_第1頁
隨機抽樣與正態(tài)分布_第2頁
隨機抽樣與正態(tài)分布_第3頁
隨機抽樣與正態(tài)分布_第4頁
隨機抽樣與正態(tài)分布_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

隨機抽樣與正態(tài)分布第1頁,共29頁,2023年,2月20日,星期日1.了解分布的意義和作用,會列頻率分布表,會畫頻率分布直方圖、頻率折線圖、莖葉圖,理解它們各自的特點.2.理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,會計算數(shù)據(jù)標(biāo)準(zhǔn)差.3.能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并做出合理的解釋.第2頁,共29頁,2023年,2月20日,星期日4.會用樣本的頻率分布估計總體分布,會用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征,理解用樣本估計總體的思想.5.會用隨機抽樣的基本方法和樣本估計總體的思想,解決一些簡單的實際問題.6.通過實際問題,借助直觀(如實際問題的直方圖),認(rèn)識正態(tài)分布曲線的特點及曲線所表示的意義.第3頁,共29頁,2023年,2月20日,星期日1.某初級中學(xué)共有30個班,其中初一有12個班,初二有12個班,初三有6個班.現(xiàn)從中抽出5個班進行調(diào)查,則應(yīng)在初三6個班中抽取

個班.12.把數(shù)據(jù)x1,x2,…,xn分成若干組,已知某數(shù)xi的頻數(shù)和頻率分別為4和0.125,則n的值是()CA.16B.24C.32D.64第4頁,共29頁,2023年,2月20日,星期日3.數(shù)據(jù)5,10,73,1,3,105,111的中位數(shù)與極差的差為

.-100因為中位數(shù)是10,極差是111-1=110,故所求的值為10-110=-100.4.將一組數(shù)據(jù)同時減去3.1,得到一組新數(shù)據(jù),若原數(shù)據(jù)的平均數(shù)、方差分別為s2,則新數(shù)據(jù)的平均數(shù)是

,方差是

.-3.1s2第5頁,共29頁,2023年,2月20日,星期日設(shè)=(x1+x2+…+xn),則=[(x1-3.1)+(x2-3.1)+…+(xn-3.1)]

=-3.1.s′2=(xi′-)2=[(xi-3.1)-(-3.1)]2=(xi-)2=s2.第6頁,共29頁,2023年,2月20日,星期日1.數(shù)據(jù)的基本數(shù)字特征(1)平均數(shù):一組數(shù)據(jù)的平均數(shù),記為.設(shè)有n個數(shù)據(jù)x1,x2,…,xn,則平均數(shù)為

=①

.(2)中位數(shù):一組數(shù)據(jù)按照從小到大或從大到小的順序進行排列時,處于中間位置的數(shù).當(dāng)這組數(shù)據(jù)的個數(shù)為奇數(shù)時,中位數(shù)為中間一個數(shù);當(dāng)這組數(shù)據(jù)的個數(shù)為偶數(shù)時,中位數(shù)為中間的兩個數(shù)的平均數(shù).第7頁,共29頁,2023年,2月20日,星期日(3)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).(4)極差:一組數(shù)據(jù)中最大數(shù)與最小數(shù)的差.(5)方差:一組數(shù)據(jù)中所有數(shù)與平均數(shù)的差的平方和的平均數(shù),記為s2,即s2=②

.(6)標(biāo)準(zhǔn)差:方差的算術(shù)平方根,記作s.2.主要統(tǒng)計圖表(1)基本統(tǒng)計圖表:象形、條形、折線、扇形統(tǒng)計圖.第8頁,共29頁,2023年,2月20日,星期日(2)頻率分布直方圖的畫圖步驟:(ⅰ)求極差;(ⅱ)決定組距與組數(shù);(ⅲ)將數(shù)據(jù)分組;(ⅳ)列頻率分布表;(ⅴ)畫頻率分布直方圖(以頻率組距為縱坐標(biāo)).(3)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點所得的折線.(4)總體密度曲線:隨著樣本容量的增加,作頻率分布折線圖時所分的組數(shù)增加,組距減小,相應(yīng)的頻率折線圖會越來越接近于一條光滑曲線,則稱這條光滑曲線為總體密度曲線.第9頁,共29頁,2023年,2月20日,星期日(5)莖葉圖:中間的數(shù)字表示數(shù)據(jù)的十位數(shù)字,旁邊的數(shù)字分別表示兩組數(shù)據(jù)中各個數(shù)據(jù)的個位數(shù)字.3.抽樣方法(1)簡單隨機抽樣:從含有N個個體的總體中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,就把這種抽樣方法叫做③

.有兩種常用方法:簡單隨機抽樣第10頁,共29頁,2023年,2月20日,星期日(ⅰ)④

:就是把總體中的N個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中取出一個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本.(ⅱ)⑤

:利用隨機數(shù)表、隨機數(shù)骰子或計算機產(chǎn)生的隨機數(shù)進行抽樣.(2)系統(tǒng)抽樣:按下列步驟進行抽樣:(ⅰ)先將總體的N個個體編號;(ⅱ)確定分段間隔k,對編號進行分段;(ⅲ)在第1段用簡單隨機抽樣確定第一個個體編號l(l≤k);(ⅳ)按照一定的規(guī)則抽取樣本.抽簽法隨機數(shù)表法第11頁,共29頁,2023年,2月20日,星期日

(3)分層抽樣:即⑥

.

.

..

在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽出一定數(shù)量的個體,將各層取出的個體合在一起作為樣本第12頁,共29頁,2023年,2月20日,星期日題型一抽樣方法例1在我國東南沿海有60個人均GDP在3萬元以上的城市,其中人均GDP在3~4萬元之間的有36個,在4~5萬元之間的有18個,在5萬元以上的有6個.國家環(huán)??偩钟梅謱映闃訌闹须S機抽取部分城市進行環(huán)境調(diào)查,若抽取的人均GDP在4~5萬元之間的城市個數(shù)為3,則抽取的人均GDP在3~4萬元之間的城市個數(shù)為.第13頁,共29頁,2023年,2月20日,星期日根據(jù)分層抽樣的特征,在各層抽取的比例是相同的,故可先依據(jù)已知求出這個比例,再求解.抽取的人均GDP在4~5萬元之間的城市的比例為,故抽取的人均GDP在3~4萬元之間的城市的比例也是,則抽取的城市個數(shù)為36×=6.分層抽樣在各層抽取樣本的比例是相等的,這是解決分層抽樣計算問題的主要依據(jù).第14頁,共29頁,2023年,2月20日,星期日題型二頻率分布表與頻率分布直方圖例2在生產(chǎn)過程中,測得纖維產(chǎn)品的纖度(表示纖維粗細(xì)的一種量)共有100個數(shù)據(jù),數(shù)據(jù)分組如下表分組[1.30,1.34)[1.34,1.38)[1.38,1.42)[1.42,1.46)[1.46,1.50)[1.50,1.54)合計頻數(shù)4253029102100第15頁,共29頁,2023年,2月20日,星期日(1)完成頻率分布表,并在給定的坐標(biāo)系中畫出頻率分布直方圖;分組頻數(shù)頻率[1.30,1.34)40.04[1.34,1.38)250.25[1.38,1.42)300.30[1.42,1.46)290.29[1.46,1.50)100.10[1.50,1.54)20.02合計1001第16頁,共29頁,2023年,2月20日,星期日第17頁,共29頁,2023年,2月20日,星期日(2)估計纖度落在[1.38,1.50)中的概率及纖度小于1.40的概率是多少?(3)統(tǒng)計方法中,同一組數(shù)據(jù)常用該組區(qū)間的中點值(例如區(qū)間[1.30,1.34)的中點值是1.32)作為代表.據(jù)此,估計纖度的眾數(shù),平均數(shù),中位數(shù).第18頁,共29頁,2023年,2月20日,星期日分組頻數(shù)頻率[1.30,1.34)40.04[1.34,1.38)250.25[1.38,1.42)300.3[1.42,1.46)290.29[1.46,1.50)100.10[1.50,1.54)20.02合計1001.00(1)頻率分布表為:第19頁,共29頁,2023年,2月20日,星期日第20頁,共29頁,2023年,2月20日,星期日(2)纖度落在[1.38,1.50)中的概率約為0.30+0.29+0.10=0.69,纖度小于1.40的概率約為0.04+0.25+12×0.30=0.44.(3)總體數(shù)據(jù)的平均數(shù)約為1.32×0.04+1.36×0.25+1.40×0.30+1.44×0.29+1.48×0.10+1.52×0.02=1.4088.第21頁,共29頁,2023年,2月20日,星期日

1.解答本題時,第(1)問首先需計算出每組的頻率(利用頻數(shù)100);第(2)問注意[1.38,1.42)中既有小于1.40,又有大于1.40的,可以認(rèn)為各一半;第(3)問先計算出中點的概率,然后根據(jù)平均數(shù)的定義求解.

2.本題主要考查頻率分布直方圖、頻率、期望等概念和用樣本頻率估計整體分布的統(tǒng)計方法,考查運用概率、統(tǒng)計知識解決實際問題的能力.第22頁,共29頁,2023年,2月20日,星期日題型三樣本的數(shù)字特征估計總體例3對甲、乙兩名自行車賽手在相同條件下進行了6次測試,測得他們的最大速度(m/s)的數(shù)據(jù)如下表:(1)畫出莖葉圖,由莖葉圖你能獲得哪些信息?(2)分別求出甲、乙兩名自行車賽手最大速度(m/s)數(shù)據(jù)的平均數(shù)、中位數(shù)、標(biāo)準(zhǔn)差,并判斷選誰參加比賽更合適.甲273830373531乙332938342836第23頁,共29頁,2023年,2月20日,星期日

(1)畫莖葉圖,中間數(shù)為數(shù)據(jù)的十位數(shù)字:

從這個莖葉圖上可以看出,甲、乙的最大速度情況都是分布均勻的,只是乙更好一些;乙的中位數(shù)是33.5,甲的中位數(shù)是33.因此,乙發(fā)揮比較穩(wěn)定,總體情況比甲好.(2)=33,=33;s甲=3.96,s乙=3.56;甲的中位數(shù)是33,乙的中位數(shù)是33.5.綜合比較,選乙參加比賽較為合適.第24頁,共29頁,2023年,2月20日,星期日1.統(tǒng)計的基本思想方法是用樣本估計總體,即用局部推斷整體,這就要求樣本應(yīng)具有很好的代表性,而樣本良好客觀的代表性,完全依賴抽樣方法,弄清簡單隨機抽樣和分層抽樣的客觀合理性,從而會在不同的情況下采用適當(dāng)?shù)某闃臃椒?掌握三種抽樣方法的抽樣步驟.第25頁,共29頁,2023年,2月20日,星期日三種抽樣方法的比較:類別共同點各自特點相互聯(lián)系適用范圍簡單隨機抽樣①抽樣過程中每個個體被抽取的概率是相等的;②均屬于不放回抽樣從總體中逐個抽取最基本的抽樣方法總體中的個體數(shù)較少分層抽樣將總體分成幾層進行抽取各層抽樣時采用簡單隨機抽樣總體由差異明顯的幾部分組成系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多第26頁,共29頁,2023年,2月20日,星期日2.頻率分布直方圖會使樣本的一些數(shù)字特征更明顯,繪制頻率分布直方圖時,要合理分組,以便使數(shù)據(jù)中的特征能更好地反映出來.總體分布估計中,(1)先確定分組的組數(shù),其方法是:最大數(shù)據(jù)與最小數(shù)據(jù)之差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論