版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 高中數(shù)學必修3知識點總結第二章 統(tǒng)計2.1.1 簡單隨機抽樣1簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取調查單位。特點是:每個樣本單位被抽中的可能性一樣(概率相等),樣本的每個單位完全獨立,彼此間無一定的關聯(lián)性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數(shù)目較少時,才采用這種方法。2簡單隨機抽樣常用的方法: (1)抽簽法;隨機數(shù)表法;計算機模擬法;使用統(tǒng)計軟件直接抽取。在簡單隨機抽樣的樣本容量設計中,主要考慮:總體變異情況;允許誤差圍;概率保證程度。3抽簽法: (1)給調查對象群體中的每一個對象編號; (2)準
2、備抽簽的工具,實施抽簽 (3)對樣本中的每一個個體進行測量或調查 例:請調查你所在的學校的學生做喜歡的體育活動情況。4隨機數(shù)表法: 例:利用隨機數(shù)表在所在的班級中抽取10位同學參加某項活動。2.1.2系統(tǒng)抽樣1系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應是隨機的,即不存在某種與研究變量相關的規(guī)則分布。可以在調查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分
3、布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調查指標相關的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。2.1.3分層抽樣1分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構成總體的樣本。兩種方法:1先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2先以分層變量將
4、總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質性較強的總體分成一個個同質性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。分層標準:(1)以調查所要分析和研究的主要變量或相關的變量作為分層的標準。(2)以保證各層部同質性強、各層之間異質性強、突出總體在結構的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3分層的比例問題: (1)按比例分層抽樣:根據(jù)各種類型或層次中的單位數(shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。 (2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,
5、此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權處理,調整樣本中各層的比例,使數(shù)據(jù)恢復到總體中各層實際的比例結構。例1 某大學為了支援我國西部教育事業(yè),決定從2007應屆畢業(yè)生報名的18名志愿者中,選取6人組成志愿小組.請用抽簽法和隨機數(shù)表法設計抽樣方案.解 抽簽法:第一步:將18名志愿者編號,編號為1,2,3,18.第二步:將18個分別寫在18外形完全一樣的紙條上,并揉成團,制成號簽;第三步:將18個號簽放入一個不透明的盒子里,充分攪勻;第四步:從盒子中逐個抽取6個號簽,并記錄上面的編號;第五步:所得對應的志
6、愿者,就是志愿小組的成員.隨機數(shù)表法:第一步:將18名志愿者編號,編號為01,02,03,18.第二步:在隨機數(shù)表中任選一數(shù)作為開始,按任意方向讀數(shù),比如第8行第29列的數(shù)7開始,向右讀;第三步:從數(shù)7開始,向右讀,每次取兩位,凡不在0118中的數(shù),或已讀過的數(shù),都跳過去不作記錄,依次可得到12,07,15,13,02,09.第四步:找出以上對應的志愿者,就是志愿小組的成員.例2 某工廠有1 003名工人,從中抽取10人參加體檢,試用系統(tǒng)抽樣進行具體實施.解 (1)將每個人隨機編一個號由0001至1003.(2)利用隨機數(shù)法找到3個號將這3名工人剔除. (3)將剩余的1 000名工人重新隨機編
7、號由0001至1000.(4)分段,取間隔k=100將總體均分為10段,每段含100個工人.(5)從第一段即為0001號到0100號中隨機抽取一個號l.(6)按編號將l,100+l,200+l,,900+l共10個選出,這10個所對應的工人組成樣本.例3 (14分)某一個地區(qū)共有5個鄉(xiāng)鎮(zhèn),人口3萬人,其中人口比例為32523,從3萬人中抽取一個300人 的樣本,分析某種疾病的發(fā)病率,已知這種疾病與不同的地理位置與水土有關,問應采取什么樣的方法?并寫出具體過程.解 應采取分層抽樣的方法.過程如下:(1)將3萬人分為五層,其中一個鄉(xiāng)鎮(zhèn)為一層.(2)按照樣本容量的比例隨機抽取各鄉(xiāng)鎮(zhèn)應抽取的樣本.30
8、0=60(人);300=40(人);300=100(人);300=40(人);300=60(人),因此各鄉(xiāng)鎮(zhèn)抽取人數(shù)分別為60人,40人,100人,40人,60人.(3)將300人組到一起即得到一個樣本.2.2.2用樣本的數(shù)字特征估計總體的數(shù)字特征1、本均值:2、樣本標準差:3用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標準差并不是總體的真正的分布、均值和標準差,而只是一個估計,但這種估計是合理的,特別是當樣本量很大時,它們確實反映了總體的信息。4(1)如果把一組數(shù)據(jù)中
9、的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標準差不變.(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標準差變?yōu)樵瓉淼膋倍.(3)一組數(shù)據(jù)中的最大值和最小值對標準差的影響,區(qū)間的應用;“去掉一個最高分,去掉一個最低分”中的科學道理.例1 為了解A,B兩種輪胎的性能,某汽車制造廠分別從這兩種輪胎中隨機抽取了8個進行測試,下面列出了每一個輪胎行駛的最遠里程數(shù)(單位:1 000 km)輪胎A96,112,97,108,100,103,86,98輪胎B108,101,94,105,96,93,97,106(1)分別計算A,B兩種輪胎行駛的最遠里程的平均數(shù),中位數(shù);(2)分別計算A,B兩種輪胎行
10、駛的最遠里程的極差、標準差;(3)根據(jù)以上數(shù)據(jù)你認為哪種型號的輪胎性能更加穩(wěn)定?解 (1)A輪胎行駛的最遠里程的平均數(shù)為:=100,中位數(shù)為: =99;B輪胎行駛的最遠里程的平均數(shù)為:=100,中位數(shù)為:=99.(2)A輪胎行駛的最遠里程的極差為:112-86=26,標準差為:s=7.43;B輪胎行駛的最遠里程的極差為:108-93=15,標準差為:s= =5.43.(3)由于A和B的最遠行駛里程的平均數(shù)一樣,而B輪胎行駛的最遠里程的極差和標準差較小,所以B輪胎性能更加穩(wěn)定.例2(14分)某化肥廠甲、乙兩個車間包裝肥料,在自動包裝傳送帶上每隔30 min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)
11、如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說明哪個車間產(chǎn)品較穩(wěn)定.解 (1)因為間隔時間一樣,故是系統(tǒng)抽樣.(2)莖葉圖如下:(3)甲車間:平均值:=(102+101+99+98+103+98+99)=100,方差:s12=(102-100)2+(101-100)2+(99-100)23.428 6.乙車間:平均值:=(110+115+90+85+75+115+110)=100,方差:s22=(110-100)2+(115-100)2+(110
12、-100)2228.571 4.=,s12s22,甲車間產(chǎn)品穩(wěn)定.2.3.2兩個變量的線性相關1、概念: (1)回歸直線方程 (2)回歸系數(shù)2最小二乘法3直線回歸方程的應用 (1)描述兩變量之間的依存關系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關系 (2)利用回歸方程進行預測;把預報因子(即自變量x)代入回歸方程對預報量(即因變量Y)進行估計,即可得到個體Y值的容許區(qū)間。 (3)利用回歸方程進行統(tǒng)計控制規(guī)定Y值的變化,通過控制x的圍來實現(xiàn)統(tǒng)計控制的目標。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。4應用直線回歸的注意事項 (1)
13、做回歸分析要有實際意義; (2)回歸分析前,最好先作出散點圖; (3)回歸直線不要外延。5. 回歸直線方程的推導 設x與y是具有線性相關關系的兩個變量,且相應于樣本的一組觀測值的n個點的坐標分別是:,下面給出回歸方程的推導。 設所求的回歸方程為,其中是待確定的參數(shù),那么:,(),樣本中各個點的偏差是 ,()顯然,上面的各個偏差的符號有正、有負,如果將他們相加會相互抵消一部分,因此他們的和不能代表n個點與回歸直線在整體上的接近程度,而是采用n個偏差的平方和來表示n個點與相應直線(回歸直線)在整體上的接近程度。即求出當取最小值時的的值,就求出了回歸方程。 (一) 先證明兩個在變形中用到的公式:公式
14、(1) 其中 因為所以公式() 因為所以(二)推導:將的表達式的各項先展開,再合并、變形 -展開 -以a,b為同類項,合并 -以a,b的次數(shù)為標準整理 -將數(shù)據(jù)轉化為平均數(shù) -配方法 -展開 -整理-用公式(一)、(二)變形 -配方 在上式中,共有四項,后兩項與a,b無關,為常數(shù);前兩項是兩個非負數(shù)的和,因此要使得區(qū)的最小值,當且僅當前兩項的值都為0。所以 或 -用公式(一)、(二)變形得 (三)總結規(guī)律:上述推倒過程是圍繞著待定參數(shù)a,b進行的,只含有的部分是常數(shù)或系數(shù),用到的方法有(1)配方法,有兩次配方,分別是a的二次三項式和b的二次三項式;(2)變形時,用到公式(一)、(二)和整體思想
15、;(3)用平方的非負性求最小值。(4)實際計算時,通常是分步計算:先求出,再分別計算, 或,的值,最后就可以計算出a,b的值。6相關系數(shù)r統(tǒng)計中常用相關系數(shù)r來衡量兩個變量之間的線性相關的強弱,當不全為零,yi也不全為零時,則兩個變量的相關系數(shù)的計算公式是:r就叫做變量y與x的相關系數(shù)(簡稱相關系數(shù))說明:(1)對于相關系數(shù)r,首先值得注意的是它的符號,當r為正數(shù)時,表示變量x,y正相關;當r為負數(shù)時,表示兩個變量x,y負相關;(2)另外注意r的大小,如果,那么正相關很強;如果,那么負相關很強;如果或,那么相關性一般;如果,那么相關性較弱例1測得某國10對父子身高(單位:英寸)如下:父親身高()60626465666768707274兒子身高()63.565.26665.566.967.167.468.370.170(1)對變量y與x進行相關性檢驗;(2)如果y與x之間具有線性相關關系,求回歸直線方程;(3)如果父親的身高為73英寸,估計兒子身高解:(1),所以,所以y與x之間具有線性相關關系(2)設回歸直線方程為,則, 故所求的回歸直線方程為(3)當英寸時,所以當父親身高為73英寸時,估計兒子的身高約為69.9英寸點評:回歸直線是對兩個變量線性相關關系的定量描述,利用回歸直線,可以對一些實際問題進行分析、預測,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 技術開發(fā)合同(2篇)
- 2025年度數(shù)據(jù)中心通風排煙系統(tǒng)建設與維護服務合同2篇
- 個人向公司借款合同(2024年)
- 2025版民房建筑工程勞務分包合同4篇
- 2025年建筑保溫材料專用黏結劑銷售合同3篇
- 2025年度農(nóng)用車出口貿(mào)易代理合同范本3篇
- 2025年度能源行業(yè)個人勞務派遣及安全生產(chǎn)合同3篇
- 2025年度個人企業(yè)全額承包經(jīng)營服務合同規(guī)范3篇
- 2025年度智能培訓班租賃合同范本3篇
- 二零二五模具加工企業(yè)臨時工用工合同范本4篇
- 副總經(jīng)理招聘面試題與參考回答(某大型國企)2024年
- PDCA循環(huán)提高護士培訓率
- 2024-2030年中國智慧水務行業(yè)應用需求分析發(fā)展規(guī)劃研究報告
- 《獅子王》電影賞析
- 河北省保定市定州市2025屆高二數(shù)學第一學期期末監(jiān)測試題含解析
- 中醫(yī)護理人文
- 2024-2030年中國路亞用品市場銷售模式與競爭前景分析報告
- 貨物運輸安全培訓課件
- 前端年終述職報告
- 2024小說推文行業(yè)白皮書
- 市人民醫(yī)院關于開展“改善就醫(yī)感受提升患者體驗主題活動”2023-2025年實施方案及資料匯編
評論
0/150
提交評論