數(shù)學(xué):第一章《統(tǒng)計案例》教案(新人教A版選修1-2)_第1頁
數(shù)學(xué):第一章《統(tǒng)計案例》教案(新人教A版選修1-2)_第2頁
數(shù)學(xué):第一章《統(tǒng)計案例》教案(新人教A版選修1-2)_第3頁
數(shù)學(xué):第一章《統(tǒng)計案例》教案(新人教A版選修1-2)_第4頁
數(shù)學(xué):第一章《統(tǒng)計案例》教案(新人教A版選修1-2)_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PAGE統(tǒng)計案例復(fù)習(xí)教案一、本章知識脈絡(luò):統(tǒng)計案例統(tǒng)計案例回歸分析樣本點的中心隨機(jī)誤差殘差分析建立回歸模型的基本步驟回歸分析列聯(lián)表K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))判斷結(jié)論成立可能性的步驟二、本章要點追蹤:1.樣本點的中心(eq\O(x,\s\up8(-)),eq\O(y,\s\up8(-)))其中eq\O(x,\s\up8(-))=eq\f(1,n)eq\s\di(n,∑,i=1)xi,eq\O(y,\s\up8(-))=eq\s\di(n,∑,i=1)yi.2.線性回歸模型的完美表達(dá)式eq\b\lc\{(\a\vs2(y=bx+a+e,E(e)=0,D(e)=σ2))3.類比樣本方差估計總體方差的思想,可以用eq\O(σ2,\s\up8(∧))=eq\f(1,n-2)eq\s\di(n,∑,i=1)eq\O(e2,\s\up8(∧))i=eq\f(1,n-2)Q(eq\O(a,\s\up8(∧)),eq\O(b,\s\up8(∧)))(n>2)作為σ2的估計量其中eq\O(a,\s\up8(∧))=eq\O(y,\s\up8(-))-eq\O(b,\s\up8(∧))eq\O(x,\s\up8(-))eq\O(b,\s\up8(∧))=eq\f(eq\s\di(n,∑,i=1)(xi-eq\O(x,\s\up8(-)))(yi-eq\O(y,\s\up8(-))),eq\s\di(n,∑,i=1)(xi-eq\O(x,\s\up8(-)))2)4.我們可以用相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是:R2=1-eq\f(eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2,eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(-)))2)R2取值越大,意味著殘差平方和越小,也就是說模型的擬合效果越好.5.建立回歸模型的基本步驟:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等);(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程y=bx+x);(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法);(5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。6.作K2來確定結(jié)論“X與Y有關(guān)系”的可信程度.三、幾個典型例題:例1某地區(qū)10名健康兒童頭發(fā)和全血中的硒含量(1000ppm)如下,血硒74668869917366965873發(fā)硒13101311169714510(1)畫出散點圖;(2)求回歸方程;(3)如果某名健康兒童的血硒含量為94(1000ppm)預(yù)測他的發(fā)硒含量.解(1)散點圖如下圖所示:(2)利用計算器或計算機(jī),求得回歸方程:eq\O(y,\s\up8(∧))=0.2358x-6.9803(3)當(dāng)x=94時,eq\O(y,\s\up8(∧))≈15.2因此,當(dāng)兒童的血硒含量為94(1000ppm)時,該兒童的發(fā)硒含量約為15.2(1000ppm).某地大氣中氰化物測定結(jié)果如下:污染源距離50100150200250300400500氰化物濃度0.6870.3980.2000.1210.090.050.020.01(1)試建立氰化物濃度與距離之間的回歸方程.(2)求相關(guān)指數(shù).(3)作出殘差圖,并求殘差平方和解析(1)選取污染源距離為變量x,氰化物濃度為自因變量y作散點圖.從表中所給的數(shù)據(jù)可以看出,氰化物濃度與距離有負(fù)的相關(guān)關(guān)系,用非線性回歸方程來擬合,建立y關(guān)于x的指數(shù)回歸方程.eq\O(y,\s\up8(∧))=0.9293e-0.0094x(2)相關(guān)指數(shù)K2=1-eq\f(eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2,eq\s\di(n,∑,i=1)(yi-eq\O(y,\s\up8(∧)))2)=0.9915(3)編號12345678污染源距離50100150200250300400500氰化物濃度0.6870.3980.20.1210.090.050.020.01殘差0.10618570.035-0.027-0.0210.0014-0.005-0.0020.0015殘差平方和eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2=0.0118例3某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對待企業(yè)改革態(tài)度的關(guān)系,隨機(jī)制取了189名員工進(jìn)行調(diào)查,所得數(shù)據(jù)如下表所示:積極支持企業(yè)改革不太造成企業(yè)改革合計工作積極544094工作一般326395合計86103189對于人力資源部的研究項目,根據(jù)上述數(shù)據(jù)能得出什么結(jié)論?解:根據(jù)列聯(lián)表中的數(shù)據(jù),得到K2=eq\f(189×(54×63-40×32)2,94×95×86×103)=10.76.因為10.76>6.635,所以有99%的把握說:員工“工作積極”與“積極支持企業(yè)改革”是有關(guān)的,可以認(rèn)為企業(yè)的全體員工對待企業(yè)改革的態(tài)度與其工作積極性是有關(guān)的.例4有人統(tǒng)計了同一個省的6個城市某一年的人均國內(nèi)生產(chǎn)總值(即人均GDP)和這一年各城市患白血病的兒童數(shù)量,如下表:人均GDP(萬元)1086431患白血病的兒童數(shù)351312207175132180(1)畫出散點圖;(2)求對的回歸直線方程;(3)如果這個省的某一城市同時期年人均GDP為12萬元,估計這個城市一年患白血病的兒童數(shù)目;分析:利用公式分別求出的值,即可確定回歸直線方程,然后再進(jìn)行預(yù)測.16題圖解:(1)作與對應(yīng)的散點圖,如右圖所示;16題圖(2)計算得,∴,,∴對的回歸直線方程是;(3)將代入得,估計這個城市一年患白血病的兒童數(shù)目約為381.評注:本題涉及的是一個和我們生活息息相關(guān),也是一個愈來愈嚴(yán)峻的問題——環(huán)保問題.本題告訴了我們一個沉痛的事實:現(xiàn)如今,一個城市愈發(fā)達(dá),這個城市患白血病的兒童愈多.原因在于,城市的經(jīng)濟(jì)發(fā)展大都以犧牲環(huán)境為代價的,經(jīng)濟(jì)發(fā)展造成了大面積的環(huán)境污染,空氣、水源中含有的大量的有害物質(zhì)是導(dǎo)致白血病患者增多的罪魁禍?zhǔn)?,所以,我們一定要增?qiáng)自我保護(hù)意識和環(huán)境保護(hù)意識.例5寒假中,某同學(xué)為組織一次愛心捐款,于2008年天數(shù)1234567人數(shù)711212466115325(1)作出散點圖,并猜測與之間的關(guān)系;(2)建立與的關(guān)系,預(yù)報回歸模型并計算殘差;(3)如果此人打算在2008年2月12日(即帖子傳播時間共10天)進(jìn)行募捐活動,根據(jù)上述回歸模型,估計可去多少人.分析:先通過散點圖,看二者是否具有線性相關(guān)關(guān)系,若不具有,可通過相關(guān)函數(shù)變換,轉(zhuǎn)化為線性相關(guān)關(guān)系.解:(1)散點圖略.從散點圖可以看出與不具有線性相關(guān)關(guān)系,同時可發(fā)現(xiàn)樣本點分布在某一個指數(shù)函數(shù)曲線的周圍,其中是參數(shù);(2)對兩邊取對數(shù),把指數(shù)關(guān)系變成線性關(guān)系.令,則變換后的樣本點分布在直線的周圍,這樣就可以利用線性回歸模型來建立與之間的非線性回歸方程了,數(shù)據(jù)可以轉(zhuǎn)化為:天數(shù)1234567人數(shù)1.9462.3983.0453.1784.1904.7455.784求得回歸直線方程為,∴.(3)截止到2008年2月12日,,此時(人).∴估計可去1530人.評注:現(xiàn)如今是網(wǎng)絡(luò)時代,很多同學(xué)都會通過互聯(lián)網(wǎng)發(fā)帖子,所以此類問題為同學(xué)們司空見慣.但如何預(yù)測發(fā)帖后的效果,這卻是個新課題,通過本題你是否已明確.例6有人發(fā)現(xiàn)了一個有趣的現(xiàn)象,中國人的郵箱名稱里含有數(shù)字的比較多,而外國人郵箱名稱里含有數(shù)字的比較少.為了研究國籍和郵箱名稱里是否含有數(shù)字的關(guān)系,他收集了124個郵箱名稱,其中中國人的70個,外國人的54個,中國人的郵箱中有43個含數(shù)字,外國人的郵箱中有27個含數(shù)字.(1)根據(jù)以上數(shù)據(jù)建立一個2×2的列聯(lián)表;(2)他發(fā)現(xiàn)在這組數(shù)據(jù)中,外國人郵箱名稱里含數(shù)字的也不少,他不能斷定國籍和郵箱名稱里含有數(shù)字是否有關(guān),你能幫他判斷一下嗎?分析:按題中數(shù)據(jù)建列聯(lián)表,然后根據(jù)列聯(lián)表數(shù)據(jù)求出值,即可判定.解:(1)2×2的列聯(lián)表中國人外國人總計有數(shù)字432770無數(shù)字213354總計6460124(2)假設(shè)“國籍和郵箱名稱里是否含有數(shù)字無關(guān)”.由表中數(shù)據(jù)得,因為,所以有理由認(rèn)為假設(shè)“國籍和郵箱名稱里是否含有數(shù)字無關(guān)”是不合理的,即有的把握認(rèn)為“國籍和郵箱名稱里是否含有數(shù)字有關(guān)”.評注:獨立性檢驗類似于反證法,其一般步驟為:第一步:首先假設(shè)兩個分類變量幾乎沒有關(guān)系(幾乎獨立);第二步:求隨機(jī)變量的值;第三步.判斷兩個分類變量有關(guān)的把握(即概率)有多大.例7針對時下的“韓劇熱”,某校團(tuán)委對“學(xué)生性別和是否喜歡韓劇是否有關(guān)”作了一次調(diào)查,其中女生人數(shù)是男生人數(shù)的,男生喜歡韓劇的人數(shù)占男生人數(shù)的,女生喜歡韓劇人數(shù)占女生人數(shù)的.(1)若有的把握認(rèn)為是否喜歡韓劇和性別有關(guān),則男生至少有多少人;(2)若沒有充分的證據(jù)顯示是否喜歡韓劇和性別有關(guān),則男生至多有多少人.分析:有的把握認(rèn)為回答結(jié)果對錯和性別有關(guān),說明,沒有充分的證據(jù)顯示回答結(jié)果對錯和性別有關(guān),說明.設(shè)出男生人數(shù),并用它分別表示各類別人數(shù),代入的計算公式,建立不等式求解即可.解:設(shè)男生人數(shù)為,依題意可得列聯(lián)表如下:喜歡韓劇不喜歡韓劇總計男生女生總計 (1)若有的把握認(rèn)為回答結(jié)果的對錯和性別有關(guān),則,由,解得,∵為整數(shù),∴若有的把握認(rèn)為回答結(jié)果的對錯和性別有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論