第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例_第1頁
第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例_第2頁
第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例_第3頁
第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例_第4頁
第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第3講變量間的相關(guān)關(guān)系與統(tǒng)計案例【2013年高考會這樣考】以選擇題或填空題的形式考查回歸分析及獨立性檢驗中的基本思想方法及其簡單應(yīng)用【復(fù)習(xí)指導(dǎo)】高考在該部分的主要命題點就是回歸分析和獨立性檢驗的基礎(chǔ)知識和簡單應(yīng)用復(fù)習(xí)時要掌握好回歸分析和獨立性檢驗的基本思想、方法和基本公式基礎(chǔ)梳理1相關(guān)關(guān)系的分類從散點圖上看,點散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān);點散布在從左上角到右下角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān)2線性相關(guān)從散點圖上看,如果這些點從整體上看大致分布在一條直線附近,則稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線3回歸方程(1)最小

2、二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離平方和最小的方法叫最小二乘法(2)回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),(xn,yn),其回歸方程為eq o(y,sup6()eq o(b,sup6()xeq o(a,sup6(),則eq blcrc (avs4alco1(o(b,sup6()f(isu(i1,n, )xixto(x)yixto(y),isu(i1,n, )xixto(x)2)f(isu(i1,n,x)iyin xto(x)xto(y),isu(i1,n,x)oal(2,i)n xto(x)2),,o(a,sup6()xto(y)o(b,sup6

3、() xto(x).)其中,b是回歸方程的斜率,a是在y軸上的截距4樣本相關(guān)系數(shù)req f(isu(i1,n, )xixto(x)yixto(y),r(isu(i1,n, )xixto(x)2isu(i1,n, )yixto(y)2),用它來衡量兩個變量間的線性相關(guān)關(guān)系(1)當(dāng)r0時,表明兩個變量正相關(guān);(2)當(dāng)r0時,表明兩個變量負(fù)相關(guān);(3)r的絕對值越接近1,表明兩個變量的線性相關(guān)性越強;r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系通常當(dāng)|r|0.75時,認(rèn)為兩個變量有很強的線性相關(guān)關(guān)系5線性回歸模型(1)ybxae中,a、b稱為模型的未知參數(shù);e稱為隨機(jī)誤差(2)相關(guān)指

4、數(shù)用相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是:R2 ,R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好在線性回歸模型中,R2表示解釋變量對預(yù)報變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸效果越好6獨立性檢驗(1)用變量的不同“值”表示個體所屬的不同類別,這種變量稱為分類變量例如:是否吸煙,宗教信仰,國籍等(2)列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表(3)一般地,假設(shè)有兩個分類變量X和Y,它們的值域分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為:22列聯(lián)表y1y2總計x1ababx2cdcd總計acbdabcdK2eq f(nadbc2,abaccdbd)(其中n

5、abcd為樣本容量),可利用獨立性檢驗判斷表來判斷“x與y的關(guān)系”這種利用隨機(jī)變量K2來確定在多大程度上可以認(rèn)為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗兩個規(guī)律(1)函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系事實上,函數(shù)關(guān)系是兩個非隨機(jī)變量的關(guān)系,而相關(guān)關(guān)系是非隨機(jī)變量與隨機(jī)變量的關(guān)系(2)當(dāng)K23.841時,則有95%的把握說事A與B有關(guān);當(dāng)K26.635時,則有99%的把握說事件A與B有關(guān);當(dāng)K22.706時,則認(rèn)為事件A與B無關(guān)三個注意(1)回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義,否則,求出

6、的回歸直線方程毫無意義(2)線性回歸方程中的截距和斜率都是通過樣本數(shù)據(jù)估計而來的,存在誤差,這種誤差會導(dǎo)致預(yù)報結(jié)果的偏差;而且回歸方程只適用于我們所研究的樣本總體(3)獨立性檢驗的隨機(jī)變量K23.841是判斷是否有關(guān)系的臨界值,K23.841應(yīng)判斷為沒有充分證據(jù)顯示事件A與B有關(guān)系,而不能作為小于95%的量化值來判斷雙基自測1(人教A版教材習(xí)題改編)下面哪些變量是相關(guān)關(guān)系()A出租車車費與行駛的里程 B房屋面積與房屋價格C身高與體重 D鐵塊的大小與質(zhì)量解析A,B,D都是函數(shù)關(guān)系,其中A一般是分段函數(shù),只有C是相關(guān)關(guān)系答案C2對變量x,y有觀測數(shù)據(jù)(xi,yi)(i1,2,10),得散點圖(1)

7、;對變量u,v有觀測數(shù)據(jù)(ui、vi)(i1,2,10),得散點圖(2)由這兩個散點圖可以判斷()A變量x與y正相關(guān),u與v正相關(guān)B變量x與y正相關(guān),u與v負(fù)相關(guān)C變量x與y負(fù)相關(guān),u與v正相關(guān)D變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)解析由題圖(1)可知,各點整體呈遞減趨勢,x與y負(fù)相關(guān);由題圖(2)可知,各點整體呈遞增趨勢,u與v正相關(guān)答案C3(2012南昌模擬)某商品銷售量y(件)與銷售價格x(元/件)負(fù)相關(guān),則其回歸方程可能是()A.eq o(y,sup6()10 x200 B.eq o(y,sup6()10 x200C.eq o(y,sup6()10 x200 D.eq o(y,sup6()1

8、0 x200解析因為銷量與價格負(fù)相關(guān),由函數(shù)關(guān)系考慮為減函數(shù),又因為x,y不能為負(fù)數(shù),再排除C,故選A.答案A4(2012棗莊模擬)下面是22列聯(lián)表:y1y2合計x1a2173x2222547合計b46120則表中a,b的值分別為()A94,72 B52,50 C52,74 D74,52解析a2173,a52,又a22b,b74.答案C5在一項打鼾與患心臟病的調(diào)查中,共調(diào)查了1 671人,經(jīng)過計算K2的觀測值k27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是_的(有關(guān),無關(guān))解析由觀測值k27.63與臨界值比較,我們有99%的把握說打鼾與患心臟病有關(guān)答案有關(guān)考向一相關(guān)關(guān)系的判斷【例

9、1】山東魯潔棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進(jìn)行施化肥量x對產(chǎn)量y影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg):施化肥量x15202530354045棉花產(chǎn)量y330345365405445450455(1)畫出散點圖;(2)判斷是否具有相關(guān)關(guān)系審題視點 (1)用x軸表示化肥施用量,y軸表示棉花產(chǎn)量,逐一畫點(2)根據(jù)散點圖,分析兩個變量是否存在相關(guān)關(guān)系解(1)散點圖如圖所示(2)由散點圖知,各組數(shù)據(jù)對應(yīng)點大致都在一條直線附近,所以施化肥量x與產(chǎn)量y具有線性相關(guān)關(guān)系 利用散點圖判斷兩個變量是否有相關(guān)關(guān)系是比較簡便的方法在散點圖中如果所有的樣本點都落在某一

10、函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系即變量之間具有函數(shù)關(guān)系如果所有的樣本點落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系;如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系【訓(xùn)練1】 根據(jù)兩個變量x,y之間的觀測數(shù)據(jù)畫成散點圖如圖所示,這兩個變量是否具有線性相關(guān)關(guān)系_(填“是”與“否”)解析從散點圖看,散點圖的分布成團(tuán)狀,無任何規(guī)律,所以兩個變量不具有線性相關(guān)關(guān)系答案否考向二獨立性檢驗【例2】(2010全國新課標(biāo))為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機(jī)抽樣方法從該地區(qū)調(diào)查了500位老年人,結(jié)果如下: 性別是否需要志愿者男女需要4030不需要160270(1)估計該

11、地區(qū)老年人中,需要志愿者提供幫助的老年人的比例;(2)能否有99%的把握認(rèn)為該地區(qū)老年人是否需要志愿者提供幫助與性別有關(guān)?(3)根據(jù)(2)的結(jié)論,能否提出更好的調(diào)查方法來估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例?說明理由附:P(K2k)0.0500.0100.001k3.8416.63510.828K2eq f(nadbc2,abcdacbd)審題視點 第(2)問由a40,b30,c160,d270,代入公式可求K2,由K2的值與6.635比較斷定第(3)問從抽樣方法說明解(1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例的

12、估計值為eq f(70,500)14%.(2)K2eq f(50040270301602,70430200300)9.967.由于9.9676.635,所以有99%的把握認(rèn)為該地區(qū)老年人是否需要幫助與性別有關(guān)(3)由(2)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層,采用分層抽樣方法,這要比采用簡單隨機(jī)抽樣方法更好 獨立性檢驗的步驟:(1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表;(2)根據(jù)公式K2eq f(nadbc2,abacbdcd)計算K2的觀測值;(

13、3)比較K2與臨界值的大小關(guān)系作統(tǒng)計推斷【訓(xùn)練2】 某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在29.94,30.06)的零件為優(yōu)質(zhì)品從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得結(jié)果如下表:甲廠:分組29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)頻數(shù)12638618292614乙廠:分組29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)頻數(shù)297185

14、159766218(1)試分別估計兩個分廠生產(chǎn)零件的優(yōu)質(zhì)品率;(2)由以上統(tǒng)計數(shù)據(jù)填下面22列聯(lián)表,并問是否有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”.甲廠乙廠合計優(yōu)質(zhì)品非優(yōu)質(zhì)品合計附K2eq f(nadbc2,abcdacbd),P(K2k)0.050.01k3.8416.635解(1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為eq f(360,500)100%72%;乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為eq f(320,500)100%64%.(2)甲廠乙廠合計優(yōu)質(zhì)品360320680非優(yōu)質(zhì)品140180320合計5005

15、001 000K2eq f(1 0003601803201402,500500680320)7.356.635,所以有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”考向三線性回歸方程【例3】(2012菏澤模擬)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對照數(shù)據(jù).x3456y2.5344.5(1)請畫出上表數(shù)據(jù)的散點圖;(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程eq o(y,sup6()eq o(b,sup6()xeq o(a,sup6();(3)已知該廠技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤試根據(jù)

16、(2)求出的線性回歸方程預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤?(參考數(shù)值:32.5435464.566.5)審題視點 (2)問利用公式求eq o(a,sup6()、eq o(b,sup6(),即可求出線性回歸方程(3)問將x100代入回歸直線方程即可解(1)由題設(shè)所給數(shù)據(jù),可得散點圖如圖所示(2)由對照數(shù)據(jù),計算得:eq isu(i1,4,x)eq oal(2,i)86,eq xto(x)eq f(3456,4)4.5(噸),eq xto(y)eq f(2.5344.5,4)3.5(噸)已知eq isu(i1,4,x)iyi66.5,所以,由最小二乘法確定的回歸方程的系數(shù)為

17、:eq o(b,sup6()eq f(isu(i1,4,x)iyi4xto(x)xto(y),isu(i1,4,x)oal(2,i)4xto(x)2)eq f(66.544.53.5,8644.52)0.7,eq o(a,sup6()eq xto(y)eq o(b,sup6()eq xto(x)3.50.74.50.35.因此,所求的線性回歸方程為eq o(y,sup6()0.7x0.35.(3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的生產(chǎn)能耗為:90(0.71000.35)19.65(噸標(biāo)準(zhǔn)煤) 在解決具體問題時,要先進(jìn)行相關(guān)性檢驗,通過檢驗確認(rèn)兩個變量是否具有線性相

18、關(guān)關(guān)系,若它們之間有線性相關(guān)關(guān)系,再求回歸直線方程【訓(xùn)練3】 (2011江西)為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對父子的身高數(shù)據(jù)如下:父親身高x/cm174176176176178兒子身高y/cm175175176177177則y對x的線性回歸方程為()Ayx1 Byx1Cy88eq f(1,2)x Dy176解析由題意得eq xto(x)eq f(174176176176178,5)176(cm),eq xto(y)eq f(175175176177177,5)176(cm),由于(eq xto(x),eq xto(y)一定滿足線性回歸方程,經(jīng)驗證知選C.答案C閱卷報告15數(shù)據(jù)處理

19、不當(dāng)導(dǎo)致計算錯誤而失分【問題診斷】 由于大多數(shù)省市高考要求不準(zhǔn)使用計算器,而線性回歸問題和獨立性檢驗問題仍是近幾年新課標(biāo)高考的??键c,并且大多是考查考生的計算能力,就計算方面常有不少考生因計算出錯而失分【防范措施】 平時訓(xùn)練時首先養(yǎng)成勤于動手的習(xí)慣,親自動手計算,再者考場上要保持心態(tài)放松,做題時細(xì)心認(rèn)真,最終可減少錯誤的發(fā)生【示例】(2011安徽)某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù):年份20022004200620082010需求量(萬噸)236246257276286(1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程eq o(y,sup6()bxa;(2)利用(1)中所求出的直線方程預(yù)測該地2012年的糧食需求量實錄(1)eq xto(x)2 006,eq xto(y)eq f(236246257276286,5)260.2.b e

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論