第3節(jié)-成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第1頁(yè)
第3節(jié)-成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第2頁(yè)
第3節(jié)-成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第3頁(yè)
第3節(jié)-成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第4頁(yè)
第3節(jié)-成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3節(jié)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析[學(xué)習(xí)目標(biāo)]

1.會(huì)作兩個(gè)相關(guān)變量的數(shù)據(jù)的散點(diǎn)圖,能根據(jù)最小二乘原理建立經(jīng)驗(yàn)回歸方程并進(jìn)行預(yù)測(cè),了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義和殘差分析.2.了解獨(dú)立性檢驗(yàn)的基本思想,2×2列聯(lián)表的統(tǒng)計(jì)意義,能對(duì)兩個(gè)分類變量進(jìn)行獨(dú)立性檢驗(yàn).積累·必備知識(shí)01回顧教材,夯實(shí)四基1.成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性(1)正相關(guān)與負(fù)相關(guān)從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)

的趨勢(shì),我們就稱這兩個(gè)變量正相關(guān);當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)

的趨勢(shì),則稱這兩個(gè)變量負(fù)相關(guān).增加減小(2)線性相關(guān)與曲線相關(guān)一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在

附近,我們就稱這兩個(gè)變量線性相關(guān).一般地,如果兩個(gè)變量具有

性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān).一條直線相關(guān)(3)樣本相關(guān)系數(shù)①相關(guān)系數(shù)r的計(jì)算變量x和變量y的樣本相關(guān)系數(shù)r的計(jì)算公式如下:②相關(guān)系數(shù)r的性質(zhì)r的取值范圍

r>0成對(duì)樣本數(shù)據(jù)

相關(guān)r<0成對(duì)樣本數(shù)據(jù)

相關(guān)r=0成對(duì)樣本數(shù)據(jù)間沒(méi)有線性相關(guān)關(guān)系|r|越接近1成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越

|r|越接近0成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越

[-1,1]正負(fù)強(qiáng)弱2.一元線性回歸模型及其應(yīng)用(1)一元線性回歸模型我們稱式子為Y關(guān)于x的

,其中,Y稱為

,x稱為

;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的

.一元線性回歸模型因變量響應(yīng)變量自變量解釋變量隨機(jī)誤差(2)一元線性回歸模型參數(shù)的最小二乘估計(jì)最小經(jīng)驗(yàn)回歸方程經(jīng)驗(yàn)回歸函數(shù)經(jīng)驗(yàn)回歸公式(3)判斷回歸模型的擬合效果①殘差分析法對(duì)于響應(yīng)變量Y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值,通過(guò)經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測(cè)值,觀測(cè)值減去預(yù)測(cè)值稱為

.畫(huà)出殘差圖,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,經(jīng)驗(yàn)回歸方程的預(yù)報(bào)精度越高.殘差②決定系數(shù)(R2)法越小R2越大,殘差平方和

,模型的擬合效果

;R2越小,殘差平方和

,模型的擬合效果

.越好越大越差對(duì)于線性與非線性回歸模型,以上兩個(gè)分析方法都適合.通過(guò)分析,可以決定選擇哪一種函數(shù)模型更加合理.(1)列聯(lián)表:列出成對(duì)分類變量數(shù)據(jù)的

的數(shù)據(jù)統(tǒng)計(jì)表稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為交叉分類頻數(shù)XY合計(jì)y1y2x1aba+bx2cdc+d合計(jì)a+cb+da+b+c+d記n=a+b+c+d,則隨機(jī)變量χ2=

.3.列聯(lián)表與獨(dú)立性檢驗(yàn)(2)獨(dú)立性檢驗(yàn)基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(1)獨(dú)立性檢驗(yàn)是對(duì)兩個(gè)變量有關(guān)系的可信程度的判斷,而不是對(duì)其是否有關(guān)系的判斷.(2)根據(jù)χ2的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,χ2越大,則兩分類變量有關(guān)的把握越大.1.通常|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性.2.經(jīng)驗(yàn)回歸直線一定過(guò)點(diǎn)().1.思考辨析(在括號(hào)內(nèi)打“√”或“×”).(1)相關(guān)關(guān)系與函數(shù)關(guān)系都是一種確定性的關(guān)系.(

)(2)利用散點(diǎn)圖可以直觀判斷兩個(gè)變量的關(guān)系是否可以用線性關(guān)系表示.(

)×√(3)經(jīng)驗(yàn)回歸直線

至少經(jīng)過(guò)點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)中的一個(gè)點(diǎn).(

)×(4)用相關(guān)系數(shù)r來(lái)刻畫(huà)回歸效果,r越小,說(shuō)明模型的擬合效果越好.(

)(5)在2×2列聯(lián)表中,若|ad-bc|越小,說(shuō)明兩個(gè)分類變量之間關(guān)系越強(qiáng).(

)(6)事件X,Y關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的χ2的值越大.(

)××√2.某機(jī)構(gòu)為調(diào)查古詩(shī)詞愛(ài)好者是否有性別差異,通過(guò)調(diào)查數(shù)據(jù)統(tǒng)計(jì):在500名男生中有200名愛(ài)好古詩(shī)詞,在400名女生中有300名愛(ài)好古詩(shī)詞.若要確定是否有充分證據(jù)推斷愛(ài)好古詩(shī)詞與性別有關(guān),下列最適合的統(tǒng)計(jì)方法是(

)A.均值 B.方差C.獨(dú)立性檢驗(yàn) D.回歸分析√解析:由題意可知,“愛(ài)好古詩(shī)詞”與“性別”是兩類變量,要確定是否有充分證據(jù)推斷其有關(guān),應(yīng)用獨(dú)立性檢驗(yàn)判斷.故選C.3.一組樣本數(shù)據(jù):(1,y1),(2,y2),(3,y3),(4,y4),(m,y5),由最小二乘法求得經(jīng)驗(yàn)回歸方程為=5x-7,若y1+y2+y3+y4+y5=45,則實(shí)數(shù)m的值為(

)A.5 B.6 C.7 D.8√4.(選擇性必修第三冊(cè)P138T2改編)根據(jù)變量Y和x的成對(duì)樣本數(shù)據(jù),作出殘差圖.對(duì)于以下四幅殘差圖,滿足一元線性回歸模型中對(duì)隨機(jī)誤差假設(shè)的是(

)√解析:對(duì)于A,殘差與觀測(cè)時(shí)間有線性關(guān)系,故A錯(cuò)誤;對(duì)于B,殘差的方差不是一個(gè)常數(shù),隨著觀測(cè)時(shí)間變大而變小,故B錯(cuò)誤;對(duì)于C,殘差與觀測(cè)時(shí)間是非線性關(guān)系,故C錯(cuò)誤;對(duì)于D,殘差比較均勻地分布在以取值為0的橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi),故D正確.故選D.5.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在檢驗(yàn)30歲以上的人患胃病是否與生活無(wú)規(guī)律有關(guān)的過(guò)程中,某研究員搜集數(shù)據(jù)并計(jì)算得到χ2=7.235,則根據(jù)小概率值α=

的χ2獨(dú)立性檢驗(yàn),可認(rèn)為30歲以上的人患胃病與生活無(wú)規(guī)律有關(guān).解析:因?yàn)?.635<7.235<10.828,所以根據(jù)小概率值α=0.01的χ2獨(dú)立性檢驗(yàn),可認(rèn)為30歲以上的人患胃病與生活無(wú)規(guī)律有關(guān).0.0102提升·關(guān)鍵能力類分考點(diǎn),落實(shí)四翼考點(diǎn)一成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性的判斷[例1](1)(2024·廣西南寧模擬)某統(tǒng)計(jì)部門對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后,獲得如圖所示的散點(diǎn)圖.下面關(guān)于相關(guān)系數(shù)的比較,正確的是(

)A.r4<r2<r1<r3 B.r2<r4<r1<r3C.r2<r4<r3<r1 D.r4<r2<r3<r1√解析:(1)由題圖可知,r3,r1所對(duì)應(yīng)的圖中的兩個(gè)變量呈現(xiàn)正相關(guān),而且r1對(duì)應(yīng)的相關(guān)性比r3對(duì)應(yīng)的相關(guān)性要強(qiáng),故0<r3<r1,r2,r4所對(duì)應(yīng)的圖中的兩個(gè)變量呈現(xiàn)負(fù)相關(guān),且根據(jù)散點(diǎn)的分布情況可知r2<r4<0,因此r2<r4<r3<r1.故選C.(2)(2023·湖北黃岡二模)在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn互不相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x-5上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為(

)A.- B. C.-1D.1√解析:(2)由題意可知,所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x-5上,則這組樣本數(shù)據(jù)完全正相關(guān),且相關(guān)系數(shù)為1.故選D.判斷線性相關(guān)關(guān)系中正相關(guān)與負(fù)相關(guān)的三種方法(1)散點(diǎn)圖法:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)變量負(fù)相關(guān).(2)相關(guān)系數(shù)法:當(dāng)r>0時(shí),成對(duì)樣本數(shù)據(jù)正相關(guān),當(dāng)r<0時(shí),成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).[針對(duì)訓(xùn)練](1)在一次試驗(yàn)中,測(cè)得(x,y)的五組數(shù)據(jù)分別為(1,3),(2,4),(4,5),(5,13),(10,12),去掉一組數(shù)據(jù)(5,13)后,下列說(shuō)法正確的是(

)A.樣本數(shù)據(jù)由正相關(guān)變成負(fù)相關(guān)B.樣本的相關(guān)系數(shù)不變C.樣本的相關(guān)性變?nèi)鮀.樣本的相關(guān)系數(shù)變大√解析:(1)由題意,去掉離群點(diǎn)(5,13)后,仍然為正相關(guān),相關(guān)性變強(qiáng),相關(guān)系數(shù)變大,故A,B,C錯(cuò)誤,D正確.故選D.(2)變量X與Y相對(duì)應(yīng)的5組數(shù)據(jù)和變量U與V相對(duì)應(yīng)的5組數(shù)據(jù)統(tǒng)計(jì)如表:X1011.311.812.513Y12345U1011.311.812.513V54321用r1表示變量Y與X之間的相關(guān)系數(shù),r2表示變量V與U之間的相關(guān)系數(shù),則r1與r2的大小關(guān)系是

.r1>r2解析:(2)因?yàn)閅與X之間正相關(guān),所以r1>0;因?yàn)閂與U之間負(fù)相關(guān),所以r2<0,因此r1>0>r2.考點(diǎn)二回歸模型及其應(yīng)用角度一線性回歸分析[例2](2024·河南鄭州模擬)某汽車城從某天開(kāi)始連續(xù)的營(yíng)業(yè)天數(shù)x與新能源汽車銷售總量y(單位:輛)的統(tǒng)計(jì)數(shù)據(jù)如表所示:連續(xù)營(yíng)業(yè)天數(shù)x/天1020304050新能源汽車銷售總量y/輛6268758189(1)已知可用線性回歸模型擬合y與x的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明(結(jié)果精確到0.001);因?yàn)閥與x的相關(guān)系數(shù)近似為0.999,說(shuō)明y與x的線性相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合y與x的關(guān)系.所以預(yù)測(cè)該汽車城連續(xù)營(yíng)業(yè)130天的汽車銷售總量為142輛.(1)經(jīng)驗(yàn)回歸方程中系數(shù)的兩種求法①公式法:利用公式,求出②待定系數(shù)法:利用回歸直線過(guò)()求系數(shù).(2)回歸分析的兩種應(yīng)用①利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè):把經(jīng)驗(yàn)回歸方程看作一次函數(shù),求函數(shù)值.②利用經(jīng)驗(yàn)回歸方程判斷正、負(fù)相關(guān):決定正相關(guān)還是負(fù)相關(guān)的是回歸系數(shù).角度二非線性回歸分析[例3](2024·廣東廣州二模)一企業(yè)生產(chǎn)某種產(chǎn)品,通過(guò)加大技術(shù)創(chuàng)新投入降低了每件產(chǎn)品成本,為了調(diào)查年技術(shù)創(chuàng)新投入x(單位:千萬(wàn)元)對(duì)每件產(chǎn)品成本y(單位:元)的影響,對(duì)近10年的年技術(shù)創(chuàng)新投入xi和每件產(chǎn)品成本yi(i=1,2,3,…,10)的數(shù)據(jù)進(jìn)行分析,得到如下散點(diǎn)圖,并計(jì)算得:(1)根據(jù)散點(diǎn)圖可知,可用函數(shù)模型y=+α擬合y與x的關(guān)系,試建立y關(guān)于x的回歸方程;所以當(dāng)年技術(shù)創(chuàng)新投入為20千萬(wàn)元時(shí),年利潤(rùn)的預(yù)報(bào)值取最大值.求非線性經(jīng)驗(yàn)回歸方程的步驟(1)確定變量,作出散點(diǎn)圖.(2)根據(jù)散點(diǎn)圖,選擇恰當(dāng)?shù)臄M合函數(shù).(3)變量置換,通過(guò)變量置換把非線性回歸問(wèn)題轉(zhuǎn)化為線性回歸問(wèn)題,并求出經(jīng)驗(yàn)回歸方程.(4)分析擬合效果,通過(guò)計(jì)算決定系數(shù)或畫(huà)殘差圖來(lái)判斷擬合效果.(5)根據(jù)相應(yīng)的變換,寫(xiě)出非線性經(jīng)驗(yàn)回歸方程.角度三殘差分析與決定系數(shù)[例4]現(xiàn)代物流成為繼勞動(dòng)力、自然資源外影響企業(yè)生產(chǎn)成本及利潤(rùn)的重要因素.某企業(yè)去年前八個(gè)月的物流成本和企業(yè)利潤(rùn)的數(shù)據(jù)(單位:萬(wàn)元)如表所示:月份12345678物流成本x8383.58086.58984.57986.5利潤(rùn)y114116106122132114m1320.20.61.8-3-1-4.6-1所以114+116+106+122+132+114+m+132=117×8,解得m=100,(3)通過(guò)殘差分析,懷疑殘差絕對(duì)值最大的那組數(shù)據(jù)有誤,經(jīng)再次核實(shí)后發(fā)現(xiàn)其真正利潤(rùn)應(yīng)該為116萬(wàn)元.請(qǐng)重新根據(jù)最小二乘法的思想與公式,求出新的經(jīng)驗(yàn)回歸方程.(1)通過(guò)殘差分析,可以發(fā)現(xiàn)異常樣本點(diǎn),重新修正或剔除異常樣本點(diǎn),求得更加合理的回歸方程.(2)決定系數(shù)R2越接近于1,表示回歸的效果越好.[針對(duì)訓(xùn)練](2024·福建福州模擬)中國(guó)茶文化博大精深,飲茶深受大眾喜愛(ài),茶水的口感與茶葉類型和水的溫度有關(guān),某數(shù)學(xué)建模小組為了獲得茶水溫度y(單位:℃)關(guān)于時(shí)間x(單位:min)的回歸方程模型,通過(guò)實(shí)驗(yàn)收集在25℃室溫,用85℃的水沖泡的條件下,茶水溫度隨時(shí)間變化的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行初步處理得到如圖所示散點(diǎn)圖,他們分別用兩種模型①y=a+bx與②y=d·cx+25進(jìn)行擬合,得到相應(yīng)的回歸方程并進(jìn)行殘差分析,得到如圖所示的殘差圖及一些統(tǒng)計(jì)量的值.(1)根據(jù)殘差圖判斷,①y=a+bx與②y=d·cx+25哪一個(gè)更適宜作為該茶水溫度y關(guān)于時(shí)間x的回歸方程類型?請(qǐng)說(shuō)明理由;解:(1)應(yīng)該選擇模型②,因?yàn)槟P廷诘臍埐铧c(diǎn)比較均勻地落在水平的帶狀區(qū)域中,且模型②的帶狀區(qū)域比模型①的帶狀區(qū)域窄.所以模型②的擬合精度高,回歸方程的預(yù)測(cè)精度高.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立該茶水溫度y關(guān)于時(shí)間x的回歸方程;解:(2)由y=d·cx+25得y-25=d·cx,兩邊取自然對(duì)數(shù)得ln(y-25)=ln(d·cx)=lnd+xlnc,設(shè)ω=ln(y-25),α=lnd,β=lnc,所以該茶水溫度y關(guān)于時(shí)間x的回歸方程為y=d·cx+25=60×0.92x+25.(3)已知該茶水溫度降至60℃口感最佳,根據(jù)(2)中的回歸方程,求在相同條件下沖泡的茶水,大約需要放置多長(zhǎng)時(shí)間才能達(dá)到最佳飲用口感.(結(jié)果精確到1分鐘)解:(3)在25℃室溫下,茶水溫度降至60℃口感最佳,所以大約需要放置7分鐘才能達(dá)到最佳飲用口感.考點(diǎn)三獨(dú)立性檢驗(yàn)[例5](2024·江西南昌模擬)某地開(kāi)設(shè)美食街,共有20多家餐飲單位進(jìn)駐,為維護(hù)市場(chǎng)價(jià)格秩序,營(yíng)造公平競(jìng)爭(zhēng)良好環(huán)境,監(jiān)管部門到美食街舉辦餐飲明碼標(biāo)價(jià)現(xiàn)場(chǎng)指導(dǎo)會(huì),現(xiàn)針對(duì)明碼標(biāo)價(jià)指導(dǎo)會(huì)前、會(huì)后游客滿意度進(jìn)行問(wèn)卷回訪調(diào)查,統(tǒng)計(jì)了100名游客的數(shù)據(jù),列出如下2×2列聯(lián)表:滿意度指導(dǎo)會(huì)前后合計(jì)會(huì)前會(huì)后滿意285785不滿意12315合計(jì)4060100請(qǐng)根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn)判斷游客對(duì)該地美食

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論