版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
(會作兩個相關(guān)變量的數(shù)據(jù)的散點圖,會利用散點圖認(rèn)識變量的相關(guān)關(guān)系/了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程/了解獨立檢驗(只要求2×2列聯(lián)表)的基本思想、方法簡單應(yīng)用/了解假設(shè)檢驗的基本思想、方法簡單應(yīng)用/了解聚類分析的基本思想、方法簡單應(yīng)用)9.3
變量間的相關(guān)關(guān)系、回歸分析及獨立性檢驗1.相關(guān)關(guān)系的量:當(dāng)自變量一定時,因變量的取值帶有一定的隨機(jī)性的兩個變量之間的關(guān)系稱為相關(guān)關(guān)系.2.回歸分析:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法叫做回歸分析.3.散點圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖.4.正相關(guān)與負(fù)相關(guān)概念:如果散點圖中的點散布在從左下角到右上角的區(qū)域內(nèi),稱為正相關(guān).如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi),稱為負(fù)相關(guān).5.
回歸直線:設(shè)所求的直線方程為,其中求回歸直線,使得樣本數(shù)據(jù)的點到它的距離的平方和最小的方法叫做最小二乘法.6.相關(guān)系數(shù):r=叫做變量y與x之間的樣本相關(guān)系數(shù),簡稱相關(guān)系數(shù),用 它來衡量兩個變量之間的線性相關(guān)程度.7.相關(guān)系數(shù)的性質(zhì):|r|≤1,且|r|越接近1,相關(guān)程度越大;且|r|越接近0,相關(guān)程度越?。?.獨立性檢驗:一般地,假設(shè)有兩個分類變量X和Y,它們的可能取值分別為
{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:2×2列聯(lián)表
若要推斷的論述為H1:X與Y有關(guān)系,可以按如下步驟判斷結(jié)論H1成立的可能性:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d(1)通過三維柱形圖和二維條形圖,可以粗略地判斷兩個分類變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度.①在三維柱形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上的兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大.②在二維條形圖中,可以估計滿足條件X=x1的個體中具有Y=y(tǒng)1的個體所占的比例,也可以估計滿足條件X=x2的個體中具有Y=y(tǒng)2的個體所占的比例.“兩個比例的值相差越大,H1成立的可能性就越大.”(2)可以利用獨立性檢驗來考察兩個分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度.具體做法是:①根據(jù)實際問題需要的可信程度確定臨界值k0;②利用公式K2=,由觀測數(shù)據(jù)計算得到隨機(jī)變量K2的觀測值k;③如果k>k0,就以(1-P(K2≥k0))×100%的把握認(rèn)為“X與Y有關(guān)系”;否則就說樣本觀測數(shù)據(jù)沒有提供“X與Y有關(guān)系”的充分證據(jù).1.在對兩個變量x,y進(jìn)行線性回歸分析時有下列步驟: ①對所求出的回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=1,2,…,n;③求線性回歸方程;④求相關(guān)系數(shù);⑤根據(jù)所搜集的數(shù)據(jù)繪制散點圖. 如果根據(jù)可靠性要求能夠作出變量x,y具有線性相關(guān)結(jié)論,則在下列操作順序中正確的是() A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③① 答案:D2.對兩個變量y和x進(jìn)行回歸分析,得到一組樣本數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),則下列說法中不正確的是() A.由樣本數(shù)據(jù)得到的回歸方程=bx+a必過樣本中心() B.殘差平方和越小的模型,擬合的效果越好 C.用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好 D.若變量y和x之間的相關(guān)系數(shù)為r=-0.9362,則變量y和x之間具有線性相 關(guān)關(guān)系 答案:C3.(2009·寧夏、海南)對變量x,y有觀測數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點圖(1);對變量u、v有觀測數(shù)據(jù)(ui,vi)(i=1,2,…,10),得散點圖(2).由這兩個散點圖可以判斷()A.變量x與y正相關(guān),u與v正相關(guān)B.變量x與y正相關(guān),u與v負(fù)相關(guān)C.變量x與y負(fù)相關(guān),u與v正相關(guān)D.變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)解析:由圖(1)可知,各點整體呈遞減趨勢,x與y負(fù)相關(guān),由圖(2)可知,各點整體呈遞增趨勢,u與v正相關(guān).答案:C4.下面是一個2×2列聯(lián)表
則表中a、b處的值分別為() A.94,96B.52,50C.52,54D.54,52 答案:C
y1y2總計x1a2173x222527總計b46判斷兩個變量正相關(guān)還是負(fù)相關(guān),有三種方法:1.利用散點圖;2.利用相關(guān)系數(shù)r的符號;當(dāng)r>0時,正相關(guān);r<0時,負(fù)相關(guān);3.在已知兩變量線性相關(guān)時,也可以利用回歸方程=a+bx.當(dāng)b>0時,=a+bx是增函數(shù),兩變量是正相關(guān),當(dāng)b<0時,=a+bx是減函數(shù), 兩變量是負(fù)相關(guān).【例1】山東魯潔棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進(jìn)行施化肥量x對產(chǎn)量y影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg). (1)畫出散點圖; (2)判斷是否具有相關(guān)關(guān)系.施化肥量x15202530354045棉花產(chǎn)量y330345365405445450455思維點撥:用施化肥量x作為橫軸,產(chǎn)量y為縱軸可作出散點圖,由散點圖即可分析是否具有線性相關(guān)關(guān)系.解答:(1)散點圖如右圖所示, (2)由散點圖知,各組數(shù)據(jù)對應(yīng)點大致都在一條直線附近,所以施化肥量x與產(chǎn)量y具有線性相關(guān)關(guān)系.對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析時,首先要作出散點圖,然后進(jìn)行相關(guān)性檢驗,在確認(rèn)具有線性相關(guān)關(guān)系后,再求其回歸直線.
【例2】一臺機(jī)器使用時間較長,但還可以使用.它按不同的轉(zhuǎn)速生產(chǎn)出來的某機(jī)械零件有一些會有缺點,每小時生產(chǎn)有缺點零件的多少,隨機(jī)器運轉(zhuǎn)的速度而變化,下表為抽樣試驗結(jié)果:轉(zhuǎn)速x(轉(zhuǎn)/秒)1614128每小時生產(chǎn)有缺點的零件數(shù)y(件)11985(1)對變量y與x進(jìn)行相關(guān)性檢驗;(2)如果y與x有線性相關(guān)關(guān)系,求回歸直線方程;(3)若實際生產(chǎn)中,允許每小時的產(chǎn)品中有缺點的零件最多為10個,那么,機(jī)器的運轉(zhuǎn)速度應(yīng)控制在什么范圍內(nèi)?思維點撥:利用相關(guān)系數(shù)r進(jìn)行線性相關(guān)檢驗(也可利用散點圖).如果線性相關(guān),再求回歸直線方程并加以判斷.(2)=0.7286x-0.8571.(3)要使≤10?0.7286x-0.8571≤10,所以x≤14.9013.所以機(jī)器的轉(zhuǎn)速應(yīng)控制在14.9013轉(zhuǎn)/秒以下.解答:變式2.假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費用y(萬元),有如下的統(tǒng)計資料:
(1)y與x間是否有線性相關(guān)關(guān)系?若有,求出線性回歸方程; (2)估計使用年限為10年時的維修費用.使用年限(x)/年23456維修費用(y)/萬元2.23.85.56.57.0所謂獨立性檢驗,就是根據(jù)采集樣本的數(shù)據(jù),先利用三維柱形圖和二維條形圖粗略判斷兩個分類變量是否有關(guān)系,再利用公式計算K2的值,比較它與臨界值的大小關(guān)系,來判斷事件X與Y是否有關(guān)的問題.【例3】(2009·遼寧)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質(zhì)品.從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得結(jié)果如下表: 甲廠:分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)頻數(shù)12638618292614乙廠:(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;(2)由以上統(tǒng)計數(shù)據(jù)填下面2×2列聯(lián)表,并問是否有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”.分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)頻數(shù)297185159766218甲廠乙廠合計優(yōu)質(zhì)品非優(yōu)質(zhì)品合計解答:(1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為=72%;乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為=64%. 所以有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”
甲廠乙廠合計優(yōu)質(zhì)品360320680非優(yōu)質(zhì)品140180320合計5005001000(2)變式3.在對人們休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人.女性中有43人主要的休閑方式是看電視,另外27人的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動. (1)根據(jù)以上數(shù)據(jù)建立一個2×2列聯(lián)表; (2)畫出二維條形圖; (3)檢驗休閑方式是否與性別有關(guān),可靠性有多大.解答:(1)2×2列聯(lián)表如圖:休閑方式性別看電視運動合計女432770男213354合計6460124(2)二維條形圖如圖:(3)假設(shè)休閑方式與性別無關(guān),則K2=≈6.201>5.024,所以有理由認(rèn)為休閑方式與性別無關(guān)是不合理的,即我們有97.5%的把握認(rèn)為休閑方式與性別有關(guān).【方法規(guī)律】1.求回歸方程,關(guān)鍵在于正確求出系數(shù)a,b,由于a,b的計算量大,計算時應(yīng)仔細(xì)謹(jǐn)慎,分層進(jìn)行,避免因計算而產(chǎn)生錯誤.(注意回歸直線方程中一次項系數(shù)為b,常數(shù)項為a,這與一次函數(shù)的習(xí)慣表示不同).2.回歸分析是處理變量相關(guān)關(guān)系的一種數(shù)學(xué)方法.主要解決:①確定特定量之間是否有相關(guān)關(guān)系,如果有就找出它們之間貼近的數(shù)學(xué)表達(dá)式;②根據(jù)一組觀察值,預(yù)測變量的取值及判斷變量取值的變化趨勢;③求出回歸直線方程.3.獨立性檢驗是一種假設(shè)檢驗,在對總體的估計中,通過抽取樣本,構(gòu)造合適的隨機(jī)變量,對假設(shè)的正確性進(jìn)行判斷.
為了分析某個高三學(xué)生的學(xué)習(xí)狀態(tài),對其下一階段的學(xué)習(xí)提供指導(dǎo)性建議.現(xiàn)對他前7次考試的數(shù)學(xué)成績x、物理成績y進(jìn)行分析.下面是該生7次考試的成績.數(shù)學(xué)888311792108100112物理949110896104101106(1)他的數(shù)學(xué)成績與物理成績哪個更穩(wěn)定?請給出你的證明;(2)已知該生的物理成績y與數(shù)學(xué)成績x是線性相關(guān)的,若該生的物理成績達(dá)到115分,請你估計他的數(shù)學(xué)成績大約是多少?并請你根據(jù)物理成績與數(shù)學(xué)成績的相關(guān)性,給出該生在學(xué)習(xí)數(shù)學(xué)、物理上的合理建議.【答題模板】(2)由于x與y之間具有線性相關(guān)關(guān)系,根據(jù)回歸系數(shù)公式得到b==0.5,a=100-0.5×100=50,∴線性回歸方程為=0.5x+50.當(dāng)y=115時,x=130.建議:進(jìn)一步加強對數(shù)學(xué)的學(xué)習(xí),提高數(shù)學(xué)成績的穩(wěn)定性,將有助于物理成績的進(jìn)一步提高.
【分析點評】1.成績的穩(wěn)定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 八年級英語Connect課件
- 車輛整改報告范文
- 2025年錦州貨運資格證模擬考試卷
- 個人自檢自查報告范文
- 外墻風(fēng)貌調(diào)研報告范文
- 常見應(yīng)急事故
- 2025年玉樹c1貨運上崗證模擬考試
- 2025年潮州貨運從業(yè)資格證模擬考試保過版
- 2025年深圳a2貨運從業(yè)資格證模擬考試題
- 2025年??谪涍\從業(yè)資格證模擬考試0題b2b
- 數(shù)據(jù)分析服務(wù)合同三篇
- 血透室安全隱患
- 《中國園林發(fā)展》課件
- 菏澤學(xué)院教育科學(xué)研究方法(專升本)復(fù)習(xí)題
- 小學(xué)科技節(jié)活動總結(jié)15篇
- 船運居間協(xié)議合同范例
- 2024-2025學(xué)年統(tǒng)編版道德與法治三年級上冊 期末測試卷(含答案)
- 教育學(xué)原理項賢明第九章教師與學(xué)生
- 醫(yī)院高空墜物預(yù)防措施方案
- 2024-2025學(xué)年高二上學(xué)期期中家長會-家校同頻共話成長 課件
- 2024年度企業(yè)咨詢服務(wù)框架協(xié)議
評論
0/150
提交評論