




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、回歸分析的基本知識(shí)點(diǎn)及習(xí)題 本周難點(diǎn):(1)求回歸直線方程,會(huì)用所學(xué)的知識(shí)對(duì)實(shí)際問(wèn)題進(jìn)行回歸分析. (2)掌握回歸分析的實(shí)際價(jià)值與基本思想. (3)能運(yùn)用自己所學(xué)的知識(shí)對(duì)具體案例進(jìn)行檢驗(yàn)與說(shuō)明. (4)殘差變量的解釋;(5)偏差平方和分解的思想;回歸直線:如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線。求回歸直線方程的一般步驟:作出散點(diǎn)圖(由樣本點(diǎn)是否呈條狀分布來(lái)判斷兩個(gè)量是否具有線性相關(guān)關(guān)系),若存在線性相關(guān)關(guān)系求回歸系數(shù) 寫出回歸直線方程 ,并利用回歸直線方程進(jìn)行預(yù)測(cè)說(shuō)明.2.回歸分析:對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一
2、種常用方法。建立回歸模型的基本步驟是:確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;畫好確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(線性關(guān)系). 由經(jīng)驗(yàn)確定回歸方程的類型. 按一定規(guī)則估計(jì)回歸方程中的參數(shù) (最小二乘法);得出結(jié)論后在分析殘差圖是否異常,若存在異常,則檢驗(yàn)數(shù)據(jù)是否有誤,后模型是否合適等. 4.殘差變量 的主要來(lái)源:(1)用線性回歸模型近似真實(shí)模型(真實(shí)模型是客觀存在的,通常我們并不知道真實(shí)模型到底是什么)所引起的誤差??赡艽嬖诜蔷€性的函數(shù)能夠更好地描述 與 之間的關(guān)系,但是現(xiàn)在卻用線性函數(shù)來(lái)表述這種關(guān)系,結(jié)果就會(huì)產(chǎn)生誤差。這種由于模型近似所引起的誤差包含
3、在 中。(2)忽略了某些因素的影響。影響變量 的因素不只變量 一個(gè),可能還包含其他許多因素(例如在描述身高和體重關(guān)系的模型中,體重不僅受身高的影響,還會(huì)受遺傳基因、飲食習(xí)慣、生長(zhǎng)環(huán)境等其他因素的影響),但通常它們每一個(gè)因素的影響可能都是比較小的,它們的影響都體現(xiàn)在 中。(3)觀測(cè)誤差。由于測(cè)量工具等原因,得到的 的觀測(cè)值一般是有誤差的(比如一個(gè)人的體重是確定的數(shù),不同的秤可能會(huì)得到不同的觀測(cè)值,它們與真實(shí)值之間存在誤差),這樣的誤差也包含在 中。上面三項(xiàng)誤差越小,說(shuō)明我們的回歸模型的擬合效果越好。二、例題選講1為研究某市家庭平均收入與月平均生活支出的關(guān)系,該市統(tǒng)計(jì)部門隨機(jī)調(diào)查了10個(gè)家庭,得數(shù)
4、據(jù)如下:家庭編號(hào)12345678910xi(收入)千元yi(支出)千元(1)判斷家庭平均收入與月平均生活支出是否相關(guān)(2)若二者線性相關(guān),求回歸直線方程.解 (1)作出散點(diǎn)圖: 觀察發(fā)現(xiàn)各個(gè)數(shù)據(jù)對(duì)應(yīng)的點(diǎn)都在一條直線附近,所以二者呈線性相關(guān)關(guān)系. (2)= +=,=(+)=, = 6,= 6 3,回歸方程= 6x+ 3.2下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過(guò)程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸)標(biāo)準(zhǔn)煤的幾組對(duì)照數(shù)據(jù). x3456y34(1)請(qǐng)畫出上表數(shù)據(jù)的散點(diǎn)圖;(2)請(qǐng)根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程=x+;(3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗
5、為90噸標(biāo)準(zhǔn)煤.試根據(jù)(2)求出的線性回歸方程,預(yù)測(cè)生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤解 (1)散點(diǎn)圖如下圖: (2)=,=3×+4×3+4×5+6×=.=32+42+52+62=86= =-=所求的線性回歸方程為=+.(3)現(xiàn)在生產(chǎn)100噸甲產(chǎn)品用煤y=×100+=,降低=(噸)標(biāo)準(zhǔn)煤.3科研人員為了全面掌握棉花新品種的生產(chǎn)情況,查看了氣象局對(duì)該地區(qū)年降雨量與年平均氣溫的統(tǒng)計(jì)數(shù)據(jù)(單位分別是mm,),并作了統(tǒng)計(jì).年平均氣溫年降雨量748542507813574701432(1)試畫出散點(diǎn)圖;(2)判斷兩個(gè)變量是否具有相關(guān)關(guān)系
6、.解 (1)作出散點(diǎn)圖如圖所示,(2)由散點(diǎn)圖可知,各點(diǎn)并不在一條直線附近,所以兩個(gè)變量是非線性相關(guān)關(guān)系.4在研究硝酸鈉的可溶性程度時(shí),對(duì)于不同的溫度觀測(cè)它在水中的溶解度,得觀測(cè)結(jié)果如下: 溫度(x)010205070溶解度(y)由資料看y與x呈線性相關(guān),試求回歸方程.解 =30,=.= 9.=-= 9×30=.回歸方程為= 9x+.5.某企業(yè)上半年產(chǎn)品產(chǎn)量與單位成本資料如下:月份產(chǎn)量(千件)單位成本(元)127323723471437354696568(1)求出線性回歸方程;(2)指出產(chǎn)量每增加1 000件時(shí),單位成本平均變動(dòng)多少(3)假定產(chǎn)量為6 000件時(shí),單位成本為多少元解
7、(1)n=6,=21,=426,=,=71,=79,=1 481,=.=-=71+×=.回歸方程為=+x=(2)因?yàn)閱挝怀杀酒骄儎?dòng)=0,且產(chǎn)量x的計(jì)量單位是千件,所以根據(jù)回歸系數(shù)b的意義有:產(chǎn)量每增加一個(gè)單位即1 000件時(shí),單位成本平均減少元.(3)當(dāng)產(chǎn)量為6 000件時(shí),即x=6,代入回歸方程:=(元)當(dāng)產(chǎn)量為6 000件時(shí),單位成本為元.1.觀察下列散點(diǎn)圖,則正相關(guān);負(fù)相關(guān);不相關(guān).它們的排列順序與圖形對(duì)應(yīng)順序是 .答案 a,c,b2.回歸方程=,則下列說(shuō)法正確的有 個(gè).=15是回歸系數(shù)a是回歸系數(shù)ax=10時(shí),y=0答案 13.(2009.湛江模擬)某地區(qū)調(diào)查了29歲兒童的
8、身高,由此建立的身高y(cm)與年齡x(歲)的回歸模型為=+,下列敘述正確的是 .該地區(qū)一個(gè)10歲兒童的身高為 cm該地區(qū)29歲的兒童每年身高約增加 cm該地區(qū)9歲兒童的平均身高是 cm利用這個(gè)模型可以準(zhǔn)確地預(yù)算該地區(qū)每個(gè)29歲兒童的身高答案 4.某人對(duì)一地區(qū)人均工資x(千元)與該地區(qū)人均消費(fèi)y(千元)進(jìn)行統(tǒng)計(jì)調(diào)查,y與x有相關(guān)關(guān)系,得到回歸直線方程=+.若該地區(qū)的人均消費(fèi)水平為千元,估計(jì)該地區(qū)的人均消費(fèi)額占人均工資收入的百分比約為 .答案 83%5.某化工廠為預(yù)測(cè)產(chǎn)品的回收率y,需要研究它和原料有效成分含量x之間的相關(guān)關(guān)系,現(xiàn)取8對(duì)觀測(cè)值,計(jì)算,得=52, =228, =478, =1 84
9、9,則其線性回歸方程為 .答案 =+6.有下列關(guān)系:人的年齡與他(她)擁有的財(cái)富之間的關(guān)系;曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)之間的關(guān)系;蘋果的產(chǎn)量與氣候之間的關(guān)系;森林中的同一種樹(shù)木,其斷面直徑與高度之間的關(guān)系.其中,具有相關(guān)關(guān)系的是 .答案 7.已知關(guān)于某設(shè)備的使用年限x與所支出的維修費(fèi)用y(萬(wàn)元),有如下統(tǒng)計(jì)資料:使用年限x23456維修費(fèi)用y若y對(duì)x呈線性相關(guān)關(guān)系,則回歸直線方程=x+表示的直線一定過(guò)定點(diǎn) .答案 (4,5)二、解答題8.期中考試結(jié)束后,記錄了5名同學(xué)的數(shù)學(xué)和物理成績(jī),如下表: 學(xué)生學(xué)科ABCDE數(shù)學(xué)8075706560物理7066686462(1)數(shù)學(xué)成績(jī)和物理成績(jī)具有相關(guān)關(guān)系嗎
10、(2)請(qǐng)你畫出兩科成績(jī)的散點(diǎn)圖,結(jié)合散點(diǎn)圖,認(rèn)識(shí)(1)的結(jié)論的特點(diǎn).解 (1)數(shù)學(xué)成績(jī)和物理成績(jī)具有相關(guān)關(guān)系.(2)以x軸表示數(shù)學(xué)成績(jī),y軸表示物理成績(jī),可得相應(yīng)的散點(diǎn)圖如下:由散點(diǎn)圖可以看出,物理成績(jī)和數(shù)學(xué)成績(jī)對(duì)應(yīng)的點(diǎn)不分散,大致分布在一條直線附近.9.以下是某地搜集到的新房屋的銷售價(jià)格y和房屋的面積x的數(shù)據(jù):房屋面積x(m2)11511080135105銷售價(jià)格y(萬(wàn)元)22(1)畫出數(shù)據(jù)對(duì)應(yīng)的散點(diǎn)圖;(2)求線性回歸方程,并在散點(diǎn)圖中加上回歸直線.解 (1)數(shù)據(jù)對(duì)應(yīng)的散點(diǎn)圖如圖所示:(2)=109,=,=60 975,=12 952,= 2=- 2= 2x+ 2.10.某公司利潤(rùn)y與銷售
11、總額x(單位:千萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):x10151720252832y12(1)畫出散點(diǎn)圖;(2)求回歸直線方程;(3)估計(jì)銷售總額為24千萬(wàn)元時(shí)的利潤(rùn).解 (1)散點(diǎn)圖如圖所示:(2)=(10+15+17+20+25+28+32)=21,=(1+2+=,=102+152+172+202+252+282+322=3 447,=10×1+15×+17×+20×2+25×+28×+32×=,=,=-=把x=24(千萬(wàn)元)代入方程得,=(千萬(wàn)元).估計(jì)銷售總額為24千萬(wàn)元時(shí),利潤(rùn)為千萬(wàn)元.11某種產(chǎn)品的廣告費(fèi)支出x與銷售額y(
12、單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):x24568y3040605070(1)畫出散點(diǎn)圖;(2)求回歸直線方程;(3)試預(yù)測(cè)廣告費(fèi)支出為10百萬(wàn)元時(shí),銷售額多大解 (1)根據(jù)表中所列數(shù)據(jù)可得散點(diǎn)圖如下:(2)列出下表,并用科學(xué)計(jì)算器進(jìn)行有關(guān)計(jì)算:i12345xi24568yi3040605070xiyi60160300300560因此,=5,= =50,=145, =13 500, =1 380.于是可得:=;=-=×5=.因此,所求回歸直線方程為:=+.(3)根據(jù)上面求得的回歸直線方程,當(dāng)廣告費(fèi)支出為10百萬(wàn)元時(shí),=×10+=(百萬(wàn)元),即這種產(chǎn)品的銷售收入大約為百萬(wàn)元.獨(dú)立
13、性檢驗(yàn)的基本知識(shí)點(diǎn)及習(xí)題本周內(nèi)容: 一、基礎(chǔ)知識(shí)梳理1.獨(dú)立性檢驗(yàn)利用隨機(jī)變量 來(lái)確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。2.判斷結(jié)論成立的可能性的步驟:(1)通過(guò)三維柱形圖和二維條形圖,可以粗略地判斷兩個(gè)分類變量是否有關(guān)系,但是這種判斷無(wú)法精確地給出所得結(jié)論的可靠程度。(2)可以利用獨(dú)立性檢驗(yàn)來(lái)考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。二、例題選講例1.為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了339名50歲以上的人,調(diào)查結(jié)果如下表所示: 患病不患病合計(jì)吸煙43162205不吸煙13121134合計(jì)56283339試問(wèn):50歲
14、以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)嗎分析:最理想的解決辦法是向所有50歲以上的人作調(diào)查,然后對(duì)所得到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,但這花費(fèi)的代價(jià)太大,實(shí)際上是行不通的,339人相對(duì)于全體50歲以上的人,只是一個(gè)小部分,已學(xué)過(guò)總體和樣本的關(guān)系,當(dāng)用樣本平均數(shù),樣本方差去估計(jì)總體相應(yīng)的數(shù)字特征時(shí),由于抽樣的隨機(jī)性,結(jié)果并不唯一?,F(xiàn)在情況類似,我們用部分對(duì)全體作推斷,推斷可能正確,也可能錯(cuò)誤。如果抽取的339個(gè)調(diào)查對(duì)象中很多人是吸煙但沒(méi)患慢性氣管炎,而雖不吸煙因身體體質(zhì)差而患慢性氣管炎,能夠得出什么結(jié)論呢我們有95%(或99%)的把握說(shuō)事件 與事件 有關(guān),是指推斷犯錯(cuò)誤的可能性為5%(或1%),這也常常說(shuō)成是
15、“以95%(或99%)的概率”是一樣的。解:根據(jù)列聯(lián)表中的數(shù)據(jù),得 。因?yàn)?,所以我們有99%的把握說(shuō):50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)。例2甲乙兩個(gè)班級(jí)進(jìn)行一門考試,按照學(xué)生考試成績(jī)優(yōu)秀和不優(yōu)秀統(tǒng)計(jì)成績(jī)后,得到如下的列聯(lián)表:班級(jí)與成績(jī)列聯(lián)表 優(yōu)秀不優(yōu)秀總計(jì)甲班103545乙班73845總計(jì)177390畫出列聯(lián)表的條形圖,并通過(guò)圖形判斷成績(jī)與班級(jí)是否有關(guān);利用列聯(lián)表的獨(dú)立性檢驗(yàn)估計(jì),認(rèn)為“成績(jī)與班級(jí)有關(guān)系”犯錯(cuò)誤的概率是多少。解:列聯(lián)表的條形圖如圖所示:由表中數(shù)據(jù)計(jì)算得K2的觀察值為k>。由下表中數(shù)據(jù)P(K2k)k得:P(K2,從而有50%的把握認(rèn)為“成績(jī)與班級(jí)有關(guān)系”,即斷言“
16、成績(jī)優(yōu)秀與班級(jí)有關(guān)系”犯錯(cuò)誤的概率為。評(píng)注:(1)畫出條形圖后,從圖形上判斷兩個(gè)分類變量之間是否有關(guān)系。這里通過(guò)圖形的直觀感覺(jué)的結(jié)果可能會(huì)出錯(cuò)。(2)計(jì)算得到K2的觀測(cè)值比較小,所以沒(méi)有理由說(shuō)明“成績(jī)優(yōu)秀與班級(jí)有關(guān)系”。這與反證法也有類似的地方,在使用反證法證明結(jié)論時(shí),假設(shè)結(jié)論不成立的條件下如果沒(méi)有推出矛盾,并不能說(shuō)明結(jié)論成立也不能說(shuō)明結(jié)論不成立。在獨(dú)立性檢驗(yàn)中,在假設(shè)“成績(jī)優(yōu)秀與班級(jí)沒(méi)有關(guān)系”的情況下,計(jì)算得到的K2的值比較小,且P(K2,說(shuō)明事件(K2不是一個(gè)小概率事件,這個(gè)事件的發(fā)生不足以說(shuō)明“成績(jī)優(yōu)秀與班級(jí)沒(méi)有關(guān)系”,即沒(méi)有理由說(shuō)明“成績(jī)優(yōu)秀與班級(jí)有關(guān)系”。這里沒(méi)有推出小概率事件發(fā)生類
17、似于反證法中沒(méi)有推出矛盾。例3為考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下的列聯(lián)列表:藥物效果與動(dòng)物試驗(yàn)列聯(lián)表 患病未患病總計(jì)服用藥104555沒(méi)服用藥203050總計(jì)3075105請(qǐng)問(wèn)能有多大把握認(rèn)為藥物有效解: 假設(shè)“服藥情況與是否患病之間沒(méi)有關(guān)系”,則K2的值應(yīng)比較?。蝗绻鸎2的值很大,則說(shuō)明很可能“服藥情況與是否患病之間有關(guān)系”。由題目中所給數(shù)據(jù)計(jì)算,得K2的觀測(cè)值為k,而P(K2,所以有%的把握認(rèn)為“服藥情況與是否患病之間有關(guān)系”,即大約有%的把握認(rèn)為藥物有效。例4在一次惡劣氣候的飛行航程中調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示,根據(jù)此資料你是否認(rèn)為在惡劣氣候中男人比女人更容
18、易暈機(jī) 暈機(jī)不暈機(jī)合計(jì)男人243155女人82634合計(jì)325789分析:這是一個(gè) 列聯(lián)表的獨(dú)立性檢驗(yàn)問(wèn)題,根據(jù)列聯(lián)表的數(shù)據(jù)求解。解:由條件中數(shù)據(jù),計(jì)算得: ,因?yàn)?,所以我們沒(méi)有理由說(shuō)暈機(jī)是否跟男女性別有關(guān),盡管這次航班中男人暈機(jī)的比例 比女人暈機(jī)的比例 高,但我們不能認(rèn)為在惡劣的氣候飛行中男人比女人更容易暈機(jī)。評(píng)注:在使用 統(tǒng)計(jì)量作 列聯(lián)表的獨(dú)立性檢驗(yàn)時(shí),要求表中的4個(gè)數(shù)據(jù)大于等于5,為此,在選取樣本的容量時(shí)一定要注意這一點(diǎn),本例中的4個(gè)數(shù)據(jù)都大于5,且滿足這一要求的。例5在對(duì)人們休閑的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人。女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運(yùn)動(dòng);男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運(yùn)動(dòng)。(1)根據(jù)以上數(shù)據(jù)建立一個(gè) 的列
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 紅木知識(shí)培訓(xùn)課件
- 小學(xué)生的自我介紹
- 職工待崗協(xié)議
- 清新創(chuàng)意靈感簡(jiǎn)歷模板
- 夫妻析產(chǎn)離婚協(xié)議二零二五年
- 個(gè)體公司股份轉(zhuǎn)讓合同二零二五年
- 二零二五高校學(xué)生實(shí)習(xí)協(xié)議書范例
- 公司入股合作協(xié)議書
- 組織設(shè)計(jì)與崗位管理
- 房屋租賃及居間服務(wù)合同范例二零二五年
- 環(huán)保知識(shí)競(jìng)賽考試參考題庫(kù)300題(含各題型)
- 基于AT89C51單片機(jī)的智能水表設(shè)計(jì)
- 五年級(jí)《他怎么了》作文600字5篇
- 精神疾病??婆R床醫(yī)療質(zhì)量控制與評(píng)價(jià)標(biāo)準(zhǔn)(試行)
- 預(yù)防高處墜落安全專項(xiàng)施工方案
- 【超星學(xué)習(xí)通】追尋幸福:中國(guó)倫理史視角(清華大學(xué))章節(jié)答案
- 常見(jiàn)急危重癥的快速識(shí)別要點(diǎn)與處理技巧演示課件
- 人教A版(2019)必修第二冊(cè)高中數(shù)學(xué)《平面向量及其應(yīng)用》單元教材教學(xué)分析
- 2021屆高考作文寫作指導(dǎo):材料作文的擬題技巧 (課件29張)
- GB/Z 18620.1-2008圓柱齒輪檢驗(yàn)實(shí)施規(guī)范第1部分:輪齒同側(cè)齒面的檢驗(yàn)
- GB/T 9754-2007色漆和清漆不含金屬顏料的色漆漆膜的20°、60°和85°鏡面光澤的測(cè)定
評(píng)論
0/150
提交評(píng)論