




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三章 統(tǒng)計案例,回歸分析的基本思想及其初步應用,1、求回歸直線方程的步驟:,(3)代入公式,(1)畫散點圖,例1 從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。,求根據一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為 172cm的女大學生的體重。,3、從散點圖還看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數y=bx+a描述它們關系。,思考 產生隨機誤差項e 的原因是什么?,我們可以用下面的線性回歸模型來表示: y=bx+a+e,其中a和b為模型的未知參數, e稱為隨機誤差。,思考 產生隨機誤差項e的原因是什么?,隨機誤差e的來源(可以推
2、廣到一般): 1、其它因素的影響:影響身高 y 的因素不只是體重 x,可能 還包括遺傳基因、飲食習慣、生長環(huán)境等因素; 2、用線性回歸模型近似真實模型所引起的誤差; 3、身高 y 的觀測誤差。,假設隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。但是,在圖中,數據點并沒有完全落在回歸直線上。這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上“推”開了。,在例1中,殘差平方和約為128.361。,例如,編號為6的女大學生,計算殘差為:,類似于方差的定義,表1-4列出了女大學生身高和體重的原始數據以及相應的殘差數據。,在研究兩個變量間的
3、關系時,首先要根據散點圖來粗略判斷它們是否線性相關,是否可以用回歸模型來擬合數據。,殘差分析與殘差圖的定義:,然后,我們可以通過殘差 來判斷模型擬合的效果,判斷原始 數據中是否存在可疑數據,這方面的分析工作稱為殘差分析。,我們可以利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖。,殘差圖的制作及作用。 坐標縱軸為殘差變量,橫軸可以有不同的選擇; 若模型選擇的正確,殘差圖中的點應該分布在以橫軸為心的帶形區(qū)域; 對于遠離橫軸的點,要特別注意。,身高與體重殘差圖,幾點說明: 第一個樣本點和第6個樣本點的殘差比較大,需要確認在采集
4、過程中是否有人為的錯誤。如果數據采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數據;如果數據采集沒有錯誤,則需要尋找其他的原因。 另外,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型計較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高。,R2越接近1,表示回歸的效果越好(因為R2越接近1,表示解析變量和預報變量的線性相關性越強)。,如果某組數據可能采取幾種不同回歸方程進行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較大的模型作為這組數據的模型。,總的來說: 相關指數R2是度量模型擬合效果的一種指標。 在線性模型中,它代表自變量刻畫預報變量的能
5、力。,例 關于x與y有如下數據: 有如下的兩個線性模型: (1) ;(2) 試比較哪一個擬合效果更好。,第一個好,一般地,建立回歸模型的基本步驟為:,(1)確定研究對象,明確哪個變量是解析變量,哪個變量是預報變量。,(2)畫出確定好的解析變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等)。,(3)由經驗確定回歸方程的類型(如我們觀察到數據呈線性關系,則選用線性回歸方程y=bx+a).,(4)按一定規(guī)則估計回歸方程中的參數(如最小二乘法)。,(5)得出結果后分析殘差圖是否有異常(個別數據對應殘差過大,或殘差呈現不隨機的規(guī)律性,等等),過存在異常,則檢查數據是否有誤,或模型是 否合
6、適等。,案例2 一只紅鈴蟲的產卵數y和溫度x有關?,F收集了7組觀測數據列于表中:,(1)試建立產卵數y與溫度x之間的回歸方程;并預測溫度為28oC時產卵數目。 (2)你所建立的模型中溫度在多大程度上解釋了產卵數的變化?,畫散點圖,假設線性回歸方程為 :=bx+a,選 模 型,所以,一次函數模型中溫度解釋了74.64%的產卵數變化。,探索新知,方案1,當x=28時,y =19.8728-463.73 93,線性模型,奇怪?,9366 ? 模型不好?,方案2,問題3,合作探究,t=x2,二次函數模型,方案2解答,平方變換:令t=x2,產卵數y和溫度x之間二次函數模型y=bx2+a就轉化為產卵數y和溫度的平方t之間線性回歸模型y=bt+a,作散點圖,并由計算器得:y和t之間的線性回歸方程為y=0.367t-202.54,相關指數R2=r20.8962=0.802,將t=x2代入線性回歸方程得: y=0.367x2 -202.54 當x=28時,y=0.367282-202.5485,且R2=0.802, 所以,二次函數模型中溫度解 釋了80.2%的產卵數變化。,產卵數,氣溫,指數函數模型,方案3,合作探究,對數,方案3解答,當x=28oC 時,y 44 ,指數回歸模型中溫度解釋了98.5%的產卵數的變化,由計算器得:z關于x的線性回歸方程 為z=0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 仿真雕塑合同范本
- 口腔門診入股合同范本
- 企業(yè)績效合同范本
- 醫(yī)院常用合同范本
- 勞務合同范本主體
- 廠房建設包工合同范本
- 卡車配件轉讓合同范本
- 南沙承包單位食堂合同范本
- 優(yōu)惠物流倉庫租賃合同范本
- 電梯采購合同范本
- 初中物理競賽及自主招生講義:第7講 密度、壓強與浮力(共5節(jié))含解析
- 高中主題班會 梁文鋒和他的DeepSeek-由DeepSeek爆火開啟高中第一課-高中主題班會課件
- 污水處理設施運維服務投標方案(技術標)
- 一年級下冊書法教案 (一)
- 《浙江省應急管理行政處罰裁量基準適用細則》知識培訓
- 2024年全國職業(yè)院校技能大賽高職組(康復治療技術賽項)考試題庫(含答案)
- 2025年山東健康集團招聘筆試參考題庫含答案解析
- 《中外廣播電視史》課件
- 2024年八年級語文下冊《經典常談》第一章《說文解字》練習題卷附答案
- 華為基建項目管理手冊
- 三年級數學下冊單元計劃【9個單元全】
評論
0/150
提交評論