版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、10 10 簡單線性回歸分析簡單線性回歸分析主主 講:講: 盧盧 潔潔 Ph.D : hanyaa800 yahoo辦公室:鄭大公衛(wèi)學(xué)院辦公室:鄭大公衛(wèi)學(xué)院 A510室室統(tǒng)計學(xué)研討特點:統(tǒng)計學(xué)研討特點:n研討的是樣本,要對總體作出推斷研討的是樣本,要對總體作出推斷n得到的是頻率,要對概率作出推斷得到的是頻率,要對概率作出推斷n需進展參數(shù)估計和假設(shè)檢驗需進展參數(shù)估計和假設(shè)檢驗 抽樣研討抽樣研討 抽樣誤差抽樣誤差n利用利用“小概率原那么進展統(tǒng)計推小概率原那么進展統(tǒng)計推斷斷 準確的搜集數(shù)據(jù);準確的搜集數(shù)據(jù); 準確的錄入數(shù)據(jù);準確的錄入數(shù)據(jù); 正確的選用統(tǒng)計分析方法、調(diào)用統(tǒng)計分析程序;正確的選用統(tǒng)計分
2、析方法、調(diào)用統(tǒng)計分析程序; 對輸出的結(jié)果作出合理的解釋。對輸出的結(jié)果作出合理的解釋。統(tǒng)計學(xué)學(xué)習(xí)的重點是掌握如何:統(tǒng)計學(xué)學(xué)習(xí)的重點是掌握如何:統(tǒng)計統(tǒng)計描畫描畫參數(shù)估計:點估計、區(qū)間估計參數(shù)估計:點估計、區(qū)間估計假設(shè)檢驗假設(shè)檢驗定量資料定量資料離散趨勢:離散趨勢:算術(shù)均數(shù)、算術(shù)均數(shù)、 中位數(shù)等中位數(shù)等集中趨勢:集中趨勢:極差、極差、 四分位數(shù)間距、四分位數(shù)間距、方差、規(guī)范差、變異系數(shù)方差、規(guī)范差、變異系數(shù)定性資料:頻率型目的、強度型目的、比定性資料:頻率型目的、強度型目的、比 統(tǒng)計表和統(tǒng)計圖統(tǒng)計表和統(tǒng)計圖統(tǒng)計統(tǒng)計推斷推斷統(tǒng)計學(xué)的主要內(nèi)容:統(tǒng)計學(xué)的主要內(nèi)容:變量變量對于單變量對于單變量對于多變量:對
3、于多變量:多重線性回歸、多重線性回歸、logistic分析分析非參數(shù)檢驗非參數(shù)檢驗參數(shù)檢驗參數(shù)檢驗定量資料定量資料定性資料定性資料實驗設(shè)計實驗設(shè)計對于兩變量:對于兩變量:簡單線性相關(guān)和回歸分析簡單線性相關(guān)和回歸分析數(shù)據(jù)資料數(shù)據(jù)資料定量資料定量資料數(shù)據(jù)數(shù)據(jù)類型類型設(shè)計設(shè)計類型類型單單樣樣本本定性資料定性資料設(shè)計設(shè)計類型類型兩兩獨獨立立樣樣本本配配對對樣樣本本多多獨獨立立樣樣本本隨隨機機區(qū)區(qū)組組t / Z檢驗檢驗方差分析方差分析單單樣樣本本兩、兩、多多獨獨立立樣樣本本配配對對樣樣本本等等級級資資料料進入進入條件條件不滿足進不滿足進入條件入條件秩和檢驗秩和檢驗四四格格表表RC列列聯(lián)聯(lián)表表配配對對RC
4、x2檢驗檢驗設(shè)計設(shè)計類型類型配配對對四四格格表表假設(shè)他知道某一個人的身高和體重,他能知道這假設(shè)他知道某一個人的身高和體重,他能知道這個人的手指有多粗嗎?個人的手指有多粗嗎?假設(shè)他知道患兒的月齡,他能換算出他體重是多假設(shè)他知道患兒的月齡,他能換算出他體重是多少嗎?少嗎?調(diào)查父親身高與子女身高之間的關(guān)系。調(diào)查父親身高與子女身高之間的關(guān)系。調(diào)查收入程度與受教育程度之間的關(guān)系。調(diào)查收入程度與受教育程度之間的關(guān)系?;貧w分析:是研討一個隨機變量如何隨另一個變量回歸分析:是研討一個隨機變量如何隨另一個變量可固定,也可隨機變化的??晒潭?,也可隨機變化的。從一組樣本數(shù)據(jù)出發(fā),確定變量之間的回歸關(guān)系式;從一組樣本
5、數(shù)據(jù)出發(fā),確定變量之間的回歸關(guān)系式;對這些關(guān)系式的可信程度進展各種統(tǒng)計檢驗,并從影對這些關(guān)系式的可信程度進展各種統(tǒng)計檢驗,并從影 響因變量的諸多變量中找出具有統(tǒng)計學(xué)意義的變量;響因變量的諸多變量中找出具有統(tǒng)計學(xué)意義的變量;利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù) 測或控制另一個特定變量的取值,并給出這種預(yù)測測或控制另一個特定變量的取值,并給出這種預(yù)測或或 控制的準確程度。控制的準確程度?;貧w分析的主要目的:回歸分析的主要目的: 就是研討固定自變量就是研討固定自變量X的情況下,因變量的情況下,因變量Y的總體均數(shù)與的總體均數(shù)與X之間的回歸關(guān)系;即
6、:之間的回歸關(guān)系;即:簡單線性回歸分析簡單線性回歸分析線性回歸方程的建立線性回歸方程的建立回歸方程的解釋回歸方程的解釋線性回歸的前提條件線性回歸的前提條件回歸方程的假設(shè)檢驗回歸方程的假設(shè)檢驗回歸方程的統(tǒng)計運用回歸方程的統(tǒng)計運用10.1 10.1 什么是回歸?什么是回歸? 。 10.2 10.2 簡單線性回歸模型簡單線性回歸模型 。 10.1 10.1 什么是回歸?什么是回歸?1. 線性回歸分析線性回歸分析 linear regression analysis:研討一個變量和另外一些變量間線性數(shù)量關(guān)系的:研討一個變量和另外一些變量間線性數(shù)量關(guān)系的統(tǒng)計分析方法。統(tǒng)計分析方法。簡單線性回歸簡單線性回
7、歸 simple linear regression多重線性回歸多重線性回歸 muptiple linear regression:涉及多個變量自變量、解釋變量時稱:涉及多個變量自變量、解釋變量時稱。:模型中只包含兩個有:模型中只包含兩個有“依存關(guān)系的變量,一個依存關(guān)系的變量,一個變量隨另一個變量的變化而變化,且呈直線變化變量隨另一個變量的變化而變化,且呈直線變化趨勢,叫趨勢,叫。分分類類矮個子的父代:矮個子的父代:64英寸英寸而它子代:而它子代:67英寸英寸父親和他兒子的身高:父親和他兒子的身高:1.父代的總均數(shù)父代的總均數(shù)=68英寸英寸 子代的總均數(shù)子代的總均數(shù)=69英寸英寸2.高個子的父
8、代:高個子的父代:72英寸英寸 而它子代:而它子代:71英寸英寸調(diào)查了調(diào)查了1087對父子:對父子:例例10.1 為研討大氣污染一氧化氮為研討大氣污染一氧化氮NO的濃度能否遭到汽車流量、的濃度能否遭到汽車流量、氣候情況等要素的影響,選擇氣候情況等要素的影響,選擇24個工個工業(yè)程度相近的一個交通點,統(tǒng)計單位業(yè)程度相近的一個交通點,統(tǒng)計單位時間過往的汽車數(shù)千輛,同時在時間過往的汽車數(shù)千輛,同時在低空一樣高度測定了該時間段平均氣低空一樣高度測定了該時間段平均氣溫溫、空氣濕度、風(fēng)速、空氣濕度、風(fēng)速m/s以及空氣中一氧化氮以及空氣中一氧化氮NO的濃度的濃度10-6,數(shù)據(jù)如下表。,數(shù)據(jù)如下表。 2. 2.
9、 簡單線性回歸的兩個變量:簡單線性回歸的兩個變量:反響變量反響變量 response variable或或 因變量因變量dependent variable :是按某種規(guī)律變化的隨機變量,是被估計:是按某種規(guī)律變化的隨機變量,是被估計的被預(yù)測的變量。用的被預(yù)測的變量。用“Y表示。表示。解釋變量解釋變量explanatory variable或自變量或自變量 independent variable 或預(yù)測因子或預(yù)測因子 predictor :可看作影響要素,是能獨立自在變化的變量,是:可看作影響要素,是能獨立自在變化的變量,是“Y所依存的變量,常用所依存的變量,常用“X表示,可是隨機變量,表示
10、,可是隨機變量,也可是人為控制或選擇的變量。也可是人為控制或選擇的變量。假設(shè)假設(shè) Y 隨隨X1、X2、Xm的改動而改動的改動而改動:資料類型:定量資料資料類型:定量資料目的:了解一氧化氮濃度與汽車流量、氣候目的:了解一氧化氮濃度與汽車流量、氣候情況等單變量之間的依存關(guān)系。情況等單變量之間的依存關(guān)系?!景咐馕觥亢唵尉€性回歸簡單線性回歸線性回歸的分類:線性回歸的分類:I I 型回歸型回歸 :因變量:因變量Y Y是隨機變化的,但自是隨機變化的,但自變量變量X X可以不隨機可以不隨機 ,當它是可以準確丈量和,當它是可以準確丈量和嚴密控制的量時,叫嚴密控制的量時,叫Y Y 關(guān)于關(guān)于X X 的的I I型
11、回歸。型回歸。IIII型回歸型回歸 :因變量:因變量Y Y和自變量和自變量X X都是隨都是隨機變化的,叫機變化的,叫Y Y 關(guān)于關(guān)于X X 的的IIII型回歸。型回歸。表表12-1 不同不同IgG濃度下的沉淀環(huán)數(shù)據(jù)濃度下的沉淀環(huán)數(shù)據(jù)IgG濃度(濃度(IU/ml)X12345沉淀環(huán)直徑(沉淀環(huán)直徑(mm)Y4.05.56.27.78.5 線性回歸關(guān)系的特點:線性回歸關(guān)系的特點:u各觀測點分布在直線周圍的束狀帶內(nèi);各觀測點分布在直線周圍的束狀帶內(nèi);u當變量當變量 X 取某個值時,變量取某個值時,變量Y取值能夠有幾個。取值能夠有幾個。u變量間關(guān)系不能用函數(shù)關(guān)系準確表達變量間關(guān)系不能用函數(shù)關(guān)系準確表達
12、Ya bx 自然景象之間存在著大量相互聯(lián)絡(luò)、相互依賴自然景象之間存在著大量相互聯(lián)絡(luò)、相互依賴、相互制約的數(shù)量關(guān)系。、相互制約的數(shù)量關(guān)系。描畫確定性景象的描畫確定性景象的確定性依存關(guān)系確定性依存關(guān)系描畫不確定性景象描畫不確定性景象隨機隨機景象的依存關(guān)系景象的依存關(guān)系函數(shù)關(guān)系函數(shù)關(guān)系回歸關(guān)系回歸關(guān)系舉例:正方形面積舉例:正方形面積Y=X2舉例:年齡與身高舉例:年齡與身高Y=+ Y X10.2 10.2 簡單線性回歸模型的建立簡單線性回歸模型的建立 只思索只思索NO濃度和車流量的關(guān)系,濃度和車流量的關(guān)系,問之間能否存在數(shù)量依存關(guān)系?問之間能否存在數(shù)量依存關(guān)系?10.1.1 解析:解析:回歸分析的要到
13、達下面三個目的:回歸分析的要到達下面三個目的:n NO濃度與車流量之間是有聯(lián)絡(luò)?濃度與車流量之間是有聯(lián)絡(luò)?n 是直線趨勢,還是曲線趨勢?是直線趨勢,還是曲線趨勢?n 如何采用回歸方程定量地描畫這種趨勢?如何采用回歸方程定量地描畫這種趨勢?n 車流量每添加車流量每添加100輛,輛,NO濃度平均會添加多少?濃度平均會添加多少? 統(tǒng)計描畫統(tǒng)計描畫n X和和Y間的回歸聯(lián)絡(luò)能否有統(tǒng)計學(xué)意義?間的回歸聯(lián)絡(luò)能否有統(tǒng)計學(xué)意義?n車流量對車流量對NO濃度的影響奉獻有多大?濃度的影響奉獻有多大? 統(tǒng)計推斷統(tǒng)計推斷n 如何由車流量預(yù)測大氣中如何由車流量預(yù)測大氣中NO的平均濃度?的平均濃度?n 如何經(jīng)過控制車流量到達
14、控制如何經(jīng)過控制車流量到達控制NO濃度的目的?濃度的目的? 統(tǒng)計運用統(tǒng)計運用10.1.2 如何定量地描畫兩者的關(guān)系:如何定量地描畫兩者的關(guān)系:繪制散點圖繪制散點圖回歸方程:求回歸系數(shù)回歸方程:求回歸系數(shù)和常數(shù)項和常數(shù)項回歸方程和回歸系數(shù)回歸方程和回歸系數(shù) 的假設(shè)檢驗的假設(shè)檢驗總體回歸系數(shù)總體回歸系數(shù)的區(qū)間估計的區(qū)間估計回歸方程的統(tǒng)計運用回歸方程的統(tǒng)計運用一繪制散點圖一繪制散點圖 從散點圖可見:車從散點圖可見:車流量與空氣中流量與空氣中NO濃濃度所對應(yīng)的點分布度所對應(yīng)的點分布在一個線性束狀帶在一個線性束狀帶內(nèi),有線性的趨向,內(nèi),有線性的趨向,所以可以思索做線所以可以思索做線性回歸分析。性回歸分析
15、。 通常情況下,研討者只能獲得一定數(shù)量的樣本數(shù)通常情況下,研討者只能獲得一定數(shù)量的樣本數(shù)據(jù),用樣本數(shù)據(jù)建立的有關(guān)據(jù),用樣本數(shù)據(jù)建立的有關(guān)Y依從依從X變化的線性表達變化的線性表達式稱為回歸方程式稱為回歸方程regression equation,記為:,記為:Ya bx YX= +X 那么在總體中,能夠存在對應(yīng)的方程模型:回歸直線的截距參數(shù)回歸直線的截距參數(shù)intercept 回歸直線的斜率參數(shù)回歸直線的斜率參數(shù)slope又稱回歸系數(shù)又稱回歸系數(shù)regression coefficientiiiYY讓一切點的讓一切點的 的平方和最小的平方和最小iiYYv用最小二乘法擬合直線,選擇用最小二乘法擬合
16、直線,選擇a和和b使其殘差樣本點使其殘差樣本點到直線的垂直間隔到直線的垂直間隔)平方和到達最小。平方和到達最小。三回歸參數(shù)的估計:最小二乘估計三回歸參數(shù)的估計:最小二乘估計least square estimation回歸參數(shù)的估計方法:回歸參數(shù)的估計方法:),.,2 , 1( ,)()(21niLLXXYYXXbxxxyiniii()XbYa()Ya bx 回歸方程:回歸方程:22() (- -) iiiiSSEyyy a bx 用最小二乘法擬合直線,選擇a和b使其殘差樣本點到直線的垂直間隔)平方和到達最小。即:使以下的SSE到達最小值。求:求:NO濃度和車流量間的簡單線性回歸方程?濃度和車
17、流量間的簡單線性回歸方程?解:由樣本數(shù)據(jù)了解計算統(tǒng)計量,帶入下公式,解:由樣本數(shù)據(jù)了解計算統(tǒng)計量,帶入下公式,求出回歸系數(shù)求出回歸系數(shù)b1584. 0)()(21XXYYXXbiniii1353. 0XbYaXY1584. 01353. 0作回歸直線圖作回歸直線圖帶入下公式,求出回歸截矩帶入下公式,求出回歸截矩a最小二乘法原那么下的回歸方程為:最小二乘法原那么下的回歸方程為:三建立回歸方程,作回歸直線圖三建立回歸方程,作回歸直線圖回歸方程的解釋回歸方程的解釋 b b 的意義?的意義? a a 的意義?的意義? 的意義的意義 的意義?的意義?y yyYa bx XY1584. 01353. 0y
18、回歸系數(shù)回歸系數(shù)的意義:的意義:1.由總體回歸方程可知由總體回歸方程可知 Y X= + x,參數(shù)參數(shù) 的意義:假設(shè)自變量的意義:假設(shè)自變量X添加添加1個單位,反響變量個單位,反響變量Y的的 平均值便添加平均值便添加 個單位。個單位。 。2.由于由于 是是 Y X= +X 的估計表達式,的估計表達式,所以樣本回歸系數(shù)所以樣本回歸系數(shù)b 表示表示 X 添加一個單位,樣本添加一個單位,樣本察看值察看值Y 平均添加平均添加 b 個單位。個單位。Ya bx 總體回歸系數(shù)總體回歸系數(shù) regression coefficient 的統(tǒng)計學(xué)意義:的統(tǒng)計學(xué)意義:X每添加或減少一個單位,每添加或減少一個單位,Y
19、 平平均改動了個均改動了個 單位;單位; 越大,表示越大,表示Y 隨隨X 增減變化的增減變化的趨勢越陡。趨勢越陡。n 0, 闡明闡明Y與與X呈同向線性變化趨勢呈同向線性變化趨勢n =0, 闡明闡明Y與與X無線性回歸關(guān)系,但能夠有其它關(guān)系無線性回歸關(guān)系,但能夠有其它關(guān)系n 0, 闡明闡明Y與與X呈反向線性變化趨勢呈反向線性變化趨勢3. 線性回歸分析的前題條件:線性回歸分析的前題條件: 線性線性linear) 獨立性獨立性independent) 正態(tài)性正態(tài)性 (normal) 等方差性等方差性equal variance) 3X1Y2Y3YYX2X1X YX= +XiN(+Xi,2)圖圖12-3
20、線性回歸模型的適用條件表示圖線性回歸模型的適用條件表示圖3. 線性回歸分析的前題條件線性回歸分析的前題條件l i n enormal正態(tài)性正態(tài)性equal variance等方差性等方差性反響變量反響變量Y 的的總體平均值總體平均值與自變量與自變量X呈呈線性關(guān)系線性關(guān)系在一定范圍內(nèi)恣在一定范圍內(nèi)恣意給定值,那意給定值,那么對應(yīng)的隨機變么對應(yīng)的隨機變量服從正態(tài)分量服從正態(tài)分布布在一定范圍內(nèi),在一定范圍內(nèi),對應(yīng)于不同對應(yīng)于不同X值,值,Y總體變異程度總體變異程度一樣一樣linear線性線性independent獨立性獨立性指恣意兩指恣意兩個察看值個察看值相互獨立相互獨立四回歸方程有統(tǒng)計學(xué)意義嗎?四
21、回歸方程有統(tǒng)計學(xué)意義嗎? 總體回歸系數(shù)總體回歸系數(shù)的統(tǒng)計推斷:的統(tǒng)計推斷:i樣 本樣 本Ya bx 樣本回歸方程樣本回歸方程就總體而言,這種回歸關(guān)系能否存在?就總體而言,這種回歸關(guān)系能否存在?即總體回歸方程能否成立?即總體回歸方程能否成立?由于樣本回歸系數(shù)由于樣本回歸系數(shù)b與總體回歸系數(shù)與總體回歸系數(shù)存在抽樣存在抽樣誤差,即:普通情況下,誤差,即:普通情況下, b ,因此需求思索,因此需求思索抽樣誤差對統(tǒng)計推斷能否存在艱苦影響?抽樣誤差對統(tǒng)計推斷能否存在艱苦影響?假設(shè)檢驗假設(shè)檢驗回歸模型的假設(shè)檢驗回歸模型的假設(shè)檢驗model test:回歸系數(shù)的假設(shè)檢驗:回歸系數(shù)的假設(shè)檢驗:目的:檢驗求得的回
22、歸方程在總體中能目的:檢驗求得的回歸方程在總體中能否成立;否成立;方法:單要素方差分析。方法:單要素方差分析。目的:即檢驗總體回歸體系數(shù)目的:即檢驗總體回歸體系數(shù)能否能否為為0=0;方法:方法:t 檢驗。檢驗。1. 回歸模型的假設(shè)檢驗回歸模型的假設(shè)檢驗方差分析方差分析 YYYYYY222YYYYYY變異的分解:變異的分解:變異的種類變異的種類 產(chǎn)生原因產(chǎn)生原因解釋解釋SS總總:Y的離均差平方和的離均差平方和 沒有利用沒有利用X的信息的信息時,時,Y 觀察值的變異觀察值的變異 反映因變量反映因變量Y的總變異的總變異SS回歸回歸: (回歸平方和)(回歸平方和) 當自變量當自變量X引入引入 模型后所
23、引起的變模型后所引起的變異異反映在反映在Y的總變異中,的總變異中,可可用用Y與與X的線性關(guān)系解釋的的線性關(guān)系解釋的那部分變異那部分變異。SS回歸回歸越大,越大,說明回歸效果越好。說明回歸效果越好。SS殘差殘差: (殘差平方和)(殘差平方和) 總變異中無法用總變異中無法用X和和Y的回歸關(guān)系解釋的回歸關(guān)系解釋的那部分變異的那部分變異反應(yīng)自變量反應(yīng)自變量X以外因素對以外因素對Y的變異的影響的變異的影響。表示考慮。表示考慮回歸之后,回歸之后,Y的隨機誤差。的隨機誤差。2YY2YY2YY回歸方程假設(shè)檢驗的根本思想:回歸方程假設(shè)檢驗的根本思想:假設(shè)總體中自變量假設(shè)總體中自變量X對因變量對因變量Y沒有奉獻,
24、那么沒有奉獻,那么由樣本所得的回歸均方與殘差均方應(yīng)相近;由樣本所得的回歸均方與殘差均方應(yīng)相近;反之,假設(shè)總體中自變量反之,假設(shè)總體中自變量X對因變量對因變量Y有奉獻,有奉獻,回歸平方和反響的就不僅僅是隨機誤差,即回回歸平方和反響的就不僅僅是隨機誤差,即回歸均方必然要遠大于殘差均方;歸均方必然要遠大于殘差均方;依此,可計算檢驗統(tǒng)計量依此,可計算檢驗統(tǒng)計量F值作出判別。值作出判別。問:所求得的回歸方程在總體中能否成立?問:所求得的回歸方程在總體中能否成立?均方:均方:MS=SS/v回歸均方:回歸均方:MS回歸回歸=SS回歸回歸/v回歸回歸殘差均方:殘差均方: MS殘差殘差=SS殘差殘差/v殘差殘差
25、2nSSSSSSSSMSMSF殘差回歸殘差殘差回歸回歸殘差回歸檢驗統(tǒng)計量:檢驗統(tǒng)計量:查查F界值表界值表P572,確定單側(cè)臨界值,確定單側(cè)臨界值Fa(v回歸回歸, v殘殘差差),求概率值求概率值 P,下結(jié)論,下結(jié)論1. 建立假設(shè),確定檢驗水準建立假設(shè),確定檢驗水準 H0 :總體回歸方程不成立,:總體回歸方程不成立, 即總體中自變量即總體中自變量X對因變量對因變量Y沒有奉沒有奉獻;獻; H1 :總體回歸方程成立,:總體回歸方程成立, 即總體中自變量即總體中自變量X對;因變時對;因變時Y有奉有奉獻。獻。 =0.05 單側(cè)單側(cè) 查查F 界值表界值表P572:a =0.05,v回歸回歸=1、 v殘差殘
26、差=n-2=22得:得:F(k-1, n-k)= F(1,22) =4.303. 確定確定P值,作出推斷結(jié)論:值,作出推斷結(jié)論: 由于由于F=41.3764.30,那么,那么P0.05,故回絕,故回絕H0,接受,接受H1,可以為在,可以為在a =0.05 的顯著程度上,的顯著程度上,NO濃度與車流量濃度與車流量之間的回歸方程具有統(tǒng)計學(xué)意義。之間的回歸方程具有統(tǒng)計學(xué)意義。2. 計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量F值:值:2. 回歸系數(shù)的假設(shè)檢驗回歸系數(shù)的假設(shè)檢驗 t 檢驗檢驗 =0,闡明,闡明Y與與X之間并不存在線性關(guān)系之間并不存在線性關(guān)系 0,闡明,闡明Y與與X之間存在線性關(guān)系之間存在線性關(guān)系由總體
27、回歸方程由總體回歸方程 YX= + YX= + x x 當當=0=0時,時, YX= YX= 即:對于即:對于X X 的任何值,總體均數(shù)的任何值,總體均數(shù) YX YX 沒有任何改沒有任何改動,故建立動,故建立Y Y與的直線回歸方程就沒有任何意義了與的直線回歸方程就沒有任何意義了故故 能否為能否為0,涉及到所建立的回歸方程能否有意義的問,涉及到所建立的回歸方程能否有意義的問題。然而從題。然而從=0的總體抽得樣本,計算出的回歸系數(shù)的總體抽得樣本,計算出的回歸系數(shù)b很很能夠不為零,需求對能夠不為零,需求對 能否等于能否等于0進展假設(shè)檢驗進展假設(shè)檢驗t檢驗檢驗t 檢驗:檢驗:22,2XXnSSXXSS
28、XYb殘差bbSbt02 n檢驗過程:檢驗過程:留意:留意:1.在簡單線性回歸模型中,對回歸模型的方在簡單線性回歸模型中,對回歸模型的方差分析等價于對回歸系數(shù)的差分析等價于對回歸系數(shù)的t 檢驗,即有:檢驗,即有:2.對于服從雙變量正態(tài)分布的同樣一組資料,對于服從雙變量正態(tài)分布的同樣一組資料,同時作相關(guān)分析和回歸分析,那么相關(guān)系數(shù)同時作相關(guān)分析和回歸分析,那么相關(guān)系數(shù)的的 t檢驗與回歸系數(shù)數(shù)的檢驗與回歸系數(shù)數(shù)的t 檢驗等價,即有:檢驗等價,即有:Ft brtt 五總體回歸系數(shù)五總體回歸系數(shù)的區(qū)間估計:的區(qū)間估計:知知b為回歸系數(shù)的樣本估計值,為回歸系數(shù)的樣本估計值,Sb為樣本回歸為樣本回歸系數(shù)的
29、規(guī)范誤,系數(shù)的規(guī)范誤, 那么總那么總體回歸系數(shù)體回歸系數(shù)的雙側(cè)的雙側(cè)1-置信區(qū)間為:置信區(qū)間為:上例題中上例題中b=0.1584,Sb=0.0246,v=22,查查t 界值界值表得:表得:t0.05/2,22=2.074;那么其總體回歸系數(shù);那么其總體回歸系數(shù)的雙的雙側(cè)側(cè)95置信區(qū)間為:置信區(qū)間為:b t/2,v Sb0.1584 2.074 0.0246=(0.1074,0.2095)22,2XXnSSXXSSXYb殘差【電腦實現(xiàn)】【電腦實現(xiàn)】SPSSSPSS線性回歸分析:線性回歸分析: 1. 數(shù)據(jù)錄入數(shù)據(jù)錄入2.線性回歸分析的步驟線性回歸分析的步驟:CoefficientsCoeffici
30、entsa a-.135.035-3.829.001.158.025.8086.432.000(Constant)車流量Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: NOa. A AN NO OV VA Ab b.0531.05341.376.000a.02822.001.08123RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 車
31、流量a. Dependent Variable: NOb. 3. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: 六回歸方程的解釋:六回歸方程的解釋: 車流量對車流量對NO濃度的影響有多大?濃度的影響有多大?決議系數(shù):回歸平方和與總平方和之比。決議系數(shù):回歸平方和與總平方和之比。 0R21反映了自變量反映了自變量X對回歸效果的奉獻,即對回歸效果的奉獻,即Y的總的總變異中回歸關(guān)系所能解釋的百分比變異中回歸關(guān)系所能解釋的百分比variance account formula,VAF;反映了回歸模型的擬合效果,可作為反響擬反映了回歸模型的擬合效果,可作為反響擬合優(yōu)度合優(yōu)度goodness of fit的目的。的目
32、的。2R1SSSSSSSS 回歸殘差總總上例題:上例題:SS總總=0.0812, SS回歸回歸=0.0530 R2= SS回歸回歸/ SS總總=0.0530/0.0812=0.6527=65.27% 解釋:解釋: 闡明空氣中闡明空氣中NO濃度總變異的濃度總變異的65.27%與車流量與車流量有關(guān)。有關(guān)。七回歸方程的統(tǒng)計運用:七回歸方程的統(tǒng)計運用:u定量描畫兩變量之間的依存關(guān)系。定量描畫兩變量之間的依存關(guān)系。u利用回歸方程進展統(tǒng)計預(yù)測。利用回歸方程進展統(tǒng)計預(yù)測。u利用回歸方程進展統(tǒng)計控制。利用回歸方程進展統(tǒng)計控制。1. 統(tǒng)計預(yù)測:將統(tǒng)計預(yù)測:將X值作預(yù)告因子,固定總體值作預(yù)告因子,固定總體中中X為
33、某定值為某定值Xi時,時, 估計個體估計個體Y值的允許區(qū)值的允許區(qū)間,即間,即Y值的動搖范圍。值的動搖范圍。YnStY2, 2/2211XXXXnSSiY,Y例:當車流量為例:當車流量為1300輛,求空氣中一氧化氮輛,求空氣中一氧化氮95%的允許區(qū)間。的允許區(qū)間。答:答:XY1584. 01353. 0知回歸方程知回歸方程0707. 03 . 11584. 01353. 0YX=1.300時時:故空氣中故空氣中NO的的98%允許區(qū)間為允許區(qū)間為:62101467. 00000. 01124. 24035. 13 . 124110358. 0074. 20707. 02. 均數(shù)置信區(qū)間:當均數(shù)置
34、信區(qū)間:當X值為某定值,并給定置信度值為某定值,并給定置信度1- ,調(diào)查,調(diào)查Y的總體均數(shù)的分布時,可估計的總體均數(shù)的分布時,可估計Y的總的總體均數(shù)體均數(shù) Y X的的1-置信區(qū)間。置信區(qū)間。YnStY2, 2/221XXXXnSSiY,Y例:當車流量為例:當車流量為1300輛,求空氣中一氧化氮輛,求空氣中一氧化氮95%的置信區(qū)間。的置信區(qū)間。答:答:XY1584. 01353. 0知回歸方程知回歸方程0707. 03 . 11584. 01353. 0YX=1.300時時:故空氣中故空氣中NO的的95%置信區(qū)間為置信區(qū)間為:621008675. 005465. 01124. 24035. 13
35、 . 12410358. 0074. 20707. 0均數(shù)的置信區(qū)間和個體允許區(qū)間的不同:均數(shù)的置信區(qū)間和個體允許區(qū)間的不同:2. 統(tǒng)計控制:統(tǒng)計控制:例:例: 該城市為降低空氣中該城市為降低空氣中NO的含量,擬對的含量,擬對車流量進展適當?shù)目刂疲鶕?jù)空氣污染指車流量進展適當?shù)目刂?,根?jù)空氣污染指數(shù)分級,要求空氣中氮氧化合物含量不超數(shù)分級,要求空氣中氮氧化合物含量不超越越0.1000.15010-6 。XY1584. 01353. 0知回歸方程知回歸方程答:答:千輛時當千輛時當801. 11584. 0/135. 0150. 010150. 0485. 11584. 0/135. 0100.
36、010100. 0162161,XY,XY故該城市單位時間內(nèi)車流量應(yīng)控制在故該城市單位時間內(nèi)車流量應(yīng)控制在1500輛以內(nèi),輛以內(nèi),最多不超越最多不超越1800輛,否那么會導(dǎo)致輕度污染的發(fā)生。輛,否那么會導(dǎo)致輕度污染的發(fā)生。簡單線性回歸分析的本卷須知:簡單線性回歸分析的本卷須知: 1. 要留意實踐意義;要留意實踐意義;2. 繪制散點圖察看兩變量的關(guān)系以及找繪制散點圖察看兩變量的關(guān)系以及找出異常點;出異常點;3. 留意自變量和因變量的變化范圍。留意自變量和因變量的變化范圍。小小 結(jié)結(jié)簡單線性回歸是指只包含一個自變量,且呈線性變化趨勢的回歸模型,用于描畫因變量的總體均數(shù)與自變量之間的線性關(guān)系,即兩變
37、量間的依存變化關(guān)系。簡單線性回歸的根本步驟: 繪制散點圖, 在最小二乘法原那么下建立線性回歸方程,即估計回歸系數(shù)與截距; 對回歸方程或回歸系數(shù)進展假設(shè)檢驗; 列出回歸方程,繪制回歸直線; 統(tǒng)計解釋及運用。線性回歸模型的適用條件為:線性、獨立、正態(tài)和等方差,簡稱LINE。決議系數(shù)反映了回歸平方和在總平方和中所占的比例,常用來反映回歸的實踐效果。線性回歸常用于統(tǒng)計預(yù)測和統(tǒng)計控制。當兩變量變化趨勢為非線性時,可思索擬合非線性回歸議程,常用的曲線類型包括指數(shù)曲線,多項式曲線、雙典線和logistic曲線等。留意線性相關(guān)與線性回歸的區(qū)別與聯(lián)絡(luò)。相關(guān)分析是用來描畫兩變量的相關(guān)關(guān)系,當兩變相關(guān)分析是用來描畫
38、兩變量的相關(guān)關(guān)系,當兩變量滿足雙變量正態(tài)分布時,可以計算量滿足雙變量正態(tài)分布時,可以計算Pearson積差相積差相關(guān)系數(shù),假設(shè)有任何一個變量不滿足正態(tài)分布或為等關(guān)系數(shù),假設(shè)有任何一個變量不滿足正態(tài)分布或為等級資料,需計算級資料,需計算Spearman秩相關(guān)系數(shù)。秩相關(guān)系數(shù)?;貧w分析是用來描寫兩變量的依存關(guān)系,它要求回歸分析是用來描寫兩變量的依存關(guān)系,它要求資料滿足資料滿足LINE線性、獨立、正態(tài)和等方差,二線性、獨立、正態(tài)和等方差,二者之間既有聯(lián)絡(luò)又有區(qū)別。者之間既有聯(lián)絡(luò)又有區(qū)別。 案 例 討 論案 例 討 論案例10-1:年齡與身高預(yù)測研討。 某地調(diào)查了418歲男孩與女孩身高,數(shù)據(jù)見下表,試
39、描畫男孩與女孩身高與年齡間的關(guān)系,并預(yù)測10.5歲、16.5歲、19歲與20歲男孩與女孩的身高。表10-5 男孩身高對年齡的簡單線性回歸分析結(jié)果%5 .98990.98,2RF估計值估計值標準誤標準誤tPconstant83.73631.882444.48390.0000age5.27480.167631.47980.0000采用SPSS對身高與年齡進展回歸分析,結(jié)果如下表所示。估計值估計值標準誤標準誤tPconstant88.43263.280026.96110.0000age4.53400.292015.52900.0000表表12-6 女孩身高對年齡的簡單線性回歸分析結(jié)果女孩身高對年齡的簡單線性回歸分析結(jié)果%1 .94,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度不動產(chǎn)登記信息共享與安全保障合同3篇
- 2025年度新型住宅水電費分時計費合同4篇
- 2025年度生態(tài)廁所建設(shè)與資源化利用合同4篇
- 2024版貨車租賃吊車合同3篇
- 2025年度生物制藥研發(fā)成果轉(zhuǎn)化保密合同4篇
- 2025年度智能節(jié)能窗戶系統(tǒng)研發(fā)、安裝與運營合同3篇
- 2025年度LED廣告車租賃及智能控制系統(tǒng)集成服務(wù)合同3篇
- 2025賓館一次性餐飲用品采購及庫存管理合同3篇
- 2024版貨物出口運輸服務(wù)協(xié)議書
- 2025年度山地旅游項目土石方運輸與景觀開發(fā)合同匯編3篇
- 綿陽市高中2022級(2025屆)高三第二次診斷性考試(二診)歷史試卷(含答案)
- 廠級安全培訓(xùn)資料
- 中國藥科大學(xué)《藥物化學(xué)》教學(xué)日歷
- 露天礦山課件
- 經(jīng)濟效益證明(模板)
- 銀行卡凍結(jié)怎么寫申請書
- 果樹蔬菜病害:第一章 蔬菜害蟲
- 借條借款合同帶擔保人
- 人工地震動生成程序
- SSB變槳系統(tǒng)的基礎(chǔ)知識
- 大五人格量表(revised)--計分及解釋
評論
0/150
提交評論