回歸分析應(yīng)用_第1頁
回歸分析應(yīng)用_第2頁
回歸分析應(yīng)用_第3頁
回歸分析應(yīng)用_第4頁
回歸分析應(yīng)用_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

定義(dìngyì):現(xiàn)實世界中大多數(shù)現(xiàn)象表現(xiàn)相關(guān)關(guān)系,人們通過的大量觀察,將現(xiàn)象之間的相關(guān)關(guān)系抽象概括為函數(shù)關(guān)系,并用函數(shù)形式或模型來描述與推斷現(xiàn)象間的具體變動關(guān)系,用一或一組變量(biànliàng)的變化來估計與推算另一變量(biànliàng)的變化。這種分析方法成為回歸分析。精品資料依據(jù)要素(yàosù)分類

一元線性回歸分析一元回歸分析冪函數(shù)一元非線性回歸分析指數(shù)函數(shù)多元(duōyuán)線性回歸分析對數(shù)函數(shù)多元(duōyuán)回歸分析冪函數(shù)多元(duōyuán)非線性回歸分析指數(shù)函數(shù)對數(shù)函數(shù)

精品資料回歸分析的主要(zhǔyào)內(nèi)容:①從一組數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計其中的未知參數(shù)。估計參數(shù)的常用方法是最小二乘法。②對這些關(guān)系式的可信程度進(jìn)行檢驗。③在許多自變量共同影響著一個因變量的關(guān)系中,判斷(pànduàn)哪個(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關(guān)系式對某一生產(chǎn)過程進(jìn)行預(yù)測或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計軟件包使各種回歸方法計算十分方便。精品資料線性回歸(huíguī)的局限性:不應(yīng)該使用(shǐyòng)這種方法來預(yù)測和建立模型時所使用(shǐyòng)的數(shù)據(jù)值相關(guān)差甚遠(yuǎn)的值。避免模型中自變量之間有較高的相關(guān)性。對噪聲數(shù)據(jù)敏感。一般假設(shè)誤差變量(

errorvariances或residuals)服從均值為0的正態(tài)分布。精品資料回歸(huíguī)分析在地理學(xué)中的意義和作用:

主要研究地理系統(tǒng)各要素之間相互關(guān)系(guānxì),尋找出隱藏在隨機性后面的統(tǒng)計規(guī)律。

有預(yù)測地理中要素的變化趨勢。

精品資料回歸分析(fēnxī)的一般步驟精品資料涉及一個自變量的回歸;因變量y與自變量x之間為線性關(guān)系(guānxì);因變量(dependentvariable):被預(yù)測或被解釋的變量,用y表示。自變量(independentvariable):預(yù)測或解釋因變量的一個或多個變量,用x表示。因變量與自變量之間的關(guān)系(guānxì)用一條線性方程來表示;精品資料實例(shílì):氣溫是否會顯著影響地溫;降雨量是否會影響到糧食產(chǎn)量;航班(hánɡbān)正點率是否對顧客投訴次數(shù)有顯著影響;廣告費用支出是否對銷售額有顯著影響;北極熊數(shù)量是否會影響企鵝的出生率(不會,反例);植物生長是否受土壤、降水、陽光等因素影響。精品資料描述因變量y如何依賴于自變量x和誤差項的方程稱為回歸模型一元線性回歸模型:y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化引起(yǐnqǐ)的y的變化誤差項是隨機變量反映了除x和y之間線性關(guān)系之外的隨機因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)一元(yīyuán)線性回歸精品資料描述因變量y如何依賴于自變量x和誤差項的方程稱為回歸模型一元線性回歸模型:y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化引起的y的變化誤差項是隨機變量反映了除x和y之間線性關(guān)系之外的隨機因素對y的影響(yǐngxiǎng)是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)精品資料描述y的平均值或期望值如何依賴于x的方程稱為回歸方程;一元線性回歸方程的形式如下:E(y)=0+1x方程表示一條直線,也稱為直線回歸方程;0是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值;1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(biàndòng)一個單位時,y的平均變動(biàndòng)值精品資料估計(gūjì)的回歸方程總體回歸參數(shù)和是未知的,必須利用樣本數(shù)據(jù)去估計;用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程;一元線性回歸中估計的回歸方程為:其中:是估計的回歸直線在y軸上的截距,是直線的斜率(xiélǜ),它表示對于一個給定的x的值,是y的估計值,也表示x每變動一個單位時,y的平均變動值。精品資料最小二乘法(chéngfǎ)估計使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得和的方法(fāngfǎ)。即

用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實際數(shù)據(jù)的誤差比其他任何直線都小精品資料最小二乘估計(gūjì)(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^精品資料最小二乘法(chéngfǎ)根據(jù)最小二乘法的要求,可得求解和的公式(gōngshì)如下精品資料一元回歸方程統(tǒng)計(tǒngjì)檢驗的主要內(nèi)容精品資料變差因變量y取值的波動稱為變差變差來源于兩個方面:由于自變量x的取值不同造成;除x以外的其他因素(如測量誤差等)的影響;對一個(yīɡè)具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示。精品資料變差的分解(fēnjiě)(圖示)xyy{}}精品資料離差平方和的分(三個平方和的意義(yìyì))總平方和(SST)用S表示反映因變量的n個觀察值與其均值的總離差;回歸平方和(SSR)用U表示反映自變量x的變化對因變量y取值變化的影響,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和;殘差平方和(SSE)用Q表示反映除x以外的其他(qítā)因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和;精品資料離差平方和的分解(fēnjiě)

(三個平方和的關(guān)系)SST=SSR+SSE或S=U+Q總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{精品資料判定(pàndìng)系數(shù)R2(coefficientofdetermination)回歸(huíguī)平方和占總離差平方和的比例反映回歸方程的擬合程度;取值范圍在[0,1]之間;

R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差;一元線性回歸中,判定系數(shù)等于y和x相關(guān)系數(shù)的平方,即R2=(r)2;精品資料線性關(guān)系的檢驗(jiǎnyàn)檢驗所有自變量與因變量之間的線性關(guān)系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以(jiāyǐ)比較,應(yīng)用F檢驗來分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應(yīng)的自由度(自變量的個數(shù)K);均方殘差:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)。精品資料線性關(guān)系的檢驗(jiǎnyàn)(檢驗(jiǎnyàn)的步驟)提出假設(shè)H0:1=0所有回歸系數(shù)與零無顯著差異(chāyì),y與全體x的線性關(guān)系不顯著計算檢驗統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若F>F,拒絕H0;若F<F,不能拒絕H0精品資料線性關(guān)系的檢驗(jiǎnyàn)(sig值檢驗(jiǎnyàn))Sig值小于顯著性水平a,拒絕零假設(shè)認(rèn)為所有回歸系數(shù)與零存在顯著差異,被解釋變量y與解釋變量x的線性關(guān)系顯著,可以(kěyǐ)用線性模型描述它們之間的關(guān)系;Sig值大于顯著性水平a,不應(yīng)拒絕零假設(shè)說明用線性模型描述x和y之間的關(guān)系是不恰當(dāng)?shù)摹>焚Y料檢驗回歸方程中的每個解釋變量(biànliàng)x與被解釋變量(biànliàng)y之間是否存在顯著的線性關(guān)系;確定解釋變量(biànliàng)能否保留在線性回歸方程中?;貧w系數(shù)的顯著性檢驗(jiǎnyàn)精品資料回歸系數(shù)的檢驗(jiǎnyàn)(樣本統(tǒng)計量的分布)是根據(jù)最小二乘法求出的樣本統(tǒng)計量,服從正態(tài)分布;的分布具有(jùyǒu)如下性質(zhì)數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計量se來代替得到的估計標(biāo)準(zhǔn)差精品資料回歸系數(shù)的檢驗(jiǎnyàn)(檢驗(jiǎnyàn)步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b10(有線性關(guān)系)計算檢驗(jiǎnyàn)的統(tǒng)計量

確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不能拒絕H0Sig值小于a,拒絕H0精品資料利用回歸方程進(jìn)行(jìnxíng)估計和預(yù)測根據(jù)自變量x的取值估計或預(yù)測因變量y的取值估計或預(yù)測的類型點估計y的平均值的點估計y的個別(gèbié)值的點估計區(qū)間估計y的平均值的置信區(qū)間估計y的個別(gèbié)值的預(yù)測區(qū)間估計精品資料線性關(guān)系的檢驗(jiǎnyàn)檢驗(jiǎnyàn)所有自變量與因變量之間的線性關(guān)系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以比較,應(yīng)用F檢驗(jiǎnyàn)來分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應(yīng)的自由度(自變量的個數(shù)K);均方殘差:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)。精品資料線性關(guān)系的檢驗(jiǎnyàn)(檢驗(jiǎnyàn)的步驟)提出假設(shè)H0:1=0所有(suǒyǒu)回歸系數(shù)與零無顯著差異,y與全體x的線性關(guān)系不顯著計算檢驗統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若F>F,拒絕H0;若F<F,不能拒絕H0精品資料線性關(guān)系的檢驗(jiǎnyàn)(sig值檢驗(jiǎnyàn))Sig值小于顯著性水平a,拒絕零假設(shè)認(rèn)為所有回歸系數(shù)與零存在顯著差異,被解釋變量y與解釋變量x的線性關(guān)系顯著,可以用線性模型描述(miáoshù)它們之間的關(guān)系;Sig值大于顯著性水平a,不應(yīng)拒絕零假設(shè)說明用線性模型描述(miáoshù)x和y之間的關(guān)系是不恰當(dāng)?shù)?。精品資料實例(shílì):精品資料精品資料(1)點擊(diǎnjī)statistics在回歸系數(shù)下拉框中估計,殘差下拉框中選中Durbin-Waston

(2)點擊(diǎnjī)在繪圖在左選框中選中DEPENDNT,標(biāo)準(zhǔn)化殘差圖選中正態(tài)概率圖

(3)點擊(diǎnjī)選項中默認(rèn)設(shè)置精品資料殘差統(tǒng)計(tǒngjì)量方差分析模型(móxíng)匯總回歸分析圖精品資料在【模型匯總】中,主要顯示回歸模型中的相關(guān)系數(shù)、相關(guān)系數(shù)的平方、調(diào)整后的相關(guān)系數(shù)和估計(gūjì)的標(biāo)準(zhǔn)誤值在【方差分析】中主要顯示F檢驗值、顯著性檢驗P值、平方和、自由度在【殘差統(tǒng)計量】主要顯示預(yù)測值、殘差、標(biāo)準(zhǔn)預(yù)測值和標(biāo)準(zhǔn)殘差精品資料Multivariatelinearregression概念(gàiniàn):多元線性回歸分析也稱復(fù)線性回歸分析(multiplelinearregressionanalysis),它研究一組自變量如何直接影響(yǐngxiǎng)一個因變量。自變量(independentvariable)是指獨立自由變量的變量,用向量X表示;因變量(dependentvariable)是指非獨立的、受其它變量影響(yǐngxiǎng)的變量,用向量Y表示;由于模型僅涉及一個因變量,所以多元線性回歸分析也稱單變量線性回歸分析(univariatelinearregressionanalysis)精品資料多元回歸分析(fēnxī)數(shù)據(jù)格式精品資料多元線性回歸必須滿足的假定(jiǎdìng)條件因變量是服從正態(tài)分布的連續(xù)型隨機(suíjī)變量;k個自變量是固定變量,即非隨機(suíjī)或無度量誤差的變量;k個自變量間不存在多重共線性;k個自變量與殘差獨立;殘差是隨機(suíjī)變量,均值為零,方差為常數(shù);各殘差間相互獨立;殘差服從正態(tài)分布。精品資料因變量是服從正態(tài)分布的連續(xù)型隨機(suíjī)變量;k個自變量是固定變量,即非隨機(suíjī)或無度量誤差的變量;k個自變量間不存在多重共線性;k個自變量與殘差獨立;殘差是隨機(suíjī)變量,均值為零,方差為常數(shù);各殘差間相互獨立;殘差服從正態(tài)分布。統(tǒng)計檢驗(jiǎnyàn)結(jié)果偏倚結(jié)果失真結(jié)論的非唯一性模型中缺乏重要變量參數(shù)估計偏倚結(jié)果誤導(dǎo)精品資料假定因變量Y與自變量間存在如下關(guān)系:式中,是常數(shù)項,稱為偏回歸系數(shù)(partialregressioncoefficient)。的含義為在其它自變量保持不變的條件下,自變量改變一個單位時因變量Y的平均改變量。為隨機誤差,又稱殘差(residual),它表示的變化中不能由自變量解釋的部分。一、多元(duōyuán)線性回歸方程模型精品資料x1x2y精品資料應(yīng)用(yìngyòng)條件:注意:雖然模型要求因變量是連續(xù)數(shù)值變量,但對自變量的類型不限。若自變量是分類變量,特別是無序分類變量,要轉(zhuǎn)化為亞變量才能分析。對于(duìyú)自變量是分類變量的情形,需要用廣義線性回歸模型分析。精品資料二、多元線性回歸分析(fēnxī)的步驟(一)估計各項參數(shù),建立多元線性回歸方程模型(二)對整個模型進(jìn)行假設(shè)檢驗,模型有意義的前提下,再分別(fēnbié)對各偏回歸系數(shù)進(jìn)行假設(shè)檢驗。(三)計算相應(yīng)指標(biāo),對模型的擬合效果進(jìn)行評價。精品資料(一)模型(móxíng)的參數(shù)估計精品資料27名糖尿病患者的血清總膽固醇(x1)、甘油三酯(x2)、空腹(kōngfù)胰島素(x3)、糖化血紅蛋白(x4)、空腹(kōngfù)血糖(y)的測量值列于表中,試建立血糖與其它幾項指標(biāo)關(guān)系的多元線性回歸方程。例精品資料各變量的離差矩陣精品資料線性回歸方程模型為:精品資料1、對模型的假設(shè)檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)2、對偏回歸系數(shù)的假設(shè)檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)和t檢驗(jiǎnyàn)3、標(biāo)準(zhǔn)偏化回歸系數(shù)(二)對模型及偏回歸系數(shù)的假設(shè)檢驗精品資料1、對模型的假設(shè)檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)精品資料SS回歸=b1l1y+b2l2y

+b3l3y+b4l4y=0.1424×67.6962+0.3515×89.8025+0.2706×142.4347+0.6382×84.5570=133.7107;ν回歸=m=4各變量的離差矩陣精品資料SS總=lyy=222.5519;ν總=n-1=26SS剩余(shèngyú)=SS總-SS回歸=222.5519-133.7107=88.8412ν剩余(shèngyú)=n-m-1=22MS回歸=SS回歸/ν回歸;MS剩余(shèngyú)=SS剩余(shèngyú)/ν剩余(shèngyú);F=MS回歸/MS剩余(shèngyú)1、對模型的假設(shè)檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)精品資料1、對模型的假設(shè)檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)精品資料2、對偏回歸系數(shù)的假設(shè)檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)和t檢驗(jiǎnyàn)回歸方程成立(chénglì)只能認(rèn)為總的來說自變量與因變量間存在線性關(guān)系,但是否每一個自變量都與因變量間存在線性關(guān)系,須對其偏回歸系數(shù)進(jìn)行假設(shè)檢驗。①方差分析法②t

檢驗法精品資料①偏回歸系數(shù)的假設(shè)檢驗--方差分析法精品資料①偏回歸系數(shù)的假設(shè)檢驗--方差分析法精品資料ParameterSta

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論