第十一十二講相關(guān)與回歸分析_第1頁
第十一十二講相關(guān)與回歸分析_第2頁
第十一十二講相關(guān)與回歸分析_第3頁
第十一十二講相關(guān)與回歸分析_第4頁
第十一十二講相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第十一、十二講 相關(guān)與回歸分析_課程名稱:應(yīng)用統(tǒng)計(jì)學(xué)本講題目:相關(guān)與回歸分析時(shí)間:4學(xué)時(shí)教學(xué)目標(biāo):1、掌握相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別2、能夠利用相關(guān)系數(shù)對(duì)相關(guān)關(guān)系進(jìn)行測定,并且掌握相關(guān)系數(shù)的性質(zhì)3、明確相關(guān)分析與回歸分析各自特點(diǎn)以及它們的區(qū)別與聯(lián)系4、建立回歸直線方程,計(jì)算估計(jì)標(biāo)準(zhǔn)誤差,理解估計(jì)標(biāo)準(zhǔn)誤差的意義任務(wù): 相關(guān)分析是較常用的統(tǒng)計(jì)分析方法。本章的目的在于提供從數(shù)量上研究現(xiàn)象之間相互聯(lián)系方法。該章主要講述相關(guān)分析、回歸分析的基本理論和應(yīng)用方法。重點(diǎn)掌握:1、相關(guān)分析的方法。2、回歸分析的分析方法應(yīng)用。閱讀資料: 學(xué)生閱讀資料:本章題庫1、楊盛菁 “養(yǎng)兒像舅舅”的統(tǒng)計(jì)學(xué)解析 統(tǒng)計(jì)研究 201

2、2年3期2、陳鵬 基于綜合應(yīng)急模型的道路突發(fā)事件應(yīng)急預(yù)案的改進(jìn) 統(tǒng)計(jì)與決策 2012年4期3、張琳芝 高、低分組學(xué)習(xí)風(fēng)格和教學(xué)偏好典型相關(guān)分析探討 中北大學(xué)學(xué)報(bào) 2012年1期教師閱讀資料:1、楊盛菁 “養(yǎng)兒像舅舅”的統(tǒng)計(jì)學(xué)解析 統(tǒng)計(jì)研究 2012年3期2、陳鵬 基于綜合應(yīng)急模型的道路突發(fā)事件應(yīng)急預(yù)案的改進(jìn) 統(tǒng)計(jì)與決策 2012年4期3、張琳芝 高、低分組學(xué)習(xí)風(fēng)格和教學(xué)偏好典型相關(guān)分析探討 中北大學(xué)學(xué)報(bào) 2012年1期4、胡鐘平 鄉(xiāng)風(fēng)文明·村容整潔·管理民主實(shí)施效應(yīng)差異性研究 安徽農(nóng)業(yè)科學(xué) 2012年11期5、郭春東 國家重大工程項(xiàng)目資源配置行為分析 科研管理 2012年4

3、期6、董姝娜 基于“3S”技術(shù)的村鎮(zhèn)住宅洪災(zāi)脆弱性曲線研究 災(zāi)害學(xué) 2012年2期總的要求: 掌握相關(guān)分析與回歸分析的思想及方法。教學(xué)目標(biāo)1 相關(guān)分析一、相關(guān)分析的概念、種類(一)相關(guān)分析的概念現(xiàn)實(shí)世界中的各種現(xiàn)象之間相互聯(lián)系、相互制約、相互依存,某些現(xiàn)象發(fā)生變化時(shí),另一現(xiàn)象也隨之發(fā)生變化。研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對(duì)經(jīng)搜集、整理過的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,為客觀、科學(xué)地統(tǒng)計(jì)提供依據(jù)。現(xiàn)象間的依存關(guān)系大致可以分成兩種類型: 一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系。(二)相關(guān)關(guān)系類型現(xiàn)象之間的相關(guān)關(guān)系從不同的角度可以區(qū)分為不同類型。1 按照相關(guān)關(guān)系涉及變量(或因素)的多少分為

4、單相關(guān)又稱一元相關(guān),是指兩個(gè)變量之間的相關(guān)關(guān)系,如廣告費(fèi)支出與產(chǎn)品銷售量之間的相關(guān)關(guān)系;復(fù)相關(guān)又稱多元相關(guān),是指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系,如商品銷售額與居民收入、商品價(jià)格之間的相關(guān)關(guān)系。偏相關(guān)在一個(gè)變量與兩個(gè)或兩個(gè)以上的變量相關(guān)的條件下,當(dāng)假定其他變量不變時(shí),其中兩個(gè)變量的相關(guān)關(guān)系稱為。例如,在假定商品價(jià)格不變的條件下,該商品的需求量與消費(fèi)者收入水平的相關(guān)關(guān)系即為偏相關(guān)。2 按照相關(guān)形式不同分為線性相關(guān)又稱直線相關(guān),是指當(dāng)一個(gè)變量變動(dòng)時(shí),另一變量隨之發(fā)生大致均等的變動(dòng),從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條直線;例如,人均消費(fèi)水平與人均收入水平通常呈線性關(guān)系。非線性相關(guān)一個(gè)變量變動(dòng)

5、時(shí),另一變量也隨之發(fā)生變動(dòng),但這種變動(dòng)不是均等的,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱曲線相關(guān)。例如,工人加班加點(diǎn)在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。3 按照相關(guān)現(xiàn)象變化的方向不同分為正相關(guān)當(dāng)一個(gè)變量的值增加或減少,另一個(gè)變量的值也隨之增加或減少。如工人勞動(dòng)生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費(fèi)水平隨個(gè)人所支配收入的增加而增加。負(fù)相關(guān)當(dāng)一個(gè)變量的值增加或減少時(shí),另一變量的值反而減少或增加。如商品流轉(zhuǎn)額越大,商品流通費(fèi)用越低;利潤隨單位成本的降低而增加。4按相關(guān)程度分為完全相關(guān)當(dāng)一個(gè)變量的數(shù)量完全由

6、另一個(gè)變量的數(shù)量變化所確定時(shí),二者之間即為完全相關(guān)。例如,在價(jià)格不變的條件下,銷售額與銷售量之間的正比例函數(shù)關(guān)系即為完全相關(guān),此時(shí)相關(guān)關(guān)系便成為函數(shù)關(guān)系,因此也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個(gè)特例。不完全相關(guān)又稱零相關(guān),當(dāng)變量之間彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),則變量之間為不相關(guān)。例如,股票價(jià)格的高低與氣溫的高低一般情況下是不相關(guān)的。不相關(guān)如果兩個(gè)變量的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。由于完全相關(guān)和不相關(guān)的數(shù)量關(guān)系是確定的或相互獨(dú)立的,因此統(tǒng)計(jì)學(xué)中相關(guān)分析的主要研究對(duì)象是不完全相關(guān)。二、相關(guān)關(guān)系的測定要判別現(xiàn)象之間有無相關(guān)關(guān)系,一是定性分析,二是定量分析。(一)定性分析定性分析

7、是依據(jù)研究者的理論知識(shí)、專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及有何種相關(guān)關(guān)系做出判斷。并可在定性認(rèn)識(shí)的基礎(chǔ)上,編制相關(guān)表、繪制相關(guān)圖,以便直觀地判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及大致的密切程度。1相關(guān)表相關(guān)表是一種統(tǒng)計(jì)表。它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值按從小到大的順序排列,并將另一變量的值與之對(duì)應(yīng)排列形成的統(tǒng)計(jì)表。2相關(guān)圖相關(guān)圖又稱散點(diǎn)圖,它是用直角坐標(biāo)系的x軸代表自變量,y軸代表因變量,將兩個(gè)變量間相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來,用以表明相關(guān)點(diǎn)分布狀況的圖形。(二)定量分析相關(guān)系數(shù)相關(guān)系數(shù)用r表示,它的基本公式為: 相關(guān)系數(shù)的值介于1與+1之間,即1

8、r+1。其性質(zhì)如下:1當(dāng)r>0時(shí),表示兩變量正相關(guān),r<0時(shí),兩變量為負(fù)相關(guān)。2當(dāng)|r|=1時(shí),表示兩變量為完全線性相關(guān),即為函數(shù)關(guān)系。3當(dāng)r=0時(shí),表示兩變量間無線性相關(guān)關(guān)系。4當(dāng)0<|r|<1時(shí),表示兩變量存在一定程度的線性相關(guān)。且|r|越接近1,兩變量間線性關(guān)系越密切;|r|越接近于0,表示兩變量的線性相關(guān)越弱。5一般可按三級(jí)劃分:|r|<0.4為低度線性相關(guān);0.4|r|<0.7為顯著性相關(guān);0.7|r|<1為高度線性相關(guān)。本書附表中有相關(guān)系數(shù)檢驗(yàn)表,表中是相關(guān)系數(shù)絕對(duì)值的臨界值。當(dāng)計(jì)算出的變量x與y的相關(guān)系數(shù)絕對(duì)值大于表中臨界值時(shí),才可以判定

9、x與y有線性關(guān)系。通常,當(dāng)|r|大于表中=5%相應(yīng)的值,但小于表中=1%相應(yīng)的值時(shí),稱x與y有顯著的線性關(guān)系;當(dāng)|r|大于表中=1%相應(yīng)的值時(shí),稱x與y有高度的線性關(guān)系;如果|r|小于表中=5%相應(yīng)的值時(shí),就判定x與y沒有明顯的線性關(guān)系。這種檢驗(yàn)方法通常稱臨界值法,即比較|r|與r(,n2)的關(guān)系。三、相關(guān)分析中應(yīng)注意的問題(一)相關(guān)系數(shù)不能解釋兩變量間的因果關(guān)系(二)警惕虛假相關(guān)導(dǎo)致的錯(cuò)誤結(jié)論。教學(xué)目標(biāo)2 一元線性回歸分析一、什么是回歸分析 回歸分析通過一個(gè)變量或一些變量的變化解釋另一變量的變化。其主要內(nèi)容和步驟是,首先根據(jù)理論和對(duì)問題的分析判斷,將變量分為自變量和因變量;其次,設(shè)法找出合適

10、的數(shù)學(xué)方程式(即回歸模型)描述變量間的關(guān)系;由于涉及到的變量具有不確定性,接著還要對(duì)回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn);統(tǒng)計(jì)檢驗(yàn)通過后,最后是利用回歸模型,根據(jù)自變量去估計(jì)、預(yù)測因變量。二、相關(guān)與回歸分析的關(guān)系相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒有對(duì)變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進(jìn)行回歸分析,很容易造成“虛假回歸”。與此同時(shí),相關(guān)分析只研究變量之間相關(guān)的方向

11、和程度,不能推斷變量之間相互關(guān)系的具體形式,也無法從一個(gè)變量的變化來推測另一個(gè)變量的變化情況,因此,在具體應(yīng)用過程中,只有把相關(guān)分析和回歸分析結(jié)合起來,才能達(dá)到研究和分析的目的。 二者的區(qū)別主要體現(xiàn)在以下三個(gè)方面: 1在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關(guān)系是對(duì)等的;而在回歸分析中,則必須根據(jù)研究對(duì)象的性質(zhì)和研究分析的目的,對(duì)變量進(jìn)行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對(duì)等的。 2在相關(guān)分析中所有的變量都必須是隨機(jī)變量;而在回歸分析中,自變量是給定的,因變量才是隨機(jī)的,即將自變量的給定值代入回歸方程后,所得到的因變量的估計(jì)值不是惟一確定的,而

12、會(huì)表現(xiàn)出一定的隨機(jī)波動(dòng)性。 3相關(guān)分析主要是通過一個(gè)指標(biāo)即相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,由于變量之間是對(duì)等的,因此相關(guān)系數(shù)是惟一確定的。而在回歸分析中,對(duì)于互為因果的兩個(gè)變量 (如人的身高與體重,商品的價(jià)格與需求量),則有可能存在多個(gè)回歸方程。需要指出的是,變量之間是否存在“真實(shí)相關(guān)”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關(guān)分析和回歸分析只是定量分析的手段,通過相關(guān)分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準(zhǔn)確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關(guān)系。因此,在具體應(yīng)用過程中,一定要始終注意把定性分析和定量分析結(jié)合起來,在準(zhǔn)確的定性分析

13、的基礎(chǔ)上展開定量分析。三、一元線性回歸(Simple Linear Regression)模型對(duì)于具有線性相關(guān)關(guān)系的兩個(gè)變量,由于有隨機(jī)因素的干擾,兩變量的線性關(guān)系中應(yīng)包括隨機(jī)誤差項(xiàng),即有:對(duì)于x某一確定的值,其對(duì)應(yīng)的y值雖有波動(dòng),但隨機(jī)誤差的期望值為零,即E () = 0,因而從平均意義上說(記E (y)為y),總體線性回歸方程為: 我們可通過樣本觀察值計(jì)算a、b,用它對(duì)(62)式中的參數(shù)、作出估計(jì),即求樣本回歸方程,用它對(duì)總體線性回歸方程進(jìn)行估計(jì)。樣本回歸直線方程又稱一元線性回歸方程,其表達(dá)形式為: 式中:表示因變量的估計(jì)值(回歸理論值);a,b是待定參數(shù),其中a是回歸直線的起始值(截距)

14、,即x為0時(shí)的值,從數(shù)學(xué)意義上理解,它表示在沒有自變量x的影響時(shí),其它各種因素對(duì)因變量y的平均影響;b是回歸系數(shù)(直線的斜率),表示自變量x每變動(dòng)一個(gè)單位時(shí),因變量y平均變動(dòng)b個(gè)單位。一元線性回歸方程中的待定參數(shù)是根據(jù)數(shù)據(jù)資料求出的。其計(jì)算公式為:(由于本書旨在介紹該種方法在統(tǒng)計(jì)中的應(yīng)用,故數(shù)學(xué)推導(dǎo)過程略)。 當(dāng)a、b求出后,一元線性回歸方程yc = a + bx便可確定了。四、回歸估計(jì)標(biāo)準(zhǔn)誤差回歸方程的一個(gè)重要作用在于根據(jù)自變量的已知值估計(jì)因變量的理論值(估計(jì)值)。而理論值yc與實(shí)際值y存在著差距,這就產(chǎn)生了推算結(jié)果的準(zhǔn)確性問題。如果差距小,說明推算結(jié)果的準(zhǔn)確性高;反之,則低。為此,分析理論

15、值與實(shí)際值的差距很有意義。為了度量y的實(shí)際水平和估計(jì)值離差的一般水平,可計(jì)算估計(jì)標(biāo)準(zhǔn)誤差。估計(jì)標(biāo)準(zhǔn)誤差是衡量回歸直線代表性大小的統(tǒng)計(jì)分析指標(biāo),它說明觀察值圍繞著回歸直線的變化程度或分散程度。(一)估計(jì)標(biāo)準(zhǔn)誤差的計(jì)算通常用Se代表估計(jì)標(biāo)準(zhǔn)誤差,其計(jì)算公式為: (二)回歸估計(jì)標(biāo)準(zhǔn)差與一般標(biāo)準(zhǔn)差回歸估計(jì)標(biāo)準(zhǔn)差與第五章介紹的標(biāo)準(zhǔn)差的計(jì)算原理是一致的,兩者都是反映平均差異程度和表明代表性的指標(biāo)。一般標(biāo)準(zhǔn)差反映的是各變量值與其平均數(shù)的平均差異程度,表明其平均數(shù)對(duì)各變量值的代表性強(qiáng)弱;回歸標(biāo)準(zhǔn)誤差反映的是因變量各實(shí)際值與其估計(jì)值之間的平均差異程度,表明其估計(jì)值對(duì)各實(shí)際值的代表性強(qiáng)弱,其值越小,估計(jì)值yc(或

16、回歸方程)的代表性越強(qiáng),用回歸方程估計(jì)或預(yù)測的結(jié)果越準(zhǔn)確。教學(xué)目標(biāo)3 回歸方程的顯著性檢驗(yàn) 當(dāng)我們得到一個(gè)實(shí)際問題的經(jīng)驗(yàn)回歸方程yc=a+bx后,還不能用它去進(jìn)行經(jīng)濟(jì)分析和預(yù)測,因?yàn)閥c=a+bx是否真正描述了變量y與x之間的統(tǒng)計(jì)規(guī)律性,還需運(yùn)用統(tǒng)計(jì)方法對(duì)回歸方程進(jìn)行檢驗(yàn)。下面介紹兩種統(tǒng)計(jì)方法:一、F檢驗(yàn) F檢驗(yàn)是檢驗(yàn)回歸方程是否真正線性相關(guān)的一種方法,它是建立在對(duì)總離差平方和分解的基礎(chǔ)上進(jìn)行的。回歸分析表明,因變量y的實(shí)際值(觀察值)有大有小、上下波動(dòng),對(duì)每一個(gè)觀察值來說,波動(dòng)的大小可用離差()來表示。離差產(chǎn)生的原因有兩個(gè)方面:一是受自變量x變動(dòng)的影響;二是受其它因素的影響(包括觀察或?qū)嶒?yàn)中

17、產(chǎn)生的誤差的影響)。n個(gè)觀察值總的波動(dòng)大小用總離差平方和表示。其中:()為剩余離差;()為回歸離差。將上式兩邊平方,然后對(duì)所有的n點(diǎn)求和,則有:x式中:交錯(cuò)的乘積項(xiàng)等于零,因而總離差平方和為: 即 總離差平方和 = 剩余平方和 + 回歸平方和剩余平方和又稱殘差平方和,它反映了自變量x對(duì)因變量y的線性影響之外的一切因素(包括x對(duì)y的非線性影響和測量誤差等)對(duì)因變量y的作用?;貧w平方和表示在總離差平方和中,由于x與y的線性關(guān)系而引起因變量y變化的部分。上式可寫成:Lyy = Q + U其中 每個(gè)平方和都有一個(gè)自由度同它相聯(lián)系。正如總離差平方和可以分解成剩余平方和Q與回歸平方和U兩部分一樣,總離差平

18、方和的自由度f也等于剩余平方和的自由度fQ與回歸平方和的自由度fU之和,即:f = fQ + fU其中: f = n1 fQ = n2 fU = f fQ = 1在總離差平方和Lyy中,Q大就意味著U小,U越小表示變量間線性相關(guān)性越低,當(dāng)且僅當(dāng)b = 0時(shí),U是最小的??梢娨獧z驗(yàn)總體兩變量間是否真正線性相關(guān),可以檢驗(yàn)總體的回歸系數(shù)是否等于零。提出零假設(shè)、備擇假設(shè):H0:b= 0 H1:b0當(dāng)x與y有線性關(guān)系時(shí),現(xiàn)可以用F統(tǒng)計(jì)量檢驗(yàn)零假設(shè)H0 其中,表示第一自由度為1,第二自由度為n2的F分布。對(duì)于回歸方程的具體檢驗(yàn)??煞旁诜讲罘治霰碇小7讲罘治霰淼男问饺绫?5所示。表75 一元線性回歸方差分析

19、表方差來源平方和自由度F值回 歸剩 余總 和1n2n1這時(shí),若給定顯著性水平,計(jì)算 F值與查分布表得到的F值比較(一般取0.05,0.01等,1表示檢驗(yàn)的可靠度)。如果FF(1,n2)則稱變量x與y沒有明顯的線性關(guān)系,接受H0,說明回歸方程不明著;如果F>F(1,n2),則拒絕H0。說明x與y有顯著的線性關(guān)系。二、樣本決定系數(shù)r2由回歸平方和與剩余平方和的意義我們知道,在總的離差平方和中,回歸平方和所占的比重越大,則線性回歸效果越好;如果殘差平方和所占的比重大,則回歸直線與樣本觀測值擬合的就不理想。這里把回歸平方和與總離差平方和之比定義為樣本決定系數(shù),記作r2,且有 而正是相關(guān)系數(shù)r的平

20、方。(證明略)決定系數(shù)r2是一個(gè)回歸直線與樣本觀測值擬合優(yōu)度判定的指標(biāo)。r2的值總在0和1之間。一個(gè)線性回歸模型如果充分利用了x的信息,則r2越大,擬合優(yōu)度就越好;反之,如r2不大,說明模型中給出的x對(duì)y的信息還不夠充分,應(yīng)進(jìn)行修改,使x對(duì)y的信息得到充分利用。三、預(yù)測及應(yīng)用擬合的回歸直線方程經(jīng)檢驗(yàn)具有意義,就可以進(jìn)行預(yù)測。預(yù)測是回歸模型在統(tǒng)計(jì)中的重要應(yīng)用。(一)點(diǎn)估計(jì)在產(chǎn)量與制造費(fèi)用(例72)的研究中,估計(jì)回歸方程為y = 24827.62+0.753171x,提供了產(chǎn)量x與制造費(fèi)用y之間關(guān)系的一種估計(jì)。我們可以用回歸方程來對(duì)給定某一特定x值時(shí)y的值進(jìn)行點(diǎn)估計(jì),或者預(yù)測某一特定x值的y值。例

21、如,假定11月份產(chǎn)量是60000件,運(yùn)用回歸方程,我們可以得到 yc = 24827.62+0.753171×60000 = 70017.88(元)。因此當(dāng)產(chǎn)量為60000件時(shí),制造費(fèi)用的點(diǎn)估計(jì)值是70017.88元。(二)區(qū)間估計(jì)對(duì)于預(yù)測問題,除了知道點(diǎn)估計(jì)的預(yù)測值外,還希望知道預(yù)測的精度,因?yàn)辄c(diǎn)估計(jì)不能給出與估計(jì)有關(guān)的任何準(zhǔn)確信息。比如研究產(chǎn)量與制造費(fèi)用的關(guān)系,可建立回歸方程y=a+bx,當(dāng)已知產(chǎn)量x = x0時(shí),要預(yù)測制造費(fèi)用,即計(jì)算出點(diǎn)估計(jì)值,而僅知道這一數(shù)值意義不大,我們往往更希望能給出一個(gè)預(yù)測值的變動(dòng)范圍,即進(jìn)行區(qū)間估計(jì)。而這一預(yù)測值范圍比只給更可信。這個(gè)問題也就是對(duì)于給

22、定的顯著水平,找一個(gè)區(qū)間(T1,T2),使對(duì)應(yīng)于某特定的x0的實(shí)際值y0以1的置信概率被區(qū)間(T1,T2)所包含。且可以證明置信概率為(1)的預(yù)測區(qū)間為()為的標(biāo)準(zhǔn)差,為F分布表查得的臨界值令:則預(yù)測區(qū)間為()從上式可看到,對(duì)于給定的顯著性水平,為了提高預(yù)測精度,樣本容量n應(yīng)越大越好,采集數(shù)據(jù)x1,x2xn不能太集中。在進(jìn)行預(yù)測時(shí),所給的x0不能偏離太大,太大時(shí),預(yù)測效果肯定不好。統(tǒng)計(jì)預(yù)測時(shí),當(dāng)時(shí)間序列數(shù)據(jù)發(fā)生了較大變化,即要預(yù)測未來太遠(yuǎn)時(shí),x的取值x0肯定距當(dāng)時(shí)建模時(shí)采集樣本的相差太大,因此再用原模型去預(yù)測肯定不準(zhǔn)。當(dāng)樣本量n較大,或較小時(shí),我們可用近似的預(yù)測區(qū)間。置信水平為0.95與0.99的近似預(yù)測分別為:對(duì)于例73的資料,和x = 60000時(shí)點(diǎn)估計(jì)值的計(jì)算結(jié)果,現(xiàn)以1= 0.95的置信水平進(jìn)行區(qū)間估計(jì),則:元元即在置信水平為95的條件下,預(yù)測區(qū)間為(68016.788,72018.972)。教學(xué)目標(biāo)4 可線性化的曲線回歸一、可線性化的常用曲線類型1指數(shù)函數(shù) 對(duì)其兩邊取自然對(duì)數(shù),得 lny = lna + bx令 則 2冪函數(shù) 對(duì)上式兩邊取對(duì)數(shù),得 令 3雙曲線函數(shù) 令 ,則得 4對(duì)數(shù)函數(shù) 令 ,則得 5S形曲線 令 ,則得 二、非線性判定系數(shù)在非線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論