決定系數(shù)r2計(jì)算_第1頁
決定系數(shù)r2計(jì)算_第2頁
決定系數(shù)r2計(jì)算_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、決定系數(shù)r2計(jì)算【篇一:決定系數(shù)】【篇二:判定系數(shù)和相關(guān)系數(shù)的深入研究】判定系數(shù)和相關(guān)系數(shù)的深入研究什么叫相關(guān)性?比如某個(gè)地區(qū)人的身高和體重的關(guān)系,某個(gè)學(xué)校學(xué) 生學(xué)習(xí)時(shí)間和學(xué)習(xí)成績的關(guān)系,我們的收入和教育水平的關(guān)系等等, 除此之外,在我們工作中也有大量相關(guān)性的使用實(shí)例,例如我們?cè)?定位質(zhì)差原因中運(yùn)用常規(guī) mrr和質(zhì)差mrr的電平分布間的相關(guān)性, 在定位互調(diào)干擾小區(qū)時(shí)運(yùn)用干擾系數(shù)和話務(wù)量的相關(guān)性,在分析質(zhì) 差成因時(shí)運(yùn)用全網(wǎng)質(zhì)差話務(wù)比例和弱信號(hào)的相關(guān)性等等,既然我們 的工作離不開相關(guān)性的運(yùn)用,那我們有必要深入的去了解相關(guān)性的 計(jì)算及其原理。一、概念介紹說到相關(guān)性分析會(huì)使我們聯(lián)想到線性回歸和散點(diǎn)圖的

2、概念,它們同 屬于回歸分析中的概線性回歸:線性回歸是利用數(shù)理統(tǒng)計(jì)中的回歸 分析,來確定兩種或兩種以上變量間相互念,都是被廣泛使用的相 關(guān)性分析方法:依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法之一,通俗點(diǎn)來說回歸分析是 尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性,相關(guān)性可以從涉及到 的變量數(shù)量、表現(xiàn)形式及變化方向進(jìn)行分類,如下圖所示:散點(diǎn)圖:散點(diǎn)圖是用于表示因變量隨自變量而變化的大致趨勢(shì),是 將變量相關(guān)性圖形化的工具,用于判斷的分析兩組變量之間是否存 在某種關(guān)聯(lián)或總結(jié)坐標(biāo)點(diǎn)的分布模式,散點(diǎn)圖主要體現(xiàn)變量間的關(guān) 系主要有:正線性相關(guān)、負(fù)線性相關(guān)、非線性(曲線)相關(guān)和不相 關(guān)四種相關(guān)關(guān)系,其中線性相關(guān)又分強(qiáng)線性相

3、關(guān)和一般線性相關(guān), 具體形態(tài)如以下圖例所示:1)強(qiáng)正(負(fù))線性相關(guān)2)正(負(fù))線性相關(guān)3)非線性(曲線)相關(guān)不相關(guān)二、線性回歸主要參數(shù)解釋: 通過excel的 數(shù)據(jù)分析”功能可以計(jì)算出線性回歸分析數(shù)據(jù),如下 圖所示:我們主要關(guān)注【回歸統(tǒng)計(jì)】中可以反映變量間相關(guān)性的相關(guān)系數(shù)multiple r 和判定系數(shù)r square '兩個(gè)指標(biāo):1. multiple r (相關(guān)系數(shù)r):相關(guān)系數(shù)是建立在相關(guān)分析基礎(chǔ)上, 用來分析衡量變量x和變量y之間相關(guān)程度的大小。通常用r表示,該值的范圍為:-K r 和值對(duì)應(yīng)的相關(guān)性的強(qiáng)弱關(guān)系如下圖所示:相關(guān)系數(shù)計(jì)算公式及案例:r?n?xy?n?x?(?x)22

4、?x?yn?y?(?2y)2現(xiàn)假設(shè)在判斷10bszcw小區(qū)是否存互調(diào)干擾嫌疑時(shí),通過話務(wù)量 和干擾系數(shù)的相關(guān)性進(jìn)行定位,該小區(qū) 24小時(shí)的綜合話務(wù)量及干擾系數(shù)如下 表所示(灰表中的時(shí)間段數(shù)量(24個(gè))則為公式中的n,綜合話務(wù)量為x、干 擾系數(shù)為y,根據(jù)公式要求,先對(duì)數(shù)據(jù)進(jìn)行求和和匯總,匯總后的數(shù)據(jù)如下表所示:套入公式后計(jì)算結(jié)果如下:?=98.30%22. r square (判定系數(shù)r):判定系數(shù)(又稱擬合優(yōu)度或決定系數(shù))是建立在回歸分析基礎(chǔ)之上的,用于研究一個(gè)隨機(jī)變量對(duì)別一個(gè)隨機(jī)變量的解釋程度,該值的取值范圍為 Ow r w,l值越接近1,說明自變量對(duì)因變量的 解釋程度越高,自變量引起的因變

5、量變動(dòng)占總變動(dòng)的百分比越高。2判定系數(shù)算法及案例:2r?n?x(n? xy?2?(?x)n?y?x?y)2 22?(?y)以相關(guān)系數(shù)中案例的數(shù)據(jù)為基礎(chǔ)計(jì)算lObszcw 的判定系數(shù),如下:2(24?1047.01?287.95?71.47) ?=96.64%?案例說明:lObszcw 小區(qū)的相關(guān)性系數(shù)為:98.30%,可以判斷該小區(qū)的話務(wù) 量和干擾系數(shù)為正相關(guān)關(guān)系且接近絕對(duì)相關(guān)值1,說明小區(qū)話務(wù)量和干擾系數(shù)之間的關(guān)系密切;小區(qū)的判定系數(shù)為:96.64%,非常接近1,說明該小區(qū)的話務(wù)量變化導(dǎo)致干擾變化占總變化的96.64%,由此可以判斷出該小區(qū)存在互調(diào)干擾的機(jī)率非常大;如下圖10bszcw小區(qū)話

6、務(wù)量和干擾系數(shù)趨勢(shì)圖及散點(diǎn)圖所示,小區(qū) 話務(wù)量的曲線和干擾系數(shù)的典型形態(tài)幾乎是一模一樣的,從散點(diǎn)圖 的分布來看,兩組變量形成的點(diǎn)在同一直線上,說明兩組變量是存 在較強(qiáng)的線性相關(guān);三、相關(guān)系數(shù)和判定系數(shù)函數(shù)的運(yùn)用方法:在進(jìn)行質(zhì)差原因定位及規(guī)律性質(zhì)差分析等工作時(shí),我們都需要對(duì)全 網(wǎng)的小區(qū)進(jìn)行分析,所以在數(shù)據(jù)分析上必須要滿足批量計(jì)算的功能,才能更好的為我們 提高工作效率,而在我們常軟件excel中也已經(jīng)包含了相關(guān)系數(shù)及判定系數(shù)的計(jì)算函數(shù),只要掌握使用方法,便可以迅速完成全網(wǎng)小 區(qū)的相關(guān)系數(shù)計(jì)算工作:相關(guān)系數(shù)計(jì)算函數(shù):correl(array1,array2) arrayl第一組數(shù)值單元格區(qū)域arra

7、y2第二組數(shù)值單元格區(qū)域函數(shù)說明:?如果數(shù)組或引用參數(shù)包含文本、邏輯值或空白單元格,則這些值 將被忽略;但包含零值的單元格將計(jì)算在內(nèi);?如果arrayl和array2的數(shù)據(jù)點(diǎn)的個(gè)數(shù)不同,函數(shù) correl返回錯(cuò) 誤值#n/a ;?如果arrayl或array2為空,或者其數(shù)值的 s (標(biāo)準(zhǔn)偏差)等于零,函數(shù)correl返回錯(cuò)誤值#div/0!;使用案例:known_xs為數(shù)組或數(shù)據(jù)點(diǎn)區(qū)域函數(shù)說明:?參數(shù)可以是數(shù)字或者是包含數(shù)字的名稱、數(shù)組或引用;?邏輯值和直接鍵入到參數(shù)列表中代表數(shù)字的文本被計(jì)算在內(nèi);?如果數(shù)組或引用參數(shù)包含文本、邏輯值或空白單元格,則這些值將被忽略;但包含零值的單元格將計(jì)算在

8、內(nèi);?如果參數(shù)為錯(cuò)誤值或?yàn)椴荒苻D(zhuǎn)換成數(shù)字的文本,將會(huì)導(dǎo)致錯(cuò)誤;?如果kn own_ys和kn own_xs 為空或其數(shù)據(jù)點(diǎn)個(gè)數(shù)不同,函數(shù) rsq返回錯(cuò)【篇三:線性回歸方程中的相關(guān)系數(shù) r 線性回歸方程中的相關(guān)系數(shù)rr=刀(x-x的平均數(shù))(yi-y平均數(shù)”根號(hào)下刀(x-x平均數(shù))A2*刀(y-y平 均數(shù))八2r2就是相關(guān)系數(shù)的平方,r在一元線性方程就直接是因變量自變量的相關(guān)系數(shù),多元?jiǎng)t是復(fù)相 關(guān)系數(shù)判定系數(shù)rA2也叫擬合優(yōu)度、可決系數(shù)。表達(dá)式是:A2=ess/tss=1-rss/tss該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。問題:在使用過程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,r2往往增大這就

9、給人一個(gè)錯(cuò)覺:要使得模型擬合得好,只要增加解釋變量即可。 但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的r2的增大和擬合好壞無關(guān),r2需調(diào)整。這就有了調(diào)整的擬合優(yōu)度:r1A2=1 -(rss/( n-k- 1)/(tss/( n-1)在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所 以調(diào)整的思路是:將殘差平方和和總離差平方和分別除以各自的自由 度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。總是來說,調(diào)整的判定系數(shù)比起判定系數(shù),除去了因?yàn)樽兞總€(gè)數(shù)增加對(duì)判定結(jié)果的影響。r = r接近于1表明y和x1 , x2 ,,xk之 間的線性關(guān)

10、系程度密切;r接近于0表明y和x1 , x2 ,xk之間的線性關(guān)系程度不密切相關(guān)系數(shù)就是線性相關(guān)度的大小,1為(100% )絕對(duì)正相關(guān),0為0% , -1為(100% )絕對(duì)負(fù)相關(guān)相關(guān)系數(shù)絕對(duì)值越靠近1,線性相關(guān)性質(zhì)越好,根據(jù)數(shù)據(jù)描點(diǎn)畫出 來的函數(shù)-自變量圖線越趨近于一條平直線,擬合的直線和描點(diǎn)所得 圖線也更相近。如果其絕對(duì)值越靠近0,那么就說明線性相關(guān)性越差,根據(jù)數(shù)據(jù)點(diǎn) 描出的圖線和擬合曲線相差越遠(yuǎn)(當(dāng)相關(guān)系數(shù)太小時(shí),本來擬合就 已經(jīng)沒有意義,如果強(qiáng)行擬合一條直線,再把數(shù)據(jù)點(diǎn)在同一坐標(biāo)紙 上畫出來,可以發(fā)現(xiàn)大部分的點(diǎn)偏離這條直線很遠(yuǎn),所以用這個(gè)直 線來擬合是會(huì)出現(xiàn)很大誤差的或者說是根本錯(cuò)誤的

11、)。分為一元線性回歸和多元線性回歸線性回歸方程中,回歸系數(shù)的含義一元:yA=bx+ab表示x每變動(dòng)(增加或減少)1個(gè)單位,y平均變動(dòng)(增 加或減少)b各單位多元:yA=b1x1+b2x2+b3x3+a在其他變量不變的情況下,某變量變動(dòng)1單位,引起y平均變動(dòng)量以b2為例:b2表示在x1、x3 (在其他變量不變的情況下)不變得情況下,x2每變動(dòng)1單位,y平均變動(dòng)b2單位就一個(gè) reg 來說 y=a+bx+ea+bx 的誤差稱為 explained sum of squaree的誤差是不能解釋的是 residual sum of square總誤差就是tss所以 tss=rss+ess判定系數(shù)也叫擬

12、合優(yōu)度、可決系數(shù)。表達(dá)式是該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。問題:在使用過程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,r2往往增大這就給人一個(gè)錯(cuò)覺:要使得模型擬合得好,只要增加解釋變量即可。 但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的r2的增大和擬合好壞無關(guān),r2需調(diào)整。這就有了調(diào)整的擬合優(yōu)度在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和和總離差平方和分別除以各自的自由度,以剔除變量 個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為 總體平方和的自由度??偸莵碚f,調(diào)整的判定系數(shù)比起判定系數(shù),除去了因?yàn)樽兞總€(gè)數(shù)增加對(duì)判定結(jié)果的影響。順便補(bǔ)充一下:一般做回歸的時(shí)候要求擬合優(yōu)度(實(shí)際值和擬合值相關(guān)系數(shù)的平方) 越高越好,可以通過增加解釋變量來實(shí)現(xiàn),可是解釋變量多了后很 多解釋變量的系數(shù)t檢驗(yàn)不顯著了,而且增加很多變量后模型的自由 度就減少了,這些情況狂的存在往往使得模型預(yù)測(cè)不精確;修正擬 合優(yōu)度就是將殘差平方和跟總離差平方和分別除以各自的自由度, 這樣就剔除了變量個(gè)數(shù)對(duì)其影響了。首先有一個(gè)恒等式:t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論