第七章 相關(guān)與回歸分析11new_第1頁
第七章 相關(guān)與回歸分析11new_第2頁
第七章 相關(guān)與回歸分析11new_第3頁
第七章 相關(guān)與回歸分析11new_第4頁
第七章 相關(guān)與回歸分析11new_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本科課程陳宜治系列課件統(tǒng)計學(xué)課件制作:陳宜治作業(yè)訂正(1)算術(shù)平均數(shù)76.3043;四分位數(shù)=70.6818,=75.9091和=82.5;眾數(shù)75.38;(2)全距R=50;平均差A(yù).D.=7.03;四分位差=11.82,異眾比率=51.11%;方差89.60;標準差9.4659;(3)偏度系數(shù)=0.0977,=0.1154,=0.0454;(4)峰度系數(shù)=2.95;(5)。甲班平均成績更有代表性。

作業(yè)訂正6、小號、中號和大號三款校服大概應(yīng)分別準備544、128、128套。8、甲、乙、丙三位同學(xué)該三門課程的標準化成績的總和分別為1.27,0.52和1.63,所以,丙同學(xué)更具有競爭優(yōu)勢。

第七章相關(guān)回歸分析相關(guān)分析(correlationanalysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。

“相關(guān)”經(jīng)常被用來表示更為模糊的東西,盡管“相關(guān)”本身有嚴格的科學(xué)含義??茖W(xué)圈外的人經(jīng)常說到這個詞,似乎它描述了兩種事物如何相聯(lián)系,但除非你涉及到高爾頓的數(shù)學(xué)測量,否則,當你使用高爾頓用于特別目的的“相關(guān)”這個詞時,它不必那么精確?;貧w分析(regressionanalysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法?;仡櫼幌赂郀栴D所發(fā)現(xiàn)的“向平均數(shù)回歸”,他試圖找到一個數(shù)學(xué)公式,將隨機事件彼此聯(lián)系在一起。費歇爾接過高爾頓“回歸”(regression)這個詞,建立了某個給定地塊小麥收成與年份之間的一般數(shù)學(xué)關(guān)系,這個相當復(fù)雜分布的參數(shù)描述了小麥產(chǎn)量產(chǎn)業(yè)化的不同方面。一、相關(guān)關(guān)系與函數(shù)關(guān)系

1.函數(shù)關(guān)系現(xiàn)象之間存在的確定性的數(shù)量依存關(guān)系

圓的面積S與半徑r之間的數(shù)量關(guān)系

GDP與總產(chǎn)出及中間投入之間的關(guān)系

例:GDP=總產(chǎn)出-中間投入第一節(jié)相關(guān)分析概述出租汽車費用與行駛里程:總費用=行駛里程每公里單價2.相關(guān)關(guān)系也稱統(tǒng)計相關(guān),是指現(xiàn)象之間存在的非確定性的數(shù)量依存關(guān)系

非一一對應(yīng)商品價格與商品需求量之間存在的變動關(guān)系

例:施肥量與農(nóng)作物產(chǎn)量的關(guān)系

家庭收入與恩格爾系數(shù):家庭收入高,則恩格爾系數(shù)低。1.是一一對應(yīng)的確定關(guān)系2.設(shè)有兩個變量x和y,變量y完全依賴于x,當變量x取某個數(shù)值時,y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量3.各觀測點落在一條線上1.變量間關(guān)系不能用函數(shù)關(guān)系精確表達2.一個變量的取值不能由另一個變量唯一確定,當變量x取某個值時,變量y的取值可能有幾個4.各觀測點分布在直線周圍

xy

xy2.函數(shù)關(guān)系與相關(guān)關(guān)系的聯(lián)系與區(qū)別聯(lián)系區(qū)別函數(shù)關(guān)系有時也可能表現(xiàn)為相關(guān)關(guān)系相關(guān)關(guān)系通常要利用相應(yīng)的函數(shù)關(guān)系式來表現(xiàn)

確定性依存關(guān)系與非確定依存關(guān)系函數(shù)關(guān)系往往因為有觀察或測量誤差以及各種隨機因素的干擾等原因,在實際中常常通過相關(guān)關(guān)系表現(xiàn)出來;而在研究相關(guān)關(guān)系時,其數(shù)量間的規(guī)律性了解得越深刻的時候,則相關(guān)關(guān)系越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來表現(xiàn)。相關(guān)關(guān)系變量個數(shù)的多少相關(guān)的密切程度單相關(guān)多元(復(fù))相關(guān)相關(guān)的方向相關(guān)的形式線性相關(guān)非線性相關(guān)完全相關(guān)不完全相關(guān)不相關(guān)正相關(guān)負相關(guān)二、相關(guān)關(guān)系的種類

偏相關(guān)定性分析是依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度相關(guān)關(guān)系的測定簡單相關(guān)表適用于所觀察的樣本單位數(shù)較少,不需要分組的情況分組相關(guān)表適用于所觀察的樣本單位數(shù)較多標志變異又較復(fù)雜,需要分組的情況將現(xiàn)象之間的相互關(guān)系,用表格的形式來反映。相關(guān)表正相關(guān)負相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy又稱散點圖,用直角坐標系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。相關(guān)圖在直線相關(guān)的條件下,用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計指標,用r表示相關(guān)系數(shù)★★★相關(guān)系數(shù)r的取值范圍:-1≤r≤1r>0為正相關(guān),r<0為負相關(guān);|r|=0表示不存在線性關(guān)系;|r|=1表示完全線性相關(guān);0<|r|<1表示存在不同程度線性相關(guān):|r|

<0.4為低度線性相關(guān);0.4≤|r|<0.7為顯著性線性相關(guān);0.7≤|r|<1.0為高度顯著性線性相關(guān)。是相關(guān)系數(shù)的平方,用表示;用來衡量回歸方程對y的解釋程度。判定系數(shù)取值范圍:越接近于1,表明x與y之間的相關(guān)性越強;越接近于0,表明兩個變量之間幾乎沒有直線相關(guān)關(guān)系.判定系數(shù)例1求下列序列相關(guān)系數(shù)例2求微積分與統(tǒng)計學(xué)成績的相關(guān)系數(shù)微積分X統(tǒng)計學(xué)Yx=X-

y=Y-x2y2xy李安7177+1-4116-4李連杰6888-2+7449-14趙文卓7882+8+16418章子怡6276-8-5642540郭達6478-6-336918成龍6675-4-6163624露思7184+1+3193瑪麗7380+3-191-3湯姆7783+7+249414杰克70870+60360∑4002100024418686【例3】計算工業(yè)總產(chǎn)值與能源消耗量之間的相關(guān)系數(shù)及判定系數(shù)序號能源消耗量(十萬噸)x工業(yè)總產(chǎn)值(億元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合計916625550862617537887結(jié)論:工業(yè)總產(chǎn)值與能源消耗量之間存在高度的正相關(guān)關(guān)系,能源消耗量x的變化能夠解釋工業(yè)總產(chǎn)值y變化的95.2﹪。(3)分組資料的簡捷計算法公式單變量分組雙變量分組了解相關(guān)分析只能說明兩個變量之間的相互依存關(guān)系,并不一定代表因果關(guān)系。在計算相關(guān)系數(shù)之前,一般要先做定性分析,否則就有可能因為數(shù)據(jù)的偶然巧合,得到較高的相關(guān)系數(shù),從而把虛假相關(guān)視為可信的相關(guān)。

說明有人曾對教師薪金的提高和酒價的上漲作了相關(guān)分析,計算得到一個較大的相關(guān)系數(shù),這是否表明教師薪金提高導(dǎo)致酒的消費量增加,從而導(dǎo)致酒價上漲呢?防止虛假相關(guān)或偽相關(guān)!第二節(jié)一元線性回歸分析回歸分析指根據(jù)相關(guān)關(guān)系的數(shù)量表達式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預(yù)測值的統(tǒng)計分析方法回歸:退回regression一、回歸分析概述

二、回歸分析的特點(相關(guān)與回歸分析的區(qū)別)

▲回歸分析必須根據(jù)研究目的確定其中一個為因變量,其余為自變量而相關(guān)分析可以不用區(qū)分自變量和因變量▲相關(guān)分析中,兩個變量要求都是隨機的,而在回歸分析中,要求因變量是隨機的,而自變量的值則是給定的▲若變量之間互為因果,則可以求出兩個回歸方程,而兩個變量之間只能求出一個相關(guān)系數(shù)▲回歸方程有較強的應(yīng)用性三、回歸分析的種類一元回歸(簡單回歸)多元回歸(復(fù)回歸)線性回歸非線性回歸一元線性回歸SimpleLinearregression按自變量的個數(shù)分⒈按回歸曲線的形態(tài)分⒉一、回歸分析概述二、一元線性回歸模型三、回歸估計標準差四、線性相關(guān)的顯著性檢驗五、回歸估計與預(yù)測★★第二節(jié)一元線性回歸分析一元線性回歸模型對于經(jīng)判斷具有線性關(guān)系的兩個變量y與x,構(gòu)造一元線性回歸模型為:假定E(

)=0,有總體一元線性回歸方程:一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態(tài)

為正

為負

為0總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)斜率(回歸系數(shù))截距截距a表示在沒有自變量x的影響時,其它各種因素對因變量y的平均影響;回歸系數(shù)b表明自變量x每變動一個單位,因變量y平均變動b個單位。(估計的回歸方程)(一元線性回歸方程)一元線性回歸方程中參數(shù)a、b的確定:最小平方法基本數(shù)學(xué)要求:整理得到由兩個關(guān)于a、b的二元一次方程組成的方程組:進一步整理,有:例:某企業(yè)隨機抽取車間9名學(xué)徒工進行調(diào)查,得到學(xué)徒期限與每天產(chǎn)量情況如右表所示,要求建立以日產(chǎn)量為因變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論