




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
相關(guān)與回歸分析第7章
實(shí)例1:
中國(guó)婦女生育水平的決定因素是什么?婦女生育水平除了受計(jì)劃生育政策影響以外,還可能與社會(huì)、經(jīng)濟(jì)、文化等多種因素有關(guān)。1、影響中國(guó)婦女生育率變動(dòng)的因素有哪些?2、各種因素對(duì)生育率的作用方向和作用程度如何?3、哪些因素是影響婦女生育率主要的決定性因素?4、如何評(píng)價(jià)計(jì)劃生育政策在生育水平變動(dòng)中的作用?5、計(jì)劃生育政策與經(jīng)濟(jì)因素比較,什么是影響生育率的決定因素?6、如果某些地區(qū)的計(jì)劃生育政策及社會(huì)、經(jīng)濟(jì)、文化等因素發(fā)生重大變化,預(yù)期對(duì)這些地區(qū)的婦女生育水平會(huì)產(chǎn)生怎樣的影響?
據(jù)世界衛(wèi)生組織統(tǒng)計(jì),全球肥胖癥患者達(dá)3億人,其中兒童占2200萬(wàn)人,11億人體重過(guò)重。肥胖癥和體重超常早已不是發(fā)達(dá)國(guó)家的“專利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。
(引自《光明日?qǐng)?bào)》劉軍/文)問(wèn)題:肥胖癥和體重超常與死亡人數(shù)真有顯著的數(shù)量關(guān)系嗎?這些類型的問(wèn)題可以運(yùn)用相關(guān)分析與回歸分析的方法去解決。實(shí)例2:全球吃死的人比餓死的人多?
第7章相關(guān)與回歸分析7.1
相關(guān)分析7.2
一元線性回歸分析7.1相關(guān)與回歸的基本概念一、相關(guān)關(guān)系的概念二、相關(guān)系數(shù)三、相關(guān)
一、相關(guān)關(guān)系的概念
◆確定性的函數(shù)關(guān)系
Y=f(X)◆不確定性的統(tǒng)計(jì)關(guān)系—相關(guān)關(guān)系
Y=f(X)+ε(ε為隨機(jī)變量)◆沒(méi)有關(guān)系
變量間關(guān)系的圖形描述:坐標(biāo)圖(散點(diǎn)圖)
1.變量間的相互關(guān)系函數(shù)關(guān)系函數(shù)關(guān)系當(dāng)一個(gè)或幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。
當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。即現(xiàn)象之間客觀存在的不嚴(yán)格、不確定的數(shù)量依存關(guān)系。相關(guān)關(guān)系ε為隨機(jī)變量,記為:Y=F(X)+ε為影響Y的除X外的其他隨機(jī)因素。(相關(guān)關(guān)系)相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品的消費(fèi)量(y)與物價(jià)(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系
2、相關(guān)關(guān)系的類型●
從涉及的變量數(shù)量看
簡(jiǎn)單相關(guān)多重相關(guān)(復(fù)相關(guān))●
從變量相關(guān)關(guān)系的表現(xiàn)形式看
線性相關(guān)——散布圖接近一條直線(左圖)
非線性相關(guān)——散布圖接近一條曲線(右圖)●
從變量相關(guān)關(guān)系變化的方向看正相關(guān)——變量同方向變化
A
同增同減(A)負(fù)相關(guān)——變量反方向變化一增一減(B)B●從變量相關(guān)的程度看
完全相關(guān)(B)
不完全相關(guān)(A)C
不相關(guān)(C)
●總體相關(guān)系數(shù)
對(duì)于所研究的總體,表示兩個(gè)相互聯(lián)系變量相關(guān)程度的總體相關(guān)系數(shù)為:
總體相關(guān)系數(shù)反映總體兩個(gè)變量X和Y的線性相關(guān)程度。
特點(diǎn):對(duì)于特定的總體來(lái)說(shuō),X和Y的數(shù)值是既定的總體相關(guān)系數(shù)是客觀存在的特定數(shù)值。二、相關(guān)系數(shù)
●
樣本相關(guān)系數(shù)
通過(guò)x和y的樣本觀測(cè)值去估計(jì)樣本相關(guān)系數(shù)變量x和y的樣本相關(guān)系數(shù)通常用表示特點(diǎn):樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機(jī)樣本的觀測(cè)值計(jì)算出來(lái)的,是對(duì)總體相關(guān)系數(shù)的估計(jì),它是個(gè)隨機(jī)變量。
相關(guān)系數(shù)的特點(diǎn):
相關(guān)系數(shù)的取值在-1與1之間。當(dāng)r=0時(shí),表明x與y沒(méi)有線性相關(guān)關(guān)系。當(dāng)時(shí),表明x與y存在一定的線性相關(guān)關(guān)系:
若表明x與y為正相關(guān);
若表明x與y為負(fù)相關(guān)。當(dāng)時(shí),表明x與y完全線性相關(guān):
若r=1,稱x與y完全正相關(guān);若r=-1,稱x與y完全負(fù)相關(guān)。相關(guān)關(guān)系的測(cè)度
(相關(guān)系數(shù))
樣本相關(guān)系數(shù)的計(jì)算公式可化簡(jiǎn)為:
使用相關(guān)系數(shù)的注意事項(xiàng):▲x和y都是相互對(duì)稱的隨機(jī)變量,所以▲相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說(shuō)明非線性相關(guān)關(guān)系?!嚓P(guān)系數(shù)不能確定變量的因果關(guān)系,也不能說(shuō)明相關(guān)關(guān)系具體接近于哪條直線。相關(guān)系數(shù)判斷的標(biāo)準(zhǔn)在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測(cè)值之間存在著一定的線性關(guān)系。通常判斷的標(biāo)準(zhǔn)是:|r|<0.3稱為微弱相關(guān),0.3≤|r|<0.5稱為低度相關(guān),0.5≤|r|<0.8稱為顯著相關(guān),0.8≤|r|<1稱為高度相關(guān)或強(qiáng)相關(guān)。表
我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)單位:元年份人均國(guó)民收入人均消費(fèi)金額年份人均國(guó)民收入人均消費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相關(guān)系數(shù)計(jì)算【例】在研究我國(guó)人均消費(fèi)水平的問(wèn)題中,把全國(guó)人均消費(fèi)額記為y,把人均國(guó)民收入記為x。我們收集到1981~1993年的樣本數(shù)據(jù)(xi
,yi),i=1,2,…,13,數(shù)據(jù)見(jiàn)表,計(jì)算相關(guān)系數(shù)。(計(jì)算結(jié)果)解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有人均國(guó)民收入與人均消費(fèi)金額之間的相關(guān)系數(shù)為0.9987,兩者之間高度正相關(guān).三、Spearman等級(jí)相關(guān)系數(shù)當(dāng)變量不滿足正態(tài)分布要求或不是數(shù)量型變量時(shí),簡(jiǎn)單線性相關(guān)系數(shù)不宜使用,可以用Spearman等級(jí)相關(guān)系數(shù)作相關(guān)性分析。對(duì)于樣本容量為n的變量x和y,如果取值都可以分為n個(gè)等級(jí),而且樣本的n個(gè)單位分別不重復(fù)地屬于x和y的不同等級(jí),沒(méi)有兩個(gè)單位取相同等級(jí)的情況,并且用
表示樣本單位屬于x的等級(jí)與y的等級(jí)的級(jí)差。Spearman等級(jí)相關(guān)系數(shù)
為:
Spearman等級(jí)相關(guān)系數(shù)的特性樣本等級(jí)相關(guān)系數(shù)的取值范圍:
時(shí),說(shuō)明樣本等級(jí)完全正相關(guān);
時(shí),樣本等級(jí)完全負(fù)相關(guān);
時(shí),說(shuō)明樣本等級(jí)不相關(guān);
當(dāng)
時(shí),越接近1,正相關(guān)程度越高;當(dāng)
時(shí),越接近-1,負(fù)相關(guān)程度越高。可以證明:Spearman等級(jí)相關(guān)系數(shù)是簡(jiǎn)單線性相關(guān)系數(shù)的特例。7.2一元線性回歸分析一、相關(guān)分析與回歸分析的聯(lián)系二、總體回歸函數(shù)與樣本回歸函數(shù)三、回歸系數(shù)的普通最小二乘估計(jì)四、擬合優(yōu)度度量
一、相關(guān)分析與回歸分析的聯(lián)系回歸的古典意義:
高爾頓遺傳學(xué)的回歸概念
父母身高與子女身高的關(guān)系:
無(wú)論高個(gè)子或低個(gè)子的子女都有向人的平均身高回歸的趨勢(shì)
回歸的現(xiàn)代意義:一個(gè)因變量對(duì)若干解釋變量依存關(guān)系的研究回歸的目的(實(shí)質(zhì)):
由固定的自變量去估計(jì)因變量的平均值樣本總體自變量固定值估計(jì)因變量平均值
相關(guān)分析與回歸分析的聯(lián)系●共同的研究對(duì)象:都是對(duì)變量間相關(guān)關(guān)系的分析●只有當(dāng)變量間存在相關(guān)關(guān)系時(shí),用回歸分析去尋求相關(guān)的具體數(shù)學(xué)形式才有實(shí)際意義?!裣嚓P(guān)分析只表明變量間相關(guān)關(guān)系的性質(zhì)和程度,要確定變量間相關(guān)的具體數(shù)學(xué)形式依賴于回歸分析●相關(guān)分析中相關(guān)系數(shù)的確定建立在回歸分析的基礎(chǔ)上。
二、總體回歸函數(shù)與樣本回歸函數(shù)
若干基本概念●
y的條件分布:y在x取某固定值條件下的分布。●對(duì)于x的每一個(gè)取值,都有y的條件期望與之對(duì)應(yīng),在坐標(biāo)圖上y的條件期望的點(diǎn)隨x而變化的軌跡所形成的直線或曲線,稱為回歸線。●如果把y的條件期望表示為x的某種函數(shù):,這個(gè)函數(shù)稱為回歸函數(shù)?!袢绻浜瘮?shù)形式是只有一個(gè)自變量的線性函數(shù),如,稱為一元線性回歸函數(shù)。
總體回歸函數(shù)(PRF)
概念:將總體因變量y的條件均值表現(xiàn)為自變量x的某種函數(shù),這個(gè)函數(shù)稱為總體回歸函數(shù)(簡(jiǎn)記為PRF)。表現(xiàn)形式:(1)條件均值表現(xiàn)形式(2)個(gè)別值表現(xiàn)形式(隨機(jī)設(shè)定形式)
樣本回歸函數(shù)(SRF)概念:
●y的樣本觀測(cè)值的條件均值隨自變量x而變動(dòng)的軌跡,稱為樣本回歸線。
●如果把因變量y的樣本條件均值表示為自變量x的某種函數(shù),這個(gè)函數(shù)稱為樣本回歸函數(shù)(簡(jiǎn)記為SRF)。表現(xiàn)形式:線性樣本回歸函數(shù)可表示為或者
樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系
——相互聯(lián)系
●樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致?!窈褪菍?duì)總體回歸函數(shù)參數(shù)的估計(jì)?!袷菍?duì)總體條件期望的估計(jì)●殘差e在概念上類似總體回歸函數(shù)中的隨機(jī)誤差u?;貧w分析的目的:用樣本回歸函數(shù)去估計(jì)總體回歸函數(shù)。樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系
——相互區(qū)別
●總體回歸函數(shù)雖然未知,但它是確定的;樣本回歸線隨抽樣波動(dòng)而變化,可以有許多條?!駱颖净貧w線還不是總體回歸線,至多只是未知總體回歸線的近似表現(xiàn)。●總體回歸函數(shù)的參數(shù)雖未知,但是確定的常數(shù);樣本回歸函數(shù)的參數(shù)可估計(jì),但是隨抽樣而變化的隨機(jī)變量?!窨傮w回歸函數(shù)中的是不可直接觀測(cè)的;而樣本回歸函數(shù)中的是只要估計(jì)出樣本回歸的參數(shù)就可以計(jì)算的數(shù)值。
三、回歸系數(shù)的普通最小二乘估計(jì)回歸系數(shù)估計(jì)的思想:為什么只能對(duì)未知參數(shù)作估計(jì)?
參數(shù)是未知的、不可直接觀測(cè)的、不能精確計(jì)算的
能夠得到的只是變量的樣本觀測(cè)值結(jié)論:只能通過(guò)變量樣本觀測(cè)值選擇適當(dāng)方法去近似地估計(jì)回歸系數(shù)。前提:
u是隨機(jī)變量其分布性質(zhì)不確定,必須作某些假定,其估計(jì)才有良好性質(zhì),其檢驗(yàn)才可進(jìn)行。原則:
使參數(shù)估計(jì)值“盡可能地接近”總體參數(shù)真實(shí)值
回歸系數(shù)的最小二乘估計(jì)基本思想:
希望所估計(jì)的偏離實(shí)際觀測(cè)值的殘差越小越好??梢匀埐钇椒胶妥鳛楹饬颗c偏離程度的標(biāo)準(zhǔn)——最小二乘準(zhǔn)則估計(jì)式:
序號(hào)能源消耗量(十萬(wàn)噸)x工業(yè)總產(chǎn)值(億元)yx2y2xy12345678910111213141516353840424952545962646568697172762425242832313740414047504951485812251444160017642401270429163481384440964225462447615041518457765766255767841024961136916
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年上海市戶外廣告發(fā)布合同范本
- 2025年度2月醫(yī)療影像云存儲(chǔ)系統(tǒng)集成分包合同
- 書蟲英語(yǔ)測(cè)試題及答案
- 新技術(shù)時(shí)代的專利申請(qǐng)?zhí)攸c(diǎn)分析試題及答案
- 善用文化產(chǎn)業(yè)管理證書考試試題及答案的輔助
- 處理母豬疾病的護(hù)理考查試題及答案
- 心理咨詢師的案例分析能力提升試題及答案
- 2024年護(hù)士資格證考試心理健康護(hù)理知識(shí)試題及答案
- 2024年文化產(chǎn)業(yè)管理的綜合分析試題及答案
- 教師資格筆試的復(fù)習(xí)技巧及試題與答案
- 職業(yè)暴露與安全防護(hù)ppt
- 抗腫瘤藥物處方審核要點(diǎn)
- 工業(yè)用烤箱安全操作規(guī)程范本
- 文件資料交接清單
- 人體解剖學(xué)與組織胚胎學(xué)課件
- 波導(dǎo)圓極化器結(jié)構(gòu)形式的選擇
- 交流電的三要素
- 2022-2023學(xué)年天津市部分區(qū)八年級(jí)(下)期中物理試卷(含解析)
- 2022-2023學(xué)年北京市101中學(xué)教育集團(tuán)八年級(jí)(下)期中物理試卷含答案解析
- 《平移》說(shuō)課課件
- 油氣輸送管道高后果區(qū)識(shí)別與評(píng)價(jià)釋義
評(píng)論
0/150
提交評(píng)論