經(jīng)典線性回歸模型_第1頁
經(jīng)典線性回歸模型_第2頁
經(jīng)典線性回歸模型_第3頁
經(jīng)典線性回歸模型_第4頁
經(jīng)典線性回歸模型_第5頁
已閱讀5頁,還剩195頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章第二章 經(jīng)典線性回歸模型:經(jīng)典線性回歸模型:雙變量線性回歸模型雙變量線性回歸模型 v回歸分析概述回歸分析概述 v雙變量線性回歸模型的參數(shù)估計(jì)雙變量線性回歸模型的參數(shù)估計(jì) v雙變量線性回歸模型的假設(shè)檢驗(yàn)雙變量線性回歸模型的假設(shè)檢驗(yàn)v雙變量線性回歸模型的預(yù)測雙變量線性回歸模型的預(yù)測v實(shí)例實(shí)例 從從2004中國國際旅游交易會(huì)上獲悉,到中國國際旅游交易會(huì)上獲悉,到2020年,中國旅游年,中國旅游業(yè)總收入將超過業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至至11%。(資料來源:國際金融報(bào)。(資料來源:國際金融報(bào)2004年年11月月25日第二版)日第二版)是什么

2、決定性的因素能使中國旅游業(yè)總收入到是什么決定性的因素能使中國旅游業(yè)總收入到2020年達(dá)到年達(dá)到3000億美元?億美元?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?引子引子: 中國旅游業(yè)總收入將超過中國旅游業(yè)總收入將超過30003000億美億美元嗎?元嗎? 1. 經(jīng)濟(jì)變量間的相互關(guān)系經(jīng)濟(jì)變量間的相互關(guān)系 確定性的函數(shù)關(guān)系確定性的函數(shù)關(guān)系 不確定性的統(tǒng)計(jì)關(guān)系不確定性的統(tǒng)計(jì)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系 (為隨機(jī)變量為隨機(jī)變量) 沒有關(guān)系沒有關(guān)系 一、回歸與

3、相關(guān)一、回歸與相關(guān) (對(duì)統(tǒng)計(jì)學(xué)的回顧)(對(duì)統(tǒng)計(jì)學(xué)的回顧)()Yf X()Yf X2.2.相關(guān)關(guān)系相關(guān)關(guān)系 相關(guān)關(guān)系的描述相關(guān)關(guān)系的描述 相關(guān)關(guān)系最直觀的描述方式相關(guān)關(guān)系最直觀的描述方式坐標(biāo)圖坐標(biāo)圖(散布圖)散布圖) YX相關(guān)關(guān)系的類型相關(guān)關(guān)系的類型 從涉及的變量數(shù)量看從涉及的變量數(shù)量看 簡單相關(guān)簡單相關(guān) 多重相關(guān)(復(fù)相關(guān))多重相關(guān)(復(fù)相關(guān)) 從變量相關(guān)關(guān)系的表現(xiàn)形式看從變量相關(guān)關(guān)系的表現(xiàn)形式看 線性相關(guān)線性相關(guān)散布圖接近一條直線散布圖接近一條直線 非線性相關(guān)非線性相關(guān)散布圖接近一條曲線散布圖接近一條曲線 從變量相關(guān)關(guān)系變化的方向看從變量相關(guān)關(guān)系變化的方向看 正相關(guān)正相關(guān)變量同方向變化,同增同減

4、變量同方向變化,同增同減 負(fù)相關(guān)負(fù)相關(guān)變量反方向變化,一增一減變量反方向變化,一增一減 不相關(guān)不相關(guān) 3.3.相關(guān)程度的度量相關(guān)程度的度量相關(guān)系數(shù)相關(guān)系數(shù) 總體線性相關(guān)系數(shù)總體線性相關(guān)系數(shù): 其中:其中: X 的方差;的方差; Y的方差的方差 X和和Y的協(xié)方差的協(xié)方差樣本線性相關(guān)系數(shù)樣本線性相關(guān)系數(shù): 其中:其中: 和和 分別是變量分別是變量 和和 的樣本觀測值的樣本觀測值 和和 分別是變量分別是變量 和和 樣本值的平均值樣本值的平均值Cov(,)Var()Var()X YXYVar()XVar( )YCov(, )X Y_22()()()()iiXYiiXXYYXXYY_YiXiYXXYXY

5、圖圖3 r = 0.92 圖圖4 r = 0.99 散點(diǎn)圖與相關(guān)系數(shù)散點(diǎn)圖與相關(guān)系數(shù) 值的對(duì)應(yīng)關(guān)系值的對(duì)應(yīng)關(guān)系 和和 都是相互對(duì)稱的隨機(jī)變量都是相互對(duì)稱的隨機(jī)變量 線性線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不 能說明非能說明非 線性相關(guān)關(guān)系線性相關(guān)關(guān)系 樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由 于抽樣波動(dòng),樣本相關(guān)系數(shù)是個(gè)隨機(jī)變量,其統(tǒng)于抽樣波動(dòng),樣本相關(guān)系數(shù)是個(gè)隨機(jī)變量,其統(tǒng) 計(jì)顯著性有待檢驗(yàn)計(jì)顯著性有待檢驗(yàn) 相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果 關(guān)系,不能說明

6、相關(guān)關(guān)系具體接近哪條直線關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線 計(jì)量經(jīng)濟(jì)學(xué)關(guān)心:計(jì)量經(jīng)濟(jì)學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在隨變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析方法機(jī)性后面的統(tǒng)計(jì)規(guī)律性,這有賴于回歸分析方法 使用相關(guān)系數(shù)時(shí)應(yīng)注意使用相關(guān)系數(shù)時(shí)應(yīng)注意XY4. 4. 回歸分析回歸分析回歸的回歸的古典意義古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念 ( 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系)回歸的回歸的現(xiàn)代意義現(xiàn)代意義: 一個(gè)應(yīng)變量對(duì)若干解釋變量一個(gè)應(yīng)變量對(duì)若干解釋變量 依存關(guān)系依存關(guān)系 的研究的研究回歸的回歸的目的(實(shí)質(zhì))目的(實(shí)質(zhì)): 由固定的解

7、釋變量去由固定的解釋變量去 估計(jì)應(yīng)變量的平均值估計(jì)應(yīng)變量的平均值 的的條件分布條件分布 當(dāng)解釋變量當(dāng)解釋變量 取某固定值時(shí)(條件),取某固定值時(shí)(條件), 的值不的值不確定,確定, 的不同取值形成一定的分布,即的不同取值形成一定的分布,即 的條的條件分布。件分布。 的的條件期望條件期望 對(duì)于對(duì)于 的每一個(gè)取值,的每一個(gè)取值, 對(duì)對(duì) 所形成的分布確所形成的分布確 定其期望或均值,稱定其期望或均值,稱 為為 的條件期望或條的條件期望或條 件均值件均值 注意幾個(gè)概念注意幾個(gè)概念iXXYYYYYYYXYXE()iY X iXYX回歸線回歸線: 對(duì)于每一個(gè)對(duì)于每一個(gè) 的取值,的取值, 都有都有 的條件期

8、望的條件期望 與之對(duì)應(yīng),與之對(duì)應(yīng), 代表這些代表這些 的條件期的條件期 望的點(diǎn)的軌跡所形成望的點(diǎn)的軌跡所形成 的直線或曲線,稱為的直線或曲線,稱為 回歸線?;貧w線?;貧w線與回歸函數(shù)回歸線與回歸函數(shù)XYYE()iY X 回歸函數(shù):回歸函數(shù):應(yīng)變量應(yīng)變量 的條件期望的條件期望 隨解隨解釋變量釋變量 的的變化而有規(guī)律的變化,如果把的的變化而有規(guī)律的變化,如果把 的條件期望的條件期望 表現(xiàn)為表現(xiàn)為 的某種函數(shù)的某種函數(shù) 這個(gè)函數(shù)稱為回歸函數(shù)。這個(gè)函數(shù)稱為回歸函數(shù)。 回歸函數(shù)分為:回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)總體回歸函數(shù)和樣本回歸函數(shù)舉例:假如已知舉例:假如已知100個(gè)家庭構(gòu)成的總體。個(gè)家庭

9、構(gòu)成的總體。 回歸線與回歸函數(shù)回歸線與回歸函數(shù)YXXE ()()iiYXfXYE()iY XE()iY X每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520

10、662321258729003288家家132414001615194321852365265030213399庭庭1448165020372210239827893064消消1489171220782289248728533142費(fèi)費(fèi)1538177821792313251329343274支支160018412298239825383110出出17021886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X例例:100個(gè)家庭構(gòu)成的總體個(gè)家庭構(gòu)

11、成的總體 (單位單位:元元)每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家1324140016151943218

12、52365265030213399庭庭1448165020372210239827893064消消1489171220782289248728533142費(fèi)費(fèi)1538177821792313251329343274支支160018412298239825383110出出17021886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X例例:100個(gè)家庭構(gòu)成的總體個(gè)家庭構(gòu)成的總體 (單位單位:元元)每每 月月 家家 庭庭 可可 支支 配配 收收 入

13、入 X X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家132414001615194321852365265030213399庭庭14481650203722102398

14、27893064消消1489171220782289248728533142費(fèi)費(fèi)1538177821792313251329343274支支160018412298239825383110出出17021886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X例例:100個(gè)家庭構(gòu)成的總體個(gè)家庭構(gòu)成的總體 (單位單位:元元) 1. 1. 總體回歸函數(shù)的概念總體回歸函數(shù)的概念 前提:前提:假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體應(yīng)變假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體

15、應(yīng)變量量 和解釋變量和解釋變量 的每個(gè)觀測值的每個(gè)觀測值, 可以計(jì)算出總體可以計(jì)算出總體應(yīng)變量應(yīng)變量 的條件均值的條件均值 ,并將其表現(xiàn)為解釋并將其表現(xiàn)為解釋變量變量 的某種函數(shù)的某種函數(shù) 這個(gè)函數(shù)稱為總體回歸函數(shù)(這個(gè)函數(shù)稱為總體回歸函數(shù)(PRF)二、總體回歸函數(shù)二、總體回歸函數(shù)(PRFPRF)E()()iiY X= fXYYXXE()iY X每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172

16、618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家132414001615194321852365265030213399庭庭1448165020372210239827893064消消1489171220782289248728533142費(fèi)費(fèi)1538177821792313251329343274支支160018412298239825383110出出17021

17、886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X例例:100個(gè)家庭構(gòu)成的總體個(gè)家庭構(gòu)成的總體 (單位單位:元元) iXYX總體回歸線與回歸函數(shù)總體回歸線與回歸函數(shù)05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元) iuiXXY)(iXYEiY (1)條件均值條件均值表現(xiàn)形式表現(xiàn)形式 假如假如 的條件均值的條件均值 是解是解 釋變量

18、釋變量 的線性函數(shù),可表示為:的線性函數(shù),可表示為: (2)個(gè)別值個(gè)別值表現(xiàn)形式表現(xiàn)形式 對(duì)于一定的對(duì)于一定的 , 的各個(gè)別值的各個(gè)別值 分布分布 在在 的周圍,若令各個(gè)的周圍,若令各個(gè) 與條件與條件 均值均值 的偏差為的偏差為 , , 顯然顯然 是隨機(jī)變量是隨機(jī)變量, ,則有則有 或或 2.2.總體回歸函數(shù)的表現(xiàn)形式總體回歸函數(shù)的表現(xiàn)形式iXE()iY X12E()()iiiiY Xf XXiYE()iY XiYE()iY Xiuiu12E()iiiiiiuYY XYX12iiiYXuYYX實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知未知的,的,只能根據(jù)經(jīng)濟(jì)理論和

19、實(shí)踐經(jīng)驗(yàn)去只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去設(shè)定設(shè)定?!坝?jì)量計(jì)量”的目的就是尋求的目的就是尋求PRFPRF??傮w回歸函數(shù)中總體回歸函數(shù)中 與與 的關(guān)系可是的關(guān)系可是線性線性的,也可是的,也可是非線性非線性的。的。對(duì)線性回歸模型的對(duì)線性回歸模型的“線性線性”有兩種解釋有兩種解釋 就變量而言就變量而言是線性的是線性的 的條件均值是的條件均值是 的線性函數(shù)的線性函數(shù) 就參數(shù)而言就參數(shù)而言是線性的是線性的 的條件均值是參數(shù)的條件均值是參數(shù) 的線性函數(shù)的線性函數(shù) 3.3.如何理解總體回歸函數(shù)如何理解總體回歸函數(shù)YXYYX計(jì)量經(jīng)濟(jì)學(xué)中計(jì)量經(jīng)濟(jì)學(xué)中: : 線性回歸模型主要指就參數(shù)而言是線性回歸模型主要指就參數(shù)而言

20、是“線性線性”, ,因?yàn)橹灰獙?duì)參數(shù)而言是線性的因?yàn)橹灰獙?duì)參數(shù)而言是線性的, ,都可以用類似的方法都可以用類似的方法估計(jì)其參數(shù)。估計(jì)其參數(shù)。12E()iiiY XX212E()iiiY XX12E()iiiY XX“線性線性”的判斷的判斷三、隨機(jī)擾動(dòng)項(xiàng)三、隨機(jī)擾動(dòng)項(xiàng)概念概念: 各個(gè)各個(gè) 值與條件均值值與條件均值 的偏差的偏差 代表代表 排除在模型以外的所有排除在模型以外的所有 因素對(duì)因素對(duì) 的影響。的影響。性質(zhì):性質(zhì): 是期望為是期望為0有一定分布的隨機(jī)變量有一定分布的隨機(jī)變量 重要性:重要性:隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)方隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)方法的選擇法的選擇uiYiuYXiXuE

21、()iY XYiu 未知影響因素的代表未知影響因素的代表 無法取得數(shù)據(jù)的已知影響因素的代表無法取得數(shù)據(jù)的已知影響因素的代表 眾多細(xì)小影響因素的綜合代表眾多細(xì)小影響因素的綜合代表 模型的設(shè)定誤差模型的設(shè)定誤差 變量的觀測誤差變量的觀測誤差 變量內(nèi)在隨機(jī)性變量內(nèi)在隨機(jī)性引入隨機(jī)擾動(dòng)項(xiàng)的原因引入隨機(jī)擾動(dòng)項(xiàng)的原因四、樣本回歸函數(shù)(四、樣本回歸函數(shù)(SRF)v問題:問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?v例例2.2:在例2.1的總體中有如下一個(gè)樣本,能否從該樣本估計(jì)總體回歸函數(shù)PRF?表表2.1.3 家家庭庭消消費(fèi)費(fèi)支支出出與與可可支支配配收收入入的的一一

22、個(gè)個(gè)隨隨機(jī)機(jī)樣樣本本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530 回答:能 該樣本的散點(diǎn)圖散點(diǎn)圖(scatter diagram):v 畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回樣本回歸線歸線(sample regression lines)。)。v 記樣本回歸線的函數(shù)形式為:iiiXXfY10)(稱為樣本回歸函數(shù)樣本回歸函數(shù)(sample regression function,S

23、RF)。 注意:注意:這里將樣本回歸線樣本回歸線看成總體回歸線總體回歸線的近似替代則 樣本回歸函數(shù)的隨機(jī)形式樣本回歸函數(shù)的隨機(jī)形式/ /樣本回歸模型:樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式: iiiiieXYY10式中,ie稱為(樣樣本本)殘殘差差(或剩剩余余)項(xiàng)項(xiàng)(residual) ,代表了其他影響iY的隨機(jī)因素的集合,可看成是i的估計(jì)量i。 由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型樣本回歸模型(sample regression model)。 回歸分析的主要目的回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。即,根據(jù) iiiii

24、eXeYY10估計(jì)iiiiiXXYEY10)|(注意:注意:這里PRF可能永遠(yuǎn)無法知道。2.2 2.2 雙變量線性回歸模型的參數(shù)估計(jì)雙變量線性回歸模型的參數(shù)估計(jì) 一、雙變量線性回歸模型的基本假設(shè)一、雙變量線性回歸模型的基本假設(shè) 二、參數(shù)的普通最小二乘估計(jì)(二、參數(shù)的普通最小二乘估計(jì)(OLSOLS) 三、最小二乘估計(jì)量的性質(zhì)三、最小二乘估計(jì)量的性質(zhì) 四、參數(shù)估計(jì)量的概率分布及隨機(jī)干四、參數(shù)估計(jì)量的概率分布及隨機(jī)干 擾項(xiàng)方差的估計(jì)擾項(xiàng)方差的估計(jì) v回歸分析的主要目的回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)(模型)PRF。v估計(jì)方法估計(jì)方法有多種,其中最廣泛使

25、用的是普通最普通最小二乘法小二乘法(ordinary least squares, OLS)。v為保證參數(shù)估計(jì)量具有良好的性質(zhì),通常對(duì)模型提出若干基本假設(shè)。v實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)。 一、線性回歸模型的基本假設(shè)一、線性回歸模型的基本假設(shè) 假設(shè)1. 解釋變量X是確定性變量,不是隨機(jī)變量; 假設(shè)2. 隨機(jī)誤差項(xiàng)具有零均值、同方差和無自相關(guān): E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 異方差XYX10XYX10序列自相關(guān)XXYX10YX10負(fù)相關(guān)正相關(guān)假設(shè)3. 隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān):

26、Cov(Xi, i)=0 i=1,2, ,n vP23顯示Cov的Case:即樣本相關(guān)系數(shù)假設(shè)4. 服從零均值、同方差、零協(xié)方差的正態(tài)分布 iN(0, 2 ) i=1,2, ,n 如果假設(shè)1、2滿足,則假設(shè)3也滿足; 如果假設(shè)4滿足,則假設(shè)2也滿足。注意:注意: 以上假設(shè)也稱為線性回歸模型的經(jīng)典假經(jīng)典假設(shè)設(shè)或高斯(高斯(Gauss)假設(shè))假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型經(jīng)典線性回歸模型(Classical Linear Regression Model, CLRM)。 二、參數(shù)的普通最小二乘估計(jì)(二、參數(shù)的普通最小二乘估計(jì)(OLSOLS) 最小二乘法產(chǎn)生的歷史v最小二乘法

27、最早稱為回歸分析法。由著名的英國生物學(xué)家、統(tǒng)計(jì)學(xué)家道爾頓(F.Gallton)達(dá)爾文的表弟所創(chuàng)。v早年,道爾頓致力于化學(xué)和遺傳學(xué)領(lǐng)域的研究。v他研究父親們的身高與兒子們的身高之間的關(guān)系時(shí),建立了回歸分析法。最小二乘法的地位與作用v現(xiàn)在回歸分析法已遠(yuǎn)非道爾頓的本意v已經(jīng)成為探索變量之間關(guān)系最重要的方法,用以找出變量之間關(guān)系的具體表現(xiàn)形式。v后來,回歸分析法從其方法的數(shù)學(xué)原理殘差平方和最?。ㄆ椒侥硕艘玻┏霭l(fā),改稱為最小二乘法。父親們的身高與兒子們的身高之間關(guān)系的研究v1889年F.Gallton和他的朋友K.Pearson收集了上千個(gè)家庭的身高、臂長和腿長的記錄v企圖尋找出兒子們身高與父親們身高

28、之間關(guān)系的具體表現(xiàn)形式v下圖是根據(jù)1078個(gè)家庭的調(diào)查所作的散點(diǎn)圖(略圖)yx160165170175180185140150160170180190200YX兒子們身高向著平均身高“回歸”,以保持種族的穩(wěn)定“回歸”一詞的由來v從圖上雖可看出,個(gè)子高的父親確有生出個(gè)子高的兒子的傾向,同樣地,個(gè)子低的父親確有生出個(gè)子低的兒子的傾向。得到的具體規(guī)律如下:v如此以來,高的伸進(jìn)了天,低的縮入了地。他百思不得其解,同時(shí)又發(fā)現(xiàn)某人種的平均身高是相當(dāng)穩(wěn)定的。最后得到結(jié)論:兒子們的身高回復(fù)于全體男子的平均身高,即“回歸”見1889年F.Gallton的論文普用回歸定律。v后人將此種方法普遍用于尋找變量之間的規(guī)

29、律 xyubxay516. 033.84復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)最小二乘法的思路v為了精確地描述Y與X之間的關(guān)系,必須使用這兩個(gè)變量的每一對(duì)觀察值(n組觀察值),才不至于以點(diǎn)概面(做到全面)。vY與X之間是否是直線關(guān)系(用協(xié)方差或相關(guān)系數(shù)判斷)?若是,可用一條直線描述它們之間的關(guān)系。v在Y與X的散點(diǎn)圖上畫出直線的方法很多。v找出一條能夠最好地描述Y與X(代表所有點(diǎn))之間的直線。問題是:怎樣算“最好”?v最好指的是找一條直線使得所有這些點(diǎn)到該直線的縱向所有這些點(diǎn)到該直線的縱向距離的和(平方和)距離的和(平方和)最小。整理得:復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)線性關(guān)系的顯著性檢驗(yàn)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)

30、習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)復(fù)復(fù)習(xí)習(xí)v練習(xí):取0.01做顯著性檢驗(yàn)最小二乘法的思路yx縱向距離橫向距離距離yxiiA,yxiiB,A為實(shí)際點(diǎn),B為擬合直線上與之對(duì)應(yīng)的點(diǎn)xyyyuiiiii10縱向距離最小二乘法的思路v縱向距離是Y的實(shí)際值與擬合值之差,差異大擬合不好,差異小擬合好,所以稱為殘差、擬合誤差或剩余。v將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。擬合直線在總體上最接近實(shí)際觀測點(diǎn)。v于是可以運(yùn)用求極值的原理,將求最好擬合直線問題轉(zhuǎn)換為求誤差平方和最小的問題。YX0*7Y9Y*Y7Y9Min2)(iiYY數(shù)學(xué)形式最小二乘法的數(shù)

31、學(xué)原理v縱向距離是Y的實(shí)際值與擬合值之差,差異大擬合不好,差異小擬合好,所以又稱為擬合誤差或殘差。v將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。v于是可以運(yùn)用求極值的原理,將求最好擬合直線問題轉(zhuǎn)換為求誤差平方和最小。 給定一組樣本觀測值(Xi, Yi)(i=1,2,n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值. 普通最小二乘法普通最小二乘法(Ordinary least squares, OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和niiiniXYYYQ121021)()(最小。 根據(jù)微分運(yùn)算,可推得用于估計(jì)0、1的下列方程組: 0)(0)(1010iiiiiX

32、YXYX (2.2.4) 或 21010iiiiiiXXXYXnY (2.2.5)解得: 2212220)()(iiiiiiiiiiiiiXXnXYXYnXXnXYXYX (2.2.6)方程組(2.2.5)稱為正正則則方方程程組組(normal equations) 。得到的參數(shù)估計(jì)量可以寫成: XYxyxiii1021 稱為OLS估計(jì)量的離差形式離差形式(deviation form)。)。 由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到 的,故稱為普通普通最小二乘估計(jì)量最小二乘估計(jì)量(ordinary least squares estimators)。 例例2.2.1:在上述家庭可支配收入可支配

33、收入- -消費(fèi)支出消費(fèi)支出例中,對(duì)于所抽出的一組樣本數(shù),參數(shù)估計(jì)的計(jì)算可通過下面的表2.2.1進(jìn)行。 表表 2.2.1 參參數(shù)數(shù)估估計(jì)計(jì)的的計(jì)計(jì)算算表表 iX iY ix iy iiyx 2ix 2iy 2iX 2iY 1 800 594 -1350 -973 1314090 1822500 947508 640000 352836 2 1100 638 -1050 -929 975870 1102500 863784 1210000 407044 3 1400 1122 -750 -445 334050 562500 198381 1960000 1258884 4 1700 1155 -4

34、50 -412 185580 202500 170074 2890000 1334025 5 2000 1408 -150 -159 23910 22500 25408 4000000 1982464 6 2300 1595 150 28 4140 22500 762 5290000 2544025 7 2600 1969 450 402 180720 202500 161283 6760000 3876961 8 2900 2078 750 511 382950 562500 260712 8410000 4318084 9 3200 2585 1050 1018 1068480 11025

35、00 1035510 10240000 6682225 10 3500 2530 1350 963 1299510 1822500 926599 12250000 6400900 求和 21500 15674 5769300 7425000 4590020 53650000 29157448 平均 2150 1567 計(jì)量經(jīng)濟(jì)學(xué)與電腦v必須指出,模型的建立和實(shí)際使用,離開了電腦幾乎是不可能的。v目前,已有很多計(jì)量經(jīng)濟(jì)學(xué)軟件包,可以完成計(jì)量經(jīng)濟(jì)學(xué)模型的參數(shù)估計(jì)、模型檢驗(yàn)、預(yù)測等基本運(yùn)算。v幾種常見計(jì)量軟件SAS,SPSS,ET,ESP,GAUSS,MATLAB,MICROTSP,STATA, M

36、INITAB,SYSTAT,SHAZAM,EViews,DATA-FIT。v本課程采用國家教委推薦的EViews進(jìn)行案例教學(xué)。v要求同學(xué)們掌握EViews,比較熟練地使用它,并掌握EViews與其它Windows軟件共享信息。777. 07425000576930021iiixyx172.1032150777. 0156700XY因此,由該樣本估計(jì)的回歸方程為: iiXY777.0172.103 四、最小二乘估計(jì)量的性質(zhì)四、最小二乘估計(jì)量的性質(zhì) 一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性: (1)線性)線性,即它是否是另一隨機(jī)變量的線性函數(shù); 當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的

37、精當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。 一個(gè)用于考察總體的統(tǒng)計(jì)量,可從三個(gè)方面一個(gè)用于考察總體的統(tǒng)計(jì)量,可從三個(gè)方面考察其優(yōu)劣性:考察其優(yōu)劣性:(1)線性性)線性性(linear):即是否是另一隨機(jī)變量的即是否是另一隨機(jī)變量的線性函數(shù);線性函數(shù);(2)無偏性)無偏性(unbiased):即它的均值或期望值即它的均值或期望值是否等于總體的真實(shí)值;是否等于總體的真實(shí)值;(3)有效性)有效性(efficient):即它是否在所有線性無即它是否在所有線性無偏估計(jì)量中具

38、有最小方差。偏估計(jì)量中具有最小方差。高斯高斯馬爾可夫定理馬爾可夫定理(Gauss-Markov theorem) 在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。1、線性性:、線性性:參數(shù)估計(jì)量是參數(shù)估計(jì)量是Y的線性函數(shù)的線性函數(shù)證:22221)(iiiiiiiiiiixxYxYxxYYxxyx令2iiixxk,因0)(XXxii,故有iiiiiYkYxx21 iiiiiiiYwYkXnXYkYnXY)1(1102、無偏性:、無偏性:參數(shù)估計(jì)量的均值等于總體回歸參數(shù)估計(jì)量的均值等于總體回歸參數(shù)真值參數(shù)真值證證:iiiiiiiiiikXkkXkYk10101)(由于 0

39、2iiixxk,1)()(222222iiiiiiiiiiiiiiixxXxxxXxxxXXXxxXxXk故:iik11 1111)()()(iiiiEkkEEiiiiiiiiiiwXwwXwYw10100)(由于:11)/ 1 (iiikXkXnw 01)/ 1 (XXXkXXnXkXnXwiiiiiii故: iiw00 0000)()()()(iiiiEwEwEE3、有效性:、有效性:在所有線性無偏估計(jì)量中,最在所有線性無偏估計(jì)量中,最小二乘估計(jì)量具有最小方差。小二乘估計(jì)量具有最小方差。 (1)先求0、1的方差222221021)var()var()var(iiiiiiiixxxXkYk

40、(2.2.10)221020)/1 ()var()var()var(iiiiiikXnXwYw2222222221121iiiiixxXkXnnkXkXnn22222222221iiiiixnXxnXnxxXn (2.2.11)(2)證明最小方差性假設(shè)*1是其他方法得到的關(guān)于1的線性無偏估計(jì)量: iiYc*1其中,iiidkc,id為不全為零的常數(shù)。iiiiiiiiiXccXcYEcYcEE1010*1)()()()(由*1的無偏性,即1*1)(E可知: 110iiiXcc從而有: 0ic,1iiXc*1的方差 2222*1)var()var()var()var(iiiiiiiccYcYc =

41、iiiiiidkdkdk22222222)(由于 2)(iiiiiiiikckkckdk =011222222iiiiiiiiiiixxkxcXcXkcxx故 22122222222*1)var(1)var(iiiiiddxdk因?yàn)?02id所以 )var()var(1*1當(dāng)0id, (ni,2 , 1 )等號(hào)成立,此時(shí):iikc ,*1就是 OLS 估計(jì)量1。同理可證明 )var()var(0*0Sampling distribution of OLS estimator 1 and alternative estimator *111*11)()( EE1*14 4、結(jié)論、結(jié)論 普通最小二

42、乘估計(jì)量具有線性性、無偏性、最小普通最小二乘估計(jì)量具有線性性、無偏性、最小方差性等優(yōu)良性質(zhì)。方差性等優(yōu)良性質(zhì)。 具有這些優(yōu)良性質(zhì)的估計(jì)量又稱為具有這些優(yōu)良性質(zhì)的估計(jì)量又稱為最佳線性無偏最佳線性無偏估計(jì)量估計(jì)量,即,即BLUE估計(jì)量估計(jì)量(the Best Linear Unbiased Estimators)。)。 顯然這些優(yōu)良的性質(zhì)依賴于對(duì)模型的基本假設(shè)。顯然這些優(yōu)良的性質(zhì)依賴于對(duì)模型的基本假設(shè)。 全部估計(jì)量 線性無偏估計(jì)量 BLUE估計(jì)量 五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)項(xiàng)方差的估計(jì) 1、參參數(shù)數(shù)估估計(jì)計(jì)量量0和和1的的概概率率分分布布 ),

43、(2211ixN),(22200iixnXN2. 隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng) 的方差的方差 2的估計(jì)的估計(jì)2又稱為總體方差總體方差。 由于隨機(jī)項(xiàng) i不可觀測,只能從 i的估計(jì)殘差ei出發(fā),對(duì)總體方差進(jìn)行估計(jì)。 可以證明可以證明, 2的最小二乘估計(jì)量最小二乘估計(jì)量為222nei它是關(guān)于2的無偏估計(jì)量。 在隨機(jī)誤差項(xiàng)的方差2估計(jì)出后,參數(shù)0和1的方方差差和標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差的估計(jì)量分別是: 1的樣本方差: 2221ixS 1的樣本標(biāo)準(zhǔn)差: 21ixS 0的樣本方差: 22220iixnXS 0的樣本標(biāo)準(zhǔn)差: 220iixnXS 2.3 2.3 雙變量線性回歸模型的統(tǒng)計(jì)檢驗(yàn)雙變量線性回歸模型的統(tǒng)計(jì)檢驗(yàn) 一、擬合

44、優(yōu)度檢驗(yàn)一、擬合優(yōu)度檢驗(yàn) 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 如果Yi=i 即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好擬合最好。 對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:TSS=ESS+RSS22)(YYyTSSii記22)(YYyESSii22)(iiiYYeRSS總體平方和總體平方和(Total Sum of Squares)回歸平方和回歸平方和(Explained Sum of Squares)殘差平方和殘差平方和(Residual Sum of Squares )iY 總變差i(Y -Y )SRFi(Y -Y ) 來

45、自回歸ie來自殘差iXY變差分解的圖示變差分解的圖示YX Y的觀測值圍繞其均值的總離差的觀測值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自回可分解為兩部分:一部分來自回歸線歸線(ESS),另一部分則來自隨機(jī)勢(shì)力,另一部分則來自隨機(jī)勢(shì)力(RSS)。v在給定樣本中,TSS不變,v如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此v擬合優(yōu)度:回歸平方和擬合優(yōu)度:回歸平方和ESS/Y的總離差的總離差TSSTSSRSSTSSESSR1記22、判定系數(shù)、判定系數(shù)R2 2統(tǒng)計(jì)量統(tǒng)計(jì)量 稱 R2 為(樣本)(樣本)判定系數(shù)判定系數(shù)/可決系數(shù)可決系數(shù)(coef

46、ficient of determination)。 判定系數(shù)判定系數(shù)的取值范圍取值范圍:0,1 R2 2越接近越接近1 1,說明實(shí)際觀測點(diǎn)離樣本線越近,說明實(shí)際觀測點(diǎn)離樣本線越近,擬合優(yōu)度越高擬合優(yōu)度越高。在實(shí)際計(jì)算可決系數(shù)時(shí),在1已經(jīng)估計(jì)出后: 22212iiyxR 在例2.1.1的收入消費(fèi)支出收入消費(fèi)支出例中, 9766. 045900207425000)777. 0(222212iiyxR 注:判定系數(shù)注:判定系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)判定系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在以后進(jìn)行。 R2的其他表示方法221121()niiniixRy2212211

47、()()()niiinniiiix yRxy2212211()()()niiinniiiiy yRyy22121niiniiyRy擬合優(yōu)度(或稱判定系數(shù)、決定系數(shù))v判定系數(shù)只是說明列入模型的所有解釋變量對(duì)應(yīng)變量的聯(lián)合的影響程度,不說明模型中單個(gè)解釋變量的影響程度。v對(duì)時(shí)間序列數(shù)據(jù),判定系數(shù)達(dá)到0.9以上是很平常的;但是,對(duì)截面數(shù)據(jù)而言,能夠有0.5就不錯(cuò)了。判定系數(shù)達(dá)到多少為宜?v沒有一個(gè)統(tǒng)一的明確界限值;v若建模的目的是預(yù)測應(yīng)變量值,一般需考慮有較高的判定系數(shù)。v若建模的目的是結(jié)構(gòu)分析,就不能只追求高的判定系數(shù),而是要得到總體回歸系數(shù)的可信任的估計(jì)量。判定系數(shù)高并不一定每個(gè)回歸系數(shù)都可信任

48、; 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 回歸分析回歸分析是要判斷解釋變量解釋變量X是否是被解釋變被解釋變量量Y的一個(gè)顯著性的影響因素。 在雙變量線性模型雙變量線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯變量的顯著性檢驗(yàn)。著性檢驗(yàn)。 變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的學(xué)中的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)。 計(jì)量經(jīng)濟(jì)學(xué)中計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。是否為零來進(jìn)行顯著性檢驗(yàn)的。 1、假設(shè)檢驗(yàn)、假設(shè)檢驗(yàn) v 所謂假設(shè)檢驗(yàn)假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)

49、假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。 例例1:某車間用一臺(tái)包裝機(jī)裝箱某車間用一臺(tái)包裝機(jī)裝箱,額定標(biāo)準(zhǔn)為每箱額定標(biāo)準(zhǔn)為每箱重重100kg,設(shè)每箱重量服從正態(tài)分布設(shè)每箱重量服從正態(tài)分布,且且=1.15,=1.15,某某日開工后日開工后, ,隨機(jī)抽取隨機(jī)抽取1010箱箱, ,測得重量為測得重量為(kg):(kg):9 .1008 .998 .1002 .1027 .986 .991 .1015 .1019 .983 .99試在水平試在水平=0.05下,檢驗(yàn)假設(shè)下,檢驗(yàn)假設(shè)是否成立是否成立?100:00 H96.1025.02

50、 ZZ nxu)(0 結(jié)論:接受結(jié)論:接受H0代入樣本值計(jì)算統(tǒng)計(jì)量代入樣本值計(jì)算統(tǒng)計(jì)量U的值的值u即認(rèn)為在水平即認(rèn)為在水平=0.05下,包裝機(jī)工作正常。下,包裝機(jī)工作正常。.)(0_作作為為檢檢驗(yàn)驗(yàn)統(tǒng)統(tǒng)計(jì)計(jì)量量解解:取取 nXU 對(duì)給定的水平對(duì)給定的水平=0.05,查表知:查表知:15.110)10027.100( )27.100(,96.174.0_ xv假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法反證法 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。v判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的:我們知道,假設(shè)檢驗(yàn)就是先對(duì)總體的未知參數(shù)我們

51、知道,假設(shè)檢驗(yàn)就是先對(duì)總體的未知參數(shù)提出某種假設(shè)提出某種假設(shè)H0,然后再根據(jù)小概率事件是否發(fā),然后再根據(jù)小概率事件是否發(fā)生作出拒絕假設(shè)生作出拒絕假設(shè)H0 或是接受假設(shè)或是接受假設(shè)H0 的。的。棄真錯(cuò)誤棄真錯(cuò)誤的概率的概率即為小概率事件發(fā)生的概率。即為小概率事件發(fā)生的概率。 我們把只關(guān)心犯第一類錯(cuò)誤而不考慮犯第二類我們把只關(guān)心犯第一類錯(cuò)誤而不考慮犯第二類錯(cuò)誤的檢驗(yàn)稱為顯著性檢驗(yàn)。錯(cuò)誤的檢驗(yàn)稱為顯著性檢驗(yàn)。小概率事件發(fā)生的小概率事件發(fā)生的概率概率稱為顯著性檢驗(yàn)水平。稱為顯著性檢驗(yàn)水平。下面我們學(xué)習(xí)具體的假設(shè)檢驗(yàn)方法下面我們學(xué)習(xí)具體的假設(shè)檢驗(yàn)方法復(fù)復(fù)習(xí)習(xí)0 : = 0 ( 0為已知)為已知) 是否成

52、立是否成立),(),(20200nNXNXH 從從而而則則成成立立,若若)1,0()(0_NnUX 取取注:尋求一個(gè)含有注:尋求一個(gè)含有(當(dāng)當(dāng)H0為真時(shí),不含任何未知參數(shù)為真時(shí),不含任何未知參數(shù))且且分布已知的檢驗(yàn)統(tǒng)計(jì)量分布已知的檢驗(yàn)統(tǒng)計(jì)量U.作為檢驗(yàn)統(tǒng)計(jì)量。作為檢驗(yàn)統(tǒng)計(jì)量。X樣樣本本均均值值是是 的一個(gè)無偏估計(jì)量,的一個(gè)無偏估計(jì)量,解:解:考慮到考慮到一、方差一、方差2已知時(shí),對(duì)總體均值已知時(shí),對(duì)總體均值的假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)、方差、方差2已知時(shí),在水平已知時(shí),在水平下,檢驗(yàn)假設(shè)下,檢驗(yàn)假設(shè) 對(duì)給定的檢驗(yàn)水平對(duì)給定的檢驗(yàn)水平,由,由標(biāo)準(zhǔn)正態(tài)分布上標(biāo)準(zhǔn)正態(tài)分布上分位點(diǎn)的定分位點(diǎn)的定義可知:義可知

53、:)(2ZUP為臨界點(diǎn)。為臨界點(diǎn)。2Z2ZH0的的拒絕域”“2 ZU 由于由于很小,故事件很小,故事件是小概率事件。是小概率事件。能發(fā)生的能發(fā)生的.如果發(fā)生了,我們就認(rèn)為是不合理的,從而如果發(fā)生了,我們就認(rèn)為是不合理的,從而”“2 ZU 拒絕假設(shè)拒絕假設(shè)H0 ,因而我們因而我們把由事件把由事件所確定的所確定的2 Z區(qū)域區(qū)域W稱為稱為H0的拒絕的拒絕 域,其余的便是接受域,稱域,其余的便是接受域,稱由實(shí)際推斷原則,小概率事件在一次試驗(yàn)中幾乎是不可由實(shí)際推斷原則,小概率事件在一次試驗(yàn)中幾乎是不可以上方法稱為以上方法稱為U檢驗(yàn)法。檢驗(yàn)法。代入樣本值計(jì)算統(tǒng)計(jì)量代入樣本值計(jì)算統(tǒng)計(jì)量U的值的值u,當(dāng),當(dāng)u

54、落入拒絕域落入拒絕域時(shí),則拒絕時(shí),則拒絕H0 。時(shí)時(shí),當(dāng)當(dāng)2 Zu 就拒絕就拒絕H0;時(shí)時(shí),當(dāng)當(dāng)2 Zu 就接受就接受H0;小結(jié):小結(jié):U U檢驗(yàn)法的一般步驟檢驗(yàn)法的一般步驟(1 1)提出假設(shè))提出假設(shè)H0: = 0H1: 0(2)選定檢驗(yàn)統(tǒng)量:)選定檢驗(yàn)統(tǒng)量: nXU)(0 )(2ZUP(4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀察值)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀察值u(5)下結(jié)論)下結(jié)論時(shí)時(shí),當(dāng)當(dāng)2 Zu 接受接受H0時(shí)時(shí),當(dāng)當(dāng)2 Zu 拒絕拒絕H0(3)對(duì)給定的顯著水平)對(duì)給定的顯著水平,確定臨界值點(diǎn)確定臨界值點(diǎn) ,使,使2 Z 例例1:某車間用一臺(tái)包裝機(jī)裝箱某車間用一臺(tái)包裝機(jī)裝箱,額定標(biāo)準(zhǔn)為每箱額定標(biāo)準(zhǔn)為每箱重重1

55、00kg,設(shè)每箱重量服從正態(tài)分布設(shè)每箱重量服從正態(tài)分布,且且=1.15,=1.15,某某日開工后日開工后, ,隨機(jī)抽取隨機(jī)抽取1010箱箱, ,測得重量為測得重量為(kg):(kg):9 .1008 .998 .1002 .1027 .986 .991 .1015 .1019 .983 .99試在水平試在水平=0.05下,檢驗(yàn)假設(shè)下,檢驗(yàn)假設(shè)是否成立是否成立?100:00 H96.1025.02 ZZ nxu)(0 結(jié)論:接受結(jié)論:接受H0代入樣本值計(jì)算統(tǒng)計(jì)量代入樣本值計(jì)算統(tǒng)計(jì)量U的值的值u即認(rèn)為在水平即認(rèn)為在水平=0.05下,包裝機(jī)工作正常。下,包裝機(jī)工作正常。.)(0_作作為為檢檢驗(yàn)驗(yàn)統(tǒng)統(tǒng)

56、計(jì)計(jì)量量解解:取取 nXU 對(duì)給定的水平對(duì)給定的水平=0.05,查表知:查表知:15.110)10027.100( )27.100(,96.174.0_ x小結(jié):求解具體檢驗(yàn)題目的一般步驟小結(jié):求解具體檢驗(yàn)題目的一般步驟(1 1)提出假設(shè))提出假設(shè)(2)選定檢驗(yàn)統(tǒng)量)選定檢驗(yàn)統(tǒng)量(3)確定臨界點(diǎn))確定臨界點(diǎn)(4)代入樣本值計(jì)算統(tǒng)計(jì)量的值)代入樣本值計(jì)算統(tǒng)計(jì)量的值(5)下結(jié)論)下結(jié)論 )(ZUPZ1- 接受域拒絕域2、方差、方差2已知時(shí),在水平已知時(shí),在水平下,檢驗(yàn)假設(shè)下,檢驗(yàn)假設(shè)對(duì)給定的檢驗(yàn)水平對(duì)給定的檢驗(yàn)水平,求臨界點(diǎn),求臨界點(diǎn)Z使使H0 : = 0 H1 : 0哪一個(gè)成立。哪一個(gè)成立。代入

57、樣本值計(jì)算統(tǒng)計(jì)量代入樣本值計(jì)算統(tǒng)計(jì)量U的值的值u接受接受H0 .時(shí),時(shí),當(dāng)當(dāng) Zu 時(shí),時(shí),當(dāng)當(dāng) Z 拒絕拒絕H0;解:解:與第與第1種情況類似種情況類似, nXU)(0 取取作為檢驗(yàn)統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量.例例2 某工廠產(chǎn)品壽命某工廠產(chǎn)品壽命XN( , 2),正常情況下正常情況下 0=40, 0=2,25.41 x設(shè)技術(shù)革新后方差不變?cè)O(shè)技術(shù)革新后方差不變,問革新后產(chǎn)品質(zhì)量較以前是問革新后產(chǎn)品質(zhì)量較以前是否顯著提高否顯著提高?( =0.05)H0 : = 0=40 H1 : u0= 40 哪一個(gè)成立哪一個(gè)成立對(duì)給定的水平對(duì)給定的水平 =0.05,查表知:,查表知:Z0.05=1.645125.

58、3225)4025.41( U1.645拒絕拒絕H0,接受接受H1,即在水平即在水平= 0.05下下,認(rèn)為革新后的質(zhì)量有顯認(rèn)為革新后的質(zhì)量有顯著提高著提高.代入樣本值計(jì)算統(tǒng)計(jì)量的值代入樣本值計(jì)算統(tǒng)計(jì)量的值技術(shù)革新后技術(shù)革新后,隨機(jī)抽取隨機(jī)抽取25只只,測得壽命均值測得壽命均值分析分析: 質(zhì)量顯著提高的含義是壽命均值質(zhì)量顯著提高的含義是壽命均值40. 解解:這個(gè)問題即在水平這個(gè)問題即在水平 =0.05下下,檢驗(yàn)假設(shè)檢驗(yàn)假設(shè) nXU)(0 取取作為檢驗(yàn)統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量. ZUPH0 : = 0 H1 : 0 H0 : = 0 H1 : 0 H0 : = 0 H1 : 0 假設(shè)提法假設(shè)提法檢驗(yàn)統(tǒng)

59、計(jì)量檢驗(yàn)統(tǒng)計(jì)量).1()(0 ntSnXT )1()1();1(2 ntTntTntT 拒絕域拒絕域此方法稱為此方法稱為T檢驗(yàn)法檢驗(yàn)法參看參看P143表表t-t例例1 在正常情況下在正常情況下,某工廠生產(chǎn)的燈泡的壽命某工廠生產(chǎn)的燈泡的壽命X服從正態(tài)服從正態(tài)分布分布,今測得今測得10個(gè)燈泡壽命為個(gè)燈泡壽命為:1490 1440 1680 1610 1500 1750 1550 1420 1800 1580 。問能否認(rèn)為該工廠生產(chǎn)的燈泡壽命。問能否認(rèn)為該工廠生產(chǎn)的燈泡壽命 0=1600( =0.05)? (注:此題是第注:此題是第141頁例頁例3)H0 : = 0=1600 是否成立是否成立由由t

60、分布表查得分布表查得t0.025(9)=2.262snXT)(0 對(duì)給定的水平對(duì)給定的水平 =0.05,解解: 此題為在水平此題為在水平 =0.05下檢驗(yàn)假設(shè)下檢驗(yàn)假設(shè) 由于方差未知由于方差未知,所以我們選所以我們選作為檢驗(yàn)統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量.即認(rèn)為該工廠生產(chǎn)的燈泡壽命即認(rèn)為該工廠生產(chǎn)的燈泡壽命為為 = 1600小時(shí)小時(shí). 在水平在水平 =0.05下下,由樣本算得由樣本算得:129;1582 sx 262.2944.02 t接受接受H0.代入樣本值計(jì)算統(tǒng)計(jì)量代入樣本值計(jì)算統(tǒng)計(jì)量t的值的值snxt)(0_ 12910)16001582( 三、方差三、方差2的假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)假設(shè)的提法假設(shè)的提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論