古扎拉蒂《計量經(jīng)濟學基礎》(第5版)筆記和課后習題詳解_第1頁
古扎拉蒂《計量經(jīng)濟學基礎》(第5版)筆記和課后習題詳解_第2頁
古扎拉蒂《計量經(jīng)濟學基礎》(第5版)筆記和課后習題詳解_第3頁
古扎拉蒂《計量經(jīng)濟學基礎》(第5版)筆記和課后習題詳解_第4頁
古扎拉蒂《計量經(jīng)濟學基礎》(第5版)筆記和課后習題詳解_第5頁
已閱讀5頁,還剩396頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

word文檔可自由復制編輯引言0.1復習筆記一、計量經(jīng)濟學1.定義計量經(jīng)濟學,是對經(jīng)濟學的作用存在某種期待的結果,它把數(shù)理統(tǒng)計學應用于經(jīng)濟數(shù)據(jù),以使數(shù)理經(jīng)濟學構造出來的模型得到經(jīng)驗上的支持,并獲得數(shù)值結果。計量經(jīng)濟學可定義為實際經(jīng)濟現(xiàn)象的數(shù)量分析。這種分析基于理論與觀測的并行發(fā)展,而理論與觀測又通過適當?shù)耐茢喾椒ǖ靡月?lián)系。計量經(jīng)濟學可定義為這樣的社會科學:它把經(jīng)濟理論、數(shù)學和統(tǒng)計推斷作為工具,應用于經(jīng)濟現(xiàn)象的分析。2.研究對象和研究方法計量經(jīng)濟學研究經(jīng)濟定律的經(jīng)驗判定。計量經(jīng)濟學家的藝術,就在于找出一組足夠具體且足夠現(xiàn)實的假定,使他盡可能最好地利用他所獲得的數(shù)據(jù)。計量經(jīng)濟學的研究方法是,利用統(tǒng)計推斷的理論和技術作為橋頭堡,以達到經(jīng)濟理論和實際測算相銜接的目的。二、計量經(jīng)濟學是一門單獨的學科計量經(jīng)濟學值得作為一門獨立的學科來研究,理由如下:1.經(jīng)濟理論所作的陳述或假說大多數(shù)是定性的。計量經(jīng)濟學家的工作就是要提供這一數(shù)值估計。換言之,計量經(jīng)濟學對大多數(shù)的經(jīng)濟理論賦予經(jīng)驗內(nèi)容。2.數(shù)理經(jīng)濟學的主要問題,是要用數(shù)學形式(方程式)來表述經(jīng)濟理論,而不管該理論是否可以量化或是否能夠得到實證支持。計量經(jīng)濟學家常常使用數(shù)理經(jīng)濟學家所提供的數(shù)學方程式,但要把這些方程式改造成適合于經(jīng)驗檢驗的形式。這種從數(shù)學方程到計量經(jīng)濟方程的轉換需要有許多的創(chuàng)造性和實際技巧。3.經(jīng)濟統(tǒng)計學的問題,主要是收集、加工并通過圖表的形式來展現(xiàn)經(jīng)濟數(shù)據(jù)。但是,經(jīng)濟統(tǒng)計學家不考慮怎樣利用所收集來的數(shù)據(jù)去檢驗經(jīng)濟理論。三、計量經(jīng)濟學方法論大致說來,傳統(tǒng)的計量經(jīng)濟學方法論按如下路線進行:1.理論或假說的陳述;2.理論的數(shù)學模型設定;3.統(tǒng)計或計量經(jīng)濟模型設定;4.獲取數(shù)據(jù);5.計量經(jīng)濟模型的參數(shù)估計;6.假設檢驗;7.預報或預測;8.利用模型進行控制或制定政策。四、計量經(jīng)濟學的類型計量經(jīng)濟學可劃分為兩大類:理論計量經(jīng)濟學(theoreticaleconometrics)和應用計量經(jīng)濟學(appliedeconometrics)。在每一大類中均可按經(jīng)典方法(classical)或貝葉斯方法(Bayesian)進行研究。理論計量經(jīng)濟學是要找出適當?shù)姆椒?,去測度由計量經(jīng)濟模型設定的經(jīng)濟關系。為此,計量經(jīng)濟學家非常依賴于數(shù)理統(tǒng)計。在應用計量經(jīng)濟學中,利用理論計量經(jīng)濟學工具去研究經(jīng)濟學或管理學中的某些特殊領域。0.2課后習題詳解本章沒有課后習題。本章是全書的一個引言,對計量經(jīng)濟學這門學科作一個簡要介紹。對于本章內(nèi)容,學員簡單了解即可。

第1篇單方程回歸模型第1章回歸分析的性質(zhì)1.1復習筆記一、回歸的現(xiàn)代含義回歸分析是關于研究一個因變量對另一個或多個解釋變量的依賴關系,其用意在于通過后者(在重復抽樣中)的已知或設定值,去估計和(或)預測前者的(總體)均值。二、統(tǒng)計關系與確定性關系在回歸分析中,考慮統(tǒng)計依賴關系,主要處理的是隨機變量,也就是有著概率分布的變量。但是在函數(shù)或確定性依賴關系中,要處理的變量不是隨機的。三、回歸與因果關系從邏輯上說,回歸得到的統(tǒng)計關系式本身不可能意味著任何因果關系??系聽柡退箞D亞特認為,一個統(tǒng)計關系式永遠不能確立因果方面的聯(lián)系:對因果關系的理念,必須來自統(tǒng)計學以外的某種理論。四、回歸與相關1.相關分析與相關系數(shù)相關分析是以測度兩個變量之間的線性關聯(lián)程度為其主要目的。相關系數(shù)是用來測度線性關聯(lián)強度的。2.回歸分析與相關分析的區(qū)別回歸分析中,對因變量和解釋變量的處理方法存在著不對稱性。因變量被當作是統(tǒng)計的、隨機的,也就是它有一個概率分布。而解釋變量則被看作是(在重復抽樣中)取固定值的。相關分析中,任何(兩個)變量的處理方法都是對稱的;因變量和解釋變量之間不加區(qū)別;兩個變量都被看作是隨機的。五、術語與符號1.術語一個有代表性的清單如圖1-1所示:圖1-12.雙變量回歸分析與多元回歸分析雙變量回歸分析研究一個變量對僅僅一個解釋變量的依賴關系。多元回歸分析研究一個變量對多于一個解釋變量的依賴關系。六、經(jīng)濟分析所用數(shù)據(jù)的性質(zhì)與來源1.數(shù)據(jù)類型(1)時間序列數(shù)據(jù):一個時間序列是對一個變量在不同時間取值的一組觀測結果。如果一個時間序列的均值和方差不隨時間而系統(tǒng)地變化,那它就是平穩(wěn)的。(2)橫截面數(shù)據(jù):橫截面數(shù)據(jù)指對一個或多個變量在同一時間點上收集的數(shù)據(jù)。當統(tǒng)計分析包含有異質(zhì)的單位時,必須考慮尺度或規(guī)模效應以避免造成混亂。(3)混合數(shù)據(jù):在混合或組合數(shù)據(jù)中兼有時間序列和橫截面數(shù)據(jù)的成分。面板、縱列或微觀面板數(shù)據(jù)是混合數(shù)據(jù)的一種特殊類型,指對相同的橫截面單位在時間軸上進行跟蹤調(diào)查的數(shù)據(jù)。如果每個橫截面單位都具有相同的觀測次數(shù),則是平衡面板;若觀測次數(shù)不同,則是非平衡面板。2.數(shù)據(jù)來源(1)互聯(lián)網(wǎng)?;ヂ?lián)網(wǎng)使數(shù)據(jù)搜集發(fā)生了革命性的變化。(2)實驗或非實驗性質(zhì)的數(shù)據(jù)。在社會科學中,人們通常獲得的數(shù)據(jù)是非實驗性質(zhì)的。3.數(shù)據(jù)的準確性數(shù)據(jù)的質(zhì)量常常不那么好的原因:(1)大部分社會科學數(shù)據(jù)是非實驗性質(zhì)的,有觀測誤差的可能;也可能出于疏漏,或出于委托。(2)即使是實驗得來的數(shù)據(jù),測量誤差可由近似計算或進位而產(chǎn)生。(3)在問卷調(diào)查中,無應答的問題也可能相當嚴重。(4)獲取數(shù)據(jù)的抽樣方法可能變化很大,要比較不同樣本得來的結果常常非常困難。(5)通常獲得的經(jīng)濟數(shù)據(jù)都是高度加總的。(6)由于保密性質(zhì),某些數(shù)據(jù)只能以高度加總的形式公布。研究結果不可能比數(shù)據(jù)的質(zhì)量更好。所以,如果在一定情況下,研究者發(fā)現(xiàn)研究的結果“不能令人滿意”的話,原因不一定是誤用模型,而是數(shù)據(jù)的質(zhì)量不好。七、對變量測量尺度的注解1.比率尺度對于一個變量,取其兩個值和,比率和距離都是有意義的量。這些值在這種尺度下存在著一種自然順序(上升或下降)。大多數(shù)經(jīng)濟變量都屬于這一類。2.區(qū)間尺度一個區(qū)間尺度變量滿足比率尺度變量的后面兩個性質(zhì),但不滿足第一個性質(zhì)。3.序數(shù)尺度只要一個變量滿足比率尺度的第三個性質(zhì)(即自然順序),那它就屬于這一類變量。4.名義尺度此類變量不具備比率尺度變量的任何一個特征。因此適合于比率尺度變量的計量經(jīng)濟方法可能不適合于名義尺度變量。1.2課后習題詳解1.表1-1給出了7個工業(yè)化國家的消費者價格指數(shù)(CPI)數(shù)據(jù),以1982~1984年為該指數(shù)的基期并令1982—1984=100。表1-11980~2005年間7個工業(yè)化國家的CPI(1982—1984=100)資料來源:EconomicReportofthePresident,2007,Tablel08,P.354.a(chǎn).利用所給數(shù)據(jù)計算每個國家的通貨膨脹率。b.繪制每個國家的通貨膨脹率相對時間的描點圖(即以時間為橫軸,并以通貨膨脹率為縱軸)。c.你從這7個國家的通貨膨脹經(jīng)歷中能得出什么寬泛的結論?d.哪個國家的通貨膨脹率波動最大?你能給出什么樣的解釋呢?答:a.通貨膨脹率等于當年的CPI減去上一年度的CPI,再除以上一年度的CPI,然后乘以100。因此這些國家的通貨膨脹率(%)如表1-2所示,它們是從1981年開始的年度數(shù)據(jù)。表1-2年份美國加拿大日本法國德國意大利英國198110.3212.484.8413.286.3419.3011.9719826.1610.862.9411.975.3116.318.5319833.215.801.739.493.3014.944.6119844.324.282.307.672.3910.625.0119853.564.112.065.832.048.616.0119861.864.130.672.53-219873.654.320.0094.1819884.144.050.672.731.334.994.9319894.824.952.273.462.736.597.7219905.404.803.153.342.756.129.5319914.215.656.395.8719923.011.541.742.414.995.303.7019932.991.791.282.144.504.251.6019942.560.200.681.602.743.922.4819952.832.16-0.081.781.835.373.3619962.951.590.082.021.503.872.4619972.291.631.841.191.701.753.1219981.560.960.580.650.943.153.4619992.211.71-0.330.520.651.661.5220003.362.74-0.661.681.432.522.9920012.852.55-0.741.651.972.761.7520021.582.25-0.921.941.312.521.6720032.282.78-0.252.081-092.662.9020042.661.860.002.161.692.193.0020053.392.15-0.341.701.921.952.83b.每個國家的通貨膨脹率相對時間的關系如圖1-2所示。圖1-2c.從圖1-2中可以看出,每個國家的通貨膨脹率總體來說是逐年遞減的。d.作為對變動性的一種度量,可以使用標準差。美國、加拿大、日本、法國、德國、意大利和英國的標準差分別是1.81、2.85、1.49、3.40、1.60、4.70和2.65。由此可見,變動最大和最小的國家分別是意大利和日本。2.a(chǎn).利用表1-1,繪制加拿大、法國、德國、意大利、日本和英國的通貨膨脹率相對美國通貨膨脹率的散點圖。b.一般性地評論這6個國家的通貨膨脹率相對美國通貨膨脹率的表現(xiàn)。c.如果你發(fā)現(xiàn)這6個國家的通貨膨脹率與美國的通貨膨脹率同向變化,那是否表明美國的通貨膨脹導致了其他國家的通貨膨脹?為什么?答:a.這六個國家的通貨膨脹率相對于美國的通貨膨脹率的散點圖如圖1-3所示:圖1-3b.如圖1-3所示,這六個國家的通貨膨脹率與美國的通貨膨脹率正相關。c.相關并不意味著因果關系。從邏輯上說,回歸得到的統(tǒng)計關系式本身不可能意味著任何因果關系??系聽柡退箞D亞特認為,一個統(tǒng)計關系式永遠不能確立因果方面的聯(lián)系,對因果關系的理念,必須來自統(tǒng)計學以外的某種理論。3.表1-3給出了9個工業(yè)化國家1985~2006年間的外匯匯率數(shù)據(jù)。除英國外,匯率都定義為一美元兌換外幣的數(shù)量;而英國的匯率定義為一英鎊兌換美元的數(shù)量。a.畫出這些匯率相對時間的散點圖,并評論匯率在給定期間內(nèi)的一般表現(xiàn)。b.如果一美元能買到更多單位的外幣,則稱之為美元升值(appreciate)。相反,如果一美元購買更少的外幣,則稱之為美元貶值(depreciate)。在1985~2006年間,美元的一般表現(xiàn)如何?順便查閱一本宏觀經(jīng)濟學或國際經(jīng)濟學教科書,以探明是哪些因素決定了貨幣的升值或貶值。表1-3九國匯率:1985~2006資料來源:EconomicReportofthePresident,2007,Table13-110,P.356.答:a.把匯率的對數(shù)作為縱軸并把時間作為橫軸進行描點,如圖1-4所示,匯率的波動性很大。比如,在1985年,1美元只能兌換0.257比索,但到了2004年,它能兌換約11.29比索。圖1-4b.圖1-4中,美元既有升值又有貶值。在1985~2006年間,美元以相對高的速度對比索升值,但是對于大多數(shù)其他貨幣,這種關系更緩慢而穩(wěn)定。貨幣升值或貶值的影響因素包括:國際收支狀況、國民收入、通貨膨脹率的高低、貨幣供給、財政收支狀況、利率、各國匯率政策和對市場的干預、投機活動與市場心理預期、政治與突發(fā)因素等。其中,國際收支狀況是決定匯率趨勢的主導因素。一般情況下,國際收支變動決定匯率的中長期走勢。4.教材圖1-5背后的M1貨幣供給數(shù)據(jù)由表1-4給出。你能給出貨幣供給在表中所示時期上升的原因嗎?表1-4經(jīng)季節(jié)調(diào)整的M1供給:1959年1月~1999年7月(單位:十億美元)資料來源:BoardofGovernors,F(xiàn)ederalReserveBank,USA.答:隨著GDP的增加,自然而然就需要更多的貨幣為增加的產(chǎn)出提供資金支持。美國GDP是逐年增加的,因此貨幣供給量也相應地逐年增長。5.假設你要做一個犯罪行為的經(jīng)濟學模型,比方說花在犯罪活動(如非法販賣毒品)的時數(shù)。在做這樣的一個模型時,你要考慮哪些變量?看一下你的模型能否與諾貝爾獎得主加里貝克爾(GaryBeeker)的模型相媲美。答:取得非法活動的收入數(shù)據(jù)并不容易,因此需要考慮的變量包括:(1)犯罪活動的工資或收入;(2)非犯罪活動的小時工資或收入;(3)犯罪被抓住的概率;(4)抓住后被定罪的概率;(5)定罪后預期的判決。6.經(jīng)濟學中的控制試驗:2000年4月7日,克林頓(Clinton)總統(tǒng)簽署了一項參眾兩院通過的法案,取消對社會保障金領取者的收入限制。此前,年齡介于65歲和69歲之間的受濟者年收入超過1.7萬美元者,超出部分的每3美元減少1美元的社會保障救濟金。你如何設計一研究方案來分析這種法律修訂的影響?注:原有法律對70歲以上的受濟者沒有設定收入限制。答:分析中的一個關鍵因素是65~69歲年齡組中那些人的勞動參與率。勞工部搜集了勞動參與率方面的數(shù)據(jù)。在新法律實施以后,如果這些“高齡”公民的勞動參與率提高了,那就明顯表明,原有的法律人為地限制了他們對勞動市場的參與。另外,弄清楚這些工人找到哪些類型的工作以及他們的收入狀況也是有意義的。7.表1-5中的數(shù)據(jù)發(fā)表在1984年3月1日的《華爾街日報》(TheWallStreetJournal上。它將1983年21家企業(yè)的廣告預算(以百萬美元計)與看報者每周對這些企業(yè)產(chǎn)品保留的印象次數(shù)(以百萬次計)相聯(lián)系。這些數(shù)據(jù)基于對4000個成人的調(diào)查,在調(diào)查中要求產(chǎn)品使用者列出一條在過去的一周里見過的該類產(chǎn)品的商業(yè)廣告。a.以印象數(shù)為縱軸、以廣告支出為橫軸畫散點圖。b.你認為這兩個變量之間的關系具有什么樣的性質(zhì)?c.看一下你的圖,你認為值得做廣告嗎?想想那些出現(xiàn)在星期天的超級碗杯賽(SuperBowlSunday)上和世界職業(yè)棒球錦標賽期間的商業(yè)廣告。表1-5廣告支出的影響資料來源:http:///DASL/Datafiles/tvadsdat.html.答:a.散點圖如圖1-5所示。圖1-5b.總體來看廣告支出和看報者每周對這些企業(yè)產(chǎn)品保留的印象次數(shù)還是呈同方向變化的,只是規(guī)律性并不那么明顯,這說明兩個變量之間存在并不是很強的正相關關系。c.由于印象與廣告支出之間存在正相關關系,因此做廣告是值得的;否則,對廣告產(chǎn)業(yè)而言將是一個壞消息。

第2章雙變量回歸分析:一些基本思想2.1復習筆記一、相關概念1.條件期望值(conditionalexpectedvalues)條件期望值或稱為條件均值,取決于變量的給定值,用符號表示為,讀作“給定值下的期望值”。2.無條件期望值3.總體回歸線在幾何意義上,總體回歸曲線就是當解釋變量取給定值時因變量的條件均值或期望值的軌跡。二、總體回歸函數(shù)的概念1.條件期望函數(shù)(conditionalexpectationfunction,CEF)每一條件均值都是的一個函數(shù),其中是的某個給定值,用符號表示:方程被稱為條件期望函數(shù)(CEF)或總體回歸函數(shù)(PRF),或簡稱為總體回歸(PR)。表明在給定下的分布的(總體)均值與有函數(shù)關系。2.線性總體回歸函數(shù)假定總體回歸函數(shù)是的線性函數(shù),其形式是:其中和為未知但卻固定的參數(shù),稱為回歸系數(shù);和也分別稱為截距和斜率系數(shù)。方程本身則稱為線性總體回歸函數(shù),或簡稱線性總體回歸。三、“線性”一詞的含義1.對變量為線性的條件期望值是的線性函數(shù)。從幾何意義上說,這時回歸曲線是一條直線。2.對參數(shù)為線性的條件期望是參數(shù)的一個線性函數(shù);它可以是或不是變量的線性函數(shù)。本書中所有的“線性回歸”總是指對參數(shù)為線性的一種回歸(即參數(shù)只以它的一次方出現(xiàn));解釋變量則可以是或不是線性的。四、PRF的隨機設定1.隨機誤差項個別的圍繞它的期望值的離差為:或者其中離差是一個不可觀測的可正可負的隨機變量,稱為隨機干擾項或隨機誤差項。解釋方程,給定水平,可表示為兩個成分之和:被稱為系統(tǒng)性或確定性成分;為隨機或非系統(tǒng)性成分。2.隨機誤差項的條件均值方程的兩邊取期望,得到:因為,則。五、隨機干擾項的意義不將隨機誤差項清晰地引進模型中的原因:1.理論的含糊性;2.數(shù)據(jù)的欠缺;3.核心變量與周邊變量;4.人類行為的內(nèi)在隨機性;5.糟糕的替代變量;6.節(jié)省原則;7.錯誤的函數(shù)形式。六、樣本回歸函數(shù)1.樣本回歸函數(shù)(SRF)其中的估計量;的估計量;的估計量。所以樣本回歸函數(shù)也可以寫成它的隨機形式:,表示樣本殘差。2.估計量與估計值估計量,又稱(樣本)統(tǒng)計量,是指一個規(guī)則或公式或方法,它告訴人們怎樣用手中樣本所提供的信息去估計總體參數(shù)。由估計量算出的一個具體的數(shù)值,稱為估計值。估計量是隨機的,而估計量算出的一個具體數(shù)值則是非隨機的。3.回歸分析中的主要目的根據(jù)SRF的方程:來估計PRF的方程:。SRF只不過是PRF的一個近似,SRF使得盡可能“接近”真實的,盡可能地“接近”真實的,但真實的和永遠都不知道。

2.2課后習題詳解1.什么是條件期望函數(shù)或總體回歸函數(shù)?答:每一條件均值都是的一個函數(shù),其中是的某個給定值,用符號表示為:方程被稱為條件期望函數(shù)(CEF)或總體回歸函數(shù)(PRF),或簡稱為總體回歸(PR)。表明在給定下,分布的總體均值是如何隨著一個或多個解釋變量的固定值的變化而變化的。2.總體回歸函數(shù)和樣本回歸函數(shù)之間的差別是什么?這是不是人為的區(qū)別?答:樣本回歸函數(shù)與總體回歸函數(shù)的區(qū)別很重要,因為前者是后者的一個估計量。在多數(shù)情況下,所觀測的只是給定總體的一個樣本,并試圖通過給定的樣本對總體作出某種推斷。因此這是人為的區(qū)別。3.回歸分析中的隨機誤差項有什么作用?它與殘差有何區(qū)別?答:一個回歸模型永遠也不可能對現(xiàn)實做出完全準確的描述。因此,回歸子的實際值與從所選擇的模型中估計出來的值之間必定不同。二者之差就簡單地歸納為隨機誤差項。而且構造一個含有盡可能多變量的多元回歸模型也是不現(xiàn)實的,因此隨機誤差項就在回歸模型中扮演著非常重要的角色。殘差是指樣本的隨機誤差項。隨機誤差項()是針對總體回歸函數(shù)而言的,而殘差項()是一隨機變量,是針對樣本回歸函數(shù)而言的。4.我們?yōu)槭裁葱枰貧w分析?我們?yōu)槭裁床缓唵蔚赜没貧w子的均值作為最優(yōu)值?答:通過回歸分析,可以根據(jù)SRF的方程:來估計PRF的方程:。盡管可以使用均值、標準差和其他摘要度量來描述回歸子的行為,但通常情況下,找到影響回歸子的因素更有意義。因為如果找到了這種影響因素,就能更好地預測回歸子的均值。此外,計量模型常常是為了檢驗某個或某些經(jīng)濟理論而提出來的。5.線性回歸模型的含義是什么?答:線性于其參數(shù)的模型;它可能是也可能不是線性于變量的。本書中,線性回歸總是指對參數(shù)為線性的一種回歸,解釋變量可以是或不是線性的。6.判別如下模型是線性于參數(shù)、線性于變量還是同時線性于參數(shù)和變量,哪些模型是線性回歸模型?注:表示自然對數(shù)(即對數(shù)的底為);為隨機干擾項。答:模型a、b、c和e都是線性于參數(shù)的回歸模型。模型c同時也是線性于變量的。如果令,則模型d也是線性于參數(shù)的。7.如下模型是線性回歸模型嗎?為什么?a.b.c.d.e.答:a.通過取自然對數(shù)可得:,該模型成為一個線性回歸模型。b.通過1ogit變換,模型變成一個線性回歸模型:c.線性回歸模型。d.非線性回歸模型。e.因為的冪指數(shù)是3,所以不是線性回歸模型。8.內(nèi)在線性回歸模型的含義是什么?如果習題7d中的為0.8,那它是一個線性回歸模型,還是非線性回歸模型?答:從本質(zhì)上講,一個可以轉換成線性于參數(shù)的模型就是一個線性回歸模型,比如上題中的模型a。如果上一題模型d中的,因為很容易就能計算出來,那它便成為一個線性回歸模型。9.考慮如下非隨機模型(即不含隨機誤差項的模型)。它們是線性回歸模型嗎?若不是,可以通過適當?shù)拇鷶?shù)變換使之轉化為線性模型嗎?a.b.c.答:a.把模型變換成便成為一個線性回歸模型。b.把模型變換成便成為一個線性回歸模型。c.把模型變換成便成為一個線性回歸模型。因此,原來的模型本質(zhì)上都是線性模型。10.圖2-1是一個散點圖及其回歸線。你從此圖能得出什么一般性結論?圖中勾畫出的回歸線是總體回歸線還是樣本回歸線?出口與GNP比率的年度平均變化圖2-11970~1990年間50個發(fā)展中國家的制造業(yè)真實工資增長率與出口數(shù)據(jù)資料來源:TheWorldBank,WorldDevelopmentReport1995,P.55.TheoriginalsourcesUNIDOdata,WorldBankdata.答:散點圖表明,一個國家的出口傾向越強,其真實工資的增長率就越快。這正是許多發(fā)展中國家采用出口導向型增長政策的原因。圖中的回歸線是基于50個發(fā)展中國家的樣本而得到的,因此是一條樣本回歸線。11.你能從圖2-2的散點圖中得出什么一般性結論?其背后有什么經(jīng)濟理論?[提示:查一本國際經(jīng)濟學教科書并閱讀貿(mào)易的赫克歇爾-俄林(Heckscher-Ohlin)模型。]圖2-21985年126個工業(yè)化和發(fā)展中國家的出口與技術密集性和人力資本數(shù)據(jù)注:橫軸數(shù)據(jù)為一個國家平均受教育年數(shù)與其土地面積之比的對數(shù);縱軸為制成品出口與初級產(chǎn)品出口之比的對數(shù)。資料來源:WorldBank,WorldDevelopmentReport1995,P.59.原始資料:出口數(shù)據(jù)摘自美國統(tǒng)計局COMTRADE數(shù)據(jù)庫;受教育數(shù)據(jù)摘自UNDP1990;土地數(shù)據(jù)摘自世界銀行。答:從散點圖中可以看出,技術越密集的國家出口更多的制成品,而勞動越密集的國家出口更多的原材料。根據(jù)著名的赫克歇爾-俄林(Heckscher-Oh1in)貿(mào)易模型,每個國家都傾向于出口那些在生產(chǎn)過程中較密集地使用本國相對豐裕要素的產(chǎn)品。換言之,這個模型強調(diào)了要素稟賦與比較優(yōu)勢之間的關系。12.圖2-3中的散點圖揭示了什么關系?基于此圖,你認為最低工資法有利于經(jīng)濟福利嗎?圖2-3最低工資與人均GNP注:樣本由17個發(fā)展中國家構成。各國數(shù)據(jù)采集的年份從1988年到1992年不等。數(shù)據(jù)以國際價格度量。資料來源:WorldBank,WorldDevelopmentReport1995,P.75.答:該圖表明,最低工資越高,人均GNP就越低,基于圖2-3可知,最低工資法對發(fā)展中國家并非好事,即并不利于經(jīng)濟福利的增加。但這個觀點是有爭議的,最低工資的影響可能取決于它們對就業(yè)的影響、實施最低工資法的產(chǎn)業(yè)的性質(zhì)和政府的實施力度。13.引言中圖I-3所示的回歸線是PRF還是SRF?為什么?你如何解釋回歸線周圍的散點?除GDP外,還會有什么其他的因素或變量決定著個人消費支出?答:由于回歸線是基于15年的觀測樣本而得到的,因此它是一條樣本回歸線(SRF)?;貧w線附近的散點是實際數(shù)據(jù)點。實際消費支出與從回歸線得到的估計值之差代表了(樣本)殘差。除GDP外,諸如財富、利率等因素也可能影響消費支出。14.表2-1給出了美國1980~2006年間的數(shù)據(jù)。a.將城市男性勞動力勞動參與率相對城市男性失業(yè)率描點。目測一條穿過散點的回歸線。推測二者之間的關系,其背后的經(jīng)濟理論是什么?這個散點圖支持該理論嗎?b.對女性重做(a)部分的練習。c.現(xiàn)在同時將男性和女性的勞動參與率相對平均小時工資(以1982年美元度量)描點。(你可以分開畫圖)現(xiàn)在又有何發(fā)現(xiàn)?你又將如何解釋你的發(fā)現(xiàn)?d.你可以將勞動參與率同時對失業(yè)率和平均小時工資描點嗎?若不能,你如何口頭說明這三個變量之間的關系。表2-11980~2006年間美國勞動參與率數(shù)據(jù)注:表中變量的定義及其在文獻中的位置如下:CLFPRM1,城市男性勞動力勞動參與率(%),TableB-39,P.277.CLFPRF2,城市女性勞動力勞動參與率(%),TableB-39,P.277.UNRM3,城市男性失業(yè)率(%),TableB-42,P.280.UNRF4,城市女性失業(yè)率(%),TableB-42,P.280。AHE825,平均小時工資(以1982年美元度量),TableB-47,P.286.AHE6,平均小時工資(以當前價格度量),TableB-47,P.286.資料來源:EconomicReportofthePresident,2007.答:a.散點圖如圖2-4所示:圖2-4這兩個變量之間的負相關關系看起來是合理的。隨著失業(yè)率上升,盡管圖中有幾個小的波峰和波谷,勞動參與率下降了。b.散點圖如圖2-5所示:圖2-5這里勞動經(jīng)濟學中的減工假說(discouragedworkerhypothesis)看來起了作用:失業(yè)挫傷了婦女就業(yè)的積極性,因為她們擔心沒有工作機會。c.男性和女性勞動參與率相對AH82的描點圖如圖2-6所示:圖2-6這兩個變量之間的關系對于男性和女性而言相似,盡管男性勞動參與率總是顯著高于女性,但女性參與率的變化大得多。男性平均參與率是75.4%,而女性只有57.3%;對于變化率,男性參與率的標準差只有1.17%,但是女性的標準差是2.73%,是男性的2倍多。這是簡單二元回歸的結論。當進行多元回歸分析時,可能得到一些不同的結論。d.不能。可采用多元回歸分析模型,將失業(yè)率和平均小時工資作為解釋變量,勞動參與率作為因變量,分別對男性和女性數(shù)據(jù)進行回歸分析。也可以通過將男性、女性的數(shù)據(jù)進行整理,得出整體的失業(yè)率、勞動平均小時工資和勞動參與率的數(shù)據(jù),然后對其進行多元回歸分析,最終得出三者之間的關系。15.表2-2給出的是以盧比度量的食物支出和總支出數(shù)據(jù),樣本是印度的55個農(nóng)戶。(在2000年初,1美元約兌換40盧比。)表2-2食物支出與總支出(單位:盧比)資料來源:ChandanMukherjee,HowardWhite,andMarcWuyts,EconometricsandDataAnalysisforDevelopingCountries,Routledge,NewYork,1998,P.457.a(chǎn).以總支出為橫軸,食物支出為縱軸將數(shù)據(jù)描點,并勾勒出一條穿過散點的回歸線。b.你從此例中能得出什么一般性的結論?c.據(jù)經(jīng)驗,你會預測無論總支出水平如何食物支出總是隨總支出線性地增加嗎?為什么?你可以用總支出作為總收入的一個代理變量。答:a.散點圖和回歸線如圖2-7所示:圖2-7b.隨著總支出的增加,食物支出總體上也在增加。當總支出水平超過2000盧比之后,二者的差異更大。c.不會預測食物支出會永遠線性地(即以直線形式)增加下去。一旦基本需要得到滿足,隨著收入的增加,人們在食物上的支出將相對減少。即收入水平越高,消費者能自由支配的收入也越多。a中的散點圖給出了這方面的某些證據(jù):當收入水平超過2000盧比后,食物支出的波動性更大。16.表2-3給出了1972~2007年間應屆高中畢業(yè)生在SAT中的平均成績數(shù)據(jù)。這些數(shù)據(jù)包括男生和女生在閱讀和數(shù)學方面的成績。2006年才開始要求寫作,所以這些數(shù)據(jù)中不包含寫作成績。表2-31972~2007年應屆高中畢業(yè)生在SAT邏輯部分的分組平均成績注:1972~1986年間用一個公式把原始均值及其標準差轉化成標準分的均值。1987~1995年間,把各個學生的成績轉化成標準分再計算均值。1996~1999年間,幾乎所有學生的成績都是標準分。2000~2007年間,所有成績都是用標準分報告。資料來源:CollegeBoard,2007.a(chǎn).用橫軸代表年度,縱軸代表SAT成績,分別對男生和女生描繪閱讀和數(shù)學成績。b.你從這些圖形中能得出什么一般性的結論?c.知道了男(女)生的閱讀成績,你會怎樣預測相應的數(shù)學成績?d.將女生總的數(shù)學成績對男生的數(shù)學成績描點。你看到了什么?答:a.男生和女生閱讀成績的散點圖如圖2-8所示:圖2-8男生和女生數(shù)學成績的相應描點圖如圖2-9所示:圖2-9b.男生和女生的閱讀成績呈略微的逐年下降的趨勢,盡管在20世紀90年代中期呈現(xiàn)出穩(wěn)定狀態(tài)。然而,數(shù)學分數(shù)呈現(xiàn)出略微的上升趨勢,特別是從20世紀90年代初開始。在兩幅圖中,男生的分數(shù)都普遍高于女生的分數(shù),當然不同年份的差異有所不同。c.可以針對不同性別將數(shù)學成績對閱讀成績進行回歸而得到一個簡單的回歸模型。d.描點圖如圖2-10所示:圖2-10盡管男生的分數(shù)總是高于女生,但兩個性別呈同向變化。17.表2-4根據(jù)家庭收入給出了閱讀、數(shù)學和寫作三項SAT邏輯部分的平均成績。我們在例2.2中給出了圖2-7,即將數(shù)學平均成績對家庭平均收入的描點圖。表2-4根據(jù)家庭收入分組的SAT邏輯部分的平均成績資料來源:CollegeBoard,2007,College-BoundSeniors,Table11.a(chǎn).參照教材圖2-7畫出閱讀平均成績與家庭平均收入之間的類似圖形。將你的結論與教材圖2-7中所示的圖形進行比較。b.再作出寫作平均成績與家庭平均收入之間的圖形,并與上述兩個圖形進行比較。c.根據(jù)這三個圖形,你能得出什么一般性的結論?答:a.男生和女生閱讀成績的散點圖如圖2-11所示:圖2-11這個結果與教材中圖2-7有些類似。平均閱讀成績隨著家庭收入的增加而增加。圖2-12這幅圖與之前的圖2-11幾乎完全一樣,即平均寫作成績隨著家庭收入的增加而增加。c.很明顯,平均家庭收入與SAT分數(shù)之間呈現(xiàn)出一種正相關關系。

第3章雙變量回歸模型:估計問題3.1復習筆記一、普通最小二乘法1.普通最小二乘法的估計思想對于雙變量PRF:PRF是無法直接觀測的,通過SRF去估計:所以:。選擇殘差和盡可能小的SRF,即最小化下式:2.普通最小二乘法的估計方法對于一個給定樣本,最小二乘法提供使得達到最小可能值的和估計值。通過微分法將得到用于估計和的下列方程:其中是樣本容量。這組聯(lián)立方程被稱為正規(guī)方程。解此聯(lián)立方程得:其中和是和的樣本均值,并且定義和,可得:3.最小二乘估計量的數(shù)值性質(zhì)從最小二乘法估得出的估計量稱為最小二乘估計量,即OLS估計量。(1)OLS估計量是純粹由可觀測的(即樣本)量(指和)表達的,因此它們很容易計算;(2)都是點估計量,即對于給定樣本,每個估計量僅提供有關總體參數(shù)的一個(點)值;(3)一旦從樣本數(shù)據(jù)得到0LS估計值,便容易畫出樣本回歸線?;貧w線具有如下性質(zhì):①穿過和的樣本均值點,即;②的估計值()的均值等于實際值的均值();③殘差的均值為零;④殘差和的預測值不相關,即;⑤殘差和不相關,即。二、經(jīng)典線性回歸模型:最小二乘法的基本假定1.假定1:線性回歸模型。回歸模型盡管對變量而言不一定是線性的,但它對于參數(shù)而言是線性的,也就是說,回歸模型如方程所示。2.假定2:值是固定的或獨立于誤差項,即。最初假定變量非隨機的原因:(1)為了簡化分析,并引導讀者逐步深入地理解回歸分析的內(nèi)容。(2)在實驗環(huán)境中,值固定不變的假定可能是不太現(xiàn)實的。(3)在一定的條件下,即使是隨機的,基于固定回歸元的線性回歸的統(tǒng)計結果也是可靠的。3.假定3:干擾項的均值為零,即。假定3是所選回歸模型中不存在設定誤差的另一種表述。該假定意味著經(jīng)驗分析所用的模型中不存在設定偏誤或設定誤差。如果在給定一個隨機變量的情況下另一個隨機變量的條件均值為0,那么這兩個變量之間的協(xié)方差就是0,因而這兩個變量是無關的。4.假定4:同方差性或的方差相等。異方差性是指總體的條件方差隨而變化。假定4意味著的條件方差也是同方差的,即。5.假定5:各個干擾項之間無自相關。給定任意兩個值,和之間的相關系數(shù)為零。用符號表示:若是非隨機的,。6.假定6:觀測次數(shù)必須大于待估計的參數(shù)個數(shù)。7.假定7:變量的性質(zhì)。(1)在一個給定的樣本中,值不可以全部相同。是有限的正數(shù)。如果全部相同,則無法估計經(jīng)驗方差的參數(shù)。(2)變量的取值沒有異常,即沒有一個值相對其余觀測而言過大或過小,這是為了避免回歸結果受到這種異常觀測的支配。三、最小二乘估計的精度或標準誤1.OLS估計量的標準誤由如下公式來估計:其中是真正的但未知的的OLS估計量,而表達式被稱為自由度。表示殘差平方和。被稱為估計值的標準誤或回歸標準誤。它無非就是值圍繞估計回歸線波動的標準差,并常用于衡量所估計的回歸線的“擬合優(yōu)度”。2.和的方差的特點(1)的方差與成正比,而與成反比。(2)的方差與和成正比,而與和樣本容量成反比。(3)由于和是估計量,所以它們不僅隨著樣本的變化而變化,而且對于一個給定樣本,它們還可能是互相依賴的。這種依賴性將由它們之間的協(xié)方差來衡量。如果斜率系數(shù)被過高估計,則截距系數(shù)將被過低估計。四、最小二乘估計量的性質(zhì):高斯-馬爾可夫定理1.最小二乘估計量的統(tǒng)計性質(zhì)(1)線性的。它是諸如回歸模型中的因變量這種隨機變量的線性函數(shù)。(2)無偏的。均值或期望值等于真值。(3)有效的。最小二乘估計量是有最小方差的無偏估計量。2.高斯-馬爾可夫定理在給定經(jīng)典線性回歸模型的假定下,最小二乘估計量在所有線性無偏估計量中具有最小方差,也就是說,它們是最優(yōu)線性無偏估計量,即BLUE估計量。五、判定系數(shù):“擬合優(yōu)度”的一個度量1.判定系數(shù)的計算和定義回歸方程的離差形式為:。兩邊平方并對樣本求和,可得:因此可得:,其中總平方和():,即實際值圍繞其均值的總變異。解釋平方和():,即估計的值圍繞其均值的變異。殘差平方和():,即估計的值圍繞回歸線的變異未被解釋的部分或殘差部分。如圖3-1所示。圖3-1的變異分解為兩部分判定系數(shù)為:或者寫成另一種形式:測度了在的總變異中由回歸模型解釋的那個部分所占的比例或百分比。2.判定系數(shù)的兩個性質(zhì)(1)它是一個非負量;(2)它的界限為。3.相關系數(shù)(1)相關系數(shù)的作用:用來測量兩個變量之間的關聯(lián)度。(2)樣本相關系數(shù)的計算方法:(3)相關系數(shù)的性質(zhì):①可正可負;②落在極限和之間;③具有對稱性,即;④與原點和尺度都無關;⑤如果與統(tǒng)計上獨立,則它們之間的相關系數(shù)為零,但零相關并不意味著獨立性;⑥僅是線性關聯(lián)或線性相依的一個度量,不能用于描述非線性關系;⑦雖然是兩個變量之間線性關聯(lián)的一個度量,卻不一定有因果關系的含義。還可用實際值與的估計值之間的相關系數(shù)的平方來計算,即為:3.2課后習題詳解1.給定下表第(1)列中的假定,證明第(2)列中的假定與之等價。關于經(jīng)典模型的假定(1)(2)證明:(1),,為常數(shù)而是非隨機的,因此:(2)假定對所有的,都有,且隨機誤差項的均值為0,于是:(3)給定,于是根據(jù)假定有:2.證明教材表3-1的第1個實驗所用的估計值和事實上是0LS估計量。證明:如表3-1所示。表3-141-3-39954-2000750101126521042816001914其中,因此最小二乘估計量為:,。3.按照馬林伍得(Malinvaud)(參看3.2節(jié)假設3中的注釋)的意見,假設是相當重要的。為了看到這一點,考慮PRE:。現(xiàn)區(qū)分兩種情形:(i),及;和(ii),及。然后在這兩種情形中以為條件求PRF的數(shù)學期望,并看你是否同意馬林伍得的觀點,即假定非常重要。答:PRF是:情形1:,且,從而。情形2:,且,從而,與情形1相同。因此,上述分析表明,盡管在兩種情形中假定的參數(shù)值完全不同,但如果沒有這個假定,所得到的的條件分布可能是一樣的,因此就無法估計參數(shù)。4.考慮樣本回歸:。在如下約束條件下:(i)和(ii),求估計量和,并證明它們無異于方程(3.1.6)和方程(3.1.7)中所給出的最小二乘估計量。這種求估計量的方法叫做類比原理(analogyprinciple)。試述施加約束條件(i)和(ii)的直覺理由。(提示:回顧關于的CLRM假定。)順便指出,估計未知參數(shù)的類比原理又叫做矩法(methodofmoments),即用樣本矩(如樣本均值)去估計總體矩(如總體均值)。如在附錄A中所指出的那樣,矩是概率分布的一個摘要統(tǒng)計量,比如期望和方差。證明:施加第一個約束可得:簡化后即得到教材中第一個正規(guī)方程。施加第二個約束得到:。簡化后即得到教材中第二個正規(guī)方程。第一個約束與假定相對應;第二個約束所對應的假定是,總體誤差項與解釋變量無關,即。因此可知,,,無異于方程(3.1.6)和方程(3.1.5.證明由方程(3.5.5)定義的落在0與1之間。你可以利用柯西-施瓦茨(Cauchy-Schwarz)不等式,即對任意隨機變量和,下列關系式總是成立的:。證明:利用柯西-施瓦茨不等式可知:。相關系數(shù)為:,則,因此。6.令和分別為對回歸和對回歸中的斜率。證明:,其中為與之間的相關系數(shù)。證明:因為,,二者相乘可得:7.假設在習題6中,那么求對的回歸和求對的回歸有什么差別?請解釋。答:盡管,但仍然要研究究竟是對回歸抑或是對回歸的問題(為了澄清理論或因果關系),因為二者之積等于1,這并不等同于。8.斯皮爾曼(Spearman)等級相關系數(shù)的定義如下:其中編排給同一單元或現(xiàn)象的等級差,參與等級編排的單元或現(xiàn)象個數(shù)。試從(3.5.13)中定義的推出。提示:從1到將和編排等級。注意和的等級和為,因而它們的均值都是。答:這兩個(排序)變量的均值是兩個排序之間的相關系數(shù)為:(1)其中,小寫字母和通常一樣表示相對于均值的離差。既然這種排序都是前個自然數(shù)的排列,所以類似地有于是因此(2)由于利用(2)式便得到(3)將上述方程代入(1)式便得到。9.考慮如下雙變量PRF表達式:模型Ⅰ:模型Ⅱ:a.求和的估計量。它們是否相同?它們的方差是否相同?b.求和的估計量,它們是否相同?它們的方差是否相同?C.如果模型Ⅱ比模型Ⅰ好,好在哪里?答:a.因為,所以且(注意:),,,所以這兩個估計量的估計值和方差都不相等。b.因為,所以且,容易驗證,即這兩個斜率估計量的估計值和方差都相等。c.盡管有了高速計算機,對較大的數(shù)字進行計算已不成問題,但當較大時使用模型Ⅱ仍相對簡單一些。10.假設你做了如下回歸:,其中和是它們與其各自均值的離差,問將取何值?為什么?會不會和方程(3.1.6)的一樣?為什么?答:,即數(shù)據(jù)相對其均值的離差之和恒等于0,所以總有。因此,。如果和都用其均值的離差來表示,回歸線將經(jīng)過原點。由于這兩個變量的均值都是0,所以,此即為方程(3.111.令為對()值的相關系數(shù),而為對()值的相關系數(shù),其中,,和為常數(shù)。證明,從而證實相關系數(shù)對度量單位和原點的改變保持不變的性質(zhì)。提示:應用方程(3.5.注:運算,和分別叫做尺度變換、原點變換和尺度與原點同時變換。證明:令和以離差的形式表示,即和。根據(jù)定義有:,即等于方程(3.5.13)中的。因此。12.如果對值的相關系數(shù)是正的,試判斷以下各個命題的對錯:a.之間的可正可負。b.之間以及之間的可正可負。c.斜率系數(shù)和都是正的,其中為對回歸的斜率系數(shù),而為對回歸的斜率系數(shù)。答:a.對。令上一題中的并令即可。b.錯。同樣從上一題可知應該為負。c.對。由于,和(分別表示和的標準差)都為正,而且,,所以和一定都為正。13.如果,和是有同樣方差但互不相關的變量,試證明和之間的相關系數(shù)等于1/2,為什么這個相關系數(shù)不是零?證明:令,以離差的形式表示即,。根據(jù)和之間相關系數(shù)的定義和彼此不相關的假定有(為方便起見,省略掉觀測順序的下標):具有相同的方差,所以。盡管彼此不相關,但其兩兩之和卻可能相關,因此這個相關系數(shù)不等于0。如上所述,意味著和之間的協(xié)方差是一個常數(shù)而不是0。14.假設在回歸中,我們將每個值都乘以2,這會不會改變的殘差及擬合值?為什么?如果我們給每個值都加上一個常數(shù)2,又會怎樣?答:的殘差和擬合值將不會改變。令,其中。使用離差形式可得:,即截距項未受影響。因此,即便變量都乘以2,但的擬合值和殘差卻保持不變。如果將每個都加上一個常數(shù),分析與此類似。15.證明方程(3.提示:應用方程(3.5.13)中所給的定義,并回憶和方程(3.5證明:由于,根據(jù)方程(3.516.判斷以下命題對錯,并給出原因。a.由于兩個變量和之間的相關系數(shù)取值范圍為[-1,1],所以這意味著也在此范圍內(nèi)。b.如果兩個變量之間的相關系數(shù)為零,那就意味著這兩個變量之間不存在相關關系。c.如果你將對回歸(即實際的對估計的回歸),那么截距和斜率的值分別為0和1。答:a.錯。協(xié)方差可取任意值;它取決于度量單位。而相關系數(shù)則沒有度量單位,它是一個純數(shù)字。b.錯。相關系數(shù)是對兩個變量之間線性關系的一種度量。如教材圖3-10(h)所示,和之間存在完美的函數(shù)關系,但這種關系不是線性的。c.對。以離差的形式有,因此如果將對回歸,顯然斜率系數(shù)將為1而截距為0。規(guī)范的證明如下:如果將對回歸,因為在雙變量模型中有和,所以可以得到斜率系數(shù),而這個回歸中的截距項為0。17.不含回歸元的回歸。假如給你一個模型。利用0LS求出的估計量。其方差和是多少?估計的有直覺上的意義嗎?現(xiàn)在考慮雙變量模型。值得在此模型中增加嗎?否則,為什么要進行回歸分析呢?答:(1)把樣本回歸函數(shù)寫成。根據(jù)最小二乘原理,最小化。方差最小化的一階條件為:化簡即得到,即等于樣本均值。樣本均方差為。其中,為樣本容量;為的方差。為,而。(2)值得在此模型中增加。如果向模型中添加變量能顯著地減小才值得這么做。而只要對確有影響,那么引入就會使顯著減小。在雙變量回歸模型中:因此,如果,至少包含一個回歸元的模型與不包含任何回歸元的模型相比,其中要小一些。當然,如果模型中包含更多的回歸元,且其斜率系數(shù)都不等于0,會更小。也就是說,解釋變量能夠比均值更好的預測。18.表3-2給出了10名學生在統(tǒng)計學期中和期末考試中的名次。計算斯皮爾曼等級相關系數(shù)并加以解釋。表3-2答:取兩個排名的差分并將差分加以平方得到表3-3:表3-3d﹣21﹣130﹣1﹣1﹣2124119011414因此,斯皮爾曼的等級相關系數(shù)為:因此,學生的期中排名與期末排名高度相關,期中排名越高,期末排名也越高。19.名義匯率與相對價格之間的關系。根據(jù)1985~2005年的年度觀測,可得到如下回歸結果:,。其中表示加元與美元的匯率(CD/$),表示美國CPI與加拿大CPI之比;即代表了這兩個國家的相對價格。a.解釋這個回歸。你如何解釋?b.的系數(shù)為正有經(jīng)濟意義嗎?其背后的經(jīng)濟理論是什么?c.假如我們將定義為加拿大CPI與美國CPI之比,的符號會改變嗎?為什么?答:a.斜率系數(shù)值2.250表明,在1985~2005年間,美國與加拿大CPI的比率每提高一個單位,加元兌美元的匯率平均上升2.250個單位。這就是說,隨著美元相對加元更堅挺,用一美元就可以兌換更多的加元。機械地解釋,截距-0.912意味著,如果相對價格比率為0,1美元將兌換-0.912加元(將賠錢)。當然,這個解釋沒有任何經(jīng)濟意義。由于較低,為0.440,說明這個結果有相當多的變異,對現(xiàn)實的擬合度不高。b.斜率系數(shù)為正值具有經(jīng)濟學含義,因為如果美國的價格上漲快于加拿大,(美國)國內(nèi)的消費者就會偏好于加拿大產(chǎn)品——由于他們能買得更多——因此提高了對加元的需求,這將導致加元升值。這就是購買力平價理論(purchasingpowerparity,PPP)或稱為一價定律的精髓。c.在這種情況下斜率系數(shù)被期望為負,因為加拿大CPI相對美國CPI越低,加元的相對通貨膨脹率就越低,這將導致美元貶值。當然,這也是PPP理論的精髓所在。20.表3-4給出了美國在1960~2005年間商業(yè)和非農(nóng)商業(yè)部門的小時產(chǎn)出指數(shù)()和真實小時工資()的數(shù)據(jù)?;辏?992)指數(shù)為100,且指數(shù)經(jīng)過了季節(jié)性調(diào)整。表3-41960~2005年商業(yè)部門的生產(chǎn)力及相關數(shù)據(jù)注:1產(chǎn)出指該部門真實GDP。2雇員的工資和薪水加上雇主對社會保障和私人福利方案的支付。3對于城市消費者,近幾個季度的小時工資除以消費者價格指數(shù)。資料來源:EconomicReportofthePresident,2007,Table49.a(chǎn).分別對兩個部門將對描點。b.這兩個變量之間關系的背后有什么經(jīng)濟理論?散點圖支持該理論嗎?c.估計對的OLS回歸,在學完第5章后,再回頭看一下你的結果。答:a.散點圖如圖3-2所示:圖3-2(1)圖3-2(2)b.圖3-2同時顯示,工資與生產(chǎn)力之間有正相關關系,符合勞動經(jīng)濟學中的邊際生產(chǎn)力工資理論,即勞動和資本各自的邊際生產(chǎn)力決定它們各自的產(chǎn)品價值,同時也就決定了它們各自所取得的收入,因此生產(chǎn)力和工資是正相關的。c.如圖3-2所示,工資和生產(chǎn)力之間的關系基本上是線性的,除了在產(chǎn)出最低那一段區(qū)間有點略微向上彎曲。因此,可以嘗試用一個直線回歸模型來擬合數(shù)據(jù),但擬合效果可能不甚完美。對數(shù)據(jù)擬合的線性模型為:商業(yè):非農(nóng)商業(yè):恰如所料,二者之間的關系是正相關的,但出乎意料的是,值相當高。21.根據(jù)一個包含10次觀測的樣本,得到如下結果:,,,,并且相關系數(shù)。但在重新核對這些計算時,發(fā)現(xiàn)有兩組觀測的記錄是而不是問這一錯誤對有何影響?求正確的。答:因為,則不變;,因此應減少20。應減少。同理可得、的變動量。修正后的數(shù)據(jù)如表3-5所示。表3-5原始數(shù)據(jù)11101700205500322000132100修正后數(shù)據(jù)11101680204200315400133300因此,修正后的相關系數(shù)為。22.表3-6給出1974~2006年問美國的黃金價格、消費者價格指數(shù)(CPI)和紐約證券交易所指數(shù)(NYSEIndex)數(shù)據(jù)。NYSE指數(shù)包括在NYSE上市的1500多種股票中的大多數(shù)。表3-61974~2006年間美國的黃金價格、NYSE指數(shù)和消費者價格指數(shù)數(shù)據(jù)a.在同一散點圖中描繪黃金價格、CPI和NYSE指數(shù)。b.如果一項投資的價格和(或)回報率至少跟得上通貨膨脹,就認為它是保值(能抵御通貨膨脹)的。為檢驗這一假設,假定在(a)中的散點圖表明適當?shù)那闆r下,你擬合如下模型:GoldpricetNYSEIndex如果虛擬假設正確,你對的值有什么樣的期望?答:a.散點圖如圖3-3所示。圖3-3由圖可知,黃金價格有相當大的波動性,但是NYSE指數(shù)和CPI顯得相對穩(wěn)定。(b)如果虛擬假設正確,則會預期。因此股票市場比黃金更能對付通貨膨脹,實現(xiàn)保值。23.表3-7給出1959~2005年間美國國內(nèi)生產(chǎn)總值(GDP)數(shù)據(jù)。表3-71959~2005年間美國名義和真實GDP數(shù)據(jù)注:除非特別說明,均以十億美元為單位;季度數(shù)據(jù)經(jīng)季節(jié)性調(diào)整為年度數(shù)據(jù);RGDP以2000年不變價格十億美元計算。資料來源:EconomicReportofthePresident,2007,TablesB-1andB-2.a(chǎn).將當年美元和不變(即2000年)美元數(shù)據(jù)對時間描圖。b.用表示GDP,表示時間(按年從1代表1959年,2代表1960年開始,直至47代表2005年)??匆韵履P褪欠襁m合GDP數(shù)據(jù):,試用當年美元和不變美元兩種數(shù)據(jù)分別估計此模型。c.你會怎樣解釋?d.如果用當年美元GDP估計的和用不變美元GDP估計的有所不同,怎樣解釋這個差異?e.從你的計算結果,你能對樣本時期美國通貨膨脹的性質(zhì)得出什么結論?答:a.描點圖如圖3-4所示,其中NGDP和RGDP分別表示名義GDP和真實GDP。圖3-4b.兩種模型如下:模型適合GDP數(shù)據(jù)。c.表明每年GDP的變化率。d.二者之差代表了通貨膨脹。e.如圖3-4和回歸結果所示,名義GDP比真實GDP增長更快,表明通貨膨脹在上升。24.利用引言中表Ⅰ-1所給數(shù)據(jù),驗證方程(3.答:略。25.對習題2.16中SAT一例做以下練習:a.將女生閱讀成績相對于男生閱讀成績描點。b.如果散點圖表明兩者似有線性關系,試求女生閱讀成績對男生閱讀成績的回歸。c.如果這兩個閱讀成績之間有某種關系,它是不是因果關系?答:a.圖略。b.回歸結果為:其中,為女生閱讀成績,為男生閱讀成績。c.無論多強的統(tǒng)計關系都不能證明因果關系,其因果關系必須先驗地建立。在這種情況下,沒有理由認為這兩個變量之間存在因果關系。26.用數(shù)學成績代替閱讀成績,重做習題3.25。答:如圖3-5所示。圖3-5回歸結果為:同理,無論多強的統(tǒng)計關系都不能證明因果關系,其因果關系必須先驗地建立。在這種情況下,沒有理由認為男生和女生的數(shù)學成績之間存在因果關系。27.蒙特卡羅研究課堂作業(yè):回到教材表2-4中所列的10個值。令和。假定,即服從均值為0、方差為9的正態(tài)分布。用這兩個參數(shù)值生成100個樣本,求出和的100個估計值,然后對這些估計值描圖。從這一蒙特卡羅研究中,你能得出什么結論?注:當今大多數(shù)統(tǒng)計包都能從一些最熟悉的概率分布中生成隨機數(shù)。如果你在生成這些隨機數(shù)時遇到困難,請向你的老師求助。答:略。28.利用教材表3-3中給出的數(shù)據(jù),將手機用戶數(shù)對計算機用戶數(shù)進行描點。二者之間有明顯的關系嗎?如果有,你如何對這種關系給出合理的解釋。答:如圖3-6所示。圖3-6這兩個變量之間確實呈現(xiàn)出某種正相關關系,但是它更像一種邏輯關系而不是線性關系。

第4章經(jīng)典正態(tài)線性回歸模型4.1復習筆記統(tǒng)計推斷的經(jīng)典理論是由估計和假設檢驗構成的。一、干擾項的概率分布由于在最小二乘法中并沒有對干擾項的概率性質(zhì)做任何假定,所以盡管有了高斯-馬爾可夫定理,但仍無助于從SRF去推斷PRF。在經(jīng)典線性回歸模型中,常常假定服從正態(tài)分布,就得到經(jīng)典正態(tài)線性回歸模型。二、關于的正態(tài)性假定1.經(jīng)典正態(tài)線性回歸的假定假定每個,都是正態(tài)分布的,且均值:方差:協(xié)方差:因此:。對兩個正態(tài)分布變量來說,零協(xié)方差或零相關就意味著兩個變量相互獨立。所以與不僅不相關,而且是獨立分布的,表述為:。2.采用正態(tài)假定的原因(1)代表回歸模型中未明顯引進的許多自變量對因變量的總影響,為了保證這些被忽略的變量所起的作用是微小的,隨機的,因此采取正態(tài)假定。中心極限定理認為,如果存在大量獨立且相同分布的隨機變量,那么,除了少數(shù)例外情形,隨著這些變量的個數(shù)無限地增加,它們的總和將趨向服從正態(tài)分布。中心極限定理為的正態(tài)性假定提供了理論基礎。(2)中心極限定理認為,即使變量個數(shù)并不很大或這些變量并不是嚴格獨立的,但它們的總和仍可視為正態(tài)分布的。(3)正態(tài)分布變量的任何線性函數(shù)都是正態(tài)分布的。在正態(tài)性假定下,0LS估計量的概率分布很容易推導,這就使得假設檢驗工作十分簡單。(4)正態(tài)分布是一個比較簡單的、僅涉及兩個參數(shù)的分布,它為人們所熟知,其理論性質(zhì)在數(shù)理統(tǒng)計學中受到廣泛的研究。(5)在處理小樣本或有限樣本時,正態(tài)假定就起到關鍵作用。不僅有助于推導出0LS估計量精確的概率分布,而且能用檢驗、檢驗和檢驗來對回歸模型進行統(tǒng)計檢驗。(6)在大樣本中,和統(tǒng)計量近似服從和概率分布,所以基于誤差項正態(tài)分布這一假定的和檢驗仍能可靠地使用。三、在正態(tài)性假定下OLS估計量的性質(zhì)1.無偏性;2.最小方差性;3.一致性;4.(的線性函數(shù))是正態(tài)分布的,且均值:方差:?;蚋啙嵉貙懗桑?。利用正態(tài)分布的性質(zhì),定義:可知服從標準正態(tài)分布,表示為:。5.(的線性函數(shù))是正態(tài)分布的,且均值:;方差:?;蚋啙嵉貙懗桑?;利用正態(tài)分布的性質(zhì),定義;可知也服從標準正態(tài)分布。6./服從個自由度的(即卡方)分布;7.(,)的分布獨立于;8.和在所有無偏估計中,無論是線性的還是非線性的,都有最小方差。如果假定,則作為的線性函數(shù),本身也服從正態(tài)分布,其均值和方差依次為:均值:方差:或更簡潔地寫為:。四、極大似然法1.和OLS相比,極大似然法(ML)是一種具有更強的理論特征的點估計方法。2.如果假定是正態(tài)分布的,則回歸系數(shù)的ML估計量和0LS估計量是相同的,無論所考慮的是簡單回歸還是多元回歸。3.的ML估計量是,這是一個有偏誤的估計量,而的OLS估計量則是無偏的。比較的這兩種估計量,可知隨著樣本容量的變大,兩者趨于相等。因此,的ML估計量是漸近(即隨著無限增大)無偏的。

4.2課后習題詳解1.“若兩個隨機變量在統(tǒng)計上獨立,則兩者的相關系數(shù)為零。但反之未必成立。也就是說,零相關不意味著統(tǒng)計獨立性。然而,如果兩個變量都是正態(tài)分布的,則零相關必然意味著統(tǒng)計獨立性?!痹嚴孟旅娴膬蓚€正態(tài)分布變量和的聯(lián)合概率密度函數(shù)(又稱雙變量正態(tài)概率密度函數(shù),bivariatenormalprobabilitydensityfunction)來證明這一命題。其中,的均值;的均值;的標準差;的標準差;與之間的相關系數(shù)。證明:給定和的相關系數(shù)則雙變量正態(tài)PDF可簡化成其中,和為單變量正態(tài)PDF。于是,若則這正是統(tǒng)計獨立的條件。因此,在雙變量正態(tài)情形中,零相關意味著統(tǒng)計獨立。2.試用取極值的二階條件(即二階導數(shù)檢驗),證明通過解方程(9)、(10)和(11)而得到的和的ML估計量,確實可使方程(4)中的似然函數(shù)取極大值。證明:為了保證最大似然估計量最大化似然函數(shù),則附錄4A中方程(5)的二階導數(shù)必須小于0,這就保證了RSS最小化。由于所有二階導數(shù)都為負,所以該ML估計量最大化了似然函數(shù)。3.隨機變量服從指數(shù)分布(exponentialdistribution),如果它有如下的概率密度函數(shù):其中是此分布的參數(shù)。試用ML證明的ML估計量是,其中為樣本容量。也就是證明的ML估計量是樣本均值。證明:由于服從指數(shù)分布,所以它的PDF為。因此,似然函數(shù)為。對似然函數(shù)取對數(shù):。將上述函數(shù)對求導并取導數(shù)等于0便得到:解得:,即樣本均值。4.假設一項實驗的結果要么成功要么失敗。在實驗結果成功時令,在實驗結果失敗時令,的概率密度函數(shù)如下成功概率的極大似然估計量是什么?解:由于服從伯努利分布,其概率分布函數(shù)為:。因此,似然函數(shù)為。似然函數(shù)的對數(shù)就是:。函數(shù)極大化的一階條件為:。解得:,此即為成功概率的極大似然估計量。

第5章雙變量回歸:區(qū)間估計與假設檢驗5.1復習筆記一、區(qū)間估計:一些基本思想1.區(qū)間估計的粗略概念在統(tǒng)計學中,一個點估計量的可靠性由它的標準誤來衡量。因此,不能完全信賴一個點估計值,而是要圍繞點估計量構造一個區(qū)間。隨機區(qū)間為:。,表示隨機區(qū)間包含真實的概率為。這樣的區(qū)間存在,就被稱為置信區(qū)間;被稱為置信系數(shù);則被稱為顯著性水平;置信的區(qū)間的端點被稱為置信限或臨界值;被稱為置信下限;而被稱為置信上限。2.區(qū)間估計的特征(1)方程并不意味著落入給定界限內(nèi)的概率是,而是置信區(qū)間包含的概率為。(2)方程中的區(qū)間是一個隨機區(qū)間,它隨樣本的變化而變化。(3)在重復抽樣中,基于概率而構造許多置信區(qū)間,從長期看,平均來說,這些區(qū)間中將有的比例包含著參數(shù)的真實值。(4)只要尚不知道,方程中的區(qū)間就是隨機的。但是,一旦確定,方程中的區(qū)間就是固定的。二、回歸系數(shù)和的置信區(qū)間1.的置信區(qū)間在的正態(tài)性假定下,OLS估計量和本身就是正態(tài)分布的,因此變量是一個標準正態(tài)變量。(1)真實總體方差已知正態(tài)曲線下,在之間的面積約為68%;在之間的面積約為95%;在之間的面積約為99.7%。(2)真實方差未知在實踐中用的無偏估計量來測定的。方程就可寫為:則。的置信區(qū)間為:,標準誤越大,置信區(qū)間越寬。2.和的聯(lián)合置信區(qū)間構造和的一個聯(lián)合置信域,使得和同時落在其中的置信系數(shù)()。三、的置信區(qū)間在正態(tài)性假定下,變量:則的置信區(qū)間:這就給出的置信區(qū)間。四、假設檢驗:概述虛擬假設():代表一種信以為真或意在維護的維持假設。對立假設():在檢驗虛擬假設時與虛擬假設相對立的假設。假設檢驗的置信區(qū)間方法和顯著性檢驗方法之間的聯(lián)系:兩種方法所考慮的變量(統(tǒng)計量或估計量)服從某個概率分布,并且做假設檢驗就在于對這個分布的參數(shù)值發(fā)表意見或作出判斷。五、假設檢驗:置信區(qū)間方法(1)雙側或雙尾檢驗:反映對于對立假設偏離虛擬假設的方向沒有一個強有力的先驗或理論的期望。決策規(guī)則:構造一個的置信區(qū)間。如果在假設下,落入此區(qū)間,就不拒絕。但如果它落在此區(qū)間之外,就要拒絕。如圖5-1所示。圖5-1統(tǒng)計學中,拒絕虛擬假設時,是統(tǒng)計上顯著的。反之,不拒絕虛擬假設時,則不是統(tǒng)計上顯著的。(2)單側或單尾檢驗:適用于有先驗信息表明對立假設是單向的。六、假設檢驗:顯著性檢驗方法1.檢驗回歸系數(shù)的顯著性:檢驗(1)顯著性檢驗是一種利用樣本結果來證實一個虛擬假設真?zhèn)蔚臋z驗程序。(2)檢驗,置信區(qū)間稱為(虛擬假設的)接受域,而置信區(qū)間以外的(一個或多個)區(qū)域稱為(虛擬假設的)拒絕域或臨界域。置信限,即置信區(qū)間的端點,又稱為臨界值。如果一個統(tǒng)計量的值落在臨界域內(nèi),那么這個統(tǒng)計量就是統(tǒng)計上顯著的,拒絕虛擬假設。同理,如果一個檢驗統(tǒng)計量的值落在接受域中,那么它就是統(tǒng)計上不顯著的,不拒絕虛擬假設。(3)顯著性檢驗的決策規(guī)則表5-1顯著性檢驗:決策規(guī)則2.檢驗的顯著性:檢驗,則檢驗規(guī)則如表5-2所示。表5-2檢驗概要七、假設檢驗:一些實際操作問題1.“接受”或“拒絕”假設的含義在顯著性檢驗中,如果決定“接受”虛擬假設,只表明沒有理由拒絕它;而不是虛擬假設毫無疑問是真的。統(tǒng)計檢驗的結論也應為“不拒絕”而不為“接受”。2.“零”虛擬假設與“2-t”經(jīng)驗法則在經(jīng)驗工作中,經(jīng)常檢驗的一個虛擬假設是,即斜率系數(shù)是零。如果自由度為20或更大,且顯著水平定在0.05,從方程算得值[]在絕對值上超過2時,就可拒絕虛擬假設。當自由度小于20,則必須查閱表。3.構造虛擬假設和對立假設理論預期或經(jīng)驗工作或兩者同時可作為構造假設的依據(jù),但是研究者要在進行經(jīng)驗調(diào)查研究之前先構造這些假設。如果先分析經(jīng)驗結果再進行假設的話,就不免受到一種誘惑,要構造一種假設來袒護自己所得到的結果。4.選擇顯著性水平拒絕或不拒絕虛擬假設,關鍵在于這個顯著性水平或犯第Ⅰ類錯誤的概率——拒絕了真實假設的概率。給定了樣本容量,如企圖減少拒絕真實假設的概率,就同時增加了接受錯誤假設的概率,因此,對于給定的樣本容量,這兩種錯誤類型之間有一種替代關系。解決這一替代關系的唯一途徑,就是找出兩類錯誤的相對代價。如果錯誤地拒絕一個其實是真實的虛擬假設(第Ⅰ類錯誤)的代價比起錯誤地未拒絕一個其實是錯誤的虛擬假設(第Ⅱ類錯誤)的代價相對高昂,那么把第Ⅰ類錯誤的概率定得低些將是合理的。反之,如果犯第Ⅰ類錯誤的代價比犯第Ⅱ類錯誤的代價相對低廉,就值得把第Ⅰ類錯誤的概率定得高些(從而使犯第Ⅱ類錯誤的概率低些)。應用計量經(jīng)濟學家一般看來都是把定在1%、5%甚至10%的水平上。5.精確的顯著性水平:值值,又稱為概率值、觀測或精確顯著水平、犯第Ⅰ類錯誤的精確概率,被定義為一個虛擬假設可被拒絕的最低顯著水平。對于給定樣本容量,隨著的增加,值會不斷下降,犯第Ⅰ類錯誤的概率就越小,就越能夠拒絕虛擬假設。與其人為地把固定在某一水平。不如選取檢驗統(tǒng)計量的值。6.統(tǒng)計顯著性與實際顯著性統(tǒng)計上的顯著性和實際上或經(jīng)濟上的顯著性不能混同。當樣本容量變得非常大時,幾乎任何虛擬假設都一定會被拒絕,統(tǒng)計顯著性的問題會變得不重要,而經(jīng)濟顯著性的問題會變得至關重要。7.假設檢驗的置信區(qū)間方法和顯著性檢驗方法的選擇置信區(qū)間方法優(yōu)于顯著性檢驗方法。因為顯著性檢驗方法一般都拒絕虛擬假設,但如果全部或幾乎全部虛擬假設都是錯誤的,那么,討論一個估計值是否無異于它在虛擬假設下的預測值,就是無意義的。八、回歸分析與方差分析恒等式,即,把總平方和()分解為兩個構成部分:解釋平方和()與剩余平方和()。對的這些構成部分的研究從回歸的觀點就成為方差分析。同任一個平方和聯(lián)系在一起的是它所依據(jù)的自由度,即獨立觀測值的個數(shù)。在計算樣本均值時,失去1個自由度,故有個自由度。有個自由度。有1個自由度(也僅對雙變量情形才正確)。九、回歸分析的應用:預測問題預測分別稱為均值預測和個值預測。1.均值預測是正態(tài)分布的估計量,其均值為(),方差為:。未知,則由它的無偏估計量推知變量:,則有:2.個值預測的方差:也服從正態(tài)分布,用代替未知的,即推出下式也服從分布:。因此分布可用來對真實進行推斷。當時,置信帶的寬度達到最小。隨著遠離,寬度急劇地變大。這說明歷史樣本回歸線的預測能力隨著越來越遠離而顯著下降。十、評價回歸分析的結果1.正態(tài)性檢驗(1)殘差直方圖殘差直方圖是用于了解隨機變量概率密度函數(shù)(PDF)形狀的一個簡單圖示。殘差不是完美的正態(tài)分布;對于一個正態(tài)分布變量,其偏態(tài)值(對稱性的一個度量指標)應該為0,而峰態(tài)值(它度量了一個正態(tài)分布的高矮)應該為3。但作為檢驗正態(tài)假定的一個簡易方法,繪制回歸殘差的直方圖總是一個好的做法。(2)正態(tài)概率圖安德森-達林正態(tài)性檢驗,稱為統(tǒng)計量。其背后的虛擬假設是,所考慮的變量是正態(tài)分布的。(3)雅克-貝拉檢驗(JB檢驗)正態(tài)性的雅克-貝拉(JB)檢驗是一項漸近或大樣本檢驗。它仍以OLS殘差為依據(jù)。此檢驗先計算0LS殘差的偏態(tài)(skewness)和峰態(tài)(kurtosis),再使用下列檢驗統(tǒng)計量:其中,樣本容量,偏態(tài)系數(shù),峰態(tài)系數(shù)。對于一個正態(tài)分布變量,,而。因此,正態(tài)性的JB檢驗是對和這一聯(lián)合假設進行檢驗。2.模型適宜性的其他檢驗模型總是建立在一些不一定總是成立的簡化假定以上的。5.2課后習題詳解1.判斷下述命題的正誤。并給出具體的理由,切勿含糊其辭。a.本章所討論的顯著性檢驗要求估計量和的抽樣分布是正態(tài)分布。b.即使CLRM中的干擾項不是正態(tài)分布的,OLS估計量仍然是無偏的。c.如果回歸模型中沒有截距項,估計值()的總和將不為零。d.值和檢驗統(tǒng)計量的尺度指的是一回事。e.在一個含有截距的回歸模型中,殘差的總和必定為零。f.如果一個虛擬假設不被拒絕,它就是真實的。g.的值越大,方程(3.3.1h.一個隨機變量的條件均值和無條件均值是一樣的。i.在雙變量PRF中,如果斜率系數(shù)是零,則截距由樣本均值來估計。j.如果對無影響,條件方差和的無條件方差將是一樣的。答:a.對。檢驗基于具有正態(tài)分布的變量而定義。由于和的估計量都是誤差的線性組合,在CLRM下誤差是正態(tài)分布的,所以這些估計量也是正態(tài)分布的。b.對。只要,則OLS估計量便是無偏的。證明無偏性無須其他任何假定。c.對。無截距的模型中,不存在,因此不一定為0。d.對。值是能拒絕虛擬假設的最小顯著性水平。術語顯著性水平和檢驗尺度(或檢驗的大小)是同義詞。e.對。,因此含有截距的回歸模型中,殘差的總和必定為零。f.錯。只能說所掌握的數(shù)據(jù)還不允許拒絕虛擬假設,并不表示虛擬假設一定為真。g.錯。較大的可能被較大的所抵消,只有保持后者不變時,這個說法才可能正確。h.錯。一個隨機變量的條件均值取決于另外一個變量的取值。只有這兩個變量相互獨立,條件均值和無條件均值才可能相同。i.對。,因此當斜率系數(shù)是零,則截距由樣本均值來估計。j.對。因為,若對沒有影響,將為0,此時。2.對方程(3.7.2)所給的回歸模型建立像答:印度食物支出的方差分析表如表5-3所示:表5-3,自由度分別為1和53。在食物支出與總支出之間沒有關系的虛擬假設下,得到這樣一個值的值幾乎為0,從而表明可以強烈拒絕這個虛擬假設。3.參考方程(3.a.在5%的顯著水平上,截距系數(shù)估計值顯著嗎?你進行檢驗的虛擬假設是什么?b.在5%的顯著水平上,斜率系數(shù)估計值顯著嗎?其背后的虛擬假設是什么?c.構造真實斜率系數(shù)的95%置信區(qū)間。d.如果人均收入是9000美元,手機需求的平均預測值是多少?這個預測值的95%置信區(qū)間是什么?答:a.截距項系數(shù)的標準誤為6.1523,因此在虛擬假設下,值為。自由度為32時,5%顯著性水平下的臨界值是2.042(使用的是30個自由度,因為在教科書的附錄中沒有包含32個自由度),因此截距項是統(tǒng)計上顯著的。b.斜率系數(shù)的標準誤為0.00032,因此虛擬假設下的值為。5%顯著性水平下的臨界值是2.042,因此斜率系數(shù)是統(tǒng)計上顯著的。c.真實斜率系數(shù)的95%的置信區(qū)間是:d.如果人均收入是9000美元,那么手機需求量的均值預測值為:(支/每百人)為了預測置信區(qū)間,首先需要計算那么置信區(qū)間為:4.令代表真實的總體判定系數(shù),假定你想檢驗假設:,用文字說明你會怎樣檢驗此假設。提示:利用方程(3.5.11),也可參看習題5答:從字面上說,這個假設說明兩個變量之間沒有相關關系。因此,如果可以證明這兩個變量之間的協(xié)方差為0,那么相關系數(shù)一定為0。5.現(xiàn)代投資分析中所謂的特征線(characteristicline)就是得自以下模型的回歸線:其中第種證券在時間的回報率;市場組合證券在時間的回報率;—隨機干擾項。在此模型中,被稱為第種證券的系數(shù)(betacoefficient),是對證券的市場(或系統(tǒng))風險的一種度量。福格勒(Fogler)和加納帕賽(Ganapathy)根據(jù)1956~1976年間的240個月回報率,算得IBM股票相對于芝加哥大學研制的市場組合證券指數(shù)的特征線如下:a.系數(shù)大于1的證券被稱為易波動或進攻型證券。問在此研究期間IBM是易波動證券嗎?b.問截距系數(shù)是否顯著地異于零?如果是,它的實際意義何在?答:a.利用檢驗來檢驗真實的斜率系數(shù)為1的假設,并得到對于自由度238而言,即便在的情況下,這個值也不顯著。結論:在樣本期間內(nèi),IBM不是一個易變證券。b.由于,所以在2%的顯著性水平上這也是一個顯著的值。但它卻沒有什么實際意義,從字面上解釋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論