版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
關(guān)于線性回歸的問題和分析方法擴(kuò)展1第1頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五2第一節(jié)多重共線性一、問題的性質(zhì)和種類二、多重共線性的危害三、發(fā)現(xiàn)和檢驗(yàn)四、多重共線性的克服和處理第2頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五3一、問題的性質(zhì)和種類1、嚴(yán)格多重共線性模型設(shè)定問題識(shí)別問題2、近似多重共線性主要是數(shù)據(jù)問題,也有模型設(shè)定問題
第3頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五4二、(近似)多重共線性的危害*隨著多重共線性程度的提高,參數(shù)方差會(huì)急劇上升到很大的水平,理論上使最小二乘法估計(jì)的有效性、可靠性和價(jià)值都受到影響,實(shí)踐中參數(shù)估計(jì)的穩(wěn)定性和可靠程度下降。*證明:把矩陣分為根據(jù)分塊矩陣的運(yùn)算法則有第4頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五5其逆矩陣左上角的首項(xiàng)為其中因此參數(shù)的最小二乘估計(jì)的方差為第5頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五6三、發(fā)現(xiàn)和檢驗(yàn)(一)方差擴(kuò)大因子檢驗(yàn)(二)狀態(tài)數(shù)檢驗(yàn)第6頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五7(一)方差擴(kuò)大因子檢驗(yàn)分析已知記為,為。第7頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五8當(dāng)時(shí),當(dāng)時(shí),方差擴(kuò)大因子,記作常以方差擴(kuò)大因子是否大于10來判斷第個(gè)解釋變量是否存在較強(qiáng)的、必須加以處理的多重共線性。第8頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五9(二)狀態(tài)數(shù)檢驗(yàn)1、狀態(tài)指數(shù)將矩陣的每一列用其模相除以實(shí)現(xiàn)標(biāo)準(zhǔn)化,然后再求矩陣的特征值,取其中最大的除以最小的后再求平方根,得到該矩陣的“狀態(tài)數(shù)”,記為:
通常當(dāng)大于20或30時(shí),認(rèn)為存在較明顯的多重共線性。
第9頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五10確定哪些解釋變量的系數(shù)受到多重共線性的影響:先計(jì)算各個(gè)特征值的“狀態(tài)指數(shù)”這些狀態(tài)指數(shù)的水平在1到之間,很可能有好幾個(gè)超過20-30的“危險(xiǎn)”水平。第10頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五112、回歸系數(shù)方差分解:如果V是對角化的(K+1)(K+1)對角矩陣:即其中是的特征值構(gòu)成的對角矩陣。從而兩種理解:如果特征值之和反映對被解釋變量解釋程度,倒數(shù)之和反映引起估計(jì)量方差的比重。第11頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五12四、多重共線性的克服和處理(一)增加樣本容量(二)差分方程(三)模型修正(四)分步估計(jì)參數(shù)(五)嶺回歸方法第12頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五13(一)增加樣本容量原理:樣本容量越大,變量相關(guān)性越小,相關(guān)越難。注意局限,且不一定解決問題。第13頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五14(二)差分方程線性回歸模型為且已知和之間存在多重共線性問題。作如下變換:
改用差分方程進(jìn)行回歸,受多重共線性的影響比較小。第14頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五15(三)模型修正1、刪減解釋變量(利用檢驗(yàn)結(jié)論、經(jīng)驗(yàn)等)2、整合解釋變量(利用原模型回歸信息、經(jīng)驗(yàn)等)3、先驗(yàn)信息參數(shù)約束
第15頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五16先驗(yàn)信息參數(shù)約束例:生產(chǎn)函數(shù),經(jīng)對數(shù)變換為:
如果預(yù)先知道所研究的經(jīng)濟(jì)有規(guī)模報(bào)酬不變的性質(zhì),即函數(shù)中的參數(shù)滿足就可以克服多重共線性。第16頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五17(四)分步估計(jì)參數(shù)例:研究需求規(guī)律的模型可以先求出模型中參數(shù)的估計(jì)值(用截面數(shù)據(jù)等)。前一個(gè)模型變?yōu)檎磉@個(gè)模型可以得到
從而估計(jì)出和的估計(jì)值和,得到克服了多重共線性的回歸直線第17頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五18(五)嶺回歸方法設(shè)一個(gè)多元線性回歸模型為普通最小二乘估計(jì)的公式為當(dāng)解釋變量間存在嚴(yán)重的多重共線性時(shí),矩陣接近于奇異。用代替代入最小二乘估計(jì)的公式,得到:其中稱為“嶺回歸參數(shù)”,一般,是用矩陣對角線上元素和構(gòu)成的對角線矩陣。第18頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五19(五)嶺回歸方法估計(jì)量的數(shù)學(xué)期望為:第19頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五20第二節(jié)隨機(jī)解釋變量一、解釋變量的隨機(jī)性二、隨機(jī)解釋變量和參數(shù)估計(jì)的性質(zhì)三、工具變量法估計(jì)四、參數(shù)估計(jì)量的分布性質(zhì)和統(tǒng)計(jì)推斷第20頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五21一、解釋變量的隨機(jī)性和問題解釋變量有隨機(jī)性是普遍的問題。隨機(jī)解釋變量有不同的情況,關(guān)鍵是與誤差項(xiàng)的相關(guān)性。不同情況對回歸分析的影響不同,處理也不同。第21頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五22二、隨機(jī)解釋變量和參數(shù)估計(jì)的性質(zhì)設(shè)模型為其中誤差項(xiàng)符合古典線性回歸模型的各個(gè)假設(shè)。參數(shù)二乘估計(jì)的參數(shù)為:把代入,得到第22頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五23如果是隨機(jī)變量,但與誤差項(xiàng)不相關(guān),那么:以為條件的的條件方差是最小方差,從而的方差也是最小方差。第23頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五24如果是隨機(jī)變量,與誤差項(xiàng)小樣本不獨(dú)立,但大樣本漸進(jìn)不相關(guān),即那么因?yàn)橐虼耸堑囊恢鹿烙?jì)。雖然不是無偏估計(jì)。第24頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五25三、工具變量法估計(jì)設(shè)模型為其中不僅是隨機(jī)變量,而且與有強(qiáng)相關(guān)性。對模型作離差變換得兩邊乘并求和得然后兩邊除以,有第25頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五26
的“工具變量法估計(jì)”為,即
的估計(jì)可以利用的估計(jì)得到第26頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五27多元回歸工具變量法估計(jì)引進(jìn)、選擇多個(gè)關(guān)鍵變量。向量、矩陣表示。工具變量的選擇問題:與替代解釋變量相關(guān)性強(qiáng)與誤差相相關(guān)性小避免引起共線性問題第27頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五28四、參數(shù)估計(jì)量分布問題和統(tǒng)計(jì)推斷問題:分布未知兩變量線性回歸模型參數(shù)估計(jì)量多元回歸模型參數(shù)的最小二乘估計(jì)影響:t、F檢驗(yàn)等仍基本有效。統(tǒng)計(jì)量漸近t分布。
F統(tǒng)計(jì)量類似。第28頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五29存在隨機(jī)解釋變量時(shí)相關(guān)統(tǒng)計(jì)推斷受到一定的影響第29頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五30第三節(jié)誤差項(xiàng)非正態(tài)分布一、問題的提出二、誤差項(xiàng)正態(tài)性的檢驗(yàn)第30頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五31一、問題的提出誤差項(xiàng)正態(tài)分布假設(shè)也不一定成立。誤差項(xiàng)不服從正態(tài)分布時(shí),稱“非正態(tài)誤差項(xiàng)”影響:統(tǒng)計(jì)推斷、假設(shè)檢驗(yàn)的有效性等,相關(guān)統(tǒng)計(jì)推斷、檢驗(yàn)結(jié)論的可靠性降低。第31頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五32二、誤差項(xiàng)正態(tài)性的檢驗(yàn)(一)直方圖檢驗(yàn)類似“高爾頓板”第32頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五33(二)偏斜度和峰度檢驗(yàn)“偏斜系數(shù)”:用代替,用代替?!胺宥取敝笜?biāo):其中用代替。,第33頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五34第四節(jié)最大似然估計(jì)一、最大似然估計(jì)的原理二、兩變量線性回歸模型參數(shù)的最大似然估計(jì)三、多元線性回歸模型參數(shù)的最大似然估計(jì)四、隨機(jī)解釋變量模型的最大似然估計(jì)五、最大似然估計(jì)的性質(zhì)第34頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五35一、最大似然估計(jì)的原理根據(jù)事物出現(xiàn)的概率(幾率、可能性)的大小,推斷事物的真相,包括定性的和定量的(參數(shù)水平)真相。例1:一個(gè)老戰(zhàn)士和一個(gè)軍訓(xùn)學(xué)生各射擊一次,但只有一槍中靶。問可能是誰打中的。第35頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五36例2:觀測到一個(gè)服從未知參數(shù)的泊松分布的隨機(jī)變量的10個(gè)數(shù)據(jù)的樣本,這些數(shù)據(jù)分別為5、0、1、2、3、2、3、4、1、1,要求估計(jì)出該泊松分布的未知分布參數(shù)。根據(jù)泊松分布的概率公式,該隨機(jī)變量的數(shù)值為的概率為10個(gè)數(shù)據(jù)出現(xiàn)的聯(lián)合分布概率為第36頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五37這個(gè)聯(lián)合分布概率就是生成上述10個(gè)數(shù)據(jù)的似然函數(shù),記作,即它的對數(shù)似然函數(shù)是(對數(shù)函數(shù)的單調(diào)性)求導(dǎo)可得的最大似然估計(jì)必須滿足所以。第37頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五38二、兩變量線性回歸模型參數(shù)的最大似然估計(jì)設(shè)模型為根據(jù)誤差項(xiàng)服從正態(tài)分布的假設(shè),有因此這個(gè)模型參數(shù)的似然函數(shù)是第38頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五39對數(shù)似然函數(shù)為最大化的一階條件為第39頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五40解一階條件方程組可以得到最大似然估計(jì)為第40頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五41三、多元線性回歸模型參數(shù)的最大似然估計(jì)模型為其中似然函數(shù)為對數(shù)似然函數(shù)為第41頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五42求導(dǎo)可得解這個(gè)方程組可得第42頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五43四、隨機(jī)解釋變量模型的最大似然估計(jì)只討論解釋變量的分布滿足下面兩個(gè)條件的模型(1)隨機(jī)解釋變量的多元密度函數(shù)的參數(shù)中,不包含需要估計(jì)的模型參數(shù)、或前者的部分。(2)和分布獨(dú)立。
第43頁,共46頁,2022年,5月20日,18點(diǎn)41分,星期五44似然函數(shù)為因?yàn)槿匀怀闪?,因?/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人教育培訓(xùn)機(jī)構(gòu)課程購銷擔(dān)保合同2篇
- 2025版新能源汽車停車位租賃與生態(tài)補(bǔ)償協(xié)議2篇
- 二零二五年度誠意金支付及退回協(xié)議合同4篇
- 看大數(shù)據(jù)時(shí)代下健康醫(yī)療傳播的發(fā)展與創(chuàng)新路徑
- 跨行業(yè)合作在展覽活動(dòng)中的應(yīng)用
- 項(xiàng)目制學(xué)習(xí)在學(xué)科教學(xué)中的實(shí)踐與評價(jià)
- 2025版國際貿(mào)易項(xiàng)目轉(zhuǎn)讓居間協(xié)議書3篇
- 2025版土地承包經(jīng)營合同樣本4篇
- 湖南2025年湖南省生態(tài)環(huán)境廳直屬事業(yè)單位招聘44人筆試歷年參考題庫附帶答案詳解
- 溫州浙江溫州市龍灣區(qū)政務(wù)服務(wù)中心招聘編外工作人員筆試歷年參考題庫附帶答案詳解
- 小學(xué)六年級數(shù)學(xué)奧數(shù)題100題附答案(完整版)
- 湖南高速鐵路職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試參考試題庫(含答案)
- 英漢互譯單詞練習(xí)打印紙
- 2023湖北武漢華中科技大學(xué)招聘實(shí)驗(yàn)技術(shù)人員24人筆試參考題庫(共500題)答案詳解版
- 一氯二氟甲烷安全技術(shù)說明書MSDS
- 母嬰護(hù)理員題庫
- 老年人預(yù)防及控制養(yǎng)老機(jī)構(gòu)院內(nèi)感染院內(nèi)感染基本知識(shí)
- SWITCH暗黑破壞神3超級金手指修改 版本號(hào):2.7.6.90885
- 2023高考語文全國甲卷詩歌閱讀題晁補(bǔ)之《臨江仙 身外閑愁空滿眼》講評課件
- 物流簽收回執(zhí)單
- 鋼結(jié)構(gòu)廠房造價(jià)指標(biāo)
評論
0/150
提交評論