第七章自變量選擇與逐步回歸課件_第1頁
第七章自變量選擇與逐步回歸課件_第2頁
第七章自變量選擇與逐步回歸課件_第3頁
第七章自變量選擇與逐步回歸課件_第4頁
第七章自變量選擇與逐步回歸課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心1第7章自變量選擇與逐步回歸§7.1自變量選擇對估計和預(yù)測的影響§7.2所有子集回歸§7.3逐步回歸§7.4實例與評注

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心1第7章2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心2第7章自變量選擇與逐步回歸在建立一個實際問題的回歸模型時,首先碰到的問題便是如何確定回歸自變量,一般情況,大都是根據(jù)所研究問題的目的,結(jié)合實際問題理論羅列出對因變量可能有影響的一些因素作為自變量。如果遺漏了某些重要的變量,回歸方程的效果肯定不會好;如果擔(dān)心遺漏了重要的變量,而考慮過多的自變量,在這些變量中,某些自變量對問題的研究可能并不重要,有些自變量數(shù)據(jù)的質(zhì)量可能很差,有些變量可能和其他變量有很大程度的重疊。如果回歸模型把這樣一些變量都選進來,不僅計算量增大好多,而且得到的回歸方程穩(wěn)定性也很差,直接影響到回歸方程的應(yīng)用。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心2第7章2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心3第7章自變量選擇與逐步回歸從20世紀60年代開始,關(guān)于回歸自變量的選擇成為統(tǒng)計學(xué)中研究的熱點問題。統(tǒng)計學(xué)家們提出了許多回歸選元的準則,并提出了許多行之有效的選元方法。本章從回歸選元對回歸參數(shù)估計和預(yù)測的影響開始,介紹自變量選擇常用的幾個準則;扼要介紹所有子集回歸選元的幾個方法;詳細討論逐步回歸方法及其應(yīng)用。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心3第7章2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心4§7.1自變量選擇對估計和預(yù)測的影響

一、全模型和選模型

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心4§7.2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心5§7.1自變量選擇對估計和預(yù)測的影響

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心5§7.2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心6§7.1自變量選擇對估計和預(yù)測的影響

自變量的選擇我們可以看成是對一個實際問題是用(7.1)式全模型還是用(7.2)式選模型去描述。如果應(yīng)該用(7.1)式全模型去描述實際問題,而我們誤選了(7.2)式選模型,這就說明我們在建模時丟掉了一些有用的變量;如果應(yīng)該選用(7.2)式選模型,而我們誤選了模型(7.1)式,這就說明我們把一些不必要的自變量引進了模型。模型選擇不當(dāng)會給參數(shù)估計和預(yù)測帶來什么影響?下面我們將分別給予討論。

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心6§7.2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心7§7.1自變量選擇對估計和預(yù)測的影響

二、自變量選擇對預(yù)測的影響

關(guān)于自變量選擇對預(yù)測的影響可以分成兩種情況考慮,第一種情況是全模型(7.1)式正確而誤用了選模型(7.2)式;第二種情況是選模型(7.2)式正確而誤用了全模型(7.1)式。以下分別考慮這兩種情況對回歸的影響。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心7§7.2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心8§7.1自變量選擇對估計和預(yù)測的影響

(一)全模型正確而誤用選模型的情況

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心8§7.2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心9§7.1自變量選擇對估計和預(yù)測的影響

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心9§7.2023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心10§7.1自變量選擇對估計和預(yù)測的影響

性質(zhì)1和性質(zhì)2表明,當(dāng)全模型(9.1)式正確時,而我們舍去了m-p個自變量,用剩下的p個自變量去建立選模型(9.2)式,參數(shù)估計值是全模型相應(yīng)參數(shù)的有偏估計,用其作預(yù)測,預(yù)測值也是有偏的。這是誤用選模型產(chǎn)生的弊端。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心10§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心11§7.1自變量選擇對估計和預(yù)測的影響

性質(zhì)3和性質(zhì)4表明,用選模型去作預(yù)測,殘差的方差比用全模型去作預(yù)測的方差小,盡管用選模型所作的預(yù)測是有偏的,但得到的預(yù)測偏差的方差下降了。這說明盡管全模型正確,誤用選模型是有弊也有利的。性質(zhì)5說明即使全模型正確,但如果其中有一些自變量對因變量影響很小或回歸系數(shù)方差過大,我們丟掉這些變量之后,用選模型去預(yù)測,可以提高預(yù)測的精度。由此可見,如果模型中包含了一些不必要的自變量,模型的預(yù)測精度就會下降。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心11§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心12§7.1自變量選擇對估計和預(yù)測的影響

(二)選模型正確而誤用全模型的情況目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心12§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心13§7.1自變量選擇對估計和預(yù)測的影響

一個好的回歸模型,并不是考慮的自變量越多越好。在建立回歸模型時,選擇自變量的基本指導(dǎo)思想是“少而精”。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心13§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心14§7.1自變量選擇對估計和預(yù)測的影響

哪怕我們丟掉了一些對因變量y還有些影響的自變量,由選模型估計的保留變量的回歸系數(shù)的方差,要比由全模型所估計的相應(yīng)變量的回歸系數(shù)的方差小。而且,對于所預(yù)測的因變量的方差來說也是如此。丟掉了一些對因變量y有影響的自變量后,所付出的代價是估計量產(chǎn)生了有偏性。然而,盡管估計量是有偏的,但預(yù)測偏差的方差會下降。另外,如果保留下來的自變量有些對因變量無關(guān)緊要,那么,方程中包括這些變量會導(dǎo)致參數(shù)估計和預(yù)測的有偏性和精度降低。自變量的選擇有重要的實際意義。在建立實際問題的回歸模型時,我們應(yīng)盡可能剔除那些可有可無的自變量。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心14§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心15§7.2所有子集回歸一、所有子集的數(shù)目目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心15§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心16§7.2所有子集回歸二、關(guān)于自變量選擇的幾個準則

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心16§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心17§7.2所有子集回歸在第五章,曾從數(shù)據(jù)與模型擬合優(yōu)劣的直觀考慮出發(fā),認為殘差平方和SSE最小的回歸方程就是最好的。還曾用復(fù)相關(guān)系數(shù)R來衡量回歸擬合的好壞。但是當(dāng)自變量子集在擴大時,殘差平方和隨之減少,而復(fù)判定系數(shù)隨之增大。如果按殘差平方和越小越好的原則來選擇自變量子集,或者為提高復(fù)相關(guān)系數(shù),不論什么變量只要多取就行,則毫無疑問選的變量越多越好。這樣由于變量的多重共線性,給變量的回歸系數(shù)估計值帶來不穩(wěn)定性,加上變量的測量誤差積累,參數(shù)數(shù)目的增加,將使估計值的誤差增大。如此構(gòu)造的回歸模型穩(wěn)定性差,使得為增大復(fù)相關(guān)系數(shù)R而付出了模型參數(shù)估計穩(wěn)定性差的代價。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心17§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心18§7.2所有子集回歸殘差平方和、復(fù)相關(guān)系數(shù)或樣本決定系數(shù)都不能作為選擇變量的準則。下面從不同的角度給出幾個常用的準則。準則1自由度調(diào)整復(fù)相關(guān)系數(shù)達到最大。準則2赤池信息量AIC達到最小。上面我們從不同角度介紹了三個準則,自變量選擇的準則還有一些,就不一一列舉了。下面用一個例子,對所有回歸子集計算上述3個準則,綜合比較一下“最優(yōu)”回歸子集的選擇。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心18§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心19§7.2所有子集回歸目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心19§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心20§7.2所有子集回歸目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心20§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心21§7.2所有子集回歸因為這個實際問題所涉及的自變量本來就較少,只有3個,所以從幾個準則看到全模型是“最優(yōu)”的。這種情況在自變量只有少數(shù)幾個時是常見的,但當(dāng)涉及的自變量數(shù)目較多時,很少見到全模型是最優(yōu)的。我們講的最優(yōu)是相對而言,在實際問題的選模中,應(yīng)綜合考慮,或根據(jù)實際問題的研究目的從不同最優(yōu)角度來考慮。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心21§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心22§7.2所有子集回歸如有時希望模型各項衡量準則較優(yōu),得到的模型又能給出合理的經(jīng)濟解釋;有時只從擬合角度考慮;有時只從預(yù)測角度考慮,并不計較回歸方程能否有個合理解釋;有時要求模型的各個衡量準則較優(yōu),而模型最好簡單些,涉及變量少些;有時還看回歸模型參數(shù)估計的標準誤差大小等。因此,上述一些準則只給了我們選擇模型的一些參考,最終的選擇既應(yīng)依上述幾個準則作基本參考根據(jù),又要考慮實際問題的性質(zhì)和需要。三、用SAS軟件尋找最優(yōu)子集目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心22§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心23§7.2所有子集回歸利用sas軟件得部分結(jié)果

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心23§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心24§7.2所有子集回歸目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心24§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心25§7.2所有子集回歸目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心25§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心26§7.2所有子集回歸目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心26§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心27§7.3逐步回歸

一、問題的提出及逐步回歸的思想當(dāng)可供選擇的自變量不太多時,用前邊j講過的方法可以求出一切可能的回歸方程,然后用幾個選元準則去挑出“最好”的方程,但是當(dāng)自變量的個數(shù)較多時,要求出所有可能的回歸方程是非常困難的。為此,人們提出了一些較為簡便、實用、快速的選擇“最優(yōu)”方程的方法。1、前進法前進法的思想是變量由少到多,每次增加一個,直至沒有可引入的變量為止。

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心27§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心28§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心28§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心29§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心29§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心30§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心30§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心31§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心31§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心32§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心32§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心33§7.3逐步回歸

2、后退法后退法與前進法相反,首先用全部m個變量建立一個回歸方程,然后在這m個變量中選擇一個最不重要的變量,將它從方程中剔除。在第4章的回歸系數(shù)的顯著性檢驗中,用的就是這種思想,把回歸系數(shù)檢驗的F值最小者對應(yīng)的自變量剔除。

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心33§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心34§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心34§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心35§7.3逐步回歸

前進法和后退法顯然都有明顯的不足。前進法可能存在這樣的問題,即不能反映引進新的自變量后的變化情況。因為某個自變量開始可能是顯著的,但當(dāng)引入其他自變量后它變得并不顯著了,但是也沒有機會將其剔除,即一旦引入,就是“終身”的。這種只考慮引入,而沒有考慮剔除的做法顯然是不全面的。而且,我們在許多例子中會發(fā)現(xiàn)可能最先引入的某個自變量,當(dāng)其他自變量相繼引入后,它會變得對因變量y很不顯著。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心35§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心36§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心36§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心37§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心37§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心38§7.3逐步回歸

后退法的明顯不足是,一開始把全部自變量引入回歸方程,這樣計算量很大。如果有些自變量不太重要,一開始就不引入,就可減少一些計算量。再就是一旦某個自變量被剔除,“一棍子就把它打死了”,它再也沒有機會重新進入回歸方程。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心38§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心39§7.3逐步回歸

然而在實際中很難碰到自變量間真正無關(guān)的情況,尤其是經(jīng)濟問題中,所研究的絕大部分問題,自變量間都有一定的相關(guān)性。這就會使得隨著回歸方程中變量的增加和減少,某些自變量對回歸方程的影響也會發(fā)生變化。這是因為自變量間的不同組合,由于它們相關(guān)的原因,對因變量y的影響可能大不一樣。如果幾個自變量的聯(lián)合效應(yīng)對y有重要作用,但是單個自變量對y的作用都不顯著,那么前進法就不能引入這幾個自變量,而后退法卻可以保留這幾個自變量,這是后退法的一個優(yōu)點。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心39§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心40§7.3逐步回歸

從前進法和后退法的思想及方法,以及我們看到它們的不足,人們比較自然地想構(gòu)造一種方法,吸收前進法和后退法的優(yōu)點,克服它們的不足,把兩者結(jié)合起來,這就有了逐步回歸的思想。二、逐步回歸法逐步回歸的基本思想是“有進有出”。具體做法是將變量一個一個引入,當(dāng)每引入一個自變量后,對已選入的變量要進行逐個檢驗,當(dāng)原引入的變量由于后面變量的引入而變得不再顯著時,要將其剔除。引入一個變量或從回歸方程中剔除一個變量,為逐步回歸的一步,每一步都要進行F檢驗,以確保每次引入新的變量之前回歸方程中只包含顯著的變量。這個過程反復(fù)進行,直到既無顯著的自變量選入回歸方程,也無不顯著自變量從回歸方程中剔除為止。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心40§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心41§7.3逐步回歸

逐步回歸的計算實施過程可以利用SPSS軟件在計算機上自動完成,我們要求關(guān)心應(yīng)用的讀者一定要通過前邊的敘述掌握逐步回歸方法的思想,這樣才能用對用好逐步回歸。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心41§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心42§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心42§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心43§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心43§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心44§7.3逐步回歸

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心44§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心45§7.3逐步回歸

從逐步回歸模型的結(jié)果來看,x8教育事業(yè)費支出對地區(qū)生產(chǎn)總值的提高有正的促進作用,加大教育事業(yè)費的支出可以極大的促進地區(qū)經(jīng)濟的發(fā)展;x13城市維護費支出對地區(qū)生產(chǎn)總值的提高也有正的促進作用,提高城市形象和加大基礎(chǔ)設(shè)施建設(shè)才能吸引更多投資,進而促進地區(qū)經(jīng)濟的發(fā)展;目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心45§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心46§7.3逐步回歸

x10衛(wèi)生經(jīng)費支出對地區(qū)生產(chǎn)總值的提高起了負的作用,衛(wèi)生經(jīng)費支出的績效難以衡量,其所提供的商品或勞務(wù),不可能以任何形式進入市場交換,也就不能創(chuàng)造直接的經(jīng)濟收益,而且衛(wèi)生經(jīng)費支出是為國家創(chuàng)造或改善生產(chǎn)條件、增進社會福利,滿足人民衛(wèi)生需要,更多的是體現(xiàn)了一種社會公平,最主要的是我國人均衛(wèi)生經(jīng)費遠遠低于世界平均水平,在近幾年趕超世界平均水平過程中出現(xiàn)大量缺口,當(dāng)前形勢就是衛(wèi)生經(jīng)費支出大于衛(wèi)生條件的提高所帶來的經(jīng)濟收益;x2企業(yè)挖潛改造資金對地區(qū)生產(chǎn)總值的提高也起了負的作用,企業(yè)的改造所帶來的經(jīng)濟效益不會短期內(nèi)有較明顯的效果,具有一定的延遲性,當(dāng)年的表現(xiàn)就是支出大于收入。有時為了方便回歸方程的實際解釋可在逐步回歸的幾個子方程中選擇某個作為最終方程。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心46§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心47§7.3逐步回歸

逐步回歸的選元過程是逐步回歸方法的有進有出的思想。這種有進有出的結(jié)果說明自變量之間具有相關(guān)性,如果自變量之間是完全不相關(guān)的,那么引入的自變量就不會再被剔除,而剔除的自變量也就不會再被引入,這時逐步回歸方法與前進法的結(jié)果是相同的。

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心47§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心48§7.4實例與評注

一、逐步回歸實例分析例7.5為了研究香港股市的變化規(guī)律,此例以恒生指數(shù)為例,建立回歸方程,分析影響股票價格趨勢變動的因素。這里研究的股票價格指數(shù),并非某一種股票的價格,它是綜合反映股票市場上所有上市股票價格整體水平變化的指標。

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心48§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心49§7.4實例與評注

目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心49§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心50§7.4實例與評注目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心50§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心51§7.4實例與評注目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心51§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心52§7.4實例與評注香港作為國際金融中心之一,它的證券市場是高度向國際開放的。事實上,1987年以前,香港證券市場上的股份所有權(quán)有50%以上掌握在外國經(jīng)營機構(gòu)手中,因此,從理論上講作為反映港幣匯率水平的主要指標港匯指數(shù)應(yīng)該與股票價格有高度相關(guān),但事實并非如此。原因何在?目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心52§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心53§7.4實例與評注觀察1974—1988年的港匯指數(shù)值,可以看出除1981年、1982年出現(xiàn)大起大落外,港匯指數(shù)的波動一直處于比較平穩(wěn)的狀態(tài),說明港幣一直比較堅挺。(至于1981年、1982年我們應(yīng)把它視為特殊年份,1981年提出香港回歸問題,1982年英首相訪華,正是這一連串的政治事件造成了港幣匯率的大幅變動。)由于匯率波動不大,自然對股價不會產(chǎn)生很大的影響。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心53§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心54§7.4實例與評注目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心54§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心55§7.4實例與評注目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心55§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心56§7.4實例與評注如果進一步作回歸診斷,可以發(fā)現(xiàn)該回歸模型滿足正態(tài)性假設(shè),無異方差、無序列相關(guān)等。因此,運用該回歸方程可以對恒生指數(shù)的變動成因作一些分析。影響恒生指數(shù)的主要因素為成交額、人均生產(chǎn)總值和房地產(chǎn)買賣金額。成交額作為反映市場因素的主要指標對股票價格有著重要的影響。香港股市上,成交額每增長100萬港元,恒生指數(shù)上漲0.355個百分點。人均生產(chǎn)總值是反映經(jīng)濟狀況的主要指標,它代表了經(jīng)濟環(huán)境對股票價格的影響,香港人均生產(chǎn)總值每上升100港元,恒生指數(shù)上漲1.286個百分點。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心56§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心57§7.4實例與評注另外,房地產(chǎn)買賣金額每增加100萬港元,恒生指數(shù)上漲0.442個百分點,這是香港股市區(qū)別于其他股票市場的一大特色。香港的證券市場反映了香港的財政與貿(mào)易活動,但證券市場的大部分資金卻投入了房地產(chǎn)部門,因為不動產(chǎn)是香港投資商致富的主要源泉。因此,房地產(chǎn)事業(yè)相應(yīng)地對股票市場產(chǎn)生了重大影響,它的影響程度甚至強于其他所有因素。所以說,這是香港股市的一大特色。

二、評注從本章§7.1討論的自變量選擇對參數(shù)估計和預(yù)測的影響來看,自變量的選擇是回歸分析建模中的一個非常重要的基本問題。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心57§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心58§7.4實例與評注在對一個實際經(jīng)濟問題建立回歸模型時,首先根據(jù)經(jīng)濟理論和采集樣本數(shù)據(jù)的條件限制,來定性地確定一些對所研究經(jīng)濟現(xiàn)象有重要影響的因素,這些因素就是所謂的自變量。由于我們認識水平的局限,從事物的表面很難分清哪些自變量對因變量有重要影響,哪些自變量間存在著嚴重的相關(guān)性。而且通??赡軙J為研究某個經(jīng)濟現(xiàn)象的回歸問題,考慮的越細越周到肯定會好,這樣自然就會羅列出很多自變量。通過自變量選擇對參數(shù)估計和預(yù)測的影響分析,我們得到的重要結(jié)論是,回歸方程并非自變量越多越好,當(dāng)一些對因變量影響不大的自變量進入回歸方程后,反而會使參數(shù)估計的穩(wěn)定性變差,預(yù)測誤差的方差增大。因此,回歸模型中應(yīng)該保留對因變量影響最顯著的變量,即變量的個數(shù)和質(zhì)量要求是“少而精”。目錄上頁下頁返回結(jié)束2023/8/3中國人民大學(xué)六西格瑪質(zhì)量管理研究中心58§72023/9/5中國人民大學(xué)六西格瑪質(zhì)量管理研究中心59§7.4實例與評注由于變量之間的相關(guān)性,自變量間不同的組合對因變量y的影響是不一樣的,那么到底哪些自變量子集對應(yīng)的回歸方程是“最優(yōu)”的方程,這就要根據(jù)我們介紹的幾個衡量準則在所有自變量子集中去挑選。挑選“最優(yōu)”的回歸方程就是選擇“最優(yōu)”自變量子集。這里的最優(yōu)打著引號實際上是指一個相對好的回歸方程,沒有絕對的最優(yōu)。我們所選的最優(yōu)回歸方程也是根據(jù)研究問題的性質(zhì)和目的,用不同的準則來衡量的結(jié)果。同一個回歸子集在不同的準則衡量下結(jié)果可能是不一樣的。選擇哪一個回歸子集,用哪一個衡量準則要根據(jù)我們研究問題的目的?;貧w模型常用的三個方面是:結(jié)構(gòu)分析、預(yù)測、控制。目錄上頁下頁返

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論