第5章 結(jié)構(gòu)模型的建立與檢驗_第1頁
第5章 結(jié)構(gòu)模型的建立與檢驗_第2頁
第5章 結(jié)構(gòu)模型的建立與檢驗_第3頁
第5章 結(jié)構(gòu)模型的建立與檢驗_第4頁
第5章 結(jié)構(gòu)模型的建立與檢驗_第5頁
已閱讀5頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、管理研究方法,主講:趙曉煜,研究生課程,第5章 結(jié)構(gòu)模型的建立與檢驗,研究生課程,主要內(nèi)容,1. 假設(shè)檢驗的基本概念 2. 卡方檢驗 3. 方差分析 4. 相關(guān)分析與回歸分析 5. 調(diào)節(jié)效應和中介效應,1. 假設(shè)檢驗的基本概念,在管理研究中涉及到對一些假設(shè)的檢驗,常見的假設(shè)包括,反映兩個變量之間的相關(guān)性 顧客滿意度越高、顧客的忠誠度就越高 兩個不同樣本間某個統(tǒng)計量是否有差異 廣泛采用了信息技術(shù)的企業(yè),企業(yè)績效是否要好于沒有采用信息技術(shù)的企業(yè)?,假設(shè)檢驗的基本步驟,1. 形成零假設(shè)(空假設(shè))和備選假設(shè)(備擇假設(shè)) 2. 選擇正確的統(tǒng)計技術(shù)和合適的檢驗統(tǒng)計量 3. 設(shè)置顯著性水平 4. 抽樣、收集

2、數(shù)據(jù)并進行檢驗統(tǒng)計量實現(xiàn)值的計算 5. 確定在空假設(shè)的前提下檢驗統(tǒng)計量實現(xiàn)值發(fā)生的 概率,看其是否比預先設(shè)定的顯著性水平還小,如果是則拒絕原假設(shè)。,H0,H1,1. 假設(shè)檢驗的基本概念,在假設(shè)檢驗中,一般要設(shè)立一個原假設(shè) 而設(shè)立該假設(shè)的動機主要是企圖利用人們掌握的反映現(xiàn)實世界的數(shù)據(jù)來找出假設(shè)與現(xiàn)實之間的矛盾,從而否定這個假設(shè)。,企圖肯定什么事物很難,而否定卻要相對容易得多。這就是假設(shè)檢驗背后的哲學。,備選假設(shè)應該按照實際世界所代表的方向來確定,即它通常是被認為可能比零假設(shè)更符合數(shù)據(jù)所代表的現(xiàn)實。,1. 假設(shè)檢驗的基本概念,例如:某公司計劃針對老客戶開展一項新服務,如果有40%的老客戶支持這項服

3、務,則決定推行這項新服務,這是典型的單尾檢驗 H0:p 0.4,例如:某公司認為客戶每周光臨門店的次數(shù)是2次,于是作如下假設(shè)。這是典型的雙尾檢驗 H0:u = 2 H1:u 2,1. 假設(shè)檢驗的基本概念,1. 假設(shè)檢驗的基本概念,數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計量;它在檢驗中被稱為檢驗統(tǒng)計量(test statistic),根據(jù)零假設(shè)(不是備選假設(shè)!),可得到該檢驗統(tǒng)計量的分布;再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值(realization)屬不屬于小概率事件。,如果的確是小概率事件,那么就有可能拒絕零假設(shè),或者說“該檢驗顯著”;否則說“沒有足夠證據(jù)拒絕零假設(shè)”,或者“該檢驗不顯著?!币虼耍僭O(shè)檢驗也被稱為顯

4、著性檢驗(significant test)。,1. 假設(shè)檢驗的基本概念,顯著性水平a,表示允許小概率事件發(fā)生的最大可能,小概率并不能說明不會發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯誤常被稱為第一類錯誤(type I error)。,在備選假設(shè)正確時反而說零假設(shè)正確的錯誤,稱為第二類錯誤(type II error)。,負責任的態(tài)度是無論做出什么決策,都應該給出該決策可能犯錯誤的概率,1. 假設(shè)檢驗的基本概念,在零假設(shè)下,檢驗統(tǒng)計量取其實現(xiàn)值及更加極端值的概率稱為p-值(p-value)。,如果得到很小的p-值,就意味著在零假設(shè)下小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是

5、相信數(shù)據(jù)呢?,當然多半是相信數(shù)據(jù),拒絕零假設(shè)。,H0,H1,1. 假設(shè)檢驗的基本概念,小竅門,記?。喝绻嬎愠鰜淼臋z驗統(tǒng)計量比臨界值大,或計算出來的檢驗統(tǒng)計量發(fā)生的概率比設(shè)定的顯著性水平下,則拒絕零假設(shè)。,假設(shè)檢驗,相關(guān)檢驗,差異檢驗,均值,分布,比例,假設(shè)檢驗的廣義分類,1. 假設(shè)檢驗的基本概念,1. 假設(shè)檢驗的基本概念,管理研究中理論模型的假設(shè)與假設(shè)檢驗的關(guān)系,員工滿意度,顧客滿意度,假設(shè):顧客的滿意度與員工的滿意度正相關(guān)。,員工滿意度4.5 顧客滿意度4.3,員工滿意度2.5 顧客滿意度2.3,盡管對與某個變量相關(guān)的單個問題的回答是令人感興趣的,但有時變量間的關(guān)系更為調(diào)研者所關(guān)心,對某品

6、牌的忠誠度與性別有關(guān)嗎? 產(chǎn)品的使用程度與戶外活動的興趣有關(guān)嗎? 對某種新產(chǎn)品的熟悉程度與年齡有關(guān)嗎? 某種產(chǎn)品的購買情況與收入有關(guān)嗎?,2. 卡方檢驗,列聯(lián)表(交叉表)反映了兩個或多個有限取值的類別變量的聯(lián)合分布,卡方檢驗(Chi-square)被用來檢驗樣本內(nèi)每一類別的實際觀測數(shù)目與某種條件下的理論期望數(shù)目是否存在顯著差異,卡方檢驗中的零假設(shè)(H0)通常是認為變量間相互獨立(不存在顯著關(guān)聯(lián)),卡方檢驗涉及到自由度的概念,可以認為是觀測值自由取值的程度: (r-1)*(c-1),2. 卡方檢驗, 列聯(lián)表的一般形式,列聯(lián)表的形式,建立列聯(lián)表的通常做法是設(shè)計一個表,在這張表中,各列列出各種不同因

7、素,如人口統(tǒng)計和生活方式特征,它們可以作為各行所列因素如心理、行為或意愿的預測指標。 采用這種方法可以簡單比較各種關(guān)系,如心理、行為或意愿數(shù)據(jù)與性別或年齡之間的關(guān)系。, 列聯(lián)表中的差異度量,卡方檢驗的例子,一個關(guān)于軟飲料市場的調(diào)研活動,得到了按性別區(qū)分的最暢銷品牌,二者存在明顯聯(lián)系嗎?,卡方檢驗的例子,查表可知,在0.05顯著水平。自由度為(8-1)(2-1)7的條件下,x2值為14.07。計算得到的值9.53314.07。這說明,購買者的性別和購買的品牌之間并沒有顯著的聯(lián)系。,卡方檢驗的例子,3. 方差分析,3.1 方差分析簡介,方差分析(ANalysis Of VAriance,ANOVA

8、),在管理研究中,一些作為定類變量的自變量有兩個以上的類別,這些自變量對定量因變量的作用可以通過方差分析來考察,從中得出有用的信息,例如:需要考察不同類型的使用者(不使用者、 輕度使用者、重度使用者)對某品牌的態(tài)度是否存在顯著差異,方差分析是作為兩組或兩組以上均值差異的檢驗使用的,通常零假設(shè)為各組均值相等,方差分析最簡單的形式中,必須有一個定量的(定距或定比)因變量,以及一個或多個自變量,通常,自變量是定類的,稱為因素,一個因素水平的特定組合被稱為一種處理,例如:檢驗對具有不同社會和經(jīng)濟風險的產(chǎn)品進行網(wǎng)上購物的偏好差異時,可采用方差分析,經(jīng)濟和社會風險都被分為兩個水平(高、低),對電子化購物的

9、偏好作為因變量,單因素(one-way)方差分析只涉及一個定類自變量或單一因素,3.1 方差分析簡介,如果涉及兩個或兩個以上的定類自變量(因素),就稱為n因素方差分析,例如:在考慮調(diào)查對象對營養(yǎng)和早餐重要性態(tài)度的前提下,了解普通產(chǎn)品使用組和忠誠組對品牌偏好的差異時,就采用協(xié)方差分析,其中的定類自變量仍稱為因素,定量自變量成為協(xié)變量(covariate),如果自變量中即包含定類變量,也包含定量變量,這種分析就稱為協(xié)方差分析 (Analysis of Covariance, ANCOVA),3.1 方差分析簡介,方差分析與t檢驗和回歸分析的關(guān)系,t檢驗只涉及一個二分的自變量,而ANOVA中的定類自

10、變量可以由兩個以上的類別 回歸分析也可以涉及一個以上的自變量,雖然有時將定類自變量表示成虛擬變量,但通常情況下自變量是以定距尺度衡量的,ANOVA,3.1 方差分析簡介,管理研究者通常需要考察因變量在單一自變量或因素的各種狀態(tài)下均值的差異,對這些類似問題的答案,可以通過單因素方差分析來得出,3.2 單因素方差分析,各個細分市場的產(chǎn)品消費量有差異嗎? 接觸不同電視廣告的組對品牌的評價有差異嗎? 零售商、批發(fā)商、分銷商對廠家分銷政策的 態(tài)度一致嗎?,單因素方差分析的步驟,確定自變量和因變量,確定自變量和因變量 總方差分解 強度測量 顯著性檢驗 結(jié)果解釋,因變量以Y表示,自變量以X表示,X是定類變量

11、,共有p類。,3.2 單因素方差分析,總變差分解 因為方差分析考察的是樣本的差異性或者變差,并根據(jù)這種差異性來決定組均值是否相等,線性模型,模型中的假定,涉及的假設(shè),H0: m1=mp,3.2 單因素方差分析,總變差分解和顯著性檢驗,總平方和=組間平方和+組內(nèi)平方和,其中, SST 有自由度 n-1, SSB有自由度 p-1, SSE 有自由度 n-p,在正態(tài)分布的假設(shè)下, 如果各組均值相等(零假設(shè)), 則檢驗統(tǒng)計量,服從自由度為 p-1 和n-p 的F 分布,3.2 單因素方差分析,總變差分解,3.2 單因素方差分析,強度測量eta的平方在0-1范圍內(nèi)取值,結(jié)果解釋 如果組均值相等的假設(shè)沒有

12、被拒絕,自變量對因變量就沒有顯著作用;如果被拒絕,自變量的作用就是顯著的,即因變量在自變量不同組中的均值各不相同,比較組均值能夠顯示出因變量作用的特點,3.2 單因素方差分析,單因素方差分析舉例,單因素方差分析舉例,單因素方差分析舉例,單因素方差分析舉例,單因素方差分析舉例,可以證明,X對Y作用的強度,就是說,銷售額變差中有57.1是出店內(nèi)促銷(X)決定的說明作用中等。,單因素方差分析舉例,檢驗零假設(shè),查F分布表可知,在分子自由度為2,分母自由度為27時,a=0.05的F臨界值為3.35,因此,零假設(shè)被拒絕 結(jié)論:店內(nèi)促銷3個水平下的樣本均值存在差異。這3個類別均值的相對重要性表明,店內(nèi)促銷水

13、平高,銷售額也顯著增加。,單因素方差分析舉例,在管理研究中,研究者經(jīng)常需要同時研究一個以上的因素,例如,為考察上述作用,可以使用n因素方差分析,其主要優(yōu)點在于研究者可以考察因素之間的交互效應,交互效應是指一個因素對因變量的影響與另一個因素的水平有關(guān),3.3 多因素方差分析,廣告水平和價格水平相互作用如何影響銷售 教育程度和年齡會影響對一個品牌的消費嗎? 消費者對商店的熟悉程度和印象會影響偏好嗎?,總效應顯著性檢驗 主效應顯著性檢驗 交互效應顯著性檢驗,檢驗過程,3.3 多因素方差分析,兩個因素方差分析的計算公式,3.3 多因素方差分析,多因素方差分析舉例,多因素方差分析舉例,交互效應,對兩個或

14、兩個以上因子進行方差分析時可能產(chǎn)生的不同交互效應。當一個自變量對因變量的作用,隨著另一個自變量的變化而變化時,就存在交互效應 從ANOVA可能顯示變量間無交互效應(交互效應不顯著),或者交互效應顯著。,交互效應,無交互效應 同序的交互效應 非同序的交互效應:交叉和非交叉,3.3 多因素方差分析,X1對Y的作用在X2的2種狀態(tài)下都是平行的這種平行可能存在微小的偏離,但處于可接受的范圍內(nèi)。平行說明X22比X21多出的凈作用在X1的3種狀態(tài)下相同。在沒有交互作用對X1和X2的聯(lián)合作用就是兩者各自主效應的簡單加總。,3.3 多因素方差分析,同序交互效應,圖中線段顯示X1和X2的作用是不平行的。X22和

15、X21之間的差異從X11到X12到X13,逐漸增加,但X1作用的排序在X2的兩種狀態(tài)下相同。這種排序為升序,并從X21到X22保持一致。,3.3 多因素方差分析,非交叉的非同序交互效應如圖所示。在X21的狀態(tài)下,X1的最低作用為X11,其作用排序為X11, X12,X13。但是, 在X22的狀態(tài)下,X1的最低作用為X12,其排序為X12,X11,X13。由于作用排序發(fā)生了變化,非同序交互效應比間序交互效應要強。,3.3 多因素方差分析,在交叉非同序交互效應中,兩條線段互相交叉,一個因子狀態(tài)的相對作用隨著另一個因子狀態(tài)的變化而改變。注意當X1為X11和X12時,X22比X21的作用大;當X1為X

16、13時,情況正好相反,交叉非同序交互效應代表最強的交互效應。,3.3 多因素方差分析,考察與受控自變量作用有關(guān)的因變量的均值差異時,通常有必要考慮非受控自變量的影響,例如,在這些情況下,可以使用協(xié)方差分析。協(xié)方差分析至少包含一個定類的自變量和定量的自變量協(xié)變量,協(xié)變量常用于去除因變量中的額外變差,3.4 協(xié)方差分析,在研究收看不同電視廣告的組別對品牌的評價時,需要了解品牌的先期知識對因變量的影響 在研究不同價格水平會如何影響某產(chǎn)品的消費量時,考慮家庭規(guī)模也是重要的,利用協(xié)變量的系數(shù)可以判斷協(xié)變量對因變量的作用,協(xié)方差常用于協(xié)變量與因變量線性相關(guān)并與因素無關(guān)的情況,在這些情況下,可以使用協(xié)方差分

17、析。協(xié)方差分析至少包含一個定類的自變量和定量的自變量協(xié)變量,協(xié)變量常用于去除因變量中的額外變差,如果協(xié)變量的作用是顯著的原始系數(shù)的符號就可以用于解釋協(xié)變量對因變量作用的方向。,3.4 協(xié)方差分析,3.4 協(xié)方差分析,3.5 樣本均值的假設(shè)檢驗,市場調(diào)查中一個最普遍的問題就是推斷總體平均數(shù),對樣本的均值進行推斷可以分為以下的情況,單個樣本均值的檢驗 兩個獨立樣本平均差的檢驗,t-檢驗(自由度為n-1) 是在總體方差未知,或樣本量很小的時候進行統(tǒng)計推斷的合適檢驗,如n30,對樣本量較大的情況也適合(接近正態(tài)分布),t-檢驗中檢驗統(tǒng)計量的計算,df=n-1,3.5.1 t檢驗,如果利用十點制量表進行

18、的調(diào)查中獲得的均值為7以上,一個新的配件就將被安裝在新產(chǎn)品中。通過向20位采購工程師出示該配件并進行評估,評價的均值為7.9,標準差為1.6,可以引入該配件嗎?,1. 形成原假設(shè)和備擇假設(shè),單個樣本t檢驗的例子,2. 確定檢驗方法和檢驗統(tǒng)計量,3. 確定顯著性水平,4. 根據(jù)樣本計算檢驗統(tǒng)計量的實現(xiàn)值,單個樣本t檢驗的例子,5. 根據(jù)檢驗統(tǒng)計量進行檢驗,自由度為n-1=20-1=19,在顯著性水平0.05的情況下,臨界值為1.729,因此,拒絕原假設(shè),6. 進行營銷決策,決定引入該配件,H0,單個樣本t檢驗的例子,兩個獨立樣本t檢驗的例子,平均差的假設(shè),檢驗統(tǒng)計量的計算,df=n1+n2-2,

19、3.5.2 z檢驗,在總體方差已知且樣本量較大的情況下利用樣本對總體均值假設(shè)進行檢驗,某大型連鎖快餐企業(yè)以往的顧客平均的等待時間為1.1分鐘。但近年來卻不斷聽到消費者抱怨,說等待時間變長,隨機對其國內(nèi)36家分店中的400位顧客進行了調(diào)查,結(jié)果發(fā)現(xiàn)其平均等待時間為1.14分鐘,由同行調(diào)查的經(jīng)驗知道等待時間的標準差為0.2分鐘,是否可由調(diào)查結(jié)果判定近年來服務出現(xiàn)了問題?,1. 形成原假設(shè)和備擇假設(shè),H0: H1:,2. 計算檢驗統(tǒng)計量,拒絕H0,3.5.2 z檢驗,M企業(yè)擬進行新產(chǎn)品開發(fā)。為了解市場需求情況,隨機地對1000名消費者進行了市場調(diào)查,發(fā)現(xiàn)其中有18的消費者表示愿意購買新產(chǎn)品。根據(jù)其它

20、資料顯示,新產(chǎn)品投入市場后,市場占用率必須超過15才能保證獲利。假定表示愿意購買新產(chǎn)品的18的消費者在新產(chǎn)品投入市場后將全部成為現(xiàn)實的消費者。問M企業(yè)應否開發(fā)這個新產(chǎn)品。,比例z檢驗的例子,1. 形成原假設(shè)和備擇假設(shè),比例z檢驗的例子,2. 確定檢驗方法和檢驗統(tǒng)計量,3. 確定顯著性水平,H0: H1:,比例z檢驗的例子,4. 根據(jù)樣本計算檢驗統(tǒng)計量的實現(xiàn)值,5. 根據(jù)檢驗統(tǒng)計量進行檢驗,因此,拒絕H0,4. 相關(guān)和回歸分析,4.1 相關(guān)分析,積矩相關(guān)系數(shù),在管理研究中我們經(jīng)常需要概括兩個定量變量之間聯(lián)系的強度,例如:,顧客滿意和顧客忠誠的關(guān)系有多強?,信任程度是否與購買量有關(guān)?,信息系統(tǒng)的可

21、用性、易用性是否與信息系統(tǒng)采納意愿有關(guān)?,在這些情況下積矩相關(guān)系數(shù)(product moment correlation)是最常用于概括兩個定量(定距或定比尺度)變且x和y的關(guān)系的統(tǒng)計量,積矩相關(guān)系數(shù),它也是一個決定x與y是否存在線性關(guān)系的指標,能夠表明x變量變差與y變量變差的相關(guān)程度。 對于n個觀測值的樣本,積矩相關(guān)系數(shù)r的計算式為:,4.1 相關(guān)分析,例如,假設(shè)一個研究者希望以居住年限來解釋一個調(diào)查對象對其居住城市的態(tài)度。態(tài)度的測量采用11級量表(1-不喜歡這個城市,11-非常喜歡這個城市),居住年限則以調(diào)查對象在該城市居住的年數(shù)來測量。預備調(diào)查中共有12個調(diào)查對象,數(shù)據(jù)見下表,4.1 相

22、關(guān)分析,r2測量的是一個變量變差中能被另一個變量的變差解釋的比例,r和r2都是測量二個變量聯(lián)系的對稱性指標也就是x和y的相關(guān)性與y和x的相關(guān)性是完全相同的,哪個變量是自變量或因變量都沒有關(guān)系。,測量的是線性關(guān)系的強度,它不能測量非線性關(guān)系,因此r0只能說明x和y不存在線性相關(guān),而不能說明x和y不相關(guān)。,4.1 相關(guān)分析,以r測量的兩個變量之間關(guān)系的統(tǒng)計顯著性很容易檢驗,假設(shè),檢驗統(tǒng)計量,它服從t分布,自由度為n-2,利用前面的例子,4.1 相關(guān)分析,自由度為12-210。從t分布表可知。a0.05時雙尾檢驗的臨界值為2.228。因此,x與y沒有關(guān)系的零假設(shè)被拒絕。r的符號為正,說明對城市的態(tài)度

23、與在該城市的居住年限正相關(guān),而且,r值很高說明二者關(guān)系很強。,4.1 相關(guān)分析,在進行多變量數(shù)據(jù)分析時考察每對變量之間的簡單相關(guān)是很有用的。這些結(jié)果可以通過相關(guān)系數(shù)矩陣表示,列出每對變量之間的相關(guān)系數(shù)。通常,只考慮矩陣的下半個三角就可以了。,對角線元素均為1,且為對稱矩陣,4.1 相關(guān)分析,4.2 二元回歸分析,回歸分析是分析定量因變量與個或多個自變量之間相關(guān)關(guān)系的有效且易用的方法,確定是否存在相關(guān)關(guān)系 關(guān)系的強度有多大 確定二者關(guān)系的數(shù)學形式 預測因變量的值 盡管自變量可能解釋一部分因變量的變差,但這并不表示必然存在因果關(guān)系,自變量和因變量只是根據(jù)變量之間的數(shù)學關(guān)系決定的,并不表示因變量在因

24、果關(guān)系上依賴于自變量,第一步繪制散點圖 就是根據(jù)兩個變量的所有觀察值繪制的圖表,通常繪制時以因變量為縱軸,自變量為橫軸,不相關(guān),正線性相關(guān),負線性相關(guān),非線性相關(guān),4.2 二元回歸分析,第二步建立二元回歸模型 直線的一般形式,這個模型隱含一種決定關(guān)系,因為Y完全是由X決定的,但是在管理研究中很少能遇到變量之間為決定性關(guān)系的情況,所以回歸分析中需要加上誤差項,以便考察變量之間關(guān)系的隨機性,4.2 二元回歸分析,第二步建立二元回歸模型 確定模型參數(shù)一般用最小二乘法,a和b的計算公式為:,4.2 二元回歸分析,第三步顯著性檢驗(與前面的檢驗等價),假設(shè),檢驗統(tǒng)計量,它服從t分布,自由度為n-2,利用

25、前面的例子,4.2 二元回歸分析,4.3 多元線性回歸,多元回歸涉及到個因變量與兩個或兩個以上自變量。二元回歸能解決的問題通過多元回歸增加更多自變量同樣能回答,多元回歸模型的一般形式如下,該模型通過以下公式進行估計,4.3.1 多元回歸分析基本概念,在多元回歸中計算回歸系數(shù)通常采用最小二乘法,公式涉及到矩陣知識,主要采用計算機軟件包進行估計,本節(jié)側(cè)重在計算機輸出結(jié)果的解釋上,回歸系數(shù)的解釋 當所有其他自變量均保持不變時,bi是因變量y對應于自變量xi改變一個單位時所作的改變的估計值,4.3.1 多元回歸分析基本概念,多元判定系數(shù) 可以理解為因變量的變異性能被估計多元回歸方程解釋的百分比,多元判

26、定系數(shù),修正的多元判定系數(shù),4.3.1 多元回歸分析基本概念,顯著性檢驗,F檢驗 用于確定因變量和所有自變量之間是否存在一種顯著性關(guān)系,稱為總體的顯著性檢驗 t檢驗 如果F檢驗顯示了總體的顯著相關(guān),則t檢驗用于確定每一個單獨的自變量是否顯著,模型中的每個單獨自變量均進行t檢驗,稱為單獨顯著性檢驗,4.3.1 多元回歸分析基本概念,顯著性檢驗F檢驗,4.3.1 多元回歸分析基本概念,顯著性檢驗t檢驗,4.3.1 多元回歸分析基本概念,例1:某地區(qū)為研究不同家庭的消費Y與收入X2的關(guān)系,在此基礎(chǔ)上,還引進了消費者家庭財富狀況X3作為第二個解釋變量。回歸方程為:,SE =(6.7525) (0.82

27、29) (0.0807),t =(3.6690) (1.1442) (- 0.5261),F924020,X2、X3的 t 值小。且X3的系數(shù)符號與經(jīng)濟意義不符和。原因?,4.3.2 多重共線性,多重共線性,在多元回歸問題中大部分自變量在一定程度上都是彼此相關(guān)的,自變量之間的這種關(guān)系稱為多重共線性(Multicollinearity),根據(jù)自變量之間是否有嚴格的線性關(guān)系,可以將多重共線性分為以下兩種類型:,完全的多重共線性 不完全(近似)的多重共線性,4.3.2 多重共線性,多重共線性產(chǎn)生的后果,完全的多重共線性 導致參數(shù)的估計值不確定 參數(shù)估計值的方差無限大 不完全(近似)的多重共線性 可以

28、估計參數(shù),但參數(shù)估計不穩(wěn)定 參數(shù)估計量的方差增大 可能導致模型誤差,t檢驗失敗,4.3.2 多重共線性,多重共線性的檢驗,簡單線性線性相關(guān)系數(shù)法 X1,X2,X3為模型中將要引進的解釋變量,計算相關(guān)系數(shù)矩陣,觀察兩兩之間的線性相關(guān)是否密切 局限性: 該方法的局限性主要在于相關(guān)系數(shù)只能測度兩個解釋變量之間線性相關(guān)的程度,而不能測度三個或更多解釋變量之間的線性相關(guān)程度。,4.3.2 多重共線性,多重共線性的檢驗,綜合判斷法 R2(或R2)大,F(xiàn)值大,t值小,說明模型可能存在多重共線性。 原因:R2,F(xiàn)值大,表明因變量的離差可以較好的由回歸模型解釋,各自變量對因變量的聯(lián)合線性作用顯著。在此前提下,若

29、各個t值很少,說明各自變量之間存在共線性,對因變量的獨立作用不能分辨。,4.3.2 多重共線性,多重共線性的檢驗,輔助回歸法 計算模型中每個自變量和其他自變量的輔助回歸,如果有輔助回歸方程的R2值較大,說明模型存在 嚴重的多重共線性,4.3.2 多重共線性,多重共線性的處理方法,逐步回歸法 用因變量Y對每一個自變量Xi分別進行回歸,從中確定一個基本回歸方程。然后,逐一引入其它解釋變量 ,再作回歸,逐步擴大模型的規(guī)模。 引入新變量后,如果: (1)擬合優(yōu)度得以改進,而且每個參數(shù)統(tǒng)計檢驗顯著,則引入的變量保留;,4.3.2 多重共線性,多重共線性的處理方法,逐步回歸法續(xù) 引入新變量后,如果: (2

30、)擬合優(yōu)度無明顯提高甚至下降,對其他參數(shù)無明顯影響,則舍棄該變量, (3)擬合優(yōu)度提高,但方程內(nèi)其他參數(shù)的符號和數(shù)值明顯變化,可以肯定產(chǎn)生了嚴重的多重共線性。,4.3.2 多重共線性,4.4 包含虛擬變量的回歸模型,許多管理變量是可以定量度量的,如:商品需求量、價格、收入、產(chǎn)量等。 但也有一些影響經(jīng)濟變量的因素無法定量度量,如:職業(yè)、性別對收入的影響;戰(zhàn)爭、自然災害對GDP的影響;季節(jié)對某些產(chǎn)品(如冷飲)銷售的影響等等。 為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。,4.4.1 虛擬變量的基本含義,這種“量化”通常是通過引入“虛擬變量”來完成的。根據(jù)這些因素的屬性

31、類型,構(gòu)造只取“0”或“1”的人工變量,通常稱為虛擬變量(dummy variables),記為D。 例如,反映文化程度的虛擬變量可取為: 1,本科學歷 D= 0,非本科學歷,4.4.1 虛擬變量的基本含義,例如:一個以性別為虛擬變量考察企業(yè)職工薪金的模型:,4.4.1 虛擬變量的基本含義,其中:Yi為企業(yè)職工的薪金,Xi為工齡, Di=1,若是男性,Di=0,若是女性。,虛擬變量做為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。,4.4.2 虛擬變量的引入,上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。 在該模型中,如果仍假定E(i)=0,則企業(yè)女職工的平均薪金為:,男職工的

32、平均薪金為:,加法方式的幾何意義,4.4.2 虛擬變量的引入,假定2不等于0,則兩個函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對工齡的變化率是一樣的,但兩者的平均薪金水平相差2。 可以通過傳統(tǒng)的回歸檢驗,對2的統(tǒng)計顯著性進行檢驗,以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。,在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個人保健支出對個人收入和教育水平的回歸。,4.4.2 虛擬變量的引入,教育水平考慮三個層次:高中以下,高中,大學及其以上。 這時需要引入兩個虛擬變量:,D1=1高中學歷; D2=1大學及以上學歷,乘法方式,4.4.2 虛擬變量的引入,加法方式引入虛擬變量,考察:截距的不同。 許多情

33、況下:往往是斜率也有變化,或斜率、截距同時發(fā)生變化。 斜率的變化可通過以乘法的方式引入虛擬變量來測度。,根據(jù)消費理論,消費水平C主要取決于收入水平Y(jié),但在一個較長的時期,人們的消費傾向會發(fā)生變化,尤其是在自然災害、戰(zhàn)爭等反常年份,消費傾向往往出現(xiàn)變化。這種消費傾向的變化可通過在收入的系數(shù)中引入虛擬變量來考察,4.4.2 虛擬變量的引入,設(shè) ,消費模型建立如下,這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察消費傾向的變化。 假定E(i)= 0,上述模型所表示的函數(shù)可化為:,正常年份:,反常年份:,4.4.2 虛擬變量的引入,4.4.3 虛擬變量的設(shè)置原則,虛擬變量的個數(shù)須按以下原則

34、確定: 每一定性變量所需的虛擬變量個數(shù)要比該定性變量的類別數(shù)少1,即如果有m個定性變量,只在模型中引入m-1個虛擬變量。 例如:已知冷飲的銷售量Y除受k種定量變量Xk的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個虛擬變量即可。,5. 調(diào)節(jié)效應和中介效應,主要內(nèi)容,調(diào)節(jié)變量和調(diào)節(jié)效應分析 中介變量和中介效應分析 調(diào)節(jié)變量與中介變量的比較 調(diào)節(jié)效應與中介效應實例,調(diào)節(jié)變量(moderator)和中介變量(mediator)是兩個重要的統(tǒng)計概念。相對于人們關(guān)注的自變量和因變量而言,調(diào)節(jié)變量和中介變量都是第三者,經(jīng)常被人混淆。,從文獻上看,存在的問題主要有如下幾種: (1)術(shù)語混用或換用,兩個概念不加區(qū)分。 (2)術(shù)語和概念不一致。 (3)術(shù)語和統(tǒng)計分析不一致。, 研究意義,1. 調(diào)節(jié)變量與調(diào)節(jié)效應,1.1 調(diào)節(jié)變量的定義,如果變量Y與變量X的關(guān)系是變量M 的函數(shù),稱M 為調(diào)節(jié)變量。就是說, Y與X 的關(guān)系受到第三個變量M 的影響。,1.1 調(diào)節(jié)變量的定義,調(diào)節(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論