stata操作介紹之相關(guān)性分析(三)_第1頁
stata操作介紹之相關(guān)性分析(三)_第2頁
stata操作介紹之相關(guān)性分析(三)_第3頁
stata操作介紹之相關(guān)性分析(三)_第4頁
stata操作介紹之相關(guān)性分析(三)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、三、線性回歸分析1 v相關(guān)性分析v回歸分析v多重共線性等相關(guān)檢驗(yàn)和處理2 線性回歸分析的stata應(yīng)用實(shí)例本部分用到的實(shí)例是Big Andys Burger Barn的銷售模型。Big Andy的漢堡銷售收入取決于單價(jià)和廣告支出水平 。因此,這個(gè)模型包含兩個(gè)解釋變量和一個(gè)常數(shù)項(xiàng)。其中,sales為指定城市的月銷售額并以千美仄元度量,price是以美元度量的單個(gè)漢堡的價(jià)格,advert為廣告支出,同樣以千美元度量。sales= 1 +2*price +3*advert+ 3 相關(guān)性分析相關(guān)性分析相關(guān)性分析主要目的是研究變量之間關(guān)系的密切程度。相關(guān)性分析的方法主要有:Pearson相關(guān)系數(shù)分析、K

2、endall T相關(guān)系數(shù)分析、Spearman秩相關(guān)系數(shù)分析以及偏相關(guān)系數(shù)分析。1. Pearson相關(guān)系數(shù)分析Pearson相關(guān)性分析是一個(gè)描述線性相關(guān)強(qiáng)度的量,取值于一1和1之間。 Pearson相關(guān)性分析的命令格式:correlate varlist if in weight ,correlate_ options pwcorr varlist if in weight ,correlate_ options correlate盡可能使用兩兩變量中所有沒有缺失的數(shù)據(jù)pwcorr只采用沒有任何缺失數(shù)據(jù)的完整觀測值4 選項(xiàng)含義means顯示變量的均值、標(biāo)準(zhǔn)差、最大最小信covariance顯

3、示協(xié)方差矩陣選項(xiàng)含義obs顯示計(jì)算每個(gè)相關(guān)系數(shù)時(shí)使用的觀測值個(gè)數(shù)sig顯示顯著性檢驗(yàn)的P值print(#)在屏幕上僅顯示達(dá)到相應(yīng)顯著性水平的相關(guān)系數(shù)star(#)在顯著的相關(guān)系數(shù)上打上星號listwise使用listwise的方法處理缺失值,這樣pwcorr就退化成correlate命令了。所謂listwis。方法是說,如果某一觀測值中某個(gè)或者多個(gè)變量出現(xiàn)缺失,則將整個(gè)觀測值刪掉,這也正是correlate命令使用的方法。對于沒有缺失值的數(shù)據(jù)集,這兩種方法沒有區(qū)別correlate選項(xiàng)說明pwcorr選項(xiàng)說明5 用pwcorr命令實(shí)現(xiàn)所有變量的Pearson相關(guān)系數(shù)分析,并在顯著性水平超過0.

4、05的相關(guān)系數(shù)上打上星號,其命令為: pwcorr , sig star(0.05)6 2. Kendall T相關(guān)系數(shù)分析Kendall T相關(guān)性分析是一個(gè)非參數(shù)度量變量間的相關(guān)性,其取值在一1和1之間。 Kendall T相關(guān)性分析的命令格式:ktau varlist if in weight , ktau _ options 選項(xiàng)含義print(#)在屏幕上僅顯示達(dá)到相應(yīng)顯著性水平的相關(guān)系數(shù)star(#)在顯著的相關(guān)系數(shù)上打上星號7 用ktau命令實(shí)現(xiàn)所有變量的Kendall T相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號,其命令為: ktau , star(0.05)8

5、 3. Spearman秩相關(guān)系數(shù)分析Spearman秩相關(guān)性分析也是一種不依賴于總體分布的非參數(shù)檢驗(yàn),取值也在一1和1之間。 Spearman秩相關(guān)性分析的命令格式:spearman varlist if in weight , spearman _ options 9 用spearman命令實(shí)現(xiàn)所有變量的Spearman秩相關(guān)系數(shù)分析,并在顯著性水平超過0.05的相關(guān)系數(shù)上打上星號,其命令為:spearman, star(0.05)10 4.偏相關(guān)系數(shù)分析雙變量相關(guān)分析是研究兩個(gè)變量之間的相關(guān)關(guān)系,有時(shí)在分析兩個(gè)變量之間相關(guān)關(guān)系時(shí),往往會(huì)有其他變量的影響因素混合在里面,此時(shí)計(jì)算出來的相關(guān)系

6、數(shù)可能并不能真正反映兩個(gè)變量之間的關(guān)系。偏相關(guān)性分析的命令格式: pcorr varnamel varlist if in weight11 用pcorr命令實(shí)現(xiàn)偏相關(guān)分析,其命令為: pcorr, sales price advert12 回歸分析回歸分析 回歸分析時(shí)常用的Stata 命令有:regress , predict, test命令。regress, predict, test 是一組命令,它們完成各種簡單和多元的普通最小二乘法回歸。1.regress實(shí)現(xiàn)因變量對自變量的回歸regress命令的格式: regress depvar indepvarsif in weight opt

7、ions因變量自變量選項(xiàng)含義noconstant不加常數(shù)項(xiàng)做線性回歸hascons由用戶指定常數(shù)項(xiàng)的值level(#)設(shè)定置信水平(默認(rèn)值為95% )beta報(bào)告標(biāo)準(zhǔn)化的beta系數(shù)noheader不報(bào)告輸出表名13 實(shí)現(xiàn)因變量為銷售收入,自變量為單價(jià)和廣告支出的線性回歸,其命令為: regress sales price advert表下方區(qū)域?yàn)榛镜幕貧w結(jié)果。第1列依次為被解釋變量sales,解釋變量price、advert,截距項(xiàng)constant;第2列回歸系數(shù);第3列回歸系數(shù)的標(biāo)準(zhǔn)誤;第4列回歸系數(shù)的 t 統(tǒng)計(jì)量值;第5列p值;第6列95%的置信區(qū)間14 表左上方區(qū)域?yàn)榉讲罘治霰?。?

8、列從上到下依次為回歸平方和(SSE)、殘差平方和(SSR)和總離差平方和(SST);第3列為自由度,分別為k=2,n-k-1=75-2-1=72,n-1=75-1=74;第4列為均方和(MSS),由各項(xiàng)平方和除以相應(yīng)的自由度得到。表右上方區(qū)域給出了樣本數(shù)(Number of obs)、判定系數(shù)(R-squared)、調(diào)整的判定系數(shù)(Adj R-squared)、F統(tǒng)計(jì)量的值、回歸方程標(biāo)準(zhǔn)誤 (Root MSE) 以及其他一些統(tǒng)計(jì)量的信息。15 2.predict計(jì)算擬合值和殘差predict命令的格式: predict type newvar if in,single_ options指定存儲(chǔ)

9、類型的格式變量名指定需要擬合值還是殘差值,若為resid,則是殘差計(jì)算前面所求回歸方程的擬合值和殘差。其命令分別為:predict y1predict e, resid16 3.test進(jìn)行指定的檢驗(yàn)test命令主要用來檢驗(yàn)系數(shù)是否符合一定的關(guān)系.test命令的格式如下:test varl var2var3ktest var=Ctest varl=var2test varl=(var2+var3)/C檢驗(yàn)多個(gè)變量的系數(shù)是否同時(shí)為零檢驗(yàn)變量的系數(shù)是否為C檢驗(yàn)兩個(gè)變量的系數(shù)是否相等檢驗(yàn)多個(gè)變量之間存在的一些關(guān)系用test命令檢驗(yàn)價(jià)格和廣告支出的系數(shù)是否同時(shí)為0,其命令為: test price a

10、dvertP值0.05,拒絕原假設(shè),即價(jià)格和廣告支出的系數(shù)不同時(shí)為017 相關(guān)檢驗(yàn)和處理相關(guān)檢驗(yàn)和處理回歸分析時(shí)通常需要檢驗(yàn)數(shù)據(jù)是否存在多重共線、序列相關(guān)和異方差等問題,如果存在這些問題,則需要對其進(jìn)行處理。1.多重共線性的檢驗(yàn)和處理1.1stata中多重共線性檢驗(yàn)的命令格式為:vif /該命令用來得到自變量的方差膨脹因子一般來說,判斷多重共線性的標(biāo)準(zhǔn)是(兩個(gè)標(biāo)準(zhǔn)必須同時(shí)滿足):*最大的vif大于10;*平均的vif大于1.由判斷標(biāo)準(zhǔn)可知不存在多重共線性18 1.2處理多重共線性的方法1.如果只關(guān)心方程的預(yù)測能力,則在整個(gè)方程顯著的條件下,可以不必關(guān)心具體的回歸系數(shù)。2.增加樣本容量,剔除導(dǎo)致

11、多重共線性的變量或者修改模型設(shè)定形式。3.對于時(shí)間序列樣本,通過使用差分模型可以一定程度上消除原模型中的多重共線性。4.嶺回歸方法。/thread-3035722-1-1.html19 2.異方差的檢驗(yàn)和處理2.1stata中異方差檢驗(yàn)的命令格式為:hettest或者imtest, white (懷特檢驗(yàn))判斷存在異方差的標(biāo)準(zhǔn)是:命令輸出結(jié)果的P值小于0.05,則拒絕原假設(shè),即存在異方差性。hettest和懷特檢驗(yàn)輸出結(jié)果的p值均大于0.05故不存在異方差性20 2.2處理異方差性的方法1.在regress命令的options選項(xiàng)中選擇robust選項(xiàng)即

12、可;2.加權(quán)最小二乘法(WLS) 。21 3.序列相關(guān)的檢驗(yàn)和處理2.1stata中檢驗(yàn)序列相關(guān)性的方法:1.BG檢驗(yàn)命令為:estat bgodfrey (默認(rèn)p=1) estat bgodfrey,lags(p) estat bgodfrey, nomiss0 (使用不添加0的BG檢驗(yàn))2.box-pierce Q檢驗(yàn)/ Ljung-Box Q命令為: reg y x1 x2 x3 predict el, resid wntestq el (使用stata提供的默認(rèn)滯后期) wntestq el, lags(p) (使用自己設(shè)定的滯后期)3.DW檢驗(yàn):現(xiàn)在已經(jīng)不常用,因?yàn)槠渲荒軝z驗(yàn)一階自相關(guān)。 命令為: estat dwatson22 3.2stata中處理序列相關(guān)性的方法:1. Newey穩(wěn)健性標(biāo)準(zhǔn)差 newey y x1 x2 x3, lag(p) (滯后階數(shù)必選)2.使用OLS+聚類穩(wěn)健的標(biāo)準(zhǔn)差(cluster robust st

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論