STATA簡(jiǎn)單命令_第1頁(yè)
STATA簡(jiǎn)單命令_第2頁(yè)
STATA簡(jiǎn)單命令_第3頁(yè)
STATA簡(jiǎn)單命令_第4頁(yè)
STATA簡(jiǎn)單命令_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、STATA的簡(jiǎn)單命令Stata中最重要的命令莫過(guò)于help和search了。help用于查找精確的命令,而search是模糊查找。例如:help regress又如:我們記不清regress命令的全名,只記得regress的前半部分reg,那么可以輸入search reg用戶獲得信息最有效的另一個(gè)途徑是使用Statalist在線論壇,該論壇提供Stata用戶交流的一個(gè)良好的平臺(tái)。要加入Statalist,我們可以給以下地址發(fā)個(gè)郵件:郵件的內(nèi)容為:subscribe Statalist變量的命名:1. 變量名可達(dá)32個(gè)字符。2. 字符組成

2、部分為AZ、az、09與下劃線“_”,這些字符以外的其他符號(hào)不可以出現(xiàn)在變量名中。3. 變量名不能以數(shù)字開(kāi)頭。4. 變量名區(qū)分大小寫(xiě)。5. 倘若遵循以上原則依然無(wú)法正常命名變量,那么這個(gè)變量可能與Stata自身保留的供系統(tǒng)使用的變量重復(fù)了。創(chuàng)建數(shù)據(jù)文件的方法:1. 手動(dòng)輸入。2. 從excel等文件中復(fù)制粘貼到stata數(shù)據(jù)表中。3. 運(yùn)用stata軟件導(dǎo)入。查看數(shù)據(jù)的概貌:summarize xcodebook x如果上面兩個(gè)命令后面不加內(nèi)容,那么顯示的結(jié)果是所有變量的概貌。對(duì)數(shù)據(jù)進(jìn)行排序的命令:sort 標(biāo)準(zhǔn)1 標(biāo)準(zhǔn)2 標(biāo)準(zhǔn)3生成數(shù)據(jù)的命令:gen1. 如果要得到一階差分,可以用以下命令:

3、gen Difference_invest(新變量的名稱是任意的)=d.invest(d.是運(yùn)算符號(hào),不得改變;invest是變量名稱)2. 要想產(chǎn)生一個(gè)新的變量Lag_invest,也就是invest的一階滯后,那么我們可以采用如下命令:gen Lag_invest = l.invest3. 生成對(duì)數(shù)的命令:gen Ln_invest=ln(invest)作散點(diǎn)圖的命令:scatter1. scatter x1 x2:scatter后的第一個(gè)變量是縱軸的變量,第二個(gè)變量是橫軸的變量。2. scatter x1 x2, connect(1):以直線的方式連接相鄰的兩個(gè)點(diǎn)。3. scatter

4、x1 x2, connect(1) msymbol(i):散點(diǎn)的顯示方式為“看不見(jiàn)”。相關(guān)性檢驗(yàn):回歸方程的斜率系數(shù)在一定程度上也是反映兩個(gè)變量之間關(guān)系的密切程度,斜率系數(shù)的平方根就是相關(guān)系數(shù)。1. pwcorr命令(用于計(jì)算Pearson相關(guān)系數(shù)),它的好處是盡可能使用兩兩變量中所有沒(méi)有缺失的數(shù)據(jù),而不像correlate只采用沒(méi)有任何缺失數(shù)據(jù)的完整的觀測(cè)值。pwcorr varlist, sig star(.1):star(.1)是為了對(duì)顯著性超過(guò)0.1的相關(guān)系數(shù)打上星號(hào)pwcorr varlist, sig print (.1):print (.1)則是僅僅顯示這些顯著的相關(guān)系數(shù)2. s

5、pearman命令(用于計(jì)算Spearman相關(guān)系數(shù))。截面數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)截面數(shù)據(jù)文件?只需要從excle中拷貝相應(yīng)的數(shù)據(jù)到stata中即可,不需要特別的命令說(shuō)明它是截面數(shù)據(jù)。截面數(shù)據(jù)的回歸主要需要注意以下幾點(diǎn):多重共線性(當(dāng)樣本量較小時(shí),例如小于100)和異方差。而且需要考察t統(tǒng)計(jì)值、R2(adj-R2)、F統(tǒng)計(jì)量。1. 檢驗(yàn)自變量的相關(guān)性。(第1步也可以暫時(shí)不做,等到回歸結(jié)束以后再做)pwcorr varlist, sig print(.05)2. 對(duì)模型進(jìn)行回歸。一個(gè)普通的回歸命令:reg y x1 x2 x3 x4 x5, robust(截面數(shù)據(jù)一律加上robust)倘若回

6、歸結(jié)果的經(jīng)濟(jì)學(xué)含義不合理(包括系數(shù)的正負(fù)號(hào)和顯著性水平),而且前面的相關(guān)性檢驗(yàn)中自變量的相關(guān)性十分高,那么有可能存在嚴(yán)重的多重共線性,為了精確起見(jiàn),可以用vif來(lái)判斷多重共線性是否嚴(yán)重(當(dāng)vif的最大值大于10,同時(shí)各vif的平均值大于1時(shí),表明多重共線性比較嚴(yán)重。使用vif命令時(shí)一定要在回歸命令執(zhí)行以后再用)。如何處理多重共線性?剔除變量法、逐步回歸法以及增加樣本容量。3. 運(yùn)用剔除變量法進(jìn)行回歸。4. 運(yùn)用逐步回歸法進(jìn)行回歸。逐步回歸命令:sw reg y x1 x2 x3 x4 x5, pr(.1):逐步回歸,從最不顯著的變量開(kāi)始刪除,直到所有變量在設(shè)定水平下(0.1)顯著。sw reg

7、 y x1 x2 x3 x4 x5, pr(.1) lockterm1:逐步回歸,從最不顯著的變量開(kāi)始刪除,直到所有變量在設(shè)定水平下(0.1)顯著;而且加入lockterm項(xiàng),為了保證第一項(xiàng)自變量不被刪除。sw reg y x1 x2 x3 (x4 x5), pr(.1):逐步回歸,從最不顯著的變量開(kāi)始刪除,直到所有變量在設(shè)定水平下(0.1)顯著;而且加入()項(xiàng),為了保證x4和x5要么同時(shí)出現(xiàn),要么同時(shí)不出現(xiàn)。時(shí)間序列數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)截面數(shù)據(jù)文件?先把數(shù)據(jù)轉(zhuǎn)移到stata中,然后用tsset命令。tsset time, yearly(或者weekly、monthly、quarterl

8、y)此時(shí),一定要保證表示時(shí)間的那一列數(shù)據(jù)(即年份)的名稱為time。時(shí)間序列數(shù)據(jù)的回歸主要需要注意以下幾點(diǎn):多重共線性(當(dāng)樣本量較小時(shí),例如小于100)和序列相關(guān)性。而且需要考察t統(tǒng)計(jì)值、R2(adj-R2)、F統(tǒng)計(jì)量、D.W.值。首先用reg命令進(jìn)行回歸,例如:reg y x1 x2 x3 x4 x5,并考察D.W.值(使用estat dwatson這一命令),如果D.W.值嚴(yán)重遠(yuǎn)離2,那么要進(jìn)行調(diào)整(調(diào)整方法如黃色底紋),直到調(diào)整到2附近,然后考察回歸結(jié)果是否符合經(jīng)濟(jì)學(xué)含義,倘若不符合,那么要注意是否受到多重共線性的影響(通過(guò)相關(guān)系數(shù)和vif值來(lái)判斷)。在處理多重共線性時(shí),可以用類似于處理

9、截面數(shù)據(jù)的方法(剔除變量法),同時(shí)還要看D.W.值。此外,還可以用差分法來(lái)處理多重共線性(此方法用得不多)。檢驗(yàn)DW值的命令:estat dwatson用廣義差分法考慮序列相關(guān)性的命令(即調(diào)整DW值的命令):reg y x1 x2 x3 x4 x5 L.y(后面還可以運(yùn)用L.y L2.y)用序列相關(guān)穩(wěn)健標(biāo)準(zhǔn)誤法考慮序列相關(guān)性的命令(即調(diào)整DW值的命令):reg y x1 x2 x3 x4 x5, robust考慮多重共線性的方法除了以上截面數(shù)據(jù)中用到的方法以外,還可以用差分法,然后再看vif值。reg D.y D.x1 D.x2 D.x3 D.x4 D.x5面板數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)面板數(shù)

10、據(jù)文件?錄入數(shù)據(jù)xtset id year面板數(shù)據(jù)的回歸主要需要注意:多重共線性(當(dāng)樣本量較小時(shí)),異方差和序列相關(guān)性在很多研究中可以不必深究。而且需要考察t統(tǒng)計(jì)值、R2(adj-R2)、F統(tǒng)計(jì)量,選擇固定效應(yīng)(fixed effect)或隨機(jī)效應(yīng)(random effect)。多重共線性的處理方法可以參照截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)的處理方法。固定效應(yīng)和隨機(jī)效應(yīng)的選擇:(xtreg后面緊挨著的變量是被解釋變量,然后接下來(lái)才是解釋變量)xtreg 被解釋變量 解釋變量, feest store fextreg 被解釋變量 解釋變量, reest store rehausman fe原假設(shè)是隨機(jī)效應(yīng),

11、p值太小可以拒絕原假設(shè),如果hausman檢驗(yàn)的結(jié)果(Probchi2)小于0.1,那么選擇固定效應(yīng);如果(Probchi2)大于0.1,或者chi2的值小于0,那么選擇隨機(jī)效應(yīng)。其它命令GMM方法:xtabond depvar indepvarssargan 檢驗(yàn):estat sargan自相關(guān)檢驗(yàn):estat abond同時(shí)控制時(shí)間因素(year)和行業(yè)因素(industrycode),即自動(dòng)加入虛擬變量的命令xi的用法:xi i.year i.industrycode加入自動(dòng)生成的虛擬變量,并且運(yùn)用穩(wěn)健標(biāo)準(zhǔn)誤進(jìn)行固定效應(yīng)回歸的命令:xtreg lnex lngdpcn lngdppart

12、ner educationjob iprrd lawhi i.year i.industrycode, fe robust面板數(shù)據(jù)中2sls的命令(這可能是默認(rèn)的命令,還可以根據(jù)具體情況更改):(1)xtivreg lnex lk tfp rd size fdi i.year i.id (finance=l.finance),此時(shí)懷疑解釋變量finance是內(nèi)生的,而且以finance的一階滯后作為IV。注意:括號(hào)前面必須有空格?。?)xtivreg lnex lk tfp rd size fdi i.year i.id (finance=l.finance l2.finance),此時(shí)懷疑解

13、釋變量finance是內(nèi)生的,而且以finance的一階滯后和二階滯后作為IV。注意:括號(hào)前面必須有空格!如果用overid,需要安裝overid :ssc install overid, replace如果用xtoverid,需要安裝xtoverid :ssc install xtoverid, replace如果用ranktest,需要安裝ranktest :ssc install ranktest, replace有時(shí)即使安裝以后依然無(wú)法運(yùn)用,可能是由于自變量太多導(dǎo)致的,例如控制行業(yè)固定效應(yīng)、時(shí)間固定效應(yīng)等固定效應(yīng)時(shí)會(huì)增加幾十個(gè)虛擬變量,這時(shí)可能由于模型無(wú)法運(yùn)算而無(wú)法運(yùn)用這些命令,GMM

14、方法似乎也有類似情況。例如:xtivreg lnex lngdpcn lngdppartner distance language border (fincountry=l.fincountry l2.fincountry) findep financefin,re檢驗(yàn)工具變量識(shí)別不足時(shí)用命令ranktest,以上例子應(yīng)該是ranktest (fincountry) (l.fincountry l2.fincountry)【理想的結(jié)果是Kleibergen-Paap rk LM的p值小于0.1】檢驗(yàn)弱工具變量時(shí)也用命令ranktest,但要在后面加上wald,以上例子應(yīng)該是ranktest (

15、fincountry) (l.fincountry l2.fincountry),wald【理想的結(jié)果是Kleibergen-Paap Wald rk F的p值小于0.1】檢驗(yàn)過(guò)度識(shí)別時(shí)用命令xtoverid【理想的結(jié)果Sargan-Hansen檢驗(yàn)的p值大于0.1】博客的命令整理,供參考,未經(jīng)博主允許不得轉(zhuǎn)載。1、input: 輸入數(shù)據(jù)例: inpurt x y 1 4 2 3.5 3 7 end2、by: 按照某一變量的取值來(lái)進(jìn)行分析例:一般要先sort(排序),然后 by group: regress Y x1 x2 /按照不同的組,對(duì)Y分別作四個(gè)回歸分析3、weight: 加權(quán)或者頻數(shù)

16、例:fw=頻數(shù)變量 /多用在四格表資料中或者未原資料未給出所有值,只給出了值和對(duì)應(yīng)的頻數(shù)4、if: 用條件語(yǔ)句指定條件例:drop if group=1|group=2 /把group變量值為1或者2的記錄刪除掉5、in:指定觀察值的范圍,對(duì)在范圍內(nèi)的觀察值做分析處理例:replace x1=123 in 100/200 /把第100-200條記錄中的X1變量值改為1236、for: 用來(lái)指定變量例:for y1-y10 z1-z5: regress x1-x22 /把y1-y10,z1-z5分別于x1-x22做回歸,一次性代表15次回歸,其中是替換符,代表y1-y10, z1-z57、函數(shù):

17、abs(x) 絕對(duì)值exp(x) 指數(shù)函數(shù)log(x) 自然對(duì)數(shù)log10(x) 常用對(duì)數(shù)sqrt(x) 平方根uniform(x) 生成(0,1)內(nèi)均勻分布的偽隨機(jī)數(shù)length(x) 計(jì)算長(zhǎng)度substr(s,n1,n2) 獲得從S的n1個(gè)字符開(kāi)始的n2個(gè)字符組成的字符串real(x) 將字符串s轉(zhuǎn)換為數(shù)值函數(shù)trim(x) 去除字符串前面和后面的空格int(x) 去掉x的小數(shù)部分,得到整數(shù)sum(X) 求和max(x) min(x) 最大值最小值_n 當(dāng)前觀察值的位置_N 觀察值的總個(gè)數(shù)8、ren: 重命名例:ren var1 var123 / 把var1重新命名為var1239、des

18、:描述數(shù)據(jù)庫(kù)的基本情況 10、label: 為變量添加一些說(shuō)明,以示說(shuō)明11、sort: 按照某一變量從小到大排序 gsort +/-:按照某一變量從大到小或者從小到大排序 sort var1 var2:按照var1大小排序,相同的var1按照var2大小排序12、drop:刪除變量或者記錄 drop x1 x2 drop x1-x5 drop if x0 drop in 1/100 drop if x=.|y=. drop _all /清空數(shù)據(jù)庫(kù)13、keep: 與drop對(duì)應(yīng),保存變量14、append:縱向連接數(shù)據(jù)庫(kù)15、merge:橫向連接數(shù)據(jù)庫(kù)16、gen: 生成新變量 gen bh

19、=_n /將數(shù)據(jù)庫(kù)的內(nèi)部編號(hào)賦給變量bh17、replace:更改變量值 replace z=. if z=9 /將所有z=9的值用缺失值代替18、set obs: 增加空白記錄 set obs 20 /增加20條空白記錄19、format: 改變數(shù)據(jù)格式 format tjrq %td /將tjrq改成日期形式20、l: list 將結(jié)果列出21、su: 對(duì)分析數(shù)據(jù)進(jìn)行描述,均值標(biāo)準(zhǔn)差等,與des不同,des是描述數(shù)據(jù)庫(kù)變量個(gè)數(shù),格式等su x, d / 對(duì)x進(jìn)行統(tǒng)計(jì)描述,如果加了d,那么就會(huì)更加detail22、centile: 百分位數(shù)計(jì)算centile x, centile(2.5,5

20、0,97.5) /計(jì)算變量x的2.5,50.97.5百分位數(shù)23、tab:頻數(shù)表達(dá)tab sex /計(jì)算兩個(gè)性別各自的頻數(shù)tab sex group /看看各組性別分布的情況tab group, sum(x1) /在各組內(nèi)對(duì)x1統(tǒng)計(jì)分析24、ci: 計(jì)算可信區(qū)間25、直方圖:gra x, bin(9) xlab(10,20,30,40) ylab(0,1,2,3) norm gap(4) b2(height (cm) /對(duì)x畫(huà)直方圖,分為9組,X軸為10,20,30,40,y軸為0,1,2,3,加上正態(tài)分布曲線,標(biāo)題與坐標(biāo)軸的距離(1-8),下坐標(biāo)軸加標(biāo)題為height(cm)b1/t1/l1

21、/r1() 給各個(gè)坐標(biāo)軸加標(biāo)題b2/t2/l2/r2() 給各個(gè)坐標(biāo)軸加副標(biāo)題title 給圖加總標(biāo)題 條圖:gra x1 x2, bar by(group) sh(31) l1(rate of die) b1(comparison of rate of die)/ 對(duì)x1,x2畫(huà)條圖,分組變量為group,兩組的明暗對(duì)比度為3:1,左標(biāo)題rate of die,下標(biāo)題comparison of rate of die 餅圖:gra x1 x2 x3 x4 x5, pie by(group) sh(31) total 散點(diǎn)圖與線圖:connect(簡(jiǎn)寫(xiě)c)連接散點(diǎn)的方式:. 不連接 l 直線連

22、接 s 平滑曲線連接 | 直線連接在同一縱向上的兩點(diǎn) J 階梯式線條連接 symbol(簡(jiǎn)寫(xiě)s)各個(gè)散點(diǎn)的圖形:O 大圓圈 S 大方塊 T 大三角型 o 小圓圈 d 小菱形 p 小加號(hào) . 小點(diǎn) gra y x, xlab ylab c(l) s(d) 箱式圖: gra y x, oneway/twoway box26、單樣本均數(shù)t檢驗(yàn): ttest x=14.02(總體均數(shù)) ttesti n mean sd 配對(duì)t檢驗(yàn): ttest x1=x2 兩樣本均數(shù)t檢驗(yàn):ttest x1=x2,unpaired ttest x, by(group)27、方差分析:方差齊性檢驗(yàn):sdtest x1=

23、x2 sdtest x, by (group) 正態(tài)性檢驗(yàn): sktest x 單因素方差分析: oneway 相應(yīng)變量 分組變量 兩因素方差分析:anova 相應(yīng)變量 分組變量1 分組變量2 多因素方差分析:anova x a b c . a*b b*c a*b*c. /乘積項(xiàng)代表交互作用28、率、構(gòu)成比的比較: tab var1 var2 fw=頻數(shù)變量 chi2 pearson卡方檢驗(yàn) exact fisher確切概率法 如果是原始資料RXC列聯(lián)表: tabi 第一行數(shù)字從左到右第二行從左到右.最后一行從左到右, row chi2 exact29、 隊(duì)列研究(暴露,不暴露): ir 病例變量 暴露變量 時(shí)間變量 ./ irs a b n1 n2 cs 病例變量 暴露變量 / csi a b c d 病例對(duì)照研究(發(fā)病,不發(fā)?。篶ci a b c d30、等級(jí)資料: genrank 編秩 genrank rankx=x signtest 符號(hào)檢驗(yàn) 類似t檢驗(yàn),signtest x=常數(shù),signtest x1=x2, signrank x1=x2 signrank 符號(hào)秩和檢驗(yàn) ranksum/Wilcoxon 兩樣本秩和檢驗(yàn) wilcoxon var, by (group_var) k

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論