STATA簡(jiǎn)單命令_第1頁(yè)
STATA簡(jiǎn)單命令_第2頁(yè)
STATA簡(jiǎn)單命令_第3頁(yè)
STATA簡(jiǎn)單命令_第4頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、-精選文檔 -STATA 的簡(jiǎn)單命令Stata 中最重要的命令莫過(guò)于help和 search了。help 用于查找精確的命令,而search 是模糊查找。例如: help regress又如:我們記不清regress命令的全名,只記得regress的前半部分reg ,那么可以輸入search reg用戶獲得信息最有效的另一個(gè)途徑是使用Statalist在線論壇,該論壇提供Stata 用戶交流的一個(gè)良好的平臺(tái)。要加入Statalist ,我們可以給以下地址發(fā)個(gè)郵件:郵件的內(nèi)容為:subscribe Statalist變量的命名:1. 變量

2、名可達(dá) 32 個(gè)字符。2. 字符組成部分為 AZ 、az 、09 與下劃線“ _”,這些字符以外的其他符號(hào)不可以出現(xiàn)在變量名中。3. 變量名不能以數(shù)字開(kāi)頭。4. 變量名區(qū)分大小寫(xiě)。5.倘若遵循以上原則依然無(wú)法正常命名變量,那么這個(gè)變量可能與Stata 自身保留的供系統(tǒng)使用的變量重復(fù)了。可編輯-精選文檔 -創(chuàng)建數(shù)據(jù)文件的方法:1. 手動(dòng)輸入。2. 從 excel 等文件中復(fù)制粘貼到 stata 數(shù)據(jù)表中。3. 運(yùn)用 stata 軟件導(dǎo)入。查看數(shù)據(jù)的概貌:summarize xcodebook x如果上面兩個(gè)命令后面不加內(nèi)容,那么顯示的結(jié)果是所有變量的概貌。對(duì)數(shù)據(jù)進(jìn)行排序的命令:sort標(biāo)準(zhǔn) 1

3、標(biāo)準(zhǔn) 2 標(biāo)準(zhǔn) 3生成數(shù)據(jù)的命令:gen1. 如果要得到一階差分, 可以用以下命令: gen Difference_invest (新變量的名稱是任意的) =d.invest( d.是運(yùn)算符號(hào),不得改變;invest是變量名稱)2. 要想產(chǎn)生一個(gè)新的變量 Lag_invest ,也就是 invest 的一階滯后,那么我們可以采用如下命令: gen Lag_invest = l.invest3. 生成對(duì)數(shù)的命令: gen Ln_invest=ln(invest)作散點(diǎn)圖的命令:scatter1. scatter x1 x2 : scatter 后的第一個(gè)變量是縱軸的變量,第二個(gè)變量是橫軸的變量。

4、2. scatter x1 x2, connect(1):以直線的方式連接相鄰的兩個(gè)點(diǎn)。3.scatter x1 x2, connect(1) msymbol(i):散點(diǎn)的顯示方式為“看不見(jiàn)”。相關(guān)性檢驗(yàn):可編輯-精選文檔 -回歸方程的斜率系數(shù)在一定程度上也是反映兩個(gè)變量之間關(guān)系的密切程度,斜率系數(shù)的平方根就是相關(guān)系數(shù)。1. pwcorr 命令(用于計(jì)算 Pearson 相關(guān)系數(shù)),它的好處是盡可能使用兩兩變量中所有沒(méi)有缺失的數(shù)據(jù),而不像correlate只采用沒(méi)有任何缺失數(shù)據(jù)的完整的觀測(cè)值。pwcorr varlist, sig star(.1): star(.1) 是為了對(duì)顯著性超過(guò)0.1

5、 的相關(guān)系數(shù)打上星號(hào)pwcorr varlist, sig print (.1): print (.1)則是僅僅顯示這些顯著的相關(guān)系數(shù)2. spearman 命令(用于計(jì)算 Spearman 相關(guān)系數(shù))。截面數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)截面數(shù)據(jù)文件?只需要從excle 中拷貝相應(yīng)的數(shù)據(jù)到stata 中即可, 不需要特別的命令說(shuō)明它是截面數(shù)據(jù)。截面數(shù)據(jù)的回歸主要需要注意以下幾點(diǎn):多重共線性(當(dāng)樣本量較小時(shí),例如小于100 )和異方差。而且需要考察t 統(tǒng)計(jì)值、 R2 ( adj-R 2)、 F 統(tǒng)計(jì)量。1. 檢驗(yàn)自變量的相關(guān)性。 (第 1 步也可以暫時(shí)不做,等到回歸結(jié)束以后再做) pwcorr va

6、rlist, sig print(.05)2. 對(duì)模型進(jìn)行回歸。一個(gè)普通的回歸命令:reg y x1 x2 x3 x4 x5, robust(截面數(shù)據(jù)一律加上robust )倘若回歸結(jié)果的經(jīng)濟(jì)學(xué)含義不合理(包括系數(shù)的正負(fù)號(hào)和顯著性水平),而且前面的相關(guān)性檢驗(yàn)中自變量的相關(guān)性十分高,那么有可能存在嚴(yán)重的多重共線性,為了精確起見(jiàn),可以用 vif 來(lái)判斷多重共線性是否嚴(yán)重(當(dāng) vif 的最大值大于10 ,同時(shí)各 vif 的平均值大于 1 時(shí),表明多重共線性比較嚴(yán)重。使用vif 命令時(shí)一定要在回歸命令執(zhí)行以后再用)。可編輯-精選文檔 -如何處理多重共線性?剔除變量法、逐步回歸法以及增加樣本容量。3.

7、運(yùn)用剔除變量法進(jìn)行回歸。4. 運(yùn)用逐步回歸法進(jìn)行回歸。逐步回歸命令:sw reg y x1 x2 x3 x4 x5, pr(.1) :逐步回歸,從最不顯著的變量開(kāi)始刪除,直到所有變量在設(shè)定水平下( 0.1 )顯著。sw reg y x1 x2 x3 x4 x5, pr(.1) lockterm1:逐步回歸,從最不顯著的變量開(kāi)始刪除,直到所有變量在設(shè)定水平下(0.1 )顯著;而且加入lockterm項(xiàng),為了保證第一項(xiàng)自變量不被刪除。sw reg y x1 x2 x3 (x4 x5), pr(.1):逐步回歸,從最不顯著的變量開(kāi)始刪除,直到所有變量在設(shè)定水平下(0.1 )顯著;而且加入()項(xiàng),為了

8、保證x4 和 x5 要么同時(shí)出現(xiàn),要么同時(shí)不出現(xiàn)。可編輯-精選文檔 -時(shí)間序列數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)截面數(shù)據(jù)文件?先把數(shù)據(jù)轉(zhuǎn)移到stata 中,然后用tsset 命令。tsset time, yearly(或者 weekly 、 monthly、 quarterly)此時(shí),一定要保證表示時(shí)間的那一列數(shù)據(jù)(即年份)的名稱為time 。時(shí)間序列數(shù)據(jù)的回歸主要需要注意以下幾點(diǎn):多重共線性(當(dāng)樣本量較小時(shí), 例如小于 100 )和序列相關(guān)性。而且需要考察t 統(tǒng)計(jì)值、 R2(adj-R 2 )、F 統(tǒng)計(jì)量、 D.W. 值。首先用 reg 命令進(jìn)行回歸, 例如:reg y x1 x2 x3 x4 x5

9、,并考察 D.W. 值(使用 estat dwatson這一命令),如果 D.W. 值嚴(yán)重遠(yuǎn)離2,那么要進(jìn)行調(diào)整(調(diào)整方法如黃色底紋),直到調(diào)整到 2 附近,然后考察回歸結(jié)果是否符合經(jīng)濟(jì)學(xué)含義,倘若不符合,那么要注意是否受到多重共線性的影響(通過(guò)相關(guān)系數(shù)和 vif 值來(lái)判斷) 。在處理多重共線性時(shí),可以用類似于處理截面數(shù)據(jù)的方法(剔除變量法) ,同時(shí)還要看 D.W. 值。此外,還可以用差分法來(lái)處理多重共線性(此方法用得不多) 。檢驗(yàn) DW 值的命令: estat dwatson用廣義差分法考慮序列相關(guān)性的命令(即調(diào)整DW 值的命令):reg y x1 x2 x3 x4 x5 L.y(后面還可以

10、運(yùn)用L.y L2.y )用序列相關(guān)穩(wěn)健標(biāo)準(zhǔn)誤法考慮序列相關(guān)性的命令(即調(diào)整DW 值的命令):reg y x1 x2 x3 x4 x5, robust考慮多重共線性的方法除了以上截面數(shù)據(jù)中用到的方法以外,還可以用差分法,然后再看vif 值。可編輯-精選文檔 -reg D.y D.x1 D.x2 D.x3 D.x4 D.x5面板數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)面板數(shù)據(jù)文件?錄入數(shù)據(jù)xtset id year面板數(shù)據(jù)的回歸主要需要注意:多重共線性(當(dāng)樣本量較小時(shí)),異方差和序列相關(guān)性在很多研究中可以不必深究。而且需要考察t 統(tǒng)計(jì)值、 R2 ( adj-R 2)、F 統(tǒng)計(jì)量, 選擇固定效應(yīng)(fixed ef

11、fect)或隨機(jī)效應(yīng)(random effect)。多重共線性的處理方法可以參照截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)的處理方法。固定效應(yīng)和隨機(jī)效應(yīng)的選擇:(xtreg后面緊挨著的變量是被解釋變量,然后接下來(lái)才是解釋變量)xtreg被解釋變量解釋變量 , feest store fextreg被解釋變量解釋變量 , reest store rehausman fe原假設(shè)是隨機(jī)效應(yīng),p 值太小可以拒絕原假設(shè),如果hausman檢驗(yàn)的結(jié)果 (Prob>chi2)小于 0.1 ,那么選擇固定效應(yīng);如果(Prob>chi2)大于 0.1 ,或者 chi2 的值小于0 ,那么選擇隨機(jī)效應(yīng)??删庉?精選文檔

12、-其它命令GMM方法:xtabonddepvarindepvarssargan檢驗(yàn):estat sargan自相關(guān)檢驗(yàn):estat abond同時(shí)控制時(shí)間因素(year )和行業(yè)因素(industrycode),即自動(dòng)加入虛擬變量的命令xi的用法:xi i.year i.industrycode加入自動(dòng)生成的虛擬變量,并且運(yùn)用穩(wěn)健標(biāo)準(zhǔn)誤進(jìn)行固定效應(yīng)回歸的命令:xtreg lnex lngdpcn lngdppartner educationjob iprrd lawhi i.year i.industrycode, ferobust面板數(shù)據(jù)中2sls 的命令(這可能是默認(rèn)的命令,還可以根據(jù)具體

13、情況更改):(1 )xtivreglnex lk tfp rd size fdi i.year i.id (finance=l.finance),此時(shí)懷疑解釋變量finance是內(nèi)生的,而且以finance的一階滯后作為IV 。 注意:括號(hào)前面必須有空格?。? )xtivreglnex lk tfp rd size fdi i.year i.id (finance=l.finance l2.finance),此時(shí)懷疑解釋變量 finance是內(nèi)生的,而且以finance的一階滯后和二階滯后作為IV 。 注意:括號(hào)前面必須有空格!可編輯-精選文檔 -如果用 overid ,需要安裝overid:

14、 ssc install overid, replace如果用 xtoverid,需要安裝xtoverid:ssc install xtoverid, replace如果用 ranktest ,需要安裝ranktest: ssc install ranktest, replace有時(shí)即使安裝以后依然無(wú)法運(yùn)用,可能是由于自變量太多導(dǎo)致的,例如控制行業(yè)固定效應(yīng)、時(shí)間固定效應(yīng)等固定效應(yīng)時(shí)會(huì)增加幾十個(gè)虛擬變量,這時(shí)可能由于模型無(wú)法運(yùn)算而無(wú)法運(yùn)用這些命令, GMM方法似乎也有類似情況。例如: xtivreg lnex lngdpcn lngdppartner distance language bord

15、er(fincountry=l.fincountry l2.fincountry) findep financefin,re檢驗(yàn)工具變量識(shí)別不足時(shí)用命令ranktest,以上例子應(yīng)該是ranktest (fincountry)(l.fincountry l2.fincountry)【理想的結(jié)果是Kleibergen-Paap rk LM的 p 值小于 0.1 】檢驗(yàn)弱工具變量時(shí)也用命令ranktest,但要在后面加上wald ,以上例子應(yīng)該是ranktest(fincountry) (l.fincountry l2.fincountry),wald【理想的結(jié)果是Kleibergen-Paap

16、Wald rkF 的 p 值小于 0.1 】檢驗(yàn)過(guò)度識(shí)別時(shí)用命令xtoverid【理想的結(jié)果Sargan-Hansen檢驗(yàn)的 p 值大于 0.1 】博客的命令整理,供參考,未經(jīng)博主允許不得轉(zhuǎn)載??删庉?精選文檔 -1 、 input:輸入數(shù)據(jù)例:inpurt x y1 42 3.53 7end2 、 by:按照某一變量的取值來(lái)進(jìn)行分析例:一般要先sort( 排序 ),然后by group: regress Y x1 x2/ 按照不同的組,對(duì)Y 分別作四個(gè)回歸分析3 、 weight:加權(quán)或者頻數(shù)例:fw= 頻數(shù)變量/ 多用在四格表資料中或者未原資料未給出所有值,只給出了值和對(duì)應(yīng)的頻數(shù)4 、 i

17、f:用條件語(yǔ)句指定條件例: drop if group=1|group=2/ 把 group變量值為1 或者 2 的記錄刪除掉5 、 in: 指定觀察值的范圍,對(duì)在范圍內(nèi)的觀察值做分析處理可編輯-精選文檔 -例:replace x1="123"in 100/200/ 把第 100-200條記錄中的X1 變量值改為 1236 、 for:用來(lái)指定變量例:for y1-y10 z1-z5: regress x1-x22/ 把 y1-y10,z1-z5分別于 x1-x22做回歸,一次性代表15 次回歸,其中 是替換符,代表y1-y10, z1-z57 、函數(shù):abs(x)絕對(duì)值e

18、xp(x)指數(shù)函數(shù)log(x)自然對(duì)數(shù)log10(x)常用對(duì)數(shù)sqrt(x)平方根uniform(x)生成( 0,1 )內(nèi)均勻分布的偽隨機(jī)數(shù)length(x)計(jì)算長(zhǎng)度substr(s,n1,n2)獲得從 S 的 n1 個(gè)字符開(kāi)始的n2 個(gè)字符組成的字符串real(x)將字符串 s 轉(zhuǎn)換為數(shù)值函數(shù)可編輯-精選文檔 -trim(x)去除字符串前面和后面的空格int(x)去掉 x 的小數(shù)部分,得到整數(shù)sum(X)求和max(x)min(x)最大值最小值_n當(dāng)前觀察值的位置_N觀察值的總個(gè)數(shù)8 、 ren:重命名例: renvar1var123/把 var1 重新命名為var1239 、 des: 描

19、述數(shù)據(jù)庫(kù)的基本情況10 、 label:為變量添加一些說(shuō)明,以示說(shuō)明11 、 sort:按照某一變量從小到大排序gsort+/- :按照某一變量從大到小或者從小到大排序sort var1 var2:按照 var1 大小排序,相同的var1 按照 var2 大小排序12 、 drop: 刪除變量或者記錄drop x1 x2可編輯-精選文檔 -drop x1-x5drop in 1/100drop if x=.|y=.drop _all/ 清空數(shù)據(jù)庫(kù)13 、 keep:與 drop對(duì)應(yīng),保存變量14 、 append: 縱向連接數(shù)據(jù)庫(kù)15 、 merge: 橫向連接數(shù)據(jù)庫(kù)16 、 gen:生成新變

20、量gen bh=_n/ 將數(shù)據(jù)庫(kù)的內(nèi)部編號(hào)賦給變量bh17 、 replace: 更改變量值replace z=. if z=9/ 將所有 z=9 的值用缺失值代替18 、 set obs:增加空白記錄set obs 20/ 增加 20 條空白記錄19 、 format:改變數(shù)據(jù)格式可編輯-精選文檔 -format tjrq %td/ 將 tjrq 改成日期形式20 、 l: list將結(jié)果列出21 、su: 對(duì)分析數(shù)據(jù)進(jìn)行描述,均值標(biāo)準(zhǔn)差等, 與 des 不同, des 是描述數(shù)據(jù)庫(kù)變量個(gè)數(shù),格式等su x, d/對(duì) x 進(jìn)行統(tǒng)計(jì)描述,如果加了d ,那么就會(huì)更加detail22 、 cent

21、ile:百分位數(shù)計(jì)算centile x, centile(2.5,50,97.5)/ 計(jì)算變量x 的 2.5,50.97.5百分位數(shù)23 、 tab: 頻數(shù)表達(dá)tab sex/ 計(jì)算兩個(gè)性別各自的頻數(shù)tab sex group/ 看看各組性別分布的情況tab group, sum(x1)/ 在各組內(nèi)對(duì)x1 統(tǒng)計(jì)分析24 、 ci: 計(jì)算可信區(qū)間25 、直方圖: gra x, bin(9) xlab(10,20,30,40) ylab(0,1,2,3) norm gap(4) b2("height(cm)")/ 對(duì) x 畫(huà)直方圖,分為9 組, X 軸為 10,20,30,40

22、, y 軸為 0,1,2,3 ,加上正態(tài)分布曲線,標(biāo)題與坐標(biāo)軸的距離(1-8 ),下坐標(biāo)軸加標(biāo)題為height(cm)可編輯-精選文檔 -b1/t1/l1/r1("")給各個(gè)坐標(biāo)軸加標(biāo)題b2/t2/l2/r2("")給各個(gè)坐標(biāo)軸加副標(biāo)題title給圖加總標(biāo)題條圖: gra x1 x2, bar by(group) sh(31) l1("rate of die") b1("comparison of rateof die")/對(duì) x1,x2 畫(huà)條圖,分組變量為group ,兩組的明暗對(duì)比度為3:1 ,左標(biāo)題rate

23、of die,下標(biāo)題 comparison of rate of die餅圖: gra x1 x2 x3 x4 x5, pie by(group) sh(31) total散點(diǎn)圖與線圖:connect(簡(jiǎn)寫(xiě) c)連接散點(diǎn)的方式:.不連接l 直線連接s 平滑曲線連接| 直線連接在同一縱向上的兩點(diǎn)J 階梯式線條連接可編輯-精選文檔 -symbol(簡(jiǎn)寫(xiě) s)各個(gè)散點(diǎn)的圖形:O大圓圈S 大方塊T 大三角型o 小圓圈d 小菱形p 小加號(hào).小點(diǎn)gra y x,xlab ylab c(l) s(d)箱式圖:gra y x, oneway/twoway box26 、單樣本均數(shù)t 檢驗(yàn):ttestx=14.

24、02 (總體均數(shù))ttestin mean sd可編輯-精選文檔 -配對(duì) t 檢驗(yàn):ttest x1=x2兩樣本均數(shù)t 檢驗(yàn): ttest x1=x2,unpairedttest x, by(group)27 、方差分析:方差齊性檢驗(yàn):sdtest x1=x2sdtest x, by (group)正態(tài)性檢驗(yàn):sktestx單因素方差分析:oneway相應(yīng)變量分組變量?jī)梢蛩胤讲罘治觯篴nova相應(yīng)變量分組變量1 分組變量2多因素方差分析:anova x a b c . a*b b*c a*b*c./ 乘積項(xiàng)代表交互作用28 、率、構(gòu)成比的比較:tab var1var2 fw=頻數(shù)變量 chi2

25、pearson卡方檢驗(yàn)exactfisher確切概率法如果是原始資料RXC 列聯(lián)表:tabi第一行數(shù)字從左到右第二行從左到右最后一行從左到右, row chi2 exact可編輯-精選文檔 -29 、 隊(duì)列研究(暴露, 不暴露): ir病例變量暴露變量時(shí)間變量./ irsabn1n2cs 病例變量暴露變量/ csiabcd病例對(duì)照研究(發(fā)病,不發(fā)病): cci a b c d30 、等級(jí)資料:genrank編秩genrank rankx=xsigntest符號(hào)檢驗(yàn)類似 t 檢驗(yàn),signtest x=常數(shù), signtest x1=x2, signrank x1=x2signrank符號(hào)秩和檢驗(yàn)ranksum/Wilco

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論