STATA簡(jiǎn)單命令

上傳人：3*** IP屬地：湖北上傳時(shí)間：2021-07-10 格式：DOCX 頁(yè)數(shù)：13 大?。?4.87KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩8頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、STATA的簡(jiǎn)單命令Stata中最重要的命令莫過(guò)于help和search了。help用于查找精確的命令，而search是模糊查找。例如：help regress又如：我們記不清regress命令的全名，只記得regress的前半部分reg，那么可以輸入search reg用戶獲得信息最有效的另一個(gè)途徑是使用Statalist在線論壇，該論壇提供Stata用戶交流的一個(gè)良好的平臺(tái)。要加入Statalist，我們可以給以下地址發(fā)個(gè)郵件：郵件的內(nèi)容為：subscribe Statalist變量的命名：1. 變量名可達(dá)32個(gè)字符。2. 字符組成

2、部分為AZ、az、09與下劃線“_”，這些字符以外的其他符號(hào)不可以出現(xiàn)在變量名中。3. 變量名不能以數(shù)字開(kāi)頭。4. 變量名區(qū)分大小寫(xiě)。5. 倘若遵循以上原則依然無(wú)法正常命名變量，那么這個(gè)變量可能與Stata自身保留的供系統(tǒng)使用的變量重復(fù)了。創(chuàng)建數(shù)據(jù)文件的方法：1. 手動(dòng)輸入。2. 從excel等文件中復(fù)制粘貼到stata數(shù)據(jù)表中。3. 運(yùn)用stata軟件導(dǎo)入。查看數(shù)據(jù)的概貌：summarize xcodebook x如果上面兩個(gè)命令后面不加內(nèi)容，那么顯示的結(jié)果是所有變量的概貌。對(duì)數(shù)據(jù)進(jìn)行排序的命令：sort 標(biāo)準(zhǔn)1 標(biāo)準(zhǔn)2 標(biāo)準(zhǔn)3生成數(shù)據(jù)的命令：gen1. 如果要得到一階差分，可以用以下命令：

3、gen Difference_invest（新變量的名稱是任意的）=d.invest（d.是運(yùn)算符號(hào)，不得改變；invest是變量名稱）2. 要想產(chǎn)生一個(gè)新的變量Lag_invest，也就是invest的一階滯后，那么我們可以采用如下命令：gen Lag_invest = l.invest3. 生成對(duì)數(shù)的命令：gen Ln_invest=ln(invest)作散點(diǎn)圖的命令：scatter1. scatter x1 x2：scatter后的第一個(gè)變量是縱軸的變量，第二個(gè)變量是橫軸的變量。2. scatter x1 x2, connect(1)：以直線的方式連接相鄰的兩個(gè)點(diǎn)。3. scatter

4、x1 x2, connect(1) msymbol(i)：散點(diǎn)的顯示方式為“看不見(jiàn)”。相關(guān)性檢驗(yàn)：回歸方程的斜率系數(shù)在一定程度上也是反映兩個(gè)變量之間關(guān)系的密切程度，斜率系數(shù)的平方根就是相關(guān)系數(shù)。1. pwcorr命令（用于計(jì)算Pearson相關(guān)系數(shù)），它的好處是盡可能使用兩兩變量中所有沒(méi)有缺失的數(shù)據(jù)，而不像correlate只采用沒(méi)有任何缺失數(shù)據(jù)的完整的觀測(cè)值。pwcorr varlist, sig star(.1)：star(.1)是為了對(duì)顯著性超過(guò)0.1的相關(guān)系數(shù)打上星號(hào)pwcorr varlist, sig print (.1)：print (.1)則是僅僅顯示這些顯著的相關(guān)系數(shù)2. s

5、pearman命令（用于計(jì)算Spearman相關(guān)系數(shù)）。截面數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)截面數(shù)據(jù)文件？只需要從excle中拷貝相應(yīng)的數(shù)據(jù)到stata中即可，不需要特別的命令說(shuō)明它是截面數(shù)據(jù)。截面數(shù)據(jù)的回歸主要需要注意以下幾點(diǎn)：多重共線性（當(dāng)樣本量較小時(shí)，例如小于100）和異方差。而且需要考察t統(tǒng)計(jì)值、R2（adj-R2）、F統(tǒng)計(jì)量。1. 檢驗(yàn)自變量的相關(guān)性。（第1步也可以暫時(shí)不做，等到回歸結(jié)束以后再做）pwcorr varlist, sig print(.05)2. 對(duì)模型進(jìn)行回歸。一個(gè)普通的回歸命令：reg y x1 x2 x3 x4 x5, robust（截面數(shù)據(jù)一律加上robust）倘若回

6、歸結(jié)果的經(jīng)濟(jì)學(xué)含義不合理（包括系數(shù)的正負(fù)號(hào)和顯著性水平），而且前面的相關(guān)性檢驗(yàn)中自變量的相關(guān)性十分高，那么有可能存在嚴(yán)重的多重共線性，為了精確起見(jiàn)，可以用vif來(lái)判斷多重共線性是否嚴(yán)重（當(dāng)vif的最大值大于10，同時(shí)各vif的平均值大于1時(shí)，表明多重共線性比較嚴(yán)重。使用vif命令時(shí)一定要在回歸命令執(zhí)行以后再用）。如何處理多重共線性？剔除變量法、逐步回歸法以及增加樣本容量。3. 運(yùn)用剔除變量法進(jìn)行回歸。4. 運(yùn)用逐步回歸法進(jìn)行回歸。逐步回歸命令：sw reg y x1 x2 x3 x4 x5, pr(.1)：逐步回歸，從最不顯著的變量開(kāi)始刪除，直到所有變量在設(shè)定水平下（0.1）顯著。sw reg

7、 y x1 x2 x3 x4 x5, pr(.1) lockterm1：逐步回歸，從最不顯著的變量開(kāi)始刪除，直到所有變量在設(shè)定水平下（0.1）顯著；而且加入lockterm項(xiàng)，為了保證第一項(xiàng)自變量不被刪除。sw reg y x1 x2 x3 (x4 x5), pr(.1)：逐步回歸，從最不顯著的變量開(kāi)始刪除，直到所有變量在設(shè)定水平下（0.1）顯著；而且加入（）項(xiàng)，為了保證x4和x5要么同時(shí)出現(xiàn)，要么同時(shí)不出現(xiàn)。時(shí)間序列數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)截面數(shù)據(jù)文件？先把數(shù)據(jù)轉(zhuǎn)移到stata中，然后用tsset命令。tsset time, yearly（或者weekly、monthly、quarterl

8、y）此時(shí)，一定要保證表示時(shí)間的那一列數(shù)據(jù)（即年份）的名稱為time。時(shí)間序列數(shù)據(jù)的回歸主要需要注意以下幾點(diǎn)：多重共線性（當(dāng)樣本量較小時(shí)，例如小于100）和序列相關(guān)性。而且需要考察t統(tǒng)計(jì)值、R2（adj-R2）、F統(tǒng)計(jì)量、D.W.值。首先用reg命令進(jìn)行回歸，例如：reg y x1 x2 x3 x4 x5，并考察D.W.值（使用estat dwatson這一命令），如果D.W.值嚴(yán)重遠(yuǎn)離2，那么要進(jìn)行調(diào)整（調(diào)整方法如黃色底紋），直到調(diào)整到2附近，然后考察回歸結(jié)果是否符合經(jīng)濟(jì)學(xué)含義，倘若不符合，那么要注意是否受到多重共線性的影響（通過(guò)相關(guān)系數(shù)和vif值來(lái)判斷）。在處理多重共線性時(shí)，可以用類似于處理

9、截面數(shù)據(jù)的方法（剔除變量法），同時(shí)還要看D.W.值。此外，還可以用差分法來(lái)處理多重共線性（此方法用得不多）。檢驗(yàn)DW值的命令：estat dwatson用廣義差分法考慮序列相關(guān)性的命令（即調(diào)整DW值的命令）：reg y x1 x2 x3 x4 x5 L.y（后面還可以運(yùn)用L.y L2.y）用序列相關(guān)穩(wěn)健標(biāo)準(zhǔn)誤法考慮序列相關(guān)性的命令（即調(diào)整DW值的命令）：reg y x1 x2 x3 x4 x5, robust考慮多重共線性的方法除了以上截面數(shù)據(jù)中用到的方法以外，還可以用差分法，然后再看vif值。reg D.y D.x1 D.x2 D.x3 D.x4 D.x5面板數(shù)據(jù)的估計(jì)命令如何創(chuàng)建一個(gè)面板數(shù)

10、據(jù)文件？錄入數(shù)據(jù)xtset id year面板數(shù)據(jù)的回歸主要需要注意：多重共線性（當(dāng)樣本量較小時(shí)），異方差和序列相關(guān)性在很多研究中可以不必深究。而且需要考察t統(tǒng)計(jì)值、R2（adj-R2）、F統(tǒng)計(jì)量，選擇固定效應(yīng)（fixed effect）或隨機(jī)效應(yīng)（random effect）。多重共線性的處理方法可以參照截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)的處理方法。固定效應(yīng)和隨機(jī)效應(yīng)的選擇：（xtreg后面緊挨著的變量是被解釋變量，然后接下來(lái)才是解釋變量）xtreg 被解釋變量解釋變量, feest store fextreg 被解釋變量解釋變量, reest store rehausman fe原假設(shè)是隨機(jī)效應(yīng)，

11、p值太小可以拒絕原假設(shè)，如果hausman檢驗(yàn)的結(jié)果(Probchi2)小于0.1，那么選擇固定效應(yīng)；如果(Probchi2)大于0.1，或者chi2的值小于0，那么選擇隨機(jī)效應(yīng)。其它命令GMM方法：xtabond depvar indepvarssargan 檢驗(yàn)：estat sargan自相關(guān)檢驗(yàn)：estat abond同時(shí)控制時(shí)間因素（year）和行業(yè)因素（industrycode），即自動(dòng)加入虛擬變量的命令xi的用法：xi i.year i.industrycode加入自動(dòng)生成的虛擬變量，并且運(yùn)用穩(wěn)健標(biāo)準(zhǔn)誤進(jìn)行固定效應(yīng)回歸的命令：xtreg lnex lngdpcn lngdppart

12、ner educationjob iprrd lawhi i.year i.industrycode, fe robust面板數(shù)據(jù)中2sls的命令（這可能是默認(rèn)的命令，還可以根據(jù)具體情況更改）：（1）xtivreg lnex lk tfp rd size fdi i.year i.id (finance=l.finance)，此時(shí)懷疑解釋變量finance是內(nèi)生的，而且以finance的一階滯后作為IV。注意：括號(hào)前面必須有空格?。?）xtivreg lnex lk tfp rd size fdi i.year i.id (finance=l.finance l2.finance)，此時(shí)懷疑解

13、釋變量finance是內(nèi)生的，而且以finance的一階滯后和二階滯后作為IV。注意：括號(hào)前面必須有空格！如果用overid，需要安裝overid ：ssc install overid, replace如果用xtoverid，需要安裝xtoverid ：ssc install xtoverid, replace如果用ranktest，需要安裝ranktest ：ssc install ranktest, replace有時(shí)即使安裝以后依然無(wú)法運(yùn)用，可能是由于自變量太多導(dǎo)致的，例如控制行業(yè)固定效應(yīng)、時(shí)間固定效應(yīng)等固定效應(yīng)時(shí)會(huì)增加幾十個(gè)虛擬變量，這時(shí)可能由于模型無(wú)法運(yùn)算而無(wú)法運(yùn)用這些命令，GMM

14、方法似乎也有類似情況。例如：xtivreg lnex lngdpcn lngdppartner distance language border (fincountry=l.fincountry l2.fincountry) findep financefin,re檢驗(yàn)工具變量識(shí)別不足時(shí)用命令ranktest，以上例子應(yīng)該是ranktest (fincountry) (l.fincountry l2.fincountry)【理想的結(jié)果是Kleibergen-Paap rk LM的p值小于0.1】檢驗(yàn)弱工具變量時(shí)也用命令ranktest，但要在后面加上wald，以上例子應(yīng)該是ranktest (

15、fincountry) (l.fincountry l2.fincountry),wald【理想的結(jié)果是Kleibergen-Paap Wald rk F的p值小于0.1】檢驗(yàn)過(guò)度識(shí)別時(shí)用命令xtoverid【理想的結(jié)果Sargan-Hansen檢驗(yàn)的p值大于0.1】博客的命令整理，供參考，未經(jīng)博主允許不得轉(zhuǎn)載。1、input: 輸入數(shù)據(jù)例： inpurt x y 1 4 2 3.5 3 7 end2、by: 按照某一變量的取值來(lái)進(jìn)行分析例：一般要先sort(排序),然后 by group: regress Y x1 x2 /按照不同的組，對(duì)Y分別作四個(gè)回歸分析3、weight: 加權(quán)或者頻數(shù)

16、例：fw=頻數(shù)變量 /多用在四格表資料中或者未原資料未給出所有值，只給出了值和對(duì)應(yīng)的頻數(shù)4、if: 用條件語(yǔ)句指定條件例：drop if group=1|group=2 /把group變量值為1或者2的記錄刪除掉5、in:指定觀察值的范圍，對(duì)在范圍內(nèi)的觀察值做分析處理例：replace x1=123 in 100/200 /把第100-200條記錄中的X1變量值改為1236、for: 用來(lái)指定變量例：for y1-y10 z1-z5: regress x1-x22 /把y1-y10,z1-z5分別于x1-x22做回歸，一次性代表15次回歸，其中是替換符，代表y1-y10, z1-z57、函數(shù)：

17、abs(x) 絕對(duì)值exp(x) 指數(shù)函數(shù)log(x) 自然對(duì)數(shù)log10(x) 常用對(duì)數(shù)sqrt(x) 平方根uniform(x) 生成（0,1）內(nèi)均勻分布的偽隨機(jī)數(shù)length(x) 計(jì)算長(zhǎng)度substr(s,n1,n2) 獲得從S的n1個(gè)字符開(kāi)始的n2個(gè)字符組成的字符串real(x) 將字符串s轉(zhuǎn)換為數(shù)值函數(shù)trim(x) 去除字符串前面和后面的空格int(x) 去掉x的小數(shù)部分，得到整數(shù)sum(X) 求和max(x) min(x) 最大值最小值_n 當(dāng)前觀察值的位置_N 觀察值的總個(gè)數(shù)8、ren: 重命名例：ren var1 var123 / 把var1重新命名為var1239、des

18、:描述數(shù)據(jù)庫(kù)的基本情況 10、label: 為變量添加一些說(shuō)明，以示說(shuō)明11、sort: 按照某一變量從小到大排序 gsort +/-：按照某一變量從大到小或者從小到大排序 sort var1 var2:按照var1大小排序，相同的var1按照var2大小排序12、drop:刪除變量或者記錄 drop x1 x2 drop x1-x5 drop if x0 drop in 1/100 drop if x=.|y=. drop _all /清空數(shù)據(jù)庫(kù)13、keep: 與drop對(duì)應(yīng)，保存變量14、append:縱向連接數(shù)據(jù)庫(kù)15、merge:橫向連接數(shù)據(jù)庫(kù)16、gen: 生成新變量 gen bh

19、=_n /將數(shù)據(jù)庫(kù)的內(nèi)部編號(hào)賦給變量bh17、replace:更改變量值 replace z=. if z=9 /將所有z=9的值用缺失值代替18、set obs: 增加空白記錄 set obs 20 /增加20條空白記錄19、format: 改變數(shù)據(jù)格式 format tjrq %td /將tjrq改成日期形式20、l: list 將結(jié)果列出21、su: 對(duì)分析數(shù)據(jù)進(jìn)行描述，均值標(biāo)準(zhǔn)差等，與des不同，des是描述數(shù)據(jù)庫(kù)變量個(gè)數(shù)，格式等su x, d / 對(duì)x進(jìn)行統(tǒng)計(jì)描述，如果加了d，那么就會(huì)更加detail22、centile: 百分位數(shù)計(jì)算centile x, centile(2.5,5

20、0,97.5) /計(jì)算變量x的2.5,50.97.5百分位數(shù)23、tab:頻數(shù)表達(dá)tab sex /計(jì)算兩個(gè)性別各自的頻數(shù)tab sex group /看看各組性別分布的情況tab group, sum(x1) /在各組內(nèi)對(duì)x1統(tǒng)計(jì)分析24、ci: 計(jì)算可信區(qū)間25、直方圖：gra x, bin(9) xlab(10,20,30,40) ylab(0,1,2,3) norm gap(4) b2(height (cm) /對(duì)x畫(huà)直方圖，分為9組，X軸為10,20,30,40，y軸為0,1,2,3，加上正態(tài)分布曲線，標(biāo)題與坐標(biāo)軸的距離（1-8），下坐標(biāo)軸加標(biāo)題為height(cm)b1/t1/l1

21、/r1() 給各個(gè)坐標(biāo)軸加標(biāo)題b2/t2/l2/r2() 給各個(gè)坐標(biāo)軸加副標(biāo)題title 給圖加總標(biāo)題條圖：gra x1 x2, bar by(group) sh(31) l1(rate of die) b1(comparison of rate of die)/ 對(duì)x1,x2畫(huà)條圖，分組變量為group，兩組的明暗對(duì)比度為3:1，左標(biāo)題rate of die，下標(biāo)題comparison of rate of die 餅圖：gra x1 x2 x3 x4 x5, pie by(group) sh(31) total 散點(diǎn)圖與線圖：connect（簡(jiǎn)寫(xiě)c）連接散點(diǎn)的方式：. 不連接 l 直線連

22、接 s 平滑曲線連接 | 直線連接在同一縱向上的兩點(diǎn) J 階梯式線條連接 symbol(簡(jiǎn)寫(xiě)s)各個(gè)散點(diǎn)的圖形：O 大圓圈 S 大方塊 T 大三角型 o 小圓圈 d 小菱形 p 小加號(hào) . 小點(diǎn) gra y x, xlab ylab c(l) s(d) 箱式圖： gra y x, oneway/twoway box26、單樣本均數(shù)t檢驗(yàn)： ttest x=14.02（總體均數(shù)） ttesti n mean sd 配對(duì)t檢驗(yàn)： ttest x1=x2 兩樣本均數(shù)t檢驗(yàn)：ttest x1=x2,unpaired ttest x, by(group)27、方差分析：方差齊性檢驗(yàn)：sdtest x1=

23、x2 sdtest x, by (group) 正態(tài)性檢驗(yàn)： sktest x 單因素方差分析： oneway 相應(yīng)變量分組變量兩因素方差分析：anova 相應(yīng)變量分組變量1 分組變量2 多因素方差分析：anova x a b c . a*b b*c a*b*c. /乘積項(xiàng)代表交互作用28、率、構(gòu)成比的比較： tab var1 var2 fw=頻數(shù)變量 chi2 pearson卡方檢驗(yàn) exact fisher確切概率法如果是原始資料RXC列聯(lián)表： tabi 第一行數(shù)字從左到右第二行從左到右.最后一行從左到右, row chi2 exact29、隊(duì)列研究（暴露，不暴露）： ir 病例變量暴露變量時(shí)間變量 ./ irs a b n1 n2 cs 病例變量暴露變量 / csi a b c d 病例對(duì)照研究（發(fā)病，不發(fā)?。篶ci a b c d30、等級(jí)資料： genrank 編秩 genrank rankx=x signtest 符號(hào)檢驗(yàn) 類似t檢驗(yàn)，signtest x=常數(shù)，signtest x1=x2, signrank x1=x2 signrank 符號(hào)秩和檢驗(yàn) ranksum/Wilcoxon 兩樣本秩和檢驗(yàn) wilcoxon var, by (group_var) k

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

STATA簡(jiǎn)單命令

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

STATA簡(jiǎn)單命令

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔