stata 第一章 基本操作_第1頁
stata 第一章 基本操作_第2頁
stata 第一章 基本操作_第3頁
stata 第一章 基本操作_第4頁
stata 第一章 基本操作_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、宋順林中央財(cái)經(jīng)大學(xué) 會(huì)計(jì)學(xué)院內(nèi)容提綱n1.1導(dǎo)入數(shù)據(jù)n1.2編輯數(shù)據(jù)n1.3描述數(shù)據(jù)n1.4結(jié)果和程序管理n1.5多表數(shù)據(jù)管理1.1 導(dǎo)入數(shù)據(jù)打開Stata軟件STATA由四個(gè)窗口構(gòu)成Review (列出歷史命令)Variables (變量列表)Results (報(bào)告結(jié)果)Command (輸入命令)你可以通過下列菜單調(diào)整窗口設(shè)置Edit/preferencesWindow/command, variables display 命令在命令窗口輸入:display 1display song 試試以下兩者的區(qū)別:display 1+1 display 1+1Help 命令菜單窗口help/pdf

2、 document (Stata基本參考手冊)help/content (Stata所有命令 介紹)help/stata command (搜索查詢Stata命令)命令窗口help + stata 命令,例如:help displayhelp help 另外,你也可以利用search命令尋求幫助,例如:search displaysearch help Insheet:導(dǎo)入數(shù)據(jù)通常數(shù)據(jù)來源于數(shù)據(jù)庫下載,而不是手工錄入導(dǎo)入格式Stata不能直接支持很多格式(Excel files, SAS files)可以先保存為csv格式后再導(dǎo)入stata準(zhǔn)備工作:將Excel文件另存為csv格式,然后導(dǎo)入

3、csv文件。菜單窗口File/import/ASCII data created by spreadsheet /browse file name 命令窗口insheet using D:Teach課件STATAdatacorgov.csv ,clear在知道文件路徑的情況下,往往使用insheet命令更為方便對insheet了解更多, pls help insheetdrop _all and clear首先導(dǎo)入數(shù)據(jù)insheet using D:Teach課件STATAdatacorgov.csv ,clear然后試試以下兩個(gè)的差別:insheet using D:Teach課件STATA

4、datacorgov.csv insheet using D:Teach課件STATAdatacorgov.csv ,clear為什么要加clear,原因是:你必須先清除(clear)原來的數(shù)據(jù),才能導(dǎo)入新的數(shù)據(jù)你也可以先用drop _all 刪除原有數(shù)據(jù),然后導(dǎo)入新的數(shù)據(jù)檢查數(shù)據(jù)describe ,list,browse,edit 導(dǎo)入數(shù)據(jù)之后,你可以檢查一下數(shù)據(jù)是否導(dǎo)入成功,有好幾種方式可以幫到你:在命令窗口輸入describe 或 d ,將顯示樣本、變量數(shù)、數(shù)據(jù)大小及變量的詳細(xì)信息。輸入入list, 顯示所有樣本數(shù)據(jù),試試以下命令:list in 1 list in 2/10輸入brow

5、se 或br, 在數(shù)據(jù)窗口瀏覽所有數(shù)據(jù)輸入edit,不僅可以數(shù)據(jù)窗口瀏覽數(shù)據(jù),而且可以編輯和修改數(shù)據(jù)試試browse,list,edit三個(gè)命令,看看三者的區(qū)別注意:上述命令也可以通過菜單的方式實(shí)現(xiàn)。保存數(shù)據(jù)菜單窗口File/save File/save as(另存為)命令窗口save D:Teach課件STATAdatacorgov.dta save D:Teach課件STATAdatacorgov.dta ,replace replace的作用是,如果文件已存在,則替換注意stata格式文件的后綴為.dta練習(xí)1.1導(dǎo)入表名為earning的Excel格式數(shù)據(jù)檢查數(shù)據(jù)保存數(shù)據(jù)為stata數(shù)

6、據(jù)格式1.2編輯數(shù)據(jù)打開stata數(shù)據(jù)use D:Teach課件STATAdatacorgov.dta,cleardrop命令,刪除變量或觀察值drop if year=2010,刪除所有2010年的變量drop year,刪除year這個(gè)變量drop _all,刪除所有變量注意:stata值的等號全為雙等號,單等號是賦值命令,在以后的操作中,注意=號和=號的區(qū)別。 打開stata數(shù)據(jù)use D:Teach課件STATAdatacorgov.dta,clearkeep命令是drop命令的反向命令keep year topone,刪除其它變量,只保留year和topone這兩個(gè)變量keep if

7、 year=2010,刪除其它年度變量,只保留2010年的變量rename,編輯變量名稱rename topone top1label ,為變量名貼標(biāo)簽,以更容易理解label var top1 第一大股東持股比例clear,清空所有數(shù)據(jù)練習(xí)1.打開stata數(shù)據(jù)刪除private變量變量只保留stkcd year兩個(gè)變量刪除2008年的數(shù)據(jù)只保留2010年的數(shù)據(jù)將year變量改名為y將y的標(biāo)簽設(shè)置為年度1.3描述數(shù)據(jù)count,看看有多少樣本count count if year=2008summary or sum,描述樣本的統(tǒng)計(jì)量sum topone ,描述topone變量最基本統(tǒng)計(jì)量,

8、均值、方差、最小值、最大值sum topone, d,描述topone變量更為詳細(xì)的統(tǒng)計(jì)量,包括偏度、峰度、分位數(shù)。tabulate或tab,描述離散變量的基本統(tǒng)計(jì)量tab private,描述private變量為0和1的百分比 練習(xí)1.3用stata打開corgov文件看看一共有多少家樣本看看2010年一共有多少家樣本看看roa變量均值、方差、最小值、最大值是多少看看roa變量的5,75的分位數(shù)是多少,偏度是多少看看2010年private等于的比例是多少1.4結(jié)果和程序管理log命令,你可以用log存儲(chǔ)命令和結(jié)果use D:Teach課件STATAdatacorgov.dta,clear打

9、開log文件:capture log using “D:Teach課件STATAdataoutput.log”,replacesum toponesum topone,dtab private查看log文件:view “D:Teach課件STATAdataoutput.log”關(guān)閉log文件:log close查查capture有什么功能,help capture注意:log命令的功能同樣可以通過菜單方式實(shí)現(xiàn)用doedit和do命令管理程序步驟用doedit打開程序管理窗口編輯程序,保存程序,運(yùn)行程序例子use D:Teach課件STATAdatacorgov.dta,clear打開程序:do

10、edit輸入一系列命令:sum toponesum topone,dtab private保存程序運(yùn)行程序:do D:Teach課件STATAdatado.do思考doedit和do的用處?練習(xí)1.4建立一個(gè)log文件執(zhí)行一些操作用log文件存儲(chǔ)你的操作結(jié)果建立一個(gè)程序文件(do file)執(zhí)行一些操作用do命令運(yùn)行你的程序文件1.3 多組數(shù)據(jù)處理整理數(shù)據(jù)過程中,我們經(jīng)常會(huì)遇到兩種情況我們希望在2000年的數(shù)據(jù)表后面加上2001年相同變量的樣本數(shù)據(jù)-加行我們希望在原始數(shù)據(jù)基礎(chǔ)上增加對樣本公司的其他特征的變量-添列Business School of SYSU, 2010191.3 多組數(shù)據(jù)處理

11、多組數(shù)據(jù)處理NameyearSizeA2000B2000nameYearsizeA2000B2000nameyearsizeA2000B2000A2001B2001nameyearsizeA2000B2000nameyearindustryA2000B2000nameyearsizeindustryA2000B2000Master dataUsing data1.5多表數(shù)據(jù)管理append 命令:數(shù)據(jù)表之間縱向合并,追加數(shù)據(jù)insheet using D:Teach課件STATAdatacorgov99-00.csv ,clearsave D:Teach課件STATAdatacorgov99-

12、00.dta ,replaceinsheet using D:Teach課件STATAdatacorgov01-10.csv ,clearappend using D:Teach課件STATAdatacorgov99-00.dta save D:Teach課件STATAdatacorgov99-10.dta,replacebrmerge命令 數(shù)據(jù)表之間橫向合并,追加新的變量insheet using D:Teach課件STATAdatacorgov.csv,clearsort stkcd yearsave D:Teach課件STATAdatacorgov.dta,replaceinsheet

13、using D:Teach課件STATAdataearning.csv,clearsort stkcd yearmerge stkcd year using D:Teach課件STATAdatacorgov.dta tab _merge(數(shù)值為1表示表一有,表二沒有;2表示表二有表一沒有;3表示都有)browsesave D:Teach課件STATAdatacorfin.dta,replacebrhelp _merge注意append命令和merge命令區(qū)別思考merge和append命令相對于excel直接copy的優(yōu)勢使用merge命令時(shí),經(jīng)常容易出錯(cuò),merge完后,一定要檢驗(yàn)數(shù)據(jù)是否正確,可以用browse,也可以tab _merge。常見錯(cuò)誤包括:忘記sort一下數(shù)據(jù),合并不成功忘記添加關(guān)鍵詞,導(dǎo)致合并的數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論