stata使用手冊(cè)資料_第1頁(yè)
stata使用手冊(cè)資料_第2頁(yè)
stata使用手冊(cè)資料_第3頁(yè)
stata使用手冊(cè)資料_第4頁(yè)
stata使用手冊(cè)資料_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余6頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、STATA基本入門(mén)、八、刖言STATA是 一個(gè)十分好用而且簡(jiǎn)單的統(tǒng)計(jì)軟件包,透過(guò)輕松的數(shù)據(jù)輸入方式,而且簡(jiǎn)單的指令,即可執(zhí)行一般在計(jì)量經(jīng)濟(jì)學(xué)上常用的計(jì)量模型。除了計(jì)量模型 外,STATA勺軟件包中也可執(zhí)行統(tǒng)計(jì)學(xué)中的估計(jì)和檢定,甚至是多變量分析中的 各項(xiàng)分析工具。因此,STATA可以說(shuō)是一個(gè)相當(dāng)強(qiáng)而有力的統(tǒng)計(jì)軟件。一、安裝STATA所須的內(nèi)存容量不大,只有。此外,安裝也相當(dāng)簡(jiǎn)單,只要在SETUP上點(diǎn)兩下,安裝完成后再分別輸入”Sn”、”Code和”Key”即可開(kāi)始使用。 但是安裝過(guò)程中有一點(diǎn)必須注意的是,如下圖所示,有”Intercooled” 和”Small”兩個(gè)選項(xiàng)。一般而言,為了方便日后要

2、設(shè)定較大的內(nèi)存容量來(lái)處理 大筆的資料,通常選擇以”In tercooled”進(jìn)行安裝。、窗口介紹以此項(xiàng)進(jìn)行安裝安裝完成后,點(diǎn)選桌面上STATA勺圖標(biāo),窗口畫(huà)面如下圖所示。為了使畫(huà)面美觀,我們可以將畫(huà)面拉到自己喜歡的地方,如下圖所示。為了保存這個(gè)窗口 畫(huà)面,我們必須點(diǎn)選工具列上的”P(pán)refs”下的”Save Windowing Preferences”。如此一來(lái),以后開(kāi)啟STATA寸都會(huì)以此窗口畫(huà)面呈現(xiàn)。(1)確認(rèn)數(shù)據(jù)輸入無(wú)誤;(2)只要在某變量上點(diǎn)選兩下,該變量即會(huì)出現(xiàn)在窗口”Stata Comma nd上。右上一Stata Results:此一窗口用于呈現(xiàn)并記錄指令執(zhí)行后的結(jié)果。右下一Sta

3、ta Comma nd:此一窗口用于輸入所欲執(zhí)行的指令。Note:以上四個(gè)窗口都可以從”Fo nts”去更改字體大小。三、輸入數(shù)據(jù)(Entering data)在本小節(jié)中,我們將介紹如何把數(shù)據(jù)讀進(jìn)STAT A但是在正式介紹之前,我 們必須先對(duì)幾個(gè)一般性的指令(gen eral comma nd)有所了解,說(shuō)明如下:cd:即change directory,簡(jiǎn)言之,告知STATA數(shù)據(jù)儲(chǔ)存的地方。例如當(dāng) 數(shù)據(jù)儲(chǔ)存在e槽的sample數(shù)據(jù)夾時(shí),則必須先輸入cd e:sample。dir /ls:用來(lái)顯示目錄的內(nèi)容。set memory #m設(shè)定內(nèi)存的容量。例如:當(dāng)有一筆龐大的數(shù)據(jù)要處理時(shí),則可設(shè)定1

4、00mb的容量,此時(shí)可輸入set memory100n。(輸入指令memory可以知道內(nèi)存容量的大小以及使用 情況。)set matsize #:設(shè)定所需的變量個(gè)數(shù)。一般而言,不須對(duì)此部分進(jìn)行設(shè)定, 除非所欲處理的資料龐大或是當(dāng)執(zhí)行后出現(xiàn)matsize too small的訊息時(shí)再進(jìn)行修改即可。內(nèi)建為40。set more off / on:若欲執(zhí)行結(jié)果以分頁(yè)的型式呈現(xiàn)時(shí),則輸入set more on; 若欲執(zhí)行結(jié)果同時(shí)呈現(xiàn)時(shí),則輸入set more off。保留於此接下來(lái),我們依序介紹四個(gè)窗口的功用:左上一Review:此一窗口用于記錄在開(kāi)啟STATA后所執(zhí)行過(guò)的所有指令。因此, 若欲使用重

5、復(fù)的指令時(shí),只要在該指令上點(diǎn)選兩下即可執(zhí)行相 同的指令;若欲使用類(lèi)似的指令時(shí),在該指令上點(diǎn)一下,該指 令即會(huì)出現(xiàn)在窗口”Stata Command上,再進(jìn)行修改即可。此 夕卜,STATA還可以將執(zhí)行過(guò)的指令儲(chǔ)存下來(lái),存在一個(gè)do-file內(nèi),下次即可再執(zhí)行相同的指令。下一Variables:此一窗口用于呈現(xiàn)某筆數(shù)據(jù)中的所有變量。換言之,當(dāng)數(shù)據(jù) 中的變量都有其名稱(chēng)時(shí),變量名稱(chēng)將會(huì)出現(xiàn)在此一窗口中。只要數(shù)據(jù)有讀進(jìn)STATA中,變量名稱(chēng)就會(huì)出現(xiàn)。它的優(yōu)點(diǎn)是在此輸入指令執(zhí)行過(guò)的指令都會(huì)資料中的變數(shù)在這裡指令的執(zhí)行結(jié)果看這裡help:求助鍵。后面必須接的是指令。說(shuō)明如何使用該指令,例如:help reg

6、ress。search:求助鍵。后面可接任何文字。說(shuō)明在何處可以找到該文字。例如:searchnormal distribution。clear:清除鍵。用來(lái)刪除所有數(shù)據(jù)。接下來(lái),根據(jù)數(shù)據(jù)類(lèi)型或指令的不同,數(shù)據(jù)輸入的方法可分成以下四種:1、輸入EXCELS 據(jù)將EXCEL勺數(shù)據(jù)輸入STATA勺方式還可細(xì)分成以下兩種:將EXCEL勺數(shù)據(jù)輸入STAT/之前,必須先將數(shù)據(jù)存成csv文件,再利用指令in sheet來(lái)讀數(shù)據(jù)。Example:當(dāng)csv檔的第一列有變量名稱(chēng)時(shí):cd e:sample dir memoryset memory 10m in sheet using當(dāng)csv檔的第一列沒(méi)有變量名稱(chēng)

7、時(shí):in sheet gen der id race ses schtyp prgtype read write mathscie nee socst using直接復(fù)制EXCELt 的數(shù)據(jù),再到STATA選取”Win dow下的”Data Editor”, 點(diǎn)選后會(huì)出現(xiàn)”Stata Editor”工作表,再到”Edit”下選取”P(pán)aste”即可 貼上數(shù)據(jù)。2、輸入ASCII的數(shù)據(jù)型態(tài)依ASCII的數(shù)據(jù)型態(tài)區(qū)分,將ASCII的數(shù)據(jù)輸入STATA勺方式也有以下兩 種:數(shù)據(jù)型態(tài)一:見(jiàn)in file gen der id race ses schtyp str10 prgtype read writ

8、e math scie nee socst usingNote:記住文字的設(shè)定方式(str # variable name)。數(shù)據(jù)型態(tài)二:見(jiàn)第二種的數(shù)據(jù)型態(tài)通常須要codebook。如下表所示variable n ameColumn nu mberid1-2|eng3-4path5-6sex7Hero8-9hacro10-11infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro 10-11 using3、利用Do-file editor輸入數(shù)據(jù)將數(shù)據(jù)或是指令寫(xiě)入Do-file editor,再執(zhí)行即可。例如:將下面 數(shù)據(jù)復(fù)制并貼在Do-f

9、ile editor(選取”Window下的”Do-file editor”)上,再選擇”do currnet file”執(zhí)行即可。cd e:samplein put id female race ses str3 schtype prog read write math scie nee socst147 1 1 3 pub 1 47 62 53 53 61108 0 1 2 pub 2 34 33 41 36 3618 0 3 2 pub 3 50 33 49 44 36153 0 1 2 pub 3 39 31 40 39 5150 0 2 2 pub 2 50 59 42 53 615

10、1 1 2 1 pub 2 42 36 42 31 39102 0 1 1 pub 1 52 41 51 53 5657 1 1 2 pub 1 71 65 72 66 56160 1 1 2 pub 1 55 65 55 50 61136 0 1 2 pub 1 65 59 70 63 51end4、利用STATA勺數(shù)據(jù)型態(tài)輸入除了以上三種方法之外,還可以開(kāi)啟之前以STATA儲(chǔ)存的資料。useNote:此一指令亦可用在讀取網(wǎng)絡(luò)上的數(shù)據(jù)(use網(wǎng)址) 最后,將數(shù)據(jù)輸入的相關(guān)指令整理成下表。in sheetread ASCII (text) data created by a spreadshe

11、etin fileread un formatted ASCII (text) datainfixread ASCII (text) data in fixed formatin puten ter data from keyboarduseload a Stata-format dataset四、探索資料(Exploring data)為了更詳細(xì)地呈現(xiàn)出在數(shù)據(jù)探索時(shí)所需使用的 相關(guān)指 令,我們利 用sample4-1來(lái)說(shuō)明指令的用法。首先,利用前節(jié)所提及的數(shù)據(jù)輸入方法將sample4-1讀進(jìn)STATA在正式分析數(shù)據(jù)之前,我們可以利用一個(gè)log檔來(lái)儲(chǔ)存之后所要執(zhí)行的指令以及所得到的結(jié)果。指令的

12、表示方法如下:log using result4-1, text(log檔的名稱(chēng)為result4-1)接下來(lái),我們可以先利用下面的指令來(lái)檢視sample4-1的數(shù)據(jù):count:可得樣本數(shù)。describe:描述數(shù)據(jù)來(lái)源以及數(shù)據(jù)大小。list:依序列出觀察值的各個(gè)變量值。codebook:描述資料的詳細(xì)內(nèi)容。此外,我們就可以利用summarize、tabulate和tabstat等指令得到數(shù)據(jù) 的敘述統(tǒng)計(jì)與基本特性。表示如下:summarize:列出資料的敘述統(tǒng)計(jì)。Example:summarize write, detailsum write if read=60(sum是summarize

13、的簡(jiǎn)寫(xiě))sum write ifprgtype=academic(接在if之后的句子中 的”=”要放兩個(gè))sum write in 1/40(只列出第1筆到第40筆資料)tabulate:列出變數(shù)的次數(shù)表。Example:tabulate prgtypetabulate prgtype race tabulate prgtype, summarize(read)tabulate prgtype race, summarize(write)tabstat:列出變量的敘述統(tǒng)計(jì)。Example:tabstat read write math, by(prgtype) stat(n mean sd)t

14、abstat write, stat (n mean sd p25 p50 p75) by(prgtype)接下來(lái),我們介紹一些用來(lái)劃圖的指令:莖葉圖:stem writestem write, li nes(2)直方圖:graph write, bin(10)graph write, hist no rmal bin( 10)箱形圖:graph write, boxsort prgtype(要先有這個(gè)指令才能執(zhí)行下一個(gè)指令)graph write, box by(prgtype)此外, 利用correlate或是pwcorr可以得到相關(guān)矩陣; 亦可利用graph劃 出散布圖。correlat

15、e write read scie neepwcorr write read scie nee, obsgraph write read, twowaygraph write read, two jitter(2)(two是twoway的簡(jiǎn)稱(chēng),jitter是用來(lái)區(qū)分重疊的觀察點(diǎn))graph write read, two jitter(2) boxgraph read scie nee write, matrix half現(xiàn)在我們可以將log文件結(jié)束了,指令輸入如下:log close若欲檢視log檔中的結(jié)果,可以輸入指令:type或是到所儲(chǔ)存的目錄下點(diǎn)選。最后,將數(shù)據(jù)探索的相關(guān)指令整理成下表

16、。cou ntShow the nu mber of observati onsdescribeDescribe contents of data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDescriptive statisticstabulateOne- & two-way freque ncy tablestabstatTable of descriptive statisticsstemSte

17、m-a nd-leaf plotgraphHigh resolutio n graphssortSort observatio ns in a datasethistHistogram of a categorical variablecorrelateCorrelati onspwcorrPairwise correlati onstypeDisplay an ASCII file五、修飾資料(Modifying data)在本小節(jié)中,我們亦利用sample4-1的數(shù)據(jù)進(jìn)行說(shuō)明。首先,讀進(jìn)數(shù)據(jù) 讀完數(shù)據(jù)后,可以為此數(shù)據(jù)取個(gè)名稱(chēng),指令如下:label data High School a nd

18、 Beyo nd, 200 cases現(xiàn)在我們可以將變量的順序作一排列。例如:原先的變量順序?yàn)間en der、id和race,但是我們想把順序改成id、gender和race,則可以下面的指 令來(lái)執(zhí)行:order id gender在執(zhí)行codebook時(shí),我們會(huì)發(fā)現(xiàn)有些變量尚未加上卷標(biāo)(label),為了 更清楚地表達(dá)變量所代表的意義,我們可以執(zhí)行以下的指令:label variable schtyp The type of school the student attended.現(xiàn)在,我們想要產(chǎn)生一個(gè)新變量total,此變量代表read、write和math的總和。指令如下:gen era

19、te total = read + write + math此外,若是我們想加總的分?jǐn)?shù)是read、write和socst,而非read、write和math,此時(shí)的指令輸入如下:replace total = read + write + socst另一方面,我們還可以將變量total表示成以等級(jí)(A、B、C、D and F) 的形式。指令如下:gen erate grade = totalrecode grade 0/80=0 80/110=1 110/140=2 140/170=3 170/300=4label define abcdf 0 F 1 D 2 C 3 B 4 Alabel v

20、alues grade abcdf為了記憶變量的意義為何,我們還可以利用note的方式來(lái)記錄變量。指令如下:no tes race: values of race coded as 5 were recoded to be miss ing notes(叫出note的指令)另外,介紹一些利用公式來(lái)產(chǎn)生變量的指令。ege n zread = std(read)summarize zreadlist read zread in 1/10ege n rmea n = mean( read), by(ses)list read ses rmea n in 1/10ege n mread = media

21、 n( read), by(prog)list read prog mread in 1/10最后,我們可以將以上的執(zhí)行結(jié)果儲(chǔ)存下來(lái)。指令如下:save sample5-1(存成另一個(gè)檔)save sample4-1(取代原來(lái)的sample4-1)現(xiàn)在亦將數(shù)據(jù)修飾的相關(guān)指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlabelApply a label to a variablevariablegen erateCreates a new variablereplaceRepl

22、aces one value with ano ther valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablelabel defi neDefine a set of a labels for the levels of a categorical variableno tesApply no tes to the data fileege nExte nded gen erate - has special functions that can be usee when c

23、reati nga new variablesaveStore the dataset currently in memoryon disk in Stata data format六、管理數(shù)據(jù)(Managing data)在本節(jié)中,我們將進(jìn)一步介紹如何將數(shù)據(jù)作一些特殊的處理,例如:保留 所欲分析的數(shù)據(jù)、刪除多余的數(shù)據(jù)或是將兩份數(shù)據(jù)結(jié)合等等。假設(shè)我們只想針對(duì)部分的數(shù)據(jù)進(jìn)行處理,而又想保留原始資料時(shí),則有以F 兩種方法可進(jìn)行:1、 另存新檔: 亦即將所欲分析的部分?jǐn)?shù)據(jù)儲(chǔ)存在另一個(gè)檔案中。 例如: 我們只 針對(duì)read成績(jī)大于或是等于60分的學(xué)生進(jìn)行分析, 則可利用下 面的指令來(lái)篩選。keep i

24、f read = 60 summarizesave sample6-1Note:當(dāng)只要保留某些變量時(shí),則利用指令keep。例如:keep read write2、直接處理:亦即在原始數(shù)據(jù)上進(jìn)行分析。承上例,指令輸入如下:preservedrop if read 60summarizerestoreNote:若要?jiǎng)h除某些變量時(shí),則利用指令drop。例如:drop read write接下來(lái),我們介紹如何將兩筆數(shù)據(jù)結(jié)合在一起。數(shù)據(jù)的結(jié)合主要可以分為 兩種,水平合并和垂直合并。前者是指變量的增加;后者則是指樣本數(shù)的增加。 說(shuō)明如下:1、水平合并use samplehlappe nd using sa

25、mpleh22、垂直合并:use samplevlsort idsave samplevl, replace use samplev2, clear sort idsave , replaceuse samplevlmerge id using samplev2Note:在垂直合并前要記得先sort。最后,我們將數(shù)據(jù)修飾的相關(guān)指令整理成下表。keep ifKeep observations if condition is metdrop ifDrop observations if condition is metkeepKeep variables (dropp ing others)dro

26、pDrop variables (keep ing others)appe nd usingAppend a data file to current filesortSort observati onsmergeMerge a data file with curre nt file七、資料分析透過(guò)前面幾節(jié)的介紹,應(yīng)該對(duì)于STATA勺指令和使用方法有了基本的認(rèn)識(shí) 現(xiàn)在,我們開(kāi)始說(shuō)明如何利用STATA來(lái)處現(xiàn)統(tǒng)計(jì)上的問(wèn)題以及計(jì)量方面的模型。1、檢定:我們利用下面的例子來(lái)示范如何進(jìn)行統(tǒng)計(jì)上的檢定工作。sample4-1:ttest write =60ttest write, by (ge nder)ttest write, by (ge nder) un equalsample7-1:ttest before= after2、回歸在執(zhí)行回歸分析時(shí)所使用的指令為regress。cd e:sampleuse sampl

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論