




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、STATA 十八講入門目錄STATA統(tǒng)計(jì)分析1目錄21 STATA入門61.1 安裝61.2 啟用和.61.3 打開和查看數(shù)據(jù)81.4 尋求幫助與網(wǎng)絡(luò).91.5 命令示例101.6 幾個(gè)環(huán)境設(shè)置111.7 復(fù)習(xí)和練習(xí)121.8 附錄132 命令語句152.1 掌握命令語句的格式152.2 命令command152.3 變量varlist152.42.52.62.72.82.9分類操作by varlist16賦值及運(yùn)算=exp16條件表if exp17范圍篩選in range17weight17其他可選項(xiàng),options182.10 復(fù)習(xí)與練習(xí)193 數(shù)據(jù)203.1 打開示例數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù):us
2、e203.2 數(shù)據(jù)類型213.3 數(shù)據(jù)類型轉(zhuǎn)化243.4 數(shù)據(jù)顯示格式:format263.5 在STATA中直接錄入數(shù)據(jù):input273.6 導(dǎo)入其他格式數(shù)據(jù):insheet303.7 數(shù)據(jù):label323.8 復(fù)習(xí)與練習(xí)354 數(shù)據(jù)整理364.1 拆分與連接數(shù)據(jù)文件要掌握令364.2 案例:拆分與連接數(shù)據(jù)364.3 案例:連接數(shù)據(jù)文件394.4 數(shù)據(jù)重整394.5 案例:數(shù)據(jù)轉(zhuǎn)置414.6 復(fù)習(xí)與作業(yè)425 函數(shù)與運(yùn)算符445.1 運(yùn)算符exp445.2 函數(shù)概覽function465.3 數(shù)學(xué)函數(shù)math functions472大學(xué)chrisccbSTATA 十八講入門5.4 字符
3、函數(shù)string functions505.5 分類操作by516 程序546.1 標(biāo)準(zhǔn)的程序文件格式546.2 創(chuàng)造令:與STATA互致問候546.3 暫元Macros: local/global576.4 自帶命令參數(shù)596.5 scalar標(biāo)量606.6 臨時(shí)變量和臨時(shí)數(shù)據(jù)文件:tempvar和tempfile616.7系數(shù)命令的創(chuàng)建案例 (選學(xué)內(nèi)容)627 流程語句677.1 循環(huán)語句:while677.3 循環(huán)語句:forvalues687.3 循環(huán)語句:foreach697.4 嵌套循環(huán)717.5 條件語句727.6 復(fù)習(xí)和練習(xí)748 矩陣758.1 生成矩陣758.2 矩陣四則運(yùn)
4、算768.3 矩陣函數(shù)788.4 隨機(jī)向量與矩陣代數(shù)(選學(xué)內(nèi)容)819 繪圖849.1 繪圖命令849.2 幾種常用的圖899.3 同時(shí)做多個(gè)圖by(varname)969.4 模板及圖文件處理989.5 附錄9910 隨機(jī)模擬10010.1 偽隨機(jī)數(shù)10010.2 簡單模擬10110.3 復(fù)雜模擬10310.4 多階段模擬10510.5 商店案例10710.6 練習(xí)10810.7 附錄10911 分布函數(shù)11511.1 二項(xiàng)分布11511.2 標(biāo)準(zhǔn)正態(tài)分布函數(shù)11511.3 正態(tài)分布函數(shù)及其反函數(shù)11611.4 服從正態(tài)分布的隨機(jī)數(shù)11711.5 正態(tài)分布密度函數(shù)11811.6 分位數(shù)119
5、11.7 卡布1203大學(xué)chrisccbSTATA 十八講入門11.8 t分布的分位數(shù)12211.9 F分布12212 抽樣分布12512.1 經(jīng)驗(yàn)分布12512.2 均值的抽樣分布:正態(tài)總體的小樣本抽樣分布12612.3 中心極限定理:非正態(tài)總體大樣本下均值的抽樣分布12612.4 卡布與樣本標(biāo)準(zhǔn)差的抽樣分布12812.5 構(gòu)造F分布12912.6 t分布:未知總體方差時(shí)的抽樣分布13012.7 多元正態(tài)分布13113 參數(shù)估計(jì)與假設(shè)檢驗(yàn)13313.1 極大似然估計(jì)的原理13313.2 正態(tài)總體均值和方差的極大似然估計(jì)13313.3 最小二乘估計(jì)OLS原理13413.4 矩估計(jì)MM原理13
6、513.5 區(qū)間估計(jì)原理13513.6 假設(shè)檢驗(yàn)原理13614 簡單回歸原理13814.1 回歸分析原理13814.2 模擬實(shí)驗(yàn)14214.3 回歸報(bào)告結(jié)果中各項(xiàng)的手工計(jì)算14314.3 線性模型的最大似然估計(jì)14515 異方差模擬14715.1 條件分布圖示14715.2 異方差的后果14815.315.415.515.6圖形檢驗(yàn)與檢驗(yàn)150檢驗(yàn)的功效(選讀內(nèi)容)151估計(jì)方法:WLS與GLS154廣義最小二乘估計(jì)與FGLS155Equation Chapter 1 Section 116 隨機(jī)過程模擬15716.1 時(shí)間數(shù)據(jù)函數(shù)15716.216.316.416.516.616.717 計(jì)
7、量17.117.217.317.417.517.6模擬白噪聲及檢驗(yàn)白噪聲158模擬自回歸過程AR并檢驗(yàn)穩(wěn)定性160模擬移動(dòng)平均過程MA163序列相關(guān)性檢驗(yàn)167根檢驗(yàn)168平滑分析170學(xué)基本理論模擬172經(jīng)典假設(shè)滿足時(shí)OLS估計(jì)量的小樣本性質(zhì)172條件誤差服從正態(tài)分布的假設(shè)不成立時(shí)OLS的小樣本性質(zhì)173條件誤差服從正態(tài)分布假設(shè)不成立時(shí)OLS的大樣本性質(zhì)173第一假設(shè)不成立時(shí)175第二假設(shè)不成立時(shí)176第三假設(shè)不成立時(shí)1774大學(xué)chrisccbSTATA 十八講入門17.717.818 計(jì)量18.118.218.318.418.5第四假設(shè)不成立時(shí)177第五假設(shè)不成立時(shí)(略)177學(xué)綜合案例
8、179簡單回歸分析179多元回歸分析181非線性回歸分析182回歸模型的有效性184實(shí)驗(yàn)與自然實(shí)驗(yàn)187參考文獻(xiàn)1895大學(xué)chrisccbSTATA 十八講入門1 STATA 入門Stata 統(tǒng)計(jì)軟件包是目前世界上最著名的統(tǒng)計(jì)軟件之一,與 SAS、SPSS 一起被并稱為三大權(quán)威軟件。它廣泛的應(yīng)用于、教育、人口、政治會(huì)學(xué)、醫(yī)學(xué)、藥學(xué)、工礦、農(nóng)林等學(xué)科領(lǐng)域,同時(shí)具有數(shù)據(jù)管理軟件、統(tǒng)計(jì)分析軟件、繪圖軟件、矩陣計(jì)算軟件和程序語言的特點(diǎn),幾乎可以完成全部復(fù)雜的統(tǒng)計(jì)分析工作。其功能非常強(qiáng)大且操作簡單、使用靈活、易學(xué)易用、運(yùn)行速度極快,在許多方面別具一格。Stata令語句極為簡潔明快,而且在統(tǒng)計(jì)分析命令的
9、設(shè)置上又非常有條理,它將相同類型的統(tǒng)計(jì)模型均歸在同一個(gè)命令族下,而不同命令族又可以使用相同功能的選項(xiàng),這使得用戶學(xué)習(xí)時(shí)極易上手。Stata 語句在簡潔的同時(shí)又擁有著極高的靈活性,用戶可以充分發(fā)揮的聰明才智,熟練應(yīng)用各種技巧,真正做到隨心所欲。盡管它也提供了窗口菜單式的操作方式,但強(qiáng)烈建議大家堅(jiān)持使用命令行程序操作方式,很快你就會(huì)體會(huì)到使用命令方式所帶來的那種隨心所欲地處理和分析數(shù)據(jù)的。Stata 的另一個(gè)特點(diǎn)是他的許多高級(jí)統(tǒng)計(jì)模塊均是編程程序文件(ADO 文件),這些文件可以自行修改、添加和用宏語言寫成的。用戶可隨時(shí)到Stata尋找并最新的升級(jí)文件。這一特點(diǎn)使得 STATA 始終處于統(tǒng)計(jì)分析方
10、法發(fā)展的最前沿,用戶幾乎總是能很快找到最新統(tǒng)計(jì)算法的 Stata 程序版本,而這也使得 Stata 自身成了幾大統(tǒng)計(jì)軟件中升級(jí)最多、最頻繁的一個(gè)。STATA 由美國計(jì)算機(jī)中心(Computer Resource Center)研制,現(xiàn)為STATA公司的。從 1985 至 2007 的二十多年時(shí)間里,已連續(xù)推出 1.1,1.2,,7.0,8.0,9.0,10.0 等多個(gè)版本。1.1 安裝(1)要學(xué)習(xí)的是 9.2 版本。上有 stata9.rar,但是做正式的或工作還是應(yīng)該盡量用正版軟件。(2) 將其解壓到 D:/stata9。(3) 點(diǎn)擊 setup 安裝>>改變安裝路徑到 D:/s
11、tata9>>選擇 Stata/SE 版本。1.2 啟用和(1) 程序Stata,Stata,啟動(dòng)后出現(xiàn)文件框,要求輸入單位和等。6大學(xué)chrisccbSTATA 十八講入門(2)打開 D:/stata9>>點(diǎn)擊 wsestata>>打開 sn 文件找到信息,進(jìn)行注意用戶名和要多于 5 個(gè)英文字符)。完成后,出現(xiàn)如下畫面。(3)調(diào)整和保存界面設(shè)置:拖動(dòng)各個(gè)窗口,將其調(diào)整為如下合適的格式,然后選擇 Prefs>>save windowing preference7大學(xué)chrisccbSTATA 十八講入門Stata 的界面主要是由四個(gè)窗口:結(jié)果窗口
12、:位于界面右上部,軟件運(yùn)行中的所有信息,如所執(zhí)行令、執(zhí)行結(jié)果和出錯(cuò)信息等均在這里列出。窗口中會(huì)使用不同的顏分不同的文本,如白色表示命令,紅色表示錯(cuò)誤信息。命令窗口:位于結(jié)果窗口下方,相當(dāng)于 DOS 軟件中令行,此處用于鍵入需要執(zhí)行令后即開始執(zhí)行,相應(yīng)的結(jié)果則會(huì)在結(jié)果窗口中。令會(huì)依命令回顧窗口:即 review 窗口,位于界面左上方,所有執(zhí)行過次在該窗口中列出,選中某一行單擊后命令即被自動(dòng)拷貝到命令窗口中;如果需要重復(fù)執(zhí)行,用鼠標(biāo)雙擊相應(yīng)令行即可。變量名窗口:位于界面左下方,列出當(dāng)前數(shù)據(jù)集中的所有變量名稱,。除以上四個(gè)默認(rèn)打開的窗口外,在 Stata 中還有數(shù)據(jù)編輯窗口、程序文件編輯窗口、幫助窗
13、口、繪圖窗口、Log 窗口等,如果需要使用,可以用 Window 或Help 菜單將其打開。(4)點(diǎn)擊右上角的 X 號(hào)。建議安裝路徑為: D: /stata9。一般不要安裝在 C 盤下,更不要直接放在桌面上。這是因?yàn)槲覀兺ǔ?huì)將數(shù)據(jù)和程序一旦計(jì)算機(jī)出現(xiàn)意外故障,很可能導(dǎo)致我們于安裝目錄下,如果安裝 c 盤,在上面的數(shù)據(jù)無法恢復(fù)。1.3 打開和查看數(shù)據(jù)打開和查看一個(gè)數(shù)據(jù)文件有三種方式,這三種方式分別是窗口式操作、命令式和程序式操作。例:我們要打開 STATA 自帶的示例數(shù)據(jù)文件 auto.dta。1.3.1 窗口執(zhí)行方式(1)點(diǎn)左上角的第一個(gè)按扭,彈出一個(gè)框,選擇 STATA 軟件自帶的示例數(shù)據(jù)
14、文件 auto.dta,雙擊即打開該文件。(2)然后點(diǎn)擊倒數(shù)第四個(gè)按扭圖標(biāo),彈出一個(gè)數(shù)據(jù)庫窗口,顯示的是 auto數(shù)據(jù)文件包含的具體內(nèi)容。8大學(xué)chrisccbSTATA 十八講入門該數(shù)據(jù)集共有 12 列 74 行,每一列為一個(gè)變量,如第一列為汽車品牌,第二列為價(jià)格等;每一行為一輛汽車的相關(guān)信息,如第一行的汽車是 AMC Concord,價(jià)格為 4099。(3)點(diǎn)右上角的 X 號(hào),1.3.2 命令互動(dòng)執(zhí)行方式數(shù)據(jù)窗口。注意到執(zhí)行上述操作后,結(jié)果窗口新出現(xiàn)了兩行白色字體顯示的如use "D:Stata9auto.dta", clear edit:其中,前者為打開 auto 數(shù)
15、據(jù)文件令,后者為查看該數(shù)據(jù)令。將該行文字選中,點(diǎn)右鍵并選擇文本(copy text)。然后不妨先命令,或者直接鍵入STATA,再重新打開 STATA。在命令窗口粘貼先前的. use "D:Stata9auto.dta", clear在命令窗口中. edit即表示執(zhí)行剛鍵入令,因此命令窗口不能換行。這兩行命令將再一次打開并顯示 auto 數(shù)據(jù)集,同樣點(diǎn)擊右上角的 X 號(hào),退出數(shù)據(jù)窗口。注意到,若不數(shù)據(jù)窗口,則命令窗口被輸入。1.3.3 批量程序執(zhí)行方式注意到屏幕左上有一個(gè) Review 窗口,該窗口使用過令,剛才鍵入的兩個(gè)命令即出現(xiàn)在該窗口中,擊活命令回顧窗口,點(diǎn)右鍵選擇 s
16、ave reviewcontent,在彈出的框中取名為 mydo 并保存,即得到程序操作文件。先STATA,然后重新打開 STATA,點(diǎn)擊倒數(shù)第五個(gè)命令按鈕,打開剛才保存過的程序文件 mydo.do,再點(diǎn)選1.3.4 三種執(zhí)行方式的相互關(guān)系,執(zhí)行。三種操作方式可以完成同樣的任務(wù)。在初學(xué)命令的時(shí)候,當(dāng)不記得某個(gè)命令時(shí)可以采用菜單操作方式得到該命令的用法。在結(jié)果窗口和命令回顧窗口都出現(xiàn)該命令,在命令窗口重復(fù)輸入相應(yīng)令,即可獲得和窗口式操作同樣的結(jié)果。如果將回顧窗口令保存,即得到程序,執(zhí)行程序也得到同樣的結(jié)果。使用 STATA 時(shí)建議大家采用第三種方式,即寫程序的方式,程序可以使得數(shù)據(jù)的處理和分析過
17、程被完整保留下來,便于和他人進(jìn)行修改和評(píng)論。1.4 尋求幫助與網(wǎng)絡(luò)有多種途徑可以獲得STATA 的幫助,主要的途徑有三個(gè):手冊(cè)、STATA 自帶幫助和網(wǎng)絡(luò)幫助。對(duì)于多數(shù)人而言手冊(cè)是可望不可及的,因?yàn)橐惶淄暾氖謨?cè)有 10 余本,而且價(jià)格昂貴。但有了STATA 的自帶幫助,我們可以在記住極少9大學(xué)chrisccbSTATA 十八講入門量的基本命令的基礎(chǔ)上,方便地運(yùn)用STATA命令 1。1.4.1 獲取幫助. help顯示出 STATA 所有幫助內(nèi)容的目錄結(jié)構(gòu)。令如果輸入具體. help summarize令,則只顯示該命令的幫助,如也可以通過菜單式的點(diǎn)選方式獲得幫助: Help>>s
18、tata command在彈出的框中輸入:summarize 然后,得到與 help summarize 同樣的結(jié)果。使用幫助的小竅門:先看命令描述(Description)部分,然后直接看幫助文件后面令示例(Examples),將命令示例到命令窗口,執(zhí)行,看看執(zhí)行結(jié)果,體會(huì)命令的用法。網(wǎng)絡(luò)幫助可以采用如下命令獲得. findit scat3, net. search scat3, net這兩條命令等價(jià),均為尋找繪三維立體圖內(nèi)置命令,所以需要通過這兩個(gè)命令搜索并令scat3。由于scat3 不是STATA安裝后才能使用。1.4.2 幾個(gè)主要的(1) STATA公司(2) STATA(3) ST
19、ATA(4) STATA(5) STATA 技術(shù)公告版1.5 命令示例1.5.1 進(jìn)行四則運(yùn)算. di 5+9. di 5-9. di 5*9. di 10/2. di 102. di exp(0). di ln(1). di sqrt(4)上述運(yùn)算分別為加、減、乘、除、冪、指、對(duì)和開方,其中 di 為 display 的1最常用令見附錄 210大學(xué)chrisccbSTATA 十八講入門簡寫,是一個(gè) STATA 命令,該命令顯示計(jì)算結(jié)果。1.5.2 描述統(tǒng)計(jì):求五數(shù)概略任務(wù):求價(jià)格和重量的觀察值個(gè)數(shù)、平均值、標(biāo)準(zhǔn)差、最小值和最大值. use auto, clear. sum price. su
20、m weight這兩步命令也可以一步完成. sum price weight1.5.3 繪圖任務(wù):繪出價(jià)格和重量的散點(diǎn)圖和折線圖. scatter price weight. line price weight, sort1.5.4 生成新的數(shù)據(jù)任務(wù):生成新的數(shù)據(jù) x, (x=1,2,1000);. clear. set obs 1000. gen x=_n. gen y=x+100y=x+100.1.5.5. list n顯示結(jié)果輸出顯示后會(huì)停住,此時(shí)按鍵和”l”會(huì)顯示下一行;按”q”會(huì)終止命令,或者使用 ctrl+break;按其他鍵會(huì)顯示下一頁。1.6 幾個(gè)環(huán)境設(shè)置1.6.1 設(shè)置屏幕滾
21、動(dòng)在列示 1 到 1000 之前,若先設(shè)置 set more off,則屏幕不停止;反之 set more on 會(huì)使顯示停止。. set more off. list. set more on. list. q1.6.2 清除內(nèi)存中原有內(nèi)容. clear1.6.3 設(shè)置內(nèi)存大小查看內(nèi)存使用情況11大學(xué)chrisccbSTATA 十八講入門. memory設(shè)置內(nèi)存. set memory 10m1.6.4 設(shè)置文件存取路徑在打開數(shù)據(jù)之前,先要. cd d:/stata9數(shù)據(jù)的位置,其命令為如果想知道當(dāng)前路徑下有哪些文件,可以用 dir 命令來列示. dir假設(shè)你想在 D 盤的根目錄下創(chuàng)建一個(gè)新
22、的文件夾 mydata 來存放數(shù)據(jù)文件, 命令為 mkdir。mkdir d:/mydata然后,進(jìn)入該目錄,命令為 cd. cd d:/mydata1.6.5 錯(cuò)誤提示學(xué)會(huì)從 STATA 的錯(cuò)誤提示中明白錯(cuò)在哪里非常重要。. list myvar上述命令試圖顯示變量 myvar,但是結(jié)果窗口僅出現(xiàn)如下的顯示variable myvar not foundr(111);紅色信息表明,沒有找到一個(gè)叫 myvar 的變量,的確,我們的數(shù)據(jù)中并沒有這個(gè)變量。List 巧婦難為無米之炊。紅色信息下面還有一個(gè)天蘭色的 r(111),用鼠標(biāo)點(diǎn)擊,即可彈進(jìn)一個(gè)幫助信息框,給出錯(cuò)誤的更詳盡解釋。再比如,我們?cè)?/p>
23、求五數(shù)概略時(shí),誤把 sum 寫成了 sun. sununrecognized command:sunr(199);顯示說不認(rèn)識(shí) sun 這個(gè)命令。1.7 復(fù)習(xí)和練習(xí)(1)復(fù)習(xí)本節(jié)學(xué)習(xí)的主令 clear, help, list, whelp, use, search, cd(2)找到附錄 2 中主令的幫助信息(3)計(jì)算出 8+2*ln(100)-e3/5212大學(xué)chrisccbSTATA 十八講入門1.8 附錄1.8.1 附錄 1:本章命令的程序文件*=chp1.do=clearset memory 10mcd d:/stata8/清除內(nèi)存/設(shè)置內(nèi)存大小/在打開數(shù)據(jù)之前,先要數(shù)據(jù)的位置use
24、auto/打開數(shù)據(jù)文件 auto.dta*計(jì)算汽車的平均價(jià)格sum price/該步計(jì)算汽車的平均價(jià)格sum price weight值和最大值/求價(jià)格和重量的觀察值個(gè)數(shù)、平均值、標(biāo)準(zhǔn)差、最小use /*使用系統(tǒng)中的數(shù)據(jù)*/ auto, clearsum weight price length/求重量、價(jià)格、長度的平均值scatter price weight/繪價(jià)格和重量的散點(diǎn)圖clearset obs 1000 gen x=_n gen y=x+100/清除內(nèi)存/將數(shù)據(jù)指針到 1000 處/個(gè) 1 到 1000 的自然數(shù),變量名為 x個(gè)新的變量 y,y 從 101 到 1100/*從上面的
25、例子可見:(1)(2)(3)(4)在最前面加上“*”號(hào)表示該行為注釋語句,STATA 將只顯示不執(zhí)行;在一個(gè)命令的中間加入注釋,要用:/*注釋內(nèi)容*/對(duì)較長令或者為便于閱讀,將一行命令寫成幾行/來在命令行的后面加入注釋: /注釋語句將一部分內(nèi)容變成注釋內(nèi)容,前后用/*被注釋掉的語句*/*/*=end=13大學(xué)chrisccbSTATA 十八講入門1.8.2 附錄 2:常用命令需求幫助helpsearch幫助網(wǎng)絡(luò)尋求幫助進(jìn)入某路徑cd設(shè)定內(nèi)存set memory 20m設(shè)置 STATA 的內(nèi)存空間為 20m打開和保存數(shù)據(jù)clearuse save清空內(nèi)存數(shù)據(jù)打開 STATA 格式的數(shù)據(jù)文件保存內(nèi)
26、存中的數(shù)據(jù)導(dǎo)入數(shù)據(jù)input edit infileinsheet錄入數(shù)據(jù)編輯數(shù)據(jù)導(dǎo)入數(shù)據(jù)導(dǎo)入數(shù)據(jù)重整數(shù)據(jù)append merge xpose reshape generate egen rename drop keep sort encode decode orderby將有相同結(jié)果的數(shù)據(jù)縱向拼接(觀察值拼接)將兩個(gè)數(shù)據(jù)文件橫向拼接數(shù)據(jù)轉(zhuǎn)置生成新的數(shù)據(jù)生成新的數(shù)據(jù)變量重命令刪除變量或觀察值保留變量或觀察值對(duì)觀察值按從小到大順序重新排列數(shù)值型數(shù)據(jù)轉(zhuǎn)換為字符型數(shù)據(jù)字符型數(shù)據(jù)轉(zhuǎn)換為數(shù)值型數(shù)據(jù)變量順序的重新排列分類操作報(bào)告數(shù)據(jù)describe codebook listcount inspect t
27、abletabulate總體展示數(shù)據(jù)情況展示數(shù)據(jù)庫中的每個(gè)變量情況列示內(nèi)存中的數(shù)據(jù)報(bào)告共有多少觀察值報(bào)告變量的分布數(shù)據(jù)列表聯(lián)列表顯示和保存輸出結(jié)果displaylog顯示計(jì)算結(jié)果將輸出結(jié)果存放入結(jié)果文件14大學(xué)chrisccbSTATA 十八講:2 命令語句2 命令語句2.1 掌握命令語句的格式by varlist: command varlist =exp if exp in range weight , options注: 表示可有可無的項(xiàng),顯然只有 command 是必不可少的,下面結(jié)合例子分項(xiàng)來講解命令的各個(gè)組成部分。2.2 命令 commandby varlist: command
28、varlist =exp if exp in range weight , options. cd d:/stata9. use auto, clear/打開美國汽車數(shù)據(jù)文件 auto.dta,后面的 clear 表示先清除內(nèi)存中可能存在的數(shù)據(jù)集/*很多命令可單獨(dú)使用,單獨(dú)使用時(shí),一般是對(duì)所有變量進(jìn)行操作,等價(jià)于后面加上代表所有變量的_all。 */注意到該命令輸出結(jié)果與上一個(gè)命令完全一樣/與前一命令等價(jià),sum 為 summarize 的略寫/ su 是 summarize 的最簡化略寫,不能再簡化為 s. summarize. summarize _all. sum. su. s/簡寫前提
29、是不引起。執(zhí)行這個(gè)命令將出現(xiàn)錯(cuò)誤信息unrecognized command:s練習(xí):請(qǐng)用 list 進(jìn)行仿照練習(xí)。注意,在用 list 做練習(xí)的時(shí)候可能會(huì)遇到結(jié)果窗口停止,其右下角出現(xiàn)一個(gè)的“more”,按鍵盤上任何一個(gè)鍵,屏幕滾動(dòng)一行。這一現(xiàn)象與第一講中“set more on”的設(shè)置有關(guān),請(qǐng)參考 1.6.12.3 變量 varlistby varlist: command varlist =exp if exp in range weight , optionsvarlist 表示一個(gè)變量,或者多個(gè)變量,多個(gè)變量之間用空格隔開。. cd d:/stata9. use auto, clea
30、r. sum price. su p. su t/求價(jià)格的觀察值個(gè)數(shù),平均值,方差,最小值和最大值/變量和命令均可略寫,注意到兩個(gè)結(jié)果完全一樣/分?jǐn)?shù)據(jù)中有兩個(gè)變量的開首字母為 t(trunk 和 turn),所以 STATA 認(rèn)為 t 為模糊的省略。m ambiguous abbreviation/紅色為錯(cuò)誤信息. sum tr tu/求 trunk 和 turn 變量的五數(shù)概略統(tǒng)計(jì)15大學(xué)chrisccb變量的省略規(guī)則只要不引起歧義,命令可以盡量只寫前幾個(gè)字母。如 summarize 只需要前兩個(gè)字母 su;而list 只需要寫第一個(gè)字母 l。在幫助文件中,命令下面有小劃線,該線表明了命令可
31、以省略到什么程度。如list varlist if in , optionssummarize varlist if in weight , optionsSTATA 十八講:2 命令語句. su t*/等價(jià)于前一命令,以 t 開首的所有變量可用 t*來表示。2.4 分類操作 by varlistby varlist: command varlist =exp if exp in range weight , options先看下面的例子,在汽車數(shù)據(jù)集中,有一個(gè)變量 foreign,該變量表示某個(gè)車是進(jìn)口車(1 Foreign)還是國產(chǎn)車(0 Domestic)。如果我們需要知道車的平均價(jià)格和
32、重量,則. cd d:/stata9. use auto, clear. sum price weight*如果需要分別知道國產(chǎn)車和進(jìn)口車的價(jià)格和重量,可以采用分類操作來求得,. by foreign: sum price weight/分別計(jì)算國產(chǎn)車和進(jìn)口車的價(jià)格和重量但如果執(zhí)行下面兩個(gè)命令,將出現(xiàn)錯(cuò)誤*/. sort price. by foreign: sum price weight*not sorted/按價(jià)格從低到高重新排序/* 系統(tǒng)提示沒有排序,這是因?yàn)?by varlist 在執(zhí)行時(shí)要求內(nèi)存中的數(shù)據(jù)是按照by 后面的變量排序的。當(dāng)我們用 sort price 重新排序后,就打亂
33、了原來按照foreign 的排序,所以出現(xiàn)了錯(cuò)誤提示。更正的辦法是:*/. sort foreign. by foreign: sum price weight/按國產(chǎn)車和進(jìn)口車排序*更簡略的方式是把兩個(gè)命令用一個(gè)組合命令來寫。. by foreign, sort: sum price weight如果不想從小到大排序,而是從大到小排序,其命令為 gsort。. sort - price. sort foreign -price/按價(jià)格從高到低排序/*先把國產(chǎn)車都排在前,進(jìn)口車排在后面,然后在國產(chǎn)車內(nèi)再按價(jià)格從大小到排序,在進(jìn)口車內(nèi)部,也按從大到小排序*/2.5 賦值及運(yùn)算=expby var
34、list: command varlist =exp if exp in range weight , options該選項(xiàng)主要用于給新變量賦值或替換原變量的值例:個(gè)新的價(jià)格變量 nprice,該變量的取值為原汽車價(jià)格變量 price 的16大學(xué)chrisccb變量名稱除以下字符不能用作變量名外,任何字母、字母與數(shù)字(單獨(dú)的數(shù)字也不)組合均可用做變量名:_all _b byte _coef _cons double float if in int long _n _N _pi _pred _rc _se _skip using with基本要求如下:_ 第一個(gè)字元可以是英文字母或, 但不能是數(shù)
35、字;_ 最多只能包括32 個(gè)英文字母、數(shù)字或下劃線;_ 由于 STATA 保留了很多以“_ “開頭的內(nèi)部變量,所以最好不要用為第一個(gè)字元來定義變量。STATA 十八講:2 命令語句基礎(chǔ)上漲 10 元. cd d:/stata9. use auto, clear. gen nprice=price+10/生成新變量 nprice,其值為 price+10/比較一下兩個(gè)變量的取值. list/*上面pricenprice令 generate(略寫為 gen)個(gè)新的變量,新變量的變量名為nprice,新的價(jià)格在原價(jià)格的基礎(chǔ)上均增加了 10 元。. replace nprice=nprice-10/*
36、命令 replace 則直接改變?cè)兞康馁x值,nprice 調(diào)減后與 price 變量取值相等*/. listpricenprice/再比較一下兩個(gè)變量,相等。2.6 條件表if expby varlist: command varlist =exp if exp in range weight , options例:若只想查看國產(chǎn)車的品牌和價(jià)格,則加入篩選條件 if foreign=0 */. cd d:/stata9. use auto, clear. list make price if foreign=0*只查看價(jià)格超過 1 萬元的進(jìn)口車(同時(shí)滿足兩個(gè)條件),則. list make
37、price if foreign=1 & price>10000*查看價(jià)格超過 1 萬元或者進(jìn)口車(兩個(gè)條件任滿足一個(gè)). list make price if foreign=1 |price>10000*分類型查看價(jià)格超過 1 萬元的汽車的品牌和價(jià)格. by foreign, sort: list make priceif price>100002.7 范圍篩選 in rangeby varlist: command varlist =exp if exp in range weight , options如果要計(jì)算較低的前 10 個(gè)車的價(jià)格求平均值. cd d:
38、/stata9. use auto, clear. sort price. sum price in 1/5的平均價(jià)格,則要先按價(jià)格排序,然后僅對(duì)前 10注意“1/5”中,斜杠不是除號(hào),而是從1到5 的意思,即 1,2,3,4,5。如果要計(jì)算前 10中的國產(chǎn)車的平均價(jià)格,則可將范圍和條件篩選使用。. sum price in 1/10 if foreign=02.8weightby varlist: command varlist =exp if exp in range weight , options任務(wù):下表是 2005 年省高考 640 分及以上成績一分一段的人數(shù)統(tǒng)計(jì),第一列 scor
39、e 為高考分?jǐn)?shù),第二列 num 為該分?jǐn)?shù)段的人數(shù)?,F(xiàn)在我們要求 640 分及以上考生的平均分?jǐn)?shù)。17大學(xué)chrisccbSTATA 十八講:2 命令語句操作:先將上面的表格. clear. edit然后把光標(biāo),然后進(jìn)入 STATA,執(zhí)行如下命令/清空 STATA在表格的第一行第一列,點(diǎn)右鍵,選擇粘貼(paste),上表數(shù)據(jù)便被到 STATA 中,數(shù)據(jù)編。. sum score/思考:得到的結(jié)果是 640 分及以上考生的平均分嗎?簡單地使用 sum 命令得到的平均成績顯然是不正確的,因?yàn)楦鱾€(gè)分?jǐn)?shù)下的人數(shù)是不一樣的,正確的計(jì)算需要,. sum score weight=num/*的辦法是計(jì)算,比較
40、該結(jié)果與 sum score 的區(qū)別,實(shí)際上,不用權(quán)重選項(xiàng)時(shí),相當(dāng)于權(quán)重相等。*/w 為 weight 的略寫,n 為 num 的簡寫,兩命令等價(jià). sum score w=n2.9 其他可選項(xiàng),optionsby varlist: command varlist =exp if exp in range weight , options許多命令都有一些可選項(xiàng)例如,我們不僅要計(jì)算平均成績,還想知道成績的中值,方差,偏度和峰度等*/. sum score, detail. sum score, d/d 為 detail 的略寫,兩個(gè)命令完全等價(jià)注意,結(jié)果中顯示了 1%,5%等分位數(shù),意思是把變量
41、從小到大排序,第 1%位置處的取值是多少,第 10%的位置上的取值是多少。顯然,50%位置處的取值是中位數(shù)。此外,加了 detail 選項(xiàng)后,還得到最小的前 5 個(gè)數(shù),最大的 5 個(gè)數(shù),以及峰度和偏度等。*再如,list 命令也有一些可選項(xiàng). cd d:/stata9. use auto, clear. list price in 1/30, sep(10). list price in 10/30, sep(2). list price, nohead/每 10 個(gè)觀察值之間加一橫線/每 2 個(gè)觀察值之間加一橫線/不要表頭18大學(xué)chrisccbscorenum650236471664621
42、645266443264323642386412964038STATA 十八講:2 命令語句2.10 復(fù)習(xí)與練習(xí)對(duì)照本章令結(jié)構(gòu),用幫助命令打開第一講中附錄 2 中常用命令的相應(yīng)幫助文件,對(duì)照幫助文件下面的例子體會(huì)各種命令的用法。19大學(xué)chrisccbSTATA 十八講:3 數(shù)據(jù)3 數(shù)據(jù)數(shù)據(jù)文件是一個(gè)矩形的矩陣,這個(gè)矩陣的每一行都代表或?qū)?yīng)著一個(gè)“觀測”(如、),矩陣的每一列都代表或?qū)?yīng)著一個(gè)“變量”(比如,身高、體重,月工資收入等等)。因此,數(shù)據(jù)文件矩陣中的每一個(gè)元素(case)都代表或?qū)?yīng)著某一個(gè)“觀測察值?!敝械哪骋粋€(gè)“變量”的變量值或觀3.1 打開示例數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù):use3.1.1
43、示例數(shù)據(jù)示例數(shù)據(jù)為 STATA 幫助文件中所用的數(shù)據(jù),其后輟名為.dta,如果在 STATA 軟件當(dāng)前路徑下,直接用 use 命令即可打開;如果不在當(dāng)前路徑下,則可以使用sysuse 命令打開。. use auto,clear. cd d:/. use auto, clearfile auto.dta not found r(601);/打開汽車數(shù)據(jù) auto.dta/改變路徑到 d:/系統(tǒng)提示無法找到文件,因?yàn)?auto.dta 不在 d:/. sysuse auto,clear/無論當(dāng)前路徑是什么,該命令均能打自帶文件3.1.2 從網(wǎng)絡(luò)獲取數(shù)據(jù)上述示例數(shù)據(jù)可能沒有全部到你的所用的電腦中,因
44、此簡單地使用 use和 sysuse 命令時(shí),可能出現(xiàn)錯(cuò)誤,如. use nlswork, clearfile nlswork.dta not found此時(shí),如果確定該數(shù)據(jù)為示例數(shù)據(jù),可以直接通過網(wǎng)絡(luò)獲取,其命令為:20大學(xué)chrisccb示例數(shù)據(jù)Auto :美國 1978 年汽車數(shù)據(jù),包括產(chǎn)地、行使里程、重量等變量Bplong 血壓數(shù)據(jù)Cancer實(shí)驗(yàn)生存數(shù)據(jù) Census1980 年美國分州人口普查數(shù)據(jù)Citytemp 美國城市氣溫?cái)?shù)據(jù)Educ99gdp 教育與 GDP 關(guān)系數(shù)據(jù)Gnp96 美國 1967-2002 年的 GNP 數(shù)據(jù)Lifeexp 預(yù)期數(shù)據(jù)Nlsw88 美國年輕婦女研究
45、數(shù)據(jù)Pop2000 美國 2000 年人口普查數(shù)據(jù)Sp500 S&P500 歷史數(shù)據(jù)Uslifeexp 美國預(yù)期1900-1999Voter 美國 1992 年數(shù)據(jù)STATA 十八講:3 數(shù)據(jù). use. webuse nlswork, clearwebuse只能從/從/與前一命令等價(jià),從 STATA獲取數(shù)據(jù),或者數(shù)據(jù)庫獲取數(shù)據(jù)這一路徑獲取數(shù)據(jù),如果不是地址完全寫出來。使用該命令時(shí)必須確該的數(shù)據(jù),webuse失效,只能把保網(wǎng)絡(luò)連接正常.另一個(gè)網(wǎng)絡(luò)數(shù)據(jù)較多的地方是波士登大學(xué)的數(shù)據(jù)中心,的計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論一書中所使用的全部數(shù)據(jù)都可以通過該數(shù)據(jù)中心獲得。比如. use即打開中例 2.3 中所使
46、用的 CEO 數(shù)據(jù)。use 命令只能打開后輟名為“*.dta”格式的數(shù)據(jù),.dta 格式以外的數(shù)據(jù),STATA不能直接,需要從外部讀入,最簡單而直接的辦法是和粘貼。但是有時(shí)沒有其他軟件,比如,我們有 SAS 格式或 SPSS 格式的數(shù)據(jù),但沒有 SAS 軟件和 SPSS 軟件,此時(shí)需要用 STATA 提供的其令或者使用 transfer 數(shù)據(jù)格式轉(zhuǎn)化軟件。在討論其他輸入或?qū)霐?shù)據(jù)的方法之前,我們先來學(xué)習(xí)一點(diǎn)數(shù)據(jù)類型的知識(shí)。3.2 數(shù)據(jù)類型STATA 通常把變量劃分為三類:分別是數(shù)值型,字符型和日期型3.2.1 數(shù)值變量:用 0、1、29 及+、(正負(fù)號(hào))與小數(shù)點(diǎn)“(.)”來表示。在輸入數(shù)據(jù)時(shí),
47、逗號(hào)不能被識(shí)別,如 1,024 應(yīng)該直接寫成 1024.其他示例5-55.25.2e+35.2e-2后面兩個(gè)數(shù)據(jù)為科學(xué)計(jì)數(shù)法的數(shù)據(jù),分別表示 5200 和 0.052.其中的 e 相當(dāng)于 10,因此 5.2e+3 的意思是:5.2*103=5200數(shù)值型變量按其精度區(qū)分,又有五種類型,分別是:存貯類型最小最大0-領(lǐng)域字節(jié)byte int longfloat-127-32,767-2,147,483,647-1.70141173319*103810032,7402,147,483,6201.70141173319*1036+/-1+/-1+/-1+/-10-36124421大學(xué)chrisccbS
48、TATA 十八講:3 數(shù)據(jù)double-8.9884656743*103078.9884656743*10307+/-10-3238當(dāng)運(yùn)算精度要求很高的時(shí)候,需要將變量設(shè)置成浮點(diǎn)型或雙精度型。另注意1 和1.0000 的精度是不同的,前者在(0.5,1.5)區(qū)間內(nèi)近似,而后者在(0.99995,1.00005)區(qū)間內(nèi)近似。若多次運(yùn)算反復(fù)取四舍五入,精度較低時(shí)將使計(jì)算誤差迅速變大,然而,精度高時(shí)占用的內(nèi)存解變量存貯類型變換。. clear較多。下面令有助于理. set obs 1obs was 0, now 1. gen a=1. d/將設(shè)定一個(gè)觀察值/提示信息說,之前系統(tǒng)中沒有觀察,現(xiàn)在有了一
49、個(gè)/個(gè)新變量 a,令 a 取值為 1/*d 為 describ 命令的略寫,describ 命令顯示數(shù)據(jù)集的屬性信息,注意觀察顯示結(jié)果中,a 的 storage type 為 float 型, 浮點(diǎn)型為默認(rèn)類型*/Contains dataobs: vars:size:118 (99.9% of memory free)storagedisplay format%9.0gvaluelabelvariable name aSorted by:typevariable labelfloatNote:dataset has changed since last saved. compressa wa
50、s float,. d/在不損害信息的基礎(chǔ)上壓縮,使數(shù)據(jù)占用空間盡可能小nowbyte/a 由浮點(diǎn)型變?yōu)榱俗止?jié)型/ 注意 a 的 storage type 現(xiàn)在為 byte 型/* 注意 a 的 storage type 現(xiàn)在自動(dòng)升為 int 型, 因?yàn)?byte 最大只能為 100*/. replace a=101a was byte now int (1 real change made). replace a=100. compress. d. replace a=32741. gen double b=1. recast double a. d/重新變回到 byte 型/直接變到 long 型,因?yàn)?int 型最大只能到 32740/直接生成雙精度變量 b/將
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中生物學(xué)SSI教學(xué)培養(yǎng)學(xué)生科學(xué)思維的實(shí)踐研究
- 數(shù)據(jù)中心機(jī)柜的隔震性能研究
- 大型活動(dòng)安保培訓(xùn)
- 有害物質(zhì)基礎(chǔ)知識(shí)培訓(xùn)
- 預(yù)防兒童性侵課件
- 核心領(lǐng)導(dǎo)力培訓(xùn)
- 音樂課件的技能與技巧
- 市政污水管網(wǎng)改造項(xiàng)目節(jié)能評(píng)估報(bào)告(模板)
- 2025年電子用高純氣體項(xiàng)目建議書
- 建筑工程項(xiàng)目管理人員工作標(biāo)準(zhǔn)
- (完整文本版)新概念英語第一冊(cè)單詞表默寫版1-144
- 建設(shè)用地報(bào)批服務(wù)投標(biāo)方案(技術(shù)方案)
- 仁愛版英語九年級(jí)(上)全冊(cè)課文翻譯(互譯版)
- (2023版)小學(xué)語文一年級(jí)上冊(cè)電子課本
- 新華鎮(zhèn)生活污水處理管網(wǎng)與新華農(nóng)場管網(wǎng)并網(wǎng)項(xiàng)目環(huán)境影響報(bào)告表
- 互聯(lián)網(wǎng)導(dǎo)論智慧樹知到課后章節(jié)答案2023年下上海第二工業(yè)大學(xué)
- 工程物探-第五章電法勘探課件
- KSS編碼說明電廠KKS編號(hào)
- 臺(tái)區(qū)線損綜合分析臺(tái)區(qū)線損分類及計(jì)算方法
- 人民醫(yī)院普外科臨床技術(shù)操作規(guī)范2023版
評(píng)論
0/150
提交評(píng)論