Stata教程:描述性統(tǒng)計(jì)命令與輸出結(jié)果說明_第1頁
Stata教程:描述性統(tǒng)計(jì)命令與輸出結(jié)果說明_第2頁
Stata教程:描述性統(tǒng)計(jì)命令與輸出結(jié)果說明_第3頁
Stata教程:描述性統(tǒng)計(jì)命令與輸出結(jié)果說明_第4頁
Stata教程:描述性統(tǒng)計(jì)命令與輸出結(jié)果說明_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、本節(jié)STATA命令摘要by分組變量:summarize變量名1變量名2變量名m,detailci變量名1變量名2變量名m,level(#)binomialpoissonexposure(varname)by(分組變量)cii樣本量均數(shù)標(biāo)準(zhǔn)差,level(#)tab1變量名,generate(變量名)·資料特征描述(均數(shù),中位數(shù),離散程度)例:某地測定克山病患者與克山病健康人的血磷測定值如下表(數(shù)據(jù)摘自四川醫(yī)學(xué)院主編的衛(wèi)生統(tǒng)計(jì)學(xué),1978出版,p21):患者26324373373432473518558578640653健康人167198198233234250360373414417

2、457482578并假定這些數(shù)據(jù)已以STATA格式存入ex2dta文件中,其中變量x1為患者的血磷測定值數(shù)據(jù),變量x2為健康人的血磷測定值數(shù)據(jù)。上述數(shù)據(jù)也可以用變量x表示血磷測定值,分組變量group=0表示患者組和group=1表示健康組(如:患者組中第一個(gè)數(shù)據(jù)為26,則x=26,group=0;又如:健康組中第三個(gè)數(shù)據(jù)為198,則x為198以及group為1),并假定這些數(shù)據(jù)已以STATA格式存入ex2adta文件中。計(jì)算資料均數(shù),標(biāo)準(zhǔn)差命令summarize,以述資料為例:useex2,clearsummarizex1x2結(jié)果:變量樣本數(shù)均數(shù)標(biāo)準(zhǔn)差最小值最大值Variable|ObsMe

3、anStdDevMinMax-+x1|114710909130297726653x2|1333546151304368167578即:本例中急性克山病患者組的樣本數(shù)為11,血磷測定值均數(shù)為4711(mg%),相應(yīng)的標(biāo)準(zhǔn)差為1303,最小值為26以及最大值為653;健康組的樣本量為13,血磷測定值均數(shù)為33546,相應(yīng)的標(biāo)準(zhǔn)差為13044,最小值為167以及最大值為578。計(jì)算資料均數(shù),標(biāo)準(zhǔn)差,中位數(shù),低四分位數(shù)和高四分位數(shù)的命令summarize以及子命令detail,仍以述資料為例:useex2,clearsummarizex1x2,detail結(jié)果:x1PercentilesSmalles

4、t(最小值)1%26265%2632410%324373Obs11(樣本數(shù))25%373(低四分位)373SumofWgt1150%473(中位數(shù))(最大值)Mean4710909(均數(shù))LargestStdDev1302977(標(biāo)準(zhǔn)差)75%578(高四分位)55890%64578Variance1697749(方差)95%65364Skewness-0813446(偏度)99%653653Kurtosis1809951(峰度)x2PercentilesSmallest1%1671675%16719810%198198Obs1325%233233SumofWgt1350%36Mean3354

5、615LargestStdDev130436875%41741790%482457Variance170137795%578482Skewness296394399%578578Kurtosis1875392由上述結(jié)果可知:summarize命令并使用子命令detail,不僅可以得到各變量資料的均數(shù)和標(biāo)準(zhǔn)差,而且可以得到主要的非參數(shù)描述指標(biāo):低四分位(lowerquartile),中位數(shù)(Median)以及高四分位(upperquartile)。對于非正態(tài)資料,一般不應(yīng)用均數(shù)±標(biāo)準(zhǔn)差進(jìn)行描述,而應(yīng)使用中位數(shù)以及(低四分位-高四分位,稱interquartilerange,IQR)進(jìn)行

6、描述。如:若本資料不正態(tài)1,則x1的Median以及IQR為:473(373-578)以及x2的Median以及IQR為:36(233-417)。為樣本方差;為偏度,偏度的絕對值越小,表明該數(shù)據(jù)的正態(tài)對稱性越好;峰度,峰度值越大表明該數(shù)據(jù)的正態(tài)峰越明顯;在該數(shù)據(jù)中最小的四個(gè)數(shù)據(jù);在該數(shù)據(jù)中最大的四個(gè)數(shù)據(jù)。若調(diào)用ex2adta文件,進(jìn)行描述性統(tǒng)計(jì),可用下列命令:useex2a,clearsortgroup(將資料以group變量為例從小到大排序)bygroup:summarizex結(jié)果:->group=0xPercentilesSmallest1%26265%2632410%324373O

7、bs1125%373373SumofWgt1150%473Mean4710909LargestStdDev130297775%57855890%64578Variance169774995%65364Skewness-081344699%653653Kurtosis1809951->group=1xPercentilesSmallest1%1671675%16719810%198198Obs1325%233233SumofWgt1350%36Mean3354615LargestStdDev130436875%41741790%482457Variance170137795%578482S

8、kewness296394399%578578Kurtosis1875392上述結(jié)果與前面的結(jié)果對應(yīng)相同。·根據(jù)樣本數(shù)據(jù)計(jì)算可信限295%可信限計(jì)算:正態(tài)數(shù)據(jù):ci變量名0-1數(shù)據(jù):ci變量名,binomialpoisson分布數(shù)據(jù):ci變量名,poisson90%可信限計(jì)算(其它可信限類推)正態(tài)數(shù)據(jù):ci變量名,level(90)0-1數(shù)據(jù):ci變量名,level(90)binomialpoisson分布數(shù)據(jù):ci變量名,level(90)poisson以ex2dta為例計(jì)算x1,x2的95%可信限。useex2dta,clearVariable|ObsMeanStdErr95%C

9、onfInterval-+x1|114710909392862438355575586261x2|133354615361766725663934142837以上結(jié)果中:為樣本數(shù);為均數(shù);為標(biāo)準(zhǔn)誤;為95%的可信限,因此x1的95%可信限為38356,55863,x2的95%可信限為25664,41428。·根據(jù)樣本數(shù),樣本均數(shù)和標(biāo)準(zhǔn)差計(jì)算可信限3。若數(shù)據(jù)服從正態(tài)分布,并已知樣本均數(shù)和標(biāo)準(zhǔn)差以及樣本數(shù),則95%可信限計(jì)算為:cii樣本數(shù)樣本均數(shù)標(biāo)準(zhǔn)差,level(#)例:已知樣本數(shù)為90樣本均數(shù)為40以及樣本標(biāo)準(zhǔn)差為12,則:計(jì)算該樣本均數(shù)的95%可信限為cii904012Varia

10、ble|ObsMeanStdErr95%ConfInterval+|9040126491137486654251335該樣本均數(shù)的90%可信限為3748665,4251335cii904012,level(90)Variable|ObsMeanStdErr90%ConfInterval-+|9040126491137897524210248·計(jì)數(shù)資料中頻數(shù)和比例STATA命令:tab1變量名,g(新變量名)因?yàn)樵撁钪饕m用描述計(jì)數(shù)資料(即:屬性資料),當(dāng)使用子命令g(新變量),則產(chǎn)生屬性指示變量。在回歸分析中經(jīng)常需要這些指示變量作為亞元變量進(jìn)行分析。例:50只小鼠隨機(jī)分配到5個(gè)不同

11、飼料組,每組10只小鼠。在喂養(yǎng)一定時(shí)間后,測定鼠肝中的鐵的含量(mg/g)如表所示:試比較各組鼠肝中鐵的含量是否有顯著性差別(摘自醫(yī)學(xué)統(tǒng)計(jì)方法,金丕煥主編,p220)。用x表示鼠肝中鐵的含量以及用group=1,2,3,4,5分別表示對應(yīng)的5個(gè)組。tab1group,g(a)->tabulationofgroupgroup|FreqPercentCum+1|10200020002|10200040003|10200060004|10200080005|10200010000+Total|5010000為各屬性資料的頻數(shù);為該屬性占整個(gè)資料樣本數(shù)的百分比;為累計(jì)百分比。本例中,總樣本數(shù)為50,共有5組,每組有10個(gè)樣本點(diǎn),各占總樣本數(shù)的10%。因?yàn)槭褂昧俗用頶(a),從而產(chǎn)生5個(gè)指示變量(又可稱亞元變量):a1,a2,a3,a4和a5。變量a1用于指示第1組的資料:即:當(dāng)資料屬于第1組的(group=1),則a1=1;其它組的資料(group¹1),則a1=0。變量a2用于指示第2組的資料,變量a3,a4和a5相應(yīng)分別指示第3,4,5組的資料(詳細(xì)見下表)。1此處僅是舉例而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論