




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、本節(jié)STATA命令摘要by分組變量:summarize變量名1變量名2變量名m,detailci變量名1變量名2變量名m,level(#)binomialpoissonexposure(varname)by(分組變量)cii樣本量均數(shù)標(biāo)準(zhǔn)差,level(#)tab1變量名,generate(變量名)·資料特征描述(均數(shù),中位數(shù),離散程度)例:某地測定克山病患者與克山病健康人的血磷測定值如下表(數(shù)據(jù)摘自四川醫(yī)學(xué)院主編的衛(wèi)生統(tǒng)計(jì)學(xué),1978出版,p21):患者26324373373432473518558578640653健康人167198198233234250360373414417
2、457482578并假定這些數(shù)據(jù)已以STATA格式存入ex2dta文件中,其中變量x1為患者的血磷測定值數(shù)據(jù),變量x2為健康人的血磷測定值數(shù)據(jù)。上述數(shù)據(jù)也可以用變量x表示血磷測定值,分組變量group=0表示患者組和group=1表示健康組(如:患者組中第一個(gè)數(shù)據(jù)為26,則x=26,group=0;又如:健康組中第三個(gè)數(shù)據(jù)為198,則x為198以及group為1),并假定這些數(shù)據(jù)已以STATA格式存入ex2adta文件中。計(jì)算資料均數(shù),標(biāo)準(zhǔn)差命令summarize,以述資料為例:useex2,clearsummarizex1x2結(jié)果:變量樣本數(shù)均數(shù)標(biāo)準(zhǔn)差最小值最大值Variable|ObsMe
3、anStdDevMinMax-+x1|114710909130297726653x2|1333546151304368167578即:本例中急性克山病患者組的樣本數(shù)為11,血磷測定值均數(shù)為4711(mg%),相應(yīng)的標(biāo)準(zhǔn)差為1303,最小值為26以及最大值為653;健康組的樣本量為13,血磷測定值均數(shù)為33546,相應(yīng)的標(biāo)準(zhǔn)差為13044,最小值為167以及最大值為578。計(jì)算資料均數(shù),標(biāo)準(zhǔn)差,中位數(shù),低四分位數(shù)和高四分位數(shù)的命令summarize以及子命令detail,仍以述資料為例:useex2,clearsummarizex1x2,detail結(jié)果:x1PercentilesSmalles
4、t(最小值)1%26265%2632410%324373Obs11(樣本數(shù))25%373(低四分位)373SumofWgt1150%473(中位數(shù))(最大值)Mean4710909(均數(shù))LargestStdDev1302977(標(biāo)準(zhǔn)差)75%578(高四分位)55890%64578Variance1697749(方差)95%65364Skewness-0813446(偏度)99%653653Kurtosis1809951(峰度)x2PercentilesSmallest1%1671675%16719810%198198Obs1325%233233SumofWgt1350%36Mean3354
5、615LargestStdDev130436875%41741790%482457Variance170137795%578482Skewness296394399%578578Kurtosis1875392由上述結(jié)果可知:summarize命令并使用子命令detail,不僅可以得到各變量資料的均數(shù)和標(biāo)準(zhǔn)差,而且可以得到主要的非參數(shù)描述指標(biāo):低四分位(lowerquartile),中位數(shù)(Median)以及高四分位(upperquartile)。對于非正態(tài)資料,一般不應(yīng)用均數(shù)±標(biāo)準(zhǔn)差進(jìn)行描述,而應(yīng)使用中位數(shù)以及(低四分位-高四分位,稱interquartilerange,IQR)進(jìn)行
6、描述。如:若本資料不正態(tài)1,則x1的Median以及IQR為:473(373-578)以及x2的Median以及IQR為:36(233-417)。為樣本方差;為偏度,偏度的絕對值越小,表明該數(shù)據(jù)的正態(tài)對稱性越好;峰度,峰度值越大表明該數(shù)據(jù)的正態(tài)峰越明顯;在該數(shù)據(jù)中最小的四個(gè)數(shù)據(jù);在該數(shù)據(jù)中最大的四個(gè)數(shù)據(jù)。若調(diào)用ex2adta文件,進(jìn)行描述性統(tǒng)計(jì),可用下列命令:useex2a,clearsortgroup(將資料以group變量為例從小到大排序)bygroup:summarizex結(jié)果:->group=0xPercentilesSmallest1%26265%2632410%324373O
7、bs1125%373373SumofWgt1150%473Mean4710909LargestStdDev130297775%57855890%64578Variance169774995%65364Skewness-081344699%653653Kurtosis1809951->group=1xPercentilesSmallest1%1671675%16719810%198198Obs1325%233233SumofWgt1350%36Mean3354615LargestStdDev130436875%41741790%482457Variance170137795%578482S
8、kewness296394399%578578Kurtosis1875392上述結(jié)果與前面的結(jié)果對應(yīng)相同。·根據(jù)樣本數(shù)據(jù)計(jì)算可信限295%可信限計(jì)算:正態(tài)數(shù)據(jù):ci變量名0-1數(shù)據(jù):ci變量名,binomialpoisson分布數(shù)據(jù):ci變量名,poisson90%可信限計(jì)算(其它可信限類推)正態(tài)數(shù)據(jù):ci變量名,level(90)0-1數(shù)據(jù):ci變量名,level(90)binomialpoisson分布數(shù)據(jù):ci變量名,level(90)poisson以ex2dta為例計(jì)算x1,x2的95%可信限。useex2dta,clearVariable|ObsMeanStdErr95%C
9、onfInterval-+x1|114710909392862438355575586261x2|133354615361766725663934142837以上結(jié)果中:為樣本數(shù);為均數(shù);為標(biāo)準(zhǔn)誤;為95%的可信限,因此x1的95%可信限為38356,55863,x2的95%可信限為25664,41428。·根據(jù)樣本數(shù),樣本均數(shù)和標(biāo)準(zhǔn)差計(jì)算可信限3。若數(shù)據(jù)服從正態(tài)分布,并已知樣本均數(shù)和標(biāo)準(zhǔn)差以及樣本數(shù),則95%可信限計(jì)算為:cii樣本數(shù)樣本均數(shù)標(biāo)準(zhǔn)差,level(#)例:已知樣本數(shù)為90樣本均數(shù)為40以及樣本標(biāo)準(zhǔn)差為12,則:計(jì)算該樣本均數(shù)的95%可信限為cii904012Varia
10、ble|ObsMeanStdErr95%ConfInterval+|9040126491137486654251335該樣本均數(shù)的90%可信限為3748665,4251335cii904012,level(90)Variable|ObsMeanStdErr90%ConfInterval-+|9040126491137897524210248·計(jì)數(shù)資料中頻數(shù)和比例STATA命令:tab1變量名,g(新變量名)因?yàn)樵撁钪饕m用描述計(jì)數(shù)資料(即:屬性資料),當(dāng)使用子命令g(新變量),則產(chǎn)生屬性指示變量。在回歸分析中經(jīng)常需要這些指示變量作為亞元變量進(jìn)行分析。例:50只小鼠隨機(jī)分配到5個(gè)不同
11、飼料組,每組10只小鼠。在喂養(yǎng)一定時(shí)間后,測定鼠肝中的鐵的含量(mg/g)如表所示:試比較各組鼠肝中鐵的含量是否有顯著性差別(摘自醫(yī)學(xué)統(tǒng)計(jì)方法,金丕煥主編,p220)。用x表示鼠肝中鐵的含量以及用group=1,2,3,4,5分別表示對應(yīng)的5個(gè)組。tab1group,g(a)->tabulationofgroupgroup|FreqPercentCum+1|10200020002|10200040003|10200060004|10200080005|10200010000+Total|5010000為各屬性資料的頻數(shù);為該屬性占整個(gè)資料樣本數(shù)的百分比;為累計(jì)百分比。本例中,總樣本數(shù)為50,共有5組,每組有10個(gè)樣本點(diǎn),各占總樣本數(shù)的10%。因?yàn)槭褂昧俗用頶(a),從而產(chǎn)生5個(gè)指示變量(又可稱亞元變量):a1,a2,a3,a4和a5。變量a1用于指示第1組的資料:即:當(dāng)資料屬于第1組的(group=1),則a1=1;其它組的資料(group¹1),則a1=0。變量a2用于指示第2組的資料,變量a3,a4和a5相應(yīng)分別指示第3,4,5組的資料(詳細(xì)見下表)。1此處僅是舉例而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年03月四川自貢市沿灘區(qū)社會(huì)治安綜合治理中心公開招聘聘用制人員4人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 高溫氣冷堆及配套產(chǎn)品項(xiàng)目風(fēng)險(xiǎn)分析和評估報(bào)告
- 浙江省嘉興市2025屆高三下學(xué)期4月教學(xué)測試政治+答案
- 民辦四川天一學(xué)院《酒店信息化管理》2023-2024學(xué)年第二學(xué)期期末試卷
- LCR測量儀項(xiàng)目風(fēng)險(xiǎn)分析和評估報(bào)告
- 華東交通大學(xué)《劇本創(chuàng)作》2023-2024學(xué)年第二學(xué)期期末試卷
- 漳州理工職業(yè)學(xué)院《中醫(yī)養(yǎng)生與食療》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣東海洋大學(xué)《形體訓(xùn)練(Ⅱ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南都市職業(yè)學(xué)院《專業(yè)方向綜合課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西水利職業(yè)學(xué)院《中國古代小說導(dǎo)讀》2023-2024學(xué)年第二學(xué)期期末試卷
- 發(fā)證機(jī)關(guān)所在地區(qū)代碼表
- 奧托尼克斯計(jì)米器使用說明書
- 風(fēng)生水起博主的投資周記
- 供水管網(wǎng)施工組織設(shè)計(jì)
- 最全的冷軋知識(shí)材質(zhì)牌號(hào)分類及生產(chǎn)工藝
- 易制毒、易制爆化學(xué)品安全培訓(xùn)
- 氣化風(fēng)機(jī)檢修工藝規(guī)程
- 美女金喜善寫真集
- 大學(xué)物理平面電磁波ppt課件
- 八年級(jí)下寫字課
- 前列腺癌臨床路徑(最全版)
評論
0/150
提交評論