醫(yī)學(xué)統(tǒng)計(jì)學(xué)SAS第一次實(shí)驗(yàn)課件_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)SAS第一次實(shí)驗(yàn)課件_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)SAS第一次實(shí)驗(yàn)課件_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)SAS第一次實(shí)驗(yàn)課件_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)SAS第一次實(shí)驗(yàn)課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SAS軟件介紹

.一、概述SAS系統(tǒng)全稱為StatisticsAnalysisSystem,最早由北卡羅來(lái)納大學(xué)的兩位生物統(tǒng)計(jì)學(xué)研究生編制,并于1976年成立了SAS軟件研究所,正式推出了SAS軟件。SAS是用于決策支持的大型集成信息系統(tǒng),但該軟件系統(tǒng)最早的功能限于統(tǒng)計(jì)分析,至今,統(tǒng)計(jì)分析功能也仍是它的重要組成部分和核心功能。.SAS系統(tǒng)是一個(gè)組合軟件系統(tǒng),它由多個(gè)功能模塊組合而成,其基本部分是BASESAS模塊。BASESAS模塊是SAS系統(tǒng)的核心,承擔(dān)著主要的數(shù)據(jù)管理任務(wù),并管理用戶使用環(huán)境,進(jìn)行用戶語(yǔ)言的處理,調(diào)用其他SAS模塊和產(chǎn)品。.啟動(dòng)SAS二、初識(shí)SAS

.啟動(dòng)后,出現(xiàn)如圖的SAS運(yùn)行界面,它象其它Windows應(yīng)用程序一樣,在一個(gè)主窗口內(nèi),包含若干個(gè)子窗口,并有菜單條、工具欄、狀態(tài)欄等。SAS有三個(gè)最重要的子窗口:程序窗口(PROGRAMEDITOR)、運(yùn)行記錄窗口(LOG)、輸出窗口(OUTPUT)。.ProgramEditor的窗口(窗口標(biāo)簽為Editor)就是用來(lái)輸入SAS語(yǔ)句的,編程操作的所有內(nèi)容都是在該窗口內(nèi)完成的。要運(yùn)行程序,只要用鼠標(biāo)單擊工具欄的提交(Submit)圖標(biāo),或用Run菜單下的Submit命令,或者直接按下F8鍵,就可運(yùn)行程序。如果選中某一段程序,然后進(jìn)行調(diào)用,則系統(tǒng)只執(zhí)行被選中的部分。.Editor窗口.Log窗口.運(yùn)行記錄窗口則記錄每段程序的運(yùn)行情況、所用時(shí)間、生成數(shù)據(jù)保存情況。如果有錯(cuò)誤還會(huì)用紅色指示錯(cuò)誤。.Log窗口出錯(cuò)原因:數(shù)據(jù)行末尾加了分號(hào).三、SAS程序的基本結(jié)構(gòu)SAS程序由語(yǔ)句組成,語(yǔ)句用分號(hào)結(jié)束。語(yǔ)句一般由特定的關(guān)鍵詞開(kāi)始,語(yǔ)句中可包含變量名、運(yùn)算符等,它們以空格分隔。SAS對(duì)語(yǔ)句所占的行數(shù)無(wú)限制,一個(gè)語(yǔ)句可占多行,同樣,多個(gè)語(yǔ)句也可占一行。.SAS中的變量及數(shù)據(jù)集名稱由英文字母、數(shù)字、下劃線組成,第一個(gè)字符必須是字母或下劃線,名字最多用8個(gè)字符,大寫(xiě)字母和小寫(xiě)字母不區(qū)分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一個(gè)名字,而class-1(不能有減號(hào))、abit(不能有空格)、serial#(不能有特殊字符)、Documents(超長(zhǎng))等不是合法的名字。四、SAS中的命名

.程序步分為兩種,一種叫數(shù)據(jù)步(datastep),一種叫過(guò)程步(procstep),分別以DATA語(yǔ)句和PROC語(yǔ)句開(kāi)始。數(shù)據(jù)步和過(guò)程步由若干個(gè)語(yǔ)句組成,一般以RUN語(yǔ)句結(jié)束。前者用來(lái)創(chuàng)建和修改用于統(tǒng)計(jì)分析的數(shù)據(jù)集,后者則利用已創(chuàng)建的數(shù)據(jù)集完成特定的統(tǒng)計(jì)分析任務(wù)。比如下面的例子:五、SAS中的程序步

.dataaaaa;建立數(shù)據(jù)集,數(shù)據(jù)集名稱為aaaainputx@@;數(shù)據(jù)集中有一個(gè)變量xcards;提示以下錄入的為數(shù)據(jù)12345注意數(shù)據(jù)行末尾不要加分號(hào);procprint;“輸出”過(guò)程varx;要求輸出變量xrun;程序結(jié)束要加上run語(yǔ)句才能運(yùn)行.數(shù)據(jù)步均以DATA語(yǔ)句開(kāi)始,用于創(chuàng)建和處理數(shù)據(jù)集。數(shù)據(jù)步中常用的語(yǔ)句如下表:表2數(shù)據(jù)步的常用語(yǔ)句語(yǔ)句格式功能DATA語(yǔ)句DATA數(shù)據(jù)集名;數(shù)據(jù)步的開(kāi)始,同時(shí)命名將要?jiǎng)?chuàng)建的數(shù)據(jù)集INPUT語(yǔ)句INPUT變量名<變量類型起止列數(shù)>…;確定變量的讀入格式,即確定輸入的數(shù)據(jù)所對(duì)應(yīng)的變量六、數(shù)據(jù)步基本結(jié)構(gòu).下面是幾個(gè)例子:Data語(yǔ)句:Dataabc;INPUT語(yǔ)句:Inputxyz;/*輸入變量x,y,z*/Inputx1-x10;/*輸入10個(gè)變量x1到x10*/Inputx$y@@;/*輸入變量x,y,符號(hào)$指明x為字符變量,@@表示數(shù)據(jù)是連續(xù)讀入*/.七、SAS程序的過(guò)程步

通俗地說(shuō),SAS程序的過(guò)程步就是用于實(shí)現(xiàn)各種統(tǒng)計(jì)分析功能的SAS命令,我們只需要按照其格式調(diào)用它們。過(guò)程步總是以一個(gè)proc語(yǔ)句開(kāi)始,后面緊跟著過(guò)程步名。如procprint;/*打印輸出過(guò)程*/

.八、數(shù)據(jù)集的引用如有一數(shù)據(jù)集已建立好,下次要使用時(shí)可以使用set語(yǔ)句來(lái)引用,如:datadef;setabc;將abc數(shù)據(jù)集內(nèi)容復(fù)制到def數(shù)據(jù)集中。run;.九、從excel導(dǎo)入數(shù)據(jù)將預(yù)先錄入在excel中的數(shù)據(jù)集導(dǎo)入到sas中:File-importdata-選擇microsoftexcel97or2000(*.xls).next下一步:瀏覽確認(rèn)excel數(shù)據(jù)集的位置.在臨時(shí)數(shù)據(jù)集work中為導(dǎo)入的數(shù)據(jù)集起名,例如abc.完成后按finish.Log窗口會(huì)有提示導(dǎo)入成功.導(dǎo)入數(shù)據(jù)集的注意事項(xiàng)被引用的Excel數(shù)據(jù)集此時(shí)必須保證關(guān)閉狀態(tài)才能被引用,否則會(huì)出錯(cuò)。被引用的Excel數(shù)據(jù)集內(nèi)盡量使用英文的變量名,否則容易出錯(cuò)。.計(jì)量資料的統(tǒng)計(jì)描述Univariate、Means過(guò)程.理論回顧計(jì)量資料的統(tǒng)計(jì)描述(頻數(shù)表,直方(條)圖,統(tǒng)計(jì)指標(biāo))正態(tài)分布資料偏峰分布資料

M(P25~P75).某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L)

實(shí)例分析變量類型?資料分布?定量變量1.根據(jù)專業(yè)知識(shí)2.繪制直方圖或頻數(shù)表3.統(tǒng)計(jì)學(xué)檢驗(yàn)(正態(tài)性).datat;inputx@@;*@@是行保持標(biāo)記符;

cards;7.42 8.65 23.02 21.61……24.66 14.1816.52;Run;SAS程序:建立數(shù)據(jù)集.SAS程序:計(jì)算統(tǒng)計(jì)指標(biāo),繪制直方圖procunivariatedata=t;*調(diào)用univariate過(guò)程;varx;*對(duì)變量x進(jìn)行分析;HISTOGRAMx/MIDPOINTS=7

TO

29

BY

2;*繪制直方圖;run;.運(yùn)行結(jié)果(graph窗口).均數(shù)標(biāo)準(zhǔn)差方差變異系數(shù)中位數(shù)極差四分位數(shù)間距未校正平方和校正平方和偏度系數(shù)峰度系數(shù)運(yùn)行結(jié)果(output窗口).運(yùn)行結(jié)果(output窗口).Means過(guò)程Procmeansmeanstdminmax;Varx;Run;可限定輸出常用的指標(biāo).定性資料的統(tǒng)計(jì)描述FREQ過(guò)程.現(xiàn)有一份預(yù)防醫(yī)學(xué)專業(yè)61名學(xué)生的個(gè)人資料,包括年級(jí)(grade)、性別(sex)和個(gè)人是否擁有電腦(pc)等等信息,試用一維表描述性別比例,用二維表描述不同性別學(xué)生擁有個(gè)人電腦的情況。

.SAS程序:proc

freq;tablessex;/*一維表*/run;proc

freq;tablessex*pc;/*二維表*/run;.置信區(qū)間Tinv函數(shù)以及賦值語(yǔ)句.總體均數(shù)的可信區(qū)間t分布法SAS函數(shù):TINV

t=TINV(p,df)可求t分位數(shù)的函數(shù),p是從-∞到當(dāng)前t分位數(shù)位置的面積。df=n-1(自由度)當(dāng)p<0.5,求出來(lái)的t為負(fù)數(shù);當(dāng)p>0.5,求出來(lái)的t為正數(shù)。t0-∞p.例:隨機(jī)抽取15名學(xué)生,記錄他們的性別(sex)、年齡(age)、體重(w)和身高(h),求:學(xué)生身高的95%置信區(qū)間。f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162.dataa;inputsex$agewh@@;cards;f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160F1660165m1765175f1861162;.procmeans;varh;Outputout=bmean=meanstd=sn=n;/*把均數(shù),標(biāo)準(zhǔn)差,樣本含量存放在數(shù)據(jù)集b中,方便下面寫(xiě)賦值語(yǔ)句計(jì)算置信區(qū)間*/datac;set

b;t=tinv(0.975,n-1);/*也可使用t=tinv(0.025,n-1);但此時(shí)計(jì)算出來(lái)的t界值為負(fù)數(shù)。*/yl=mean-t*s/sqrt(n);/*可信區(qū)間的下限*/y2=mean+t*s/sqrt(n);/*可信區(qū)間的上限*/procprint;run;.t檢驗(yàn)ttest過(guò)程.t檢驗(yàn)

1.單樣本t檢驗(yàn)

2.配對(duì)t檢驗(yàn)

3.兩個(gè)獨(dú)立樣本的t檢驗(yàn).一、單樣本資料的

t檢驗(yàn)

目的:根據(jù)樣本均數(shù)推斷其總體均數(shù)是否與已知總體均數(shù)0相等——與0的比較。應(yīng)用條件:獨(dú)立性正態(tài)性.例1某鎮(zhèn)痛新藥在藥廠投入量產(chǎn),已知該藥的生產(chǎn)技術(shù)標(biāo)準(zhǔn)為:每片藥中平均有效藥物含量為40.4mg。為評(píng)價(jià)生產(chǎn)質(zhì)量是否達(dá)標(biāo),現(xiàn)抽測(cè)10片藥物,結(jié)果為:41.3,40.8,38.7,42.7,43.0,38.6,42.7,39.5,42.1,42.1,問(wèn)該廠是否達(dá)到生產(chǎn)要求?

.dataaa;inputa@@;cards;41.340.838.742.743.038.642.739.542.142.1;數(shù)據(jù)步.

procttestH0=40.4;vara;run;過(guò)程步.

本例t=1.41,雙側(cè)檢驗(yàn)p=0.1917,按a=0.05水準(zhǔn),不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不認(rèn)為該廠生產(chǎn)質(zhì)量不達(dá)標(biāo)。.二、配對(duì)資料t檢驗(yàn)資料類型:兩個(gè)同質(zhì)對(duì)象接受不同處理;同一受試對(duì)象分別接受不同的處理,同一受試對(duì)象處理前后。條件:差值d服從正態(tài)分布.例2.數(shù)據(jù)步dataaa;

inputx1x2@@;

cards;

0.94 0.921.02 1.011.14 1.11

1.23 1.221.31 1.321.41 1.42

1.53 1.511.61 1.611.72 1.72

1.81 1.821.93 1.932.02 2.04

;.

procttest;pairedx1*x2;run;過(guò)程步.

本例t=0.771,P=0.4569,在α=0.05水平上不能拒絕H0,差別沒(méi)有統(tǒng)計(jì)學(xué)意義

,尚不能認(rèn)為兩法測(cè)定結(jié)果不同。

.兩個(gè)獨(dú)立樣本的t檢驗(yàn)

應(yīng)用條件:(1)觀察值之間是獨(dú)立的;(2)每組觀察值來(lái)自正態(tài)分布的總體;(3)兩個(gè)獨(dú)立組的方差相等。.例3:.dataaa;inputxgroup@@;cards;241361251141261341231201151191142182202152222242212252272232procunivariatenormal;/*正態(tài)性檢驗(yàn)*/classgroup;varx;r

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論