版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1SAS9.3使用入門陶育純SAS9.3使用入門陶育純2㈠SAS歷史
SAS(StatisticalAnalysisSystem)是當(dāng)今世界上最權(quán)威的統(tǒng)計(jì)分析系統(tǒng)之一。SAS系統(tǒng)于上世紀(jì)六十年代末由美國的NorthCarolina大學(xué)的一
個研究小組開發(fā)。1976年成立SAS研究所專門負(fù)責(zé)產(chǎn)品的研制、生產(chǎn)、銷售和培訓(xùn)。1985年首次推出PC版本,以后相繼推出升級版本,功能不
斷加強(qiáng),目前最新版本為SAS
V9.4。
一、SAS簡介㈠SAS歷史SAS(StatisticalAn3㈡SAS特點(diǎn)
SAS是一個模塊化、集成化的應(yīng)用軟件系統(tǒng),它可以實(shí)現(xiàn)對數(shù)據(jù)的完全控制和充分利用。主要完成以數(shù)據(jù)中心的四大任務(wù):
?數(shù)據(jù)訪問?數(shù)據(jù)管理?數(shù)據(jù)呈現(xiàn)?數(shù)據(jù)分析
SAS可由許多不同的模塊組成來完成不同的任務(wù)。對于最基本的、最常用的統(tǒng)計(jì)方法放在基本系統(tǒng)模塊(BASE)里,不管低版本還是高版本,此模塊都包含。常用的模塊有:SAS/BASE(基礎(chǔ))、SAS㈡SAS特點(diǎn)SAS是一個模塊化、集成化的應(yīng)用軟件4
/STAT(統(tǒng)計(jì))、SAS/GRAPH(圖形)、SAS/ETS(預(yù)測)、SAS/IML(矩陣)、SAS/QC(質(zhì)量控制)等。
SAS的特點(diǎn):
①可靠性高
②
易用性好
③
通用性強(qiáng)
④
應(yīng)用范圍廣/STAT(統(tǒng)計(jì))、SAS/GRAPH(圖形)、SAS5SASadsSASads6SAS大學(xué)版產(chǎn)品你可以花錢使用SAS,但你不能擁有它!SAS9.3,6萬元/年使用費(fèi),此價(jià)格可以享受5年。SAS大學(xué)版產(chǎn)品你可以花錢使用SAS9.3,6萬元/年使用7㈢SAS的啟動和操作界面OUTPUTLOGPROGAMEDITORCommand===>Command===>Command===>00001000020000300004Licensedtoxxxxxx早期DOS下的SAS6.04的操作界面㈢SAS的啟動和操作界面OUTPUTLOGPROGAM8早期Windows98下的SAS6.12的操作界面早期Windows98下的SAS6.12的操作界面9WindowsXP下的最新版SAS9.3的操作界面WindowsXP下的最新版SAS9.3的操作界面10㈣SAS的基本使用方法
SAS主要通過編程完成統(tǒng)計(jì)分析任務(wù)。SASProgram數(shù)據(jù)步(DATAStep)過程步(PROCStep)
SAS程序通過數(shù)據(jù)步完成SAS數(shù)據(jù)集(DataSet)的建立工作,此步還可對數(shù)據(jù)進(jìn)行加工、整理和變換。通過過程步調(diào)用一個或多個SAS過程(procedure),其作用是對已建立的SAS數(shù)據(jù)集進(jìn)行分析和管理。㈣SAS的基本使用方法SAS主要通過編程完成統(tǒng)計(jì)11datatest2;inputxy@@;d=x-y;cards;3550 2450 2000 2400 3000 1800 3950320038003250 3750 2700 3450 2500 3050 1750;procmeansmeanstdstderrtprt;vard;run;
以下是一個SAS程序的樣例。EducatingthenewgenerationofdecisionmakersinChinaTheSchoolofEconomicsandManagement(SEM)isthelargestschooloftheTsinghuaUniversityofBeijing.With4,300studentsin2004,thebusinessschooleducates15percentofthetotalnumberofstudentsatTsinghuaacrossthemajordisciplinesinbusiness,includingmanagementscienceandengineering,financeandinternationaltrade,accounting,andmarketing.Themajorityoftheschool'snon-MBAundergraduatescontinuetheiracademiceducationandeventuallyobtaintheirPh.D.sormaster'sdegrees.SEMalsohasvariousresearchcentersthatcontributetotheDevelopmentofmanagementknowledgeforbusiness:theChinaCenterforFinancialResearch,theNationalCenterforEconomicResearchandtheWal-MartRetailResearchCenter,tonameafew.
customersuccessstoriesdatatest2;以下是一個SAS程序的樣例12
SAS主要通過三個基本窗口,即程序編輯窗口(PROGAMEDITOR,簡記PGM)、日志窗口(LOG)和輸出窗口(OUTPUT)進(jìn)行程序的輸入、編輯、運(yùn)行以及運(yùn)行過程信息和運(yùn)行結(jié)果的查看、存儲。
以下是前述SAS程序樣例的運(yùn)行過程信息和運(yùn)行結(jié)果。SAS主要通過三個基本窗口,即程序編輯窗以下13
有關(guān)SAS使用方法的參考書如下:1.
SASforWindows
統(tǒng)計(jì)分析系統(tǒng)教程
洪楠等編
電子工業(yè)出版社
2001有關(guān)SAS使用方法的參考書如下:1.SASf142.
WindowsSAS6.12&8.0實(shí)用統(tǒng)計(jì)分析教程
胡良平編軍事醫(yī)學(xué)科學(xué)院
20013.
分類數(shù)據(jù)的統(tǒng)計(jì)分析及SAS編程
劉勤編復(fù)旦大學(xué)出版社
20024.
醫(yī)用統(tǒng)計(jì)學(xué)中的SAS統(tǒng)計(jì)分析
賀佳編第二軍醫(yī)大學(xué)出版社
20025.
醫(yī)用統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)(第三版)
方積乾編上海科學(xué)技術(shù)出版社
20066.
SAS8.2統(tǒng)計(jì)應(yīng)用教程薛富波編北京希望電子出版社
兵器工業(yè)出版社20042.WindowsSAS6.12&8.0實(shí)用統(tǒng)15
二、SAS9.3使用入門㈠SAS編程基礎(chǔ)1.
觀測值(observation)
等同于數(shù)據(jù)庫中的記錄(record)。
觀測值的集合稱為數(shù)據(jù)集(dataset)。2.
變量(variable)
等同于數(shù)據(jù)庫中的字段(field)。
①命名:變量名可由1~32個字符組成,首字符必須為字母,其后可以是字母、數(shù)字、下劃線。★
②變量特性:
數(shù)值型和字符型
?字符型變量在變量名后用一“$”號來表示。例如name$二、SAS9.3使用入門㈠SAS編程基礎(chǔ)116③變量清單的簡化表示:即可用x1–x20表示x1、x2
、x3…x20。④缺項(xiàng)值:用“?”表示。3.
常量(constant)①數(shù)值常量
②字符常量
③日期、時(shí)間和日期常量。4.
函數(shù)(function)
①算術(shù)函數(shù):
ABS(x)、SQRT(x)等。
②數(shù)學(xué)函數(shù):
EXP(x)
、LOG(x)
、LOG10(x)等。
③字符函數(shù):略。
④日期和時(shí)間函數(shù):DATE()等。③變量清單的簡化表示:17⑤
統(tǒng)計(jì)函數(shù):MEAN(x1,x2...)
、
STD(x1,x2...)
等。
⑥
概率函數(shù):POISSON(,n)
等。5.
操作符(operator)①算術(shù)操作符:
**
表示乘方。
②比較操作符:^=
或
NE
表示不等于。
③邏輯操作符:
&AND,|
OR,^
NOT。6.
SAS表達(dá)式(expression)㈡SAS建立數(shù)據(jù)集1.數(shù)據(jù)步基本語句①
DATA語句
格式:DATA[數(shù)據(jù)集名];;(分號)是SAS每個語句的結(jié)束符。[]表示此部分為可選項(xiàng)。⑤統(tǒng)計(jì)函數(shù):MEAN(x1,x2...)、STD18
作用:指明數(shù)據(jù)步的開始,給出所建數(shù)據(jù)集的名稱。
數(shù)據(jù)集名:[libref.]sas-filename
[庫標(biāo)記.]文件名
(一級名)(二級名)
每次SAS啟動時(shí)都自動指定兩個庫標(biāo)記(庫邏輯名):
SASUSER
永久庫
WORK
臨時(shí)庫
僅使用二級名的數(shù)據(jù)集,系統(tǒng)自動以WORK作為一級名。②
INPUT語句
格式:DATA[數(shù)據(jù)集名];作用:描述輸入的數(shù)據(jù),給輸入值定義變量。作用:指明數(shù)據(jù)步的開始,給出所建數(shù)據(jù)集的名稱。②IN19⑴列表方式★
格式:INPUTvariable[$]variable[$]…;
例:
inputname$ageheightweight;⑵格式方式
格式:INPUTvariableinformat…;informat(輸入格式):[$]informat-name[w].[d]其中
$
代表字符型變量
informat-name
輸入格式名
w
輸入數(shù)據(jù)域的寬度
?
必須的分隔符
d
小數(shù)部分的長度例:inputname$10.address$20.weight4.1;⑴列表方式★20
行保持符@@
適用于列表方式,作用為從一行讀入多個觀測值。
例:datat;inputxy@@;cards;3.162.94.85.78.246.58;procprint;run;
Q:如果沒有@@,數(shù)據(jù)集將會怎樣?行保持符@@Q:如果沒有@@,數(shù)據(jù)集將會怎樣?212.
SAS內(nèi)建數(shù)據(jù)集格式
★格式:DATA[數(shù)據(jù)集名];
INPUT變量
…;
其它語句
;
CARDS;
數(shù)據(jù)行
;
3.
從外部數(shù)據(jù)文件中讀入數(shù)據(jù)★
外部數(shù)據(jù)文件指ASCII碼型(文本)文件。2.SAS內(nèi)建數(shù)據(jù)集格式★格式:DATA22格式:DATA[數(shù)據(jù)集名];
INFILE‘filename‘;
filename應(yīng)包含完整的路徑。
INPUT變量
…;
其它語句
;RUN;
例:
datat;infile‘d:\99yf\fit.dat‘;inputnum$name$sex$heightweight;procprint;run;
INFILE語句必須在INPUT語句之前執(zhí)行。格式:DATA[數(shù)據(jù)集名];234.從已建立的數(shù)據(jù)集中讀入數(shù)據(jù)
格式:DATA[新數(shù)據(jù)集名];
SET舊數(shù)據(jù)集名;
其它語句
;RUN;
例:
datad2;
setd1;
假設(shè)d1中有變量x、y
z=x+y;
procprint;run;
新數(shù)據(jù)集d2中有變量x、y、z
。4.從已建立的數(shù)據(jù)集中讀入數(shù)據(jù)245.
從外部數(shù)據(jù)庫文件中導(dǎo)入數(shù)據(jù)★
外部數(shù)據(jù)庫文件指由數(shù)據(jù)庫軟件(如Excel、Access、dBASE、SPSS等)生成的數(shù)據(jù)文件。方法:點(diǎn)擊“文件File”→“導(dǎo)入數(shù)據(jù)ImportData…”5.從外部數(shù)據(jù)庫文件中導(dǎo)入數(shù)據(jù)★25選擇正確的數(shù)據(jù)源,Next
。選擇正確的數(shù)據(jù)源,Next。26找文件選擇工作表找文件選擇工作表27選擇SAS的庫,給數(shù)據(jù)集起名
。把此導(dǎo)入過程存成SAS程序
。PROCIMPORTOUT=WORK.TestMarkDATAFILE="D:\TYC\2007yf\sxt\testmark.xls"DBMS=EXCELREPLACE;RANGE="TYC";GETNAMES=YES;MIXED=NO;SCANTEXT=YES;USEDATE=YES;SCANTIME=YES;RUN;選擇SAS的庫,把此導(dǎo)入過程存PROCIMPORTOUT28㈢SAS分析過程1.過程步基本語句①
PROC語句
格式:PROC[數(shù)據(jù)集名];作用:指定調(diào)用的過程及該過程的若干選擇項(xiàng)。例:
procprintlabeldata=a;
(run;)
②
BY語句
格式:BY
[descending]variables[notsorted];作用:以指定的變量值來分組處理某數(shù)據(jù)集。
BY語句總是與SORT過程一起使用。㈢SAS分析過程1.過程步基本語句①PROC語句29③
CLASS語句
格式:CLASS
variables
;作用:定義分類變量。
CLASS語句不要求數(shù)據(jù)集事先排序。
④
VAR語句
格式:VARvariables;作用:用于定義分析變量。⑤
WEIGHT語句
格式:WEIGHT
variables
;作用:規(guī)定一個數(shù)值變量,以其值作為觀測值的權(quán)重。③CLASS語句30⑥
FREQ語句
格式:FREQ
variables
;作用:規(guī)定一個數(shù)值變量,其值表示觀測值出現(xiàn)的頻數(shù)。⑦
ID語句
格式:IDvariables;作用:用于規(guī)定一個或幾個變量,以便在輸出或由該過程生成的數(shù)據(jù)集中,不再使用OBS,而用這些變量值來識別觀測值。⑧
OUTPUT語句
格式:OUTPUT
OUT=數(shù)據(jù)集名[統(tǒng)計(jì)關(guān)鍵字=variable]
;作用:將過程結(jié)果輸出到一個新的SAS數(shù)據(jù)集中,以便作為下步處理的輸入。⑥FREQ語句31
例:
libnameyf‘c:\99yf\‘;
procmeansdata=yf.studentsnmeansum;varhw;outputout=yyymean=mhmwstd=sh;procprintdata=yyy;
(run;)
輸出結(jié)果見下圖:
OUTPUTN
ObsVariableNSUMMean
10H1016.65000001.6650000W10596.200000059.6200000MEANS過程的輸出
OBS_TYPE__FREQ_MHMWSH
10101.66559.620.096753YYY數(shù)據(jù)集的內(nèi)容OUTPUT例:libnameyf‘c:\99yf322.SAS服務(wù)過程語句PRINT過程格式:PROCPRINT[options];VARvariables;IDvariables;BYvariables;SUMvariables;
其中options可有如下選項(xiàng):DATA=數(shù)據(jù)集名指出過程待處理的數(shù)據(jù)集LABEL用變量標(biāo)記代替變量名輸出SUM語句指出將要被求總和的變量2.SAS服務(wù)過程語句PRINT過程33
FORMAT過程格式:PROCFORMAT[options];VALUE[$]format-namerange1=‘label’...
;其中options有如下選項(xiàng):LIBRARY=libref為永久的格式指定庫,libref為庫邏輯名。VALUE語句定義一種輸出格式。range可用LOW、HIGH、OTHER關(guān)鍵字。Example!FORMAT過程Example!34例:
procformat;valuehfmtlow-<1.69=‘L‘1.69-<1.75=‘M‘other=‘H‘;libnameap‘d:\tyc\sas‘;datalmh;setap.students;ifsex=‘M‘;formathhfmt.;
procprintdata=ap.studentslabel;run;procprintdata=lmhlabel;run;引用由FORMAT過程定義的格式時(shí),一定要在格式名后加句點(diǎn)(?)。例:procformat;引用由FORMAT過程35輸出結(jié)果見下圖:輸出結(jié)果見下圖:363.SAS描述性統(tǒng)計(jì)過程語句
UNIVARIATE過程★格式:PROCUNIVARIATE
[options];
VAR
variables;
BY
variables;
FREQ
variable
;
WEIGHT
variable
;
ID
variables;
OUTPUTOUT=數(shù)據(jù)集名statistic=variable;
其中options可有如下選項(xiàng):3.SAS描述性統(tǒng)計(jì)過程語句UNIVARIATE過程★37PLOT
給出莖葉圖、盒狀圖及正態(tài)概率圖
NORMAL
給出正態(tài)性檢驗(yàn)結(jié)果其中OUTPUT語句中常用統(tǒng)計(jì)量的SAS標(biāo)準(zhǔn)關(guān)鍵字有:
MEDIAN
中位數(shù)
P1(P5,
P10,P90,P95,P99)
第1(n)百分位數(shù)
NORMAL
正態(tài)性檢驗(yàn)統(tǒng)計(jì)量
PCTLPTS=百分位數(shù)值
指定所需求的百分位數(shù)值
PCTLNAME=百分位數(shù)名
指定所需求的百分位數(shù)名
PCTLPRE=
變量前綴
為包含新百分位數(shù)的輸出變量名指定前綴,建立新
百分位數(shù)時(shí)此選擇項(xiàng)必須
指定。Parameterstoomany!PLOT給出莖葉圖、盒狀圖38例:已知患者血液中磷和葡萄糖的含量,數(shù)據(jù)存放在
blood中,試對血磷觀測值進(jìn)行統(tǒng)計(jì)描述。libnametyc'd:\tyc';datat4;settyc.blood;procunivariatedata=tyc.bloodnormalplot;varphosphrs;run;輸出結(jié)果見下頁。例:已知患者血液中磷和葡萄糖的含量,數(shù)據(jù)存放在libname39SAS93使用入門報(bào)告課件40有中文就是好!有中文就是好!41
MEANS過程
FREQ過程4.SAS假設(shè)檢驗(yàn)過程語句
TTEST過程★格式:PROCTTEST[options];
CLASS
variable;
VAR
variables;
BY
variables;
其中CLASS是必選語句,用來指定分組變量,分組變量必須只取兩個水平的值。MEANS過程4.SAS假設(shè)檢驗(yàn)過程語句TTEST過程42例:某克山病區(qū)測得11例急性克山病患者和13例健康人的血磷值(mg%)如下表。問該地例急性克山病患者和健康人的血磷值是否不同?datat5;doa=1to2;inputn;dob=1ton;inputx@@;output;end;end;dropb;cards;112.603.243.733.734.324.735.185.585.786.406.53131.671.981.982.332.342.503.603.734.144.174.574.825.78;procttest;classa;varx;run;例:某克山病區(qū)測得11例急性克山病患者和13例健康人的血磷值43輸出結(jié)果見下圖:
方差齊性檢驗(yàn)P>0.05,方差齊方差不齊方差齊輸出結(jié)果見下圖:方差齊性檢驗(yàn)方差不齊方差齊44OUTPUT
TTESTPROCEDUREVariable:XANMeanStdDevStdErrorMinimumMaximum--------------------------------------------------------------------------1114.710909091.302977010.392862352.600000006.530000002133.354615381.304368400.361766701.670000005.78000000VariancesTDFProb>|T|---------------------------------------Unequal2.539621.40.0189Equal2.539422.00.0187ForH0:Variancesareequal,F'=1.00DF=(12,10)Prob>F'=1.0000方差不齊方差齊
方差齊性檢驗(yàn)P>0.05,方差齊早期SAS6.04輸出結(jié)果見下圖:中文還不如英文呢!OUTPUT45
FREQ過程
ANOVA過程
NPAR1WAY過程
REG過程
NLIN過程
CORR過程
LOGISTIC過程
LIFETEST過程
PHREG過程
……Theyaresomany!FREQ過程Theyare46Maybenexttime,IwillgiveyoudetailsforSAS.Thanks!Maybenexttime,47SAS9.3使用入門陶育純SAS9.3使用入門陶育純48㈠SAS歷史
SAS(StatisticalAnalysisSystem)是當(dāng)今世界上最權(quán)威的統(tǒng)計(jì)分析系統(tǒng)之一。SAS系統(tǒng)于上世紀(jì)六十年代末由美國的NorthCarolina大學(xué)的一
個研究小組開發(fā)。1976年成立SAS研究所專門負(fù)責(zé)產(chǎn)品的研制、生產(chǎn)、銷售和培訓(xùn)。1985年首次推出PC版本,以后相繼推出升級版本,功能不
斷加強(qiáng),目前最新版本為SAS
V9.4。
一、SAS簡介㈠SAS歷史SAS(StatisticalAn49㈡SAS特點(diǎn)
SAS是一個模塊化、集成化的應(yīng)用軟件系統(tǒng),它可以實(shí)現(xiàn)對數(shù)據(jù)的完全控制和充分利用。主要完成以數(shù)據(jù)中心的四大任務(wù):
?數(shù)據(jù)訪問?數(shù)據(jù)管理?數(shù)據(jù)呈現(xiàn)?數(shù)據(jù)分析
SAS可由許多不同的模塊組成來完成不同的任務(wù)。對于最基本的、最常用的統(tǒng)計(jì)方法放在基本系統(tǒng)模塊(BASE)里,不管低版本還是高版本,此模塊都包含。常用的模塊有:SAS/BASE(基礎(chǔ))、SAS㈡SAS特點(diǎn)SAS是一個模塊化、集成化的應(yīng)用軟件50
/STAT(統(tǒng)計(jì))、SAS/GRAPH(圖形)、SAS/ETS(預(yù)測)、SAS/IML(矩陣)、SAS/QC(質(zhì)量控制)等。
SAS的特點(diǎn):
①可靠性高
②
易用性好
③
通用性強(qiáng)
④
應(yīng)用范圍廣/STAT(統(tǒng)計(jì))、SAS/GRAPH(圖形)、SAS51SASadsSASads52SAS大學(xué)版產(chǎn)品你可以花錢使用SAS,但你不能擁有它!SAS9.3,6萬元/年使用費(fèi),此價(jià)格可以享受5年。SAS大學(xué)版產(chǎn)品你可以花錢使用SAS9.3,6萬元/年使用53㈢SAS的啟動和操作界面OUTPUTLOGPROGAMEDITORCommand===>Command===>Command===>00001000020000300004Licensedtoxxxxxx早期DOS下的SAS6.04的操作界面㈢SAS的啟動和操作界面OUTPUTLOGPROGAM54早期Windows98下的SAS6.12的操作界面早期Windows98下的SAS6.12的操作界面55WindowsXP下的最新版SAS9.3的操作界面WindowsXP下的最新版SAS9.3的操作界面56㈣SAS的基本使用方法
SAS主要通過編程完成統(tǒng)計(jì)分析任務(wù)。SASProgram數(shù)據(jù)步(DATAStep)過程步(PROCStep)
SAS程序通過數(shù)據(jù)步完成SAS數(shù)據(jù)集(DataSet)的建立工作,此步還可對數(shù)據(jù)進(jìn)行加工、整理和變換。通過過程步調(diào)用一個或多個SAS過程(procedure),其作用是對已建立的SAS數(shù)據(jù)集進(jìn)行分析和管理。㈣SAS的基本使用方法SAS主要通過編程完成統(tǒng)計(jì)57datatest2;inputxy@@;d=x-y;cards;3550 2450 2000 2400 3000 1800 3950320038003250 3750 2700 3450 2500 3050 1750;procmeansmeanstdstderrtprt;vard;run;
以下是一個SAS程序的樣例。EducatingthenewgenerationofdecisionmakersinChinaTheSchoolofEconomicsandManagement(SEM)isthelargestschooloftheTsinghuaUniversityofBeijing.With4,300studentsin2004,thebusinessschooleducates15percentofthetotalnumberofstudentsatTsinghuaacrossthemajordisciplinesinbusiness,includingmanagementscienceandengineering,financeandinternationaltrade,accounting,andmarketing.Themajorityoftheschool'snon-MBAundergraduatescontinuetheiracademiceducationandeventuallyobtaintheirPh.D.sormaster'sdegrees.SEMalsohasvariousresearchcentersthatcontributetotheDevelopmentofmanagementknowledgeforbusiness:theChinaCenterforFinancialResearch,theNationalCenterforEconomicResearchandtheWal-MartRetailResearchCenter,tonameafew.
customersuccessstoriesdatatest2;以下是一個SAS程序的樣例58
SAS主要通過三個基本窗口,即程序編輯窗口(PROGAMEDITOR,簡記PGM)、日志窗口(LOG)和輸出窗口(OUTPUT)進(jìn)行程序的輸入、編輯、運(yùn)行以及運(yùn)行過程信息和運(yùn)行結(jié)果的查看、存儲。
以下是前述SAS程序樣例的運(yùn)行過程信息和運(yùn)行結(jié)果。SAS主要通過三個基本窗口,即程序編輯窗以下59
有關(guān)SAS使用方法的參考書如下:1.
SASforWindows
統(tǒng)計(jì)分析系統(tǒng)教程
洪楠等編
電子工業(yè)出版社
2001有關(guān)SAS使用方法的參考書如下:1.SASf602.
WindowsSAS6.12&8.0實(shí)用統(tǒng)計(jì)分析教程
胡良平編軍事醫(yī)學(xué)科學(xué)院
20013.
分類數(shù)據(jù)的統(tǒng)計(jì)分析及SAS編程
劉勤編復(fù)旦大學(xué)出版社
20024.
醫(yī)用統(tǒng)計(jì)學(xué)中的SAS統(tǒng)計(jì)分析
賀佳編第二軍醫(yī)大學(xué)出版社
20025.
醫(yī)用統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)(第三版)
方積乾編上??茖W(xué)技術(shù)出版社
20066.
SAS8.2統(tǒng)計(jì)應(yīng)用教程薛富波編北京希望電子出版社
兵器工業(yè)出版社20042.WindowsSAS6.12&8.0實(shí)用統(tǒng)61
二、SAS9.3使用入門㈠SAS編程基礎(chǔ)1.
觀測值(observation)
等同于數(shù)據(jù)庫中的記錄(record)。
觀測值的集合稱為數(shù)據(jù)集(dataset)。2.
變量(variable)
等同于數(shù)據(jù)庫中的字段(field)。
①命名:變量名可由1~32個字符組成,首字符必須為字母,其后可以是字母、數(shù)字、下劃線?!?/p>
②變量特性:
數(shù)值型和字符型
?字符型變量在變量名后用一“$”號來表示。例如name$二、SAS9.3使用入門㈠SAS編程基礎(chǔ)162③變量清單的簡化表示:即可用x1–x20表示x1、x2
、x3…x20。④缺項(xiàng)值:用“?”表示。3.
常量(constant)①數(shù)值常量
②字符常量
③日期、時(shí)間和日期常量。4.
函數(shù)(function)
①算術(shù)函數(shù):
ABS(x)、SQRT(x)等。
②數(shù)學(xué)函數(shù):
EXP(x)
、LOG(x)
、LOG10(x)等。
③字符函數(shù):略。
④日期和時(shí)間函數(shù):DATE()等。③變量清單的簡化表示:63⑤
統(tǒng)計(jì)函數(shù):MEAN(x1,x2...)
、
STD(x1,x2...)
等。
⑥
概率函數(shù):POISSON(,n)
等。5.
操作符(operator)①算術(shù)操作符:
**
表示乘方。
②比較操作符:^=
或
NE
表示不等于。
③邏輯操作符:
&AND,|
OR,^
NOT。6.
SAS表達(dá)式(expression)㈡SAS建立數(shù)據(jù)集1.數(shù)據(jù)步基本語句①
DATA語句
格式:DATA[數(shù)據(jù)集名];;(分號)是SAS每個語句的結(jié)束符。[]表示此部分為可選項(xiàng)。⑤統(tǒng)計(jì)函數(shù):MEAN(x1,x2...)、STD64
作用:指明數(shù)據(jù)步的開始,給出所建數(shù)據(jù)集的名稱。
數(shù)據(jù)集名:[libref.]sas-filename
[庫標(biāo)記.]文件名
(一級名)(二級名)
每次SAS啟動時(shí)都自動指定兩個庫標(biāo)記(庫邏輯名):
SASUSER
永久庫
WORK
臨時(shí)庫
僅使用二級名的數(shù)據(jù)集,系統(tǒng)自動以WORK作為一級名。②
INPUT語句
格式:DATA[數(shù)據(jù)集名];作用:描述輸入的數(shù)據(jù),給輸入值定義變量。作用:指明數(shù)據(jù)步的開始,給出所建數(shù)據(jù)集的名稱。②IN65⑴列表方式★
格式:INPUTvariable[$]variable[$]…;
例:
inputname$ageheightweight;⑵格式方式
格式:INPUTvariableinformat…;informat(輸入格式):[$]informat-name[w].[d]其中
$
代表字符型變量
informat-name
輸入格式名
w
輸入數(shù)據(jù)域的寬度
?
必須的分隔符
d
小數(shù)部分的長度例:inputname$10.address$20.weight4.1;⑴列表方式★66
行保持符@@
適用于列表方式,作用為從一行讀入多個觀測值。
例:datat;inputxy@@;cards;3.162.94.85.78.246.58;procprint;run;
Q:如果沒有@@,數(shù)據(jù)集將會怎樣?行保持符@@Q:如果沒有@@,數(shù)據(jù)集將會怎樣?672.
SAS內(nèi)建數(shù)據(jù)集格式
★格式:DATA[數(shù)據(jù)集名];
INPUT變量
…;
其它語句
;
CARDS;
數(shù)據(jù)行
;
3.
從外部數(shù)據(jù)文件中讀入數(shù)據(jù)★
外部數(shù)據(jù)文件指ASCII碼型(文本)文件。2.SAS內(nèi)建數(shù)據(jù)集格式★格式:DATA68格式:DATA[數(shù)據(jù)集名];
INFILE‘filename‘;
filename應(yīng)包含完整的路徑。
INPUT變量
…;
其它語句
;RUN;
例:
datat;infile‘d:\99yf\fit.dat‘;inputnum$name$sex$heightweight;procprint;run;
INFILE語句必須在INPUT語句之前執(zhí)行。格式:DATA[數(shù)據(jù)集名];694.從已建立的數(shù)據(jù)集中讀入數(shù)據(jù)
格式:DATA[新數(shù)據(jù)集名];
SET舊數(shù)據(jù)集名;
其它語句
;RUN;
例:
datad2;
setd1;
假設(shè)d1中有變量x、y
z=x+y;
procprint;run;
新數(shù)據(jù)集d2中有變量x、y、z
。4.從已建立的數(shù)據(jù)集中讀入數(shù)據(jù)705.
從外部數(shù)據(jù)庫文件中導(dǎo)入數(shù)據(jù)★
外部數(shù)據(jù)庫文件指由數(shù)據(jù)庫軟件(如Excel、Access、dBASE、SPSS等)生成的數(shù)據(jù)文件。方法:點(diǎn)擊“文件File”→“導(dǎo)入數(shù)據(jù)ImportData…”5.從外部數(shù)據(jù)庫文件中導(dǎo)入數(shù)據(jù)★71選擇正確的數(shù)據(jù)源,Next
。選擇正確的數(shù)據(jù)源,Next。72找文件選擇工作表找文件選擇工作表73選擇SAS的庫,給數(shù)據(jù)集起名
。把此導(dǎo)入過程存成SAS程序
。PROCIMPORTOUT=WORK.TestMarkDATAFILE="D:\TYC\2007yf\sxt\testmark.xls"DBMS=EXCELREPLACE;RANGE="TYC";GETNAMES=YES;MIXED=NO;SCANTEXT=YES;USEDATE=YES;SCANTIME=YES;RUN;選擇SAS的庫,把此導(dǎo)入過程存PROCIMPORTOUT74㈢SAS分析過程1.過程步基本語句①
PROC語句
格式:PROC[數(shù)據(jù)集名];作用:指定調(diào)用的過程及該過程的若干選擇項(xiàng)。例:
procprintlabeldata=a;
(run;)
②
BY語句
格式:BY
[descending]variables[notsorted];作用:以指定的變量值來分組處理某數(shù)據(jù)集。
BY語句總是與SORT過程一起使用。㈢SAS分析過程1.過程步基本語句①PROC語句75③
CLASS語句
格式:CLASS
variables
;作用:定義分類變量。
CLASS語句不要求數(shù)據(jù)集事先排序。
④
VAR語句
格式:VARvariables;作用:用于定義分析變量。⑤
WEIGHT語句
格式:WEIGHT
variables
;作用:規(guī)定一個數(shù)值變量,以其值作為觀測值的權(quán)重。③CLASS語句76⑥
FREQ語句
格式:FREQ
variables
;作用:規(guī)定一個數(shù)值變量,其值表示觀測值出現(xiàn)的頻數(shù)。⑦
ID語句
格式:IDvariables;作用:用于規(guī)定一個或幾個變量,以便在輸出或由該過程生成的數(shù)據(jù)集中,不再使用OBS,而用這些變量值來識別觀測值。⑧
OUTPUT語句
格式:OUTPUT
OUT=數(shù)據(jù)集名[統(tǒng)計(jì)關(guān)鍵字=variable]
;作用:將過程結(jié)果輸出到一個新的SAS數(shù)據(jù)集中,以便作為下步處理的輸入。⑥FREQ語句77
例:
libnameyf‘c:\99yf\‘;
procmeansdata=yf.studentsnmeansum;varhw;outputout=yyymean=mhmwstd=sh;procprintdata=yyy;
(run;)
輸出結(jié)果見下圖:
OUTPUTN
ObsVariableNSUMMean
10H1016.65000001.6650000W10596.200000059.6200000MEANS過程的輸出
OBS_TYPE__FREQ_MHMWSH
10101.66559.620.096753YYY數(shù)據(jù)集的內(nèi)容OUTPUT例:libnameyf‘c:\99yf782.SAS服務(wù)過程語句PRINT過程格式:PROCPRINT[options];VARvariables;IDvariables;BYvariables;SUMvariables;
其中options可有如下選項(xiàng):DATA=數(shù)據(jù)集名指出過程待處理的數(shù)據(jù)集LABEL用變量標(biāo)記代替變量名輸出SUM語句指出將要被求總和的變量2.SAS服務(wù)過程語句PRINT過程79
FORMAT過程格式:PROCFORMAT[options];VALUE[$]format-namerange1=‘label’...
;其中options有如下選項(xiàng):LIBRARY=libref為永久的格式指定庫,libref為庫邏輯名。VALUE語句定義一種輸出格式。range可用LOW、HIGH、OTHER關(guān)鍵字。Example!FORMAT過程Example!80例:
procformat;valuehfmtlow-<1.69=‘L‘1.69-<1.75=‘M‘other=‘H‘;libnameap‘d:\tyc\sas‘;datalmh;setap.students;ifsex=‘M‘;formathhfmt.;
procprintdata=ap.studentslabel;run;procprintdata=lmhlabel;run;引用由FORMAT過程定義的格式時(shí),一定要在格式名后加句點(diǎn)(?)。例:procformat;引用由FORMAT過程81輸出結(jié)果見下圖:輸出結(jié)果見下圖:823.SAS描述性統(tǒng)計(jì)過程語句
UNIVARIATE過程★格式:PROCUNIVARIATE
[options];
VAR
variables;
BY
variables;
FREQ
variable
;
WEIGHT
variable
;
ID
variables;
OUTPUTOUT=數(shù)據(jù)集名statistic=variable;
其中options可有如下選項(xiàng):3.SAS描述性統(tǒng)計(jì)過程語句UNIVARIATE過程★83PLOT
給出莖葉圖、盒狀圖及正態(tài)概率圖
NORMAL
給出正態(tài)性檢驗(yàn)結(jié)果其中OUTPUT語句中常用統(tǒng)計(jì)量的SAS標(biāo)準(zhǔn)關(guān)鍵字有:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版施工隊(duì)中途退場預(yù)防措施及違約責(zé)任協(xié)議3篇
- 2025年湖南省懷化靖州苗族侗族自治縣自來水公司招聘筆試參考題庫附帶答案詳解
- 2025年銷售員聘用協(xié)議書含客戶關(guān)系維護(hù)服務(wù)2篇
- 2025年度新型智能公寓租賃合同范本4篇
- 2025版安防產(chǎn)品銷售代理居間服務(wù)合同范本
- 2025年度個人租車保險(xiǎn)及救援服務(wù)合作協(xié)議4篇
- 2025年全球及中國半導(dǎo)體光刻模擬器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 2025-2030全球心包穿刺套件行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025年全球及中國光熱液壓系統(tǒng)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 2025年鋼構(gòu)工程裝配式建筑合同樣本2篇
- 2024年湖南商務(wù)職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫帶答案
- 全國身份證前六位、區(qū)號、郵編-編碼大全
- 2024-2025學(xué)年福建省廈門市第一中學(xué)高一(上)適應(yīng)性訓(xùn)練物理試卷(10月)(含答案)
- 2024年全國各地中考試題分類匯編:作文題目
- 《糖拌西紅柿 》 教案()
- 彈性力學(xué)數(shù)值方法:解析法:彈性力學(xué)中的變分原理
- 《零售學(xué)第二版教學(xué)》課件
- 廣東省珠海市香洲區(qū)2023-2024學(xué)年四年級下學(xué)期期末數(shù)學(xué)試卷
- 房地產(chǎn)行業(yè)職業(yè)生涯規(guī)劃
- 江蘇省建筑與裝飾工程計(jì)價(jià)定額(2014)電子表格版
- MOOC 數(shù)字電路與系統(tǒng)-大連理工大學(xué) 中國大學(xué)慕課答案
評論
0/150
提交評論