




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、SAS軟件與數(shù)學(xué)建模鮮思東重慶郵電大學(xué)Email:統(tǒng)計(jì)生物物理化學(xué)經(jīng)濟(jì)保險(xiǎn)心理教育管理內(nèi)容簡(jiǎn)介模塊簡(jiǎn)介SAS與Excel的通訊常用過(guò)程SAS的學(xué)習(xí)曲線(xiàn)擬合非線(xiàn)性規(guī)劃神經(jīng)網(wǎng)絡(luò)多元統(tǒng)計(jì)矩陣運(yùn)算回歸分析模塊簡(jiǎn)介SAS系統(tǒng)的組成 SAS數(shù)據(jù)庫(kù)部分:其模塊為SAS/BASE。它也是其它模塊的基礎(chǔ),即其它模塊是建立在其基礎(chǔ)之上的 SAS分析核心:這一部分包括了許多模塊: SAS/STAT:統(tǒng)計(jì)分析模塊:回歸分析、方差分析、屬性數(shù)據(jù)分析、多變量分析、判別和聚類(lèi)分析、殘存分析、心理測(cè)驗(yàn)分析和非參數(shù)分析等8類(lèi)40多個(gè)過(guò)程。 SAS/ETS:經(jīng)濟(jì)預(yù)測(cè)或時(shí)間序列分析模塊。如實(shí)用預(yù)測(cè)(逐步回歸、指數(shù)平滑等)序列相關(guān)校
2、正回歸、分布滯后回歸、ARIMA模型、狀態(tài)空間方法、譜分析和互譜分析等。 SAS/OR:運(yùn)籌學(xué)和工程管理模塊:可進(jìn)行線(xiàn)性和非線(xiàn)性規(guī)劃,還包括項(xiàng)目管理,時(shí)間安排和資源分配等問(wèn)題的一整套方法。 SAS/QC:質(zhì)量控制和試驗(yàn)設(shè)計(jì)模塊。 SAS/IML:矩陣運(yùn)算模塊。 SAS/LAB:菜單驅(qū)動(dòng)的面向任務(wù)的解釋引導(dǎo)式數(shù)據(jù)分析模塊。 SAS/INSIGHT:可視化數(shù)據(jù)探索工具模塊。 SAS/SPECTRAVIEW:多維數(shù)據(jù)觀測(cè)、分析、研究的交互式立體可視化工具模塊模塊簡(jiǎn)介SAS系統(tǒng)的組成 SAS開(kāi)發(fā)及呈現(xiàn)工具: SAS/AF:應(yīng)用開(kāi)發(fā)工具。采用面向?qū)ο蟮募夹g(shù),開(kāi)發(fā)用戶(hù)自己的圖形用戶(hù)界面(GUI)的應(yīng)用系統(tǒng)
3、。 SAS/EIS:行政管理系統(tǒng)或個(gè)人的信息系統(tǒng) SAS/GRAPH:圖形軟件包 SAS/GIS:集地理信息系統(tǒng)功能與空間數(shù)據(jù)的顯示分析于一體的軟件 SAS對(duì)分布處理模式的支持及其數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì): SAS/ACCESS:與外部數(shù)據(jù)庫(kù)文件的接口模塊。 SAS/CONNECT:在網(wǎng)絡(luò)環(huán)境下,使各平臺(tái)上的SAS系統(tǒng)建立內(nèi)在聯(lián)系模塊。實(shí)現(xiàn)分布處理,從而有效地利用各平臺(tái)數(shù)據(jù)和機(jī)器資源 SAS/SHARE:實(shí)行SAS系統(tǒng)中數(shù)據(jù)庫(kù)的并發(fā)控制的模塊 SAS與Excel的通訊SAS中數(shù)據(jù)Excel常用過(guò)程曲線(xiàn)擬合例:負(fù)指數(shù)增長(zhǎng)曲線(xiàn)數(shù)據(jù)圖形模型SAS程序(nlin)常用過(guò)程非線(xiàn)性規(guī)劃例:求下面非線(xiàn)性問(wèn)題的解SAS程
4、序(nlp)常用過(guò)程神經(jīng)網(wǎng)絡(luò)輸入層隱層輸出層常用過(guò)程神經(jīng)網(wǎng)絡(luò)例:用神經(jīng)網(wǎng)絡(luò)構(gòu)造邏輯運(yùn)算異或輸入層隱層輸出層0 0 00 1 11 0 11 1 0 x1 x2 ySAS程序(xornet)常用過(guò)程多元統(tǒng)計(jì)聚類(lèi)分析判別分析主成分分析典型相關(guān)分析因子分析常用過(guò)程矩陣運(yùn)算SAS程序(iml)SAS系統(tǒng)基礎(chǔ)1 概述1.1 SAS顯示管理系統(tǒng)1.2 SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集2 SAS編程基礎(chǔ)2.1 一個(gè)簡(jiǎn)單SAS程序2.2 SAS變量2.3 SAS表達(dá)式2.4 SAS函數(shù)2.4.1 SAS函數(shù)概述2.4.2 常用SAS函數(shù)3 DATA步3.1 DATA步流程3.2 INPUT語(yǔ)句3.3 數(shù)據(jù)集的整理3.4
5、數(shù)據(jù)集的連接與合并3.5 SAS與外部數(shù)據(jù)的交換Statistical Analysis System(縮寫(xiě)為SAS): 是用于數(shù)據(jù)分析與決策支持的大型集成式模塊化軟件系統(tǒng) 在數(shù)據(jù)處理和統(tǒng)計(jì)分析領(lǐng)域,SAS系統(tǒng)被譽(yù)為國(guó)際上的標(biāo)準(zhǔn)軟件系統(tǒng)四大任務(wù):數(shù)據(jù)訪(fǎng)問(wèn)訪(fǎng)問(wèn)任何形式和來(lái)源的數(shù)據(jù)數(shù)據(jù)管理將數(shù)據(jù)轉(zhuǎn)變?yōu)榭捎眯问綌?shù)據(jù)呈現(xiàn)以文字、圖形和表格的形式展現(xiàn)數(shù)據(jù)信息數(shù)據(jù)分析獲取有意義的信息SAS系統(tǒng)是一個(gè)可由幾個(gè)到二、三十個(gè)工具模塊及面向行業(yè)的子系統(tǒng)組成的可伸縮系統(tǒng)模塊按功能可分為四類(lèi):數(shù)據(jù)庫(kù)部分:Base SAS,FSP,ACCESS分析核心:STAT,ETS,QC,OR,INSIGHT開(kāi)發(fā)呈現(xiàn)工具:AF,E
6、IS,GRAPH,分布處理與數(shù)據(jù)倉(cāng)庫(kù):CONNECT,WA1. SAS顯示管理系統(tǒng) SAS系統(tǒng)的啟動(dòng) 點(diǎn)擊圖標(biāo) ,啟動(dòng)SAS系統(tǒng)命令窗口菜單欄工具欄LOG窗程序編輯窗狀態(tài)欄結(jié)果窗資源管理器結(jié)果輸出窗演示2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)庫(kù):主要用于存放數(shù)據(jù)集和目錄.SAS系統(tǒng)庫(kù)操作系統(tǒng)文件夾2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)庫(kù):主要用于存放數(shù)據(jù)集和目錄.臨時(shí)庫(kù)(WORK):SAS系統(tǒng)的臨時(shí)工作目錄,退出系統(tǒng)時(shí), 其中的內(nèi)容全部刪除永久庫(kù): 與臨時(shí)庫(kù)相反.SAS提供SASUSER,SASHELP2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)庫(kù):主要用于存放數(shù)據(jù)集和目錄.創(chuàng)建用戶(hù)永久庫(kù) 用操作系統(tǒng)中的資
7、源管理器,建立一文件夾程序方式: libname 庫(kù)名 文件夾所在路徑菜單方式: 點(diǎn)擊圖標(biāo) ,然后按要求操作.在SAS系統(tǒng)中建庫(kù)2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)庫(kù):主要用于存放數(shù)據(jù)集和目錄.創(chuàng)建用戶(hù)永久庫(kù)例:在SAS中先用程序方式建立一名為COURSE的用戶(hù)庫(kù);再用菜單方式建立一名為COURSE1的用戶(hù)庫(kù)。操作2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)集:主要用于存放數(shù)據(jù)文件。它一般由描述部分和數(shù)據(jù)部分組成,也有一些數(shù)據(jù)集包含索引部分。數(shù)據(jù)部分是存放數(shù)據(jù)的地方,它組織成一張二維表,其列表示變量,行表示觀測(cè)。描述部分說(shuō)明了數(shù)據(jù)集的一般信息,如數(shù)據(jù)集的名字和成員類(lèi)型;建立的日期和時(shí)間;觀測(cè)數(shù)以及變量
8、個(gè)數(shù)、屬性等。2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)集:數(shù)據(jù)部分是存放數(shù)據(jù)的地方,它組織成一張二維表,其列表示變量,行表示觀測(cè)。觀測(cè)變量2. SAS數(shù)據(jù)庫(kù)與數(shù)據(jù)集SAS數(shù)據(jù)集的引用:庫(kù)名數(shù)據(jù)集名園點(diǎn)連接符Data bodyfat; inPUt sex $ fatpct ; fat=fatpct/100;cards;M 13.3 F 22 M 19 F 26 M 20 F 16 M 8 F 12 M 18 F 21.7M 22 F 23.2 M 20 F 21 M 31 F 28 M 21 F 30 M 12 F 23M 16 M 12 M 24RUN;PROC means data=bodyfa
9、t;var fatpct;run;DATA步程序步1、一個(gè)簡(jiǎn)單SAS程序該程序的結(jié)構(gòu)包括兩部分: 以關(guān)鍵詞DATA開(kāi)始的DATA步;主要?jiǎng)?chuàng)建數(shù)據(jù)集,如此例中的bodyfat,同時(shí)也可以產(chǎn)生一些描述性統(tǒng)計(jì)和報(bào)表輸出; 以關(guān)鍵詞PROC開(kāi)頭PROC步。PROC步則是系統(tǒng)預(yù)先寫(xiě)好的執(zhí)行特殊任務(wù)的SAS子程序,如此例中的means過(guò)程,它主要是承擔(dān)數(shù)據(jù)的分析,同時(shí)也可產(chǎn)生相關(guān)的數(shù)據(jù)集。 1、一個(gè)簡(jiǎn)單SAS程序從該程序可以看出SAS程序的特點(diǎn): SAS程序是由SAS關(guān)鍵詞、SAS名字、特殊字符(如例子中的$號(hào))和運(yùn)算符組成的字符串,并以分號(hào)(;)結(jié)尾的SAS語(yǔ)句組成,它要求SAS系統(tǒng)執(zhí)行一種操作或給SA
10、S系統(tǒng)提供信息。 SAS程序不區(qū)分大小寫(xiě),語(yǔ)句位置任意,一條語(yǔ)句的書(shū)寫(xiě)既可起始于任何行、列,也可跨越多行,同時(shí)也可以將多條語(yǔ)句寫(xiě)在一行。不過(guò)一個(gè)好的習(xí)慣是;DATA步和PROC步頂格書(shū)寫(xiě),在每個(gè)步驟內(nèi)的語(yǔ)句以縮進(jìn)的方式書(shū)寫(xiě),這樣閱讀和理解起來(lái)方便。 1、一個(gè)簡(jiǎn)單SAS程序操作SAS變量的命名:第一個(gè)字符必須是字母或下劃線(xiàn)(_);后面可跟1至32個(gè)字符(數(shù)字、字母或下劃線(xiàn))變量的屬性: 類(lèi)型(type):數(shù)值型、字符型(定義時(shí)變量后帶$) 長(zhǎng)度(length):存儲(chǔ)該變量所用的字節(jié)數(shù)(缺省為8) 輸入格式(informat)/輸出格式(format): 標(biāo)簽(label):對(duì)變量的作用給予描述。
11、2、SAS變量輸入/輸出格式: 類(lèi)型: 字符型:用于字符變量的現(xiàn)成格式 數(shù)值型:用于一般數(shù)值型變量的現(xiàn)成格式 日期時(shí)間型:用于日期和時(shí)間的現(xiàn)成格式 用戶(hù)定義:用于用戶(hù)自定義格式2、SAS變量輸入/輸出格式: 一般形式:格式名.2、SAS變量字符型變量寬度小數(shù)點(diǎn)后數(shù)值位數(shù)輸入/輸出格式: 字符格式:$w. $CHARw.2、SAS變量其含義是讀入或顯示字符變量的前w個(gè)字節(jié)。其缺省值均為變量的長(zhǎng)度。當(dāng)變量的長(zhǎng)度未定時(shí),$CHARw.格式寬度的缺省值為8;對(duì) $w.作為輸出格式時(shí)缺省寬度為1,作為輸入格式時(shí),必須提供w的值。二者作為輸出格式時(shí),均保留字符串前的空格;但作為輸入格式時(shí), $CHARw.
12、保留字符串前的空格,而$w.則刪除字符前的空格。輸入/輸出格式: 數(shù)值輸入格式:w.d 數(shù)值輸出格式:BESTw. 2、SAS變量BESTw.是缺省輸出格式。W的缺省值為12,最大可取32。含義為將數(shù)值在規(guī)定的寬度下用最為精確有效的方式顯示。若用定點(diǎn)方式表示可提供更多的有效數(shù)字就使用定點(diǎn)方式;否則自動(dòng)使用浮點(diǎn)數(shù)。如:數(shù)據(jù)集中數(shù)值 輸出格式 輸出表示1257000 best6. 1.26E61257000 best3. 1E6輸入/輸出格式: 數(shù)值輸入格式:COMMAw.d 2、SAS變量如:原始數(shù)據(jù) 輸入格式 記入數(shù)值$1,2345,6789 comma12.2 1234567.89$1234
13、,5678.9 comma12.2 12345678.9($1,2345,6789) comma14.2 -1234567.89輸入/輸出格式: 數(shù)值輸出格式:COMMAw.d & DOLLARw.d 2、SAS變量如:原始數(shù)據(jù) 輸出格式 輸出表示123456.7 comma12.2 123,456.70-123456.7 comma12.2 -123,456.70123456.7 dollar12.2 $123,456.70-123456.7 dollar12.2 -123,456.70 輸入/輸出格式(日期): 日期、時(shí)間的處理: 將日期和時(shí)間值均作為數(shù)值變量存儲(chǔ)以1960年1月1日為0點(diǎn)
14、,其它日期值為該日期值與1960年1月1日相差的天數(shù)。時(shí)間以1960年1月1日0時(shí)0分0秒為起點(diǎn)(0點(diǎn)),其余時(shí)間為與其的差值。 2、SAS變量輸入/輸出格式(日期):輸入格式: YYMMDDw. 輸出格式:YYMMDDxw.源數(shù)據(jù)日期 輸入格式 SAS日期值 輸出格式 輸出表示99-10-15 yymmdd8. 14532 yymmddd10. 1999-10-1599/10/15 ddmmyy8. 14532 yymmdds10. 1999/10/15151099 ddmmyy6. 14532 mmddyyp10. 10.15.199910-15-99 mmddyy8. 14532 ddm
15、myyn8. 151019992、SAS變量其中輸出格式中的x的取值為:x: B C D N P S含義 空格 : - 無(wú) . /輸入/輸出格式(日期):輸入輸出格式: DATEw.源數(shù)據(jù)日期 輸入格式 SAS日期值 輸出格式 輸出表示15OCT99 date7. 14532 date9. 15OCT19992、SAS變量輸入/輸出格式(時(shí)間):輸入格式: TIMEw. 和輸出格式: TIMEw.d hh:mm:ss.ss(時(shí):分:秒.百分秒)源數(shù)據(jù)日期 輸入格式 SAS日期值 輸出格式 輸出表示13:40:35.37 time11. 49235.37 time11.2 13:40:35.37
16、13 40 35.37 time11. 49235.37 Time2. 1313/40/35.37 time11. 49235.37 Time5. 13:4013-40-35.37 time11. 49235.37 Time8. 13:40:351 40 35.37 PM time14. 49235.37 Timeampm13.2 1:40:35.37 PM2、SAS變量輸入/輸出格式(日期時(shí)間):輸入格式: DATETIMEw. ddmmmyy hh:mm:ss.ss 或 ddmmmyyyy hh:mm:ss.ss 輸出格式: DATETIMEw.d ddmmmyy:hh:mm:ss.ss
17、或 ddmmmyyyy:hh:mm:ss.ss 2、SAS變量變量列表: x1 x2 x3 xn 簡(jiǎn)寫(xiě)為x1-xn A B C D 簡(jiǎn)寫(xiě)為A-D V X TD UP JPP 簡(jiǎn)寫(xiě)為V-JPP2、SAS變量表達(dá)式是由運(yùn)算符和運(yùn)算對(duì)象形成的指令集3、SAS表達(dá)式1.SAS常數(shù) 數(shù)值常數(shù): 110 -0.35 1.8E3 0.5E-10 字符常數(shù): Smith 23 John Smith 日期,時(shí)間和日期時(shí)間常數(shù): 13JUL2001d 22:23t 13JUL2001:22:23:25DT2.SAS運(yùn)算符: 算術(shù)運(yùn)算符: *(乘方) * / + - 比較運(yùn)算符: = (eq) =(ne) (gt)
18、 =(ge) (取小) (取大) |(連接)表達(dá)式是由運(yùn)算符和運(yùn)算對(duì)象形成的指令集3、SAS表達(dá)式3.運(yùn)算次序: 括號(hào)內(nèi)的表達(dá)式先算優(yōu)先級(jí)(見(jiàn)下面)相同優(yōu)選級(jí)別的算符,按順序,先左后右表達(dá)式是由運(yùn)算符和運(yùn)算對(duì)象形成的指令集3、SAS表達(dá)式優(yōu)先級(jí)第一級(jí)*乘方+僅作前綴時(shí)(取正)-僅作前綴時(shí)(取負(fù))非最小最大第二級(jí)*乘/除第三級(jí)+加-減第四級(jí)|連接第五級(jí), =,第六級(jí)&與第七級(jí)|1.SAS函數(shù)的調(diào)用: functionname(argument,)-括號(hào)不能少 自變量的表示形式有兩種:如x,y,z的和 sum(x,y,z) 或 sum(of x y z) sum(of x-z)A=sum(x,y,
19、z)B=min(sum(of x y z),1000)4、SAS函數(shù)2.SAS函數(shù)的返回值: 返回值為: 數(shù)值型 字符型 其返回值的類(lèi)型一般可通過(guò)自變量的類(lèi)型加以判斷(但有個(gè)別有例外,如PUT函數(shù),總是輸出字符型)4、SAS函數(shù)3.SAS函數(shù)的分類(lèi):SAS函數(shù)分為十七類(lèi):算術(shù)函數(shù)、數(shù)組函數(shù)、截取函數(shù)、數(shù)學(xué)函數(shù)、三角和雙曲函數(shù)、概率函數(shù)、分位數(shù)函數(shù)、非中心函數(shù)、樣本統(tǒng)計(jì)函數(shù)、隨機(jī)數(shù)函數(shù)、財(cái)政金融函數(shù)、逐位邏輯操作函數(shù)、數(shù)字函數(shù)、字符函數(shù)、日期和時(shí)間函數(shù)、洲和Zip碼換算函數(shù)和特殊函數(shù)。4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)1.概率函數(shù): SAS系統(tǒng)提供了10個(gè)常見(jiàn)分布的概率函數(shù),其定義為: 在
20、下面的函數(shù)均表示求這些分布函數(shù)的值。其中DF表示自由度,NC表示非中心參數(shù)值,NDF表示分子自由度,DDF表示分母自由度,其余參數(shù)為相關(guān)分布的參數(shù)項(xiàng)。 4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)1.概率函數(shù):標(biāo)準(zhǔn)正態(tài)分布函數(shù) PROBNORM(X) 計(jì)算PU0貝塔分布函數(shù) PROBBETA(X,a,b) X(0,1),a,b0F分布函數(shù) PROBF(X,NDF,DDF,NC)t分布函數(shù) PROBT(X,DF,NC)二項(xiàng)分布的概率分布函數(shù) PROBBNML(P,N,M)波松分布 POISSON(,N)負(fù)二項(xiàng)分布 PROBNEGB(P,N,M)超幾何分布 PROBHYPR(NN,K,N,X,OR)
21、表示NN件產(chǎn)品,其中有K件不合格品,隨機(jī)地從NN件中抽取N件,這N件中不合格品的個(gè)數(shù)服從該分布.該函數(shù)給出N件品中不合格品的個(gè)數(shù)=X的概率. 參數(shù)OR是不勻率. K=0是有效的值(即NN件產(chǎn)品中沒(méi)有不合格品),由此導(dǎo)出X=0,不管其它參數(shù)取什么值,該函數(shù)獲得值1.如果省略O(shè)R,就認(rèn)為其值為1.如: X=PROBHYPR(10,5,3,2,1.5) OR=1.5表示抽到不合格品的概率是抽到合格品概率的1.5倍. 4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)1.概率函數(shù): 舉例: DATA DD;p=PROBCHI(5.6,4);/*求自由度為4的2分布不超過(guò)5.6的概率值p*/T=1-2*(1-PR
22、OBT(2.4,8);/*求自由度為8的P|t|2.4*/RUN; 在SAS系統(tǒng)中操作4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)2.分位數(shù)函數(shù):2分布的分位數(shù) CINV(p,df,nc) nc0)Beta分布的分位數(shù) BETAINV(p,a,b)F分布的分位數(shù) FINV(p,ndf,ddf,nc)T分布的分位數(shù) TINV(p,df,nc)正態(tài)分布的分位數(shù) PROBIT(p) 標(biāo)準(zhǔn)正態(tài)分布的分位數(shù), 其結(jié)果在-5和5之間.Gamma分布的分位數(shù) GAMINV(p,a) 4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)2.分位數(shù)函數(shù): 舉例:DATA A;Q1=FINV(0.025,2,10);/*求自由度
23、為(2,10)的F分布的2.5%分位數(shù)Q1*/Q2=FINV(0.975,2,10);/*求自由度為(2,10)的F分布的97.5%分位數(shù)Q2*/Q3=FINV(0.95,2,10,3.2);/* 非中心值為3.2的F分布的95%的分位數(shù),其自由度為(2,10)*/RUN; 演示4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)3.隨機(jī)數(shù)函數(shù):均勻分布隨機(jī)數(shù) UNIFORM(seed) 其乘子為16807,模為231的乘同余發(fā)生器和一個(gè)64位數(shù)的攪亂表形成的組合發(fā)生器,seed必須是常數(shù),它或是0或5位,6位,7位的奇數(shù)。 RANUNI(seed) 其乘子為397204094,模為231-1的素?cái)?shù)發(fā)生器
24、,seed必須是小于模231-1任何常數(shù)。標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù) NORMAL(seed) RANNOR(seed)一般正態(tài)分布N(,2)可由如下變換得到: 4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)3.隨機(jī)數(shù)函數(shù):指數(shù)分布隨機(jī)數(shù) RANEXP(seed) 產(chǎn)生=1的指數(shù)分布的隨機(jī)數(shù). Y=RANEXP(seed)/,則產(chǎn)生一般指數(shù)分布隨機(jī)數(shù) 若Y=-*LOG(RANEXP(seed),則Y為具有位置參數(shù) 和尺度參數(shù)為的極值分布隨機(jī)變量 若Y=FLOOR(-RANEXP(seed)/LOG(p),則Y為具有參數(shù)p的幾何分布變量4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)3.隨機(jī)數(shù)函數(shù):伽馬分布隨機(jī)數(shù) R
25、ANGAM(seed,).它用組合法產(chǎn)生參數(shù)為非整數(shù)的GAMMA隨機(jī)數(shù).非整數(shù)可表示為整數(shù)部分和小數(shù)部分的和:=+(-).用逆變換方法產(chǎn)生參數(shù)為整數(shù)的GAMMA隨機(jī)數(shù)X1,用舍選法產(chǎn)生參數(shù)為小數(shù)(-)的GAMMA隨機(jī)數(shù)X2,那么X1+X2即為參數(shù)為的GAMMA隨機(jī)數(shù) 設(shè)X=RANGAM(seed,),則Y= X /為形狀參數(shù)為,尺度參數(shù)為的GAMMA分布隨機(jī)數(shù); 若2*為整數(shù),且Y=2*X,則Y是具有自由度為2*的卡方分布隨機(jī)數(shù); 若=n (正整數(shù))且Y= X/,那么Y是Erlang(厄蘭)分布隨機(jī)數(shù).它是n個(gè)獨(dú)立的均值為的指數(shù)分布變量的和; 若Y1=RANGAM(seed,),Y2=RANG
26、AM(seed,),則Y=Y1/(Y1+Y2)是參數(shù)為和的貝塔分布隨機(jī)數(shù)4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)3.隨機(jī)數(shù)函數(shù):三角分布隨機(jī)數(shù) RANTRI(seed,h) 0h1 其密度函數(shù)為: 的三角分布隨機(jī)數(shù).對(duì)一般區(qū)間a,b上的三角形分布隨機(jī)數(shù)Y,可由0,1區(qū)間上三角形分布的隨機(jī)數(shù)的線(xiàn)性變換得到.即: Y=(b-a)*RANTRI(seed,h)+a h=(c-a)/(b-a) ca,b4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)3.隨機(jī)數(shù)函數(shù):柯西分布隨機(jī)數(shù) RANCAU(seed) 用舍選法產(chǎn)生 Y=+*RANCAU(seed),則Y是位置參數(shù)為,尺度參數(shù)為的一般柯西分布隨機(jī)數(shù)二項(xiàng)分布
27、隨機(jī)數(shù) RANBIN(seed,n,p)波松分布隨機(jī)數(shù) RANPOI(seed,)離散分布隨機(jī)數(shù) RANTBL(seed,p1,p2,pn) 此函數(shù)產(chǎn)生一個(gè)由p1到pn定義的概率密度函數(shù)的變量.它返回?cái)?shù)值1,2,3,n,且具以下概率分布: 1 2 3 n p1 p2 p3 pn4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)3.隨機(jī)數(shù)函數(shù):關(guān)于種子數(shù)(seed): 當(dāng)SEED0時(shí),則取系統(tǒng)當(dāng)前的日期時(shí)間值作為初始值隨機(jī)數(shù)函數(shù)每次執(zhí)行時(shí)雖然當(dāng)前的種子不斷變化,但自變量SEED的值保持不變.因此不可能控制初始化之后的隨機(jī)數(shù).若想控制隨機(jī)數(shù)流,可使用CALL 子程序 Call ranbin(seed,n,p
28、,x)Call rancau(seed,x)Call ranexp(seed,x)Call rannor(seed,x)Call ranpoi(seed,x)Call rantbl(see,p1,p2,pn,x)Call rantri(seed,h,x)Call ranuni(seed,x)Call rangam(seed,a,x)4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)4.樣本統(tǒng)計(jì)函數(shù) :均值 MEAN(OF X1-Xn) 或 MEAN(X,Y,Z,) (注:缺失值不含在內(nèi))最大值 MAX(OF X1-Xn) 或 MAX(X,Y,Z,) (注:缺失值不含在內(nèi))最小值 MIN(OF X1-Xn
29、) 或 MIN(X,Y,Z,) (注:缺失值不含在內(nèi))非缺失值的個(gè)數(shù) N(OF X1-Xn) 或 N(X,Y,Z,)缺失數(shù)據(jù)的個(gè)數(shù) NMISS(OF X1-Xn) 或 NMISS(X,Y,Z,)求和 SUM(OF X1-Xn) 或 SUM(X,Y,Z,)(注:缺失值不含在內(nèi))方差 VAR(OF X1-Xn) 或 VAR(X,Y,Z,) (注:缺失值不含在內(nèi))標(biāo)準(zhǔn)差 STD(OF X1-Xn) 或 STD(X,Y,Z,) (注:缺失值不含在內(nèi))4.與統(tǒng)計(jì)有關(guān)的SAS函數(shù)4、SAS函數(shù)4.樣本統(tǒng)計(jì)函數(shù) :標(biāo)準(zhǔn)誤差 STDERR(OF X1-Xn) 或 STDERR(X,Y,Z,)(注:缺失值不含在
30、內(nèi))變異系數(shù) CV(OF X1-Xn) 或 CV(X,Y,Z,)(注:缺失值不含在內(nèi))極差 RANGE(OF X1-Xn) 或 RANGE(X,Y,Z,)(注:缺失值不含在內(nèi))偏差平方和(校正平方和) CSS(OF X1-Xn) 或 CSS(X,Y,Z,)(注:缺失值不含在內(nèi))未校正的平方和 USS(OF X1-Xn) 或 USS(X,Y,Z,)(注:缺失值不含在內(nèi))偏斜度 SKEWNESS(OF X1-Xn) 或 SKEWNESS(X,Y,Z,)(注:缺失值不含在內(nèi))峰度 KURTOSIS(OF X1-Xn) 或 KURTOSIS(X,Y,Z,)(注:缺失值不含在內(nèi)) 編譯階段和執(zhí)行階段1、
31、DATA步流程編譯階段(Compilation Phase): 語(yǔ)法檢查。若出現(xiàn)嚴(yán)重錯(cuò)誤,則停止執(zhí)行。 將程序轉(zhuǎn)換為機(jī)器碼,代執(zhí)行階段使用 建立工作部件,輸入緩沖器(Input Buffer) 建立工作部件PDV( Program Data Vector ) 確定數(shù)據(jù)集中各個(gè)變量的三個(gè)必須的屬性:變量名,類(lèi)型,長(zhǎng)度 建立新建數(shù)據(jù)集的描述部分編譯階段和執(zhí)行階段1、DATA步流程編譯階段(Compilation Phase): 語(yǔ)法檢查的主要內(nèi)容: 漏掉或錯(cuò)拼的關(guān)鍵詞 無(wú)效的變量名 遺漏或錯(cuò)誤的符號(hào) 無(wú)效的選擇項(xiàng) 編譯階段和執(zhí)行階段1、DATA步流程編譯階段(Compilation Phase):
32、 在內(nèi)存中建立程序數(shù)據(jù)矢量PDV 用于建立SAS系統(tǒng)的數(shù)據(jù)集,一次只處理一個(gè)觀測(cè) 兩個(gè)自動(dòng)變量 _N_ 記錄DATA步執(zhí)行的次數(shù) _ERROR_指示出錯(cuò)信息. 0表示無(wú)錯(cuò)誤,1表示有錯(cuò)誤PDV的一般格式: |_N_|_ERROR_| | 編譯階段和執(zhí)行階段1、DATA步流程編譯階段(Compilation Phase): 建立數(shù)據(jù)集的描述部分 數(shù)據(jù)集名 觀測(cè)數(shù)和變量個(gè)數(shù) 變量名及其屬性編譯階段和執(zhí)行階段1、DATA步流程執(zhí)行階段(Execution Phase): 創(chuàng)建數(shù)據(jù)集的數(shù)據(jù)部分 執(zhí)行順序 PDV中外部為題初始化為缺省值輸入每條記錄至輸入緩沖器,按INPUT語(yǔ)句讀至PDV按數(shù)據(jù)步的其它語(yǔ)
33、句處理后存入PDV在數(shù)據(jù)步結(jié)束時(shí)缺省地將PDV的內(nèi)容作為一條觀測(cè) 寫(xiě)入新的數(shù)據(jù)集回到數(shù)據(jù)步的開(kāi)始.使PDV中外部變量初始化為缺省值對(duì)源文件中每條記錄都按上述步驟執(zhí)行一次當(dāng)對(duì)源文件最后一條記錄執(zhí)行結(jié)束后,數(shù)據(jù)步執(zhí)行完成. 編譯階段1、DATA步流程data bodyfat;inPUt sex $ fatpct;fat=fatpct/100;cards;M 13.3F 22 RUN; 程序數(shù)據(jù)矢量|_N_|_ERROR_|SEX|FATPCT| | | | | data bodyfat;inPUt sex $ fatpct ;fat=fatpct/100;cards;M 13.3F 22RUN;
34、程序數(shù)據(jù)矢量|_N_|_ERROR_|SEX|FATPCT|FAT| | | | | |數(shù)據(jù)集名:bodyfat 變量的個(gè)數(shù)(從PDV中可知) 觀測(cè)個(gè)數(shù)(執(zhí)行到RUN時(shí)也已知) 變量名及屬性(從PDV中可知)執(zhí)行階段1、DATA步流程data bodyfat;inPUt sex $ fatpct ;fat=fatpct/100;cards;M 13.3 F 22RUN; 程序數(shù)據(jù)矢量|_N_|_ERROR_|SEX|FATPCT|FAT| 1 | 0 | M | 13.3 | . |初始缺省值data bodyfat;inPUt sex $ fatpct ;fat=fatpct/100;car
35、ds;M 13.3F 22RUN; 程序數(shù)據(jù)矢量|_N_|_ERROR_|SEX|FATPCT|FAT| 1 | 0 | | . | . |data bodyfat;inPUt sex $ fatpct ;fat=fatpct/100;cards;M 13.3 F 22RUN; 程序數(shù)據(jù)矢量|_N_|_ERROR_|SEX|FATPCT|FAT| 1 | 0 | M | 13.3 | 0.133 |將 M 13.3 0.133寫(xiě)入數(shù)據(jù)集bodyfat 一個(gè)觀測(cè)被處理完后,這時(shí)SAS系統(tǒng)首先將程序數(shù)據(jù)矢量中的數(shù)據(jù)寫(xiě)入數(shù)據(jù)集中(兩個(gè)自動(dòng)變量的值并不寫(xiě)入,此值可在其他編程是使用),同時(shí)SAS系統(tǒng)將控
36、制又返回到DATA步的開(kāi)頭,程序開(kāi)始第二個(gè)觀測(cè)的處理,此過(guò)程一直到?jīng)]有觀測(cè)要處理為止。 1、DATA步流程 本章目錄 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句自由格式:輸入格式 input 變量名1$ 變量名2$ | ;特點(diǎn): 輸入的數(shù)據(jù)之間至少要用一個(gè)空格隔開(kāi) input中定義的變量順序應(yīng)與數(shù)據(jù)區(qū)中數(shù)據(jù)值對(duì)應(yīng) 一行一條觀測(cè)(無(wú)| 選項(xiàng)時(shí)) 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句自由格式:例子data A; input sex $ fatpct; cards;M 13.3 F 22 M 19 F 26run;數(shù)據(jù)集A中的數(shù)據(jù)Sex fatpctM
37、13.3F 22M 19F 26 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句自由格式:和的作用data A; input x y; cards;11 22 33 4455 66 77 88run;數(shù)據(jù)集A中的數(shù)據(jù)x y 22 44 6677 88data B; input x; input y; cards;11 22 33 4455 66 77 88run;data C; input x; input y; cards;11 22 33 4455 66 77 88run;數(shù)據(jù)集B中的數(shù)據(jù)x y 2255 66數(shù)據(jù)集B中的數(shù)據(jù)x y 55 常用的有三種方式:自由格式、列方式
38、、規(guī)定格式2、INPUT語(yǔ)句列方式:輸入格式 input 變量名 $ 起始列-終止列 ;特點(diǎn): 輸入的數(shù)據(jù)按固定的格式排列 可將含空格的字符串賦值給字符型變量 可只讀取數(shù)據(jù)區(qū)中某些數(shù)據(jù) 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句列方式:已知數(shù)據(jù)為 1 2 3 1-5-0-5-0-5-0 張 軍01APR75男807984 王衛(wèi)紅24OCT78女959689input name$ 1-6 dmy$ 7-13 sex$ 14-15 math 16-17 phy 18-19 eng 20-21; input name$ 1-6 sex$ 14-15 dmy$ 7-13 phy 1
39、8-19; 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句規(guī)定格式:輸入格式 input 位置控制指針 變量名 $ 讀入格式 ;特點(diǎn): 適用于字段固定格式的數(shù)據(jù) 給出字段開(kāi)始列數(shù),通過(guò)輸入格式給出讀入長(zhǎng)度 可設(shè)定輸入格式 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句規(guī)定格式:位置控制指針n 表示將輸入指針移動(dòng)到第n列,這是指針的絕對(duì)位置移動(dòng)+n 表示將輸入指針向后移動(dòng)n列,這是指針的相對(duì)移動(dòng) 讀入格式(見(jiàn)前面所述) 常用的有三種方式:自由格式、列方式、規(guī)定格式2、INPUT語(yǔ)句規(guī)定格式:例 已知數(shù)據(jù)為 1 2 3 1-5-0-5-0-5-0 張 軍01APR7
40、5男807984 王衛(wèi)紅24OCT78女959689input 1 name$ 6. dmy date7. sex$ 2. math 2. phy 2. eng 2.;input name$ 6. 14 sex$ 2. 7 dmy date7. +4 phy 2.; 為了對(duì)數(shù)據(jù)進(jìn)行分析,有時(shí)還要對(duì)以有的數(shù)據(jù)集進(jìn)行整理,如提取需要處理的變量或觀測(cè)等,這樣才能滿(mǎn)足各種分析的要求 3、數(shù)據(jù)集的整理常用的操作有: 賦值 累加 語(yǔ)句DROP,KEEP,IF,DO END 賦值語(yǔ)句 它是將某個(gè)SAS表達(dá)式的值賦給變量,其格式為:變量=表達(dá)式。若變量已經(jīng)存在,則表示對(duì)該變量的值進(jìn)行修改,否則表示建立一個(gè)新變
41、量 3、數(shù)據(jù)集的整理累加語(yǔ)句 格式為:累加變量+表達(dá)式,它表示把表達(dá)式的結(jié)果加到累計(jì)變量中。注意累加變量只能是數(shù)值型變量,且最好將表達(dá)式用小括號(hào)括起來(lái),即累加變量+(表達(dá)式)。在第一個(gè)觀測(cè)被讀取之前,其值被自動(dòng)置0,若表達(dá)式為缺失值,則將表達(dá)式當(dāng)作0處理 DROP和KEEP語(yǔ)句 格式為: DROP 變量表 表示將所列的變量不輸出到所建立的數(shù)據(jù)集。 KEEP 變量表 表示將所列出的變量輸出到所建立的數(shù)據(jù)集。 3、數(shù)據(jù)集的整理這兩種方法事實(shí)上可達(dá)到同樣的效果,即選擇數(shù)據(jù)集中的變量。這兩種形式要看哪種方便就用哪個(gè),若要保留的變量少,可直接用KEEP=語(yǔ)句,這樣等式右邊列出的變量個(gè)數(shù)少,比較方便;若不
42、需要的變量少,用DROP=語(yǔ)句則較方便。 例3、數(shù)據(jù)集的整理data B;input name$ 1-6 dmy date7. sex$ 14-15 math 16-17 phy 18-19 eng 20-21;total=sum(math,phy);teng+eng;drop dmy sex;/*此句亦可用KEEP NAME MATH PHY ENG TOTAL TENG;替代。*/cards;張 軍01MAR75男807984王衛(wèi)紅24JUL78女959689run; 輸出結(jié)果 OBS NAME MATH PHY ENG TOTAL TENG 1 張 軍 80 79 84 159 84 2
43、 王衛(wèi)紅 95 96 89 191 173條件語(yǔ)句 IF條件語(yǔ)句 格式為: IF 條件表達(dá)式 THEN SAS語(yǔ)句; ELSE sas語(yǔ)句; 其意義為如果條件表達(dá)式為真(其值非0),則去執(zhí)行THEN后面的SAS語(yǔ)句。若條件表達(dá)式為假(其值為0),則去執(zhí)行ELSE后面的SAS語(yǔ)句(當(dāng)ELSE選項(xiàng)存在時(shí))或下一條SAS語(yǔ)句(ELSE語(yǔ)句不存在時(shí))。3、數(shù)據(jù)集的整理?xiàng)l件語(yǔ)句子集IF語(yǔ)句 格式為: IF 條件表達(dá)式; 它表示當(dāng)條件表達(dá)式為真時(shí),SAS系統(tǒng)對(duì)正被處理的觀測(cè)繼續(xù)執(zhí)行IF語(yǔ)句后面的語(yǔ)句;若表達(dá)式為假,則返回執(zhí)行下一個(gè)DATA步 3、數(shù)據(jù)集的整理循環(huán)語(yǔ)句簡(jiǎn)單DO語(yǔ)句 格式: DO; 多個(gè)sas
44、語(yǔ)句; END; 這時(shí)的DO END象是一對(duì)括號(hào),將多個(gè)SAS語(yǔ)句封裝起來(lái),它通常IF語(yǔ)句聯(lián)合使用 3、數(shù)據(jù)集的整理循環(huán)語(yǔ)句簡(jiǎn)單DO語(yǔ)句 IF SEX=男 THEN DO; MATH=MATH+2; PHY=PHY-4; TOTAL=SUM(MATH,PHY); END;3、數(shù)據(jù)集的整理相當(dāng)于IF SEX=男 THEN MATH=MATH+2;IF SEX=男 THEN PHY=PHY-4;IF SEX=男 THEN TOTAL=SUM(MATH,PHY); 循環(huán)語(yǔ)句循環(huán)DO語(yǔ)句 格式: DO 循環(huán)變量=初值 TO 終值 BY 步長(zhǎng); 若干SAS語(yǔ)句;(循環(huán)體) END;3、數(shù)據(jù)集的整理括號(hào)內(nèi)
45、的終值和步長(zhǎng)均為可選項(xiàng),當(dāng)無(wú)步長(zhǎng)時(shí),其值為1,當(dāng)無(wú)終值時(shí),循環(huán)體中至少有一語(yǔ)句控制循環(huán)的結(jié)束,否則就為一死循環(huán).其執(zhí)行過(guò)程是,循環(huán)變量在取得初值后,結(jié)合步長(zhǎng)方向,同終值進(jìn)行比較,若沒(méi)有超過(guò)終值,則執(zhí)行一次循環(huán)體,循環(huán)變量增加一個(gè)步長(zhǎng),繼續(xù)下一輪的執(zhí)行,直到循環(huán)變量超過(guò)終值為止.要注意在循環(huán)體內(nèi)不要對(duì)循環(huán)變量進(jìn)行操作,以免出現(xiàn)死循環(huán),另外循環(huán)變量也會(huì)被寫(xiě)到所建的數(shù)據(jù)集,若不需要,可用DROP語(yǔ)句將其刪除. 循環(huán)語(yǔ)句循環(huán)DO語(yǔ)句 格式: DO 循環(huán)變量=值1,值2,值3,; 若干SAS語(yǔ)句;(循環(huán)體) END;3、數(shù)據(jù)集的整理如:Do I=2 to 10 by 2;Do j=10 to 2 by
46、2;Do k=3.6 to 4.8 by 0.05;Do n=1,5,15,30,60;Do month=JAN,FEB,MAR;Do q=k to n/10;循環(huán)語(yǔ)句循環(huán)DO WHILE語(yǔ)句 格式: DO WHILE 條件表達(dá)式; 若干SAS語(yǔ)句;(循環(huán)體) END;3、數(shù)據(jù)集的整理此循環(huán)語(yǔ)句執(zhí)行的過(guò)程是:當(dāng)條件表達(dá)式為真時(shí),執(zhí)行循環(huán)體,直到條件表達(dá)式為假為止.它是先判斷條件,再執(zhí)行循環(huán)體 循環(huán)語(yǔ)句循環(huán)DO UNTIL語(yǔ)句 格式: DO UNTIL 條件表達(dá)式; 若干SAS語(yǔ)句;(循環(huán)體) END;3、數(shù)據(jù)集的整理它首先執(zhí)行循環(huán)體一次,之后再進(jìn)行條件的判斷, 若條件為假,則繼續(xù)下一次循環(huán),
47、若條件為真,則循環(huán)結(jié)束 OUTPUT語(yǔ)句 3、數(shù)據(jù)集的整理data CM CF;input name$ 1-6 dmy 7-13 sex$ 14-15 math 16-17 phy 18-19 eng 20-21;if sex=男 then output CM;if sex=女 then output CF;drop dmy sex;/*此句亦可用KEEP NAME MATH PHY ENG TOTAL TENG;替代。*/cards;張 軍01MAR75男807984王衛(wèi)紅24JUL78女959689run;一次產(chǎn)生兩個(gè)數(shù)據(jù)集:數(shù)據(jù)集CM中只含男性的觀測(cè),數(shù)據(jù)集CF中則只含有性別為女的觀測(cè)
48、3、數(shù)據(jù)集的整理注釋語(yǔ)句 一個(gè)好的編程習(xí)慣是對(duì)程序進(jìn)行恰當(dāng)?shù)淖⑨?以防止遺忘和增加可讀性. 給程序加注釋的格式有兩種: * 注釋內(nèi)容;整句注釋(后面的;號(hào)不能少)/* 注釋內(nèi)容 */ (任意內(nèi)容注釋?zhuān)?4、數(shù)據(jù)集的連接與合并ABABABAB連接合并+4、數(shù)據(jù)集的連接與合并連接數(shù)據(jù)集的連接 數(shù)據(jù)集的連接是將數(shù)據(jù)集縱向連接起來(lái),其主要目的給數(shù)據(jù)集追加觀測(cè)。這一功能可由SET語(yǔ)句完成,其格式如下:SET 數(shù)據(jù)集1(選項(xiàng)) ;常用的選項(xiàng)有:KEEP=變量表 只打開(kāi)由變量表中所列出的變量. DROP=變量表 變量表中所列出的變量將不被打開(kāi)。 FIRSTOBS=n1 從第n1個(gè)觀測(cè)開(kāi)始以后的觀測(cè)將被選入新
49、建數(shù)據(jù)集. OBS= n2 新建數(shù)據(jù)集的觀測(cè)到第n2個(gè)觀測(cè)為止. RENAME=(原變量名=新變量名) 將原變量名改為新變量名. 4、數(shù)據(jù)集的連接與合并連接data A; input no name$ math phy eng; cards;9701 wanglei 90 86 799702 wanghao 98 97 909703 gudexian 87 86 949706 zhuming 96 87 86run;data B;input no name$ math phi chem geo; Cards;9701 wanglei 90 86 89 769702 wanghao 98 97
50、69 729704 zhuzhun 88 76 78 689705 chaoyin 64 85 76 66run;數(shù)據(jù)集A:no name math phy eng9701 wanglei 90 86 799702 wanghao 98 97 909703 gudexian 87 86 949706 zhuming 96 87 86數(shù)據(jù)集Bno name math phi chem geo9701 wanglei 90 86 89 769702 wanghao 98 97 69 729704 zhuzhun 88 76 78 689705 chaoyin 64 85 76 664、數(shù)據(jù)集的連接
51、與合并連接data C; set A(drop=eng) B(drop=chem geo rename=(phi=phy);run; OBS NO NAME MATH PHY 1 9701 wanglei 90 86 2 9702 wanghao 98 97 3 9703 gudexian 87 86 4 9706 zhuming 96 87 5 9701 wanglei 90 86 6 9702 wanghao 98 97 7 9704 zhuzhun 88 76 8 9705 chaoyin 64 854、數(shù)據(jù)集的連接與合并連接若不用選項(xiàng),直接使用,其結(jié)果如下:data C1; set A
52、 B;run; OBS NO NAME MATH PHY ENG PHI CHEM GEO 1 9701 wanglei 90 86 79 . . . 2 9702 wanghao 98 97 90 . . . 3 9703 gudexian 87 86 94 . . . 4 9706 zhuming 96 87 86 . . . 5 9701 wanglei 90 . . 86 89 76 6 9702 wanghao 98 . . 97 69 72 7 9704 zhuzhun 88 . . 76 78 68 8 9705 chaoyin 64 . . 85 76 664、數(shù)據(jù)集的連接與合
53、并合并數(shù)據(jù)集的合并是將不同數(shù)據(jù)集中的觀測(cè)合并成一個(gè)新的觀測(cè)??捎肕ERGE語(yǔ)句實(shí)現(xiàn)此目的 一對(duì)一合并 它是將多個(gè)數(shù)據(jù)集中第一條觀測(cè)合并成新數(shù)據(jù)集的第一條觀測(cè),第二條觀測(cè)合并成新數(shù)據(jù)集的第二條觀測(cè),等等,沒(méi)有的用缺失值替代 4、數(shù)據(jù)集的連接與合并合并data AA;input x1 x2 ;cards;1 27 84 5;data BB;input x1 y1 y2;cards;11 22 3344 55 66run;data aabb;merge AA BB;run;數(shù)據(jù)集AA: x1 x2 1 2 7 8 4 5數(shù)據(jù)集BB: x1 y1 y2 11 22 33 44 55 66merge數(shù)據(jù)
54、集aabbobs x1 x2 y1 y21 11 2 22 332 44 8 55 663 4 5 . . 4、數(shù)據(jù)集的連接與合并合并匹配合并 這種合并是按某一公共變量的值進(jìn)行橫向連接,其做法是首先對(duì)公共變量進(jìn)行排序,然后再進(jìn)行合并。 4、數(shù)據(jù)集的連接與合并合并匹配合并data A; input no name$ math phy eng; cards;9701 wanglei 90 86 799702 wanghao 98 97 909703 gudexian 87 86 949706 zhuming 96 87 86run;data B;input no name$ math phi ch
55、em geo; Cards;9701 wanglei 90 86 89 769702 wanghao 98 97 69 729704 zhuzhun 88 76 78 689705 chaoyin 64 85 76 66run;proc sort data=a;by no;run;proc sort data=b;by no;run;data C;merge A B;by no;run;本章目錄4、數(shù)據(jù)集的連接與合并合并匹配合并 OBS NO NAME MATH PHY ENG PHI CHEM GEO 1 9701 wanglei 90 86 79 86 89 76 2 9702 wangh
56、ao 98 97 90 97 69 72 3 9703 gudexian 87 86 94 . . . 4 9704 zhuzhun 88 . . 76 78 68 5 9705 chaoyin 64 . . 85 76 66 6 9706 zhuming 96 87 86 . . .5、SAS與外部數(shù)據(jù)的交換設(shè)e:example 目錄下有以下三個(gè)文件EX1.DBF、EX2.XLS、EX3.TXT,則三者分別與SAS之間進(jìn)行文件轉(zhuǎn)換如下 編程方式dbf文件轉(zhuǎn)換成SAS數(shù)據(jù)集SAS數(shù)據(jù)集轉(zhuǎn)換成dbf文件filename ex1 e:exampleex1.dbf;proc dbf db3=ex1
57、OUT=DBF2SAS;run;filename ex11 e:examplesas2dbf.dbf;proc dbf db3=ex11 data=DBF2SAS; run; 5、SAS與外部數(shù)據(jù)的交換設(shè)e:example 目錄下有以下三個(gè)文件EX1.DBF、EX2.XLS、EX3.TXT,則三者分別與SAS之間進(jìn)行文件轉(zhuǎn)換如下 編程方式EXCEL文件轉(zhuǎn)換為SAS數(shù)據(jù)集SAS數(shù)據(jù)集轉(zhuǎn)換為EXCEL文件filename ex2 e:exampleex2.xls;proc dbf db3=ex2 OUT=XLS2SAS;run; filename ex22 e:exampleSAS2XLS.xls
58、;proc dbf db3=ex22 data=XLS2SAS;run;5、SAS與外部數(shù)據(jù)的交換設(shè)e:example 目錄下有以下三個(gè)文件EX1.DBF、EX2.XLS、EX3.TXT,則三者分別與SAS之間進(jìn)行文件轉(zhuǎn)換如下 編程方式文本文件轉(zhuǎn)換為SAS數(shù)據(jù)集SAS數(shù)據(jù)集轉(zhuǎn)換為文本文件 設(shè)文本文件的內(nèi)容如下: 9701 wanglei 90 86 9702 wanghao 98 97 9703 gudexian 87 86 9706 zhuming 96 87則:filename ex3 e:exampleex3.txt;data txt2sas; infile ex3; input no
59、name$ math phy;run;DATA _null_; /*表示不建數(shù)據(jù)集, _null_為SAS的關(guān)鍵詞 */SET TXT2SAS;FILE E:EXAMPLESAS2TXT.TXT;/*指出存放的文件位置*/PUT NO 4. NAME8. MATH 2. PHY2. ;/*存在文件中的變量及格式*/RUN; 5、SAS與外部數(shù)據(jù)的交換設(shè)e:example 目錄下有以下三個(gè)文件EX1.DBF、EX2.XLS、EX3.TXT,則三者分別與SAS之間進(jìn)行文件轉(zhuǎn)換如下 菜單方式外部數(shù)據(jù)文件轉(zhuǎn)成SAS數(shù)據(jù)集(將hald.xls轉(zhuǎn)成SAS數(shù)據(jù)集)MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程
60、MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 1.格式PROC MEANS 選擇項(xiàng); VAR 變量表; BY 變量表; CLASS 變量表; FREQ 變量表; WEIGHT 變量; ID 變量表; OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計(jì)量關(guān)鍵詞=變量名表必需的語(yǔ)句可選擇語(yǔ)句MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 選擇項(xiàng) DATA=SAS數(shù)據(jù)集名,指明進(jìn)行分析的數(shù)據(jù)集名,其缺省值為最近建立的SAS數(shù)據(jù)集。NOPRINT不打印任何描述性統(tǒng)計(jì)量。此選項(xiàng)多用在將描述性統(tǒng)計(jì)量輸出到SAS數(shù)據(jù)集時(shí)。 缺省時(shí)的規(guī)定輸出描述統(tǒng)計(jì)量,即PRINT選項(xiàng)。MAXDEC=n指定輸出結(jié)果小數(shù)部分的最大位數(shù),n的取值范圍為0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)融資渠道拓展實(shí)戰(zhàn)指南
- 電熱與供暖智能管理技術(shù)應(yīng)用推廣方案
- 航空業(yè)智能航空管理與安全保障方案
- 江西省弋投建設(shè)(集團(tuán))有限公司及下屬子公司2024年公開(kāi)招聘筆試相關(guān)內(nèi)容筆試參考題庫(kù)附帶答案詳解
- 蕪湖2025年安徽蕪湖無(wú)為市事業(yè)單位招聘72人筆試歷年參考題庫(kù)附帶答案詳解
- 淄博2025年山東淄博桓臺(tái)縣事業(yè)單位招聘綜合類(lèi)崗位人員26人筆試歷年參考題庫(kù)附帶答案詳解
- 浙江浙江省對(duì)外交流服務(wù)中心編外人員招聘筆試歷年參考題庫(kù)附帶答案詳解
- 廣東省惠州市2024-2025學(xué)年高一上學(xué)期期末考試歷史參考答案解析(2025.01)
- 2022年成人高考專(zhuān)升本《政治》真題及答案
- 2021年成人高等學(xué)校招生全國(guó)統(tǒng)一考試專(zhuān)升本真題《教育理論》
- 2025年兒科常見(jiàn)面試題及答案
- (一模)贛州市2025年高三年級(jí)摸底考試物理試卷(含標(biāo)準(zhǔn)答案)
- 河南省洛陽(yáng)市~重點(diǎn)中學(xué)2025屆中考生物全真模擬試題含解析
- 九年級(jí)物理上冊(cè)22內(nèi)燃機(jī)省公開(kāi)課一等獎(jiǎng)新課獲獎(jiǎng)?wù)n件
- 2025年個(gè)人向企業(yè)借款合同協(xié)議樣本
- (二調(diào))武漢市2025屆高中畢業(yè)生二月調(diào)研考試 英語(yǔ)試卷(含標(biāo)準(zhǔn)答案)+聽(tīng)力音頻
- 數(shù)學(xué)-湖北省武漢市2025屆高中畢業(yè)生二月調(diào)研考試(武漢二調(diào))試題和解析
- 2025屆華潤(rùn)數(shù)科校園招聘正式啟動(dòng)筆試參考題庫(kù)附帶答案詳解
- 2025年湖南環(huán)境生物職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)完整版
- 煤礦常用機(jī)電設(shè)備的日常管理-培訓(xùn)課件
- 2025年新執(zhí)業(yè)醫(yī)師定期考核真題庫(kù)附參考答案
評(píng)論
0/150
提交評(píng)論