SAS 生物統(tǒng)計學(xué)教學(xué)實習(xí)指導(dǎo)書_第1頁
SAS 生物統(tǒng)計學(xué)教學(xué)實習(xí)指導(dǎo)書_第2頁
SAS 生物統(tǒng)計學(xué)教學(xué)實習(xí)指導(dǎo)書_第3頁
SAS 生物統(tǒng)計學(xué)教學(xué)實習(xí)指導(dǎo)書_第4頁
SAS 生物統(tǒng)計學(xué)教學(xué)實習(xí)指導(dǎo)書_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、生物統(tǒng)計學(xué)教學(xué)實習(xí)指導(dǎo)書 - SAS軟件實習(xí)材料目錄一、SAS概述2二、描述性統(tǒng)計7三、統(tǒng)計推斷(單個或兩個平均數(shù)的比較)10四、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(1)12五、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(2)15六、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(3)18七、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(4)22八、統(tǒng)計推斷(相關(guān)和回歸分析)28一、SAS概述發(fā)布:admin 時間:2006-8-26一、SAS概述SAS是“Statistical Analysis System”的縮寫,意為統(tǒng)計分析系統(tǒng)。SAS自1976年問世以來,已由最初的統(tǒng)計分析系統(tǒng)演變成為

2、大型集成應(yīng)用軟件系統(tǒng),具備完備的數(shù)據(jù)訪問、管理、分析和呈現(xiàn)功能。在數(shù)據(jù)處理與統(tǒng)計分析領(lǐng)域,SAS系統(tǒng)被譽為國際上的標(biāo)準(zhǔn)軟件。目前SAS系統(tǒng)已被廣泛作為決策支持、行政信息、報告生成、財務(wù)分析、市場調(diào)查和銷售管理、計算機運行評價、數(shù)據(jù)分析及產(chǎn)品制造與質(zhì)量管理的工具,廣泛用于科研、生產(chǎn)、政府、金融等不同領(lǐng)域。我們主要學(xué)習(xí)SAS統(tǒng)計分析功能的相關(guān)內(nèi)容。SAS可在大、中、小與微型計算機和多種操作系統(tǒng)(如Windows, Dos, Unix等)上運行。使用者通過簡單的過程調(diào)用就能完成各種復(fù)雜、龐大的統(tǒng)計分析,當(dāng)然也可以使用SAS語句編制程序完成特定的計算。1SAS的啟動、程序運行和退出(1)SAS的啟動運

3、行可執(zhí)行命令(程序)SAS.EXE即可啟動SAS系統(tǒng)(注意SAS公司為保護自身版權(quán)在程序中設(shè)置了日期防護,當(dāng)程序不能執(zhí)行并提示日期過期,雖然可通過修改計算機日期解決,但這是一種違法行為,您應(yīng)該與SAS程序供應(yīng)商聯(lián)系以取得鑰子軟盤)。SAS啟動后可見如下圖的界面(這里是SAS for DOS的情形,不過在其它操作系統(tǒng)下與此類似)。 OUTPUT   Command  = = =>   LOG   Command  = = =>Licensed t

4、o  ?, Site ?.NOTE: AUTOEXEC processing completed. PROGRAM EDITOR   Command  = = => 000010000200003該屏幕分為3個窗口,結(jié)果輸出窗(OUTPUT)、運行記載窗(LOG)和程序編輯窗(PROGRAM EDITOR)。各個窗口中均有命令行(Command行)。開始時,光標(biāo)停留在程序編輯窗的命令行內(nèi)。在能保證已有SAS程序是正確時,也可不進入SAS窗口,方法是在SAS工作目錄下(如有path說明則可在任一目錄下

5、)輸入命令:SAS test.sas 8(test.sas為已存在的SAS程序名)。這樣不進入SAS窗口,直接運行test.sas這一程序,運行記載保存在test.log文件中,運行結(jié)果則保存在test.lst文件中,且這兩個文件均在 SAS目錄下。(2)SAS程序的運行程序尚未建立在程序編輯窗內(nèi)的行號的后面空一格開始輸入程序。輸入完成后,在該窗中命令行輸入SUBMIT命令或直接按功能鍵F10即可運行程序。運行過程顯示在LOG窗口內(nèi),運行結(jié)果顯示在OUTPUT窗中內(nèi)。在OUTPUT或LOG或PROGRAM EDITOR窗口命令行執(zhí)行命令FILE”文件名(或包括路徑)”則可將

6、相應(yīng)窗口中的內(nèi)容(統(tǒng)計分析結(jié)果或程序運行說明或程序)以指定路徑下的指定文件名保存。程序已經(jīng)建立SAS程序可用任何文本編輯器編輯,并按DOS命名規(guī)則給定文件名。注意SAS程序必須以純文本的格式(ASC碼)保存。在SAS程序編輯窗的命令行執(zhí)行:INC“路徑文件名” 8,即可將已經(jīng)建立的文件調(diào)入,再按F10或執(zhí)行SUBMIT就可執(zhí)行程序。(3)SAS的退出在任一窗口的命令行Command = = =>后空一格輸入BYE或ENDSAS命令即可退出SAS。若要臨時執(zhí)行一個DOS命令(不將SAS系統(tǒng)從內(nèi)存御載),可輸入X”DOS命令名”,其中引號可為雙引號或單引號,并且后面的引號可以省略。

7、例如:X  dir *.sas 8 ,將顯示當(dāng)前目錄下的所有擴展名為sas的文件。顯示結(jié)束后,按任意鍵可返回SAS。*注:所有SAS命令或程序中的語句字符大寫、小寫均可用,SAS對此不加區(qū)分(除字符型數(shù)據(jù)),且兩者可以混用。2SAS的程序結(jié)構(gòu)下面是一個完整的SAS程序。00001  DATA  sm;00002  INPUT  y ;00003  CARDS;00004  20.0  19.0  

8、21.0  17.5  18.500005  00006  PROC  MEANS;00007  RUN;這一程序包括兩個部分,第一部分為0000100005,稱為數(shù)據(jù)步(data step),它用于建立數(shù)據(jù)集,為下面的過程步準(zhǔn)備數(shù)據(jù);第二部分為0000600007,稱為過程步(procedure step),它對數(shù)據(jù)進行適當(dāng)?shù)慕y(tǒng)計分析。典型的SAS程序都包括這兩個部分。一般至少包括一個數(shù)據(jù)步和一個過程步。無論是數(shù)據(jù)步還是過程步,均由SAS語句構(gòu)成,每條SAS語句的第一個詞通

9、常是SAS的關(guān)鍵詞,它指定執(zhí)行何種操作,每條語句均以“  ”結(jié)束。SAS程序的輸入格式相當(dāng)自由,語句可以從一行的任一列開始輸入,一行中可以輸入任意多條語句,而一條語句也可以占用多行。語句中間允許空行。SAS語句對字母大小寫不加區(qū)分,大小寫可以混用,語句中的各詞應(yīng)用空格分開。3SAS的數(shù)據(jù)步數(shù)據(jù)集的建立依數(shù)據(jù)來源或讀入方式一般有以下幾種。(1)直接輸入法:如:DATA  ex;INPUT  name $  age  sex $;CARDS;Zhang3  18 

10、60;MLi4     65  F      MWang5  36  M;這一程序中DATA語句指明建立一個名為ex(單名)的臨時數(shù)據(jù)集,SAS運行時將生成臨時文件ex.ssd,其位置在SASSASWORK目錄下,當(dāng)退出SAS系統(tǒng)時,該臨時文件將自動被刪除。DATA后的數(shù)據(jù)集名也可省略,此時系統(tǒng)將自動依次賦名DATA1,DATA2,L。INPUT語句描述SAS數(shù)據(jù)集中每條記錄,這里一條記錄由3個變量組成,即name、age和s

11、ex,其中name和sex為字符型變量(變量后加“$”)。變量名的命名規(guī)則(包括SAS數(shù)據(jù)集名稱)是以字母或下劃線開頭,后面可帶數(shù)字或字母,長度不超過8個字符,不能包括一些特殊字符(如空格、“,”、“.”、“+”、“-”等),這實際上與DOS文件的主名命名規(guī)則一樣。CARDS詞句表明數(shù)據(jù)的開始,其后緊隨數(shù)據(jù)行。數(shù)據(jù)行數(shù)據(jù)順序與INPUT語句描述的變量相對應(yīng)。數(shù)據(jù)缺損時用“.”表示。最后“;”單獨形成一行,稱空語句,它表示數(shù)據(jù)行的結(jié)束。這種方法主要用于數(shù)據(jù)量不大的情況,如數(shù)據(jù)量大,則一般采用下面的外部數(shù)據(jù)文件法。(2)讀取外部數(shù)據(jù)文件法例如,我們已建立了內(nèi)容為:22.0  5

12、.517.4  4.5  M23.0  5.620.0  5.228.5  4.0的數(shù)據(jù)文件abc.txt,則可通過以下方法建立數(shù)據(jù)集:    DATA  ex;    INFILE  “abc.txt”;    INPUT  x  y;    RUN;如果要

13、在磁盤上建立永久數(shù)據(jù)集則可:LIBNAME  dic  “C:HE”;DATA  dic.datakeep;    INFILE  “abc.txt”;INPUT  x  y;RUN;該程序運行后就可在目錄C:HE下建立datakeep.ssd(雙名)這一永久數(shù)據(jù)集,永久數(shù)據(jù)集是以SAS特有的方法對數(shù)據(jù)進行存儲的,數(shù)據(jù)集內(nèi)包括變量名稱、類型、長度等屬性和各變量的具體數(shù)據(jù)。該永久數(shù)據(jù)集可用下面的方法調(diào)用。(3)利用永久數(shù)據(jù)集如上已建立了C

14、:HEdatakeep.ssd這一永久數(shù)據(jù)集,則可用LIBNAME  dic  “C:HE”;DATA  ex;SET  dic.datakeep;RUN;如果對上述永久數(shù)據(jù)集不進行變量或觀察值的選擇,還可省去建立臨時數(shù)據(jù)集的過程,直接對永久數(shù)據(jù)集分析,如:LIBNAME  dic  “C:HE”;PROC  REG  DATA=dic.datakeep;RUN;4SAS的過程步SAS過程步通常包括PROC語句,指明調(diào)用的過程名,即指明

15、對數(shù)據(jù)用何種方法進行分析。后面我們將按統(tǒng)計方法對主要的過程結(jié)合教材的例子進行說明。SAS數(shù)據(jù)步與過程步的組合可以是任意的。在比較簡單的情況下,一個SAS程序是DATA步后跟一個PROC步(簡記D+P)。其它還可D+P+P或D+P+D+PL。通常一個過程步就是一個子程序(*.exe)。5SAS常用命令(1)FILE用于保存文件。在相應(yīng)窗口的命令行執(zhí)行FILE ”文件名”,可將相應(yīng)窗口中的內(nèi)容保存為指定文件名的磁盤文件。例如,一個SAS程序運行通過后,我們在OUTPUT窗口命令行中執(zhí)行FILE ”test.out”,則運行結(jié)果就保存到當(dāng)前目錄下的test.out中。FILE所保

16、存的文件格式均為ASC形式(純文件),可以在任何字處理軟件(如DOS-EDIT,WORD,WORDPAD,WRITE,WPS等)中進行編輯,修飾和打印。(2)CLEAR用于消除相應(yīng)窗口中的內(nèi)容。SAS的OUTPUT、LOG窗口中的內(nèi)容一般不自動清除(即在執(zhí)行一個SAS程序時,在它之前執(zhí)行的SAS程序所生成的結(jié)果及程序運行記載仍在相應(yīng)窗口中,后面程序運行所產(chǎn)生的相應(yīng)內(nèi)容將添加到前面程序所產(chǎn)生的內(nèi)容之后)。清除命令也可在相應(yīng)窗口按熱鍵ALT+E進行。SAS命令行命令在不產(chǎn)生歧義時,可用前面連續(xù)的若干個字母代替。如調(diào)入程序命令I(lǐng)NCLUDE,可用INCLUDE、INCLU、INCL或INC代替。但不

17、能簡化為IN,因為這將與INDENT命令相混。6SAS的窗口操作(1)窗口間的切換通過光標(biāo),PgDn,PgUp鍵進行;在任一窗口命令行輸入OUTPUT或LOG或PGM命令進入相應(yīng)窗口;按Home鍵可快速回到當(dāng)前窗口的命令行中。(2)SAS的功能鍵SAS常用功能鍵定義如下:功能鍵      命令               命令解釋  F1  

18、60;    HELP           SAS聯(lián)機幫助信息  F2       reshow          功能鍵的定義窗  F3       end; 

19、; F4       recall           調(diào)回已運行的程序,供修改、存儲等  F5       pgm            快速進入PGM窗  F6 &#

20、160;     log             快速進入LOG窗口  F7       output          快速進入OUTPUT窗口窗口  F8    &#

21、160;  submit;zoom off  運行SAS程序;關(guān)閉  F9       keys            查看快捷鍵發(fā)布時間:2006-8-26 點擊次數(shù):1   【 打 印 】【 關(guān) 閉 】二、描述性統(tǒng)計發(fā)布:admin 時間:2006-8-26二、描述性統(tǒng)計描述

22、性統(tǒng)計的主要過程有MEANS、SUMMARY、UNIVARIATE和CORR等。1MEANS過程例1  以教材P38,表3.4數(shù)據(jù)為例。OPTION  NODATE  PS=60;DATA  tb34;INPUT  y ;CARDS;177  215  197  97  123  159 L 194  227  141 

23、0;169  124  159;PROC  MEANS  DATA=tb34 N MIN MAX STD RANGE MEAN                CV SUM VAR STDERRNMISSMAXDEC=n            

24、;    VARDEF=DF|WEIGHT|WGT|WGF|N NOPRINT;RUN;以上 表示該項是可選項。OPTION一句設(shè)置結(jié)果輸出選項,這里設(shè)為結(jié)果不顯示日期(NODATE),每頁輸出60行(PS=60);INPUT語句后面的表示讀入一條觀察值后不換行,連續(xù)讀入數(shù)據(jù),這樣在一個物理行中可以輸入多條記錄,以減少數(shù)據(jù)占用行數(shù);PROC MEANS語句指定計算基本統(tǒng)計數(shù),包括樣本容量、最小值、最大值、標(biāo)準(zhǔn)差、極差、平均數(shù)、變異系數(shù)、總和數(shù)、方差、標(biāo)準(zhǔn)誤、缺值數(shù),這些選項如全都不指定(即PROC MEANS;)則輸出N、MIN、MAX、MEAN和STD

25、這5項;一旦指定了選項,則只輸出所指定項。DATA=tb34,指定對tb34這一數(shù)據(jù)集進行分析,當(dāng)有多個數(shù)據(jù)步時,一般應(yīng)該指定,否則以最近建立的數(shù)據(jù)集進行分析。MAXDEC=n,用來設(shè)置輸出時的小數(shù)位數(shù),缺省值為2。VARDEF用來選擇計算標(biāo)準(zhǔn)差(方差)時使用樣本容量(N或WGT)還是自由度(DF或WGF)。例2  以教材P39,表3.6為例。DATA  tb36;INPUT  y  f  CARDS;75290710571201313517150201652518021195132109225

26、324022551  PROC  MEANS  N  MEAN  VAR  STD  CV;   VAR  y;   WEIGHT  f;RUN;這里采用加權(quán)法計算MEAN、VAR、STD。其中y為變量,用VAR語句指明。f為權(quán)重,用WEIGHT語句指明。2SUMMARY過程SUMMARY功能與MEANS很類似,只是若不加PRINT選項則不輸出計算結(jié)果。例3

27、DATA  tb34;INPUT  y ;CARDS;177  215  197  97  123  159 L 194  227  141  169  124  159;PROC  SUMMARY PRINT;   VAR  y;RUN;其中PRINT選項指定輸出計算

28、結(jié)果,而“VAR y;”這一選用語句也需列出。如果不用PRINT選項,也可按下面的辦法進行。PROC  SUMMARY;   VAR  y;OUTPUT  OUT=stat  MEAN=ymean  STD=ystd  CV=ycv;PROC  PRINT  DATA=stat;RUN;    這采用OUTPUT語句將計算結(jié)果存到stat數(shù)據(jù)集中,然后用PRINT過程

29、將stat數(shù)據(jù)集中的內(nèi)容打印出來(輸出到結(jié)果窗口)。3UNIVARIATE過程UNIVARIATE過程除了可以提供MEANS和SUMMARY所提供了基本統(tǒng)計數(shù)外,還提供位置特征數(shù)(如Med中位數(shù),Mode眾數(shù))和偏度系數(shù)(Skewness)、峰度系數(shù)(Kurtosis)這些變異數(shù)。此外它還可通過FREQ選項統(tǒng)計變量次數(shù)及頻率,通過PLOT選項給出莖葉圖(Stem Leaf)和正態(tài)概率密度圖(Normal Probability Plot),通過NORMAL選項進行變數(shù)正態(tài)性檢驗(給出W:Normal值)。例4  以P37表3.1數(shù)據(jù)為例。DATA  tb

30、31;INPUT  y  CARDS;18  15  17  19  16 L 18  17  17  16  19  17;PROC  UNIVARIATE  FREQ PLOT NORMAL;RUN;注意:UNIVARIATE過程中不能指定基本統(tǒng)計數(shù)(如N,MEAN,MODE,SKEWNESS,MEDIUM等),如

31、果指定則程序?qū)⒊鲥e,這一點與MEANS和SUMMARY過程不同。4CORR過程CORR過程是用于進行相關(guān)分析的,它用于給出簡單相關(guān)系數(shù),我們將它放到相關(guān)、回歸分析中說明。發(fā)布時間:2006-8-26 點擊次數(shù):0   【 打 印 】【 關(guān) 閉 】三、統(tǒng)計推斷(單個或兩個平均數(shù)的比較)發(fā)布:admin 時間:2006-8-26三、統(tǒng)計推斷(單個或兩個平均數(shù)的比較)    用于這一目的SAS過程,主要有MEANS、TTEST,此外ANOVA、GLM等過程也可用于測驗兩個平均數(shù)的差異顯著性,

32、但一般不用。1MEANS過程MEANS過程用于測驗?zāi)硞€平均數(shù)與0之間的差異顯著性。可以用來對H0: ()或H0: 進行測驗。例5  以教材P82例5.1為例。DATA  ex51;INPUT  y ;y=y-34.0;CARDS;35.6  37.6  33.4  35.1  32.7  36.8  35.9  34.6;PROC  MEANS &

33、#160;N  MEAN  STDERR  T  PRT;RUN;    其中STDERR為平均數(shù)的標(biāo)準(zhǔn)誤( )選項;T選項表示列出ti值;PRT選項表示列出P(| t |>ti)的概率,即實際結(jié)果是由誤差造成的概率。例6  以教材P87例5.6為例。DATA  ex56;INPUT  y1  y2 y=y1-y2;CARDS;10 

34、0;25  13  12  8  14  3  15  5  12  20  27  6  18;PROC  MEANS  N  MEAN  STDERR  T  PRT;   VAR  y

35、;RUN;以上“VAR  y;”一句用于指定對變數(shù)y進行分析,若缺省則對y1、y2和y三個變數(shù)分析。不過如果在“CARDS;”語句前加上“DROP  y1  y2;”一句,建立數(shù)據(jù)集時將去除變數(shù)y1和y2,這樣生成的數(shù)據(jù)集中只有變量y,此時VAR語句可省去。2TTEST過程一般用于成組數(shù)據(jù)資料的測驗即測驗H0: ( ),結(jié)果輸出包括兩樣本的基本統(tǒng)計數(shù),總體方差相等和不相等的t值、概率值(實得差異由誤差造成的概率),以及對兩個總體的方差測驗結(jié)果(F測驗)。當(dāng)F測驗不顯著時,應(yīng)選擇Equal( )下的結(jié)果,否

36、則取Unequal( )下的結(jié)果。例7  以P84例5.3為例。DATA  ex5;DO  trt=1  TO  2;    DO  r=1  TO  5;       INPUT  y ;       OUTPUT; 

37、   END;END;CARDS;400  420  435  460  425450  440  445  445  420;PROC  TTEST;   CLASS  trt;   VAR  y;RUN;其中CLASS語句指明分組變量,這里是trt,注意在TTEST過程中,它只允許有兩

38、個水平。例8  以P84例5.4為例。DATA  ex54;INPUT  trt  y ;CARDS;1  160  2  170  1  160  2  270  1  200  2  1801  160  2  250 

39、60;1  200  2  270  1  170  2  2901  150  2  270  1  210  2  230  2  170;PROC  TTEST;   CLASS  trt; &

40、#160; VAR  y;RUN;    從例7和例8可見,當(dāng)n1=n2=n時可以用例7的方式簡化數(shù)據(jù)輸入;而n1n2時則可用例8的方式進行數(shù)據(jù)輸入。發(fā)布時間:2006-8-26 點擊次數(shù):0   【 打 印 】【 關(guān) 閉 】四、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(1)發(fā)布:admin 時間:2006-8-26四、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(1)方差分析是關(guān)于多個平均數(shù)的假設(shè)測驗,其主要做法是將總變異的自由度和平方和剖分為不同來源的自由度和平方

41、和,接著根據(jù)各變異來源方差的組成(期望均方)進行F測驗,若F測驗達顯著,當(dāng)處理效應(yīng)為固定模型時,可對其處理平均數(shù)進行多重比較,當(dāng)處理效應(yīng)為隨機模型時,可進一步進行方差分量的估計。方差分析在生物科學(xué)領(lǐng)域中應(yīng)用十分廣泛。用于方差分析的SAS過程主要有方差分析(ANOVA,analysis of variance)、廣義線性模型(GLM,general linear models)。此外還有方差分量估計(VARCOMP,variance components estimation)等。其中ANOVA一般用于平衡資料(資料中各因素均衡搭配且沒有發(fā)生數(shù)據(jù)缺失),非平衡資料的分析一般用GLM過程。不同的試

42、驗設(shè)計有其相應(yīng)的線性數(shù)學(xué)模型,而方差分析正是根據(jù)這一線性數(shù)學(xué)模型進行的,因此所獲數(shù)據(jù)的試驗設(shè)計決定了其分析方法(即自由度和平方和的分解以及度量各效應(yīng)是否顯著的尺度)。正是如此,方差分析的SAS程序中模型的確定是關(guān)鍵。以下結(jié)合教材內(nèi)容順序說明各種情況下的SAS程序編寫方法。(一)  單向分組資料(單因素完全隨機試驗)1組內(nèi)觀察值數(shù)目相等的資料例9  以教材P111例6.10為例。DATA  tb611;DO  trt=1  TO  5;  (或DO 

43、; trt=”A”,”B”,”C”,”D”,”E”; )    DO  r=1  To  4;       INPUT  y ;       OUTPUT;    END;END;CARDS;24  30  28  2627

44、60; 24  21  2631  28  25  3032  33  33  2821  22  16  21;PROC  ANOVA;   CLASS  trt;   MODEL  y=trt;   MEANS

45、60; trt/DUNCAN;RUN;這里PROC前是數(shù)據(jù)步,使用兩套循環(huán)(DO;  END;)進行簡化數(shù)據(jù)輸入,這是在數(shù)據(jù)經(jīng)過整理加工后的方法,當(dāng)然也可直接按田間(或試驗記錄)順序輸入,這在后面會看到。OUTPUT語句用于輸出一組觀察值,它表明一條記錄的結(jié)束。本題利用ANOVA過程。在PROC  ANOVA后可加上選項,包括DATA=輸入數(shù)據(jù)集名和OUTSTAT=輸出數(shù)據(jù)集名(用于存儲方差分析結(jié)果)。CLASS一句用于指明分類變量,此語句一定要設(shè)定,并且應(yīng)出現(xiàn)在MODEL語句之前。MODEL語句用于定義分析所用的線性數(shù)學(xué)模型,通常試驗誤差項(

46、Error)一項不列。MEANS語句用于計算效應(yīng)平均數(shù),并在“/”號后設(shè)定多重比較方法、顯著水平 以及使用的誤差均方。常用多重比較方法有T或LSD(最小顯著差數(shù)法或F測驗保護下的最小顯著差數(shù)法)、SNK(q法或NK法)、DUNCAN(Duncan新復(fù)極差法)、TUKEY(Q法或Tukey氏固定極差法)、DUNNETT(用于設(shè)置于對照試驗的DLSD法)等。顯著水平的確定采用alpha=設(shè)定,如alpha=0.01等,缺省時為alpha=0.05。多重比較的誤差均方由E=效應(yīng)給出,如MEANS a/E=a*b,缺省時使用試驗分析誤差均方。2組內(nèi)觀察值數(shù)目不等的資料例10 

47、60;以教材P113例6.11為例。DM “LOG;CLEAR;OUTPUT;CLEAR;“;DATA  tb615;DO  rtype=1  TO  4;    DO  r=1  TO  8;      INPUT  y ;      OUTPUT; 

48、60;  END;END;DROP  r;CARDS;12131415151617.141011131411.92101112131211121110981012.;PROC  GLM;   CLASS  rtype;   MODEL  y=rtype;   MEANS  rtype  /T;RUN;    由于組內(nèi)觀察值數(shù)目不

49、等,即出現(xiàn)數(shù)據(jù)不平衡,故采用GLM過程,“.”號(小數(shù)點)代替缺省數(shù)據(jù),從這里可見GLM與ANOVA過程在格式上有著相似之處。本程序的第一行稱為顯示管理命令,相當(dāng)于DOS中的批處理命令,它的作用是清除LOG窗和OUTPUT窗中的內(nèi)容;DROP  r 用于刪除變量r,因為r在后面的分析中用不到。當(dāng)然,DM和DROP兩句都可以不用。3系組分組資料例11  以教材P116例6.12的二級系統(tǒng)分組資料為例。DATA  tb619;DO  trt=1  TO  4; 

50、;   DO  m=1  TO  3;        DO  nop=1  TO  4;           INPUT  y;         &#

51、160; OUTPUT;        END;    END;END;CARDS;50  55  40  35  35  35  30  40  45  40  40  5050  45  50 &

52、#160;45  55  60  50  50  55  45  65  5585  60  90  85  65  70  80  65  70  70  70  7060  55 

53、60;35  70  60  85  45  75  65  65  85  75;PROC  FORMAT;   VALUE  trtv  1=”A”  2=”B”  3=”C”  4=”D”;PROC  ANOVA;  

54、60;FORMAT  trt  trtv.;   CLASS  trt  m;   MODEL  y=trt  m(trt);   TEST  H=trt  E=m(trt);   MEANS  trt / DUNCAN  E=m(trt);RUN;  

55、60;        這是一個系統(tǒng)分組資料,用ANOVA過程,其模型中效應(yīng)包括培養(yǎng)液的效應(yīng)(trt)、同一培養(yǎng)液內(nèi)盆間差異m(trt),以及同一盆內(nèi)各植株間的差異(即試驗誤差,在MODEL中不列出)。MODEL這種定義方式稱嵌套模型。TEST語句指出測驗trt的顯著性時應(yīng)使用m(trt)作誤差項,若不指明則以試驗誤差作為被比量進行測驗。因此方差分析表中的trt項F測驗不正確,必須使用TEST語句定義被比量進行測驗。對各培養(yǎng)液平均數(shù)的多重比較用新復(fù)極差法(DUNCAN),且平均數(shù)的標(biāo)準(zhǔn)誤由m(trt)效應(yīng)項方差計算。

56、本程序中還應(yīng)用了FORMAT過程進行變量格式設(shè)定,VALUE則給出具體內(nèi)容,這種設(shè)定通過語句“FORMAT  trt  trtv.;”指定輸出格式。當(dāng)然格式設(shè)定語句可以不要,這里只是為了使處理名稱與相應(yīng)效應(yīng)直接對應(yīng)。五、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(2)發(fā)布:admin 時間:2006-8-26(二)  兩向分組資料1組合內(nèi)只有單個觀察值的兩向分組資料(單因素隨機區(qū)組或二因素完全隨機設(shè)計)例12  以教材P119例6.13為例。DATA  tb625;DO  szs=

57、1  TO  5;    DO  blk=1  TO  4;        INPUT  y ;        OUTPUT;    END;END;CARDS;60  62  61 

58、60;6065  65  68  6563  61  61  6064  67  63  6162  65  62  6461  62  62  65;PROC  ANOVA;   CLASS  szs  bl

59、k;   MODEL  y=szs  blk;   MEANS  szs / T;   MEANS  szs/DUNNETT;RUN;本例用ANOVA過程,效應(yīng)項包括生長素效應(yīng)和區(qū)組效應(yīng)以及省去的誤差。對生長素效應(yīng)分別用LSD法和DUNNETT氏最小顯著差數(shù)法(DLSD法,默認對照是處理項中第一項)進行多重比較。2組合內(nèi)有重復(fù)的兩向分組資料的方差分析(二因素完全隨機設(shè)計)例13  以教材P122例6.14為

60、例。DATA  tb631;DO  a=1  TO  3;    DO  b=1  TO  3;        DO  r=1  to  3;           

61、60;INPUT  y ;            OUTPUT;        END;    END;END;CARDS;21.4  21.2  20.1  19.6  18.8  16.4  17.6 &#

62、160;16.6  17.512.0  14.2  12.1  13.0  13.7  12.0  13.3  14.0  13.912.8  13.8  13.7  14.2  13.6  13.3  12.0  14.6  14.0;PROC &

63、#160;ANOVA;   CLASS  a  b;   MODEL  y= a | b;   MEANS  a  b  a*b / DUNCAN;RUN;“MODEL  y=a | b;”是“MODEL  y=a b  a*b;”的簡化形式,使用簡化形式可使模型語句簡潔,以下是一些簡化表示法及其所代表的意義:簡化示法

64、意    義a | b | ca | b | c 2a | b(a) | ca | b(a) | c 2a | c(b)a(b) | c(b)a  b  a*b  c  a*c  b*c  a*b*ca  b  a*b  c  a*c  b*ca  b(a)  c  a*c b*

65、c(a)a  b(a)  c  a*ca  c(b)  a*c(b)a(b)  c(b)  a*c(b)    MEANS語句對肥料、土壤及兩者互作的平均數(shù)進行多重比較。(三)  數(shù)據(jù)轉(zhuǎn)換方差分析是在可加性,正態(tài)性和同質(zhì)性的假定下進行的,為了滿足這三項假定有時必須對原始數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換。例14  以P126例6.15為例。DATA  ex61;DO 

66、; trt=1  to  4;    DO  r=1  TO  6;        INPUT  y ;        yt=ARSIN(SQRT(y/100)*180/3.1415926;      

67、0; OUTPUT;    END;END;CARDS;97  91  82  85  78  7795  77  72  64  56  6893  78  75  76  63  7170  68  66&

68、#160; 49  55  64;PROC  ANOVA;   CLASS  trt;   MODEL  y  yt=trt;   MEANS  trt / DUNNETT;RUN;在OUTPUT語句之前對反應(yīng)量進行轉(zhuǎn)換,即 。發(fā)布時間:2006-8-26 點擊次數(shù):1   【 打 印 】【

69、0;關(guān) 閉 】六、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(3)發(fā)布:admin 時間:2006-8-26(四)  單因素試驗的分析1完全隨機試驗設(shè)計參見前面單向分組資料的分析方法。2隨機區(qū)組試驗設(shè)計。與兩向分組資料組合內(nèi)無重復(fù)觀察值的分析方法一樣。例15  以P228例12.3為例。DATA  tb123;DO  v=1  TO  8;    DO  blk=1  TO 

70、0;3;        INPUT  y ;        OUTPUT;    END;END;CARDS;10.99.112.210.812.314.011.112.510.59.110.710.111.813.916.810.110.611.810.011.514.19.310.414.4;PROC  ANOVA;   C

71、LASS  v  blk;   MODEL  y=blk  v;   MEANS  v / T  alpha=0.01;   MEANS  v/ DUNCAN;RUN;對品種平均數(shù)的多重比較采用LSD法和新復(fù)極差法,其中前者采用顯著水平。3隨機區(qū)組試驗有缺區(qū)時的分析當(dāng)出現(xiàn)缺區(qū)時,可以先進行缺區(qū)估計,再應(yīng)用ANOVA過程,但更好的方法是直接應(yīng)用GLM過程。例1

72、6  以P233例12.4為例。DATA  tb129;DO  trt=1  TO  6;    DO  blk=1  TO  4;        INPUT  y ;        OUTPUT;  

73、;  END;END;CARDS;27.8  27.3  28.5  38.5  30.6  28.8    .   39.527.7  22.7  34.9  36.8  16.2  15.0  14.1  19.616.2  17.0 

74、 17.7  15.4  24.9  22.5  22.7  26.3;PROC  ANOVA;   CLASS  trt  blk;   MODEL  y=trt  blk;RUN;PROC  GLM;   CLASS  trt  blk

75、;   MODEL  y=trt  blk;   MEANS  trt / T;RUN;缺失區(qū)組的數(shù)據(jù)以小數(shù)點“.”代替,采用GLM過程。注意在有缺失數(shù)據(jù)時如仍用ANOVA過程則結(jié)果會有偏。教材P234例12.5可以通過同樣的方法進行分析。需要注意的是如果試驗的缺失數(shù)據(jù)太多,則宜將試驗作廢,否則即使能分析,其結(jié)論的可靠性會受到影響。4拉丁方試驗的統(tǒng)計分析例17  以教材P236例12.6為例。DATA  tb1215;DO &

76、#160;r=1  TO  5;    DO  c=1  TO  5;        INPUT  v $  y ;        OUTPUT;        END; 

77、;   END;    CARDS;    D  37  A  38  C  38  B  44  E  38    B  48  E  40  D  36 &

78、#160;C  32  A  35    C  27  B  32  A  32  E  30  D  26E  28  D  37  B  43  A  38 

79、0;C  41    A  34  C  30  E  27  D  30  B  41        PROC  ANOVA;   CLASS  r  c  v;

80、60;      MODEL  y=r  c  v;       MEANS  v / T;       MEANS  v / DUNCAN;    RUN;    模型中包括行效應(yīng),列效應(yīng)及品種(處理)效應(yīng)。

81、    例18  有缺區(qū)的拉丁方試驗的分析,以教材P239例12.7為例。    DATA  tb1222;    DO  r=1  TO  5;        DO  c=1  TO  5;    

82、        INPUT  v$  y ;            OUTPUT;        END;    END;    CARDS;A14E22D20C18B25D19B21A16E23C1

83、8B23A15C20D18E23C21D.E24B21A17E23C16B23A17D20        PROC  GLM;       CLASS  r  c  v;       MODEL  y=r c v;     

84、60; MEANS  v / T;    RUN;    5試驗處理的合并比較(單一自由比較)    例19  以教材P242例12.8為例。    DATA  tb611;    DO  trt=”A”,”B”,”C”,”D”,”E”;      

85、  DO  r=1  TO  4;            INPUT  y ;            OUTPUT;        END;   &#

86、160;END;    CARDS;    24  30  28  26  27  24  21  26  31  28    25  30  32  33  33  28  21

87、  22  16  21        PROC  GLM;       CLASS   trt;       MODEL  y=trt;CONTRAST”A+B+C+D  vs  E”trt1111-4;CO

88、NTRAST”A+B  vs  C+D”trt11-1-10;CONTRAST”A  vs  B”trt1-1000;CONTRAST”C  vs  D”trt001-10;    RUN;GLM過程中的CONTRAST語句用于進行試驗處理的合并比較,其格式為:CONTRAST”對比說明”  效應(yīng)  對比向量(即正交系數(shù))。發(fā)布時間:2006-8-26 點擊次數(shù):0  

89、0;【 打 印 】【 關(guān) 閉 】七、統(tǒng)計推斷(方差分析多個平均數(shù)的比較)(4)發(fā)布:admin 時間:2006-8-26(五)  多因素試驗的分析1二因素隨機區(qū)組試驗例20  以教材P249例13.1為例。DATA  tb132;DO  a=1  TO  3;    DO  b=1  TO  3;   

90、60;    DO  blk=1  TO  3;            INPUT  y ;            OUTPUT;        END;

91、60;   END;END;CARDS;8  8  8  7  7  6   6  5  69  9  8  7  9  6   8  7  67  7  6  8

92、60; 7  8  10  9  9;PROC  ANOVA;   CLASS  a  b  blk;   MODEL  y=blk  a  b  a*b;   MEANS  a  b  a*b /&

93、#160;DUNCAN;RUN;2三因素試驗的統(tǒng)計分析(1)三因素完全隨機試驗例21  以教材P253例13.2為例。DATA  tb139;DO  a=1  TO  3;    DO  b=1  TO  2;        DO  c=1  TO  2;&#

94、160;           DO  r=1  TO  5;                INPUT  y ;           

95、60;    OUTPUT;            END;        END;    END;END;CARDS;16.3  19.6  20.4  18.3  19.615.5  17.6  

96、17.3  18.7  19.130.9  35.6  33.2  32.6  36.628.4  23.9  26.0  24.0  29.218.7  18.4  15.1  17.9  17.415.6  15.6  17.8  17.7 &#

97、160;16.728.2  34.3  32.1  26.2  29.027.7  27.2  22.3  18.0  20.318.9  17.7  18.0  15.9  15.616.1  10.8  14.7  15.2  12.640.8  38.7

98、  35.1  41.0  42.927.2  31.3  27.1  29.1  25.0;PROC  ANOVA;   CLASS  a  b  c  r;   MODEL  y=a | b | c;   MEANS  a&#

99、160; b  c  a*b  a*c  b*c / T;RUN;(2)三因素隨機區(qū)組試驗例22  以教材P256例13.3為例。DATA  tb1317;DO  a=1  TO  2;    DO  b=1  TO  2;       &

100、#160;DO  c=1  TO  3;            DO  blk=1  TO  3;                INPUT  y ;  

101、60;             OUTPUT;            END;        END;    END;END;CARDS;12  14  13  12&#

102、160; 11  11  10  9  910   9   9   9   9   8   6  6  7 3   2   4   4   3 

103、60; 4   7  6  7 2   2   3   3   4   5   5  7  7;PROC  ANOVA;   CLASS  a  b  c  b

104、lk;   MODEL  y=blk  a | b | c;   MEANS  a  b  c / T;   MEANS  a*b  a*c  b*c / T;RUN;從MODEL語句可以看出三因素隨機區(qū)組試驗只是在三因素完全隨機試驗基礎(chǔ)上通過設(shè)置區(qū)組將可能存在的區(qū)組效應(yīng)(blk)從誤差中分離出來。3裂區(qū)試驗(1)二裂式試驗例23 

105、60;以教材P262例13.4為例。DATA  tb1324;DO  a=1  TO  3;    DO  b=1  TO  4;        DO  blk=1  TO  3;            INPUT  y ;            OUTPUT;  

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論