第一講SAS軟件應(yīng)用總論_第1頁
第一講SAS軟件應(yīng)用總論_第2頁
第一講SAS軟件應(yīng)用總論_第3頁
第一講SAS軟件應(yīng)用總論_第4頁
第一講SAS軟件應(yīng)用總論_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

版權(quán)所有,2005上海財經(jīng)大學(xué)邵建利SAS軟件應(yīng)用主講:上海財經(jīng)大學(xué)統(tǒng)計學(xué)系邵建利第一講總論邵建利,SAS應(yīng)用統(tǒng)計實驗,上海財經(jīng)大學(xué)出版社,2006.10;李東風(fēng),SAS統(tǒng)計軟件教程,北京大學(xué)統(tǒng)計學(xué)系講義王吉利,張堯庭,SAS應(yīng)用統(tǒng)計教程樊欣,邵謙謙.SAS8.X經(jīng)濟統(tǒng)計北京希望電子出版社,2003.2SAS?ProceduresGuide,Version8SAS/GRAPH?Software:Reference,Version8,Volumes1and2SAS?ComponentLanguage:Reference,Version8SAS/AF?Software:ChangesandEnhancementsinVersion8,CourseNotesSAS?Language:Reference,Version8參考教程:

SAS是一個龐大的軟件系統(tǒng),它具有“信息系統(tǒng)”和“計算”兩類應(yīng)用屬性。本課程內(nèi)容主要是針對SAS的“統(tǒng)計學(xué)計算”屬性。

SAS簡介

(StatisticalAnalysisSystem)

據(jù)統(tǒng)計,目前全球發(fā)表的經(jīng)濟與管理學(xué)術(shù)文獻中,按研究方法出現(xiàn)頻數(shù)排名,統(tǒng)計學(xué)方法位列第一位,其次是運籌學(xué)。本書編寫目的在于通過SAS軟件應(yīng)用,培養(yǎng)學(xué)生的統(tǒng)計學(xué)知識應(yīng)用能力,同時加強學(xué)生的實踐和創(chuàng)新能力。SAS涉及統(tǒng)計方法應(yīng)用的模塊主要有SAS/BASE、SAS/STAT、SAS/GRAPH、SAS/ETS、SAS/ASSIST、SAS/IML、SAS/INSIGHT、SAS分析員應(yīng)用、SAS/EnterpriseMiner和面向?qū)ο蟮腟AS/AF程序語言等。本課程主要針對以上模塊,介紹與現(xiàn)代統(tǒng)計學(xué)方法相關(guān)的一些應(yīng)用,它具體包括認(rèn)知性、設(shè)計性和研究創(chuàng)新性三類。認(rèn)知性是以傳授SAS統(tǒng)計軟件和統(tǒng)計學(xué)知識為主;設(shè)計性是以掌握解決問題的方法為主線,倡導(dǎo)自學(xué);創(chuàng)新性是以提高素質(zhì)為主線,要求學(xué)生能結(jié)合所學(xué)知識或自行提出課題。

1.統(tǒng)計分析方法現(xiàn)代統(tǒng)計學(xué)發(fā)展至今積累了許多行之有效的數(shù)據(jù)分析方法,這些統(tǒng)計分析方法可以幫助我們發(fā)現(xiàn)大量數(shù)據(jù)中蘊藏的規(guī)律性,幫助我們在數(shù)量上把握客觀事物的本質(zhì),進一步幫助我們掌握客觀事物的發(fā)展趨勢。所以統(tǒng)計分析方法是當(dāng)今數(shù)據(jù)分析的主要應(yīng)用方法之一。這些統(tǒng)計分析方法一般有以下特點:(1)定量性。(2)復(fù)雜性。(3)廣泛性。現(xiàn)實中,統(tǒng)計分析方法的復(fù)雜性成為制約統(tǒng)計分析方法廣泛應(yīng)用的關(guān)鍵問題,統(tǒng)計分析軟件可以避免繁瑣演算,也可以避免用戶在計算機上自行編制復(fù)雜的程序,是普及應(yīng)用統(tǒng)計分析方法的重要工具。應(yīng)用統(tǒng)計軟件概述一、統(tǒng)計分析方法與統(tǒng)計軟件2.統(tǒng)計分析軟件統(tǒng)計分析軟件根據(jù)其功能可以大致分為專用統(tǒng)計分析軟件和綜合統(tǒng)計分析軟件兩大類。常見在微機上使用的綜合統(tǒng)計分析軟件有以下幾種:應(yīng)用統(tǒng)計軟件概述(1)SAS。它是美國SAS軟件研究所研制的一套大型集成應(yīng)用軟件系統(tǒng),具有完備的數(shù)據(jù)存取、數(shù)據(jù)管理、數(shù)據(jù)分析和數(shù)據(jù)展現(xiàn)功能。尤其是創(chuàng)業(yè)產(chǎn)品—統(tǒng)計分析系統(tǒng)部分,由于其具有強大的數(shù)據(jù)分析能力,一直為業(yè)界著名軟件,在數(shù)據(jù)處理和統(tǒng)計分析領(lǐng)域,被譽為國際上的標(biāo)準(zhǔn)軟件和最權(quán)威的優(yōu)秀統(tǒng)計軟件包,廣泛應(yīng)用于政府行政管理、科研、教育、生產(chǎn)和金融等不同領(lǐng)域,發(fā)揮著重要的作用。SAS系統(tǒng)中提供的主要分析功能包括統(tǒng)計分析、經(jīng)濟計量分析、時間序列分析、決策分析、財務(wù)分析和全面質(zhì)量管理工具等等。應(yīng)用統(tǒng)計軟件概述在國際學(xué)術(shù)界有條不成文的規(guī)定,即在國際學(xué)術(shù)交流中凡是用SAS軟件完成的計算和統(tǒng)計分析,可以不必說明算法。雖然在我國SAS的廣泛應(yīng)用還是近幾年的事,但是隨著計算機應(yīng)用的普及和信息事業(yè)的不斷發(fā)展,越來越多的單位采用了SAS軟件。尤其在教育、科研領(lǐng)域,SAS軟件已成為專業(yè)研究人員的實用進行統(tǒng)計分析的標(biāo)準(zhǔn)軟件。然而,由于SAS系統(tǒng)是從大型機上的系統(tǒng)發(fā)展而來,其操作至今仍以編程為主,人機對話界面不太友好,系統(tǒng)地學(xué)習(xí)和掌握SAS,需要花費一定的時間和精力。而對大多數(shù)科技工作者而言,需要掌握的僅是如何利用SAS來解決自己的實際問題,因此往往會與SAS軟件失之交臂。但不管怎樣,SAS作為專業(yè)統(tǒng)計軟件,現(xiàn)在還很難有什么統(tǒng)計軟件足以與之抗衡。應(yīng)用統(tǒng)計軟件概述

(2)SPSS。它是社會科學(xué)統(tǒng)計軟件包,也是世界著名的統(tǒng)計分析軟件之一。20世紀(jì)60年代末,美國斯坦福大學(xué)的三位研究生研制開發(fā)了最早的統(tǒng)計分析軟件SPSS,同時成立了SPSS公司,并于1975年在芝加哥組建了SPSS總部。20世紀(jì)80年代以前,SPSS統(tǒng)計軟件主要應(yīng)用于企事業(yè)單位。目前的SPSS是一個組合式軟件包,它集數(shù)據(jù)整理、分析功能于一身。用戶可以根據(jù)實際需要和計算機的功能選擇模塊,以降低對系統(tǒng)硬盤容量的要求,有利于該軟件的推廣應(yīng)用。應(yīng)用統(tǒng)計軟件概述SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權(quán)估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。與SAS一樣,即在國際學(xué)術(shù)交流中用SPSS軟件完成的計算和統(tǒng)計分析,也不必說明其算法。(3)SYSTAT。它由美國SYSTAT公司于70年代推出,因方法齊全、速度快、精度高、軟件小、處理數(shù)據(jù)量大而大受歡迎,成為目前較為流行的通用數(shù)據(jù)分析軟件包之一。1994年9月為SPSS公司兼并。但比BMDP幸運的是,SPSS公司并沒有放棄SYSTAT的開發(fā)研究,它通過調(diào)整產(chǎn)品布局,利用SYSTAT較為突出的圖形優(yōu)勢,發(fā)展MAC平臺上的產(chǎn)品系列使得SYSTAT煥然一新,并且SPSS在吞并BMDP后,擬將其UNIX平臺版本劃入SYSTAT發(fā)展。目前SYSTAT主要針對科學(xué)研究者,SYSTAT幾乎可以完成統(tǒng)計研究者所需要的任何統(tǒng)計方法,軟件包含有包括世界地圖、三維圖、經(jīng)緯圖等普通及奇特的圖像模型,它雖然還沒有SPSS這樣的軟件包先進,但比SPSS便宜得多,而且硬盤容量要求更小。(4)Statistica。它為一套完整的統(tǒng)計資料分析、圖表、資料管理、應(yīng)用程式發(fā)展系統(tǒng)。以及對其他技術(shù)、工程、工商企業(yè)資料挖掘應(yīng)用等進階分析之應(yīng)用程式。此系統(tǒng)不僅包含統(tǒng)計上一般功能及制圖程序;還包含特殊的統(tǒng)計應(yīng)用,例如,社會統(tǒng)計人員、生物研究員或工程師。全新的Statistica在功能上,提供了四種線形模型的分析工具,包括VGLM、VGSR、VGLZ與VPLS;對使用者而言,提供完整且俱可選擇性的使用者介面;亦可廣泛使用程式語言輔助精靈來建立一般的范圍;或整合Statistica與其他應(yīng)用程式進行計算,這些都是非常方便好用的模組。Statistica能提供使用者所有需要的統(tǒng)計及制圖程序。另外,能夠在圖表視窗中顯示各種分析,及有別于傳統(tǒng)統(tǒng)計范疇外的最新統(tǒng)計作圖技術(shù),皆獲得許多使用者的好評。Statistica為基本系列產(chǎn)品;可獨立使用此模塊,或搭配Statistica其他組合產(chǎn)品系列。(5)S-plus。S語言是由AT&T貝爾實驗室開發(fā)的一種用來進行數(shù)據(jù)探索、統(tǒng)計分析、作圖的解釋型語言。它的豐富的數(shù)據(jù)類型(向量、數(shù)組、列表、對象等)特別有利于實現(xiàn)新的統(tǒng)計算法,其交互式運行方式及強大的圖形及交互圖形功能使得我們可以方便的探索數(shù)據(jù)。目前S語言的實現(xiàn)版本主要就是S-PLUS。S-PLUS。它是基于S語言,并由MathSoft公司的統(tǒng)計科學(xué)部進一步完善的統(tǒng)計軟件。作為統(tǒng)計學(xué)家及一般研究人員的通用方法工具箱,S-PLUS強調(diào)演示圖形、探索性數(shù)據(jù)分析、統(tǒng)計方法、開發(fā)新統(tǒng)計工具的計算方法,以及可擴展性。S-plus是一個商業(yè)軟件,可以直接用來進行標(biāo)準(zhǔn)的統(tǒng)計分析得到所需結(jié)果。但是它的主要特點還是在于它可以交互地從各個方面去發(fā)現(xiàn)數(shù)據(jù)中的信息,并可以很容易地實現(xiàn)一個新的統(tǒng)計方法。另外Auckland大學(xué)的RobertGentleman和RossIhaka及其他志愿人員開發(fā)了一個R系統(tǒng),其語法形式與S語言基本相同,但實現(xiàn)不同,兩種語言的程序有一定的兼容性。R是一個GPL自由軟件,它比S-PLUS還少許多功能,但已經(jīng)具有了很強的實用性。(6)Stata。它作為一個小型的統(tǒng)計軟件,其統(tǒng)計分析能力非常強。Stata也是采用命令行方式來操作,但使用上遠比SAS簡單。其生存數(shù)據(jù)分析、縱向數(shù)據(jù)(重復(fù)測量數(shù)據(jù))分析等模塊的功能甚至超過了SAS。用Stata繪制的統(tǒng)計圖形相當(dāng)精美,很有特色。Stata的另一個特點是他的許多高級統(tǒng)計模塊均是編程人員用其宏語言寫成的程序文件,這些文件可以自行修改、添加和下載。用戶可隨時到Stata網(wǎng)站尋找并下載最新的升級文件。事實上,Stata的這一特點使其成為了幾種統(tǒng)計軟件中升級最多、最頻繁的一個。Stata缺點是數(shù)據(jù)接口太簡單,實際上只能讀入文本格式的數(shù)據(jù)文件,其數(shù)據(jù)管理界面也過于單調(diào)。專用統(tǒng)計分析軟件著重實現(xiàn)綜合統(tǒng)計分析軟件的部分功能,突出某種特色處理。常見的專用統(tǒng)計分析軟件有:

(1)EViews。它是美國GMS公司1981年發(fā)行第1版的MicroTSP的Windows版本,通常稱為計量經(jīng)濟學(xué)軟件包。EViews是EconometricsViews的縮寫,它的本意是對社會經(jīng)濟關(guān)系與經(jīng)濟活動的數(shù)量規(guī)律,采用計量經(jīng)濟學(xué)方法與技術(shù)進行“觀察”。計量經(jīng)濟學(xué)研究的核心是設(shè)計模型、收集資料、估計模型、檢驗?zāi)P?、運用模型進行預(yù)測、求解模型和運用模型。EViews是完成上述任務(wù)得力的必不可少的工具。正是由于EViews等計量經(jīng)濟學(xué)軟件包的出現(xiàn),使計量經(jīng)濟學(xué)取得了長足的進步,發(fā)展成為實用與嚴(yán)謹(jǐn)?shù)慕?jīng)濟學(xué)科。使用EViews軟件包可以對時間序列和非時間序列的數(shù)據(jù)進行分析,建立序列(變量)間的統(tǒng)計關(guān)系式,并用該關(guān)系式進行預(yù)測、模擬等等。EViews。雖然EViews是由經(jīng)濟學(xué)家開發(fā)的,并且大多數(shù)被用于經(jīng)濟學(xué)領(lǐng)域,但并意味著必須限制該軟件包僅只用于處理經(jīng)濟方面的時間序列。EViews處理非時間序列數(shù)據(jù)照樣得心應(yīng)手。實際上,相當(dāng)大型的非時間序列(截面數(shù)據(jù))的項目也能在EViews中進行處理。(2)Minitab。同樣是國際上流行的一個統(tǒng)計軟件包,其特點是簡單易懂,在國外大學(xué)統(tǒng)計學(xué)系開設(shè)的統(tǒng)計軟件課程中,Minitab與SAS、BMDP并列。MiniTab統(tǒng)計軟件比SAS、SPSS等小得多,但其功能并不弱,特別是它的試驗設(shè)計及質(zhì)量控制等功能。MiniTab目前的最高版本為V14.1,它提供了對存儲在二維表中的數(shù)據(jù)進行分析的多種功能,包括:基本統(tǒng)計分析、回歸分析、方差分析、多元分析、非參數(shù)分析、時間序列分析、試驗設(shè)計、質(zhì)量控制、模擬、繪制高質(zhì)量三維圖形等,從功能來看,Minitab除各種統(tǒng)計模型外,還具有許多統(tǒng)計軟件不具備的功能--矩陣運算。(3)BMDP。BMDP第一版誕生于1961年,1968年BMDP公司發(fā)行,是最早的綜合專業(yè)統(tǒng)計分析軟件,以前,BMDP與SAS、SPSS被并稱為三大統(tǒng)計軟件包。在國際上影響很大,客戶達1萬戶以上,它方法全面、靈活,早期曾有很多獨具特色的分析方法。但是今非昔比,由于BMDP發(fā)展路途不暢,從1991年的7.0版以后就沒有新版本,最后被SPSS公司收購。由于SPSS公司在開發(fā)與推廣BMDP統(tǒng)計軟件方面的積極性也不大,因此現(xiàn)在BMDP的影響已不如從前。但不可否認(rèn),作為優(yōu)秀的統(tǒng)計軟件,BMDP在國外仍然影響巨大,著名大學(xué)統(tǒng)計學(xué)系開設(shè)的多變量分析課程當(dāng)中就有BMDP軟件的教學(xué)內(nèi)容,而且大型學(xué)術(shù)研究機構(gòu)的服務(wù)器上也通常安裝著BMDP軟件供終端用戶使用,國外許多臨床醫(yī)生進行神經(jīng)網(wǎng)絡(luò)分析就是用的BMDP。(4)LISREL(LInearStructuralRELationship)這個名稱有兩個意思,一是由Joreskog提出的線性結(jié)構(gòu)方程式模型,同時也指的是由Joreskog與其合作研究者Sorbom共同開發(fā)的軟件系統(tǒng)。60年代起,協(xié)方差結(jié)構(gòu)分析的方法開始萌芽(CovarianceStructureAnalysis),這是一種從變量間或變量群間的協(xié)方差結(jié)構(gòu)出發(fā),積極地探討和確認(rèn)因果關(guān)系的分析方法。心理學(xué)、行為科學(xué)、經(jīng)濟學(xué)等領(lǐng)域中常用的路徑分析(PathAnalysis)和結(jié)構(gòu)方程模型(StructuralEquationModel)分析等都屬于協(xié)方差結(jié)構(gòu)分析的范疇。70年代,Joreskog提出了LISREL模型和方法。十多年來,對這一模型研究的逐步完善和改進已使LISREL成為協(xié)方差結(jié)構(gòu)模型分析的代表性的手法之一。特別是LISREL軟件的研制及實現(xiàn)商品化以來,該方法的應(yīng)用受到越來越多國家的研究者的重視??傊C合統(tǒng)計分析軟件和專用統(tǒng)計分析軟件今后也會有更多的新版本,因此應(yīng)在實踐中針對統(tǒng)計分析軟件的功能和特點不斷“打磨”,這樣才能最終實現(xiàn)提高統(tǒng)計分析水平的目的。3.統(tǒng)計軟件的使用方式盡管統(tǒng)計軟件非常之多,但是它的使用方式與其它各種計算機軟件使用方式一樣,是有基本規(guī)律可循的,一般來說,統(tǒng)計分析軟件有以下幾種使用方式:(1)人機對話方式(交互式方式)。(2)批命令方式。(3)菜單方式。實際上,統(tǒng)計分析軟件是統(tǒng)計專家和計算機專家共同合作的成果,所以它必然會涉及統(tǒng)計和計算機兩個領(lǐng)域的知識,所以學(xué)習(xí)統(tǒng)計分析軟件應(yīng)從幾個方面入手:(1)弄清相應(yīng)的統(tǒng)計概念和統(tǒng)計含義。(2)正確地收集待處理的數(shù)據(jù)。(3)搞清并弄懂輸出結(jié)果。綜上所述,對統(tǒng)計分析方法的理解和計算機處理能力的培養(yǎng)是學(xué)習(xí)統(tǒng)計分析軟件的關(guān)鍵,因此這也是統(tǒng)計軟件教學(xué)的目的所在。

學(xué)習(xí)應(yīng)用統(tǒng)計軟件的好處:統(tǒng)計分析以其重要性、復(fù)雜性及應(yīng)用的廣泛性,自計算機問世以來,使用計算機完成統(tǒng)計分析一直是統(tǒng)計學(xué)家和計算機程序員面臨的重大課題。利用計算機進行抽樣設(shè)計和統(tǒng)計模擬實驗,建立數(shù)據(jù)庫,進行各種計算,繪制統(tǒng)計圖表,是當(dāng)今衡量統(tǒng)計工作和科學(xué)研究水平的重要標(biāo)志。在經(jīng)濟與管理學(xué)教育中,統(tǒng)計軟件實驗是培養(yǎng)學(xué)生統(tǒng)計科學(xué)思維、正確認(rèn)識所研究問題的“鑰匙”,有利于培養(yǎng)學(xué)生的掌握新知識的能力。歸納起來統(tǒng)計軟件應(yīng)用實驗具有以下一些好處:(1)有助于對統(tǒng)計學(xué)的認(rèn)知;(2)有助于科研論文的規(guī)范;(3)有助于提高的科研能力。

二、SAS程序和SAS數(shù)據(jù)集

安裝、啟動界面(顯示管理系統(tǒng)):三個基本窗口EDIT編輯窗:編輯SAS程序LOG記錄窗:程序運行過程、時間、錯誤信息(紅色---錯誤蘭色---正常綠色---警告)OUTPUT結(jié)果輸出窗:當(dāng)程序運行無誤,且有結(jié)果輸出時顯示其他:var窗、keys窗、lib窗(在命令窗command

或命令行command===>輸入相應(yīng)的命令激活)使用Options下拉菜單中的Preferences訂制DMS的顯示,如選擇“commendbar”和“commendline”在命令條/行輸入num并回車,可在編輯窗口加入行號,方便編程;commendline和行號后的一列禁止寫入,命令或程序需從其后第二列開始寫SAS文件系統(tǒng)*.sd2SAS數(shù)據(jù)集(6.12版)(必須以字母開頭,長度不超過8位);8.0以上版為*.sas7bdat;*.sasSAS程序文件*.loglog窗口輸出*.lstSAS結(jié)果文件

二、SAS程序和SAS數(shù)據(jù)集

由三部分組成;SAS語句以一個關(guān)鍵詞開始,以分號(;)結(jié)束;Dataesr;/*數(shù)據(jù)步:輸入并建立數(shù)據(jù)*/Inputx;Cards;39865573108104;Procprint;/*過程步:調(diào)用現(xiàn)成的SAS過程,進行統(tǒng)計分析*/Run;/*在程序最后,指示過程步或數(shù)據(jù)步結(jié)束,可以提交*/SAS程序結(jié)構(gòu):Log窗輸出Output窗輸出程序運行---在編輯窗輸入程序后點擊圖標(biāo)按功能鍵“F8”在命令行(窗)鍵入“submit”在local下拉菜單中選“submit”窗口內(nèi)容保存----激活窗口后在命令行(窗)鍵入file“路徑\文件名”點擊圖標(biāo)在file

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論