統(tǒng)計分析軟件教程(第版)(概述)_第1頁
統(tǒng)計分析軟件教程(第版)(概述)_第2頁
統(tǒng)計分析軟件教程(第版)(概述)_第3頁
統(tǒng)計分析軟件教程(第版)(概述)_第4頁
統(tǒng)計分析軟件教程(第版)(概述)_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

管理統(tǒng)計軟件應用

<SAS篇>鄭州航院經(jīng)貿學院賀書平

zdhsp@163.com一、課程名稱:管理統(tǒng)計軟件應用二、學時學分:40學時+20上機,學分2.5三、先修課程:統(tǒng)計學四、使用教材:自編五、教學參考書 1.《SASforWindows實用基礎教程》洪楠、侯軍,北京:清華大學出版社,2003年。2.《統(tǒng)計分析系統(tǒng)SAS》何寧、吳黎兵,武漢:武漢大學出版社,2005年8月第一版。3.《SAS統(tǒng)計分析》沈其君,北京:高等教育出版社,2005年8月第一版。4.《統(tǒng)計分析方法——SAS實例精選》曲慶云等,北京:清華大學出版社,2004年第一版。IfyouhaveaSAScertification,Youwillneverloseyourjob.”美國SAS專業(yè)認證和SPSS數(shù)據(jù)分析師認證都擁有較高國際聲譽。關于sas的論壇/forum/http:///index.phphttp:///第一章42/5/2023教學目的與要求

1掌握SAS軟件的基本操作

2掌握SAS軟件的簡單編程

3掌握基本統(tǒng)計分析過程

4熟練掌握SAS分析結果教學內容第一章52/5/2023一系統(tǒng)概述四統(tǒng)計圖表制作六假設檢驗七方差分析三描述統(tǒng)計分析二數(shù)據(jù)管理五相關回歸分析八多元統(tǒng)計分析第一章系統(tǒng)概述內容與要求熟悉SAS系統(tǒng)的操作環(huán)境掌握SAS系統(tǒng)的功能特點掌握SAS系統(tǒng)的相關概念第一章72/5/2023第一章82/5/2023一SAS系統(tǒng)產生與發(fā)展二SAS系統(tǒng)的基本特點三SAS系統(tǒng)的基本結構四SAS系統(tǒng)的基本概念五SAS系統(tǒng)基本程序語句目錄一

SAS系統(tǒng)產生與發(fā)展

SAS系統(tǒng):統(tǒng)計分析系統(tǒng)(StatisticalAnalysisSystem)1966年由美國NorthCarolina州立大學研發(fā),1976成立美國SAS軟件研究所,正式推出SAS系統(tǒng),較常用的版本為SAS8.2,最新版本SAS9X系列。是目前數(shù)據(jù)處理和統(tǒng)計分析領域的國際標準軟件,廣泛應用于政府、科研、教育、生產和商業(yè)等領域。具有完備的數(shù)據(jù)訪問、管理、分析、呈現(xiàn)及應用開發(fā)等功能。已經(jīng)成功應用于120多個國家和地區(qū)的3萬多個機構中。第一章92/5/2023二

SAS系統(tǒng)的特點

SAS系統(tǒng)提供了四十多個模塊,各個模塊之間既相互獨立又相互交融補充,SAS系統(tǒng)的功能覆蓋了信息處理和信息系統(tǒng)開發(fā)的各個環(huán)節(jié),用戶根據(jù)自身需要從其模塊結構中靈活選擇、適當組合相應的功能模塊用于:數(shù)據(jù)輸入、數(shù)據(jù)檢索、數(shù)據(jù)管理、數(shù)據(jù)分析、圖形顯示、圖形分析、報表生成、統(tǒng)計計算、工程計算、質量控制、市場研究、調查分析、建立預測模型、管理信息系統(tǒng)、行政信息系統(tǒng)等方面工作。第一章102/5/2023特點1使用靈活方便、功能齊全

SAS是為所有需要進行數(shù)據(jù)處理、數(shù)據(jù)分析的非計算機專業(yè)人員提供的一種完整可靠的專業(yè)數(shù)據(jù)分析軟件。例如:回歸分析使用的SAS程序:

procregdata=A;

modely=x1-x10/selection=stepwise;

ploty*x1=‘$’/*繪制回歸線*/;

run;第一章112/5/20232編程能力強且簡潔易學的非過程語言

SAS語言類似C語言,且綜合了各種高級語言的功能和靈活的格式,SAS語言的特點是用戶不需要告訴SAS“怎樣作”,而只需告訴SAS“作什么”。3數(shù)據(jù)處理與分析結合在一起

SAS程序的結構由兩個基本步驟任意組合而成其中:DATA步用于數(shù)據(jù)的加工;

PROC

步用于分析數(shù)據(jù)和編寫報告2/5/2023第一章124適用性強、應用面廣

SAS系統(tǒng)能提供多種界面以滿足從生產第一線到管理部門各方面人員對數(shù)據(jù)信息的需求,可以訪問各種數(shù)據(jù)資源,包括各種數(shù)據(jù)庫文件。5擴展性能強

SAS系統(tǒng)的模塊式結構,可以讓用戶靈活的按自己的需要去選擇相應的功能模塊,還可以利用SAS系統(tǒng)的功能擴充工具擴充系統(tǒng)功能或利用編程語言編寫特殊的應用程序。第一章13三SAS系統(tǒng)的基本結構SAS系統(tǒng)由四部分構成:(1)SAS基礎(BaseSAS)

完成SAS系統(tǒng)的數(shù)據(jù)管理功能,BaseSAS是SAS系統(tǒng)的基礎應用平臺,既可以單獨使用,也可以與其它模塊組成一個用戶個性化的SAS系統(tǒng),其它模塊必須與之結合起來使用。第一章142/5/2023(2)SAS應用分析模塊這部分是SAS系統(tǒng)的靈魂,也是SAS與其它軟件的本質區(qū)別。屬于這一部分的主要模塊有:

SAS/ETS:用于經(jīng)濟預測和時間序列分析。

SAS/IML:用于進行矩陣運算,解決系統(tǒng)沒有現(xiàn)成方法的工具。

SAS/INSIGHT:可視化的數(shù)據(jù)探索工具,是進行數(shù)據(jù)挖掘的有力工具。

SAS/OR:用于運籌學和線性規(guī)劃。

SAS/QC:提供了根據(jù)產品觀測數(shù)據(jù)進行產品質量管理的各種分析工具。

SAS/STAT:各種主要統(tǒng)計分析方法。2/5/2023第一章15

(3)SAS開發(fā)及呈現(xiàn)工具

主要由SAS/AF、SAS/EIS與SAS/GRAPH模塊提供便捷的面向對象的開發(fā)工具,該工具支持客戶/服務器的應用開發(fā)。2/5/2023第一章16

(4)數(shù)據(jù)倉庫設計屬于這一部分的主要模塊有:

SAS/ACCESSSAS/SHARESAS/CONNECTSAS/WA

這些開發(fā)工具使得用戶可以在SAS系統(tǒng)眾多產品的基礎上快速開發(fā)出功能強大的應用系統(tǒng)。2/5/2023第一章17四SAS基本概念(一)SAS常量:

指一個數(shù)值、一個括在引號中的字符串或是表示某一固定值的特殊標記。

SAS系統(tǒng)有5種類型的常量。包括:數(shù)值型常量字符型常量日期、時間、日期時間常量第一章182/5/20231、數(shù)值型常量:

指出現(xiàn)在SAS系統(tǒng)中的數(shù)字,其書寫方式有3種。①日常書寫方式;②科學計數(shù)法;③特殊標記;

特殊的數(shù)值常量,用“●”表示缺失值。第一章192/5/20232、字符型常量

SAS的字符型常量是由1—32k個字符組成的字符串。一般情況下用單引號括起。

如果在一個表示字符型常量的字符串中含有單引號或特殊字符時要用雙引號括起來。

例如:“TheSASSYSTEM”SAS系統(tǒng)用空格表示字符型的缺失值。2/5/2023第一章203、日期、時間、日期時間常量

SAS系統(tǒng)中表示時間的字符串。

①將一個日期表示為一個常量:將日期加上單引號,后面加上D或(d),如’01JAN96’d。

②將一個時間表示為一個常數(shù):將時間加上單引號,后面加上T或(t)。如’20:35:30’t

③將一個日期時間表示為一個常數(shù):將日期時間加上單引號,后面加上DT。如2010年3月23日17點45分可以表示為:’23MAR2010:17:45’DT

第一章212/5/2023

SAS系統(tǒng)通過輸入格式和輸出格式將日期值與其他較易閱讀的日期形式聯(lián)系起來。例如2007年2月14日可表示為:格式①

MMDDYYw.

021407(MMDDYY6.)02/14/07(MMDDYY8.)

格式②

DDMMYYw.

140207(DDMMYY6.)14/02/07(DDMMYY8.)

格式③DATEw.

14FEB07(DATE7.DDMMMYY)14FEB2007(DATE9.DDMMMYYYY)2/5/2023第一章22例1-1:DATAMYDATA;INPUTTIME@@;INFORMATTIMEMMDDYY6.;FORMATTIMEDATE9.;CARDS;010108021408030108050806091401061090;PROCPRINT;RUN;ObsTIME101JAN2007214FEB2007301MAR2007408MAY2006514SEP2001610JUN1990第一章232/5/2023(二)SAS變量:

1、變量命名:

SAS變量由1—8個字符成,以英文字母開頭,后面7個字符可以是英文字母、數(shù)字和下劃線但不能有空格和特殊字符。

例:NAMEAGEDA_123

2、變量類型:

SAS變量有3種類型:

字符型變量;數(shù)值型變量;日期、時間、日期時間型變量2/5/2023第一章243、變量的長度:

指變量的每個值所占的字節(jié)數(shù),系統(tǒng)默認的變量長度為:

數(shù)值型變量-8個字節(jié)字符型變量-由第一次賦值的長度決定4、特殊標記:

數(shù)據(jù)錄入時在字符型變量后面加‘$’符號。5、變量標記:

是由1—40個字符組成的字符串,該字符串是對變量的描述,在輸出結果時代替變量名,系統(tǒng)提供LABEL語句指定變量標記,默認值是空格。2/5/2023第一章25

6、輸入(Informat)與輸出(Format)格式

一般形式如下:

<$>informat-name<w.><d><$>format-name<w.><d>

其中:

$代表變量是字符型的

informat-name輸入格式名

format-name輸出格式名

w輸入或輸出的寬度

必須的分隔符

d小數(shù)部分的長度2/5/2023第一章26

SAS系統(tǒng)提供的幾種常用輸入輸出格式:

w.d

標準的數(shù)字型格式

$w.標準的字符型格式

commaw.d

數(shù)字中加入逗號(如123,456.78)

datew.日期格式

bestw.SAS選擇最佳表示法第一章272/5/2023(三)觀測:

同一對象的一組變量值構成一個觀測。

例:某數(shù)據(jù)集中的數(shù)據(jù)

OBSX1X2X3Y1Y2Y3112333322464443369555

本數(shù)據(jù)集有六個變量,三個觀測,觀測的數(shù)量決定樣本的大小。2/5/2023第一章28觀測編號變量名一個觀測(四)表達式與操作符

①SAS表達式:

指用各種操作符把SAS常量、變量、SAS函數(shù)連接起來的算式,是SAS的一組指令,提交運行后產生運算結果。

例:Y=a+b*x;z=SIN(X)+COS(Y);

②SAS操作符

(1)算術操作符:+-*/**(乘方)

如果算術運算符連接的表達式中有一個運算對象是缺失值,其運算結果也是缺失值2/5/2023第一章29

(2)比較操作符:=(EQ)等于;^=(NE)不等于;

>(GT)大于;>=(GE)大于等于;<(LT)小于;

<=(LE)不大于如果算式中如果有一個運算對象是缺失值,它比任何數(shù)都小。

(3)邏輯操作符:&(AND)與∣(OR)或^(NOT)非

(4)其他操作符:><(MIN)<>(MAX)‖(連接)

例1:如果A=3B=5

則A><B=3A<>B=52/5/2023第一章30

例2:如果A=‘1’B=‘AND’C=‘2’

D=A‖B‖C;則D=‘1AND2’

注意:連接運算符不清理開頭或結尾的空格

(5)運算次序

準則1:括號里的先算

準則2:同優(yōu)先級的左邊的先算

準則3:較高優(yōu)先級的先算2/5/2023第一章31優(yōu)先級列表:第一級:**(乘方)+(正號)-(負號)^(非)><(MIN)<>(MAX)第二級:*(乘)/(除)第三級:+(加)-(減)第四級:‖(連接)第五級:比較操作符第六級:&(與)第七級:∣(或)2/5/2023第一章32(五)SAS函數(shù)

SAS函數(shù)是一個子函數(shù),每個SAS函數(shù)都有一個關鍵詞,在應用中只要調用其關鍵詞即可。

SAS函數(shù)分為十七種類型,178個。

包括:算術函數(shù)、數(shù)組函數(shù)、數(shù)學函數(shù)、三角和雙曲函數(shù)、概率函數(shù)、分位數(shù)函數(shù)、非中心函數(shù)樣本統(tǒng)計函數(shù)、隨機數(shù)函數(shù)、財政金融函數(shù)、數(shù)字函數(shù)逐位邏輯、操作函數(shù)、字符函數(shù)、日期和時間函數(shù)、特殊函數(shù)、(美國)州和ZIP換算函數(shù)。2/5/2023第一章33

SAS函數(shù)的表達方式:

(1)函數(shù)關鍵詞(OF變量1-變量n)

例:SUM(OFXYZ);

(2)函數(shù)關鍵詞(變量1,…,變量n)

例:SUM(X,Y,Z);2/5/2023第一章34例1-2DATADA1;INPUTXYZ@@;A=(X+Y+Z)/3;B=SUM(X,Y,Z)/3;C=MEAN(X,Y,Z);CARDS;12345.789;PROCPRINT;RUN;TheSASSystem

ObsXYZABC1123222.0245..34.53789888.0第一章352/5/2023五SAS系統(tǒng)基本程序語句(一)SAS程序

SAS程序用來管理數(shù)據(jù)、選擇確定統(tǒng)計分析方法和過程,由SAS語句組成。

SAS語句

SAS語句是由SAS關鍵詞,SAS名字,特殊字符和運算符組成的字符串,以分號(;)結尾,要求SAS系統(tǒng)執(zhí)行一種操作或給SAS系統(tǒng)提供信息。第一章362/5/2023②SAS程序

由一序列SAS語句組合成為SAS程序,完成指定的數(shù)據(jù)處理過程。

SAS程序的結構包括:DATA步和PROC步

DATA步(數(shù)據(jù)步):要求創(chuàng)建新的SAS數(shù)據(jù)集,或對已有的數(shù)據(jù)集進行運算操作。

PROC步(過程步):要求系統(tǒng)從過程庫中調出一個過程并執(zhí)行,以數(shù)據(jù)集作為工作對象。2/5/2023第一章37(二)數(shù)據(jù)步(DATA步)

①DATA步:是指用DATA語句開始的一組SAS語句。2/5/2023第一章38

以上語句組成DATA步,提交后系統(tǒng)創(chuàng)建一個名為da1的SAS數(shù)據(jù)集,包含4個變量,3個觀測。例1-3例1-3datada1;inputx1x2x3;y=x1+x2+x3;cards;21.30.552.40.982.64.5;run;第一章392/5/2023DATA步的作用檢索:把輸入數(shù)據(jù)轉化為SAS數(shù)據(jù)集。編輯:檢查數(shù)據(jù)中的錯誤并修改,計算新變量。數(shù)據(jù)輸出:按照設計規(guī)格輸出報告。數(shù)據(jù)管理:對已存在的SAS數(shù)據(jù)集進行復制、合并、更新、轉置、創(chuàng)建子集。2/5/2023第一章40DATA步語句及其類型:

用于DATA步的SAS語句有四類56個。①文件操作語句:進行文件操作,用于輸入輸

出數(shù)據(jù)集。②運行語句:在創(chuàng)建SAS數(shù)據(jù)集時,用以創(chuàng)建

和修改變量,或創(chuàng)建子集。③控制語句:實現(xiàn)程序之間控制功能。④信息語句:給出數(shù)據(jù)集的各種信息,是非執(zhí)

行語句,可以出現(xiàn)在DATA步的任何位置,并具有同樣的功能。第一章412/5/2023

DATA步的一般形式:

DATASAS數(shù)據(jù)集名;

inputSAS變量名列表;

cards;

輸入數(shù)據(jù)

RUN;2/5/2023第一章42(三)PROC步(過程步)

PROC步是用PROC語句開始的一組或幾組SAS語句完成一個SAS過程,以另一個“PROC”、“DATA”或“

RUN”語句結束。

1.PROC語句的一般形式語句格式:PROC過程名<選擇項>;語句功能:指定PROC步調用的SAS程序,選擇項指明分析的數(shù)據(jù)集,分析結果的輸出要求,以及分析過程中需要用到的一些參數(shù)。2/5/2023第一章432.PROC步的常用選擇項:

(1)“DATA=”指定該過程分析處理的SAS數(shù)據(jù)集,也稱為輸入數(shù)據(jù)集。

例:PROCMEANSDATA=DA1;RUN;(2)“OUT=”命名一個輸出數(shù)據(jù)集,存放分析處理的結果數(shù)據(jù)。例:PROC

SORT

DATA=DA1OUT=DA2;RUN;2/5/2023第一章443.

通用PROC語句

(1)VAR語句

語句格式:VAR變量表;

語句功能:定義分析變量。例:VARABC;

VARX1-X5;

(2)BY語句

語句格式:

BY變量表;

語句功能:定義分組變量,以指定變量的取值分組處理分析數(shù)據(jù)。2/5/2023第一章45

(3)CLASS語句

語句格式:CLASS分類變量表;

語句功能:定義分類變量,對分類變量的不同值分別進行處理。兩者區(qū)別:

BY語句:分組變量一般是區(qū)間變量

CLASS語句:分類變量可以是名義變量2/5/2023第一章46

(4)FREQ與WEIGHT語句

FREQ語句(權數(shù)語句):

語句格式:FREQ變量名;

語句功能:指定數(shù)據(jù)集中重復數(shù)變量,每一觀測中此變量的值說明這個觀測實際代表多少個完全

相同的重復觀測。

WEIGHT語句(權重語句)

語句格式:WEIGHT變量名;

語句功能:指定數(shù)據(jù)集中代表觀測權重的變量。2/5/2023第一章47

“FREQ”與“WEIGHT”的區(qū)別:

WEIGHT語句代表觀測的比重,F(xiàn)REQ語句代表觀測的次數(shù)。

(5)LABEL語句

語句格式:LABEL變量名=‘變量標記’;

語句功能:在輸出結果中用變量標記代替變量名。第一章482/5/2023例1-2例1-4datada1;

inputAgeWeightHeightSex$@@;cards;1126140f1230145f1351153m1334152m;procprintlabel

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論