![第2章數學基礎和sas軟件基礎課件_第1頁](http://file4.renrendoc.com/view/efd9ec7898a1bca5a2542a90ae666870/efd9ec7898a1bca5a2542a90ae6668701.gif)
![第2章數學基礎和sas軟件基礎課件_第2頁](http://file4.renrendoc.com/view/efd9ec7898a1bca5a2542a90ae666870/efd9ec7898a1bca5a2542a90ae6668702.gif)
![第2章數學基礎和sas軟件基礎課件_第3頁](http://file4.renrendoc.com/view/efd9ec7898a1bca5a2542a90ae666870/efd9ec7898a1bca5a2542a90ae6668703.gif)
![第2章數學基礎和sas軟件基礎課件_第4頁](http://file4.renrendoc.com/view/efd9ec7898a1bca5a2542a90ae666870/efd9ec7898a1bca5a2542a90ae6668704.gif)
![第2章數學基礎和sas軟件基礎課件_第5頁](http://file4.renrendoc.com/view/efd9ec7898a1bca5a2542a90ae666870/efd9ec7898a1bca5a2542a90ae6668705.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章.數學基礎和SAS軟件基礎2.1統(tǒng)計學與概率論基礎知識
1.隨機變量隨機變量的含義離散型連續(xù)型密度函數分布函數隨機變量在某個區(qū)間[]上的取值的概率也可以表示為。
第二章.數學基礎和SAS軟件基礎
2.隨機變量的數值特征期望值常用表示期望值的概念
方差標準差第二章.數學基礎和SAS軟件基礎
協(xié)方差:測算兩個隨機變量之間相互關系的統(tǒng)計指標
相關系數
a.完全正相關
b.完全負相關c.完全不相關
第二章.數學基礎和SAS軟件基礎
偏度:衡量隨機變量的概率分布圍繞其均值是否對稱,公式定義為正偏態(tài):負偏態(tài):偏度系數:
峰度:反映的是隨機變量概率密度函數尾部的厚尾(或稱為寬度)的統(tǒng)計量,通常用于判斷某個隨機變量是否服從正態(tài)分布
第二章.數學基礎和SAS軟件基礎
峰度系數:
若隨機變量服從正態(tài)分布,則峰度近似等于3.若峰度顯著大于3,則概率分布的尾部要比正態(tài)分布的尾部厚,分布密度曲線在距均值較遠地方位于正態(tài)分布曲線的上方,稱為尖峰厚尾現(xiàn)象
第二章.數學基礎和SAS軟件基礎3.概率分布
正態(tài)分布記作:密度函數:的正態(tài)分布稱為標準正態(tài)分布,記作累計概率分布函數:
正態(tài)分布
第二章.數學基礎和SAS軟件基礎若隨機變量服從均值為、標準差為的正態(tài)分布,則其值在區(qū)間內的概率為95%。即:
一般正態(tài)分布的接收域和拒絕域第二章.數學基礎和SAS軟件基礎
分布:
若,則
下標k為的自由度,分布只取正值,并且是偏斜分布。偏度取決于自由度的大小,自由度越小越右偏,隨著自由度的增多,分布逐漸對稱,接近正態(tài)分布。當N無限大時,近似存在:
分布隨自由度的變化情況
第二章.數學基礎和SAS軟件基礎
t分布:若Z是一個變量,而變量X獨立于Z,且X服從自由度為k的分布,則服從自由度為k的t分布對稱性期望值為0方差為t分布的尾部比正態(tài)分布的尾部更厚自由度較大時,t分布趨從于標準正態(tài)分布第二章.數學基礎和SAS軟件基礎
F分布:若兩個服從分布的隨機變量相互獨立,其自由度分別為和,則服從自由度為的t分布。不同自由度的F分布密度函數
第二章.數學基礎和SAS軟件基礎
二項式分布:如果進行n次貝努里試驗,取得成功次數為的概率可用下面的二項分布概率公式來描述
n為獨立的貝努里試驗次數,為成功的概率,(1-)為失敗的概率,X為在次貝努里試驗中出現(xiàn)成功的次數,表示在n次試驗中X出現(xiàn)的各種組合情況,在此稱為二項系數。記為:
第二章.數學基礎和SAS軟件基礎2.2SAS軟件基礎1.常用金融計量軟件網址
軟件名稱網址SASSPSSEviewsMatlabSPLUSStatisticaStata.com第二章.數學基礎和SAS軟件基礎2.SAS簡介模塊:BASESAS為基本模塊SAS的系統(tǒng)核心SAS/ETSSAS/GRAPHSAS/QCSAS/ETSSAS/FSPSAS/AF等特點:統(tǒng)計功能強大簡捷具有功能強大的宏功能將數據處理與統(tǒng)計分析融為一體適應性強應用面廣3.SAS中的幾個基本概念窗口和文件類型:編輯器工作日志輸出數據瀏覽器結果窗口第二章.數學基礎和SAS軟件基礎
邏輯庫:將電腦硬盤中的“f:\fe”目錄定義為SAS中的邏輯庫“data”.libnamedata‘f:\fe’;SAS數據文件的命名方式臨時性文件:一級文件名datareturn;永久性文件:兩極文件名Datadata.size長方形的SAS數據結構:SAS的基本要素有觀測、變量、變量值變量名,建議數據文件整理成長方形結構,更易于數據的處理和分析SAS程序的可控分段運行:
將需要運行的程序段選黑,然后點擊運行按鈕第二章.數學基礎和SAS軟件基礎
如圖:分段執(zhí)行SAS程序“運行”命令按鈕第二章.數學基礎和SAS軟件基礎
日志文件中的信息閱讀:原數據文件出錯的程序
datadata.p;infile'f:\fe\chap2-2-1p.csv'delimiter=','MISSOVERDSDlrecl=32767;inputdate$p;
run;/*此段程序的文件名有誤,系統(tǒng)將報錯,請在執(zhí)行此段程序后觀察日志文件*/
在這段程序運行后,在日志文件中出現(xiàn)這樣的信息:
ERROR:物理文件f:\fe\chap2-2-1p.csv不存在。NOTE:SAS系統(tǒng)由于錯誤而停止了該步的處理。WARNING:數據集DATA.P可能不完整。該步停止時,共有0個觀測和2個變量。NOTE:“DATA語句”所用時間(總處理時間):實際時間0.04秒CPU時間0.01秒第二章.數學基礎和SAS軟件基礎根據錯誤進行修改后再次執(zhí)行,得到下面日志信息
NOTE:從Infile‘f:\fe\chap2-2-1p.csv’中讀取了403條記錄。最小記錄長度是10。最大記錄長度是14。NOTE:數據集DATA.P有403個觀測和2個變量。NOTE:“DATA語句”所用時間(總處理時間):實際時間0.10秒CPU時間0.00秒
數據文件的瀏覽和直接編輯:雙擊文件,則可以打開數據文件瀏覽
4.SAS語句:
由SAS關鍵詞、用戶提供信息構成,SAS語句以分號(;)結束,如:inputxy;第二章.數學基礎和SAS軟件基礎5.SAS中的data步和proc步data步:將外部數據轉化為SAS數據文件對原SAS文件進行修改,包括長生新變量、選擇觀測和選擇變量合并兩個或多個已有的數據集合,產生新的數據集將SAS數據集轉化為外部數據例:將外部數據‘f:\fe\chap2-2-1p.csv’轉化為SAS數據文件,該數據文件在邏輯庫data中,根據”libname”語句的定義,邏輯庫data和電腦文件目錄‘f:\fe’是對應的libnamedata'f:\fe';datadata.p;infile'f:\fe\chap2-2-1p.csv'delimiter=','MISSOVERDSDlrecl=32767;inputdate$p;
run;第二章.數學基礎和SAS軟件基礎產生一個新的數據文件data.r,根據原始價格計算對數收益率r,剔出不需要的變量和觀測。lag函數是取一階時滯函數,lag(p)表示上一期的價格。由于第一個觀測(即2006年1月4日這個觀測)沒有上一期的數值,SAS系統(tǒng)對這個觀測的r給出了空值“.”。在數據處理上,可以將這個觀測剔除。
datadata.r;setdata.p;r=log(p)-log(lag(p));/*addavariable*/keepdater;/*choosevariables*/ifr=.thendelete;/*chooseobservations*/run;datadata.rm;setdata.index;rm=log(index)-log(lag(index));/*addavariable*/dropindex;/*choosevariables*/ifrm=.thendelete;/*chooseobservations*/run;
第二章.數學基礎和SAS軟件基礎將兩個數據data.r和data.rm按照時間進行合并,由merge語句來完成,by變量date的功能是將兩個原數據文件中date相同的觀測合并到新數據data.co中的同一觀測中。
datadata.co;mergedata.rmdata.r;bydate;/*byvariables*/run;
SAS內部數據也可輸出為外部數據
data_null_;setdata.co;file'f:\fe\co.txt';putdater1rm;run;第二章.數學基礎和SAS軟件基礎
proc步:對已有數據文件進行統(tǒng)計分析,并輸出結果,最常見的是排序、打印和求單變量的統(tǒng)計量等下面對文件data.co執(zhí)行排序,排序的關鍵變量為dateProcsortdata=data.co;bydate;Run;
SAS程序包括:(1)將外部數據集合變成SAS數據集;(2)執(zhí)行data步,對于數據集進行一定的變換、刪除等預處理,將同一時間、同一對象的自變量和應變量放入到同一個觀測中。(3)執(zhí)行proc步(回歸、時間序列等),生成結果;(4)對結果進行分析,提取有用信息,形成最后的報表。
第二章.數學基礎和SAS軟件基礎6.主要BASESAS程序
排序過程sort:將數據按照一個或者多個變量排序,排序后的數據替代原數據,例如將數據return按照date和code排序
procsortdata=return;bydatecode;/*第一排序變量date,第二排序變量code*/run;反向排序變量后加入“descending”選項procsortdata=return;bydatedescendingcode;run;將排序后的數據寫入新數據集合
procsortdata=returnout=return1;bydatedescendingcode;run;第二章.數學基礎和SAS軟件基礎
單變量過程UNIVARIATE:對上例中變量rm畫直方圖,并填充顏色。在左上角插入正態(tài)性檢驗結果,添加擬合曲線,在右上角加入均值和標準差的圖標。
procunivariatedata=demo.rm;varrm;histogramrm/cfill=ltgraynormal(color=yelloww=3percents=20406080midpercents);insetmeanstd="StdDev"/pos=neformat=6.3cfill=ywh;insetnnormal(ksdpval)/pos=nwformat=6.3;run;
輸出結果如下:
rm的直方圖和擬合曲線的輸出結果
第二章.數學基礎和SAS軟件基礎在上面的收益率數據中,需要按月輸出日收益率的均值,標準差和t統(tǒng)計量(均值=0)。程序如下:datadata.rm_month;setdata.rm;month=substr(date,1,6);run;procunivariatedata=data.rm_month;varrm;bymonth;outputout=data.rm_statmean=rm_meanstd=rm_stdt=test;run;相關性過程CORR:計算變量的描述性統(tǒng)計量和兩個變量之間的Pearson相關系數。也可以計算三個非參數相關系數,秩序相關系數,偏相關系數和Cronbach系數alpha.第二章.數學基礎和SAS軟件基礎
例:計算股票和指數的收益率的相關性
Odshtml;proccorrdata=data.cooutp=data.corr_stat;/*定義了輸入數據集和結果輸出數據集*/VARrmr1;run;odshtmlclose;結果輸出:CORR過程的運行結果簡單統(tǒng)計量變量N均值標準偏差總和最小值最大值rm4020.004060.018631.63067-0.099490.06039r14020.004870.030691.95964-0.104620.20122Pearson相關系數,N=402當H0:Rho=0時,Prob>|r|
Rmr1
rm1.000000.65666<.0001
r10.65666<.00011.00000
第二章.數學基礎和SAS軟件基礎秩序過程RANK:對數據集中的原變量進行秩序分析,并據需求產生一個新的秩序變量,該變量把數值從小到大排序,給最小值賦予1,給第二小值賦予2,直到最大值n。
rank語句以“procrank”引導,并跟隨ranks、var和by三個一般語句。var語句后跟隨的變量(var變量)通常是原變量ranks語句后則跟隨導出數據集中的秩序變量例:sashelp.class數據為班級學生的性別、身高和體重。下面先按性別分組,對男生和女生的身高產生秩序變量rank_height,得rank1;然后再按照性別和rank_height分組,得到體重的秩序變量rank_weightprocsortdata=sashelp.class;bysexheight;run;procrankdata=sashelp.classout=rank1groups=2;ranksrank_height;varheight;bysex;run;第二章.數學基礎和SAS軟件基礎procsortdata=rank1;bysexrank_height;run;procrankdata=rank1out=rank2groups=3;ranksrank_weight;varweight;bysexrank_height;run;例:數據data.u中包含了A-H兩地上市公司股票的A股市場的每月平均溢價率數據。希望對每月根據溢價率大小將股票分為等分的五組
procrankdata=data.uout=data.urankgroups=5;/*定義輸入數據和輸出數據以及分組個數*/ranksrk;/*產生的新秩序變量*/varu;/*原變量*/bymth;/*分組變量*/run;第二章.數學基礎和SAS軟件基礎分組前后的數據集分別為:溢價率數據集秩序過程產生的新數據集data.urank第二章.數學基礎和SAS軟件基礎非參數檢驗NPAR1WAY過程:基于Wilcoxon得分的簡單線性秩統(tǒng)計量可用于檢驗一個變量的分布在不同的組中是否具有相同的位置參數。主語句以“procnpar1waywilcoxon”引導,并跟隨by、class、var三個一般語句。例:procsortdata=sashelp.class;byage;procnpar1waywilcoxondata=sashelp.class;byage;classsex;varheightweight;outputout=npar1way;data_null_;setnpar1way;file"c:\npar1way.csv"delimiter=',';putage_var_z_wilp2_wilpt2_wil_kw_p_kw;run;第二章.數學基礎和SAS軟件基礎畫圖過程GPLOT和GCHART:下面三個程序分別繪制了收益率的折線圖、直方圖和餅狀圖
procgplotdata=data.co;/*繪制折線圖*/symboli=join;plotrm*date/vref=0;run;procgchartdata=data.co;/*繪制直方圖*/vbarr;run;procgchartdata=data.co;/*繪制餅狀圖*/pier/type=percent;run;輸出結果分別是:第二章.數學基礎和SAS軟件基礎
第二章.數學基礎和SAS軟件基礎2.3SAS宏功能基礎:核心就是通過對文字或程序段進行迭代,簡化程序
1.宏變量:用于迭代文字或程序段內容的變量介紹最簡單的迭代:%letCity1=Shanghai;%letCity2=Beijing;%put&City1;%putCity1;%put&City1&City2City1City2"&City1"'&City1';在這段程序中,宏變量City1和City2分別在前兩個語句中被賦值,而第三個語句中,%put用于顯示宏變量City1所代替的內容。其中,宏變量City1前的&符號表示對宏變量的引用。執(zhí)行前三句程序后日志中將顯示Shanghai的字樣。執(zhí)行第四個語句,日志中出現(xiàn)的是City1,而不是Shanghai。最后一個語句請自行嘗試,可以看到單引號和雙引號對于宏變量的作用是完全不同的。第二章.數學基礎和SAS軟件基礎在宏定義語句中,等號后所出現(xiàn)的文字或程序段最前面和最后面的連續(xù)空格將被程序自動的剔除。下面的三個語句完全等價:%letCity1=Shanghai;%letCity1=Shanghai;%letCity1=Shanghai;因此,若需對以空格開頭或結尾的文字進行引用,則需用到函數%str()%letCity1=%str(Shanghai);%putIlove&City;得到的是IloveShanghai,其中l(wèi)ove和Shanghai中的空格來自于宏變量City1的第一個字符。如果在宏變量后直接相連文字,則SAS對其解析就將遇到麻煩:如&City1Daily,系統(tǒng)會將City1Daily視作另一個宏變量的名字,而不會將其視作宏變量City1后緊跟Daily。SAS程序規(guī)定用一個句點“.”將宏變量與其后所緊跟的字符分開。因此,正確的表達為:&City1.Daily。而若想用宏表達一個二級文件名Shanghai.Daily,則需要用兩個句點:&City1..Daily。第二章.數學基礎和SAS軟件基礎如果%和&出現(xiàn),則需要用函數%nrstr()進行宏變量的定義;而%str()中如果出現(xiàn)不對稱引號則需要在前面加上一個%。%letaa=%str(Shanghai%'s);%letbb=%nrstr(%put);%letcc=&aa;%letdd=%nrstr(%aa);%put&bb&cc;%put&bbⅆ%Eval()對整形的數字字符進行運算,且運算結果將被截為整數。%Sysevalf()不僅能對浮點的數字字符進行運算,還可以對運算結果的格式進行調整。請自行嘗試下面這段程序:第二章.數學基礎和SAS軟件基礎%leta=%eval(5/3);%letb=%eval(10.0+20.0);/*INCORRECT*/%letc=%sysevalf(5/3);%letd=%sysevalf(10.0+20.0);%lete=2.5+3;%put%sysevalf(&e,boolean);%put%sysevalf(&e,integer);%put%sysevalf(&e,ceil);%put%sysevalf(&e,floor);%put&eequals%sysevalf(&e);下面介紹對宏變量的二次及多次引用。在下面的程序中,以宏變量n代表數字1,而以宏變量var代表字符City,執(zhí)行最后三個語句的結果是相同的。兩個相連的連字符&&的含義為:先解析后面的部分,并將解析的結果作為一個宏變量名的整體。第二章.數學基礎和SAS軟件基礎%letCity1=Shanghai;%letCity2=Beijing;%letn=1;%letvar=city;%put&City1;%put&&City&n;%put&&&var&n;2.宏程序和宏函數:以%macro語句來實現(xiàn),區(qū)別在于%macro語句是否包含參數。如果%macro語句包含參數,則為一個宏程序;否則為一個宏函數,需要用戶輸入參數或變量。一段完整的%macro語句包括定義宏和調用宏兩個階段。定義宏的格式為:%macroMAC<(參數1,參數2,…)>;……%mendMAC;第二章.數學基礎和SAS軟件基礎
其中,MAC為用戶自定義的宏參數名。而在調用宏的過程中,只需在宏前面加上百分號%,如:“%MAC;”。在下例中,名為fund的宏中包含code1、code2、maturity和scales四個參數。首先定義數據集data1_&code1,然后定義了數據集data2_&code1,并將其與data1_&code1合并為data_&code1。%macrofund(code1,code2,maturity,scale);datadata1_&code1;infile"D:\fund\data\data1\%str(&code1).%str(&code2).csv"delimiter=","dsdmissover\lrecl=32767firstobs=2;inputcodename$datephslnv;date=mdy(substr(date,9,2),substr(date,11,2),substr(date,5,4));formatdateyymmdd10.;t=mdy(substr(&maturity,9,2),substr(&maturity,11,2),substr(&maturity,5,4))-date;第二章.數學基礎和SAS軟件基礎
scale=&scale/100000000;dis=-log(p/nv);lag_dis=lag(dis);keepcodenamedatedishsltscalelag_dis;run;datadata2_&code1;infile"d:\fund\data\data2\%str(&code1).%str(&code2).csv"delimiter=","dsdmissoverlrecl=32767firstobs=2;inputcodename$datenv;date=mdy(substr(date,9,2),substr(date,11,2),substr(date,5,4));formatdateyymmdd10.;r=log(nv)-log(lag(nv));lag_r=lag(r);keepcodenamedaterlag_r;run;datadata_&code1;mergedata1_&code1data2_&code1;bycodenamedate;ifdate<='18oct2002'dthendelete;run;%mend;第二章.數學基礎和SAS軟件基礎下面的程序則可以將一個含有四個字段、上百個基金基礎信息的數據表轉化為上百行的宏調用程序%fund(…)。data
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年心血管系統(tǒng)用藥項目建議書
- 家庭廚余垃圾簡易生物降解系統(tǒng)
- 民房建筑施工合同
- 環(huán)保行業(yè)廢棄物處理風險免責協(xié)議
- 智慧社區(qū)建設投資合作合同
- 2025年液壓破碎錘項目發(fā)展計劃
- Glycycoumarin-Standard-生命科學試劑-MCE
- 2025年紡織片梭織機項目建議書
- 網絡安全技術培訓服務合同書
- 1S-2S-2-PCCA-hydrochloride-生命科學試劑-MCE
- 康復科-關節(jié)活動度測量量表
- 2025初級會計理論考試100題及解析
- 墻面油漆翻新合同范例
- 門診口腔院感基礎知識培訓
- 公司關愛基金方案
- 燃料電池+基礎理論動力學+熱力學+研究方法
- DB11T 1812-2020 既有玻璃幕墻安全性檢測與鑒定技術規(guī)程
- 安全開發(fā)流程培訓文件課件
- 三年內無重大違法記錄聲明
- 星級酒店項目招標文件
- 2023深信服日志審計系統(tǒng)用戶手冊
評論
0/150
提交評論