




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SAS基礎與金融計算1本節(jié)講授內容SAS圖表過程Procchart過程Procgchart過程2統(tǒng)計圖對統(tǒng)計資料圖形化處理就形成統(tǒng)計圖,運用統(tǒng)計圖形能直觀地描述統(tǒng)計分布的特征和變量之間的關系。統(tǒng)計圖有多種表現形式:1、直方圖2、餅圖3、折線圖4、曲線圖3回顧Procunivariatedata=studentplot;varheight;Run;獲得三個圖:1、莖葉圖2、箱線圖3、正態(tài)概率圖4統(tǒng)計分組的相關概念根據統(tǒng)計研究的目的和客觀現象的內在特點,按某個標志或幾個標志把被研究的總體劃分為若干個不同性質的組,稱為統(tǒng)計分組。分組的性質來看:兼有分和合雙重含義。5統(tǒng)計分組的步驟1.確定數據的全距(R):R=xmax-xmin(即最大變量值與最小變量值之差)2.確定組限、組距和組數(1)組限分為上限和下限,上限是各組的最大變量值,下限是各組的最小變量值。(2)各組上限與下限之差稱為該組的組距。(3)組數是指某個變量數列劃分為多少個組。說明:組數的多少與組距的大小成反比關系,組距越大,則可分的組就越少。6分組,應注意如下兩個問題:首先,分組時各組數量界限的確定必須能反映事物質的差別——體現量變到質變的轉化。其次,應根據被研究的現象總體的數量特征,采用適當的分組形式,確定相宜的組距、組限——主要解決分多少組的問題。7組數的確定:與組距大小成反比以下是美國學者斯特杰斯經驗公式:
n=1+3.322lgN
(n:組數;N:總體單位數)
d=R/n=(Xmax-Xmin)/n(n為組數,d為組距,R為全距)8根據上述公式,可以得出如下的組數參考標準:分組組數參考表N15-2425-4445-8990-179180-359n56789上述數據僅供參考,不能生搬硬套,實際分組時要依所研究資料的性質而定。9SAS制圖過程SAS統(tǒng)計制圖過程均可以實現對樣本分布特征的圖形表示,一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。前兩個和后兩個只有一個字母“g”(代表graph)的差別,其實它們之間(只差一個字母g的過程之間)的統(tǒng)計描述功能是相同的,區(qū)別僅在于繪制出的圖形的復雜和美觀程度。10此外,還有一些較為復雜的制圖命令,如運用G3D過程繪制曲面圖,運用GCONTOUR過程繪制曲面對應的等高線圖。例如,我們想繪制一個二維正態(tài)分布曲面的圖形,假設(X,Y)服從聯合正態(tài)分布,其均值都是0,方差分別為1和a,相關系數為r。11chart(或plot)與gchart(或gplot)chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形,只能概括地反映出資料分布的大體形狀,實際上這兩個過程繪制的圖形并不能稱之為圖形,因為它沒有涉及一般意義上圖形的任何一種元素(如顏色、分辨率等)。而gchart過程和gplot過程給出的是真正意義上的圖形,可以用很多的語句和選項來控制圖形的各方面的性質和特征。
12Chart(或gchart)與plot(或gplot)
chart和gchart過程可以繪制出的圖形主要有條形圖(包括橫條和豎條)、圓圖、環(huán)形圖和星形圖等;plot和gplot過程通常用一個記錄中的兩個變量值表示點的坐標來繪制圖形,如散點圖和線圖等。13gchart過程的一般格式
Procgchart選項列表;圖形關鍵詞變量名稱/選項列表;
Run;此過程格式簡單,復雜的地方在于圖形關鍵字(每個圖形關鍵字對應一種圖形類型)所引導的語句,它是控制圖形類型及圖形要素的地方,涉及到眾多的關鍵字和選項。14gchart過程可以使用的圖形關鍵字及其所繪制的圖形類型見下表:
15圖形關鍵字后的變量名用以指定進行圖形描述時的分組變量,可以是數值型的(此時以各組的組中值為分組的標志),也可以是字符型的。選項列表中比較重要的有:(1)type=統(tǒng)計量關鍵字,表示圖形對變量(sumvar所指定的變量)的哪一種統(tǒng)計量進行描述,比如頻數(freq)、均數(mean)、總計(sum)、頻數百分比(percentage)等;16(2)subgroup=變量名(分組變量),指定要進行分組(各組內再分組)的變量;(3)sumvar=變量名(數值變量),指定要進行統(tǒng)計計算的變量,也就是“type=統(tǒng)計量關鍵字”選項中統(tǒng)計量的計算所依據的變量。17下表為長沙市某大學160名正常成年女子2006年體檢資料中的血清甘油三酯的測量結果(mmol/L)試以直方圖來表示上述資料的分布特征。
18例1:單變量數據第一步:建立數據集;datatest;inputx@@;cards;0.910.88 1.41 0.96 1.48 1.46 0.91 1.101.261.69 1.14 1.24 0.98 0.68 0.83 1.77……………1.491.02 1.17 0.99 0.61 1.33 0.79 0.951.051.65 1.20 1.24 0.84 1.40 0.72 1.06;Run;雙尾符,它表示為了執(zhí)行下一個input語句,保持指針在這個輸入的記錄行上。比較有加雙尾符和沒加雙尾符的區(qū)別。19第二步,進行初步的統(tǒng)計分析,確定分組的個數。Procunivariatedata=test;varx;Run;20所有160個觀測值中,最大的為1.77,最小的為0.51,如果以0.1為組距,將所有觀測值歸入13個組。如果根據前面的斯特杰斯經驗公式,則應將所有觀測值歸入8組。
TheMEANSProcedureAnalysisVariable:xNMeanStdDevMinimumMaximum1601.13120.29450.51001.770021第三步,畫圖。procgchartdata=test;
vbarx/type=freqlevels=13inside=freqspace=0width=6;run;Vbar語句表示我們要做的是豎立的條形圖,其后跟的是作圖所要依據的分類變量,這里我們以變量x來做直方圖。斜杠后的內容是對所做條形圖進行控制的選項,本段程序所涉及的各選項的含義和功能見下表。22各選項的含義和功能
23Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=x
inside=freqspace=0width=6;Run;24Procgchartdata=test;
vbarx/type=freqlevels=8
sumvar=x
inside=freqspace=0width=6;Run;25Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=xinside=mean
space=0width=6;Run;26Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=xinside=mean
space=5
width=6;Run;27Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=xinside=mean
space=0width=9;Run;28比較Procgchart與Procchart;比較vbar和hbar;Vbar用來列出用戶想要畫的垂直條形圖的那些變量,每個圖表變量對應一張垂直條形圖;Hbar對列出的每個圖變量生成水平的條形圖。比較直方圖與餅圖。29Procgchartdata=test;
hbarx/type=freqlevels=13;Run;30Procgchartdata=test;
piex/type=freqlevels=13;Run;31Procgchartdata=test;
piex/type=meansumvar=x
levels=13;Run;32Procgchartdata=test;
piex/type=meansumvar=x
levels=5;Run;33例2:
分組數據下表是財政系問卷設計資料匯總34第一步,建立數據集;Datascore;inputsubject$sex$num1num2;Cards;………
;
Run;Datascore;setscore;
labelsubject='專業(yè)'sex='性別'num1='人數'num2='題量';Run;35Group語句Proc
gchart;
vbarsubject/group=sexsumvar=num2type=mean;run;Num2表示題量。上述語句意思是:先按性別分兩組,接著在每組中按專業(yè)進一步分三組,最后再將每組設計的題量的平均數列示出來。36Proc
gchart;
vbarsubject/group=sextype=freq;run;Num2表示題量。上述語句意思是:先按性別分組,接著在每組中按專業(yè)進一步分組,最后再將每組包含的單位數列示出來。37Proc
gchart;
vbarsex/group=subjectsumvar=num2type=mean;run;Num2表示題量。上述語句意思是:先按專業(yè)分三組,接著在每組中按性別分別分兩組,最后再將每組設計的題量的平均數列示出來。38By語句Proc
gchart;
vbarsubject/sumvar=num2type=mean;
bysex;run;上述語句將得到由by變量定義的幾個觀測組分別畫出的圖表。39Subgroup語句Proc
gchart;
vbarsex/subgroup=subjecttype=freq;run;上述語句意思是:先按性別分兩組,接著在每組中按專業(yè)進一步分三組,最后再將每組包含的單位數列示出來。40Proc
gchart;
vbarsubject/subgroup=sextype=freq;run;上述語句意思是:先按專業(yè)分三組,接著在每組中按專業(yè)進一步分兩組,最后再將每組包含的單位數列示出來。41Block語句該語名列出用戶想要畫的塊形圖的變量。Proc
gchart;
blocksex/gr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025云南省建筑安全員知識題庫
- 鄭州工業(yè)安全職業(yè)學院《大數據快速運算》2023-2024學年第二學期期末試卷
- 遼寧裝備制造職業(yè)技術學院《醫(yī)學微生物學實驗轉專業(yè)》2023-2024學年第二學期期末試卷
- 山東管理學院《診斷胸肺檢查》2023-2024學年第二學期期末試卷
- 廣州城建職業(yè)學院《電子商務技術基礎》2023-2024學年第二學期期末試卷
- 太原科技大學《城市規(guī)劃與管理》2023-2024學年第二學期期末試卷
- 玉溪職業(yè)技術學院《軋制工藝學管材生產》2023-2024學年第二學期期末試卷
- 商丘職業(yè)技術學院《表面活性劑化學與應用》2023-2024學年第二學期期末試卷
- 五年級教師2025年第一季度工作計劃
- 做賬實操-商貿企業(yè)成本核算方法
- 2025年中國文玩電商行業(yè)發(fā)展現狀調查、競爭格局分析及未來前景預測報告
- 2025年臨床醫(yī)師定期考核試題中醫(yī)知識復習題庫及答案(200題)
- 《小紅帽》繪本故事-課件
- 寒假日常生活勞動清單及評價表
- 專題06 現代文閱讀(原卷版)2015-2024單招考試語文(四川真題)
- 校園超市招商政策
- 《數據采集技術》課件-網絡爬蟲
- 網絡地址轉換NAT
- 【MOOC】營養(yǎng)學-武漢大學 中國大學慕課MOOC答案
- 工資薪金管理制度模版(3篇)
- 廣東省茂名市高州市五校聯考2024-2025學年高一上學期12月月考化學試題(含答案)
評論
0/150
提交評論