版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
試驗三SAS描述統(tǒng)計分析質(zhì)的初步結論。據(jù)時可以給人留下深刻的印象。統(tǒng)計圖形的種類很多,利用SAS可以便利的繪制常用的統(tǒng)計圖形。試驗目的把握使用SAS對數(shù)據(jù)作描述性統(tǒng)計分析的方法。把握SAS/GRAPH能,能用SAS的統(tǒng)計圖形對數(shù)據(jù)進展描述性統(tǒng)計分析。試驗內(nèi)容一、用INSIGHT計算統(tǒng)計量、繪制統(tǒng)計圖形二、用“分析家”計算統(tǒng)計量、繪制統(tǒng)計圖形三、編程實現(xiàn)描述性統(tǒng)計〔MEANS、UNIVARIATE、FREQ過程、編程繪制統(tǒng)計圖〔GPLOTGCHART〕試驗指導一、用INSIGHT計算統(tǒng)計量【試驗【試驗3-1】按性別分別計算SASHELP.CLASS中身高的均值、標準差、中位數(shù)和其它四分位數(shù),簡潔分析學生身高的狀況。在INSIGHTSolutio〔解決方案Analysi〔分析InteractiveDataAnalysis〔交互式數(shù)據(jù)分析SAS/INSIGHTOpen”對話框,在對話框中選擇數(shù)據(jù)集:SASHELP.CLASS,單擊“Open〔翻開INSIGHT3-1左所示。用DistributionAnalyz〔分析Distribution(Y〔分布Distribution對話框。在數(shù)據(jù)集CLASS的變量列表中,選擇height,然后單擊“Y”按鈕,height被選為分析變量,選擇sex,然后單擊“Group”按鈕,sex3-1右所示。 圖3-1 在INSIGHT中計算統(tǒng)計量Outpu〔輸出3-。表3-1 描述性統(tǒng)計選項選項MomentsQuintilesBasicConfidenceIntervalsTestsforLocation
說明矩統(tǒng)計量分位數(shù)根本置信區(qū)間位置檢驗
選項FrequencyCountsTestsforNormality
說明頻數(shù)統(tǒng)計尺度的穩(wěn)健估量正態(tài)性檢驗BoxPlot/MosaicPloChar3-2所示。圖3-2 描述性統(tǒng)計選項兩次單擊“OKheight按sex分組的各種矩統(tǒng)計量〔Moments〕和分位數(shù)Quantile,如圖3-3所示。結果分析91060.5889低于男63.91,女生的標準差5.01834.9379,說明女生的身高較為分散一些。圖3-3分組顯示的各種矩統(tǒng)計量和分位數(shù)62.5、56.5和64.3,說明身高大于或小于62.556.5,而另有四分之一的女生身超群過了64.3;男生的中位數(shù)、四分之一分位數(shù)和四分之三分位數(shù)分別為64.15、59.0和67.0,說明身高大于或小于64.15的男生各占一半,有四分之一的男生身高不超過,而另有四分之一的男生身超群過了67.0。二、用“分析家”計算統(tǒng)計量【試驗二、用“分析家”計算統(tǒng)計量【試驗3-2500名學生的“概率統(tǒng)計學”課程的考試成績中,隨機地603-2所示〔數(shù)據(jù)集為:MYLIB.SY3-2,變量名為F1〕:表3-2 “概率統(tǒng)計學”考試成績6375839145819330728082838176678472588364936375997476959183618285834488726694687888719485827910090838884487280858087766296求出上述數(shù)據(jù)的平均值、方差、極差、中位數(shù)、四分之一分位數(shù)及四分之三分位數(shù),并分析成績分布狀況。在“分析家”中翻開MYLIB.SY3-2數(shù)據(jù)集Solution〔解決方案Analysi〔分析Analys〔分析家翻開“分析家”窗口。Fil〔文件AsSASNameOpen…〔按SAS名稱翻開的對話框中,選擇MYLIB.SY3-2。用SummaryStatisticsStatistic〔統(tǒng)計Descriptiv〔描述性統(tǒng)計SummaryStatistics〔匯總統(tǒng)計量SummaryStatisticsF1Analysis”3-4左所示。圖3-4 選定分析變量與統(tǒng)計量單擊“Statistics”按鈕,翻開“SummaryStatistics:Statistics”對話框。對話框中列3-3。3-3可計算統(tǒng)計量Mean均值Numberofobservations觀測數(shù)Standarddeviation標準差Numberofmissingvalues缺失數(shù)Standarderror標準誤Skewness偏度Variance方差Kurtosis峰度MinimumMaximumRange極差Student”sttCoefficientofvariationt檢驗值p值變異系數(shù)Sum和Correctedsumofsquares校正平方和Median中位數(shù)Uncorrectedsumofsquares未校平方和選擇輸出統(tǒng)計量平均值、方差、極差,如圖3-4右所示。兩次單擊“OK”按鈕后,得3-5所示。圖3-5 描述性統(tǒng)計量用Distributions菜單項計算分位點在“分析家”窗口選擇主菜單“Statistic〔統(tǒng)計”→“Descriptiv〔描述性統(tǒng)計”→按鈕,選定分析變量。單擊“OK”按鈕,即可得到關于變量F13-6所示。圖3-6 矩統(tǒng)計量和根本統(tǒng)計測度另外,還有位置檢驗、分位數(shù)以及極值觀測〔5個觀測,如圖3-7所示。圖3-7 位置檢驗、分位數(shù)以及極值觀測結果分析學生成績的均值、方差和極差分別為77.72、194.07和70,方差和極差較大,說明成績的分布很分散。中位數(shù)、四分之一分位數(shù)及四分之三分位數(shù)分別為81、72和86,說明成績大于或小于81的學生各占一半,有四分之一的學生成績不超過72;而有四分之一的學生成86,從均值和中位數(shù)可以看出有一大半學生的成績超過了平均數(shù)。三、編程實現(xiàn)描述性統(tǒng)計三、編程實現(xiàn)描述性統(tǒng)計【試驗3-3】編程實現(xiàn)描述性統(tǒng)計。1.1.用FREQ編制SASUSER.CLASS中age(年齡)的頻數(shù)表,代碼如下:procfreqdata=SASUSER.CLASS;tablesage;RUN; 圖3-8 頻數(shù)表2.用NEANS2.用NEANS按性別分別計算SASUSER.CLASS中體重的均值、標準差、極差、中位數(shù)、四分之一分位數(shù)和四分之三分位數(shù),代碼如下:proc means data=SASUSER.CLASS mean std range median q1 var weight;class run;3-9所示。圖3-9 使用class語句分類計算均值、標準差、極差、中位數(shù)和分位數(shù)或者proc sort data=SASUSER.CLASS;bysex;run;proc means data=SASUSER.CLASS meanstdrangemedianq1q3;var bysex;run;3-10所示。說明:1)通常使用BY語句時要求數(shù)據(jù)集須按BY變量排序,使用CLASS語句無此要求。2)meansBYBY變量的每個值分別供給一個表,使用CLASS語句則將全部結果排列在一個表之中。3.用UNIVARIATE圖3-10 3.用UNIVARIATE計算SASUSER.CLASSage(年齡)的眾數(shù)、2.5%97.5%分位數(shù)。proc univariate data=SASUSER.CLASS;var age;output out=pct pctlpre=p pctlpts=2.5 run;proc print run;3-11所示,age(年齡)12,2.5%11,97.5%16。 圖3-11 眾數(shù)和分位數(shù)說明:UNIVARIATE過程中的output語句表示將UNIVARIATE產(chǎn)生的統(tǒng)計量輸出到“out=”后定義的數(shù)據(jù)集中,本例數(shù)據(jù)集名稱為pct,output語句中的選項pctlpre用于指定數(shù)pctlpts2.5%97.5%分位數(shù)。四、用INSIGHT四、用INSIGHT繪制統(tǒng)計圖形3-4】爭論Sasuser.gpagpa分數(shù)的分布:畫出gpa的直方圖、盒形圖;通過直方圖、盒形圖簡述不同性別的gpa數(shù)據(jù)的特點。INSIGHT中翻開數(shù)據(jù)集Sasuser.gpa。1.1.繪制直方圖選擇菜單“Analyze〔分析”→“Chart(Y)〔條形圖Histogram/BarChart(Y)”對話框。gpagpa變量,然后單擊“Y”按鈕,gpa3-12所示。單擊“OK”按鈕,即可得到直方圖,如圖3-13左所示。單擊圖形框左下角處的三角形,在翻開的菜單中alue〔值,即可在圖中顯示頻數(shù)值,如圖3-13右所示。
圖3-12 話框假設在“Histogram/BarChart(Y)”對話框中選定gpa變量作為分析變量,然后選擇sexGrou〔分組O”后可將gpa分數(shù)按男女學生分別畫出3-14所示。 圖3-13 在INSIGHT中繪制直方圖2.繪制盒形圖圖3-14 不同性別gpa2.繪制盒形圖Analyz〔分析BoxPlot/MosaicPlot(Y〔馬賽克圖“BoxPlot/MosaicPlot(Y)”對話框。在數(shù)據(jù)集gpa的變量列表中,選擇gpa變量,然后單擊“Y”按鈕,gpa3-15左所示。Outpu〔輸出YAxisVertica〔垂直的Y軸”如圖3-15右所示。單擊“OK”按鈕返回對話框。 圖3-15 “BoxPlot/MosaicPlot(Y)”對話框單擊“OK”按鈕,即可得到盒形圖,如圖3-16左所示。單擊圖形框左下角處的三角形,在翻開的菜單中選擇“Mean〔均值3-16右所示。圖3-16 在INSIGHT中繪制盒形圖按(1)中方法翻開“BoxPlot/MosaicPlot(Y)”對話框,選擇gpa變量,單擊“Y”按鈕,再選擇sex變量,然后單擊“X”按鈕,如圖3-17左所示,可以將男女生gpa分數(shù)的兩個盒形圖畫在同一個坐標系下,如圖3-17右所示,便于查看男女生gpa分數(shù)的分布狀況。圖3-17 畫在一個坐標系下單擊圖3-17MeanValue在盒形圖上標出男女生gpa分數(shù)的均值、中位數(shù)、四分之一分位數(shù)和四分之三分位數(shù)等。圖3-18 顯示均值、中位數(shù)、四分之一分位數(shù)和四分之三分位數(shù)等3.結果分析3-133-16可以看到gpa分數(shù)在均值兩邊的分布是不對稱gpa分數(shù)超過了平均值。這局部高分學生的分數(shù)比較集中,由于盒形圖中均值線右邊局部較短,而其他低分局部的學生成績較為分散,gpagpa分數(shù)是極端值,它不具有代表性。gpa分數(shù)直方圖〔3-14〕和盒形圖〔3-17右〕可以看到,男女生gpa分數(shù)的分布狀況類似,都略微左偏。兩條中位數(shù)線位置沒有明顯區(qū)分,但女生中位數(shù)線左方局部更長一些,說明女生的gpa分數(shù)低分局部更分散一些。五、用“分析家”繪制統(tǒng)計圖形五、用“分析家”繪制統(tǒng)計圖形3-5】某高校對學生逃課的狀況進展抽樣調(diào)查的結果如表3-4所示:3-4學生逃課狀況表年級性別逃課的狀況年級性別逃課的狀況2023級男從不逃課2023級男從不逃課2023級男間或逃課2023級男從不逃課2023級男間或逃課2023級男從不逃課2023級男間或逃課2023級男從不逃課2023級男間或逃課2023級女從不逃課2023級男間或逃課2023級女從不逃課2023級男間或逃課2023級女從不逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課利用統(tǒng)計圖形從整體上對逃課狀況進展分析。利用統(tǒng)計圖形對兩個年級逃課狀況進展比較分析。1.數(shù)據(jù)預處理1.數(shù)據(jù)預處理由于“分析家”對漢字處理效果不是很好,用變量grade、sexcase分別代表年級、2023202320232023”分別NSA首先將表3-4處理成Excel〔sy4_2.xl3-19所示。sy4_2.xls導入為SAS數(shù)據(jù)集Mylib.sy4_2?;蛟凇胺治黾摇敝兄苯臃_sy4_2.xls后存為數(shù)據(jù)集Mylib.sy4_2。以下操作總假定已經(jīng)在“分析家”中翻開數(shù)據(jù)集2.利用統(tǒng)計圖形從整體上對逃課狀況進展分析Mylib.sy4_2。2.利用統(tǒng)計圖形從整體上對逃課狀況進展分析繪制三維餅圖
圖3-19 數(shù)據(jù)表sy4_2.xlsGraph〔圖形PieChar〔餅圖PieChar變量列表中的case,單擊“Chart3-D3-20左。 圖3-20 總體狀況三維餅圖再單擊“Options”按鈕,進入“Options”窗口。單擊“SliceValues”選項卡,選中“Percent”單項選擇按鈕,如圖3-20右所示,兩次單擊“OK”按鈕,得到標有百分比的立體三維餅圖,如圖3-21所示。繪制三維條形圖Graph〔圖形BarChart〔條形圖Vercita〔垂直BarChart”對話框,選擇變量列表中的case,單擊“Chart3-D選3-22上所示。
圖3-21 總體狀況三維餅圖單擊“Options”按鈕,進入“Options”窗口,單擊“Statistics”選項卡,選中“DisplayStatistics”復選框,如圖3-22下所示。兩次單擊“OK”按鈕,得到標有頻數(shù)的立體三維條3-23所示。結果分析
圖3-22 設置三維條形圖3-213-238%26%,間或逃課的占66,這說明絕大多數(shù)學生逃過課,眾數(shù)為“間或逃課況,有一小局部常常逃課,這是值得我們留意的。3.利用統(tǒng)計圖形對兩個年級逃課狀況進展比較分析圖3.利用統(tǒng)計圖形對兩個年級逃課狀況進展比較分析分別繪制兩個年級的二維餅圖Graph〔圖形PieChar〔餅圖PieCharcase,單擊“Chart”按鈕,選定分析變量,選中2-D選項,再單擊“Options”按鈕,翻開“Options”對話框。Percent”單項選擇OKVariables”按GRADE選為分組3-24所示。
圖3-24 Variable對話框O3-25所示。圖3-25 兩個年級二維餅圖分別繪制兩個年級的二維條形圖Graph〔圖形BarChar〔條形圖Vercita〔垂直“VercitalBarChart”對話框,選擇變量列表中的case,單擊“Chart”按鈕,選定分析變量,2-Dgrade變量,單擊“GroupBy3-26左所示。單擊“Options”按鈕,進入“Options”窗口,單擊“Statistics”選項卡,選中“DisplayStatisticsOK”按鈕,得到標有頻數(shù)的兩個年級的二維條形圖,如圖3-26右所示。 結果分析
圖3-26 兩個年級三維條形圖3-253-26右看出兩個年級學生逃課的狀況的差異,主要在兩個極端,即“從不逃課”和“常常逃課”上。2023202320%,而“從不逃課”12%20232023級嚴峻得多。4.利用統(tǒng)計圖形對男女生逃課狀況進展比較分析兩個年級的逃課狀況中,眾數(shù)均為“間或逃課2023級的異眾比例為38,2023級的異眾比例為30%,這說明“間或逃課”并不能很好地代表2023級逃課的狀況,相比之20234.利用統(tǒng)計圖形對男女生逃課狀況進展比較分析分別繪制男女生的餅圖Graph〔圖形PieChar〔餅圖PieChar”對話框,選擇變量列表中的case,單擊“Chart”按鈕,選定分析變量,選中3-D選項,再單擊“Options”按鈕,進入“Options”窗口,單擊“SliceValues”選項卡,選中“Percent”單項選擇按鈕,單擊“OK”返回,再單擊“Variable”選項Sex選為分組變量,3-27所示。兩次單擊“OK”分別得到標有百分3-28所示。
圖3-27 Variable對話框 分別繪制男女生的三維條形圖
圖3-28 男女生三維餅圖Graph〔圖形BarChar〔條形圖Vercita〔垂直“VercitalBarChart”對話框,選擇變量列表中的case,單擊“Chart”按鈕,選定分析變量,再選擇sex變量,單擊“GroupBy”按鈕,選定分組變量。3-D選項,再單擊“Options”按鈕,進入“Options”窗口,單擊“Statistics”選項卡,選中“DisplayStatistics”按鈕,兩次單擊“OK”按鈕,得到標有頻數(shù)的男女生的兩個3-29所示。結果分析3-283-29。男女生均以“間或58%和74%,42%,女生的異眾比例為26%,這說明用“間或逃課”代表男生逃課的明白,這是由于男生走“兩個極端”的不少。她們逃課的狀況。圖3-29 男女生三維條形圖六、編程繪制統(tǒng)計圖六、編程繪制統(tǒng)計圖使用GCHART3-6】使用GCHART3-5中有關圖形。〔圖形略〕goptionsftext=“宋體“htitle=1;title”總體狀況三維餅圖”;proc gchart data=Mylib.sy4_2;pie3d case/type=PCT;run;title”總體狀況三維條形圖”;procgchartdataMylib.sy4_2;vbar3d case/outside=FREQ;run;title”兩個年級二維餅圖”;procgchartdata=Mylib.sy4_2;pie case/group=grade type=PCT;run;title”兩個年級二維條形圖”;procgchartdataMylib.sy4_2;vbar case/group=grade outside=FREQ;run;title”男女生三維餅圖”;procgchartdata=Mylib.sy4_2;pie3d case/group=sex type=PCT;run;title”男女生三維條形圖”;procgchartdata=Mylib.sy4_2;vbar3d case/group=sex outside=FREQ;run;title””;使用GPLOT3-7GPLOT過程繪制SASUSER.AIRcodatetime的散點圖以及winddatetime的連線圖。goptionsftext=“宋體“htitle=1;proc gplot data=sasuser.air;plotco*datetime;title”codatetime的散點圖”;symbolv=doti=nonecv=orangeproc gplot data=sasuser.air;plotwind*datetime;title”winddatetime的連線圖”;symbolv=stari=joincv=redc
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建省南平市王臺中學2020-2021學年高一數(shù)學理期末試題含解析
- 福建省南平市塔前中學2020年高三物理模擬試題含解析
- 11《一塊奶酪》說課稿-2024-2025學年統(tǒng)編版語文三年級上冊
- 2024機關單位食堂承包合同
- 商務會議禮儀解析
- 解讀現(xiàn)代藝術
- 旅游業(yè)財務全解析
- 2024正規(guī)婚姻解除財產(chǎn)分割協(xié)議書范本12篇
- 2024版?zhèn)€人向企業(yè)租車合同
- 專項給排水施工分包協(xié)議(2024修訂版)版B版
- 日本疾病診斷分組(DPC)定額支付方式課件
- 復旦大學用經(jīng)濟學智慧解讀中國課件03用大歷史觀看中國社會轉型
- (精心整理)高一語文期末模擬試題
- QC成果解決鋁合金模板混凝土氣泡、爛根難題
- 管線管廊布置設計規(guī)范
- 提升教練技術--回應ppt課件
- 最新焊接工藝評定表格
- 精品洲際酒店集團皇冠酒店設計標準手冊
- 農(nóng)副產(chǎn)品交易中心運營方案
- 四川省南充市2019-2020學年九年級上期末數(shù)學試卷(含答案解析)
- 智多星建設工程造價軟件操作及應用PPT課件
評論
0/150
提交評論