版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 SAS數(shù)據(jù)分析完整筆記。收藏2013-08-11ice數(shù)據(jù)分析數(shù)據(jù)分析1.SASINSIGHT啟動(dòng):方法1:SolutiomAnalysisInteractiveDateAnalysis方法2:在命令欄內(nèi)輸入insight方法3:程序編輯窗口輸入以下代碼,然后單擊Submit按鈕;Procinsight;Run;一維數(shù)據(jù)分析用sasinsight做直方圖、盒形圖、馬賽克圖。直方圖:AnalysisHistogram/BarChart盒形圖:AnalysisBoxplot馬賽克圖:AnalysisBoxplot/Mosaicplot(Y)二維數(shù)據(jù)分析散點(diǎn)圖:AnalysisScatterypl
2、ot(YX)曲線圖:AnalysisLineplot(YX)三維數(shù)據(jù)分析旋轉(zhuǎn)圖:AnalysisRotationgPlot曲面圖:AnalysisRotationgPlot設(shè)置FitSurface等高線圖:AnalysisCountorplot分布分析驗(yàn)。包括:直方圖、盒形圖、各階矩、分位數(shù)表,直方圖擬合密度曲線,對(duì)特定分布進(jìn)行檢1.4.1AnalysisDistribution(Y)第一部分為盒形圖,第二部分為直方圖,第三部分為各階矩,第四部分為分位數(shù)表。添加密度估計(jì)A:參數(shù)估計(jì):給出各種已知分布(正態(tài),指數(shù)等),只需要對(duì)其中參數(shù)進(jìn)行估計(jì);CurvesParametricDensityB:核
3、估計(jì):對(duì)密度函數(shù)沒(méi)有做假設(shè),曲線性狀完全依賴于數(shù)據(jù);CurvesKernelDensity1.4.3分布檢驗(yàn)CurvesCDFconfidencebandCurvesTestforDistribution曲線擬合AnalysisFit(YX):分析兩個(gè)變量之間的關(guān)系多變量回歸AnalysisFit(YX)方差分析AnalysisFit(YX)相關(guān)系數(shù)計(jì)算AnalysisMultivariate主成分分析AnalysisMultivariate2.SASANALYST啟動(dòng):方法1:SolutionAnalysisAnalyst方法2:在命令欄內(nèi)輸入analyst分類計(jì)算統(tǒng)計(jì)量:DataSumma
4、rizebygroup隨機(jī)抽樣:DataRandomSample生成報(bào)表:ReportTables變量計(jì)算:DateTransform繪制統(tǒng)計(jì)圖條形圖:GraphBarChartHorizontal餅圖:GraphPieChart直方圖:GraphHistogram概率圖:GraphProbalityplot散點(diǎn)圖:GraphScatterplot2.6統(tǒng)計(jì)分析與計(jì)算2.6.1計(jì)算描述性統(tǒng)計(jì)量StatisticsDescriptiveSummartStatistics只計(jì)算簡(jiǎn)單統(tǒng)計(jì)量StatisticsDescriptiveDistribution可計(jì)算一個(gè)變量的分布信息StatisticsD
5、escriptiveCorrelations可計(jì)算變量之間的相關(guān)關(guān)系StatisticsDescriptiveFrequencycounts可計(jì)算頻數(shù)列聯(lián)表分析StatisticsTableAnalysis2.7假設(shè)檢驗(yàn)2.7.1單樣本均值Z檢驗(yàn):檢驗(yàn)單樣本均值與某個(gè)給定的數(shù)值之間的關(guān)系StatisticsHypothesistestsOne-SampleZ-testforamean2.7.2單樣本均值t檢驗(yàn):適用于不了解變量的方差情形推斷該樣本來(lái)自的總體均數(shù)卩與已知的某一總體均屬卩0是否相等StatisticsHypothesistestsOne-Samplet-testforamean2.
6、7.3單樣本比例檢驗(yàn):檢驗(yàn)取離散值的變量取某個(gè)值的比例StatisticsHypothesistestsOne-Sampletestforaproportion2.7.4單樣本方差檢驗(yàn):檢驗(yàn)樣本方差是否等于給定的值。零假設(shè)方差等于某個(gè)給定的StatisticsHypothesistestsOne-Sampletestforavariance2.7.5兩樣本均值t檢驗(yàn):獨(dú)立的兩個(gè)總體的均值是否相等或者是否相差給定的值StatisticsHypothesistestsTwo-Samplet-testformeans2.7.6成對(duì)樣本均值t檢驗(yàn):成對(duì)樣本檢驗(yàn)中總體是相關(guān)的。StatisticsHyp
7、othesistestsTwo-Samplepairedt-testformeans兩樣本比例檢驗(yàn):檢驗(yàn)兩個(gè)總體中某個(gè)比例的值是否相等。StatisticsHypothesistestsTwo-Sampletestforproportions兩樣本方差檢驗(yàn)StatisticsHypothesistestsTwoSampletestforvariance2.8ANOVA過(guò)程2.8.1單因素ANOVA過(guò)程StatisticsANOVAOne-WayAnova2.8.2非參數(shù)的單因素方差分析:適用于正態(tài)分布假定或方差相等假設(shè)不能滿足的單因素問(wèn)題StatisticsANOVAnonparametero
8、ne-wayAnovatestWilcoxon法、Median法、VanderWaerden法、Savage法。2.8.2因素方差分析:實(shí)驗(yàn)結(jié)果是連續(xù)數(shù)值而分類變量是兩個(gè)以上的離散型數(shù)值。StatisticsANOVAFactorialAnova2.8.3線性模型:用最小二乘法擬合一般線性模型StatisticsANOVALinearModel2.9回歸分析:StatisticsRegression2.9.1simple回歸:簡(jiǎn)單一類回歸分析,單一的自變量,單一的因變量,模型可以是一次、二次、三次。StatisticsRegressionsimple2.9.21inear回歸:線性回歸,回歸模
9、型可以有多個(gè)因變量,多個(gè)自變量,但是對(duì)因變量分別進(jìn)行回歸StatisticsRegressionlinear2.9.3logistic回歸:用于解決因變量是一個(gè)二元變量StatisticsRegressionlogistic3.報(bào)表以及圖形輸出3.1print過(guò)程Procprintdata=sasuser.score;/數(shù)據(jù)庫(kù).數(shù)據(jù)集Run;Procprintdata=sasuser.score;VarnamemathChinese;/變量Run;Procprintdata=sasuser.scorenoobs;/去掉第一列(觀測(cè)序號(hào))VarnamemathChinese;Run;Procpr
10、intdata=sasuser.score;Wheresexin(F);/通過(guò)where語(yǔ)句Run;Procprintdata=sasuser.scorenoobslabel;Title女生成績(jī)單;Labelname=姓名Sex=性別,Math=數(shù)學(xué),Chinese=語(yǔ)文,English=英語(yǔ)飛Wheresexin(f5);Run;Title“thesassystem”;/恢復(fù)系統(tǒng)標(biāo)題Procprintdata=sasuser.score;Footnote=分?jǐn)?shù)列表5;/加分?jǐn)?shù)列表的腳注Run;Procsortdata=sasuser.score;Bysex;Run;Procprintdata
11、=sasuser.score;/使用by分組輸出前用sort排序Bysex;Run;Procprintdata=sasuser.score;Summath;Run;tabulate過(guò)程Proctabulatedata=數(shù)據(jù)集名稱;Class分類變量;Var分析變量;Table頁(yè)面說(shuō)明行維說(shuō)明列維說(shuō)明/選項(xiàng)Run;sort過(guò)程Procsortdata=數(shù)據(jù)集名稱;/默認(rèn)升序排列By變量名;Run;Procsortdata=數(shù)據(jù)集名稱;Bydescending變量名;/降序排列Run;means過(guò)程:數(shù)量(N)、均值(Mean)、標(biāo)準(zhǔn)差(StdDev)、最大值(Maximum)、最小值(Minim
12、um)Procmeansdata=sasuser.stock;Varprice;Run;univariate過(guò)程Procunivariatedata=數(shù)據(jù)集;Var分析變量;Run;結(jié)果:Moments:統(tǒng)計(jì)量的各階矩,例如一階矩就是均值,二階矩就是方差等;BasicStatisticalMeasures:基本統(tǒng)計(jì)量;Testsforlocation:檢驗(yàn)均值是否為零;Quantiles:分位數(shù)表;ExtremeObservations:極端觀測(cè)值。3.6freq過(guò)程:離散變量的分布情況Procfreqdata=數(shù)據(jù)集名;Tables變量名;Run;結(jié)果:變量取值、頻數(shù)、百分比、累計(jì)頻數(shù)、;累
13、計(jì)百分比3.7corr過(guò)程:相關(guān)系數(shù)Proccorrdata=數(shù)據(jù)集;Var變量名變量名;Run;結(jié)果:簡(jiǎn)單統(tǒng)計(jì)量相關(guān)系數(shù)及p值gplot過(guò)程:繪制散點(diǎn)圖和曲線圖,繪制回歸曲線。Procgplotdata=數(shù)據(jù)集名稱;Symbol曲線類型;Plot豎軸變量*橫軸變量;Run;Procgplotdata=sasuser.score;SymbolI=nonev=star;PlotEnglish*Chinese;Run;gchart過(guò)程:繪制直方圖、餅圖、三維直方圖等。Procgchartdata=數(shù)據(jù)集名稱;Vbar/pie/block=變量;Run;3.10G3D過(guò)程繪制三維曲面Procg3dd
14、ata=數(shù)據(jù)集;Plot變量x*變量y=變量z;Run;gcontour過(guò)程:畫(huà)出曲面的等高線Procgcontourdata=數(shù)據(jù)集名;Plotx*y=z;Run;4.基本統(tǒng)計(jì)分析4.1正態(tài)性檢驗(yàn):univariate過(guò)程Procunivariatedata=sasuser.stocknormal;Vareps;Run;Procunivariatedata=sasuser.stocknormal;Vareps;Histogrameps;/畫(huà)出直方圖Probploteps;/畫(huà)出概率分布圖Run;4.2單變量均值檢驗(yàn)4.2.1如果一個(gè)變量服從正態(tài)分布,那么可以用t檢驗(yàn)來(lái)對(duì)變量進(jìn)行均值檢驗(yàn)Pro
15、cttestdata=數(shù)據(jù)集ho=均值;Var檢驗(yàn)變量;Run;4.2.2t檢驗(yàn)還可以檢驗(yàn)方差相同的兩個(gè)獨(dú)立樣本均值是否相等Procttestdata=數(shù)據(jù)集;Class分類變量;Var檢驗(yàn)變量;Run;結(jié)果第一部分簡(jiǎn)單統(tǒng)計(jì)量第二部分t檢驗(yàn)結(jié)果第三部分兩者方差是否相等檢驗(yàn)T檢驗(yàn)要求兩個(gè)獨(dú)立樣本都必須服從正態(tài)分布,如果不服從正態(tài)分布,則無(wú)法進(jìn)行t檢驗(yàn)。這時(shí)可用非參數(shù)的方法,常用的非參數(shù)方法是NPAR1WAY過(guò)程,它是noparameter1way縮寫(xiě)。4.3成對(duì)總體均值檢驗(yàn)4.4回歸分析:reg(回歸)過(guò)程、rsreg(二次響應(yīng)面回歸)過(guò)程、orthoreg(病態(tài)數(shù)據(jù)回歸)過(guò)程、nlin(非線性
16、回歸)過(guò)程、transreg(變換回歸)過(guò)程、calis(線性結(jié)果方程和路徑分析)過(guò)程、glm(一般線性回歸)過(guò)程、genmod(廣義線性回歸)過(guò)程REG過(guò)程Procregdata=輸入數(shù)據(jù)集選項(xiàng);Var變量列表;Model因變量=自變量列表;Print輸出結(jié)果;Plot診斷圖形;Run;nlin過(guò)程指明模型的表達(dá)式并給定系數(shù)初值4.4.3glm過(guò)程:使用最小二乘法回歸線性模型,還可以進(jìn)行回歸,分差,協(xié)方差,多變量方差、偏相關(guān)系數(shù)分析方差分析4.5.1單因素方差分析Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實(shí)驗(yàn)結(jié)果=因素;Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實(shí)驗(yàn)結(jié)果=因素;Meansbrand;Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實(shí)驗(yàn)結(jié)果=因素;Meansbrand/t;/t檢驗(yàn)Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實(shí)驗(yàn)結(jié)果=因素;Meansbrand/bon;/bonferronit檢驗(yàn)控制第一類錯(cuò)誤的概率,但是具有較大第二類錯(cuò)誤概率Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025企業(yè)管理資料范本附件應(yīng)屆畢業(yè)生聘用合同
- 2025年出口合同范本
- 2025國(guó)有土地使用權(quán)出讓合同(宗地)
- 挖掘少數(shù)民族醫(yī)藥資源促進(jìn)健康產(chǎn)業(yè)發(fā)展
- 課題申報(bào)參考:空間視角下當(dāng)代德國(guó)的家國(guó)反思及啟示
- 安全知識(shí)普及類APP的內(nèi)容策劃與制作研究
- 激發(fā)員工創(chuàng)造力提升企業(yè)競(jìng)爭(zhēng)力
- 智慧辦公在農(nóng)業(yè)科技園區(qū)的應(yīng)用及趨勢(shì)
- 2025年人教五四新版九年級(jí)科學(xué)下冊(cè)月考試卷含答案
- 2024 四川公務(wù)員考試行測(cè)真題(綜合管理崗)
- 四川省成都市武侯區(qū)2023-2024學(xué)年九年級(jí)上學(xué)期期末考試化學(xué)試題
- 2024年秋季人教版七年級(jí)上冊(cè)生物全冊(cè)教學(xué)課件(2024年秋季新版教材)
- 環(huán)境衛(wèi)生學(xué)及消毒滅菌效果監(jiān)測(cè)
- 2024年共青團(tuán)入團(tuán)積極分子考試題庫(kù)(含答案)
- 碎屑巖油藏注水水質(zhì)指標(biāo)及分析方法
- 【S洲際酒店婚禮策劃方案設(shè)計(jì)6800字(論文)】
- 鐵路項(xiàng)目征地拆遷工作體會(huì)課件
- 醫(yī)院死亡報(bào)告年終分析報(bào)告
- 中國(guó)教育史(第四版)全套教學(xué)課件
- 2023年11月英語(yǔ)二級(jí)筆譯真題及答案(筆譯實(shí)務(wù))
- 上海民辦楊浦實(shí)驗(yàn)學(xué)校初一新生分班(摸底)語(yǔ)文考試模擬試卷(10套試卷帶答案解析)
評(píng)論
0/150
提交評(píng)論