數(shù)據(jù)分析描述性統(tǒng)計分析過程_第1頁
數(shù)據(jù)分析描述性統(tǒng)計分析過程_第2頁
數(shù)據(jù)分析描述性統(tǒng)計分析過程_第3頁
數(shù)據(jù)分析描述性統(tǒng)計分析過程_第4頁
數(shù)據(jù)分析描述性統(tǒng)計分析過程_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析描述性統(tǒng)計分析過程第1頁,共33頁,2023年,2月20日,星期五幾種描述性統(tǒng)計分析的SAS過程和作圖過程procmeansprocunivariateproccorrprocplot//procgplotproccapability第2頁,共33頁,2023年,2月20日,星期五procmeans(1)

Means過程的語句格式

Means過程的主要控制語句如下:

procmeans輸入數(shù)據(jù)集名<選項列表>;var變量列表;class變量列表;byfreq變量列表;

變量;weight變量;id變量列表;

output<out=輸出數(shù)據(jù)集名><統(tǒng)計量關(guān)鍵字=變量名列表>;run;第3頁,共33頁,2023年,2月20日,星期五procmeans(2)var語句——規(guī)定要求計算簡單描述性統(tǒng)計量的數(shù)值變量的次序。by語句——按by語句定義的變量進(jìn)行分組計算其相應(yīng)的簡單統(tǒng)計量,要求輸入數(shù)據(jù)集已按by變量排序。class語句——與by語句一樣,可用class變量定義觀測組,分別計算各組觀測的描述統(tǒng)計量。輸出格式與by不同且事先不需要按class變量排序。freq語句——指定一個數(shù)值型的freq變量,它的值表示輸入數(shù)據(jù)集中相應(yīng)觀測出現(xiàn)的頻數(shù)。weight語句——規(guī)定一個weight變量,它的值表示相應(yīng)觀測的權(quán)數(shù)。id語句——在輸出數(shù)據(jù)集中增加一個或幾個附加變量,目的在于識別輸出數(shù)據(jù)集里的觀測。其值為生成這個觀測的輸入數(shù)據(jù)集中相應(yīng)觀測組里id變量具有的最大值。第4頁,共33頁,2023年,2月20日,星期五ntcvprocmeans(3)

procmeans語句中可用的統(tǒng)計量關(guān)鍵字統(tǒng)計量名稱含義統(tǒng)計量名稱含義未丟失的觀測個數(shù)mode眾數(shù),出現(xiàn)頻數(shù)最高的數(shù)nmissmeanstderrsumstdvarusscssskewnesskurtosis丟失的觀測個數(shù)算術(shù)平均均值的標(biāo)準(zhǔn)誤差加權(quán)和標(biāo)準(zhǔn)偏差方差變異系數(shù)的百分?jǐn)?shù)加權(quán)平方和關(guān)于均值偏差的加權(quán)平方和對稱性的度量——偏度對尾部陡平的度量——峰度sumwgtmaxminrangemedianprtclmlclmuclm權(quán)數(shù)和最大值最小值極差,max—min中間值總體均值等于0的t統(tǒng)計量t分布的雙尾p值置信度上限和下限置信度下限置信度上限第5頁,共33頁,2023年,2月20日,星期五procmeans(4)output語句中的選項。<out=輸出數(shù)據(jù)集名>——輸出數(shù)據(jù)集名。統(tǒng)計量關(guān)鍵字=變量名列表——規(guī)定在輸出數(shù)據(jù)集中要包含的統(tǒng)計量并規(guī)定這些統(tǒng)計量在新數(shù)據(jù)集中的變量名。means過程對output語句的次數(shù)沒有限制,可以使用幾個output語句來創(chuàng)建內(nèi)容不同的多個數(shù)據(jù)集。第6頁,共33頁,2023年,2月20日,星期五Nprocmeans(5)

SAS程序 dataexamp1; inputx@@; cards; 70.472.076.574.376.577.667.372.075.074.3 73.579.573.574.765.076.581.675.472.772.7 67.276.572.770.477.268.867.367.367.372.7 75.873.575.072.773.573.572.781.670.374.3 73.579.570.476.572.777.284.375.076.570.4 ; procmeansdata=examp1nmeancvskewnesskurtosisrangemedian; varx; run;

輸出TheMEANSProcedureAnalysisVariable:xMeanVariationSkewnessKurtosisRangeMedian5073.74600005.40837940.15401110.358117919.300000073.5000000第7頁,共33頁,2023年,2月20日,星期五procunivariate(1)單變量統(tǒng)計分析對一組單指標(biāo)實驗數(shù)據(jù)進(jìn)行分析常采用兩種方法:圖示法——包括莖葉圖、盒型圖和正態(tài)概率圖。描述統(tǒng)計量——包括矩、分位數(shù)、極端值和頻數(shù)分布表。第8頁,共33頁,2023年,2月20日,星期五procunivariate(2)

Univariate過程的主要控制語句如下:

procunivariate輸入數(shù)據(jù)集名<選項列表>;varbyfreqweightid變量列表變量列表變量;變量;變量列表;;;output<out=輸出數(shù)據(jù)集名><統(tǒng)計量關(guān)鍵字=變量名列表><pctlpts= 百分位數(shù)pctlpre=變量前綴名pctlname=變量后綴名>;run;第9頁,共33頁,2023年,2月20日,星期五procunivariate(3)

Univariate過程的主要控制語句如下:

procunivariate輸入數(shù)據(jù)集名<選項列表>;varbyfreqweightid變量列表變量列表變量;變量;變量列表;;;output<out=輸出數(shù)據(jù)集名><統(tǒng)計量關(guān)鍵字=變量名列表><pctlpts= 百分位數(shù)pctlpre=變量前綴名pctlname=變量后綴名>;run;第10頁,共33頁,2023年,2月20日,星期五教材1.1例題examp1_1(SAS程序)dataexamp1_1;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_1;varx;run;第11頁,共33頁,2023年,2月20日,星期五教材1.1例題examp1_1(SAS結(jié)果1)

TheUNIVARIATEProcedure Variable:x MomentsNMeanStdDeviationSkewness100SumWeights 73.66SumObservations 3.94008153Variance 0.06007521Kurtosis100 7366 15.5242424 0.03386864UncorrectedSS544116.46CorrectedSS1536.9CoeffVariation5.34901103StdErrorMean BasicStatisticalMeasures0.39400815LocationVariabilityMean73.66000StdDeviationMedian73.50000VarianceMode73.50000Range

3.94008 15.5242420.00000InterquartileRange4.60000第12頁,共33頁,2023年,2月20日,星期五教材1.1例題examp1_1(SAS結(jié)果2)

TheUNIVARIATEProcedure Quantiles(Definition5)Quantile100%Max99%95%90%75%Q3Estimate 84.30 82.95 80.50 79.15 75.8050%Median25%Q110%

73.50 71.2068.405%1%0%Min67.3064.65 64.30第13頁,共33頁,2023年,2月20日,星期五proccapability(能力分析過程)PROCCAPABILITYisdesignedforprocesscapabilityanalysis,including:Histograms(直方圖)andcomparativehistograms.Cumulativedistributionfunctionplots(cdfplots)(累積分布函數(shù)).Quantile-quantileplots(Q-Qplots),probabilityplots,andprobability-probabilityplots(P-Pplots).Theseplotsfacilitatethecomparisonofadatadistributionwithvarioustheoreticaldistributions.Goodness-of-fit(擬合優(yōu)度)testsforavarietyofdistributionsincludingthenormal.Statisticalintervals(prediction,tolerance,andconfidenceintervals)foranormalpopulation.第14頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_4(SAS程序)dataexamp1_4;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;proccapabilitydata=examp1_4;histogramx/normal(mu=estsigma=est);cdfplot/normal(mu=estsigma=est);qqplotx/normal(mu=estsigma=est);run;第15頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_4(SAS結(jié)果)

TheCAPABILITYProcedure FittedNormalDistributionforx ParametersforNormalDistribution ParameterSymbolEstimateMeanMu73.66

StdDevSigma3.940082QuantilesforNormalDistribution ------Quantile------ PercentObservedEstimated 1.064.650064.4940 5.067.300067.1791 10.068.400068.6106 25.071.200071.0025 50.073.500073.6600 75.075.800076.3175 90.079.150078.7094 95.080.500080.1409 99.082.950082.8260第16頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_4(SAS直方圖)第17頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_4(SAS分布函數(shù)圖)第18頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_4(SASqq圖)第19頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_6(SAS程序)dataexamp1_6;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_6plot;varx;run;第20頁,共33頁,2023年,2月20日,星期五#4教材1.2例題examp1_6(SAS結(jié)果)StemLeafBoxplot84383828126680355795557808887722676555555575000000046888887433333333773555555555557200000007777777712222703444444469777680088867233336665006431 3 3 3 4 3 714 91114 8 3 5 5 2 1

0 | | | | | |+-----+||*--+--*||+-----+ | | | | | | 0第21頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_8(SAS程序)dataexamp1_8;inputx@@;cards;254550545561646872757578798183848484858686868789898990919192100;procunivariatedata=examp1_8normal;run;proccapabilitydata=examp1_8graphicsnoprint;histogramx/weibullvscale=proportion;run;datadelmin;setexamp1_8;ifx=25thendelete;run;proccapabilitydata=delmingraphicsnoprint;histogramx/weibullvscale=proportion;cdfplotx/weibull;run;第22頁,共33頁,2023年,2月20日,星期五2

教材1.2例題examp1_8(SAS結(jié)果1)TestsforNormalityTest--Statistic--------pValue------Shapiro-WilkW0.863287Pr<W0.0010Kolmogorov-SmirnovD0.195196Pr>D<0.0100Cramer-vonMisesAnderson-DarlingW-Sq0.295854 A-Sq1.593346Pr>W-Sq<0.0050Pr>A-Sq<0.0050結(jié)論:拒絕正態(tài)分布的假設(shè)

Goodness-of-FitTestsforWeibullDistributionTestCramer-vonMises----Statistic----- W-Sq0.2242363DF

------pValue------Pr>W-Sq<0.010Anderson-DarlingA-Sq1.2884219Pr>A-Sq<0.010Chi-SquareChi-Sq24.87188823Pr>Chi-Sq<0.001結(jié)論:拒絕Weibull分布的假設(shè)

Goodness-of-FitTestsforWeibullDistributionTest----Statistic-----DF------pValue------Cramer-vonMisesAnderson-DarlingChi-SquareW-Sq0.16341872 A-Sq1.00500667Chi-Sq5.22777090

Pr>W-Sq0.013Pr>A-Sq<0.010Pr>Chi-Sq0.073結(jié)論:對于刪去25的數(shù)據(jù)集,接受Weibull分布的假設(shè)第23頁,共33頁,2023年,2月20日,星期五教材1.2例題examp1_8(SAS結(jié)果2)第24頁,共33頁,2023年,2月20日,星期五proccorr(1)

proccorr(相關(guān)分析過程)用于計算變量之間 的相關(guān)系數(shù),包括Pearson(皮爾遜)的乘 積矩相關(guān)和加權(quán)乘積矩相關(guān)。還能產(chǎn)生三個 非參數(shù)的關(guān)聯(lián)測量:Spearman的秩相關(guān), Kendall的tau-b和Hoeffding的相關(guān)性度量D。proccorr語句調(diào)用corr過程,且是唯一必須的語句。如果只使用proccorr這一條的語句,過程計算輸入數(shù)據(jù)集中所有數(shù)值變量之間的相關(guān)系數(shù)。其余語句是供選擇的。第25頁,共33頁,2023年,2月20日,星期五proccorr(2)

proccorr過程一般由下列語句控制:proccorrvarwithpartialweightfreqByrun;

data=數(shù)據(jù)集<選項>;變量列表;變量列表;變量列表;變量;變量;變量列表;第26頁,共33頁,2023年,2月20日,星期五教材1.3例題examp1_9(SAS程序)dataexamp1_9;inputxy;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proccorrdata=examp1_9pearsonspearmancov;run;run;第27頁,共33頁,2023年,2月20日,星期五xyNxy

教材1.3例題examp1_9(SAS結(jié)果1)TheCORRProcedure2Variables:xyCovarianceMatrix,DF=19

x 570.45007845.0789

y 7845.0789112404.2632SimpleStatisticsVariable20

Mean33.85000StdDev 23.88410Median 27.00000Minimum 5.00000Maximum70.0000020477.50000335.26745342.0000082.000001125第28頁,共33頁,2023年,2月20日,星期五xyxy教材1.3例題examp1_9(SAS結(jié)果2)

TheCORRProcedurePearsonCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0

x1.000000.97971y0.97971 <.00011.00000

<.0001SpearmanCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0

x1.000000.97366<.0001y0.97366<.00011.00000第29頁,共33頁,2023年,2月20日,星期五教材1.3例題examp1_10(SAS程序)dataexam1_10;inputx1-x6;cards;19136505162601893752211060………156335415225731383368211043;proccorrdata=exam1_10covpearsonspearman;varx1-x6;run;第30頁,共33頁,2023年,2月20日,星期五Nx520教材1.3例題examp1_10(SAS結(jié)果1)TheCORRProcedure6Variables:x1x2x3x4x5x6CovarianceMatrix,DF=19(略)

SimpleStatisticsVariableMeanStdDevMedianMinimumMaximumx120178.6000024.69051176.00000138.00000247.00000x2x3x420202035.4000056.10000 9.45000

3.20197 7.210375.28628

35.00000 55.0000011.5000031.0000046.000001.00000

46.00000 74.0000017.00000145.5500062.56658122.5000050.00000251.00000x62070.3000051.2774754.0000025.00000250.00000第31頁,共33頁,2023年,2月20日,星期五教材1.3例題examp1_10(SAS結(jié)果2)TheCORRProcedure6Variables:x1x2x3x4x5x6PearsonCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0x1x2x3x4x5x6x1x2x3x4x5x6

1.00000 0.87024 <.0001-0.365760.1128-0.389690.0894-0.49308 0.0272-0.22630 0.3374

0.87024

<.0001 1.00000 -0.352890.1270 -0.552230.0116 -0.64560 0.0021 -0.19150 0.4186

-0.36576

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論