版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計統(tǒng)計統(tǒng)計統(tǒng)計統(tǒng)計統(tǒng)計生物物理化學經(jīng)濟保險心理教育管理第1頁/共129頁內(nèi)容簡介模塊簡介模塊簡介SAS與與Excel的通訊的通訊常用過程常用過程SAS的學習的學習曲線擬合非線性規(guī)劃神經(jīng)網(wǎng)絡(luò)多元統(tǒng)計矩陣運算回歸分析第2頁/共129頁模塊簡介模塊簡介SAS系統(tǒng)的組成 SAS數(shù)據(jù)庫部分:其模塊為SAS/BASE。它也是其它模塊的基礎(chǔ),即其它模塊是建立在其基礎(chǔ)之上的 SAS分析核心:這一部分包括了許多模塊: SAS/STAT:統(tǒng)計分析模塊:回歸分析、方差分析、屬性數(shù)據(jù)分析、多變量分析、判別和聚類分析、殘存分析、心理測驗分析和非參數(shù)分析等8類40多個過程。 SAS/ETS:經(jīng)濟預(yù)測或時間序列分析模塊。
2、如實用預(yù)測(逐步回歸、指數(shù)平滑等)序列相關(guān)校正回歸、分布滯后回歸、ARIMA模型、狀態(tài)空間方法、譜分析和互譜分析等。 SAS/OR:運籌學和工程管理模塊:可進行線性和非線性規(guī)劃,還包括項目管理,時間安排和資源分配等問題的一整套方法。 SAS/QC:質(zhì)量控制和試驗設(shè)計模塊。 SAS/IML:矩陣運算模塊。 SAS/LAB:菜單驅(qū)動的面向任務(wù)的解釋引導式數(shù)據(jù)分析模塊。 SAS/INSIGHT:可視化數(shù)據(jù)探索工具模塊。 SAS/SPECTRAVIEW:多維數(shù)據(jù)觀測、分析、研究的交互式立體可視化工具模塊第3頁/共129頁模塊簡介模塊簡介SAS系統(tǒng)的組成 SAS開發(fā)及呈現(xiàn)工具: SAS/AF:應(yīng)用開發(fā)工
3、具。采用面向?qū)ο蟮募夹g(shù),開發(fā)用戶自己的圖形用戶界面(GUI)的應(yīng)用系統(tǒng)。 SAS/EIS:行政管理系統(tǒng)或個人的信息系統(tǒng) SAS/GRAPH:圖形軟件包 SAS/GIS:集地理信息系統(tǒng)功能與空間數(shù)據(jù)的顯示分析于一體的軟件 SAS對分布處理模式的支持及其數(shù)據(jù)倉庫設(shè)計: SAS/ACCESS:與外部數(shù)據(jù)庫文件的接口模塊。 SAS/CONNECT:在網(wǎng)絡(luò)環(huán)境下,使各平臺上的SAS系統(tǒng)建立內(nèi)在聯(lián)系模塊。實現(xiàn)分布處理,從而有效地利用各平臺數(shù)據(jù)和機器資源 SAS/SHARE:實行SAS系統(tǒng)中數(shù)據(jù)庫的并發(fā)控制的模塊 第4頁/共129頁SAS與與Excel的通訊的通訊SAS中數(shù)據(jù)Excel第5頁/共129頁第6
4、頁/共129頁第7頁/共129頁第8頁/共129頁第9頁/共129頁第10頁/共129頁第11頁/共129頁第12頁/共129頁第13頁/共129頁第14頁/共129頁第15頁/共129頁第16頁/共129頁第17頁/共129頁第18頁/共129頁第19頁/共129頁第20頁/共129頁第21頁/共129頁第22頁/共129頁第23頁/共129頁第24頁/共129頁第25頁/共129頁第26頁/共129頁第27頁/共129頁第28頁/共129頁第29頁/共129頁第30頁/共129頁第31頁/共129頁第32頁/共129頁第33頁/共129頁第34頁/共129頁第35頁/共129頁第36頁/共
5、129頁第37頁/共129頁xdxxfxPxF)()(第38頁/共129頁第39頁/共129頁第40頁/共129頁第41頁/共129頁第42頁/共129頁1216iiUX222sin1ln222cos1ln21RRXRRX)(*seedrannor第43頁/共129頁第44頁/共129頁第45頁/共129頁other 01xh )1/()1 (2hx0 /2)(hxhxxf第46頁/共129頁第47頁/共129頁第48頁/共129頁第49頁/共129頁第50頁/共129頁第51頁/共129頁第52頁/共129頁第53頁/共129頁第54頁/共129頁第55頁/共129頁第56頁/共129頁第5
6、7頁/共129頁第58頁/共129頁第59頁/共129頁第60頁/共129頁第61頁/共129頁第62頁/共129頁第63頁/共129頁第64頁/共129頁第65頁/共129頁第66頁/共129頁第67頁/共129頁第68頁/共129頁第69頁/共129頁第70頁/共129頁第71頁/共129頁第72頁/共129頁第73頁/共129頁第74頁/共129頁第75頁/共129頁第76頁/共129頁第77頁/共129頁第78頁/共129頁第79頁/共129頁第80頁/共129頁連接第81頁/共129頁連接第82頁/共129頁連接第83頁/共129頁連接第84頁/共129頁連接第85頁/共129頁合并
7、第86頁/共129頁合并第87頁/共129頁合并第88頁/共129頁合并本章目錄第89頁/共129頁合并第90頁/共129頁第91頁/共129頁第92頁/共129頁第93頁/共129頁第94頁/共129頁MEANS過程1 1 描述性統(tǒng)計及描述性統(tǒng)計及SASSAS相關(guān)過程相關(guān)過程MEANS過程的格式及語句說明 1.格式PROC MEANS 選擇項; VAR 變量表; BY 變量表; CLASS 變量表; FREQ 變量表; WEIGHT 變量; ID 變量表; OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計量關(guān)鍵詞=變量名表必需的語句可選擇語句第95頁/共129頁MEANS過程的格式及語句說明 2.語
8、句說明 選擇項 vDATA=SAS數(shù)據(jù)集名,指明進行分析的數(shù)據(jù)集名,其缺省值為最近建立的SAS數(shù)據(jù)集。vNOPRINT不打印任何描述性統(tǒng)計量。此選項多用在將描述性統(tǒng)計量輸出到SAS數(shù)據(jù)集時。 缺省時的規(guī)定輸出描述統(tǒng)計量,即PRINT選項。vMAXDEC=n指定輸出結(jié)果小數(shù)部分的最大位數(shù),n的取值范圍為08,缺省值為n=2vALPHA=值,指定顯著性水平的值。vVARDEF=除數(shù) 指定計算方差所用的除數(shù)。除數(shù)可以用以下關(guān)鍵字表示: 1. DF 用自由度(N-1)做除數(shù),這是缺省設(shè)置。 2. N 用觀測數(shù)做除數(shù)。 3. WEIGHT | WGT 用權(quán)重和做除數(shù)。 4. WDF 用權(quán)重和減1做除數(shù)。
9、第96頁/共129頁MEANS過程的格式及語句說明 2.語句說明 選擇項 v統(tǒng)計量用關(guān)鍵詞表示: N、mean、std、min、max、Nmiss、range、sum、var、uss、css、cv、stderr、t、prt、sumwgt、skewness、krutosis、clm、lclm、uclm等,其中前五個統(tǒng)計量為缺省時的值.要得到這些統(tǒng)計量,只需給出相關(guān)的關(guān)鍵詞即可.這此關(guān)鍵詞亦可用于OUTPUT語句中。clm是計算置信上限和下限;lclm計算置信下限;uclm計算置信上限。第97頁/共129頁MEANS過程的格式及語句說明 2.語句說明 VAR 變量表 規(guī)定要進行計算的數(shù)值變量及順序
10、。該語句缺省時,除由BY、CLASS、FREQ和WEIGHT指定的變量外,其余的數(shù)值變量均進行計算。 BY 變量表 根據(jù)BY后指定的變量表形成多個觀測組,然后對每組分別計算相應(yīng)的統(tǒng)計量,不過在使用該語句之前,應(yīng)對BY后面指定的變量表進行過排序。 CLASS 變量表 此語句的作用與BY語句類似,其不同之處是它不要求事先對CLASS的變量表進行排序,且在輸出時,按CLASS變量的不同取值,以單頁輸出。 第98頁/共129頁MEANS過程的格式及語句說明 2.語句說明 FREQ 變量 指定其后的變量代表的是頻數(shù),此語句當數(shù)據(jù)集是頻數(shù)表資料時才使用。 用ID后面指定的變量表的值來標識輸出的觀測。 ID
11、 變量表 指定其后的變量代表權(quán)重。該變量的值應(yīng)大于零,若某值小于零或缺失,則取該值為0。 WEIGHT 變量 例如,設(shè)變量X,其一組觀測值為 ,用WEIGHT語句規(guī)定權(quán)重變量為W,相應(yīng)的值為 ,( ), 則加權(quán)均值 和加權(quán)方差 為: ,其中除數(shù)由任選項VARDEF=確定。 nxxx,.,21nwww,.,210iwwxws2niiniiiwwxwx11/niiiwdxxws122/)(第99頁/共129頁MEANS過程的格式及語句說明 2.語句說明 該語句將結(jié)果輸出到某SAS數(shù)據(jù)集,其中OUT=SAS數(shù)據(jù)集指明將結(jié)果保存的數(shù)據(jù)集,若要創(chuàng)建永久數(shù)據(jù)集則要用兩級命名。統(tǒng)計量關(guān)鍵詞見選擇項中的說明
12、OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計量關(guān)鍵詞=變量名表 規(guī)定統(tǒng)計量并命名的形式有以下三種: OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計量關(guān)鍵詞=變量名表 關(guān)鍵詞=;或關(guān)鍵詞(變量表)=;表示輸出的數(shù)據(jù)集中計算由關(guān)鍵詞指定的 統(tǒng)計量,其名字仍為原變量名。前者要計算的變量和順序由VAR語句指 定,而后者則由關(guān)鍵詞括號中的變量表指定。關(guān)鍵詞=名字列表;表示輸出的統(tǒng)計量的名字為等號右邊的名字列表指定, 計算的變量和順序也是由VAR語句指定。關(guān)鍵詞(變量表)=名字列表;這結(jié)合前面兩者的優(yōu)點,既可控制要計算的 變量及順序,也可按自已的要求給計算的統(tǒng)計量取名字。 第100頁/共129頁MEANS過程的格式
13、及語句說明 3.例子 對120個爐鋼中的SI含量進行檢驗,得數(shù)據(jù)如下:0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.81 0.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.780.82 0.75 0.78 0.79 0.80 0.85 0.81 0.78 0.87 0.74 0.81 0.710.77 0.88 0.78 0.82 0.77 0.76 0.78 0.85 0.77 0.73 0.77 0.780.77 0.81 0.71 0.79 0.95 0.7
14、7 0.78 0.78 0.81 0.81 0.79 0.870.80 0.83 0.77 0.65 0.76 0.64 0.82 0.78 0.80 0.75 0.82 0.820.84 0.80 0.79 0.80 0.90 0.77 0.82 0.81 0.79 0.75 0.82 0.830.79 0.90 0.86 0.80 0.76 0.85 0.78 0.81 0.83 0.77 0.75 0.780.82 0.82 0.78 0.84 0.73 0.85 0.83 0.84 0.81 0.82 0.81 0.850.83 0.84 0.89 0.82 0.81 0.85 0.8
15、6 0.84 0.82 0.78 0.82 0.78給出這組數(shù)據(jù)的描述統(tǒng)計量,樣本均值,樣本方差,標準差,標準誤差,極差,變異系數(shù),偏度系數(shù),峰度系數(shù)等 第101頁/共129頁MEANS過程的格式及語句說明 3.例子 data stat;input x;cards;0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.810.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.780.82 0.75 0.78 0.79 0.80 0.85 0.81 0.78 0.87 0.74
16、 0.81 0.710.77 0.88 0.78 0.82 0.77 0.76 0.78 0.85 0.77 0.73 0.77 0.780.77 0.81 0.71 0.79 0.95 0.77 0.78 0.78 0.81 0.81 0.79 0.870.80 0.83 0.77 0.65 0.76 0.64 0.82 0.78 0.80 0.75 0.82 0.820.84 0.80 0.79 0.80 0.90 0.77 0.82 0.81 0.79 0.75 0.82 0.830.79 0.90 0.86 0.80 0.76 0.85 0.78 0.81 0.83 0.77 0.75
17、 0.780.82 0.82 0.78 0.84 0.73 0.85 0.83 0.84 0.81 0.82 0.81 0.850.83 0.84 0.89 0.82 0.81 0.85 0.86 0.84 0.82 0.78 0.82 0.78;proc means data=stat mean var std stderr range cv skewness kurtosis;var x;run;演示第102頁/共129頁univariate過程UNIVARIATE過程與MEANS過程一樣,能計算各種描述統(tǒng)計量,但它的功能比MEANS過程還要強大,除了可完成MEANS過程的基本統(tǒng)計量的計算
18、外,還能計算眾數(shù)和分位數(shù),生成頻率表,以及進行正態(tài)性檢驗和繪制正態(tài)概率圖、莖葉圖和盒形圖等方面的功能(關(guān)于這部分的功能下章再說明)。 第103頁/共129頁Univariate過程的格式及語句說明1.格式PROC UNIVARIATE 選擇項; VAR 變量表; BY 變量表; FREQ 變量; WEIGHT 變量; ID 變量表; OUTPUT OUT=輸出數(shù)據(jù)集 統(tǒng)計量關(guān)鍵詞=變量名表 必需的語句可選語句univariate過程UNIVARIATE過程與MEANS過程一樣,能計算各種描述統(tǒng)計量,但它的功能比MEANS過程還要強大,除了可完成MEANS過程的基本統(tǒng)計量的計算外,還能計算眾數(shù)和
19、分位數(shù),生成頻率表,以及進行正態(tài)性檢驗和繪制正態(tài)概率圖、莖葉圖和盒形圖等方面的功能(關(guān)于這部分的功能以后再說明)。 第104頁/共129頁Univariate過程的格式及語句說明2.語句說明選擇項常用的幾個選項如下:DATA=數(shù)據(jù)集 給出要計算的目標數(shù)據(jù)集NOPRINT 要求不在OUTPUT窗中輸出.PLOT 給出三種圖形:莖葉圖、盒式圖、正態(tài)概率圖。FREQ 給出頻數(shù)分布表,表中包括變量值、頻數(shù)、百分數(shù)、累計百分數(shù)等項;NORMAL 進行正態(tài)性檢驗,檢驗的原假設(shè)是:數(shù)據(jù)來自正態(tài)總體。VARDEF=DF | WGT | N | WDF 規(guī)定計算方差的除數(shù)OUTPUT語句 OUTPUT語句建立包
20、括UNIVARIATE過程分析結(jié)果的輸出數(shù)據(jù)集,其格式與MEANS過程的格式相同,但該語句必須與VAR語句聯(lián)用。 第105頁/共129頁Univariate過程的格式及語句說明2.語句說明OUTPUT語句 下面列出其統(tǒng)計關(guān)鍵詞 (1)系統(tǒng)給出的統(tǒng)計關(guān)鍵詞 N、NOBS、NMISS、MEAN、STDERR、SUM、STD、VAR、CV、USS、CSS、MAX、MIN、RANGE、SKEWNESS、KURTOSIS、SUMWGT、MODE、T、PRT。 百分位數(shù)關(guān)鍵字: Q3 上四分位數(shù)(第75百分位數(shù)) Q1 下四分位數(shù)(第25百分位數(shù)) QRANGE Q3-Q1四分位距 MEDIAN 中位數(shù)(
21、第50百分位數(shù)) P1 第1百分位數(shù), P5 第5百分位數(shù), P10 第10百分位數(shù) P90 第90百分位數(shù), P95 第95百分位數(shù) , P99 第99百分位數(shù)其它:SIGNRANK 符號秩統(tǒng)計量; PROBS 大于中心的符號統(tǒng)計量的絕對值的概率MSIGN 符號統(tǒng)計量; PROBM 大于符號秩統(tǒng)計量的絕對值的概率NORMAL 正態(tài)檢驗統(tǒng)計量(W、ProbD)。PROBN 檢驗數(shù)據(jù)來自正態(tài)分布假設(shè)的概率值。 第106頁/共129頁Univariate過程的格式及語句說明OUTPUT語句 下面列出其統(tǒng)計關(guān)鍵詞 (2)自定義分位數(shù)的選項 PCTLPTS=百分位數(shù)值表 如PCTLPTS=55 66.
22、7 即要求計算第55、和第66.7百分位數(shù)。若不指定這2個百分位數(shù)的變量名,則系統(tǒng)會自動地給出其變量名分別為55、和66_7。小數(shù)點用“_代替,若指定的百分位數(shù)有兩位小數(shù),給出的變量名截成一位 PCTLNAME=后綴名列表 給出要輸出的百分位數(shù)變量名的后綴 PCTLPRE=前綴名列表 給出要輸出的百分位數(shù)變量名的字頭 自定義的百分位數(shù)的名字由定義的變量前綴和后綴確定或缺省名連接起來形成。以上三項常聯(lián)合起來使用,其效果見下例:PROC UNIVARIATE; VAR X Y Z; OUTPUT OUT=TESTOUT PCTLPTS=55 66.7 PCTLPRE=A B C PCTLNAME=
23、P55 P66_7; run;第107頁/共129頁Univariate過程的格式及語句說明2.語句說明OUTPUT語句 下面列出其統(tǒng)計關(guān)鍵詞 (2)自定義分位數(shù)的選項 此例中要求給出由VAR語句中規(guī)定的三個變量X,Y,Z的第55%和66.7%百分位數(shù),則在輸出數(shù)據(jù)集中產(chǎn)生的變量AP55 AP66_7表示X的第55和66.7百分位數(shù); 變量BP55,BP66_7表示Y的第55和66.7百分位數(shù);變量CP55 CP66_7表示Z的第55 66.7百分位數(shù)。 3.例子例 數(shù)據(jù)同上例,下面我們用UNIVARIATE過程給出另外的幾個描述性統(tǒng)計量,中位數(shù),眾數(shù),上四分位數(shù),下四分位數(shù),四分位距 pro
24、c univariate data=stat;var x;run; 第108頁/共129頁Univariate過程的格式及語句說明3.例子輸出結(jié)果為:Univariate ProcedureVariable=X Moments (I)N120Sum Wgts120Mean0.80275Sum96.33Std Dev0.044777Variance 0.002005Skewness-0.33182Kurtosis2.287141USS77.5675CSS0.238593CV5.57795Std Mean 0.004088T:Mean=0196.3885Pr|T|0.0001Num =0 120N
25、um0120M(Sign)60Pr=|M|0.0001Sgn Rank3630Pr=|S|0.0001第109頁/共129頁Univariate過程的格式及語句說明輸出結(jié)果為: Quantiles(Def=5) (II) 100% Max 0.95 99% 0.9 75% Q3 0.83 95% 0.87 50% Med 0.81 90% 0.85 25% Q1 0.78 10% 0.75 0% Min 0.64 5% 0.735 1% 0.65 極差 0.31 Q3-Q1 0.05 眾數(shù) 0.78 Extremes(III) Lowest Obs Highest Obs 0 . 6 4 (
26、6 6 ) 0.88( 38) 0 . 6 5 ( 6 4 ) 0.89( 111) 0.71( 51) 0.9( 77) 0.71( 36) 0.9( 86) 0 . 7 3 ( 1 0 1 ) 0.95( 53) 第110頁/共129頁Univariate過程的格式及語句說明N:觀測的個數(shù)Sum Wgts:觀測的加權(quán)和Mean:均值 Sum:觀測值的總和Std Dev:標準差 Variance:方差Skewness:偏度 Kurtosis:峰度USS:觀測值平方和 CSS:離均差平方和CV:變異系數(shù) Std Mean:標準誤差(即均值的標準差)T:Mean=0:均值為0的假設(shè)下的T值 Pr
27、|T|:大于T絕對值的概率Num =0:非零觀測的個數(shù) Num0:觀測值中大于零的個數(shù)M(Sign):中位數(shù)為0的假設(shè)下符號統(tǒng)計量M的值 Pr=|M|:不小于M絕對值的概率Sgn Rank:中位數(shù)為0的假設(shè)下符號秩和統(tǒng)計量S的值 Pr=|S|:不小于S絕對值的概率。*W:Normal:正態(tài)性檢驗統(tǒng)計量W的值 PrF 0.0001表明y與x1,x2,x3,x4之間的線性關(guān)系成立參數(shù)檢驗:(結(jié)果表明每個參數(shù)均不顯著)Variable Prob |T|INTERCEP 0.891X1 2.083X2 0.705X3 0.135X4 -0.203結(jié)論:可能存在多重共線性第115頁/共129頁回 歸 分
28、 析 多元線性回歸proc reg data=hald;model y=x1-x4/ vif collin;run; VarianceVariable InflationINTERCEP 0.00000000X1 38.49621149X2 254.42316585X3 46.86838633X4 282.51286479 X4的方差膨脹因子達282.51286479,可認為這四個變量間存在嚴重的多重共線性關(guān)系 第116頁/共129頁回 歸 分 析 多元線性回歸 Collinearity Diagnostics Condition Var Prop Var Prop Var Prop Var
29、Prop Var PropNumber Eigenvalue Index INTERCEP X1 X2 X3 X41 4.11970 1.00000 0.0000 0.0004 0.0000 0.0002 0.00002 0.55389 2.72721 0.0000 0.0100 0.0000 0.0027 0.00013 0.28870 3.77753 0.0000 0.0006 0.0003 0.0016 0.00174 0.03764 10.46207 0.0001 0.0574 0.0028 0.0457 0.00095 0.0000661 249.57825 0.9999 0.931
30、6 0.9969 0.9498 0.9973最大的條件指數(shù)為249.57825,介于100到1000之間,表明這些變量間存在中等程度的多重共線性關(guān)系。 從方差比例來看,對應(yīng)最大條件指數(shù)的那一行,其方差比例最小的是變量X1,其值為0.9316,比0.5大,表明這四個變量就是一個共線性組。 第117頁/共129頁回 歸 分 析 多元線性回歸選擇變量法 逐步回歸法proc reg data=hald; model y=x1-x4/selection=stepwise; run; All variables left in the model are significant at the 0.1500
31、 level.No other variable met the 0.1500 significance level for entry into the model. Summary of Stepwise Procedure for Dependent Variable Y Variable Number Partial ModelStep Entered Removed In R*2 R*2 C(p) F ProbF 1 X4 1 0.6745 0.6745 138.7308 22.7985 0.0006 2 X1 2 0.2979 0.9725 5.4959 108.2239 0.00
32、01 3 X2 3 0.0099 0.9823 3.0182 5.0259 0.0517 4 X4 2 0.0037 0.9787 2.6782 1.8633 0.2054可以看出,逐步回歸法第一步是選進變量X4,在第二、三兩步選入變量X1和X2后,變量X4的作用變得不明顯,故第四步將X4從模型中刪除掉。故用此法所選的變量為X1和X2 第118頁/共129頁回 歸 分 析 多元線性回歸選擇變量法 全子集法proc reg data=hald;model y=x1-x4/selection=adjrsq cp bic;run;In AdjRsq C(p) BIC Variables in Mod
33、el 1 0.6450 138.7 55.54 X4 1 0.6359 142.5 55.85 X2 1 0.4916 202.5 60.00 X1 1 0.2210 315.2 65.39 X3- 2 0.9744 2.678 29.24 X1 X2 2 0.9670 5.496 30.98 X1 X4 2 0.9223 22.37 37.89 X3 X4 2 0.8164 62.44 46.84 X2 X3 2 0.6161 138.2 55.51 X2 X4 2 0.4578 198.1 59.74 X1 X3- 3 0.9764 3.018 31.17 X1 X2 X4 3 0.976
34、4 3.041 31.18 X1 X2 X3 3 0.9750 3.497 31.41 X1 X3 X4 3 0.9638 7.337 33.00 X2 X3 X4- 4 0.9736 5.000 34.41 X1 X2 X3 X4-Cp原則比較準確得到相應(yīng)的回歸方程為: y=52.577349+1.468306X1+0.66225X2第119頁/共129頁回 歸 分 析 多元線性回歸2 線性回歸2.6 綜合實例選擇變量法 全子集法In AdjRsq C(p) BIC Variables in Model 1 0.6450 138.7 55.54 X4 1 0.6359 142.5 55.85
35、 X2 1 0.4916 202.5 60.00 X1 1 0.2210 315.2 65.39 X3- 2 0.9744 2.678 29.24 X1 X2 2 0.9670 5.496 30.98 X1 X4 2 0.9223 22.37 37.89 X3 X4 2 0.8164 62.44 46.84 X2 X3 2 0.6161 138.2 55.51 X2 X4 2 0.4578 198.1 59.74 X1 X3- 3 0.9764 3.018 31.17 X1 X2 X4 3 0.9764 3.041 31.18 X1 X2 X3 3 0.9750 3.497 31.41 X1
36、X3 X4 3 0.9638 7.337 33.00 X2 X3 X4- 4 0.9736 5.000 34.41 X1 X2 X3 X4-Cp原則比較準確得到相應(yīng)的回歸方程為: y=52.577349+1.468306X1+0.66225X2第120頁/共129頁回 歸 分 析 多元線性回歸嶺回歸法 proc reg data=hald outest=rghald outvif graphics corr; model y=x1-x4/ridge=0 to 1 by 0.1 2 3 4 5 6 ; plot/ridgeplot;run;proc print data=rghald;run;其
37、中outest=rghald要求REG過程將結(jié)果保存在rghald數(shù)據(jù)集中,選項outvif要求輸出方差膨脹因子,選項graphics要求在高分辨率方式下作圖, corr則要求計算相關(guān)系數(shù)。MODEL語句后面ridge=0 to 1 by 0.1 2 3 4 5 6給出嶺回歸中的k值,共計有16個。plot語句后面加上參數(shù)ridgeplot,要求作出嶺跡圖。 第121頁/共129頁回 歸 分 析 多元線性回歸嶺回歸法 可取k=0.2的嶺回歸估計,得到如下嶺回歸模型:y=87.7519+0.9788X1+0.289X2-0.3268X3-0.324X4 第122頁/共129頁回 歸 分 析 多元
38、線性回歸主成分回歸法 proc reg data=ff.hald outest=pchald outvif;model y=x1-x4/pcomit=1,2 ;run;proc print data=pchald;run;選項pcomit=1,2表示分別求出在刪除最后1個和2個主成分后所得到的回歸方程 第123頁/共129頁回 歸 分 析 多元線性回歸主成分回歸法 數(shù)據(jù)集pchald中關(guān)于主成分回歸的輸出為 OBS _MODEL_ _TYPE_ _DEPVAR_ _RIDGE_ _PCOMIT_ _RMSE_1 MODEL1 PARMS Y . . 2.446012 MODEL1 IPCVIF
39、 Y . 1 .3 MODEL1 IPC Y . 1 1 2.322064 MODEL1 IPCVIF Y . 2 .5 MODEL1 IPC Y . 2 2 3.08195OBS INTERCEP X1 X2 X3 X4 Y1 62.4054 1.55110 0.51017 0.10191 -0.14406 -12 . 2.71096 0.78071 2.48086 0.46813 -13 85.7433 1.31189 0.26942 -0.14277 -0.3800785.7433 1.31189 0.26942 -0.14277 -0.38007 -14 . 0.26570 0.25093 0.30167 0.26348 -15 88.9559 0.78884 0.36145 -0.59624 -0.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商丘工學院《織物產(chǎn)品結(jié)構(gòu)與工藝(二)》2023-2024學年第一學期期末試卷
- 汕尾職業(yè)技術(shù)學院《運動療法技術(shù)學1》2023-2024學年第一學期期末試卷
- 收取合作公司禮品合同范例
- 汕頭大學《染織工藝基礎(chǔ)》2023-2024學年第一學期期末試卷
- 出售學校學區(qū)房合同范例
- 2024至2030年耐火材料干片項目投資價值分析報告
- 2024至2030年硝酸鉀項目投資價值分析報告
- 租賃男友合同范例
- 電箱購銷合同范例
- 2024至2030年冰雪玻璃項目投資價值分析報告
- 會計學原理智慧樹知到期末考試答案2024年
- 《血站業(yè)務(wù)場所建設(shè)指南 第3部分:獻血屋》
- 安寧護理個案
- (2024年)計算機安全培訓
- 城市地理學智慧樹知到期末考試答案2024年
- 項目撤銷方案
- 20220226【案例分享】鋁加工行業(yè)SAP解決方案
- 異地辦公與遠程團隊管理
- JB T 3929-2008通用懸掛輸送機
- 銀行輿情管理培訓課件
- 抖音小店數(shù)據(jù)分析怎么做
評論
0/150
提交評論