sas大賽第三題_第1頁(yè)
sas大賽第三題_第2頁(yè)
sas大賽第三題_第3頁(yè)
sas大賽第三題_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、題目:數(shù)據(jù)集timeser_com中存放著某地區(qū)每個(gè)電信基站的通話時(shí)長(zhǎng)和短信包信息。date代表時(shí)間變量,Cell代表基站編碼,tcherl和sms分別代表通話和短信量。問(wèn)題如下:(1)根據(jù)date創(chuàng)建時(shí)間變量date_new;(2)清理數(shù)據(jù),根據(jù)CELL和date_new變量剔除重復(fù)記錄,對(duì)tcherl和sms使用三次樣條曲線進(jìn)行插值;(3)ARIMA過(guò)程步識(shí)ARIMA(p,d,q)滯后階數(shù)并簡(jiǎn)要說(shuō)明確定該模型的原因(提示:通過(guò)單位根檢驗(yàn)檢驗(yàn)差分階數(shù)的合理性);(4)估計(jì)得到的模型系數(shù),對(duì)每個(gè)基站的tcherl和sms兩個(gè)變量進(jìn)行向前30步的預(yù)測(cè)數(shù)據(jù)。解答:(1) 程序:data times

2、e; set voice; date_new= input(put(date,8.),yynndd8.) ; format date date9.; run;原數(shù)據(jù)集新建的date_new變量(2) 刪除重復(fù)記錄:程序:proc sort data = timese out = timese; by date cell; run; data times_new; set timese; by date cell; if first.cell then delete; run; 三次插值(考慮站點(diǎn)cell=D37C072)頻數(shù)分布情況:程序:proc freq data=times_new; t

3、able cell; run; D37C0631330.0498673.15D37C0712140.07100813.22D37C0722140.07102953.29D37C0732140.07105093.36D37C0811330.04106423.40D37C0821330.04107753.44D37C0831330.04109083.48三次插值:程序:proc iml; a = shape(1,226,1); create dates from acolname='date_new' append from a; run; quit; data dates; se

4、t dates; date_new= intnx('day','04may09'd,_n_-1) ; format date_new date9.; run; proc sql ; create table date_new as select date_new from dates where date_new not in (select date_new from date); run; data date_new; set date_new date; run; proc sort data=date_new; by date_new; run; pro

5、c expand data = date_new out=date_new2 method=spline; id date_new; run; 未插值前數(shù)據(jù): 插值之后:(3) 程序:proc gplot data=data_f; plot tcherl*time; symbol color=red L=1 i=spline; run; Tcherl*time;程序:proc arima data=data_f; identify var=tcherl; run; data data_f; set data_f; z=dif(tcherl); run; 可以看出自相關(guān)函數(shù)出現(xiàn)緩慢衰減,而且后面

6、的值并沒(méi)有在兩倍標(biāo)準(zhǔn)誤差的范圍內(nèi)所以不認(rèn)為它是平穩(wěn)的序列從偏自相關(guān)函數(shù)可以看出7階截?cái)?,P<<<0.05,拒絕原假設(shè),所以認(rèn)為它是非白噪聲序列,即對(duì)序列建模是有意義的??梢园l(fā)現(xiàn)AR6,MA6的值3.687501最小,ARMA(6,6)的BIC信息量最小,所以選擇ARMA(5,6)模型擬合原序列由于是非平穩(wěn)的 所以做一階差分程序:data data_f; set data_f; z=dif(tcherl); run; proc gplot data=data_f; plot tcherl*time=1 z*time=2/overlay; symbol1 c=red l=1 i=

7、spline; symbol2 c=green l=1 i=spline; run; 程序:proc arima data=data_f; identify var=tcherl(1); run;、檢驗(yàn)其自相關(guān)函數(shù),偏自相關(guān)函數(shù)、發(fā)現(xiàn)自相關(guān)函數(shù)下降的很快,很快接近于零,而且lag=3后面的值基本落在2倍標(biāo)準(zhǔn)誤差里面,所以可以認(rèn)為是平穩(wěn)的。而且是非白噪聲序列Proc arima data_f;Identify var=tcherl stationarity=(adf=1);run;ADF檢驗(yàn)中,三個(gè)模型只要有一個(gè)拒絕原假設(shè),就可以認(rèn)為序列式平穩(wěn)的;顯然后面兩個(gè)模型,P值<0.05拒絕原假設(shè)

8、,所以序列式平穩(wěn)的proc arima data=data_f; identify var=tcherl(1) minic p=(0:6) q=(0:6); estimate p=6 method=cls; forecast lead=30 id=time out=result; run; 然后對(duì)模型參數(shù)進(jìn)行最小二乘估計(jì):發(fā)現(xiàn)這些參數(shù)是顯著的。然后對(duì)殘差序列進(jìn)行分析很顯然在lag=18之前,p>0.05,所以殘差序列是白噪聲序列,說(shuō)明模型提取信息是充分的。即ARIMA(6,1,0)是適應(yīng)的。最后寫(xiě)出這個(gè)模型:程序: proc arima data=data_f; identify var=tcherl(1) minic p=(0:6) q=(0:6); estimate p=6 method=cls; forecast lead=30 id=time out=result; run; 程序:proc gplot data=resul

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論