




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第八講:sas數(shù)據(jù)處理夏敏2016.10生成一個(gè)數(shù)據(jù)集,記錄發(fā)送失敗的和發(fā)送延遲的;包括ID、目標(biāo)郵箱、發(fā)送狀態(tài);結(jié)果按照id排序作業(yè)分析郵件的日志文件,要求:1、生成一個(gè)數(shù)據(jù)集,該數(shù)據(jù)集包括ID、目標(biāo)郵箱2、生成一個(gè)數(shù)據(jù)集,包括ID、發(fā)送狀態(tài)、反饋信息;3、生成一個(gè)數(shù)據(jù)集,包括ID、發(fā)送狀態(tài)、反饋信息(去掉顯示發(fā)送信息的行,并把狀態(tài)是success的,如果有ip地址則顯示ip地址,如果沒(méi)有IP地址則清空反饋信息)4、生成一個(gè)數(shù)據(jù)集,記錄發(fā)送失敗的,并且只提取最后一次記錄;包括ID、目標(biāo)郵箱、發(fā)送狀態(tài)、反饋信息5、生成一個(gè)數(shù)據(jù)集,記錄發(fā)送延遲的,并且只提取最后一次記錄;包括ID、目標(biāo)郵箱、發(fā)送狀態(tài)、反饋信息作業(yè)1、2input@'startingdelivery'id4.@'toremote'email:$50.;input@'delivery'id4.@':'status:$msg&$400.;MsgSuccess:Deferral:Failure:ifindex(status,":")>0thenstatus=substr(status,1,length(status)-1);//另一種思路:指針回跳一列,讀取字符,判斷是否是:作業(yè)3ifstatuseq“msg”thendelete;//結(jié)果中不會(huì)出現(xiàn)msg的行對(duì)于deferral和failure的行輸出完整的反饋信息對(duì)于success行ifstatuseq“success”andindex(msg,".")>0thenMsg=substr(msg,1,16);elsemsg="";//ip最大15位,最小9位;并且后面的字符是_accepted,所以先去16Msg=subsstr(msg,1,index(msg,”_")-1)或者使用find()函數(shù)直接匹配accepted這個(gè)字符串或者:ifindex(message,"did_1+0+0/")>0thenmsg="";作業(yè)4、5第一個(gè)和第三個(gè)數(shù)據(jù)集合并procsortdata=aa;byid;procsortdata=cc;byid;Datax_merge;mergeaacc;byemailid;作業(yè)4、5ifemail=“”thendelete;//把目標(biāo)郵箱地址為空的行刪除ifstatus=”success“thendelete;//把狀態(tài)為success的行刪除procsortdata=x_merge;//新數(shù)據(jù)集先按照郵箱地址進(jìn)行排序,當(dāng)郵箱地址相同時(shí)再按照id排序byemailid;作業(yè)4、5Datafailure;Setx_merge;//導(dǎo)入合并的數(shù)據(jù)集byemail;//按email進(jìn)行分組,然后取每組中的最后一條記錄,
iflast.emailandstatus”failure”thenoutput;//如果遇到email組最后一條記錄就輸出到last_email數(shù)據(jù)集run;
procprint;
optionslinesize=256;
run;數(shù)據(jù)分析-建模數(shù)據(jù)建模描述性統(tǒng)計(jì)量均值最大值、最小值計(jì)數(shù)求和方差、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤變異系數(shù)極差校正平方和、非校正平方和偏斜度、峰度分位數(shù)函數(shù)卡方分布正太分布分位數(shù)F分布分位數(shù)T分布分位數(shù)。。。隨機(jī)數(shù)函數(shù)正太分布均勻分布二項(xiàng)分布柏松分布貝塔分布幾何分布極值分布指數(shù)分布Means過(guò)程Means過(guò)程是對(duì)觀測(cè)值進(jìn)行列的操作Sas統(tǒng)計(jì)描述中的函數(shù)是對(duì)行的操作Means過(guò)程Libnameaa“d:\temp”;Procmeansdata=aa.scoremaxdec=3;//缺省是2Vart1-t3;/要處理的變量Classclas;//按照clas進(jìn)行分組Byclas;Procmeansmaxdec=3;Byclas;vart1-t3;Run;//輸出結(jié)果:是缺省狀態(tài),包括計(jì)數(shù)、均值、標(biāo)準(zhǔn)差、最小值、最大值Means過(guò)程Libnameaa“d:\temp”;Procmeansdata=aa.score把統(tǒng)計(jì)量寫(xiě)在此處
maxdec=3;//缺省是2Vart1-t3;/要處理的變量Classclas;//按照clas進(jìn)行分組Procsortdata=aa.score;Byclas;Procmeansmaxdec=3;Byclas;vart1-t3;Run;//Classclas;與byclas的區(qū)別是后者必須先用sort排序Weight語(yǔ)句指定觀測(cè)值的權(quán)重如果變量為缺失值或是0,則該觀測(cè)被剔除Freq語(yǔ)句頻率指定觀測(cè)值出現(xiàn)的頻率,如果指定的值不是整數(shù),將自動(dòng)取整。如果指定的值小于1,則觀測(cè)值不會(huì)被計(jì)算SexagenumberF2010f1820M2023m2019Procmens;Varage;Bysex;Run;SexagenumberF2010f1820M2023m2019Procmens;Freqnumber;Varage;Bysex;Run;Freq語(yǔ)句Freq過(guò)程產(chǎn)生一維至n維的頻數(shù)表和列聯(lián)表以總計(jì)百分比和數(shù)據(jù)計(jì)數(shù)的形式表示變量值的分布Output語(yǔ)句與data數(shù)據(jù)步中的output不同Varac;Outputout=aaMEAN=mamcSTD=sasc;MEAN=mamc//表示求得變量ac的平均值的列名用mamc表示STD=sasc//表示求得變量ac的標(biāo)準(zhǔn)差的列名用sasc表示制作制表與畫(huà)圖Table語(yǔ)句制表,不僅僅是制表,還包含了統(tǒng)計(jì)量的計(jì)算Tabulate過(guò)程Datatest;Inputxy@@;Datalines;123343876308630958;Proctabulate;Classxy;Tablex*y;Run;生成的表格中x為控制維度,y為子維度Tablexy;//按照xy兩個(gè)變量生成相對(duì)獨(dú)立的Tablex*yz;Tablex*(yz);如果行很寬,通過(guò)optionslinesize=’1000’;Tabulate過(guò)程*表示控制空格表示相互獨(dú)立上面都是列維度上,表示分為行維度和列維度Tablex,y*z;//x表示的是行維度Univ
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZSM 0052-2024“領(lǐng)跑者”評(píng)價(jià)技術(shù)要求 普通型立式帶鋸床
- T-ZSA 227-2024 低慢小無(wú)人駕駛航空器車(chē)載式預(yù)警處置系統(tǒng)
- 2025年度村級(jí)林業(yè)資源監(jiān)測(cè)村級(jí)護(hù)林員職責(zé)合同
- 2025年度美甲服務(wù)連鎖品牌合作協(xié)議
- 二零二五年度汽車(chē)維修保養(yǎng)抵押借款合同
- 2025年度美發(fā)店員工勞動(dòng)合同及員工福利政策
- 二零二五年度個(gè)人心理咨詢(xún)服務(wù)合同
- 2025年度消防車(chē)輛抵押借款合同范本
- 二零二五年度直播平臺(tái)用戶(hù)行為數(shù)據(jù)分析合同
- 2025年度石材石材加工定制采購(gòu)協(xié)議
- 2025年黑龍江林業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)含答案
- 2025年01月吉林白山市長(zhǎng)白朝鮮族自治縣事業(yè)單位公開(kāi)招聘工作人員(含專(zhuān)項(xiàng))和邊境村穩(wěn)邊固邊工作專(zhuān)干84人(1號(hào))筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 課題申報(bào)參考:產(chǎn)教融合背景下護(hù)理專(zhuān)業(yè)技能人才“崗課賽證”融通路徑研究
- 2025年四川省阿壩州小金縣面向縣外考調(diào)事業(yè)單位人員13人歷年高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 北京市東城區(qū)2024-2025學(xué)年高三(上)期末思想政治試卷(含答案)
- 1.2 男生女生 課件 -2024-2025學(xué)年統(tǒng)編版道德與法治七年級(jí)下冊(cè)
- 19S406建筑排水管道安裝-塑料管道
- 三、QHLY系列——露頂式弧形門(mén)閘門(mén)液壓?jiǎn)㈤]機(jī)
- 《病毒性肝炎》課件.ppt
- UCP600中英文對(duì)照版
- 泄露檢測(cè)負(fù)壓波檢漏
評(píng)論
0/150
提交評(píng)論