下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、桂林電子科技大學(xué)(dxu) 數(shù)學(xué)與計(jì)算(j sun)科學(xué)學(xué)院實(shí)驗(yàn)報(bào)告院系數(shù)學(xué)與計(jì)算科學(xué)學(xué)院學(xué)號(hào)姓名成績(jī)課程名稱多元統(tǒng)計(jì)分析實(shí)驗(yàn)實(shí)驗(yàn)項(xiàng)目名 稱實(shí)驗(yàn)一SAS軟件應(yīng)用基礎(chǔ)一 ,實(shí)驗(yàn)?zāi)康牧私釹AS程序結(jié)構(gòu)及SAS8.0的使用方法。掌握使用DATA步建立SAS數(shù)據(jù)集的方法。3. 掌握使用Means、Univariate等PROC步進(jìn)行描述性統(tǒng)計(jì)分析。二,實(shí)驗(yàn)原理對(duì)于樣本容量為n的一個(gè)樣本:有如下概念:均值(Mean):方差(Var):標(biāo)準(zhǔn)差(Std):變異系數(shù)(CV):偏度(SKEWNESS):峰度(KURTOSIS):中位數(shù)(MEDIUM):分位數(shù):上四分位數(shù):下四分位數(shù):三均值:極差(RANGE)
2、Proc 步具有大致相同的程序結(jié)構(gòu):PROC 過程名 ;Var variables;Run;其中:option(s):Data = 要分析的數(shù)據(jù)集(缺省為最新建立的數(shù)據(jù)集);variables:要進(jìn)行統(tǒng)計(jì)分析的變量列表(缺省為數(shù)據(jù)集中的全部變量)(1)Proc means過程Proc means過程的完整語句:proc means options;by variables;var variables;output out=sas data set keyword=name.;data=sas data set:即在等號(hào)后指明所要分析的sas數(shù)據(jù)集名稱。若此項(xiàng)沒有,則sas系統(tǒng)對(duì)最新建立的數(shù)據(jù)集
3、作分析。MAXDEC=k:其中k為介于0與8之間的一個(gè)整數(shù),該項(xiàng)指明在輸出數(shù)據(jù)時(shí)小數(shù)點(diǎn)保留k位。Sas系統(tǒng)默認(rèn)值為k=2。關(guān)鍵詞:逐個(gè)列出要計(jì)算其值的統(tǒng)計(jì)量的名稱的關(guān)鍵詞,最常用的有以下幾個(gè)統(tǒng)計(jì)量:N 樣本容量 Mean 均值 Var 方差 STD 標(biāo)準(zhǔn)差 CV 變異系數(shù) Skewness 偏度 Kurtosis 峰度 Midian 中位數(shù) Q3 上四分位數(shù) Q1 下四分位數(shù) QRange 四分位極差 P1 第一百分位數(shù) P5 第五百分位數(shù) P10 第十百分為數(shù) P90 第九十百分為數(shù) P95 第九十五百分位數(shù) P99 第九十九百分位數(shù) Var variables;該語句是指出數(shù)據(jù)集中要計(jì)算簡(jiǎn)
4、單描述性統(tǒng)計(jì)量的變量名稱。若省略此句,則sas系統(tǒng)對(duì)數(shù)據(jù)集中所有數(shù)值變量均計(jì)算各自在前一句指定的那些描述性統(tǒng)計(jì)量的值。output out=sas data set keyword=name ;此句建立一個(gè)由proc means過程的分析結(jié)果構(gòu)成的sas數(shù)據(jù)集,以備進(jìn)一步分析之用。在“out=”后命令要建立的數(shù)據(jù)的名稱,但要想將此數(shù)據(jù)文件保留起來,就要建立一個(gè)永久性數(shù)據(jù)文件,需要用兩級(jí)名稱,如“RESULT.OUT”。(2)Proc Univariate過程主要語句形式如下:Proc Univariate options;Var variables;Output out=SAS data se
5、t keyword=name ;語句中“options”部分可以是下列內(nèi)容的部分或全部:data=數(shù)據(jù)集名:指明所要分析的數(shù)據(jù)集,若省略則表示分析最新生成的數(shù)據(jù)集。plot:要求對(duì)所分析的各變量的觀測(cè)值產(chǎn)生一個(gè)莖葉圖(或水平直方圖)、一個(gè)箱線圖和一個(gè)正態(tài)QQ圖。若某區(qū)間的觀測(cè)值超過48,則不繪制莖葉圖,而改繪制直方圖。在正態(tài)QQ圖中,以“*”表示正態(tài)QQ圖上的點(diǎn),以“+”表示相應(yīng)的參考直線。freq:要求生成包括變量值、頻數(shù)、百分?jǐn)?shù)和累計(jì)百分?jǐn)?shù)的表。normal:要求對(duì)分析的各變量的觀測(cè)值進(jìn)行正態(tài)性檢驗(yàn),并輸出相應(yīng)的p值。若樣本容量不超過2000則使用W統(tǒng)計(jì)量進(jìn)行檢驗(yàn);若樣本容量大于2000則
6、使用D統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。正態(tài)分布的均值和方差分別取樣本均值和樣本方差。proc univariate 選項(xiàng)串; /*選項(xiàng)包括data=輸入文件名 plot-產(chǎn)生三種圖:莖葉圖或平行條狀圖、盒形圖、常態(tài)概率圖freq-產(chǎn)生頻次分配表 normal-檢定數(shù)據(jù)是否符合正態(tài)分布 */ var 被執(zhí)行分析變量名串;/*被統(tǒng)計(jì)的變量*/ by 分組變量名串; /*須先用proc sort ; by 分組變量名串;通過 by 對(duì)變量的值排序(數(shù)值遞增字母升序)按序分組, 以組為單位求統(tǒng)計(jì)量, 因而不適用取值中文的變量。例如,若有分組變量名串sex(分male、female) month(分feb、jan),則
7、按sex 的二種情況: male、female 與month的二種情況: feb、jan 的四種交叉組合進(jìn)行分組統(tǒng)計(jì),univariate 沒有class 分組指令*/ freq 觀測(cè)值重復(fù)次數(shù)變量名; weight 權(quán)變量名; id 樣本識(shí)別變量名串; output out=統(tǒng)計(jì)值輸出文件名 統(tǒng)計(jì)量關(guān)鍵字串(各種統(tǒng)計(jì)值) =被要求變量名;/* 例.var x y;output out=文件名 mean=mx my std=sdy;輸出了變量x與y 的均值及y 的標(biāo)準(zhǔn)差* univariate 中可出現(xiàn)多次output 指令 */ 注:統(tǒng)計(jì)量關(guān)鍵字包括: n-觀察值個(gè)數(shù) nmiss-遺漏數(shù)據(jù)個(gè)
8、數(shù) mean-均值 std-標(biāo)準(zhǔn)差 min-最小值 max-最大值 range-極差 Q3-75%分位數(shù) Q1-25%分位數(shù) Qrange- Q3-Q1 mode-眾數(shù) median-中位數(shù) sum-觀測(cè)值總和 var-樣本方差s2 skewness-峰度 kurtosis-偏度 signsank-等級(jí)符號(hào)檢定法 normal-正態(tài)分布檢驗(yàn)三,實(shí)驗(yàn)內(nèi)容1.某校為了考察學(xué)生的學(xué)習(xí)情況,就從某年級(jí)隨機(jī)抽取12名學(xué)生5門課程期末考試的成績(jī),數(shù)據(jù)如下:序號(hào) 政治(X1) 語文(X2) 外語(X3) 數(shù)學(xué)(X4) 物理(X5)1 99 94 93 100 1002 99 88 96 99 973 100
9、 98 81 96 1004 93 88 88 99 965 100 91 72 96 786 90 78 82 75 977 75 73 88 97 898 93 84 83 68 889 87 73 60 76 8410 95 82 90 62 3911 76 72 43 67 7812 85 75 50 34 37請(qǐng)計(jì)算各門成績(jī)的均值、方差、標(biāo)準(zhǔn)差、變異系數(shù)、偏度、峰度 。2.學(xué)生管理數(shù)據(jù)庫(kù)中數(shù)據(jù)集如下:姓名出生日期年齡學(xué)號(hào)數(shù)學(xué)英語王紅1977-06-022298100129073李明1978-03-232198100048868徐凱歌1978-11-142198100349278吳青云
10、1978-04-122198100238984李清華1978-10-242198100248378張平江1978-12-232198100059678(1) 要求用菜單方式將上數(shù)據(jù)集建立成一個(gè)SAS數(shù)據(jù)集;(2)請(qǐng)計(jì)算數(shù)學(xué)成績(jī)的均值、方差、標(biāo)準(zhǔn)差、變異系數(shù)、偏度、峰度 。四,實(shí)驗(yàn)過程原始記錄(數(shù)據(jù),圖表,計(jì)算等)1.data s1;input n x1-x5;cards;1 99 94 93 100 1002 99 88 96 99 973 100 98 81 96 1004 93 88 88 99 965 100 91 72 96 786 90 78 82 75 977 75 73 88 97 898 93 84 83 68 889 87 73 60 76 8410 95 82 90 62 3911 76 72 43 67 7812 85 75 50 34 37;run;proc means data=s1 mean var std cv skew kurt;var x1-x5;run;結(jié)果:2.proc means data=s2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 雙十二數(shù)碼之路
- 農(nóng)業(yè)電商春節(jié)之道
- 2024年跨境電商物流解決方案合作合同
- 2024年版企業(yè)債務(wù)償還抵扣協(xié)議版B版
- 大巴用車合同(2篇)
- 2025年度餐廚廢棄物無害化處理與綜合利用合同3篇
- 2024年高壓開關(guān)設(shè)備安裝協(xié)議
- 專業(yè)化眼科義齒2024年加工服務(wù)協(xié)議模板版B版
- 2025年父母房產(chǎn)處置與子女就業(yè)支持協(xié)議3篇
- 2024某高校與某企業(yè)之間關(guān)于產(chǎn)學(xué)研合作之合作協(xié)議
- 工廠車間安全培訓(xùn)試題附答案(完整版)
- 專項(xiàng)11-三角形中角度計(jì)算-經(jīng)典小題(30道)
- 2024年航空職業(yè)技能鑒定考試-航空乘務(wù)員危險(xiǎn)品考試近5年真題附答案
- 強(qiáng)制執(zhí)行解除申請(qǐng)書模板
- 期末卷(一)(試題)-2024-2025學(xué)年五年級(jí)上冊(cè)語文統(tǒng)編版
- 第五單元《圓》(大單元教學(xué)設(shè)計(jì))-2024-2025學(xué)年六年級(jí)上冊(cè)數(shù)學(xué)人教版
- 商業(yè)道德和反腐敗制度
- 水利工程土方回填施工方案
- 中國(guó)工商銀行借款合同
- 宜昌市西陵區(qū)2024年數(shù)學(xué)六年級(jí)第一學(xué)期期末檢測(cè)試題含解析
- 飲水機(jī)維護(hù)服務(wù)協(xié)議書模板
評(píng)論
0/150
提交評(píng)論