應用統(tǒng)計分析實驗R軟件課件_第1頁
應用統(tǒng)計分析實驗R軟件課件_第2頁
應用統(tǒng)計分析實驗R軟件課件_第3頁
應用統(tǒng)計分析實驗R軟件課件_第4頁
應用統(tǒng)計分析實驗R軟件課件_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

應用統(tǒng)計分析實驗

——R軟件SPSS:這是一個很受歡迎的統(tǒng)計軟件容易操作,輸出漂亮,功能齊全,價格合理。對于非統(tǒng)計工作者是很好的選擇。Excel:嚴格說來不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計計算功能。多數(shù)裝Office時沒有裝數(shù)據(jù)分析的功能,畫圖功能都具備(雖然不好看)。對于簡單分析,Excel還算方便,但隨著問題的深入,就不那么“傻瓜”,需要很麻煩地使用函數(shù),甚至根本沒有相應的方法了。S-plus:這是統(tǒng)計學家喜愛的軟件。功能齊全,圖形漂亮有不斷加入的各個方向統(tǒng)計學家編寫的統(tǒng)計軟件包。也可以自己加入算法.強大而又方便的編程功能,使得研究人員可以編制自己的程序來實現(xiàn)自己的理論和方法。它也在進行“傻瓜化”以爭取顧客。但主要以其方便的編程為顧客所青睞。但是對于不會編程者,不那么“傻瓜”R軟件:免費的,志愿者管理的軟件。編程方便,語言靈活,圖形功能強大有不斷加入的各個方向統(tǒng)計學家編寫的統(tǒng)計軟件包。也可以自己加入自己算法的軟件包.這是發(fā)展最快的軟件,受到世界上統(tǒng)計師生的歡迎。是用戶量增加最快的統(tǒng)計軟件。對于一般非統(tǒng)計工作者來說,主要問題是它沒有“傻瓜化”。Minitab:這個軟件是很方便的功能強大而又齊全的軟件,也已經(jīng)“傻瓜化”,在我國用的不如SPSS與SAS那么普遍。Eviews:這是一個主要處理回歸和時間序列的軟件。GAUSS:這是一個很好用的統(tǒng)計軟件,許多搞經(jīng)濟的喜歡它。主要也是編程功能強大。目前在我國使用的人不多。MATLAB:這也是應用于各個領域的以編程為主的軟件,在工程上應用廣泛。但是統(tǒng)計方法不多。搞統(tǒng)計是否不需要學習編程語言,可以不學習,如果你…搞純粹數(shù)學推導的,只搞“理論”,不面對數(shù)據(jù),不用計算機覺得歲數(shù)太大,學不會“非傻瓜”的計算不想有創(chuàng)新,僅使用現(xiàn)成方法套用但如果你要創(chuàng)新…你需要反復試驗你的新方法需要用各種數(shù)據(jù)來檢驗你的新方法需要把你的方法和老方法進行比較需要介紹自己的新方法使用編程語言不可避免R軟件通過用戶自編程序,R語言很容易延伸和擴大.它就是這樣成長的.R是計算機編程語言.類似于UNIX語言,C語言,Pascal,Gauss語言等.對于熟練的編程者,它將覺得該語言比其他語言更熟悉.而對計算機初學者,學習R語言使得學習下一步的其他編程不那么困難.那些傻瓜軟件(SAS,SPSS等)語言的語法則完全不同.R的歷史S語言在1980年代后期在AT&T實驗室開發(fā).R項目由Auckland大學統(tǒng)計系的RobertGentleman和RossIhaka于1995年開始的.它很快得到廣泛用戶的歡迎.目前它是由R核心發(fā)展團隊維持;它是一個由志愿者組成的工作努力的國際團隊下載R軟件學習網(wǎng)站三.回歸分析四.判別分析五.聚類分析六.主成分分析基本語法1.變量使用即定義,變量名區(qū)分大小寫,可用中文命名變量賦值可采用4種形式:=,<-,->,assign()變量類型自動由變量賦值確定。#注釋符號,分號;語句連接符例子: a=10a<-1010->aassign(“a”,10) A=10A<-1010->Aassgin(‘a(chǎn)b’,200) 中國=“中華人民共和國”#生成字符串變量 assign(“中國”,“中華人民共和國”)a=10;A=10;a;A算術運算符:+,-,*,/,^(乘方),%%(模),%/%(整除)

3.常用的數(shù)學函數(shù)有:abs,sign,log,log2,

log10,sqrt,exp,sin,cos,tan,acos,asin,atan,cosh,sinh,tanh4.查看幫助,例如:help(round),?absz=1:5z[7]=8;z[1]12345NA8

#缺失數(shù)據(jù)NAz[c(1,3,5)]=1:3;z[1]12243NA8z[is.na(z)]=0#函數(shù)is.na()判斷數(shù)據(jù)是否缺失,將其為真的賦為0

z[z<3]#z中小于3的元素z[(length(z)-1):length(z)]#最后二個元素.z[-c(1,3)]#去掉第1、3元素.x=rnorm(10)

sort(x)order(x)2.矩陣(二維數(shù)組)及多維數(shù)組matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)byrow=TRUE以行序放置,(默認FALSW,以列序)array(data=NA,dim=c(),dimnames=)a=c(1,2,3,4,5,6,7,8,9,10)b=matrix(data=a,nrow=5,ncol=2,byrow=TRUE)c=array(data=1:12,dim=c(2,3,2))4.維數(shù)問題 dim()#獲得維數(shù),返回向量 nrow(),ncol()#獲得行數(shù)和列數(shù)

rownames(),colnames()#訪問各維名稱x=matrix(rnorm(24),4,6)x[c(2,1),]#第2和第1行x[,c(1,3)]#第1和第3列x[2,1]#第[2,1]元素x[x[,1]>0,1]#第1列大于0的元素x[,-c(1,3)]#沒有第1、3列的x.x[-2,-c(1,3)]#沒有第2行、第1、3列的x.列表和數(shù)據(jù)框1.列表是一種特殊的對象集合,各元素類型任意生成:list(name1=value1,…,namen=valuen)訪問/修改:對象名[[下標]]或?qū)ο竺?nameistu=list(age=10,name=“Tom”,interests=c(“swimming”,”drawing”))stu[[2]]stu$namestu$name=“john”

names(stu)#得到所有的變量名2.數(shù)據(jù)框是R的一種數(shù)據(jù)結構,以矩陣形式保存數(shù)據(jù)各列類型可以不同,每列為一變量,每行為樣品各列長度相等生成:data.frame()stu=data.frame(name=c(“john”,”wuji”),age=c(30,32))

x=data.frame(matrix(1:6,nrow=2))

names(stu)#得到所有的變量名

rownames(stu)#得到行名

attach(x)#把數(shù)據(jù)框中的變量鏈接到內(nèi)存中

x=matrix(1:6,2,3)x=data.frame(x);xX1X2X311352246x$X2[1]34attributes(x)$names[1]“X1"“X2"“X3“$s[1]"1""2“$class[1]"data.frame"x=data.frame(id=101:120,score=round(rnorm(20,70,10)))x[seq(1,10,2),]x[order(x[[2]],decreasing=T),]x[x[[2]]<60,]數(shù)據(jù)格式及I/O讀表格形式文本文件read.table(file,header=FALSE,sep=““,…)header表示第一行是否有變量名,sep表示數(shù)據(jù)分割的字符D1=read.table(“e:\\test1.txt”,header=TRUE)D2=read.table(“clipboard”)

3.計算的數(shù)據(jù)保存成文本文件或CSV文本文件write.table(data,file=“”)#純文本格式

例:將數(shù)據(jù)D1寫入文件write.table(D1,file=“e:\\”)

1.分支結構單分支:if(條件)語句if(條件){復合語句;}雙分支:if(條件)語句1else語句2多分支:if()語句1elseif()語句2…elseif()語句nelse語句n+1switch:switch(表達式,list)返回list中下標與表達式對應的值例子:x=1;if(x>0){a=10;b=10}else{a=20;b=20;}switch(x,1:5,100,20)#12345

這三個構成列表list,返回list[x]控制語句2.循環(huán)結構for(nameinexpress)expr;#{expr_s}while(condition)expr;#{expr_s}

repeat{exprs;if(達到中止條件)break}

中止循環(huán)語句:break;跳空循環(huán)語句:next;例子:完成1到100的求和運算s1=0;j=1;k=1;s2=0;s3=0;for(iin1:100)s1=s1+i;#或者while(j<=100){s2=s2+j;j=j+1;}#或者repeat{s3=s3+k;k=k+1;if(k>100)break}fun<-function(arg1,arg2,…){注意:最后一句表達式的值為返回值}例子:完成一維向量均值運算mymeanmymean=function(x){sum=0;n=length(x)for(jin1:n)sum=sum+x[j]sum=sum/n}meanofx=mymean(1:100);meanofx自定義函數(shù)dnorm()#計算正態(tài)分布的密度函數(shù)pnorm()#計算正態(tài)分布的分布函數(shù)qnorm()#計算正態(tài)分布的分位數(shù)rnorm()#計算正態(tài)分布的隨機數(shù)其它分布的關鍵詞:unif,exp, chisq,t,f,binom, poisdexp(2,10)runif(10,0,10)和分布相關統(tǒng)計量mean(),median(),quantile(),var(),sd(),cor()sum(),max(),min()summary()table()#列聯(lián)表x=c(10,71:78,90)xm<-mean(x)c(xm,mean(x,trim=0.10))A=cbind(c(90,60,70),c(85,66,95))apply(A,1,mean)#對每一行取平均apply(A,2,mean)#對每一列取平均var(A)cor(A)數(shù)據(jù)的圖形表示x=seq(-10,10,2);y=rnorm(11)par(mfrow=c(3,1))#準備畫3個圖plot(x,y)

plot(x,y,main="散點圖",xlab="橫坐標x",ylab="縱坐標y")text(x,y,1:length(x),-1)#寫入點序號plot(x,y,type="o",col="red",pch=2,lty=3)1.散點圖plot(x,y,…)points()type=“p”#散點圖,默認type=“l(fā)’#繪實線type=“o”#實線通過所有的點type=“n”#不畫點參數(shù)lty表示線的類型0=blank,1=solid(default),2=dashed,3=dotted,4=dotdash,5=longdash,6=twodash2.散點圖矩陣pairs(x,…)A=matrix(rnorm(12,70,20),nrow=4)pairs(A)3.多組散點圖matplot(x,y,…)x=seq(0,2*pi,0.2)matplot(x,cbind(sin(x),cos(x)),type=c(‘o’,’o’),col=2:3))4.星座圖

5.臉譜圖library(aplpack)faces(x,nrow.plot,ncol.plot)stars(x,full=TRUE,draw.segments=FALSE)lwl.andrews=function(X){t=seq(-pi,pi,0.2)n=nrow(X)f=matrix(0,nrow=length(t),ncol=n)for(iin1:n){f[,i]=X[i,1]/sqrt(2)for(jin2:ncol(X)){if(j%%2==0)f[,i]=f[,i]+X[i,j]*sin(j/2*t) else f[,i]=f[,i]+X[i,j]*cos(j%/%2*t)}}matplot(t,f,col=1:n,type="o",main="調(diào)和曲線圖")}例1:繪制調(diào)和曲線圖hist(x,freq)#直方圖,freq=counts,(默認)為頻數(shù)直方圖, freq=TRUE,為頻率直方圖,freq=FALSE,為密度直方圖boxplot(x)#箱線圖stem(x)#莖葉圖barplot()#柱狀圖pie()#餅狀圖統(tǒng)計圖形

a=rnorm(100,70,20);a=a[a>=0&a<=100];a=round(a)hist(a)b=rbinom(100,5,0.5)nums=table(b)barplot(nums)例1:31省市地區(qū)的消費支出數(shù)據(jù),進行如下統(tǒng)計1.計算各地區(qū)的人均消費支出總和,并畫出柱狀圖2.計算各消費類型的均值,并畫出餅狀圖和柱狀圖3.畫出各消費類型的箱線圖4.畫出各地區(qū)的雷達圖和臉譜圖barplot(apply(X,1,mean),col=heat.colors(31),s=0.5)pie(apply(X,2,mean))barplot(apply(X,2,mean),names=rep('',ncol(X)),legend=names(X),col=1:ncol(X))a=rnorm(100,70,20);a=a[a>=0&a<=100];a=round(a)b=table(cut(a,breaks=c(0,59,69,79,89,100)))pie(b,labels=c('不及格','及格','中等','良好','優(yōu)秀'))例2:對模擬成績的優(yōu)良人數(shù)統(tǒng)計及畫圖實驗題求矩陣B的行列式、逆矩陣、特征根和特征向量及A’BAA=c(1,3,5)B=matrix(1:9,ncol=3,byrow=T)B[3,3]=10det(B)solve(B)eigen(B)t(A)%*%B%*%A學號性別數(shù)學語文英語物理13001男8076819023002男5567796333003女2752534343004女6257666953005女9480767163006男9759617473007男7962788883008男7092788393009女67666555103010男97465575113011男84828892123012男40576753133013男72708084143014男43315660153015男95755874163016男62859183173017女71766874183018男80405271193019女96757780203020女82517377213

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論