R語言學(xué)習(xí)總結(jié)_第1頁
R語言學(xué)習(xí)總結(jié)_第2頁
R語言學(xué)習(xí)總結(jié)_第3頁
R語言學(xué)習(xí)總結(jié)_第4頁
R語言學(xué)習(xí)總結(jié)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

R語言學(xué)習(xí)總結(jié)經(jīng)過接近一個(gè)學(xué)期的學(xué)習(xí),從對R語言的完全陌生,到現(xiàn)在對其有了一些粗淺的認(rèn)識(shí),其中經(jīng)歷了遇到困難苦思冥想的艱辛,也有解決問題以后豁然開朗的暢快。在學(xué)習(xí)的過程中,以前掌握的數(shù)理基礎(chǔ)給我?guī)砹瞬簧俦憷J(rèn)真地態(tài)度和踏實(shí)的性格也使我獲益匪淺。在這個(gè)學(xué)期中,我學(xué)會(huì)了R語言的基本操作和語法,以及針對具體的統(tǒng)計(jì)學(xué)問題相應(yīng)的解決方法。并按時(shí)完成老師布置的課后作業(yè),以達(dá)到學(xué)以致用的目的,也加強(qiáng)了對R語言操作的熟練度。一、初識(shí)R軟件R軟件是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:據(jù)存儲(chǔ)和處理,數(shù)組運(yùn)算,完整連貫的統(tǒng)計(jì)分析工具,優(yōu)秀的統(tǒng)計(jì)制圖功能已及簡便而強(qiáng)大編程語言。接觸R語言以后,我的第一感覺就是方便和強(qiáng)大。R語言中有非常多的函數(shù)和包,我們幾乎不用自己去編一些復(fù)雜的算法,而往往只需要短短幾行代碼就能解決很復(fù)雜的問題,這給我們的使用帶來了極大地方便;于此同時(shí),它又可操縱數(shù)據(jù)的輸入輸出,實(shí)習(xí)分支、循環(huán),使用者可以自定義功能,這就意味著當(dāng)找不到合適的函數(shù)或包來解決所遇的問題時(shí),我們又可以自己編程去實(shí)現(xiàn)各種具體功能,這也正是R語言的強(qiáng)大之處。二、學(xué)習(xí)心得在學(xué)習(xí)該書的過程中,我不僅加深了對統(tǒng)計(jì)學(xué)方法的理解,同時(shí)也掌握了R軟件的編程方法和基本技巧,了解了各種函數(shù)的意義和用法,并能把兩者結(jié)合起來,解決實(shí)際中的統(tǒng)計(jì)問題。1、R語言的基本語法及技巧R語言不僅可以進(jìn)行基礎(chǔ)的數(shù)字、字符以及向量的運(yùn)算,內(nèi)置了許多與向量運(yùn)算有關(guān)的函數(shù)。而且還提供了十分靈活的訪問向量元素和子集的功能。R語言中經(jīng)常出現(xiàn)數(shù)組,它可以看作是定義了維數(shù)(dim屬性)的向量。因此數(shù)組同樣可以進(jìn)行各種運(yùn)算,以及訪問數(shù)組元素和子集。二維數(shù)組(矩陣)是比較重要和特殊的一類數(shù)組,R可以對矩陣進(jìn)行內(nèi)積、外積、乘法、求解、奇異值分解及最小二乘擬合等運(yùn)算,以及進(jìn)行矩陣的合并、拉直等。apply()函數(shù)可以在對矩陣的一維或若干維進(jìn)行某種計(jì)算,例如apply(A,1,mean)表示對A按行求和。R語言允許將不同類型的元素放在一個(gè)集合中,這個(gè)集合叫做一個(gè)列表,列表元素總可以用“列表名[[下標(biāo)]]”的格式引用。而“列表名[下標(biāo)]”表示的是一個(gè)子列表,這是一個(gè)很容易混淆的地方。R語言中非常重要的一種數(shù)據(jù)結(jié)構(gòu)是data.frame(數(shù)據(jù)框),它通常是矩陣形式的數(shù)據(jù),但每列可以是不同類型,數(shù)據(jù)框每列是一個(gè)變量,每行是一個(gè)觀測,要注意的是每一列必須有相同的長度。數(shù)據(jù)框元素可以使用下標(biāo)或者下標(biāo)向量引用。用一個(gè)非常簡單的例子來說明向量、矩陣和數(shù)據(jù)框的簡單運(yùn)用。輸入:A<-matrix(c(1:12),2,6,byrow=T)#A為一個(gè)2行6列,按行排列的矩陣X<-as.data.frame(A)#把A轉(zhuǎn)化成數(shù)據(jù)框形式的XX[1:2,seq(1,5,2)]#輸出X的第1、2行和1、3、5列輸出:V1V3V5113527911輸入:attach(X);R<-V1/V5;R#調(diào)用數(shù)據(jù)框X,計(jì)算并輸出V1和V5的比值輸出:[1]0.20210000.6363636與此同時(shí)R語言中也提供了其它高級程序語言共有的分支、循環(huán)等程序控制結(jié)構(gòu)。比如if/else語句,for循環(huán)等。因此R語言也可以很容易的根據(jù)情況編寫自己所需要的函數(shù)。例:編寫一個(gè)R程序,輸入一個(gè)整數(shù)n,如果n小于等于0,中止運(yùn)算,并輸出:“要求輸入一個(gè)正整數(shù)”;否則,如果n是偶數(shù),則將n除2賦值給n;否則將3n+1賦給n。不斷循環(huán),直到n=1停止,并輸出:“運(yùn)算成功”解:新建一個(gè)程序腳本,名為chapter2.R”,寫入代碼:f<-function(n){if(n<=0)list("要求輸入一個(gè)正整數(shù)")else{repeat{if(n==1)break#n=1時(shí)終止elseif(n/2==eger(n/2))n<-n/2#n為偶數(shù)時(shí)除2elsen<-3*n+1}list("運(yùn)算成功")}}在R窗口中輸入:Source(“chapter2.R”);f(32)輸出:[1]"運(yùn)算成功"輸入:f(-5)輸出:[1]"要求輸入一個(gè)正整數(shù)"2、R在統(tǒng)計(jì)描述中的應(yīng)用數(shù)據(jù)框操作(plyr包)輔助小函數(shù)1splat函數(shù):作用:把原函數(shù)中多個(gè)參數(shù)打包為一個(gè)list作為參數(shù),然后輸出新的函數(shù)。也就是說本來某個(gè)函數(shù)需要輸入多個(gè)參數(shù),現(xiàn)在套上splat后,只要輸入一個(gè)參數(shù)list就可以了,不需要單獨(dú)地輸入?yún)?shù)。它的作用結(jié)果是把一個(gè)函數(shù)變成一個(gè)新函數(shù)。m*ply(a_matrix,FUN)的作用和a*ply(a_matrix,1,splat(FUN))一樣例:(1)參數(shù)使用>hp_per_cyl<-function(hp,cyl,...)hp/cyl>splat(hp_per_cyl)(mtcars[1,])1]18.33333>splat(hp_per_cyl)(mtcars)[1]18.3333318.3333323.2500018.3333321.8750017.5000030.6250015.5000023.75000[10]20.5000020.5000022.5000022.5000022.5000025.6250026.8750028.7500016.50000[19]13.0000016.2500024.2500018.7500018.7500030.6250021.8750016.5000022.75000[28]28.2500033.0000029.1666741.8750027.25000等價(jià)于:>hp_per_cyl(mtcars$hp,mtcars$cyl)splat函數(shù)的優(yōu)點(diǎn)就是可以不用拆分字段,可以一起輸入作為參數(shù)。(2)與plyr函數(shù)合用:>f<-function(mpg,wt,...)data.frame(mw=mpg/wt)>ddply(mtcars,.(cyl),splat(f))2each函數(shù)作用:把多個(gè)函數(shù)匯聚成一個(gè)函數(shù),當(dāng)使用這個(gè)函數(shù)時(shí),將分別作用多個(gè)函數(shù)。它的作用結(jié)果是把一個(gè)函數(shù)變成一個(gè)新函數(shù)。不足:不能給作用的函數(shù)指定附加參數(shù),只能使用默認(rèn)參數(shù)。例:>fun<-function(x)c(min=min(x),max=max(x),mean=mean(x))>fun(1:10)等價(jià)于:>f<-each(min,max,mean)>f(1:10)3colwise函數(shù)colwise(.fun,.cols,...)說明:.fun:要轉(zhuǎn)化的函數(shù);.cols是測試數(shù)據(jù)框的列是否應(yīng)包含的判別函數(shù)或者是·要包含的列的名稱。catcolwise(.fun,...)與colwise功能類似,只是對離散型變量有效numcolwise(.fun,...)與colwise功能類似,只是對數(shù)值型變量有效作用:把作用于數(shù)據(jù)框行向量的函數(shù)(如mean,median等)轉(zhuǎn)化為作用于數(shù)據(jù)框列向量的函數(shù)。于plyr函數(shù)一起使用十分方便。作用結(jié)果生成一個(gè)新的函數(shù)。例:>nmissing<-function(x)sum(is.na(x))>colwise(nmissing)(baseball)>colwise(nmissing,.(sb,cs,so))(baseball)>ddply(baseball,.(year),colwise(nmissing,.(sb,cs,so)))>numcolwise(nmissing)(baseball)等價(jià)于:colwise(nmissing,is.numeric)(baseball)>catcolwise(nmissing)(baseball)等價(jià)于:colwise(nmissing,is.discrete)(baseball)4failwith函數(shù)failwith(default=NULL,f,quiet=FALSE)作用:修正一個(gè)函數(shù),使得當(dāng)該函數(shù)出現(xiàn)錯(cuò)誤時(shí)返回一個(gè)設(shè)定的默認(rèn)值,默認(rèn)為空。作用結(jié)果生成一個(gè)新的函數(shù)。>f<-function(x)if(x==1)stop("Error")else1>f(1)Errorinf(1):Error>safef<-failwith(,f)>safef(1)Errorinf(...):ErrorNULL>safef<-failwith(12,f,quiet=TRUE)>safef(1)[1]125summarise()函數(shù)summarise(.data,...)作用:對數(shù)據(jù)框做統(tǒng)計(jì)匯總,…為設(shè)定的統(tǒng)計(jì)方法或函數(shù)例:>summarise(baseball,duration=max(year)-min(year),nteams=length(unique(team)))durationnteams1136132>head(ddply(baseball,"id",summarise,duration=max(year)-min(year),nteams=length(unique(team))))iddurationnteams1aaronha012232abernte021773adairje011244adamsba012025adamsbo031346adcocjo01165數(shù)據(jù)集變量操作1變量排序:arrange函數(shù)arrange(df,.(var1),.(var2)…)作用:按照指定列排序。注意:使用arrange函數(shù)排完序后行名會(huì)丟失,需要用cbind補(bǔ)回。例:>arrange(mtcars,cyl,disp)>cars<-cbind(vehicle=s(mtcars),mtcars)>arrange(cars,cyl,disp)------先把行名作為一個(gè)新的列加到數(shù)據(jù)框再排序2更改變量名rename(x,replace,warn_missing=TRUE)作用:通過名字修改變量名字,不是根據(jù)它的位置。例:>head(rename(tmt,replace=c("mpg"="avgpg",”cly”=”new”)))3取行或列的數(shù)據(jù)take(x,along,indices,drop=FALSE)作用:在x中,按照某個(gè)維度取數(shù)。參數(shù)說明:x為取數(shù)的源數(shù)據(jù),可以是array或者dataframe;along:維度。1表示行,2表示列,3表示數(shù)組快等等;indices:具體維度所對應(yīng)的指;drop:是否整合例:>take(mtcars,2,1)--取第一列>take(mtcars,1,1)--取第一行數(shù)據(jù)集操作1數(shù)據(jù)集鏈接match_dfmatch_df(x,y,on=NULL)作用:x為原始的需要提取的數(shù)據(jù)框,y為條件數(shù)據(jù)框;on指定用來連接的變量,默認(rèn)為兩個(gè)數(shù)據(jù)框中所有變量,可以為多個(gè)。通過on后面的字段,到x數(shù)據(jù)框取選取數(shù)據(jù),相當(dāng)于innerjoin,區(qū)別為:前者結(jié)果集是x的一個(gè)子集;innerjoin包括兩個(gè)數(shù)據(jù)框中所有字段。例:基礎(chǔ)數(shù)據(jù)>a<-c("a","b","c","d")>b<-c("aa","bb","aa","dd")>c<-c(1,2,3,4)>t1<-data.frame(a,b,c)>t2<-data.frame(a=c("a","c","e"),b=c("aa","ab","cd"))>match_df(t1,t2,on=c("a","b"))abc1aaa12)joinjoin(x,y,by=NULL,type=“l(fā)eft”,match=“all”)作用:連接兩個(gè)數(shù)據(jù)框參數(shù)說明:x,y為數(shù)據(jù)框;by=為要連接的字段,type為連接類型:left、right、full;match:all(所有匹配上的其他屬性值都帶上)、first(只帶上匹配上的第一個(gè)屬性值)>join(t1,t2,by="x2",type="inner")>join(t1,t2,by="x2",type="left")>join(t1,t2,by="x2",type="right")>tt1<-data.frame(x1=c(1,2,3,4),x2=c(5,6,7,8))>tt2<-data.frame(y1=c(1,2,3,4)*10,x2=c(6,6,6,6))>join(tt1,tt2,by="x2",type="inner",match="all")x1x2y112610226203263042640>join(tt1,tt2,by="x2",type="inner",match="first")x2x1y1262102.162102.262102.36210注意:merge和join相似,但是效率上join更優(yōu)。3)merge例:>x<-data.frame(a=c(1,2,4,5,6),x=c(9,12,14,21,8))>y<-data.frame(a=c(1,3,4,6),y=c(8,14,19,2),x=c(2,3,4,5))>merge(x,y)----根據(jù)相同字段默認(rèn)內(nèi)連接>merge(x,y,all=TRUE)---根據(jù)相同字段全鏈接>merge(x,y,all.x=TRUE)--左連接>merge(x,y,all.y=TRUE)--右連接>merge(x,y,by=c("a","x"))--根據(jù)a和x兩個(gè)字段連接>merge(x,y,by.x="a",by.y="y")--根據(jù)x表中a和y表中y連接數(shù)據(jù)統(tǒng)計(jì)1**ply函數(shù)作用:拆分?jǐn)?shù)據(jù),應(yīng)用函數(shù),再組合函數(shù)作用后的數(shù)據(jù)輸入:array、dataframe、list輸出:array、dataframe、list、discarededa*ply(.data,.margins,.fun,...,.progress="none")參數(shù)說明:.data是要進(jìn)行處理的數(shù)組.margins是用哪種方式去切割數(shù)據(jù),取值為1,2,c(1,2).fun是對切割的數(shù)據(jù)指定一個(gè)函數(shù)進(jìn)行處理.progress決定是否顯示及用哪種方式顯示進(jìn)度條>aaply(a,1,mean,.progress="none")>aaply(a,1,mean,.progress="text")---以文本形式展示進(jìn)度條>aaply(a,1,mean,.progress="win")---windows窗口展示進(jìn)度條d*ply(.data,.variables,.fun,...,.progress="none")參數(shù)說明:.variables指定要按其分割的變量名稱>daply(data,.(age),.fun=amean)>daply(data,.(sex),.fun=amean)>daply(data,.(age,sex),.fun=amean)>ddply(data,.(sex),.fun=amean)>dlply(data,.(sex),.fun=amean)l*ply(.data,.fun,...,.progress="none")說明:列表類型的數(shù)據(jù)是最簡單的數(shù)據(jù),因?yàn)樗呀?jīng)被分割成一個(gè)個(gè)了(也就是列表數(shù)據(jù)的一個(gè)個(gè)元素),所以這類函數(shù)沒有參數(shù)用來描述是按什么進(jìn)行切分的。>llply(list,mean)>laply(list,mean)>ldply(list,mean)m*ply(.data,.fun=NULL,.inform=FALSE,…)說明:把參數(shù)放到array或dataframe中整體輸入作為參數(shù),然后fun后面的函數(shù)運(yùn)用.data中的相應(yīng)數(shù)值作為參數(shù)分別作用,得到dataframe(mdply),array(maply)或者list(mlply)。與splat相似:m*ply(a_matrix,FUN)的作用和a*ply(a_matrix,1,splat(FUN))一樣。>data=data.frame(n=c(10,100,50),mean=c(5,5,10),sd=c(1,2,1))>datanmeansd11051210052350101>mlply(data,rnorm)2觀測值出現(xiàn)個(gè)數(shù)(1)count函數(shù):count(df,vars=NULL,wt_var=NULL)參數(shù):df是要處理的數(shù)據(jù)框;vars是要進(jìn)行分組統(tǒng)計(jì)的變量;wt_var為權(quán)重。注意:該函數(shù)的功能類似于table例:基礎(chǔ)數(shù)據(jù):>a=data.frame(names=c("a","b","c","d","a","a","a","b","b","c"),wt=c(1,1,1,1,2,2,2,2,2,2))>count(a,vars="names")---單變量分組>count(a,vars="names",wt_var="wt")---加上權(quán)重>count(a,c("names","wt"))----雙變量分組使用R軟件可以方便直觀的對數(shù)據(jù)進(jìn)行描述性分析。如使用均值、中位數(shù)、順序統(tǒng)計(jì)量等度量位置;用方差、標(biāo)準(zhǔn)差、變異系數(shù)等度量分散程度;以及用峰度系數(shù)、偏度系數(shù)度量分布形狀。例如在窗口中輸入:x<-seq(1,589,3)length(x);mean(x);var(x);sd(x);median(x);100*sd(x)/mean(x)[1]197#長度[1]295#均值[1]29254.5#方差[1]171.0395#標(biāo)準(zhǔn)差[1]295#中位數(shù)[1]57.97948#樣本標(biāo)準(zhǔn)差n<-length(x);m<-mean(x);s<-sd(x)n/((n-1)*(n-2))*sum((x-m)^3)/s^3;((n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4-(3*(n-1)^2)/((n-2)*(n-3)))[1]0#偏度系數(shù)[1]-1.2#峰度系數(shù)R軟件可以檢驗(yàn)樣本是不是來自某種分布總體,以正態(tài)分布為例,我們可以通過shapiro.test()函數(shù)提供W統(tǒng)計(jì)量和相應(yīng)的p值,并通過p值的大小判斷樣本是否來自正態(tài)分布的總體。經(jīng)驗(yàn)分布的K-S檢驗(yàn)方法的應(yīng)用范圍則更加廣泛,不僅可以判斷樣本是否來自正態(tài)總體,也能判斷是否來自其它類型的分布總體。除此之外,R語言還有強(qiáng)大的畫圖功能,例如我們可以通過作直方圖、莖葉圖和總體分析來描述數(shù)據(jù)的分布。R中的高水平作圖函數(shù)有:plot()、pairs()、coplot()、qqnorm()、hist()等等。當(dāng)高水平作圖函數(shù)并不能完全達(dá)到作圖的指標(biāo)時(shí),需要低水平的作圖函數(shù)予以補(bǔ)充。低水平作圖函數(shù)有:points()、lines()、text()、polygon()、legend()、title()和axis()等。需要注意的是低水平作圖函數(shù)必須是在高水平作圖函數(shù)所繪圖形的基礎(chǔ)之上增加新的圖形。hist()函數(shù)可以做出已知數(shù)據(jù)的直方圖,stem()函數(shù)可以作莖葉圖,boxplot()函數(shù)可用作箱線圖,qqline()和qqmorm()可以做出正態(tài)QQ圖和相應(yīng)的直線。R語言同時(shí)還能對兩組數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),cor.test()函數(shù)提供了Pearson相關(guān)性檢驗(yàn),Spearman秩檢驗(yàn)和Kendall秩檢驗(yàn)。其原假設(shè)為兩組數(shù)據(jù)不相關(guān),通過p值的大小來判斷是否拒絕原假設(shè)。我們還能用stars()函數(shù)作出星圖,來表示多元數(shù)據(jù),以上用法都非常簡單易用,這里就不再贅述。3、R語言在統(tǒng)計(jì)推斷中的應(yīng)用首先,R語言可以用來進(jìn)行參數(shù)估計(jì);統(tǒng)計(jì)學(xué)中我們應(yīng)用矩估計(jì)和極大似然估計(jì)來進(jìn)行點(diǎn)估計(jì),矩估計(jì)是通過解正規(guī)方程組得到參數(shù)估計(jì)的值;極大似然估計(jì)通過解極大似然函數(shù)的極值點(diǎn)得到參數(shù)估計(jì)的值。在R中我們可以使用Newton迭代法求解正規(guī)方程組,獲得矩估計(jì);用optimize()函數(shù)求解極大似然函數(shù),獲得最大似然估計(jì);由此可見,R語言能夠很方便的解決參數(shù)點(diǎn)估計(jì)問題。點(diǎn)估計(jì)給出未知參數(shù)的近似值以后,并不能知道這種估計(jì)的精確性如何,可信程度如何,為了解決這些問題,就需要用到區(qū)間估計(jì),在學(xué)習(xí)用R語言解決區(qū)間估計(jì)問題的過程中,我最大的體會(huì)就是R軟件中內(nèi)置的一些函數(shù)極大地方便了我們處理具體問題。比如t.test()函數(shù)。對單個(gè)正態(tài)總體,向量x包含了來自該總體的一個(gè)樣本,我們可以直接用t.test(x)指令得到均值u的點(diǎn)估計(jì)和區(qū)間估計(jì);對于兩個(gè)正態(tài)總體,向量y包含了來自第二個(gè)總體的一個(gè)樣本,我們可以用t.test(x,y)來得到均值差u1-u2的點(diǎn)估計(jì)和區(qū)間估計(jì),其中當(dāng)兩個(gè)總體方差相同時(shí),只需要加上var.equal=T(缺省值為F,即默認(rèn)兩個(gè)總體的方差是不同的);同時(shí)t.test()函數(shù)不僅可以進(jìn)行雙側(cè)置信區(qū)間估計(jì),也能進(jìn)行單側(cè)置信區(qū)間估計(jì),只需要在括號內(nèi)加上al=”l”或者al=”g”。當(dāng)數(shù)據(jù)不服從正態(tài)分布是,可以利用中心極限定理,取較大的樣本量,構(gòu)造近似服從正態(tài)分布的統(tǒng)計(jì)量進(jìn)行估計(jì)。其次,R語言可以用來進(jìn)行假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)也是統(tǒng)計(jì)推斷中的一個(gè)重要的內(nèi)容,在統(tǒng)計(jì)學(xué)中,我們用搜索到的數(shù)據(jù)對某個(gè)事先作出的統(tǒng)計(jì)假設(shè)按照某種設(shè)計(jì)好的方法進(jìn)行檢驗(yàn),來判斷此假設(shè)是否正確。也就是說為了檢驗(yàn)一個(gè)假設(shè)是否成立,先假定它是成立的,看看由此會(huì)導(dǎo)致什么結(jié)果。如果導(dǎo)致一個(gè)不合理的現(xiàn)象出現(xiàn),就認(rèn)為原假設(shè)不正確,如果沒有導(dǎo)出不合理的現(xiàn)象,則不能拒絕原假設(shè)。R軟件給出了參數(shù)假設(shè)檢驗(yàn)的方法。以正態(tài)總體為例,t.test()函數(shù)也可以用來進(jìn)行單個(gè)或者兩個(gè)正態(tài)總體的均值的假設(shè)檢驗(yàn)。進(jìn)行單邊檢驗(yàn)時(shí)可以加入指令alternative(備擇假設(shè)),缺省時(shí)表示雙邊檢驗(yàn),less表示備擇假設(shè)為u<u0,greater則相反,用conf.level指定置信水平。X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)t.test(X,Y,var.equal=T,al=”l”)輸出:TwoSamplet-testdata:XandYt=-4.2957,df=18,p-value=0.0002176alternativehypothesis:truedifferenceinmeansislessthan095percentconfidenceinterval:-Inf-1.908255sampleestimates:meanofxmeanofy76.2379.43結(jié)果中我們不僅能得到X和Y的均值的點(diǎn)估計(jì)76.23和79.43、左側(cè)區(qū)間估計(jì)、同時(shí)也能通過p值的大小判斷是否接受原假設(shè),該例中p<0.05,認(rèn)為拒絕原假設(shè),即認(rèn)為兩總體方差不同。與均值假設(shè)檢驗(yàn)相類似。R語言中還可以用var.test()函數(shù)進(jìn)行正態(tài)總體的方差假設(shè)檢驗(yàn)。而且R語言不僅能就正態(tài)總體進(jìn)行均值和方差檢驗(yàn),也能對其他總體分布進(jìn)行檢驗(yàn)。例如用binom.test()進(jìn)行二項(xiàng)分布的檢驗(yàn)和估計(jì)。習(xí)題中檢驗(yàn)鐵劑和飲食兩種方法治療后患者病情表現(xiàn)有無差異:x<-c(113,120,138,120,100,118,138,123)y<-c(138,116,125,136,110,132,130,110)binom.test(sum(x<y),8)Exactbinomialtestdata:sum(x<y)and8numberofsuccesses=4,numberoftrials=8,p-value=1alternativehypothesis:trueprobabilityofsuccessisnotequalto0.595percentconfidenceinterval:0.15701280.8429872sampleestimates:probabilityofsuccess0.5由結(jié)果我們可以判斷兩種診斷方法無顯著差異(其中用到的統(tǒng)計(jì)學(xué)原理見下面的符號檢驗(yàn))。參數(shù)假設(shè)檢驗(yàn)假定了總體分布的具體形式,但實(shí)際問題中我們往往不知道總體的分布,很難對總體的分布做出假定,所有要盡量從樣本本身獲得所需要的信息,即非參數(shù)檢驗(yàn)方法。R語言中有很多種非參數(shù)的檢驗(yàn)方法,這里僅介紹幾個(gè)較為重要的方法。Pearson擬合優(yōu)度的卡方檢驗(yàn):首先假設(shè)隨機(jī)變量有某種分布,將數(shù)軸分成m個(gè)區(qū)間,然后用樣本落在每個(gè)區(qū)間內(nèi)的個(gè)數(shù)和其期望構(gòu)造K統(tǒng)計(jì)量,當(dāng)n很大是,K依分布收斂于自由度為m-1的卡方分布。然后進(jìn)行參數(shù)假設(shè)檢驗(yàn)。在R語言中可以用chisq.test()函數(shù)來實(shí)現(xiàn)。符號檢驗(yàn)可以用來檢驗(yàn)一個(gè)樣本是否來自某個(gè)總體,或者檢驗(yàn)兩個(gè)總體是否有顯著區(qū)別。對于前者,如果樣本中位數(shù)等于假設(shè)的總體的中位數(shù),我們就認(rèn)為樣本來自該假設(shè),此時(shí)每個(gè)樣本中位數(shù)和總體中位數(shù)的差額應(yīng)該正負(fù)各一半,所以可以用p=0.5的二項(xiàng)分布來檢驗(yàn)。對于后者,如果認(rèn)為兩個(gè)總體無顯著差異,則對應(yīng)的兩個(gè)樣本觀測值正負(fù)差額的個(gè)數(shù)應(yīng)該大體相當(dāng),即正負(fù)各占一半,像單個(gè)樣本一樣,檢驗(yàn)其是否來自p=0.5的二項(xiàng)分布。這在R語言中只需要用binom.test()函數(shù)就能實(shí)現(xiàn)。秩統(tǒng)計(jì)量檢驗(yàn)是一種經(jīng)常被用來檢驗(yàn)分布無關(guān)性的非參數(shù)檢驗(yàn),R語言提供了Spearman、Kendall和Wilcoxon三種秩檢驗(yàn)方法,前兩種可以用cor.test()函數(shù)實(shí)現(xiàn),最后一種可以用wilcox.test()函數(shù)實(shí)現(xiàn)。最后,R語言還可以用來處理回歸分析問題對于普通的多元線性回歸模型,已知被解釋變量y和i個(gè)解釋變量的樣本數(shù)據(jù),利用R語言中的lm()函數(shù)可以非常方便的求出各解釋變量的回歸參數(shù),并做相應(yīng)的檢驗(yàn)。以y=β0+β1x+β2z+ε為例,將數(shù)據(jù)賦給各個(gè)變量后,只需要輸入lm<-lm(y~1+x+z);summary(lm)就能得到參數(shù)估計(jì)值、每個(gè)參數(shù)估計(jì)值的標(biāo)準(zhǔn)差、參數(shù)顯著性的t檢驗(yàn)和總體顯著性的F檢驗(yàn),以及模型的擬合優(yōu)度等信息。然后我們可以用predict()函數(shù)非常方便的求出預(yù)測值和預(yù)測區(qū)間,同樣我們還能用前面介紹過的plot()和abline()等函數(shù)做出各種圖形來進(jìn)行回歸分析。當(dāng)然之前講的都是比較理想的情況,而現(xiàn)實(shí)中往往影響被解釋變量y的因素很多,我們希望找出若干個(gè)比較關(guān)鍵的變量建立回歸方程,這便涉及變量選擇的問題。選擇“最優(yōu)”變量的方法有很多,比較常用的一種是逐步回歸法??偟膩碚f,R語言歸根到底只是我們解決問題的工具,而我們對問題的分析首先是要根據(jù)理論進(jìn)行的,例如參數(shù)估計(jì)、假設(shè)檢驗(yàn)以及線性回歸、時(shí)間序列方面的知識(shí),我們只有深刻理解這些理論背后的意義,才能用對R語言中的各個(gè)方法,就好比戰(zhàn)場上如果R是利刃,理論知識(shí)就是我們的身體和戰(zhàn)術(shù)素養(yǎng),只有我們學(xué)好了理論知識(shí),才能面對一個(gè)個(gè)問題迎刃而解。我深知自己在R語言的道路上還走的太短,僅僅只是學(xué)到了些皮毛,我一定要更加努力深入的學(xué)習(xí),在今后的學(xué)習(xí)實(shí)踐中獲得更多的知識(shí),成長起來,為即將到來的實(shí)習(xí)及工作打下堅(jiān)實(shí)的基礎(chǔ)。

論大學(xué)生寫作能力寫作能力是對自己所積累的信息進(jìn)行選擇、提取、加工、改造并將之形成為書面文字的能力。積累是寫作的基礎(chǔ),積累越厚實(shí),寫作就越有基礎(chǔ),文章就能根深葉茂開奇葩。沒有積累,胸?zé)o點(diǎn)墨,怎么也不會(huì)寫出作文來的。寫作能力是每個(gè)大學(xué)生必須具備的能力。從目前高校整體情況上看,大學(xué)生的寫作能力較為欠缺。一、大學(xué)生應(yīng)用文寫作能力的定義那么,大學(xué)生的寫作能力究竟是指什么呢?葉圣陶先生曾經(jīng)說過,“大學(xué)畢業(yè)生不一定能寫小說詩歌,但是一定要寫工作和生活中實(shí)用的文章,而且非寫得既通順又扎實(shí)不可。”對于大學(xué)生的寫作能力應(yīng)包含什么,可能有多種理解,但從葉圣陶先生的談話中,我認(rèn)為:大學(xué)生寫作能力應(yīng)包括應(yīng)用寫作能力和文學(xué)寫作能力,而前者是必須的,后者是“不一定”要具備,能具備則更好。眾所周知,對于大學(xué)生來說,是要寫畢業(yè)論文的,我認(rèn)為寫作論文的能力可以包含在應(yīng)用寫作能力之中。大學(xué)生寫作能力的體現(xiàn),也往往是在撰寫畢業(yè)論文中集中體現(xiàn)出來的。本科畢業(yè)論文無論是對于學(xué)生個(gè)人還是對于院系和學(xué)校來說,都是十分重要的。如何提高本科畢業(yè)論文的質(zhì)量和水平,就成為教育行政部門和高校都很重視的一個(gè)重要課題。如何提高大學(xué)生的寫作能力的問題必須得到社會(huì)的廣泛關(guān)注,并且提出對策去實(shí)施解決。二、造成大學(xué)生應(yīng)用文寫作困境的原因:(一)大學(xué)寫作課開設(shè)結(jié)構(gòu)不合理。就目前中國多數(shù)高校的學(xué)科設(shè)置來看,除了中文專業(yè)會(huì)系統(tǒng)開設(shè)寫作的系列課程外,其他專業(yè)的學(xué)生都只開設(shè)了普及性的《大學(xué)語文》課。學(xué)生寫作能力的提高是一項(xiàng)艱巨復(fù)雜的任務(wù),而我們的課程設(shè)置僅把這一任務(wù)交給了大學(xué)語文教師,可大學(xué)語文教師既要在有限課時(shí)時(shí)間內(nèi)普及相關(guān)經(jīng)典名著知識(shí),又要適度提高學(xué)生的鑒賞能力,且要教會(huì)學(xué)生寫作規(guī)律并提高寫作能力,任務(wù)之重實(shí)難完成。(二)對實(shí)用寫作的普遍性不重視。“大學(xué)語文”教育已經(jīng)被嚴(yán)重地“邊緣化”。目前對中國語文的態(tài)度淡漠,而是呈現(xiàn)出全民學(xué)英語的大好勢頭。中小學(xué)如此,大學(xué)更是如此。對我們的母語中國語文,在大學(xué)反而被漠視,沒有相關(guān)的課程的設(shè)置,沒有系統(tǒng)的學(xué)習(xí)實(shí)踐訓(xùn)練。這其實(shí)是國人的一種偏見。應(yīng)用寫作有它自身的規(guī)律和方法。一個(gè)人學(xué)問很大,會(huì)寫小說、詩歌、戲劇等,但如果不曉得應(yīng)用文寫作的特點(diǎn)和方法,他就寫不好應(yīng)用文。(三)部分大學(xué)生學(xué)習(xí)態(tài)度不端正。很多非中文專業(yè)的大學(xué)生對寫作的學(xué)習(xí)和訓(xùn)練都只是集中在《大學(xué)語文》這一門課上,大部分學(xué)生只愿意被動(dòng)地接受大學(xué)語文老師所講授的文學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論