R語言期末復習_第1頁
R語言期末復習_第2頁
R語言期末復習_第3頁
R語言期末復習_第4頁
R語言期末復習_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1、智慧教學及其評價研究智慧教學:教師與家長、管理者共同設計課程,學生對學習內容、方式(小組學習、自主學習)、測試形式、學習進度、學習路徑、評價進行選擇,課程符合個體需求,適應個性化發(fā)展。課堂中,教學內容并不是一成不變的,教師要隨著時代發(fā)展,更改教學內容、測試內容,課程內容也可以由學生討論生成的,讓學生從內容的消費者變?yōu)閯?chuàng)造者。學習資源自適應,全面支持移動泛在學習,既服務于在校學生,又支持社會學習者,支持學分銀行。借助網(wǎng)絡平臺,充分表現(xiàn)社會性、實踐性、現(xiàn)實性;采用視真手段,基于真實的課堂、場景、活動、競賽,將教育與社會實踐以新的形式相結合。全面支持學習者的研究和創(chuàng)造。評價:課堂中,通過智慧教室

2、的攝像設備,錄制課堂學生的狀態(tài),針對視頻,用滯后序列分析,分析學生的行為,進行過程性評價。通過學生使用的點陣筆和紙,記錄學生思考和學習的過程,進行數(shù)據(jù)分析評價。在平臺中,通過學生訪問各個模塊的數(shù)據(jù),依據(jù)學生的認知風格的不同,進行個性化評價,過程性評價與總結性評價相結合。2、回歸定義:回歸是研究一個因變量與一組自變量之間的關系。即用一個或多個預測變量(自變量或解釋變量)預測響應變量(因變量)的方法?;貧w分析可以生成一個等式,通過解釋變量來預剛響應變量。思想:根據(jù)自變量的值預測因變量的均值回歸診斷:vsFiftEidl二口一百比線性:擬合值與殘差圖,分布在y=0的上下,對稱分布,比較好中l(wèi)lK.u

3、.二三;nhem口a-24012Th3口/atimKluW展6正態(tài)性:如果滿足正態(tài)假設,那么圖上的點應該落在呈45度的直線上,否則違反正態(tài)分布。IIttFH凸戶EScale-Location同方差性:在水平線上隨機分布,則滿足同方差性。時由帕a殘差與杠桿圖:尋找以下三種類型點離群點:y軸距離較遠的點杠桿點:x軸距離較遠的點強影響點:去掉之后系數(shù)變動很大的點異常點的改進辦法:刪除觀測點變量變換添加或刪除變量使用其他回歸方法回歸數(shù)據(jù)分析Call:ImCformula=RunTimeRunsizetdata=production)Residuals:MinIQMedian3QMax-23.597-1

4、1.0793.3298.30229.627Coefficienrs:Estimatestd.ErrortvaluePr11|)(Intercept145.747703.S2S1517,9S6.00e-13*Run5ize0.259240.017146.9Sl.Gle-06*各*Signif.codes:0官'0.001w0-013050.11'1Residualstandarderror:It.25on18degreescffreedomMultipleR-squared:0.7302,AdjustedR-squared:0.7152F-statist1c:48.72on1an

5、d18df5p-value:1.615e-06Residuals(殘差)對殘差求一下最大值和最小值Coefficients系數(shù)Intercept截距RunSize斜率看一下p值(圖中pr的值)有三個"代表顯著(比較好)Residualstandard標準差(越小越好)(自由度,樣本數(shù)-參數(shù)=自由度)MultipleR-squared代表R平方(越趨向于1越好)AdjustedR-squared調整的R平方值(考慮自由度)F-statistic(F檢驗)對整個式子進行檢驗p-value:1.615e-06小于0.05代表顯著T檢驗用來檢驗各個參數(shù)的顯著性F檢驗用來檢驗整個回歸關系的顯著

6、性擬合殘差圖是拋物線形狀,那么需要二次項在p<0.001水平下,回歸系數(shù)都非常顯著。模型的方差結實率已經(jīng)增加到了99.9%。二次項的顯著性(t=13.89,p<0.001)表明包含二次項提高了模型的擬合度。邏輯斯蒂回歸ea+xa+p25:2+-+pnxnP=P®=1|工1,又2一.,X-)=th-卜3112如“1+eo4p1x1+pEK2+-+pnKnrY=1就是這個式子,y=0是1減去這個式子這個式子計算丫取1的概率,式子結果>0.5取1,反之,取0訓練集,訓練一個模型測試集,測試訓練集的模型glm()廣義線性模型model<-glm(formula=chu

7、rn.,data=train,family='binomial')summary(model)因變量churn,自變量.,表示所有自變量3、聚類思想:聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。聚類分析的目標就是在相似的基礎上收集數(shù)據(jù)來分類。流程:數(shù)據(jù)要滿足:高類聚,低耦合歐拉距離(兩點之間)曼哈頓距離(每一維度)明考斯基距離劃分聚類:聚類算法k-means不存在三個中心點選距離作為數(shù)據(jù)樣本間相似性度量選擇評價聚類性能的準則函數(shù)組間聚類越大,聚類越好K-中心點聚類存在的三個中心點層次聚類group_k3=cutree(fit_hc,k=3)分成3類

8、str(as.dendrogram(fit_hc)文本的形式打印這棵樹sapply(unique(group_k3),function(g)countries$countrygroup_k3=g)查看k=3的聚類結果中各類別樣本4、關聯(lián)規(guī)則思想:關聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關聯(lián)或相關聯(lián)系。流程:關聯(lián)規(guī)則可以用兩個指標來判定:支持度與可信度支持度:X商品交易量/總的交易量可信度:同時包含X、丫的交易量/包含X的交易量提升度:XY可信度/Y支持度(>1比較好)只有支持度和可信度較高的關聯(lián)規(guī)則才是用戶感興趣的。關聯(lián)規(guī)則挖掘主要有兩個問題:1 .找出交易數(shù)據(jù)庫中所有大于或等于用戶指定

9、的最小支持度的頻繁項集。(支持度不小于最小支持閾值的項集稱為頻繁集)2 .利用頻繁項集生成所需要的關聯(lián)規(guī)則,根據(jù)用戶設定的最小可信度篩選出強關聯(lián)規(guī)貝U。關聯(lián)規(guī)則的操作過程:先計算出支持度與可信度,然后運用apriori函數(shù)apriori關聯(lián)算法函數(shù)調用groceryrules=apriori(groceries,parameter=list(support=0.006,confidence=0.25,minlen=2)可視化顯示5、分類思想:決策樹顧名思義就是以建立一個樹形結構模型,通過一系列規(guī)則對數(shù)據(jù)進行分類的過程。決策樹采用遞歸分類的方式,一步步的把數(shù)據(jù)分成子集(divideandconq

10、uer)。從根節(jié)點開始,算法會選擇一個最能預測目標類的屬性來把數(shù)據(jù)分成多個子集,由此形成了幾個樹的分支,接下來算法再對每個分支進行遞歸處理,繼續(xù)選擇最適合的屬性來進行分類,直到滿足:+剩下的樣本都是同一類或者+沒有備選屬性了+樹已經(jīng)達到了預先定義的大小限制6、主成分因子分析主成分(數(shù)據(jù)降維):主成分分析(PCA)是一種數(shù)據(jù)降維技巧,它能將大量相關變量轉化為一組很少的不相關變量,這些無關變量稱為主成分。因子分析(發(fā)現(xiàn)潛在結構):因子分析(EFQ是一系列用來發(fā)現(xiàn)一組變量的潛在結構的方法。它通過尋找一組更小的、潛在的或隱藏的結構來解釋已觀測到的、顯式的變量間的關系。也。上成安4歸酒吧國小折橫中圖1年

11、【主成分分析和因子分析模型口圖中展小丁可決心交成到X5.主成分IPCI、PC21.因手(Fl,F2)和港城Icl?JcS)主要分析步驟:(1)數(shù)據(jù)預處理。(2)選擇因子模型。(3)判斷要選擇的主成分/因子數(shù)目。(4)選擇主成分/因子。(5)旋轉主成分/因子。主成分旋轉:正交旋轉(使選擇的成分保持不相關)與斜交旋轉(使選擇的成分變得相關)(6)解釋結果。(7)計算主成分或因子得分。PCA中需要多少個主成分根據(jù)先驗經(jīng)驗和理論知識判斷主成分數(shù);根據(jù)要解釋變量方差的積累值的閾值來判斷需要的主成分數(shù);通過檢查變量間kXk的相關系數(shù)矩陣來判斷保留的主成分數(shù)。Cattell碎石檢驗則繪制了特征值與主成分數(shù)的

12、圖形。這類圖形可以清晰地展示圖形彎曲狀況,在圖形變化最大處之上的主成分都可保留。最后,你還可以進行模擬,依據(jù)與初始矩陣相同大小的隨機數(shù)據(jù)矩陣來判斷要提取的特征值。若基于真實數(shù)據(jù)的某個特征值大于一組隨機數(shù)據(jù)矩陣相應的平均特征值,那么該主成分可以保留。代碼生成圖形見圖14-2,展示了基于觀測特征值的碎石檢驗(由線段和x符號組成)、根據(jù)100個隨機數(shù)據(jù)矩陣推導出來的特征值均值(虛線),以及大于1的特征值準則(y=1的水平線)。之前已經(jīng)介紹過,principal()函數(shù)可以根據(jù)原始數(shù)據(jù)矩陣或者相關系數(shù)矩陣做主成分分析。格式為:其中:r是相關系數(shù)矩陣或原始數(shù)據(jù)矩陣;nfactors設定主成分數(shù)(默認為1

13、);rotate指定旋轉的方法默認最大方差旋轉(varimax),見14.2.3節(jié)。scores設定是否需要計算主成分得分(默認不需要)。ELGUWLtcCJ-lKl'sudQ53三6小口口皿豆1、選主成分數(shù)目Screenpletwithpar才H/lanalyticCdfrpoMriilNumb«r強J頭,他征信A-Fl是口加*'M-4mLLBUIIDduJDaQEa書5anl>京E小有幾個差代表幾個特征值紅色虛線代表隨機矩組的平均值紅線,代表特征值為1的2、提取主成分principal()函數(shù)可根據(jù)原始數(shù)據(jù)矩陣或相關系數(shù)矩陣做主成分分析u2=1-h2SSloadings行包含了主成分相關聯(lián)的特征值,指的是與特定主成分相關聯(lián)的標準化后的方差值。ProportionVar0.92ProportinVar行表示的是每個主成分對整個數(shù)據(jù)集的解釋程度。3、主成分旋轉方差極大旋轉4、獲取主成分得分利用principal()函數(shù),很容易獲得每個調查對象在該主

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論