數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析_第1頁
數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析_第2頁
數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析_第3頁
數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析_第4頁
數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

Word第第頁數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析一、文獻綜述

劉華和李瑗[1]通過教學(xué)看法,教學(xué)內(nèi)容,教學(xué)方法這三個指標(biāo)打分狀況,進而利用Microsoft決策樹算法,Microsoft關(guān)聯(lián)算法和Microsoft聚類分析法挖掘模型進行挖掘分析。駱懿玲[2]基于元規(guī)章約束的關(guān)聯(lián)挖掘進行課堂教學(xué)質(zhì)量評價挖掘,并得出分析結(jié)果,給出建議。邵珠艷等[3]利用灰色關(guān)聯(lián)分析,對影響課堂教學(xué)效果的因素打分后進行分析。葉勇[4]將云模型引入到遺傳算法,再用改良遺傳算法對支持向量機參數(shù)進行優(yōu)化,并與BP神經(jīng)網(wǎng)絡(luò)、多元線性回來模型比較,以便對課堂教學(xué)質(zhì)量的模型評價效果進行評價。袁萬蓮和鄭誠[5]利用關(guān)聯(lián)規(guī)章進行數(shù)據(jù)挖掘,得出與教學(xué)質(zhì)量相關(guān)因素是老師的學(xué)歷、職稱以及教齡;職稱為講師、教齡較長或者高級職稱、高學(xué)歷的老師教學(xué)質(zhì)量較好。張震等[6]將評價指標(biāo)大致分為教學(xué)看法、教學(xué)內(nèi)容、教學(xué)水平以及老師討論力量,利用關(guān)聯(lián)規(guī)章進行數(shù)據(jù)挖據(jù)。戴俊[7]以老師因素,同學(xué)因素,師生雙方因素以及環(huán)境因素和考試成果作為變量,通過主成分回來方法對影響課堂教學(xué)效果的因素進行分析,為改良教學(xué)評價方式與提高課堂教學(xué)效果供應(yīng)理論參考。許云華等[8]設(shè)計調(diào)查問題為“您最想對課堂教學(xué)提的看法”“改良方法”“如何實現(xiàn)從被動學(xué)習(xí)向動汲取學(xué)問的轉(zhuǎn)變”,基于扎根理論對上述問題答案進行分析并得出分析結(jié)果。柴志賢和邱風(fēng)[9]借鑒過程—成果討論方法,在以往討論的老師職稱、年齡、所教班級、課程類別這些老師背景變量的基礎(chǔ)上,增加教學(xué)素養(yǎng)、教學(xué)技能與教學(xué)責(zé)任心這三個影響因子進行分析,從而為提高高校課堂教學(xué)效果供應(yīng)肯定閱歷指導(dǎo)。

二、理論

〔一〕支持向量機〔SVM〕

支持向量機是由CorinnaCortes和Vapnik等在1995年首先提出的,是一種基于統(tǒng)計學(xué)習(xí)原理的數(shù)據(jù)挖掘技術(shù)。支持向量機分為支持向量回來機和支持向量分類機,本文主要應(yīng)用支持向量分類機進行數(shù)據(jù)挖掘。支持向量機分類的核心是找到兩互相平行并且間隔〔margin〕最大,并能將屬于不同類別的樣本點正確分開的邊界,位于兩邊界中間位置并與之平行的超平面,稱之為最大邊界超平面,即為最終解。

〔二〕TF-IDFTF-IDF

是一種推斷詞語在文件中重要性程度的加權(quán)統(tǒng)計方法。一個詞語在文件中消失的頻率越高,它對這個文件來說就越重要;這個詞語在整個語言中消失的頻率越高,它對這個文檔來說越不重要。TF-IDF可以利用計算機技術(shù)在不需要人工進行干預(yù)的狀況下提取文件中的關(guān)鍵詞,并快速對詞頻進行統(tǒng)計,常被用于文本挖掘和信息檢索等前言領(lǐng)域。TF-IDF的主要思想是:若某個詞在其他文件中很少消失,但在這一文件中消失的頻率高,那么它極有可能反映了這一文件的特性,則認(rèn)為它很適合用來分類,由于它具有很好的類別區(qū)分力量。TF-IDF事實上代表的是TF*IDF,TF表示詞頻,IDF表示逆文件頻率。

三、模型

〔一〕數(shù)據(jù)來源

1.變量選取

為了獲得老師因素、同學(xué)因素以及環(huán)境因素這三個變量的收稿日期:有效數(shù)據(jù),筆者細(xì)心設(shè)計一份調(diào)查問卷,影響因素分為老師、同學(xué)及環(huán)境。老師因素中包括:學(xué)與生互動狀況、授課方法、課堂考勤、按時上下課、PPT使用狀況、一般話水平、講課聲音大小、作業(yè)布置狀況以及課程考查形式。同學(xué)因素包括:出勤狀況、遇到問題溝通狀況、課下與同學(xué)和老師溝通狀況、學(xué)習(xí)狀態(tài)、聽課表現(xiàn)、上課做筆記狀況、課程內(nèi)容把握狀況以及課堂上的感受。環(huán)境因素包括:上課時周邊環(huán)境、所用教室類型、課程支配上下學(xué)期狀況、上機教學(xué)與否、教學(xué)設(shè)備、授課時間段、授課時長以及教室衛(wèi)生環(huán)境。

2.數(shù)據(jù)獵取

在調(diào)查對象的選擇上,我們主要以東北財經(jīng)高校討論生為調(diào)查對象,發(fā)放線上調(diào)查問卷,讓同學(xué)仔細(xì)對自己所學(xué)課程中某一門課的教學(xué)效果進行評價。

〔二〕數(shù)據(jù)挖掘過程及結(jié)果

〔1〕讀入數(shù)據(jù)。選擇源選項卡中的excel節(jié)點,將調(diào)查問卷中數(shù)據(jù)導(dǎo)入到clementine中。

〔2〕數(shù)據(jù)審核。選擇輸出選項卡中的數(shù)據(jù)審核節(jié)點連接到excel節(jié)點上,由審核結(jié)果可知,Q5變量的類別比為90∶9∶1,單個類別值過大,會影響建模的精確程度,故應(yīng)刪除。

〔3〕數(shù)據(jù)分區(qū)。利用分區(qū)節(jié)點將數(shù)據(jù)進行分區(qū),其中70%為訓(xùn)練集,其余30%為測試集。

〔4〕變量相關(guān)性分析。利用統(tǒng)計量節(jié)點分析變量之間的相關(guān)性,若相關(guān)性高,需要剔除相關(guān)變量,反之則不需剔除。經(jīng)測試,在本文的變量中未發(fā)覺高相關(guān)性變量,因此無需剔除變量。

〔5〕得分變量重新分類。利用“重新分類”節(jié)點將得分變量分類,其中0—7分為一類,8、9、10分為另一類。

〔6〕特征選擇建模。選擇建模選擇項卡中的特征選擇節(jié)點,將其連接到數(shù)據(jù)流的恰當(dāng)位置上。

〔7〕支持向量機建模。提取上一步得到的重要變量,選擇建模選擇項卡中的SVM節(jié)點進行建模。

〔8〕數(shù)據(jù)測試。測試過程和訓(xùn)練過程是相同的,且得到的精確率為93%,測試結(jié)果良好。

〔三〕文本挖掘過程及結(jié)果

1、數(shù)據(jù)清洗。原始調(diào)查問卷數(shù)據(jù)中包括文字,標(biāo)點符號。其中一些信息對關(guān)鍵詞抽取沒有關(guān)心,甚至?xí)?yán)峻影響討論。為了便利抽取工作順當(dāng)開展,有必要先對原始評論數(shù)據(jù)進行清洗,如“無”或“好”等,對問卷內(nèi)容沒有關(guān)心,進行直接刪除處理。

2、數(shù)據(jù)預(yù)處理。預(yù)處理可以把句子級別的文本數(shù)據(jù)劃分成可識別的`詞、詞組,主要包括分詞、詞性標(biāo)注和依存句法分析三個部分。在本文中使用LTP進行分詞。

3、關(guān)鍵詞提取。由于人工標(biāo)注會造成主觀干擾,本文為了減小人工標(biāo)注的主觀性影響,要利用TF-IDF算法自動提取關(guān)鍵詞。

四、結(jié)論及建議

〔一〕結(jié)論

同學(xué)、老師、環(huán)境三方面均對課堂接收效果產(chǎn)生較大影響。數(shù)據(jù)挖掘結(jié)果中,課堂愛好、學(xué)科把握內(nèi)容為同學(xué)因素,授課方法以及課堂互動屬于老師因素,排在其次位的上課周邊環(huán)境則是環(huán)境因素。文本挖掘結(jié)果中,同學(xué)、課程、仔細(xì)為同學(xué)因素,理論、講課、上課、教學(xué)、案例、互動屬于老師因素,教室則是環(huán)境因素。因此,三種因素均對課堂接收效果產(chǎn)生影響。利用文本挖掘與數(shù)據(jù)挖掘?qū)Ρ确治隹梢缘玫搅己玫挠懻摻Y(jié)果。文本挖掘與數(shù)據(jù)挖掘的結(jié)果中均表達出了同學(xué)因素、老師因素以及環(huán)境因素對課堂接收效果產(chǎn)生影響,并且兩種方法的分析結(jié)果中均以高頻率消失“互動”因素,印證了文中使用的兩種方法均可行并可得到較為精準(zhǔn)的結(jié)果。

〔二〕建議

增加課堂小組商量環(huán)節(jié)。集體商量是課堂中不行忽視的環(huán)節(jié),既可以活躍課堂的氣氛,交換看法觀點,拓寬學(xué)習(xí)范圍;又可以活躍同學(xué)思維,多角度綻開思索,提升解決問題的力量,避開傳統(tǒng)灌輸式的教學(xué)方式。增加師生課堂互動。加強師生互動,調(diào)動課堂氣氛,并利用實際問題創(chuàng)設(shè)情境,讓同學(xué)給出解決的方案,提高同學(xué)的學(xué)習(xí)愛好。增加課本學(xué)問與實際案例的結(jié)合。書本的學(xué)問往往是生硬抽象的,而結(jié)合實際的案例后,不僅可以使死板的課本學(xué)問更加形象生動,易于理解消化,融會貫穿于實際案例中;也可以提高同學(xué)的學(xué)習(xí)愛好,提升學(xué)習(xí)的主動性與主動性。增加課程實踐環(huán)節(jié)。將課本學(xué)問用于實際操作中,不僅可以升同學(xué)學(xué)習(xí)的樂趣,還可以使同學(xué)結(jié)合生活閱歷學(xué)習(xí)相關(guān)學(xué)問,更好地將書本學(xué)問用于實際學(xué)習(xí)以及將來的工作中,同時在實踐中深化對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論