




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 基于葉貝斯分類的個(gè)性化學(xué)習(xí)風(fēng)格研究 繆廣寒摘 要 利用數(shù)據(jù)挖掘技術(shù)中的貝葉斯分類技術(shù)可以對(duì)大量學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,確定其學(xué)習(xí)風(fēng)格,完善個(gè)性化特征提取,為系統(tǒng)進(jìn)一步的學(xué)習(xí)推薦與教學(xué)引導(dǎo)提供有效依據(jù),進(jìn)一步的提高學(xué)習(xí)質(zhì)量與效率?!娟P(guān)鍵詞】葉貝斯分類 數(shù)據(jù)挖掘 個(gè)性化學(xué)習(xí) 學(xué)習(xí)風(fēng)格網(wǎng)絡(luò)環(huán)境下的個(gè)性化學(xué)習(xí)是以學(xué)生作為教育系統(tǒng)的中心與教育服務(wù)主體。在個(gè)性化的教育系統(tǒng)中我們?cè)跔I造數(shù)字學(xué)習(xí)氛圍的同時(shí)要強(qiáng)調(diào)并堅(jiān)持學(xué)生的主體地位,開展個(gè)性化學(xué)習(xí),把它看作是一種探索式性、實(shí)踐性、創(chuàng)造性的學(xué)習(xí)。實(shí)現(xiàn)網(wǎng)絡(luò)個(gè)性化學(xué)習(xí)的關(guān)鍵在于根據(jù)學(xué)習(xí)者的信息數(shù)據(jù)分析提取個(gè)性化特征,進(jìn)
2、而實(shí)現(xiàn)對(duì)學(xué)習(xí)者的個(gè)性化推薦或教學(xué)指導(dǎo)。本文針對(duì)目前網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中存在的個(gè)性化單一與實(shí)現(xiàn)難度大的問題,利用葉貝斯分類算法解決學(xué)習(xí)風(fēng)格分類問題,讓學(xué)生更深入的了解自己的學(xué)習(xí)模式與需求,實(shí)現(xiàn)真正自主式、個(gè)性化學(xué)習(xí)。1 數(shù)據(jù)挖掘與分類1995年,美國計(jì)算機(jī)學(xué)會(huì)(association for computing machinery ,簡稱acm)組織提出了數(shù)據(jù)挖掘(data mining)概念。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先未知的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫中知識(shí)挖掘(knowledge discovery in
3、databases)、知識(shí)提?。╧nowledge extraction)、數(shù)據(jù)采礦等。數(shù)據(jù)挖掘是一個(gè)跨學(xué)科技術(shù)領(lǐng)域,它是數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)可視化、信息提取、并行計(jì)算和分布式計(jì)算等多個(gè)學(xué)科結(jié)合的產(chǎn)物。發(fā)現(xiàn)潛在未知的規(guī)則,是數(shù)據(jù)挖掘的重要特征也是它的目標(biāo),它與數(shù)據(jù)分析的差別在于數(shù)據(jù)分析通常從一個(gè)假設(shè)出發(fā),通過建立方程、模型來驗(yàn)證假設(shè)是否成立,而數(shù)據(jù)挖掘則是直接挖掘信息之中隱藏的規(guī)律,發(fā)現(xiàn)新的知識(shí)。分類是常用的數(shù)據(jù)挖掘手段之一。它是將一組組個(gè)體分門別類的歸入預(yù)先設(shè)定的幾個(gè)類中。分類的目的是建立一個(gè)分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到類別中的某一個(gè)類別。常用的分類方法有:決策樹
4、分類方法、貝葉斯分類方法和規(guī)則歸納方法。2 應(yīng)用葉貝斯分類算法判定學(xué)習(xí)風(fēng)格學(xué)習(xí)風(fēng)格是指學(xué)習(xí)者一貫持續(xù)的帶有個(gè)性特征的學(xué)習(xí)方式,它是學(xué)習(xí)傾向和學(xué)習(xí)策略的總和。學(xué)習(xí)風(fēng)格是個(gè)體在長期的學(xué)習(xí)過程中逐漸形成的,受特定的家庭、教育和社會(huì)文化的影響,通過個(gè)體自身長期的學(xué)習(xí)活動(dòng)而形成,具有鮮明的個(gè)性特征。心理學(xué)認(rèn)為人有七種學(xué)習(xí)風(fēng)格:linguistic(語言)、logical(邏輯)、visual(視覺)、musical(音樂)、kinesthetic(動(dòng)覺)、intrapersonal(內(nèi)?。┡cinterpersonal(人際)。使用葉貝斯分類算法我們可以通過分析學(xué)習(xí)記錄,獲得學(xué)生的學(xué)習(xí)風(fēng)格。 葉貝斯分類算
5、法基于貝葉斯定理,應(yīng)用于文本分類時(shí),通過計(jì)算文本屬于每個(gè)類別的概率.將該文本歸為概率最大的一類中。2.1 樸素貝葉斯分類和貝葉斯網(wǎng)絡(luò)貝葉斯定理是關(guān)于隨機(jī)事件a和b的條件概率和邊緣概率的一則定理。p(a|b) = p(ab) / p(b) = p(a)*p(b|a) / p(b)其中p(a|b)表示在b發(fā)生的情況下a發(fā)生的可能性。其中p(a)是a的先驗(yàn)概率或邊緣概率。(a|b)是已知b發(fā)生后a的條件概率, p(b|a)是已知a發(fā)生后b的條件概率, p(b)是b的先驗(yàn)概率或邊緣概率,也作標(biāo)準(zhǔn)化常量。由此,貝葉斯定理可表述為:后驗(yàn)概率 = (相似度*先驗(yàn)概率)/標(biāo)準(zhǔn)化常量由于,比例p(b|a)/p(
6、b)也有時(shí)被稱作標(biāo)準(zhǔn)相似度,所以貝葉斯定理又可表述為:后驗(yàn)概率 = 標(biāo)準(zhǔn)相似度*先驗(yàn)概率貝葉斯分類方法是基于貝葉斯定理的,樸素貝葉斯(naive bayes)和貝葉斯網(wǎng)絡(luò)(bayesian networks)看作是兩種不同情形下的分類方法。2.1.1 樸素貝葉斯分類樸素貝葉斯分類方法是一個(gè)基于概率的分類方法,它通過計(jì)算后驗(yàn)證概率的方法來確定所屬類別的概率。vj屬于v集合, 其中vmap是給定一個(gè)example,得到的最可能的目標(biāo)值。其中a1.an是這個(gè)example里面的屬性。這里面,vmap目標(biāo)值,就是后面計(jì)算得出的概率最大的一個(gè).所以用max 來表示。樸素貝葉斯分類默認(rèn)基于一個(gè)簡單的假定:
7、給定目標(biāo)值時(shí)屬性之間相互條件獨(dú)立。因此,該假定說明給定實(shí)力的目標(biāo)值情況下。觀察到聯(lián)合的a1,a2.an的概率正好是對(duì)每個(gè)通過概率計(jì)算,從待分類的樣本數(shù)據(jù)的屬性 a1,a2,.,an 中求出最可能的分類目標(biāo)值,即計(jì)算各類 vj v對(duì)于這組屬性的條件概率 p(vj|al,a2,.,an),其中j=1,2,.m(類別標(biāo)識(shí)數(shù)),并輸出條件概率最大的類別標(biāo)識(shí)作為該樣本數(shù)據(jù)的所屬類別。這個(gè)假設(shè)是樸素貝葉斯不同于貝葉斯網(wǎng)絡(luò)等其它貝葉斯分類算法的根本,也是樸素貝葉斯這個(gè)名稱的由來。2.1.2 貝葉斯網(wǎng)絡(luò)在實(shí)際應(yīng)用中,大多數(shù)情況下不支持樸素貝葉斯的假設(shè),即各特征并非彼此獨(dú)立,此情況下可以使用貝葉斯網(wǎng)絡(luò)進(jìn)行分類。
8、貝葉斯網(wǎng)絡(luò)是根據(jù)變量之間的依賴關(guān)系,使用圖論方法表示變量集合的聯(lián)合概率分布的圖形模型,它引入了一個(gè)有向無環(huán)圖(directed acyclic graph)和一個(gè)條件概率表集合。dag的結(jié)點(diǎn)v包括隨機(jī)變量(類別和特征),有向連接e(a->b)表示結(jié)點(diǎn)a是結(jié)點(diǎn)b的parent,且b與a是有依賴關(guān)系的。同時(shí)引入了一個(gè)條件性獨(dú)立(conditional independence)概念:即圖中任意結(jié)點(diǎn)v在給定v的parent結(jié)點(diǎn)的情況下,與圖中其它結(jié)點(diǎn)都是獨(dú)立的,也就是說p(v|par(v),x1,x2.,xn) = p(v|par(v)。這里par(v)表示v的parent結(jié)點(diǎn)集,x1,x2,
9、.,xn表示圖中其它結(jié)點(diǎn)。如果已知所有聯(lián)合概率值(joint distribution),那么就可以解決任何形式的概率問題。但現(xiàn)實(shí)中的特征集合數(shù)量過多(>10),幾乎無法通過統(tǒng)計(jì)得到。所以,這個(gè)問題要通過條件獨(dú)立的概念來對(duì)各條件概率值進(jìn)行優(yōu)化來解決。貝葉斯網(wǎng)絡(luò)的建模有兩個(gè)步驟:創(chuàng)建網(wǎng)格結(jié)構(gòu)與估計(jì)每一個(gè)結(jié)點(diǎn)的概率表中的概率值。endprint2.2 貝葉斯分類過程在本學(xué)習(xí)系統(tǒng)中,主要使用樸素貝葉斯分類方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類。2.2.1 建立樣本數(shù)據(jù)根據(jù)體育學(xué)科的學(xué)習(xí)特點(diǎn),我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡要概括為視覺型(v)、語言型(l)和動(dòng)覺型(k)。把每一個(gè)學(xué)習(xí)
10、者看作一個(gè)矢量 s,學(xué)習(xí)者的每一次學(xué)習(xí)記錄作為屬性 ai,學(xué)習(xí)者的風(fēng)格(視覺型、聽覺型和動(dòng)覺型)作為可能的類別 c,對(duì)于隨機(jī)分類向量s=a1,a2,an,由此知道 s對(duì)每個(gè)類別的概率p( ci|s)分布,其中p( ci|s) 由貝葉斯公式p( ci|s)=p( s|ci)p(ci )/p(s ) 計(jì)算得到,概率最大的那個(gè)就是 s的預(yù)測(cè)類別。當(dāng)學(xué)生登入系統(tǒng)時(shí),系統(tǒng)首先根據(jù)學(xué)號(hào)查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄,如果有,系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容,如果無,則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。經(jīng)過數(shù)據(jù)預(yù)處理,我們可以確保建模的數(shù)據(jù)是正確有效的
11、。分析處理中我們需要得到分類模型需要的訓(xùn)練樣本集的相關(guān)屬性,包括文本學(xué)習(xí)次數(shù)(t)、視頻學(xué)習(xí)次數(shù)(v)、活動(dòng)次數(shù)(a)、文本學(xué)習(xí)平均成績(ts)、視頻學(xué)習(xí)平均成績(vs)、活動(dòng)成績(as)、學(xué)習(xí)風(fēng)格類型(s)。當(dāng)學(xué)生登錄次數(shù)達(dá)到某值時(shí),系統(tǒng)自動(dòng)將這些屬性值計(jì)算并存儲(chǔ)。在分析訓(xùn)練樣本時(shí)我們把學(xué)習(xí)次數(shù)屬性值分為10 三個(gè)區(qū)間,將成績分為 a(90-100) 、b(75-89)、 c(60-74)、 d(< 60)。樸素貝葉斯分類法對(duì)于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績這類連續(xù)屬性的類條件概率計(jì)算,一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進(jìn)而離散化,或是通過訓(xùn)練數(shù)據(jù)估計(jì)分布的參數(shù)。2.2.2 建立學(xué)習(xí)風(fēng)格建模根據(jù)
12、貝葉斯的最大后驗(yàn)準(zhǔn)則,對(duì)任一未知樣本 s=a1,a2,an,確定后驗(yàn)概率 p(cj| a1,a2,an),把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為:(1)計(jì)算得到每一種學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率p(ci )。(2)相對(duì)于每個(gè)類別的概率 p(aj|ci),訓(xùn)練樣本集計(jì)算得出各屬性的所有取值。(3)計(jì)算出未知樣本對(duì)三種類別的概率,選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。其中,建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。2.2.3 建立算法根據(jù)上述分析,設(shè)計(jì)算法如下:初始化訓(xùn)練集d;計(jì)算每個(gè)學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。3 結(jié)論本文將葉貝
13、斯算法應(yīng)用在判定學(xué)習(xí)者的學(xué)習(xí)風(fēng)格中,發(fā)現(xiàn)了學(xué)生的學(xué)習(xí)成績、學(xué)習(xí)興趣與學(xué)習(xí)風(fēng)格之間的潛在聯(lián)系。經(jīng)過實(shí)際應(yīng)用發(fā)現(xiàn)當(dāng)樸素貝葉斯分類的假定條件成立時(shí),它是一種非常精確的分類方法。 使用貝葉斯分類對(duì)系統(tǒng)中的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類,其特點(diǎn)主要有:(1)它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法,可以利用領(lǐng)域知識(shí)和其它先驗(yàn)信息,計(jì)算假設(shè)概率。(2)可以把所有的屬性都參與分類。(3)針對(duì)離散屬性的對(duì)象進(jìn)行分析。(4)數(shù)據(jù)樣本可以增加也可以減少,這樣可以進(jìn)行增量學(xué)習(xí)。(5)利用有向圖的表示方式非常直觀,弧表示變量之間的關(guān)系。參考文獻(xiàn)1田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實(shí)現(xiàn)d.碩士學(xué)位論文,吉林:吉林大學(xué),
14、2011(05).2鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個(gè)性化屬性調(diào)查及啟示j.現(xiàn)代教育技術(shù),2003.13(1):49-54.3凌江榮.在e_learning中建立自適應(yīng)學(xué)習(xí)路徑的研究d.碩士學(xué)位論文,湖南:湘潭大學(xué),2007.4田曉輝.基于web的個(gè)性化學(xué)習(xí)系統(tǒng)在遠(yuǎn)程教育中的應(yīng)用研究d.碩士學(xué)位論文,西安:陜西師范大學(xué),2007.5史春秀.基于數(shù)據(jù)挖掘的個(gè)性化學(xué)習(xí)系統(tǒng)的研究d.碩士學(xué)位論文,天津:天津大學(xué),2007.6王志平.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)的研究d.碩士學(xué)位論文,重慶:重慶大學(xué),2007.作者單位1.無錫高等師范學(xué)校 江蘇省無錫市 2140002.無錫城市職業(yè)技術(shù)學(xué)院 江蘇省無錫
15、市 214000endprint2.2 貝葉斯分類過程在本學(xué)習(xí)系統(tǒng)中,主要使用樸素貝葉斯分類方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類。2.2.1 建立樣本數(shù)據(jù)根據(jù)體育學(xué)科的學(xué)習(xí)特點(diǎn),我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡要概括為視覺型(v)、語言型(l)和動(dòng)覺型(k)。把每一個(gè)學(xué)習(xí)者看作一個(gè)矢量 s,學(xué)習(xí)者的每一次學(xué)習(xí)記錄作為屬性 ai,學(xué)習(xí)者的風(fēng)格(視覺型、聽覺型和動(dòng)覺型)作為可能的類別 c,對(duì)于隨機(jī)分類向量s=a1,a2,an,由此知道 s對(duì)每個(gè)類別的概率p( ci|s)分布,其中p( ci|s) 由貝葉斯公式p( ci|s)=p( s|ci)p(ci )/p(s ) 計(jì)算得到,概率最大
16、的那個(gè)就是 s的預(yù)測(cè)類別。當(dāng)學(xué)生登入系統(tǒng)時(shí),系統(tǒng)首先根據(jù)學(xué)號(hào)查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄,如果有,系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容,如果無,則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。經(jīng)過數(shù)據(jù)預(yù)處理,我們可以確保建模的數(shù)據(jù)是正確有效的。分析處理中我們需要得到分類模型需要的訓(xùn)練樣本集的相關(guān)屬性,包括文本學(xué)習(xí)次數(shù)(t)、視頻學(xué)習(xí)次數(shù)(v)、活動(dòng)次數(shù)(a)、文本學(xué)習(xí)平均成績(ts)、視頻學(xué)習(xí)平均成績(vs)、活動(dòng)成績(as)、學(xué)習(xí)風(fēng)格類型(s)。當(dāng)學(xué)生登錄次數(shù)達(dá)到某值時(shí),系統(tǒng)自動(dòng)將這些屬性值計(jì)算并存儲(chǔ)。在分析訓(xùn)練樣本時(shí)我們把學(xué)習(xí)次數(shù)屬性值分為10 三
17、個(gè)區(qū)間,將成績分為 a(90-100) 、b(75-89)、 c(60-74)、 d(< 60)。樸素貝葉斯分類法對(duì)于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績這類連續(xù)屬性的類條件概率計(jì)算,一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進(jìn)而離散化,或是通過訓(xùn)練數(shù)據(jù)估計(jì)分布的參數(shù)。2.2.2 建立學(xué)習(xí)風(fēng)格建模根據(jù)貝葉斯的最大后驗(yàn)準(zhǔn)則,對(duì)任一未知樣本 s=a1,a2,an,確定后驗(yàn)概率 p(cj| a1,a2,an),把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為:(1)計(jì)算得到每一種學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率p(ci )。(2)相對(duì)于每個(gè)類別的概率 p(aj|ci),訓(xùn)練樣本集計(jì)算得出各屬性的所有取值。(3)計(jì)算出未知樣本對(duì)三種
18、類別的概率,選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。其中,建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。2.2.3 建立算法根據(jù)上述分析,設(shè)計(jì)算法如下:初始化訓(xùn)練集d;計(jì)算每個(gè)學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。3 結(jié)論本文將葉貝斯算法應(yīng)用在判定學(xué)習(xí)者的學(xué)習(xí)風(fēng)格中,發(fā)現(xiàn)了學(xué)生的學(xué)習(xí)成績、學(xué)習(xí)興趣與學(xué)習(xí)風(fēng)格之間的潛在聯(lián)系。經(jīng)過實(shí)際應(yīng)用發(fā)現(xiàn)當(dāng)樸素貝葉斯分類的假定條件成立時(shí),它是一種非常精確的分類方法。 使用貝葉斯分類對(duì)系統(tǒng)中的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類,其特點(diǎn)主要有:(1)它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法,可以利用領(lǐng)域知識(shí)和其它先驗(yàn)信息,計(jì)算假
19、設(shè)概率。(2)可以把所有的屬性都參與分類。(3)針對(duì)離散屬性的對(duì)象進(jìn)行分析。(4)數(shù)據(jù)樣本可以增加也可以減少,這樣可以進(jìn)行增量學(xué)習(xí)。(5)利用有向圖的表示方式非常直觀,弧表示變量之間的關(guān)系。參考文獻(xiàn)1田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實(shí)現(xiàn)d.碩士學(xué)位論文,吉林:吉林大學(xué),2011(05).2鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個(gè)性化屬性調(diào)查及啟示j.現(xiàn)代教育技術(shù),2003.13(1):49-54.3凌江榮.在e_learning中建立自適應(yīng)學(xué)習(xí)路徑的研究d.碩士學(xué)位論文,湖南:湘潭大學(xué),2007.4田曉輝.基于web的個(gè)性化學(xué)習(xí)系統(tǒng)在遠(yuǎn)程教育中的應(yīng)用研究d.碩士學(xué)位論文,西安:陜西師范大學(xué)
20、,2007.5史春秀.基于數(shù)據(jù)挖掘的個(gè)性化學(xué)習(xí)系統(tǒng)的研究d.碩士學(xué)位論文,天津:天津大學(xué),2007.6王志平.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)的研究d.碩士學(xué)位論文,重慶:重慶大學(xué),2007.作者單位1.無錫高等師范學(xué)校 江蘇省無錫市 2140002.無錫城市職業(yè)技術(shù)學(xué)院 江蘇省無錫市 214000endprint2.2 貝葉斯分類過程在本學(xué)習(xí)系統(tǒng)中,主要使用樸素貝葉斯分類方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類。2.2.1 建立樣本數(shù)據(jù)根據(jù)體育學(xué)科的學(xué)習(xí)特點(diǎn),我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡要概括為視覺型(v)、語言型(l)和動(dòng)覺型(k)。把每一個(gè)學(xué)習(xí)者看作一個(gè)矢量 s,學(xué)習(xí)者的每一
21、次學(xué)習(xí)記錄作為屬性 ai,學(xué)習(xí)者的風(fēng)格(視覺型、聽覺型和動(dòng)覺型)作為可能的類別 c,對(duì)于隨機(jī)分類向量s=a1,a2,an,由此知道 s對(duì)每個(gè)類別的概率p( ci|s)分布,其中p( ci|s) 由貝葉斯公式p( ci|s)=p( s|ci)p(ci )/p(s ) 計(jì)算得到,概率最大的那個(gè)就是 s的預(yù)測(cè)類別。當(dāng)學(xué)生登入系統(tǒng)時(shí),系統(tǒng)首先根據(jù)學(xué)號(hào)查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄,如果有,系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容,如果無,則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。經(jīng)過數(shù)據(jù)預(yù)處理,我們可以確保建模的數(shù)據(jù)是正確有效的。分析處理中我們需要得到分類模型
22、需要的訓(xùn)練樣本集的相關(guān)屬性,包括文本學(xué)習(xí)次數(shù)(t)、視頻學(xué)習(xí)次數(shù)(v)、活動(dòng)次數(shù)(a)、文本學(xué)習(xí)平均成績(ts)、視頻學(xué)習(xí)平均成績(vs)、活動(dòng)成績(as)、學(xué)習(xí)風(fēng)格類型(s)。當(dāng)學(xué)生登錄次數(shù)達(dá)到某值時(shí),系統(tǒng)自動(dòng)將這些屬性值計(jì)算并存儲(chǔ)。在分析訓(xùn)練樣本時(shí)我們把學(xué)習(xí)次數(shù)屬性值分為10 三個(gè)區(qū)間,將成績分為 a(90-100) 、b(75-89)、 c(60-74)、 d(< 60)。樸素貝葉斯分類法對(duì)于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績這類連續(xù)屬性的類條件概率計(jì)算,一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進(jìn)而離散化,或是通過訓(xùn)練數(shù)據(jù)估計(jì)分布的參數(shù)。2.2.2 建立學(xué)習(xí)風(fēng)格建模根據(jù)貝葉斯的最大后驗(yàn)準(zhǔn)則,對(duì)任一未知樣本 s=a1,a2,an,確定后驗(yàn)概率 p(cj| a1,a2,an),把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為:(1)計(jì)算得到每一種學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率p(ci )。(2)相對(duì)于每個(gè)類別的概率 p(aj|ci),訓(xùn)練樣本集計(jì)算得出各屬性的所有取值。(3)計(jì)算出未知樣本對(duì)三種類別的概率,選取概率最大的類別為學(xué)生的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 婚介公司合同(2025年度)-婚戀品牌推廣與營銷協(xié)議
- 2025股東股權(quán)協(xié)議:智慧城市建設(shè)與運(yùn)營
- 二零二五年度蔬菜大棚租賃權(quán)及經(jīng)營權(quán)整體轉(zhuǎn)讓合同
- 二零二五醫(yī)療事故賠償協(xié)議書范本編寫指南
- 二零二五年度餐飲行業(yè)員工績效考核聘用合同
- 2025年度桶裝水電商平臺(tái)用戶數(shù)據(jù)分析與精準(zhǔn)營銷合同
- 二零二五年度車庫租賃與智能停車系統(tǒng)合作協(xié)議
- 2025年度珠寶店員工勞動(dòng)合同終止及后續(xù)服務(wù)合同
- 二零二五年度建筑工程安全生產(chǎn)監(jiān)督檢查合同
- 動(dòng)產(chǎn)拍賣委托代理協(xié)議書(2025年度藝術(shù)品拍賣合作)
- 2024年07月山東省泰山財(cái)產(chǎn)保險(xiǎn)股份有限公司2024年夏季校園招考29名工作人員筆試歷年參考題庫附帶答案詳解
- 臨床護(hù)理死亡病例討論
- 2025年廣東韶關(guān)城投集團(tuán)招聘筆試參考題庫含答案解析
- 醫(yī)療器械生產(chǎn)企業(yè)并購合同
- 2025版新能源汽車充電站建設(shè)合同含政府補(bǔ)貼及稅收優(yōu)惠條款
- 2025年北京國資公司招聘筆試參考題庫含答案解析
- 建設(shè)工程總承包EPC建設(shè)工程項(xiàng)目管理方案1
- iso28000-2022供應(yīng)鏈安全管理手冊(cè)程序文件表單一整套
- 養(yǎng)老院敬老院福利醫(yī)養(yǎng)機(jī)構(gòu)消防知識(shí)培訓(xùn)科普講座教學(xué)課件
- 子癇診斷及治療
- 2024年度酒店智能化系統(tǒng)安裝工程合同
評(píng)論
0/150
提交評(píng)論