主觀題自動評分算法分析與實現(xiàn)_第1頁
主觀題自動評分算法分析與實現(xiàn)_第2頁
主觀題自動評分算法分析與實現(xiàn)_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

主觀題自動評分算法分析與實現(xiàn)摘要:利用網(wǎng)絡(luò)進行考試將成為考試方式發(fā)展的必然趨勢。針對網(wǎng)絡(luò)考試系統(tǒng)中主觀題自動評分這個技術(shù)點展開研究,提出基于關(guān)鍵詞與語法相似度的主觀題自動評分算法,詳細闡述了實現(xiàn)的關(guān)鍵技術(shù),并通過實驗數(shù)據(jù)得出語法相似度閥值與閱卷比例參數(shù)的最佳參考值。關(guān)鍵詞:語法相似度;自動分詞;模式匹配;模糊匹配1主觀題人工閱卷思路與步驟教師在人工批改主觀題如名詞解釋與簡答題時,一般按照如下的思路與步驟:(1)確定主觀題標準答案的得分點,每一個得分點所對應(yīng)的關(guān)鍵詞,每一個關(guān)鍵詞的權(quán)值。(2)教師開始對學(xué)生答案進行評閱,將學(xué)生答案中出現(xiàn)的詞匯與標準答案中的關(guān)鍵詞進行比對,如果兩者相同或是近義詞,那么學(xué)生取得該得分點的分值,該題最后的總得分為所有得分點的總和。(3)為了防止學(xué)生在答題時只答關(guān)鍵詞,而出現(xiàn)語句不通的情況,教師在查找學(xué)生答案得分點的同時,也會查看學(xué)生答案語句的組織是否符合題目的要求,最后將根據(jù)實際情況作扣分處理。2主觀題自動評分算法設(shè)計思路人具有自己的思想,能獨立思考問題,并發(fā)執(zhí)行許多事情,但這對計算機來講就不行了。它只能模擬人工閱卷過程。以下為主觀題自動評分算法的設(shè)計思路:(1)評分結(jié)果是否正確合理與標準答案的確定有很大的關(guān)系,所以首先對標準答案進行如下處理:對標準答案進行分句處理,確定每一個分句的句子模式;確定每一個分句中的關(guān)鍵詞及每一個關(guān)鍵詞對應(yīng)的權(quán)值;建立關(guān)鍵詞的近義詞表。以上工作可以在出卷時完成,也可以在閱卷之前完成。(2)閱卷時通過程序?qū)W(xué)生答案進行如下處理:對學(xué)生答案進行分句預(yù)處理與處理,確定每一個分句的句子模式;將標準答案中的分句與學(xué)生答案中的分句進行模式匹配,保留有用的分句,刪除無用的分句,并得到該句語法相似度的值;對保留下來的有用分句采用最大正向匹配算法與現(xiàn)有詞庫進行對比,作自動分詞處理;將學(xué)生答案分詞處理后的關(guān)鍵詞與標準答案中的關(guān)鍵詞作模糊匹配處理,并得到關(guān)鍵詞得分;該題的最后得分為關(guān)鍵詞得分與語法相似度得分之總和。從上述處理過程不難看出,本算法的句子相似度等于語法相似度與語義相似度之和,語義相似度即關(guān)鍵詞匹配得分。(3)整個過程如圖1所示:圖1閱卷程序流程說明:由于學(xué)生答案中有可能會出現(xiàn)空格與回車等無用字符,所以在分句與分詞處理之前首先進行預(yù)處理,刪除無用字符。3實現(xiàn)的關(guān)鍵技術(shù)詞庫的建立標準答案與學(xué)生答案在進行自動分詞時都需要與詞庫中的詞進行比對來提取關(guān)鍵詞,因此詞庫的建立在網(wǎng)絡(luò)考試系統(tǒng)中占有重要的作用。為了提高自動分詞的效率,本算法在建立詞庫時附加兩個字段分別為首字編碼字段名為“WordCode”,詞長度字段名為“WordLength?\詞庫中的詞將按照“WordCode"與“WordLength”兩字段進行排序。在分詞檢索過程中,可先計算首字編碼的值,根據(jù)首字編碼的值在詞庫中查找相應(yīng)的詞,如沒有找到,將直接跳過本次搜索;如能找到再按詞長定位查找。采用此種方法將大大提高搜索的效率。除些之外,隨著大規(guī)模、可計算的語義知識庫《知網(wǎng)》的進一步完善和涵蓋專業(yè)領(lǐng)域的詞語逐步增多,建立一種通用的主觀題閱卷詞庫系統(tǒng)也將成為可能,在此不作進一步闡述。分句處理與語法相似度計算無論是標準答案還是學(xué)生答案都是以一段或幾段文本的形式呈現(xiàn),每段中包括若干語句。為了方便句子的模式匹配與關(guān)鍵詞的模糊匹配,首先需要將標準答案與學(xué)生答案進行分句處理。由于事先對學(xué)生答案進行了分句的預(yù)處理,所以答案前、后無用的空格、回車換行已刪除。接著便可以根據(jù)句號、分號、逗號、問號、感嘆號等標點符號對標準答案與學(xué)生答案進行分句處理了。在完成分句處理后,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論