郝元濤中山大學課程_第1頁
郝元濤中山大學課程_第2頁
郝元濤中山大學課程_第3頁
郝元濤中山大學課程_第4頁
郝元濤中山大學課程_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、廣東省高等教育教學改革項目申 請 書項目名稱:基于項目反應理論的醫(yī)學統(tǒng)計學標準化試題庫的建立及應用申 請 人: 郝元濤 申請學校: 中山大學 (蓋章)聯(lián)系 :傳 真:電子郵箱: 訪問路徑: 廣 東 省 教 育 廳 制二O一二年五月申請者的承諾與成果使用授權 本人自愿申報廣東省本科院校教育教學改革項目,認可所填寫的廣東省本科院校教育教學改革項目(以下簡稱為申請書)為有約束力的協(xié)議,并承諾對所填寫的申請書所涉及各項內(nèi)容的真實性負責,保證沒有知識產(chǎn)權爭議。課題申請如獲準立項,在研究工作中,接受廣東省教育廳或

2、其授權(委托)單位、以及本人所在單位的管理,并對以下約定信守承諾: 1.遵守相關法律法規(guī)。遵守我國著作權法和專利法等相關法律法規(guī);遵守我國政府簽署加入的相關國際知識產(chǎn)權規(guī)定。2.遵循學術研究的基本規(guī)范,恪守學術道德,維護學術尊嚴。研究過程真實,不以任何方式抄襲、剽竊或侵吞他人學術成果,杜絕偽注、偽造、篡改文獻和數(shù)據(jù)等學術不端行為;成果真實,不重復發(fā)表研究成果;維護社會公共利益,維護廣東省高等教育教學改革項目的聲譽和公信力,不以項目名義牟取不當利益。3.遵守廣東省本科院校教育教學改革項目有關管理規(guī)定以及廣東省財務規(guī)章制度。4.凡因項目內(nèi)容、成果或研究過程引起的法律、學術、產(chǎn)權或經(jīng)費使用問題引起的

3、糾紛,責任由相應的項目研究人員承擔。5.項目立項未獲得資助項目或獲得批準的資助經(jīng)費低于申請的資助經(jīng)費時,同意承擔項目并按申報預期完成研究任務。6.同意廣東省教育廳或其授權(委托)單位有權基于公益需要公布、使用、宣傳項目申請評審書內(nèi)容及相關成果。項目主持人(簽章):_ 年 月 日一、簡表項目簡況項目名稱醫(yī)學統(tǒng)計學標準化試題庫及計算機自適應考試系統(tǒng)的建立項目類別A、總體研究 B、專業(yè)大類 eq oac(,C)、教學管理 D、自選項目起止年月2013年1月-2014年12月項目申請人姓名郝元濤性別男出生年月1969.11專業(yè)技術職務/行政職務教授/黨委書記兼副院長最終學位/授予國家博士/中國所在學校

4、學校名稱中山大學郵政編碼510080訊地址廣東省廣州市中山二路74號中山大學北校區(qū)公共衛(wèi)生學院305室主要教學工作簡歷時間課程名稱授課對象學時所在單位1996年至今衛(wèi)生統(tǒng)計學預防醫(yī)學專業(yè)本科生48中山大學1996年至今醫(yī)藥數(shù)理統(tǒng)計藥學專業(yè)本科生32中山大學1996年至今MedicalStatistics醫(yī)學長學制學生48中山大學1996年至今MultivariateStatisticalMethods醫(yī)科研究生40中山大學主要教學改革和科學研究工作簡歷時間項目名稱獲獎情況2006-2007醫(yī)學統(tǒng)計學網(wǎng)絡課程的建設無2007-2010兒童生活質(zhì)量測定量表系列PedsQ

5、L 引進及考核無2009-2011醫(yī)學統(tǒng)計學試題庫及計算機自適應考試系統(tǒng)的建立無2011-2013ReformsofEducationonPublicHealth無項目組總?cè)藬?shù)職稱學位參加單位數(shù)高級中級初級博士后博士碩士125121371主要成員(不含申請 者)姓名性別出生年月職稱工作單位分工簽名張晉昕男1966.06副教授中山大學公共衛(wèi)生學院試題庫建設凌莉女1964.04教授中山大學公共衛(wèi)生學院試題庫建設林愛華女1963.06副教授中山大學公共衛(wèi)生學院試題庫建設顧菁女1977.08副教授中山大學公共衛(wèi)生學院試題庫建設吳少敏女1971.08實驗師中山大學公共衛(wèi)生學院試題庫管理朱淑明男1972.

6、11實驗師中山大學公共衛(wèi)生學院系統(tǒng)維護曾芳芳女1979.09實驗師中山大學公共衛(wèi)生學院系統(tǒng)維護黃勇男1987.01研究生中山大學公共衛(wèi)生學院試題分析錄入鄧特男1987.07研究生中山大學公共衛(wèi)生學院試題分析錄入鄭巧蘭女1987.08研究生中山大學公共衛(wèi)生學院試題分析錄入陳龍男1988.03研究生中山大學公共衛(wèi)生學院試題分析錄入二、立項依據(jù):(項目的意義、現(xiàn)狀分析)1 研究背景考試是指通過書面、口頭提問或?qū)嶋H操作等方式,考查并測量參試者所掌握的知識和技能的狀態(tài)或水平的社會活動 ADDIN NE.Ref.9F65629D-19B1-4B7E-8933-F223BA0548A41。考試是教學過程中的

7、一個重要環(huán)節(jié),是評價教學質(zhì)量的重要手段,不僅可以規(guī)范和引導教師的教學行為,還可以促進學生積極學習,培養(yǎng)和提高學生分析問題、解決問題等綜合能力 ADDIN NE.Ref.7A9D5F3A-E0B0-4CA1-859E-3AF3FAD10FCC2,是教育管理必不可少的手段。那么,如何通過考試客觀、科學地評價每個考生的真實能力,充分發(fā)揮考試對教學的反饋作用,是教學過程中需要著力解決的一個重要問題??荚嚹芊駵蚀_測量考生對所學知識的掌握水平,很大程度上依賴于試題質(zhì)量的高低。高質(zhì)量的試題不僅具有良好的信度、效度,便于進行統(tǒng)計分析,而且還能夠考察學生對知識的理解、運用的真實能力,全面反映學生的學習成果及老師

8、的授課效果。為了實現(xiàn)科學化、標準化、規(guī)范化、公正化的考試,充分發(fā)揮考試的積極作用,建立高質(zhì)量的標準化試題庫 ADDIN NE.Ref.60C8F0AD-E960-4D98-A934-580BC02EC4773是行之有效的方法途徑。優(yōu)質(zhì)試題庫的構(gòu)建不僅能夠大大減輕教師的工作負擔,有利于促進學風、教風的建設,還能夠更好地對試卷和考生作答情況進行分析,也有利于教學管理工作的科學化、規(guī)范化,最終促進教學水平及質(zhì)量的不斷提高。此外,如何借助計算機系統(tǒng)從已建立好的標準化試題庫中快速有效地抽取試題、組成高質(zhì)量試卷,以及如何以最少的試題量準確、有針對性地考察考生的能力是題庫建設的重要問題,因此,在智能組卷過程

9、中應選擇合適的自動組卷算法,使得組成的試卷能夠滿足用戶的各種需求,并進一步實現(xiàn)基于計算機的自適應考試。2 國內(nèi)外研究現(xiàn)狀2.1 試題庫研究現(xiàn)狀2.1.1 國外研究現(xiàn)狀題庫(Item Bank)一詞,本意為試題的有序集合 ADDIN NE.Ref.5A6E9850-8953-4AB7-9599-2CE4EF6779394,起源于60年代英國的一個全國教育研究課題。題庫并不是將某一科目的練習題或考試題簡單地進行收集并存入計算機 ADDIN NE.Ref.47DDD9DC-8909-4ECF-A87E-D60C9FED1A685, 6。這種做法得到的充其量只是一個習題集,是題目堆積的倉庫,并不是試題

10、庫。完整意義上的題庫,除了具有錄入存儲試題的功能外,還應具備查詢功能、智能組卷、分析反饋等功能,它相當于一個數(shù)據(jù)庫,可以對試題進行調(diào)用,更改。因此,題庫與一般的題集(Item Pool)是不同的,并不是未經(jīng)加工處理的試題的簡單堆集 ADDIN NE.Ref.23B86F57-C6F4-46DE-882D-852D18F6E0DA1。題庫問題的提出、發(fā)展,與計算機技術的日益革新、迅速發(fā)展是不可分割的。計算機技術的日趨成熟、大眾化、普及化,為建立智能化、高質(zhì)量、大容量的題庫提供了堅實的硬件基礎條件。國外題庫的發(fā)展有較長的歷史,最早利用計算機進行題庫管理的是CTSS系統(tǒng)(Classroom Teac

11、her Supporting System) ADDIN NE.Ref.077196D9-0646-4790-AE75-008F360F93F97,該系統(tǒng)是IBM公司和洛杉磯學區(qū)于1968年共同開發(fā)的,最初管理一個美國歷史題庫,該題庫包含800道試題,能為中學教師生成測驗試卷、家庭作業(yè)及課堂討論題等等。后來,加利福尼亞州開發(fā)了一個更為龐大的題庫系統(tǒng),該系統(tǒng)擁有11個學科試題庫,這些試題庫中所包含的題目數(shù)多則上萬,少至數(shù)百。題庫的建立與發(fā)展離不開一定的教育測量理論的指導,最初的題庫是以經(jīng)典測量理論(Classic Test Theory, CTT)為依據(jù)的。CTT經(jīng)過百年發(fā)展,在理論與方法上已相

12、當成熟,以CTT為指導編制的測驗在各行各業(yè)中得到了廣泛、成功的應用,但CTT仍存在很多無法克服的技術問題,如具有試題依賴性和樣本依賴性等 ADDIN NE.Ref.25083858-9062-42B8-A7BD-19142B9FCB148-10。于是,近代統(tǒng)計學家Rasch, Wright, Lord ADDIN NE.Ref.EA252851-10D0-4DF7-8126-40C57CE0579611等人進行了艱辛探索與不懈努力,在CTT的基礎上發(fā)展起來一種新的測量理論,即項目反應理論(Item Response Theory, IRT)。IRT依賴于幾項強勢基本假設,如單維性假設、局部獨立

13、性假設等 ADDIN NE.Ref.C8E24AD4-C5FD-4D04-96F5-D92F48E2F2B312,強調(diào)數(shù)學模型的建立 ADDIN NE.Ref.E4FF93E0-92C8-494F-9B7D-0CBD21EB127E13, 14和試題參數(shù)的估計,具有試題獨立性(即扣除了測量誤差的影響后,考生能力參數(shù)的估計值不會隨著試題的不同而改變)和樣本獨立性(即扣除了測量誤差的影響后,試題參數(shù)的估計值不會隨著考生的不同而改變),解決了CTT遇到的大部分問題,如今被廣泛應用于是題庫建設中。目前,基于IRT建立的試題庫已經(jīng)被大量應用于計算機自適應考試,且許多高校已經(jīng)引入IRT來評價考試試題,并做

14、了各種理論探討。如美國以IRT為基礎對研究生入學考試(Graduate Record Examination,GRE)、工商管理類研究生入學考試(Graduate for Management and Administration Test,GMAT)均實行了計算機自適應考試。此外,TOFEL考試中的試題評價也采用了IRT ADDIN NE.Ref.ACFCA1AC-F52B-4A79-9B92-C69BBE46E1C415。許多授證考試、認證考試(如醫(yī)護人員的資格考試、美國飛機駕駛員考試等)也都是基于IRT理論的。2.1.2 國內(nèi)研究現(xiàn)狀我國題庫建設與研究起步較晚,但發(fā)展迅速。上世紀80年代

15、中期,我國開始推廣與實施標準化考試,題庫建設迫在眉睫,許多學校及各種考試機構(gòu)均陸陸續(xù)續(xù)開始嘗試建立題庫,各種各樣的試題庫、多種學科的試題庫在這股建立題庫的熱潮構(gòu)建起來 ADDIN NE.Ref.69756A28-C7F0-4954-8843-A76038653E2F16。在這些眾多的早期試題庫中,主要有以下四種類型:1. 將試題按章節(jié)順序存儲的“題庫”這種類型的“題庫”僅僅將現(xiàn)有的試題按不同的章節(jié)劃分存放至試題庫中,存儲過程簡便易行,操作方便,但是每一道試題并未按所考查的知識點、所要達到的能力水平等指標進行劃分,試題的存放也沒有按科學、合理的順序進行,以至于在抽取試題、組卷過程中需要瀏覽考查章

16、節(jié)中存儲的所有試題才能完成任務,費時費力,效率低下。2. 整卷庫這種類型的“題庫”是以整套試卷為基本單位存放于試題庫中來進行存儲的,每一套試卷都含有固定數(shù)目和固定內(nèi)容的試題,每次舉行考試只需抽取一整套滿意的、符合要求的試卷即可,不必對試卷中的試題逐一進行挑選,方便快捷。但是,當試題庫中不存在滿足考試要求的試卷,且現(xiàn)有的試卷又結(jié)構(gòu)固化,不能夠進行靈活的調(diào)整時,往往就會陷入窘迫的狀況。3. 卡片庫這種類型的“題庫”的關鍵在于試題庫卡片的制作,試題庫卡片上包含每一道試題的詳細信息,如題型、分值、知識點、難度、區(qū)分度等指標,還包括試題的具體內(nèi)容、答案與評分標準等項目,最后將制作好的卡片分類保管,構(gòu)成題

17、庫??ㄆ瑤熳畲蟮娜秉c是未能將試題存儲在計算機中,脫離了現(xiàn)代化手段,倒是組卷時效率不高、費時費力。4. 理論框架庫這種類型的“題庫”具有相應的測量理論以及具體的計算機程序,雖然可廣泛適用于各個學科,但其僅僅是一個理論框架,未列出學科以及學科知識、能力層次分類細目,不能稱之為完整意義上的“試題庫”。雖然早期出現(xiàn)了以上多種多樣的試題庫,但是由于計算機技術等的限制,試題庫在當時并未得到大范圍的推廣應用。后來,教育技術、計算機技術、網(wǎng)絡技術的迅猛發(fā)展以及對題庫建設相關理論的深入研究,為我國試題庫的建設翻開了新的篇章。上世紀90年代初,國家也開始重視試題庫的建設,在國家有關項目的支持下,我國也建立了如高等

18、教育基礎學科系列試題庫、國家醫(yī)學水平考試題庫等一系列題庫系統(tǒng),此外,我國也對漢語水平考試(HSK)計算機試題庫的建立進行積極的探索與研究。目前,國內(nèi)許多高校都著眼于應用IRT建立標準化試題庫,如江西師范大學、北京師范大學、華東師范大學等,都為試題庫的建設積累了經(jīng)驗、鍛煉了隊伍,為在更大范圍內(nèi)開展試題庫建設打下了基礎,推動了試題庫建設工作的發(fā)展。2.1.3 醫(yī)學統(tǒng)計學試題庫研究現(xiàn)狀隨著現(xiàn)代醫(yī)學的發(fā)展,醫(yī)學統(tǒng)計學這門學科在搜集、整理、描述及推斷醫(yī)學數(shù)據(jù)乃至指導實驗設計等方面的作用和地位日益突出,該學科受到國內(nèi)外醫(yī)學院校越來越多的重視。醫(yī)學統(tǒng)計學(Medical Statistics)是應用數(shù)統(tǒng)計學

19、的原理與方法研究居民健康狀況以及衛(wèi)生服務領域中數(shù)據(jù)的收集、整理和分析的一門科學 ADDIN NE.Ref.52A7CFD5-17D5-4746-80AA-C2182B68974317。這是一門理論性與實踐性很強的學科,其教學內(nèi)容除了基本的理論知識外,還包括一些統(tǒng)計軟件的操作與使用方法,如SAS軟件、SPSS軟件等,因此,考試方式也是多種多樣的,包括理論考試與上機考試,其考試的客觀性、公正性也是至關重要的。目前,在國內(nèi)許多醫(yī)學院校,醫(yī)學統(tǒng)計學這門課程是面向不同專業(yè)(如預防專業(yè)、藥學專業(yè)、護理專業(yè)、口腔專業(yè)、康復專業(yè)、法醫(yī)專業(yè)等等)的學生開設的,不同專業(yè)對該學科的需求不一,學生的學習習慣與能力水平

20、也不等,教師對不同專業(yè)的學生制定的教學目標和采取的教學方法也不盡相同,然而,每次參加醫(yī)學統(tǒng)計學考試的不同專業(yè)的學生卻逐年增多,考試的公正性也隨之成為師生關注的焦點。傳統(tǒng)的考試方式采用人工形式,包括命題、試卷編制、監(jiān)考、教師閱卷、成績統(tǒng)計、試卷分析等步驟,工作量巨大,且容易出現(xiàn)差錯,使考試的客觀性、公平性遭到質(zhì)疑,因此,醫(yī)學統(tǒng)計學考試方式改革便逐漸提上日程。正如前所述,建立標準化的試題庫可以有效解決存在于醫(yī)學統(tǒng)計學考試中的種種問題。標準化試題庫是以單個試題為基本單位的,操作起來方便靈活,試題庫中的試題質(zhì)量高、數(shù)量大、對知識點的覆蓋面廣,并且每一道試題都具有難度、區(qū)分度等屬性指標,此外,這些試題按

21、照一定的秩序存放在試題庫中,出卷者可以根據(jù)不同的目的、不同的需求抽取相應的試題,組合成滿意的試卷對考生施測,方便快捷、省時省力、大大提高了效率。當前,不同學校對醫(yī)學統(tǒng)計學的試題庫建立方法及采取的考試方式不盡相同:有的學校建立了“整卷庫”,以整套試卷為單位進行存儲,考試時隨機抽取一套試卷對考生施測,這種方式固化了試卷結(jié)構(gòu),不能根據(jù)實際需求靈活調(diào)整;有的學校簡單的將試題按章節(jié)存放在一起,試題未經(jīng)測試與合理的分析,未按能力層次及學科要求進行劃分,考試時按章節(jié)選出一部分試題組卷,費時又費力;還有的學校并未建立試題庫,而是指定每位代課老師出一定數(shù)量的題目,最后把所有老師提交的題目匯總、組合成卷,由于代課

22、老師往往根據(jù)課堂上強調(diào)的授課重點出題,帶有暗示性質(zhì),因此并不能全面考察學生的真實水平。此外,多數(shù)試題庫是依據(jù)經(jīng)典測量理CTT論建立的,CTT本身又存在很多缺陷,難以保證考試的客觀公正性。可見,當前的醫(yī)學統(tǒng)計學試題庫建立及考試制度存在諸多問題,為了解決這些問題,醫(yī)學統(tǒng)計學標準化試題庫的建立以及考試方式的改革勢在必行。2.2 自動組卷系統(tǒng)和計算機自適應考試如何組織試卷,采用何種測試方式可以更好的評價學生的能力,是高校教育面臨的又一個現(xiàn)實問題??荚嚦鼍硎且豁椃爆嵉墓ぷ鳎枰C合考慮多方面的影響因素。利用計算機管理試題庫,自動生成試卷是大勢所趨。自動組卷系統(tǒng)是計算機輔助教學的重要組成部分,其建立主要取

23、決于算法。以往的組卷系統(tǒng)多采用隨機選取法和回溯試探法 ADDIN NE.Ref.4F5E2AC6-3436-46CB-A6E2-E592F73CE27C18。前者根據(jù)狀態(tài)空間的控制指標,隨機抽取一道試題,此過程不斷重復,直到組卷完成或已無法從題庫中抽取滿足條件的試題為止。這種算法結(jié)構(gòu)簡單,但成功率低,時間消耗多。后者是將隨機選取法產(chǎn)生的每一狀態(tài)記錄下來,當搜索失敗時釋放上次記錄的狀態(tài)類型,然后再依據(jù)一定的規(guī)律變換一種新的狀態(tài)進行試探,通過不斷回溯試探直到試卷生成完畢或回到起點。但該算法對內(nèi)存的占用量大,程序結(jié)構(gòu)相對比較復雜,選取試題缺乏隨機性,并且組卷花費時間長。在此基礎上,人們尋找了一種新的

24、改進算法-遺傳算法,這種算法具有組卷效率高、速度快、數(shù)據(jù)庫冗余小的特點,并且具有自適應全局尋優(yōu)和智能搜索技術,收斂性好的優(yōu)點 ADDIN NE.Ref.018A3411-7B8B-4568-B979-E26081451D9019, 20。目前國內(nèi)某些高校開始嘗試基于遺傳算法來建立自動組卷系統(tǒng),但仍處于嘗試階段。計算機自適應考試(Computerized Adaptive Test, CAT) ADDIN NE.Ref.B64E7A20-7132-45CE-9B34-6B8DF3A2E0C821, 22是由一定量的試題組成試題庫,按照一定的策略進行選題,按規(guī)則結(jié)束測試,進行實時評分。這是構(gòu)建在I

25、RT基礎上的一種考試方式,它能根據(jù)考生答題的情況不斷計算受試者的能力值和信息量,并及時根據(jù)這些參數(shù)調(diào)整出題策略,最終給受試者一個恰當?shù)脑u價。這種新的考試方式避免了大量題目使學生感覺厭煩,也避免了過難的題目使學生感到沮喪,可以明顯減輕學生對于考試的焦慮情緒。隨著近年來計算機及網(wǎng)絡技術的發(fā)展,CAT在測量理論研究及時間應用中都取得了顯著的進步,國內(nèi)的HSK(中國漢語水平考試)以及國外的TOFEL和GRE等都是成功應用計算機自適應考試的例子?;谝陨显?,本研究擬以醫(yī)學統(tǒng)計學課程為試點,通過IRT對試題進行分析,科學評價各個試題參數(shù),并制定試題篩選標準,以合格的、優(yōu)秀的試題為單位輸入并存儲于試題庫,

26、形成有質(zhì)量保證的試題庫。通過計算機及網(wǎng)絡技術,建立自動組卷系統(tǒng)和計算機自適應考試系統(tǒng),通過兩個系統(tǒng)測量學生的能力。本研究將為今后各學科建立標準試題庫、開展計算機自適應考試、科學評價學生能力、充分發(fā)揮考試的反饋作用提供經(jīng)驗和示范。3 研究目的和意義隨著醫(yī)學統(tǒng)計學這一學科在現(xiàn)代醫(yī)學中的地位日益突出,國內(nèi)許多醫(yī)學院校選修這一門課程及參加該學科考試的學生也大大增加,然而目前多數(shù)學校在醫(yī)學統(tǒng)計學試題庫建立方面以及現(xiàn)有的考試制度均存在一定弊端,難以保證考試的客觀性、公正性。為了解決這一問題,本研究擬以項目反應理論為依據(jù),建立醫(yī)學統(tǒng)計學標準化試題庫,并采用遺傳算法建立自動組卷系統(tǒng),并實現(xiàn)計算機自適應考試系統(tǒng)

27、。建立與推廣應用高質(zhì)量、大容量、智能化的醫(yī)學統(tǒng)計學標準化試題庫以及采用遺傳算法實現(xiàn)自動組卷、建立計算機自適應考試系統(tǒng),不僅可以大大節(jié)省時間、人力,還能充分發(fā)揮考試的積極作用,全面反饋教學效果,促進良好的學風、教風、校風的形成,不斷提高教學質(zhì)量,最終為社會培養(yǎng)高素質(zhì)的醫(yī)學統(tǒng)計學人才,具有重大的實際意義。且本研究的研究成果將進一步豐富醫(yī)學統(tǒng)計學的內(nèi)容,鞏固其在國內(nèi)外教學中的領先地位。參考文獻1 漆書青. 現(xiàn)代測量理論在考試中的應用M. 華中師范大學出版社,2003.2 張定國,梁平. 試論題庫系統(tǒng)的研究與開發(fā)J. 撫州師專學報,1998(2):43-45.3 袁玉萍,代冬巖,汪洪艷. 高校試題庫理

28、論及題庫系統(tǒng)的建立J. 哈爾濱職業(yè)技術學院學報,2007(3):42-43.4 Hambleton R K. Item response theory: the three-parameter logistic modelM. Center for the Study of Evaluation, UCLA,1983.5 張峻. 建立基于試題庫的校內(nèi)統(tǒng)考機制實現(xiàn)教考分離J. 中國科教創(chuàng)新導刊,2010(28):9-10.6 漆書青,戴海琦,丁樹良. 現(xiàn)代教育與心理測量學原理Z. 北京:高等教育出版社,2002239-242.7 張倩倩. IRT在現(xiàn)代教育技術題庫構(gòu)建中的應用D. 山東師范大學,

29、2011.8 劉啟亮,孔外平. 談談心理與教育測量理論的發(fā)展J. 重慶科技學院學報(社會科學版),2008(2):195-197.9 韓耀風,郝元濤,方積乾. 項目反應理論及其在生存質(zhì)量研究中的應用J. 中國衛(wèi)生統(tǒng)計,2006(6):562-565.10 Fan X. Item response theory and classical test theory: An empirical comparison of their item/person statistics.J. Educational and Psychological Measurement,1998,58 (3):357-

30、381.11 Hambleton R K, Swaminathan H, Flay B R. Application of Item Response Theory Models for Intensive Longitudinal DataM. New York:Oxford University Press.,2006.84-108.12 Swaminathan H, Rogers H J, Hambleton R K. Fundamentals of item response theoryM. Newbury Park, Calif.:Sage Publications,1991.17

31、4.13 Tutz G. Sequential item response models with an ordered responseJ. British Journal of Mathematical and Statistical Psychology,1990,43(1):39-55.14 姚定康,梅長林,周全,等. 關于項目反應理論試題參數(shù)的估計J. 教育發(fā)展研究,2004(6):101-103.15 劉麗平,王文杰,郭世寧. 計算機自適應考試(CAT)系統(tǒng)題庫的設計與實現(xiàn)J. 計算機系統(tǒng)應用,2006(3):10-12.16 田雨. 高等教育試題庫建設及圖學類試題庫發(fā)展概況J.

32、工程圖學學報,2000(4):139-143.17 :/baike.baidu /view/1223973.htmZ.18 董躍武,黃凱東,勾學榮. 遺傳算法與試題庫自動組卷J. 中國遠程教育,2002(8):57-60.19 杜鵬東,田振清. 基于IRT指導的組卷策略的遺傳算法設計與實現(xiàn)J. 內(nèi)蒙古師范大學學報(自然科學漢文版),2007(2):164-167.20 張彥. 遺傳算法在計算機輔助考試系統(tǒng)自動組卷中的應用D. 太原理工大學,2006.21 方長福,詹沐清. 基于IRT理論的CAT系統(tǒng)的研究J. 科技信息,2009(24):79-80.22 劉麗平,王文杰,郭世寧. 計算機自適應

33、考試(CAT)系統(tǒng)題庫的設計與實現(xiàn)J. 計算機系統(tǒng)應用,2006(3):10-12.三、項目實施方案及實施計劃1.具體改革內(nèi)容、改革目標和擬解決的關鍵問題改革內(nèi)容(1)應用項目反應理論科學評價醫(yī)學統(tǒng)計學試題的各試題參數(shù),如難度、區(qū)分度、猜測度。(2)制定嚴格的試題篩選標準,選擇優(yōu)秀的試題進入試題庫。(3)采用計算機及網(wǎng)絡技術建立基于遺傳算法的自動組卷系統(tǒng),實現(xiàn)計算機自適應考試系統(tǒng)。(4)通過自動組卷系統(tǒng)和計算機自適應系統(tǒng)科學測試學生的能力,及時反饋教學過程中存在的問題。(5)動態(tài)維護、及時更新醫(yī)學統(tǒng)計學標準化試題庫。改革目標(1)建立基于現(xiàn)代測量理論(IRT)的醫(yī)學統(tǒng)計學標準化試題庫,題庫可應

34、用于不同專業(yè)(臨床醫(yī)學、預防醫(yī)學)、不同層次(???、本科、研究生)的考生。(2)建立自動組卷系統(tǒng)和計算機自適應考試系統(tǒng),并通過兩種系統(tǒng)科學評價學生的真實能力,及時反映教學質(zhì)量。擬解決的關鍵問題(1)在估計試題參數(shù)的過程中,對不同的題型應該采用何種項目反應理論模型來進行擬合;(2)試題參數(shù)估計出來以后,采用何種方法、何種軟件進行擬合優(yōu)度檢驗;(3)如何制定完備的試題篩選標準;(4)如何根據(jù)遺傳算法實現(xiàn)自動組卷系統(tǒng)。(5)如何實現(xiàn)計算機自適應考試系統(tǒng)。2.實施方案、實施方法、具體實施計劃(含年度進展情況)及可行性分析實施方案、實施方法、具體實施計劃本研究主要分為四個階段,第一階段是試題開發(fā)與施測階

35、段,第二階段是醫(yī)學統(tǒng)計學試題參數(shù)的估計階段,第三階段是試題庫的建立和維護階段,第四階段是建立基于遺傳算法的自動組卷系統(tǒng)和計算機自適應考試系統(tǒng)階段及實測階段。(1)試題開發(fā)與施測(2013.01-2013.06)搜集各大院校以及市面上出售的醫(yī)學統(tǒng)計學試題,或由專家編制新的試題,然后將這些試題組成不同的試卷,并對不同的考生進行施測。為了使不同試卷中的試題參數(shù)水平得以比較、促進試題題庫的發(fā)展,在組成不同試卷的過程中,采用定錨測驗設計的方法將不同的測驗進行銜接,以便于將多份測驗的試題參數(shù)估計值,放置在一個共同的量尺上。經(jīng)定錨測驗設計后組成的不同試卷(供20份試卷)中存在一部分共同試題,即定錨試題(其數(shù)

36、目大約是測驗試題數(shù)的20%到25%之間),而試卷中其他部分的試題是不同的。然后將這些含有部分共同試題的不同試卷給予不同的考生進行施測。為了保證試題參數(shù)估計值的精確性,解答每一份試卷的考生數(shù)量應足夠大(如:在采用項目反應理論中的單維三參數(shù)logistic模型進行分析時,考生數(shù)量至少為1000時,試題參數(shù)的估計值才可靠)。(2)試題參數(shù)估計(2013.07-2013.12)對數(shù)據(jù)進行分析時,應選擇合適的模型,且必須滿足模型應用的前提條件(如單維性、局部獨立性等)。1.對單項選擇題,其反應數(shù)據(jù)為二元化計分形式,采用項目反應理論中的單維三參數(shù)logistic模型(3 Parameter Logisti

37、c Model,3PLM)進行處理,其表達式如下: (1)其中表示考生能力估計值;表示第i題的區(qū)分度系數(shù);表示第i題的難度系數(shù);表示第i題的猜測度系數(shù);D表示標化因子,一般取D=1.702;Pi()表示能力為的考生答對此題目的概率。2. 對于簡答題和計算分析題,將原始分數(shù)進行轉(zhuǎn)化后,反應數(shù)據(jù)變換為多元計分形式,此時,可采用項目反應理論中的等級反應模型(Graded Response Model,GRM)。GRM假設每一個反應類別各自對應一條特征曲線,如果對某試題i而言,被試的反應可以劃分為k+1類,其得分可以表示如下:Xi=0,1,k,那么被試在該試題上恰好得某一等級k分的概率可表示如下: (

38、2)公式(2)中,Pi,k()表示對于試題i而言,能力值為的被試恰好得k分的概率;表示對于試題i而言,能力值為的被試得k分以及k分以上的概率,表示對于試題i而言,能力值為的被試得k+1分以及k+1分以上的概率。其中按雙參數(shù)logistic模型可以寫為: (3)公式(3)中,、ai、D的含義與公式(1)相同,bi,k表示第i題第k個等級的難度系數(shù)。采用以上兩個模型進行試題參數(shù)估計時,均采用邊際極大似然估計(Marginal Maximum Likelihood)法。若以表示能力為的考生對題目i的反應(答對1,答錯0)的概率,其對數(shù)似然函數(shù)表示為: (4)其中n為題目數(shù),表示考生答對第i題的概率,

39、表示考生答錯第i題的概率。當各參數(shù)的偏導數(shù)為0時函數(shù)取得最大值,分別求得每一個題目相應的各試題參數(shù)值。3. 試題參數(shù)擬合優(yōu)度檢驗調(diào)用SAS9.1軟件中的宏語句IRT-FIT對每一道單選題進行擬合優(yōu)度檢驗,以Pearson 檢驗的與似然比檢驗的兩個常用的擬合指標檢驗試題與理論模型的擬合情況。兩指標的計算公式如下:, (5), (6)以上兩公式中,表示題號,為考生作答第題時選擇的答案類別(),表示考生的總分,為總分為分考生總?cè)藬?shù),為作答第題時選擇的答案類別為且總分為分的考生的實際人數(shù),為作答第題時選擇的答案類別為且總分為分的考生的期望人數(shù)。(3)試題庫的建立與維護(2014.01-2014.05)

40、 = 1 * ROMAN I. 試題庫的建立:在建立試題庫的過程中,不是任意一道試題都能入庫,只有經(jīng)過嚴格篩選,性能優(yōu)良的試題才能存放在試題庫中。在篩選試題以決定哪些試題可以入庫時,不能僅以試題參數(shù)取值是否符合一定范圍作為能否進入試題庫的唯一標準,需同時考慮擬合效果、試題是否重復以及任課教師的專業(yè)意見。我們將從以下四方面對試題進行篩選:(1)數(shù)據(jù)與模型的擬合效果考察每一道試題的擬合情況,以與為指標,將、與事先規(guī)定的檢驗水準進行比較,挑選出同時在兩種指標下擬合效果良好的試題,初步考慮其能否進入試題庫。(2)試題參數(shù)的取值大小得到每一道試題的試題參數(shù)估計之后,首先對含有錨試題的不同試卷中的試題參數(shù)

41、進行等化,使所有試題參數(shù)均在同一量尺上。此外,試題各項參數(shù)應在一定范圍內(nèi)才能保證其優(yōu)良性。如試題難度過大或過小,會使分數(shù)呈偏態(tài)分布,從而使考試的信度系數(shù)值降低,因此,選取難度位于-4.0,4.0范圍內(nèi)的試題進入試題庫。區(qū)分度越大的題目,表明對學業(yè)水平不同的考生的鑒別力或區(qū)分能力越強。通常,教學過程結(jié)束后進行的考試,是以考察考生對知識掌握情況為目的的,因此,區(qū)分度不應過大,選取區(qū)分度位于0.0,3.0范圍內(nèi)的試題進入試題庫。此外,試題的猜測度也不應太大,猜測度系數(shù)過大的試題對于考察學生對知識的掌握意義不大,我們將猜測度位于0.0,0.2(每道單選題有五個選項)范圍內(nèi)的試題選入試題庫。(3)試題是

42、否相同由于在歷年考試試卷中可能存在相同的試題,因此,挑選出擬合優(yōu)良、試題各參數(shù)在規(guī)定范圍內(nèi)的試題以后,還應查看這些試題是否具有唯一性,即是否有相同的試題存在,若存在,則應刪除相同的試題,最后只保留一道參數(shù)估計標準誤最小的該試題即可。(4)統(tǒng)計教師專業(yè)意見經(jīng)過以上三層篩選,已初步提取了候選試題,最后,還要考慮統(tǒng)計教師的專業(yè)意見。邀請8-10位任課教師獨立地逐一對初步篩選的試題進行審核,以判斷每道試題知識點劃分是否準確、所屬認知層次劃分是否準確等,經(jīng)全部任課教師認可的試題方能最終進入試題庫。經(jīng)以上四步篩選出了最終能夠入庫的優(yōu)秀試題,并利用這些試題建立試題庫。除了將試題參數(shù)錄入試題庫外,各個試題還應

43、包括試題編號、題型、知識點、認知層次、參考答案、分值以及答題時間。試題編號為抽題時提供選擇標志,可以表示為1, 2, 3。試題題型表明試題所屬類型:A表示單項選擇題、B表示簡答題、C表示綜合分析題。知識點即某道試題屬于哪個知識點。認知層次指知識點所考察的能力層次,包括掌握(以“Z”表示)、熟悉(以“S”表示)、了解(以“L”表示)3個層次。參考答案用于存儲題目的評分答案。分值即表示每道試題的分值。答題時間指考生解答每一道題所用的最長時間。 = 2 * ROMAN II. 試題庫的維護:由專門的題庫管理員管理試題庫,試題庫不是一成不變的,試題庫應不斷更新。測試過程中,如題庫管理員發(fā)現(xiàn)有某些試題已

44、不適合用于測試(考察的內(nèi)容已不再符合教學大綱要求,知識點已經(jīng)更新等),應及時與任課教師討論,如一致認為不適合,則應把此種試題剔除試題庫。自動組卷系統(tǒng)試題庫在增加新的試題時,需由出題教師事先根據(jù)教學經(jīng)驗評估出試題的各項參數(shù),包括題型、難度、區(qū)分度、猜測度等。試題經(jīng)由出題小組認可后才能增加進入試題。自適應考試的試題庫分為測試子庫和試測子庫,測試子庫儲存用于測試的試題,而經(jīng)討論新增的題目,則應存放在試題庫內(nèi)的試測子庫中。采用樣本試測的方法來估計試題參數(shù),即在考試時同樣也抽取試測子庫的試題用于試測,由于在考試時,考生不知道這些題目的作答不會影響成績,同樣也會認真作答。當試測子庫的試題已經(jīng)經(jīng)過400次試

45、測后,則可根據(jù)這400次試測的數(shù)據(jù),使用IRT相應模型,采用最大邊緣似然估計來估計試測試題的各項參數(shù),得到試題參數(shù)后,試測試題就可以進入測試子庫,用于正式考試。(4)自動組卷系統(tǒng)和計算機自適應考試系統(tǒng)的建立及施測(2014.6-2014.12) = 1 * ROMAN I. 自動組卷系統(tǒng)的建立:自動組卷系統(tǒng)建立是一個目標函數(shù)和一組約束條件的組合優(yōu)化問題。首先需給出多個約束條件,包括試題類型比例、難度、區(qū)分度、猜測度、知識掌握程度比例、試卷總分以及考試時間共七個約束條件。這七個約束條件決定了一個n*7的矩陣S: 矩陣S的列元素分別滿足用戶對試卷的要求。本研究設定試卷指標f綜合反映這7個指標與用戶

46、要求的誤差,由于不同指標的重要程度不同,故整個試卷的誤差指標即為這7個指標的誤差加權和,用下式來表示: (7)其中表示第i個指標與用戶要求的誤差絕對值,表示第i個指標的權重?;诰仃嚲幋a的遺傳算法,通過適應度函數(shù)以及三種遺傳算子(選擇算子、交叉算子和選擇算子)來進行搜索試題,最終實現(xiàn)自動組卷。組卷就是從題庫中抽取試題,使整個試卷指標f最小。 = 2 * ROMAN II. 計算機自適應考試系統(tǒng)的建立:首先是探索學生的初始能力,以取得學生的能力初值??忌ㄟ^計算機客戶端登陸考試系統(tǒng),系統(tǒng)從題庫中抽取中等難度的試題,考生開始測試,系統(tǒng)根據(jù)考生對試題的反應抽取下一道試題,若考生能正確回答,則抽取難度

47、更加大的試題予以測試;若考生不能正確回答,則抽取難度相對較小的試題,直到考生既有答對的題目又有答錯的題目時,就可以初步估計考生的能力值。在估計出考生的能力初始值后,系統(tǒng)針對初始能力從題庫中抽取難度最適當、信息量最大的題目進行測試,并不斷估計能力值。當估計出的能力值趨于穩(wěn)定,達到一定測量精度為止,從而對考生的真實能力做出準確的評價。 抽題策略:不斷從試題庫中抽取與考生能力相適應的題目是正確估計真實能力的前提,本研究采用的是IRT最大信息函數(shù)來確定所選擇的題目。用表示信息函數(shù),它表示了題目參數(shù)和考生能力的關系。 (8)其中表示考生能力估計值,表示第i題的區(qū)分度系數(shù),表示第i題的難度系數(shù),表示第i題

48、的猜測度系數(shù),D表示標化因子。對于不同能力的考生,題目有不同的信息量,信息量最大時所對應的能力值是最適合采用此題目測試的考生的能力值。系統(tǒng)根據(jù)前面推斷的考生能力,自動搜尋相應信息量最大的題目進行測試,直到前后兩次估計出的考生能力值之差小于某一定數(shù)值。 能力估計:正確估計考生的能力是計算機自適應考試的最終目的。本研究采用極大似然法來估計考生的能力。以表示能力為的考生對題目i的反應(答對1,答錯0)的概率。通過一個似然函數(shù)來表示:其中n為題目數(shù),表示考生答對第i題的概率,表示考生答錯第i題的概率。對每一個向量求出相應的值,當然函數(shù)取最大值時得到的估計值。可行性分析:(1)成立了專門的指導小組、領導

49、小組,并有資深醫(yī)學統(tǒng)計學教師、計算機技術人員的協(xié)助。(2)有Epidata 3.1、MULTILOG 7.03、SAS 9.1等多種軟件系統(tǒng)的支持,硬件設施也齊全完備,教研室有大型并行計算機一臺,擁有獨立計算機房,配有多臺電腦,以便于資料查詢、數(shù)據(jù)錄入與結(jié)果分析。(3)實施科學的課題管理制度,每周召開課題研究分析會,及時發(fā)現(xiàn)解決課題研究中遇到的問題。(4)查閱了大量相關文獻,積累了豐富的的相關知識,初步探索了標準化試題庫建立的方法、自動組卷系統(tǒng)的實現(xiàn)方法,并且對于計算機自適應系統(tǒng)有一定程度的了解,能夠完成課題研究的各種工作。技術路線圖:整理考生反應組型,錄入數(shù)據(jù)基于MMLE,采用IRT單維三參

50、數(shù)logistic模型對單選題進行參數(shù)估計,應用等級反應模型對簡答題和計算分析題進行參數(shù)估計經(jīng)四層篩選,選擇優(yōu)秀試題進入試題庫由題庫管理員管理題庫并對其及時更新試題庫管理和維護階段抽取中等難度試題開始測試既有答對又有答錯題目是否能力初始值估計選擇信息量最大的試題進行測試滿足終止條件結(jié)束測試是否計算機自適應考試系統(tǒng)建立及施測階段建立約束條件矩陣基于遺傳算法,通過適應度函數(shù)以及三種遺傳算子搜索試題從題庫中抽取試題,使整份試卷指標f最小自動組卷施 測自動組卷及施測階段試題參數(shù)估計階段試題開發(fā)與施測階段搜集、編制試題,將通過定錨測驗設計的試卷對考生施測3.項目預期的成果和效果(包括成果形式,預期推廣、

51、應用范圍、受益面等)(1)建立醫(yī)學統(tǒng)計學標準化試題庫。(2)建立基于遺傳算法的自動組卷系統(tǒng)。(3)實現(xiàn)醫(yī)學統(tǒng)計學計算機自適應考試系統(tǒng)。(4)發(fā)表論文2-3篇。 醫(yī)學統(tǒng)計學試題庫以Excel形式進行存儲,方便易行,便于試題的增加或刪除等操作。自動組卷系統(tǒng)與計算機自適應考試系統(tǒng)都由相應的程序運行實現(xiàn),可向全國范圍內(nèi)醫(yī)學院校進行推廣和應用,以協(xié)助其按照不同目的要求自動生成試卷、并能針對個別的考生進行實測。本研究成果將進一步豐富國家級精品課程一醫(yī)學統(tǒng)計學的內(nèi)容,鞏固其在國內(nèi)外教學的領先地位。4.本項目的特色與創(chuàng)新之處(1)率先應用現(xiàn)代測量理論對試題參數(shù)進行估計,修正了經(jīng)典測量理論用于參數(shù)估計時的缺陷,

52、并以此為理論基礎構(gòu)建醫(yī)學統(tǒng)計學標準化試題庫。(2)首次將自動組卷系統(tǒng)和計算機自適應考試系統(tǒng)應用于醫(yī)學統(tǒng)計學的考試中,有助于減輕學生對考試的心理負擔,準確評價學生能力,正確反映教學質(zhì)量。四、教學改革基礎1.與本項目有關的教學改革工作積累和已取得的教學改革工作成績(1)查閱了大量國內(nèi)外文獻,對研究背景有足夠的了解。(2)對二元計分形式的數(shù)據(jù)進行了初步探索與分析,并能夠選擇合適的方法進行擬合優(yōu)度檢驗。(3)掌握了遺傳算法的實現(xiàn)步驟,初步實現(xiàn)了基于遺傳算法的自動組卷系統(tǒng)。能夠根據(jù)用戶要求基本實現(xiàn)自動組卷,為今后進一步完善自動組卷系統(tǒng)的功能打下了堅實的理論和實踐基礎。(4)熟悉計算機自適應系統(tǒng)的原理。2.學校已具備的教學改革基礎和環(huán)境,學校對項目的支持情況(含有關政策、經(jīng)費及其使用管理機制、保障條件等,可附有關文件),尚缺少的條件和擬解決的途徑。學校已具備的教學改革基礎和環(huán)境:(1)成立了專門的指導小組、領導小組,并有資深優(yōu)秀的醫(yī)學統(tǒng)計學教師、計算機技術

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論