




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一講概論第一節(jié)語言測試與教學的關(guān)系其次節(jié)國外英語測試理論史第三節(jié)國內(nèi)英語測試理論史第四節(jié)英語測試的基本原則第五節(jié)英語測試中的真實性問題第六節(jié)英語測試的功能和類型第七節(jié)測試評估手段及其功能第一節(jié)語言測試與教學法的關(guān)系辨證關(guān)系:英語測試是對英語教學結(jié)果的檢驗,是英語教學法的檢測工具,是英語教學中不行缺少的重要環(huán)節(jié)。英語教學法是英語教學手段理論化的方法,是英語測試的標準。英語測試法應適應教學法,否則測試方法缺乏有效性、客觀性和可信性。教學法應為測試法供應合理的標準,否則教學法缺乏有效性、教化性。1、應試教化–初、中、高考–指揮棒?2、ArthurHughes–教學與測試=伙伴?3、高校英語四六級考試成果=學位?4、各級各類職稱=外語成果?5、標準化考試=多項選擇題?(multiplechoice)6、取消考試?思索其次節(jié)國外英語測試理論的發(fā)展OldTestament:Judges(舊約全書:士師記第12章)…JephthahthencalledtogetherthemenofGileadandfoughtagainstEphraim.TheGileaditesstruckthemdownbecausetheEphraimiteshadsaid,“YouGileaditesarerenegadesfromEphraimandManasseh.”TheGileaditescapturedthefordsoftheJordanleadingtoEphraim,andwheneverasuvivorofEphraimsaid,“Letmecrossover,”themenofGileadaskedhim,“AreyouanEphraimite?”Ifhereplied,“No,”theysaid,“Allright,say‘Shibboleth’”Ifhesaid,“Sibboleth,”becausehecouldnotpronouncethewordcorrectly,theyseizedhimandkilledhimatthefordsoftheJordan.Forty-twothousandEphraimiteswerekilledatthattime…第一階段前科學語言測試或傳統(tǒng)語言測試階段(ThePre-scientificLanguageTesting或TraditionalLanguageTestingPhase)20世紀四十年頭以前語言被當作是包括語法、詞匯、語音的一套學問體系。測試中對技巧、技能的考查沒有量度依據(jù),測試結(jié)果主要依據(jù)老師的主觀推斷。試題常包括短文寫作(EssayWriting)、翻譯(Translation)、語法分析(GrammaticalAnalysis)忽視聽力、口語測試法為短文寫作-翻譯法(Essay-writingTranslationApproach)其次階段心理測量-結(jié)構(gòu)主義語言測試或現(xiàn)代語言測試階段
(ThePsychometic-structuralistLanguageTesting或
ModernLanguageTestingPhase)20世紀四十年至70年頭中期–拉多路子階段(Lado’sApproachPhase)語言規(guī)則學問的學習不等于語言的學習Bloomfield(結(jié)構(gòu)主義語言學家):語言是一套形式結(jié)構(gòu),是一套習慣(asetofhabits)Skinner(行為主義心理學家):語言行為是一連串刺激-反應過程;提出結(jié)構(gòu)主義教學法,如聽說法。結(jié)合心理語言學領(lǐng)域的心理測量學(psychometrics)的方法。結(jié)構(gòu)主義語言學:語言是一套符號系統(tǒng),可以分解為語音、詞匯、語法等。Lado–LanguageTesting:語言實力分為語音、句法、詞匯、文化;用聽說讀寫方式可測試??稍O計出分點式測試(discrete-pointtest),認為試題應當每題只考查一個考點,其主要題型有選擇填空、詞匯填空、語法填空、完成句子、改錯等。特點:將心理測量法引入語言測試,強調(diào)信度(reliability)和客觀性(objectivity)。將統(tǒng)計方法引入語言測試,對試題難度、區(qū)分度、整卷信度等進行定量分析。語言測試成為一門既有堅實理論基礎又有相對科學的測量統(tǒng)計方法的學科。對語言測試的效度少有關(guān)注。與第一階段相比,強調(diào)了口頭語言;在教學中,把聽說擺在讀寫之前,在測試中給聽說技能確定的比重;但忽視了語言情景;為了考查結(jié)構(gòu),試題有明顯的人工捏造的痕跡。第三階段心理語言學-社會語言學語言測試或后現(xiàn)代語言測試階段(ThePsycholinguistic-sociolinguisticTesting或Post-modernTestingPhase)Chomsky(1965):語言實力(linguisticcompetence)和語言行為(linguisticperformance)Hymes(1972):交際能(communicativecompetence);運用語言不但要能夠依據(jù)語法規(guī)則產(chǎn)出形式合格的句子,而且還應具有在不同語境中運用這些句子的實力,即語言運用涉及社會文化因素。語言實力假說的演化(一)J.Oller(1979):單一語言實力假說(UnitaryCompetenceHypothesis,UCH)。認為語言實力是一個整體,語言測試可以通過綜合性的完形填空和聽寫來衡量語言實力,因為這兩種形式的測試包含全部或幾乎全部的語言實力;針對分點式測試,提出綜合式測試(integrativeapproach),主見通過一次測試全面評價被試者總體語言水平,被試者須綜合運用各種語言學問或技能;題型有完形填空、綜合改錯、聽寫、口試、作文等。Canale&Swain(1980):語言四實力–1、語言實力(linguisticcompetence),含語音、詞匯、語法等語言學問;2、社會語言實力(sociolinguisticcompetence),在不同的社會環(huán)境中,理解和表達形式和意義皆恰當?shù)恼Z言實力。3、交際策略實力(strategiccompetence),如交際時如何起先、如何維持、如何調(diào)整、轉(zhuǎn)換、如何結(jié)束等實力。4、語篇實力(discoursalcompetence),即組織連貫而非獨立機組的實力。語言實力假說的演化(二)L.F.Bachman(1990)–FundamentalConsiderationinLanguageTesting:交際語言實力(communicativelanguageability,CLA),由語言實力、策略實力、心理生理機制構(gòu)成。其中,語言實力包括:1、語言組織實力(organizationalcompetence)→a.語法實力(grammaticalcompetence)(含詞匯、詞法、句法、語音學/書寫);b.語篇實力(discoursalcompetence)(含詞語聯(lián)結(jié)學問、修辭學問)。2、語言運用實力(utilizingcompetence)→a.功能實力(illocutionarycompetence)(含達意、操縱、探究、想象功能);b.社會語言實力(sociolinguisticcompetence)(含方言或變體學問的敏感性、語域?qū)W問的敏感性、自然地到語言的敏感性、文化典故和比方學問)。策略實力是在語言交際時運用各種語言學問的心理實力。心理生理機制是語言交際時作為物質(zhì)現(xiàn)象如聲光等所涉及的心理和神經(jīng)活動過程。語言實力假說的演化(三)Weir(1990):具體闡述交際語言測試的理論原則并介紹了交際語言測試的題目類型。(IELTS)交際語言測試的主要特征:1、重點是意義;2、語境化(contextualized);3、語言活動帶有可接受的目的性(purposive);4、有實際意義的語言;5、運用真實的語言材料(authenticmaterial);6、文本處理有真實性;7、反應結(jié)果不行預見性(unpredictable);8、以互動為基礎(interaction-based);9、考生在真實心理狀態(tài)下展示語言實力;10、依據(jù)實際交際結(jié)果判定成果。思索1、結(jié)合實際,談談你或你們學校所接受的英語測試法符合那個發(fā)展階段?試舉例說明之。2、你認為現(xiàn)階段應當接受哪種測試法(理論),為什么?3、你認為交際語言測試最重要的是什么?為什么?第三節(jié)我國語言測試的發(fā)展脈絡(一)
全國一般高等學校入學考試歷年高考英語題型分值分布主觀題(短文翻譯)離散題綜合題1978年以前≈100%//1978~198516%~35%40%~70%15%-30%1986~2009/10%~40%60%~90%1950年以來我國高考英語發(fā)展分析1、改革開放前:題型單一,幾乎全部為主觀題(1950和1977年有少量客觀題),其形式以翻譯、問答式閱讀和寫作為主,有的年份間或出現(xiàn)一些新的題型(介詞填空、句型轉(zhuǎn)換、單詞變形、完形填空),但不具有連續(xù)性。短文翻譯雖然給出了確定的情景,但常常是為了考核某些語言點而拼湊出來的,缺乏真實感;閱讀段落的題材和體裁不夠多樣化;寫作的內(nèi)容與被試的生活實際聯(lián)系不大。2、1978~1985:主要接受離散式測試,以分散、孤立地測試語音、詞匯、語法等語言成分為特征,一般每題只考核一個語言點,題型包括單詞辨音、詞匯題(單詞拼法、單詞釋義、詞類適當形式轉(zhuǎn)換)、選擇填空、介詞/副詞填空、動詞正確形式填空以及句型轉(zhuǎn)換等。命題的核心集中在技能(主要是讀寫技能)和語言點兩個方面;試題的每個部分針對某項技能,而其中的每個小題又針對某個語言點。本階段題型逐步多樣化、標準化,命題逐步走向科學合理,客觀題成為一項重要的測試手段。3、1986年以后:以一個整體來測試不同語言點為特征的綜合題分值的比重明顯增加,由之前的15%~30%上升到60%-90%,比如聽力、完形填空、閱讀理解、綜合改錯、作文等。這些綜合題大多以語篇為基本單位,有語境,且關(guān)照語言學問和語言技能,能夠在確定程度上反映被試在具體的交際情景中運用語言的實力。作文的命題比較靈敏,既有限制性的作文(改對話為短文、看圖作文等)、情景作文,也有應用文寫作、開放性作文。這些作文從被試生活實際動身,把被試學習語言的目標、須要的信息、交際的情景、語料的真實以及運用語言的須要等因素都考慮在內(nèi),正確、流利、得體成為了作文的評分標準。這個階段的高考試題在設計上盡管照舊受到離散點測試的影響,但已經(jīng)能夠比較靈敏地處理聽、說、讀、寫技能和語言學問的問題,并起先反對機械地分別語言技能和劃分語言學問,提倡語言的綜合運用。不難看出,這個階段的高考英語測試基本實現(xiàn)了從綜合型語言測試階段向心理語言學一社會語言學時期的過渡,交際測試已經(jīng)萌生。4、值得留意的是,較之往年,2002年的高考英語試題有了明顯的變動:它完全摒棄了諸如詞匯與結(jié)構(gòu)選擇填空、句型轉(zhuǎn)換、正誤推斷與改錯等傳統(tǒng)題型,削減了翻譯題所占的比重,增加了聽力實力的測試。這些變動并非偶然,而是我國中學階段英語教學改革在測試領(lǐng)域的一個具體體現(xiàn),也是教化部《全日制義務教化、一般高級中學英語課程標準》頒布后高考英語測試的一次變革。小結(jié):總之,我國高考英語測試的實踐基本體現(xiàn)了語言測試理論發(fā)展的軌跡,但由于信息不夠通暢、測試理論探討起步較晚等緣由,無論是在命題的科學性還是系統(tǒng)性方面,我國的高考英語測試都滯后于國際水平。從高考的角度來看,我國目前已經(jīng)進入了測試發(fā)展的第三階段,即心理語言學一社會語言學時期。第三節(jié)我國語言測試的發(fā)展脈絡(二)
探討生入學考試歷年研考英語題型分值分布主觀題(翻譯)離散題綜合題1980~198435%~50%32%~45%5%~20%1985~198735%30%~45%20%-35%1988~200910%~35%0%~25%40%~90%1980年以來我國研考英語發(fā)展分析1、1980至1984年,以篇章翻譯為代表的主觀題比重居高,尤其是1980、1981年,分值高達50%。此外,離散題也占了相當?shù)谋戎兀?2%~45%),分值較高;綜合題雖然有所涉及,但權(quán)重不大(5%~20%),且更側(cè)重考核被試的語言學問,而并非語言技能。主觀翻譯題大多為測試某些語言學問而改編或編寫的句段,語境不夠自然真實,語言也不夠得體;離散題多局限于語言形式結(jié)構(gòu)(詞匯與結(jié)構(gòu)選擇填空、句型轉(zhuǎn)換、詞型轉(zhuǎn)換等),缺乏運用語言的交際環(huán)境;綜合題的主要形式是完形填空、錯誤改正等題項,閱讀理解、聽力理解和寫作等題目則在試卷中完全缺失。由此可見,這個階段的探討生入學英語測試重視語言學問,但在形式上已經(jīng)起先借鑒離散測試題型,正處于以主觀題為主的前科學時期向心理測量一結(jié)構(gòu)主義時期過渡的階段。2、1985-1987年,探討生入學英語試題出現(xiàn)了明顯的調(diào)整。首先,翻譯題的比重下降,離散題的比例走高(占整個比值的45%),綜合題的重量漸漸增加。其次,靠死記硬背的題項(如詞匯與結(jié)構(gòu)選擇填空、句型轉(zhuǎn)換等)在分值和比重上或有所削減或被摒棄,留意考查反應速度和操作技能的閱讀理解題起先被引入,再次,從分值支配上來看,命題已經(jīng)從語言學問和技能兩個方面入手,并留意在確定程度上反應出被試的學習層次。這些特點均表明,這個階段的探討生入學測試已進入心理測量一結(jié)構(gòu)主義時期。3、從1988年起,將語言看成一個整體、將語言學問與技能綜合起來考核的綜合測試題占據(jù)了探討生入學測試的主宰地位,其比重由從前的35%升至90%。1991、2000、2002年詞形變更、錯誤推斷與改錯、詞匯與結(jié)構(gòu)選擇填空等題型相繼被取消,代之為1991、2002年分別增加的寫作和聽力板塊,探討生入學試題在題型和模塊方面進入了一個相對較為穩(wěn)定的階段。這個階段的主要模塊為語言應用、聽力理解、閱讀理解和寫作,題型包括完形填空、多項選擇、短文和圖表填空、回答問題、翻譯、作文等。值得留意的是,每個模塊均以語篇為單位,選取的材料在題材(人物傳記‘社會、文化、日常學問、科普常識等)和體裁(敘述文、說明文、爭論文、應用文等)上紛繁多樣,相關(guān)的題目在設計上也呈多樣化(例如,閱讀理解不再是單一的多項選擇題目,而包括了多項選擇、復合填空、正誤推斷、是非選擇、表格填充、問題簡答等),且靈敏處理了聽、讀、寫、譯等技能之間以及它們與語言點之間的關(guān)系,做到了接收型技能和產(chǎn)出型技能緊密聯(lián)系,語言技能和語言學問有機結(jié)合??傊?,這個階段的試題在測試任務方面考慮到了被試的真實生活情景,設計了適度的信息量和信息差,關(guān)注到了語言接收和語言產(chǎn)出技能的平衡,交際測試的基本特征得到體現(xiàn)。小結(jié):總體看來,我國探討生入學考試同高考測試一樣,雖落后于語言測試理論但嚴格遵循其發(fā)展軌跡,目前暫處于第三發(fā)展階段,即心理語言學一社會語言學時期。第三節(jié)我國語言測試的發(fā)展脈絡(二)
高校英語四、六級考試大學英語四級考試題型和計分序號題號測試題型計分I1~20聽力理解20II21~40閱讀理解40III41~70詞匯與結(jié)構(gòu)15IV71~90完形填空10V91短文寫作15第三節(jié)我國語言測試的發(fā)展脈絡(二)
高校英語四、六級考試大學英語六級考試題型和計分序號題號測試題型計分I1~20聽力理解20II21~40閱讀理解40III41~70詞匯與結(jié)構(gòu)15IV71~90綜合改錯10V91短文寫作151987年以來我國高校英語四、六級分析1、試題內(nèi)容規(guī)范,題型相對穩(wěn)定、自施考以來,四、六級試卷主要由聽力、閱讀、寫作、詞匯與語法結(jié)構(gòu)、完形填空/綜合改錯等板塊構(gòu)成,題型包括多項選擇、簡短回答、復合填空、句子翻譯等。盡管從1996年起先,四級增加了諸如英譯漢、簡短回答、復合聽寫等新題型,但這些新題型只是與原題型中的某項題型輪番互換。2、起點高。四、六級考試施考之時,正值我國改革開放成就斐然、外語學習蔚然成風之際。國外先進的語言教學理念被推介到國內(nèi),語言測試理論與探討倍受關(guān)注,這些都確定著四、六級考試從一起先就具備了較高的起點。除了詞匯與結(jié)構(gòu)部分之外,四、六級試題選取的都是語篇層次的語言材料,試卷構(gòu)成以綜合題為主體。毋庸置疑,由語言測試理論支撐的四、六級考試旨在考核綜合語言實力,交際化趨勢明顯,而話題式口語考試的引人則是其交際化的另外一個佐證。3、語言技能之間的關(guān)系處理得更為合理。四、六級試題在形式上呈板塊,但測試任務卻體現(xiàn)了設計者的匠心。聽與寫、讀與寫、讀與譯等測試任務折射出的不僅僅是語言技能之間的互賴關(guān)系,同時也彰顯了語言作為交際工具的一個屬性,即接收型技能和產(chǎn)出型技能的平衡。由此我們可以看出,全國四、六級考試的發(fā)展印證了80年頭中后期我國英語測試所處的階段。小結(jié):我國高校英語四、六級考試分別從1987、1989年起先正式施考,現(xiàn)已成為一項大規(guī)模標準化考試。與高考、探討生入學考試相比,高校英語四、六級考試起步晚,但起點高、作為大規(guī)模標準化考試,高校英語四、六級考試無論在設計上還是在操作流程上都比較規(guī)范:它們以《高校英語教學大綱》和《高校英語四、六級考試大綱》為依據(jù),設立有特地的考試委員會,建立了相當穩(wěn)定的命題員網(wǎng)絡,其信度、效度都經(jīng)過了嚴格的檢驗。
我國英語測試的發(fā)展趨勢通過對我國大規(guī)模英語考試題型的統(tǒng)計分析,可以發(fā)覺我國語言測試的實踐基本遵循了理論發(fā)展的脈絡:20世紀70年頭之前英語測試處于前科學時期;20世紀七八十年頭,處于心理測量一結(jié)構(gòu)主義時期;20世紀80年頭中后期至今,處于測試理論發(fā)展的第三階段,即心理語言學一社會語言學時期。目前,我國英語測試越來越呈交際化趨勢,主要體現(xiàn)在:1、在作文方面,最近幾年各類考試的作文題大體以應用文為主,涉及書信、電子郵件、導游詞、投訴、出國申請等與現(xiàn)實社會休戚相關(guān)的題目??梢?,現(xiàn)在的作文命題反套路、反模塊,要求考生具有用書面語表達思想的實力,既考查被試的語言基本功,更考查他們在實際生活中運用語言的實力。2、在聽力方面加大了分數(shù)的比重,接受了增加原聲、背景音、多人交談等語言材料,更留意接受“真實語言材料”。3、在閱讀方面增加了快速閱讀內(nèi)容,使閱讀任務更加細化。4、四、六級口語考試逐步推廣,探討生入學考試也把口語測試列入了復試范圍,旨在考核被試的實際語言運用實力。結(jié)束語及思索教學與測試是相輔相成的。在我國英語教學改革的大環(huán)境下,教化部制訂的《全日制義務教化、一般高級中學英語課程標準)(2001)和《高校英語課程教學要求》(2004)不謀而合地把培育學生的綜合應用語言實力作為教學目標,而作為檢驗教學效果的測試必定要緊跟教學的發(fā)展。由此可見,交際型語言測試必將成為我國將來英語測試的主流。思索:1、結(jié)合本人了解或參與過的考試,談談你??荚嚨默F(xiàn)狀及建議。2、依據(jù)本人的教學,結(jié)合測試的發(fā)展趨勢,展望將來考試的前景。第四節(jié)英語測試的基本原則1、效度2、信度3、真實性4、互動性5、沖擊力6、可行性1、語言測試的效度(validity)測試的效度是一次考試對其所要測試的語言實力能夠測到的程度。效度側(cè)重的是測試的內(nèi)容,它檢驗測試的目的是否一樣。測試有各種不同的效度,總的來說可分為四種類型。(1)卷面效度。也稱為表面效度,是指考試在表面上使考生及其他有關(guān)人員憑直覺感到的有效程度。Ingrem認為卷面效度指的是“考試的表面信譽或公眾對考試的接受程度”。假如測試項目表面上適合于側(cè)試者、受試者和老師,它就可被看作具有卷面效度。假如一份測試具有好的卷面效度,學習者的學習意愿就能得到激發(fā)和保持.因為探討表明大多數(shù)受試者在測試表現(xiàn)出適合于他們的時候會加倍努力;相反,假如受試者看到某一測試與測量其某一語言實力無關(guān)或者高出其語言實力水平,考生就簡潔丟失參與的主動性。(2)內(nèi)容效度。指考試內(nèi)容對預料內(nèi)容的代表性的程度。內(nèi)容效度評價一個考試的動身點是看其內(nèi)容是否與考試目的一樣,在內(nèi)容正確的基礎上,再看其內(nèi)容是否具有代表性。內(nèi)容的代表性與內(nèi)容樣本量的足夠性----考試的題量、主題覆蓋面等。假如一項詞匯測試只檢測考生介詞的實力,內(nèi)容效度就很低;再如,一項聽力側(cè)試接受口語考試的形式進行,這類考試確定缺乏內(nèi)容效度。(3)構(gòu)卷效度。指測試題目反映出測試構(gòu)建于某個理論本質(zhì)方面的程度。假如一項測試能夠反映出與語言學習理論一樣的一些具體特征,那它就有構(gòu)卷效度。它要求測試的語言理論基礎要與最終的語言行為相符。它不僅要揭示現(xiàn)在的語言行為,而且應能揭示最終的語言行為。測試的設計者應依據(jù)語言學習者將來會如何運用語言的預見來設計試題。一種試題的編制要以某種語言行為理論和語言學習理論作為依據(jù)。假如以功能語法為基礎,認為語言習慣主要是通過語言環(huán)境和實際運用而獲得的,那么強調(diào)句型操練和語法分析的測試就失去了編制效度。(4)閱歷效度(尺度關(guān)聯(lián)效度)。指一項測試的結(jié)果假如與一些外部測量標準相關(guān)聯(lián),這份側(cè)試就可以說具有閱歷效度。閱歷效度是通過把測試與一個或更多的標準測量相比較而得出的,這種比較可以通過兩種方式得到:共時效度和預料效度。①共時效度,即同時從外部而不是從內(nèi)部通過某些方法論證考試的效度。它是通過定性與定量分析兩個方式來進行的。如,對共時效度的定量分析,是通過用一個得到公認的外部考試的方式與被評估的考試作比較,看求得的相關(guān)系數(shù)是否志向,如兩者之間的相關(guān)系數(shù)達到志向的數(shù)值,那么就表示被評估的考試與外部的考試具有同等效度。當測試結(jié)果在同一時期與其它測試結(jié)果相一樣時,它可被看作具有共時效度。②預料效度,即考試成果要能夠預料考生以后的學習狀況。它的測量方法是將兩組數(shù)據(jù)進行相關(guān)比較,論證它們之間的關(guān)系。當測試結(jié)果與以后的其它測試結(jié)果或以后取得的其它行為標準相一樣時,那么這個測試就可以說具有預料效度。2、語言測試的信度(reliability)
語言測試的信度是指考試測量學生語言實力一樣性、牢靠性的程度。它是任何一個好的語言測試必備的特征,也是考試結(jié)果是否牢靠的關(guān)鍵指標。一個測試的信度主要看該測試所要測量的東西是否達到前后一樣的程度即考試結(jié)果不受考試施考時間、監(jiān)考人員、場地等外部因素的影響。假如對同一個受試者連續(xù)進行兩次測試或試卷被不同的人批改而得到的結(jié)果相同或相像,這樣的測試就被看作是具有較高的信度。牢靠性也可稱為一樣性(consistency),這種牢靠性或一樣性是任何一種考試都不行缺少的一個重要特征,否則考試成果將無法真實精確地反映出考生的被測試語言實力和水平。而且用不行靠的成果來確定,就會不行避開地造成一些失誤甚至是不行彌補的損失。影響信度的因素有:(1)試卷編制。信度側(cè)重的是測試內(nèi)容的覆蓋面是否大,是否具有代表性,項目是否勻整。采樣越多,測試的信度越高。郝利群認為,一套試卷無論是常模參照考試(norm-referenced),還是標準參照考試(criterion-referenced),長的要比短的更具牢靠性。測試必需包含各種類型內(nèi)容的試題。一種測試必需涵蓋本專業(yè)領(lǐng)域內(nèi)盡可能多的內(nèi)容,而且試題必需有確定的難度。測試提出的任務必需具有標準性。在試題庫中隨意挑出的試題在難度、類型、形式上都必需基本一樣。事實上,只要試卷中所運用的試題具有測試某種實力的代表性,這種試題越多,試卷對某種實力的反映就越充分和越牢靠。因此越是重要的考試,題量越要充分。當然,題量也不能過大,否則考生的乏累和厭倦就會影響考試的信度。(2)測試的執(zhí)行。主要是涉及考試環(huán)境、試卷支配、時間支配、題意說明、考試方式、答題方式、評分標準等是否全部的考生對試題的要求都很清晰。是否相同的測試是在不同的受試對象之間,不同的條件下及不同的時間內(nèi)進行的,這是確定信度的一個重要因素。如在一次聽力測試中,一組考生所聽到的錄音效果好.另一組考生聽到的錄音效果差,那么,這次聽力測試就無信度可言。試題說明在考生的答題中起著舉足輕重的作用。假如考生對題目要求的理解程度和他們對所要完成任務的清晰程度很高他們就會主動地投人考試中去。相反,模糊不清的試題說明會干脆影響考生的答題,降低測試結(jié)果的信度。所以試題說明確定要做到簡潔、精確、明白,試題說明所運用的語言應簡潔清晰,避開考生不熟悉的術(shù)語出現(xiàn)。(3)個人因素。受試者的個體因素如動機、情感、心理狀況、身體條件會對測試信度有很大的影響。這些因素包括考生考試前和考試中的心理或生理方面的波動或變更,如疾病、乏累、缺乏考試動力、心情波動等。這些因素會影響考生的正常發(fā)揮,從而降低測試結(jié)果的牢靠性。盡管這些因素是不行預料的、也常常因一些意外而無法限制,但老師們也要有所作為,要設法將這些因素的影響降到最低點。同時閱卷員的評分也是影響信度的一個重要因素??陀^試題的評分基本沒有問題,信度較高,關(guān)鍵是對主觀試題評分標準的把握。為削減評閱的誤差首先要制定具體的評分標準,而且全部的閱卷人應統(tǒng)一進行培訓,讓大家選用一些例卷共同進行打分練習和探討,從而給出相近的分數(shù),使語言測試充分體現(xiàn)公允公正。常通過以下方法來測定考試信度:(1)重復測試法,即通過對同一組學生重復運用同一份試卷來確定試卷的信度。(2)平行卷測試法,即通過A、B卷的形式來分析試卷的信度。(3)對半分析法,也叫內(nèi)部一樣性法(internalconsistency)把一份試卷看作為兩個相對獨立且相應的部分,通過對這兩部分分數(shù)的比較以獲得整份試卷的信度。3、語言測試的真實性Bachman&Palmer(1996):真實性指某一語言測試任務與實際語言運用任務在特征方面的對應程度。任務特征包括視察類(形式)特征(即方式、內(nèi)容、情景等)和非視察類(性質(zhì))特征(即語言運用性質(zhì)、語言實力等)。其對應程度可指形式上的也可指性質(zhì)上的對應。當今語言測試界在考試真實性方面的兩大派別:1、現(xiàn)實生活法(real-lifeapproach):通過設計能復制具體語言運用環(huán)境的考試來達到真實性。主要有3個側(cè)重點:1)考試的表面效度;2)考試的預料效度;3)考試的內(nèi)容效度。此派在口語測試領(lǐng)域里獨領(lǐng)風騷。2、交際/實力法(interactional/abilityapproach):強調(diào)交際語言運用過程中的顯著特征,如“語言運用者、情景與語篇之間的相互作用”,而不是某一個具體的語言運用行為。其主要側(cè)重的是語言實力或?qū)嵙Y(jié)構(gòu),也就會結(jié)構(gòu)效度。4、語言測試的互動性互動性(交互性)指在考試所設計的任務中學生的參與程度。試比較兩種考試的互動性:考試1:50道多項選擇題,其中25道語法題,25道詞匯題??荚?:口試,實行小組探討的形式,題目是TheImpactofTVAdsonTeenagers。5、語言測試的沖擊力一般來講,教學目標確定語言測試目標。因此語言測試目標必需為實現(xiàn)語言教學目標服務。然而,語言教學與語言測試的發(fā)展并非總是同步的。語言測試體系一經(jīng)確定,它就具有確定時限的相對穩(wěn)定性,對語言教學產(chǎn)生主動或消極的反撥作用。語言測試目標對語言教學目標的反撥作用極其重要:假如語言測試目標科學、精確、就能夠科學有效地檢測教學目標并主動地促進教學目標的實現(xiàn)或進一步修正。反之就不能科學檢測教學目標,同時阻礙后續(xù)教學目標的確定與實現(xiàn)。從理論上看,教學先于測試。教什么內(nèi)容就檢測什么內(nèi)容。這是一種志向的教學和測試的關(guān)系。然而,在具體的教學與測試實踐中往往是要考什么然后才教什么。這種語言測試與語言教學的邏輯倒置,我們可以看作是語言測試內(nèi)容對語言教學內(nèi)容的反撥作用。語言測試方法對語言教學方法也會產(chǎn)生重要的反撥作用。比如科學的考卷應實行多種題型,主客觀試題相結(jié)合的方法。科學的語言測試對語言教學的各方面都應起著正面的引導作用。歸納起來,考試的沖擊力作用干脆影響兩個方面,即教和學。教指的是老師或?qū)W校,包括教學方法、課程設置、教學內(nèi)容、課程評估等;學指的是學生,包括學習方法、學習動機等。6、語言測試的可行性可行性即可操作性,與前面5點相比,可行性是指制約施考過程的因素,而前面5點主要指考試質(zhì)量或結(jié)果的運用。制約施考過程的因素有:資源、人力、時間。資源因素指考試場地、設備、閱卷設施等;人力因素指考官、監(jiān)考人員、閱卷人員等;時間因素是實際考試可用時間。這要求試題設計者和考務人員做到以下幾點:(1)試題的題目要求要清晰易懂,試題要設計得一目了,然無深邃難懂的術(shù)語,最好在試題要求下給出相應例子,試題要求無需監(jiān)考人員作口頭說明。(2)試卷必需整齊、干凈,盡量避開出現(xiàn)拼法、打印等技術(shù)錯誤。(3)考試幫助設備必需正常。如無線聽力系統(tǒng)、錄音機、計算機工作必需正常穩(wěn)定,考場座位必需具有舒適度,遠離外界干擾。(4)答題紙的運用。答題紙大小和編排要與相應的題量相一樣,滿足考生精確地書寫答案。同時它也必需能使老師清晰地看清答卷,以增加閱卷的精確性和閱卷速度。結(jié)束語及思索語言測試應符合國際形勢與新時代經(jīng)濟發(fā)展的須要,還應與專業(yè)設置、課程建設、教學過程與方法等緊密結(jié)合,應借鑒國際通行的評價體系,創(chuàng)新課堂教學模式,重視靈敏教學,設計以學生為主體、學習和創(chuàng)建為核心的教學方法,大力提倡和運用各種現(xiàn)代手段,以科學靈敏的考試培育學生的自方法識、創(chuàng)新精神和創(chuàng)建實力。然而在語言測試的具體實施過程中,由于受運用目的的影響,往往會出現(xiàn)一些偏差.比如語言測試純粹為鑒別語言水同等級為目的、純粹作為高一級學校錄用新生或用人單位錄用人才的尺度等。這樣,在理論上加劇了語言測試的信度和效度之間的沖突,狹隘了語言測試的內(nèi)涵;在實踐中,受試者或?qū)W生常常感到教學、學習同測試脫節(jié),提高語言技能同測試脫節(jié)。筆者在個人探討的基礎上,對語言測試設計的原則與實踐作一個理論上的探討,以便更清晰地相識語言測試本質(zhì),避開被語言測試的一些意義模糊了概念,更有效地把語言測試同教學、素養(yǎng)教化結(jié)合起來,最大限度地克服測試的負面反撥效應。思索:1、就測試效度和信度的關(guān)系,有人說測試效度是首要的,也有人說測試信度是首要的。試分析二種說法的立足點并談談你個人如何看待二者的關(guān)系。2、舉一個身邊的例子來說明考試對教學的沖擊力。3、從表面效度、真實性和交互性3個角度探討下面的考試題目或任務。例1依據(jù)中文提示,將對話中缺少的部分寫在線上。全句必需符合英語表達習慣。(提示:澳大利亞商人Williams先生在外貿(mào)博覽會上看到某廠生產(chǎn)的臺燈,有意購買。他找到金廠長,談了他的意向,并請金廠長具體介紹產(chǎn)品。金廠長告知他,工廠年產(chǎn)20萬臺燈,一半以上銷往亞洲國家。Williams先生詢問了價格。金廠長告知他每臺是15美元。Williams先生表示這價格可以接受,接著問他是否只有一種型號。金廠長說,有好幾種型號,假如Williams先生感愛好,可以帶他去廠里看看。)Mr.Williams:Mr.Jin,IhaveseenyourtablelampsattheForeignTradeFair.IwishtoordersomefortheAustralianmarket.______?Mr.Jin:I’dbegladto.Asamatteroffact,wehavebeenthinkingofsellingourlampstoAustraliaawell,______.AbouthalfofthemaresoldtocountriesinAsia.Mr.Williams:______?Mr.Jin:15USdollarseach.Mr.Williams:______.Andisthistheonlymodelyouproduce?Mr.Jin:No.Wehaveseveralothers.Ifyouareinterested,_____.Mr.Williams:Thatwouldbefine.例2辨別錯誤在下列各句的劃線部分A、B、C、D中各有一個錯誤,指出這一錯誤。1.Threeweeksago,Iwenttomyuncle;myaunttoldmethathehadleftforABCSingaporeonalecture.D2.Shelooksveryyoung,butistwiceasolderasmytwenty-year-oldsister.ABCD3.Thereisalotofnoiseinbigcities,butitisn’tmuchinthecountryside.ABCD4.Thoughmyneighborhasthegreatnumberofsciencebooks,heneverABCreadsanyofthem.D例3某公司要聘請英語打字員,應聘考試中的一項內(nèi)容是在規(guī)定的時間里打出確定字數(shù)的文章。第五節(jié)英語測試的真實性問題Bachman:真實地反映語言測試中語言運用的本質(zhì)。Wood:語言測試中的兩個主要問題,信度和效度,可以歸結(jié)為一個更為重要的問題,即真實與不真實。Palmer:真實性是語言測試中的一個重要特征,是語言測試開發(fā)者在設計測試時須要細致考慮的問題。Douglas:真實性是區(qū)分特定目標語言測試和一般目標語言測試的兩個特征之一(另一個特征是語言學問和特定目標內(nèi)容學問的互動)。一、對于真實性的早期相識20世紀60年頭中期。一些學者,比如Close和Broughton,認為,語言學習者所接觸的文本并不能代表他們所學的目標語。這個時期,探討者關(guān)注測試文本,認為真實性是指測試的文本應當是從真實情景中提取出來而未被改動的原始文本,而不是為了教學目的而設置或改編的文本。問題:1、把真實性等同于未作任何改寫或簡化處理的文本,產(chǎn)生了“真實-非真實”的二分法觀點。2、每個文本都有自己特定的語境,原封不動地提取源文本用于測試,雖保證了源文本的完整性,但會使測試失去真實性。逆境:因為它是從真實世界中提取出來的,而認為它是真實的,還是因為它脫離了源語境被用于測試,而認為它是非真實的。70年頭末期,Widdowson提出兩個概念即“翔實性”(genuineness)和“真實性”(authenticity)。翔實性是語篇自身的特征,是個確定的概念。真實性是語篇與讀者之間關(guān)系的特征,與恰當?shù)淖龃鹩嘘P(guān)。因此,翔實的文本只有在經(jīng)過真實化(authentication)過程之后,才算具有真實性,這個過程可能只有通過本族語者才能實現(xiàn)。二真實性的概念化(Conceptualizationofauthenticity)
Bachman:真實生活觀(real-lifeapproach)和交互實力觀(interactional-abilityapproach)。(一)真實生活觀概念:語言水平是在非測試環(huán)境中完成語言任務的實力,而真實性就是測試任務重現(xiàn)真實生活語言運用任務的程度。這種觀點為把語言測試分為“干脆測試”和“間接測試”奠定了基礎。原則:1、把語言水平看做是語用實力;2、把真實生活行為作為真實性的標準;3、表面效度上給人一種感性的真實;預料效度上預料考生在非測試情景中語言運用行為;內(nèi)容相關(guān)性和覆蓋性上測試的內(nèi)容和過程與真實生活中的語言運用相對應。20世紀80年頭,真實生活觀在語言測試中,尤其是外語口語測試中,占據(jù)著主導地位。缺點:1、停留在輸入層面,缺乏對考生處理這些輸入的過程關(guān)注。在測試中真正關(guān)切的不是考生在某一特定時間、特定場合完成特定測試任務的行為,而是這一行為在多大程度上反映了考生的語言實力。2、真實生活或非測試情景中的任務和行犯難以被確定而完全地復制到測試情景中。Bachman:這種觀點存在兩個問題:一是沒有把語言實力和語言行為區(qū)分開。二是真實生活觀未能給效度供應一個充分的基礎,即表面效度、預料效度、內(nèi)容相關(guān)性和覆蓋性并不能完全說明某項測試效度的凹凸。(二)交互實力觀概念:真實性存在于考生、考試任務與考試情景之間的相互作用中?;映潭扔鷱姡囶}的真實性程度就越高。交互實力觀留意的是結(jié)構(gòu)效度。Widdowson:不應當把真實性當作語言運用實例本身所具備的特征,而應當把它當作由語言運用者反饋所產(chǎn)生的、附加在語言運用實例上的特征。也就是說,語言素材是否有真實性不是由其來源或特點所確定的,而是要看它能否在作者與讀者之間產(chǎn)生共鳴和溝通。真實性是篇章和讀者之間的關(guān)系特征,并與讀者的恰當反應有關(guān)。因此,描述真實性時必需留意交際語言運用的關(guān)鍵特征,而不是去獲得整個語言運用情景。而且這一理論描述不僅要包括語境特征還要包括語言運用者的交際語言實力。特點:1、強調(diào)交際語言運用的區(qū)分性特征,即語言運用者、語境、語篇之間的交互作用。2、強調(diào)除了要考慮語境特征,還要考慮考生的交際語言實力。(3)強調(diào)真實性語言測試的開發(fā)要基于一個包括考生語言實力和測試情景特征的框架。三真實性的框架化(Framingofauthenticity)Bachman的兩種真實性:情景真實性(situationalauthenticity)和交際真實性(interactionalauthenticity)。前者指測試任務特征與目標語運用任務特征的對應,后者指考生與測試任務之間的互動。Bachman和Palmer把真實性定義為“特定測試任務的特征與目標語運用任務特征的一樣性程度?!彼麄冞€提出了一個任務特征框架,這個框架包括測試支配(testsetting)、測試說明(testrubrics)、輸入(input)、期盼做答(expectedresponse)以及輸入和期盼做答的關(guān)系(relationshipbetweeninputandresponse),為匹配目標語運用任務特征和測試任務特征供應了一個系統(tǒng)的方法。既然特征的一樣性是真實性的關(guān)鍵,那么,只要使測試任務盡可能具有目標語運用任務的特征,該測試就具有較高的真實性。Douglas:情景真實性和交互性是真實性的兩個方面,在特定目的語言測試中這兩方面都須要具備。Lewkowicz:真實性一部分確定于測試任務與目標語運用任務互動的對應關(guān)系,而把真實性和交互性分割來看待是有失偏頗的。四真實性的接著發(fā)展(Stepforward)Spence–Brown:真實性的四個方面:1、測試任務的真實性;2、考生與測試任務之間互動的真實性;3、考生與其他參與者之間互動的真實性;4、評分過程及其標準的真實性。(一)考生與其他參與者之間互動的真實性McNamara:要對測試中互動的社會維度特性加以重視,包括考生、測試者以及其他參與者之間的互動。對互動的探討表明,交際中的話語是交際雙方共建的,是全部交際方共同參與的結(jié)果。很多有關(guān)口語測試的試驗已證明其他的參與者(如搭檔或考官)的表現(xiàn)能夠極大地影響考生的語言行為。(二)評分過程及其標準的真實性評分的真實性主要指兩個方面:評分標準和評分過程。產(chǎn)出性測試的評分標準問題:Bachman和Palmer建議對答案的正確性運用多維標準,提倡對部分正確的做答賜予確定的分數(shù)。在確定評分標準時要考慮到目標語運用域和測試目的,如:在分班測試中,語法正確性被認為是最重要的因素,而在職業(yè)目標測試中,適切性和是否完成任務會更好地反映目標語運用的要求。Bachman:不存在普遍適用的評分標準。假如說一個測試是真實的,就要在“對誰來說、在誰看來、在什么時間、什么地點、什么目的、什么水平層次等方面”說明其真實性。Spence–Brown:讓目標語運用域的專家(非語言老師或語言學家)參與到測試開發(fā)過程中。聶建中:在探討英語產(chǎn)出性測試評分標準的真實性時,應留意區(qū)分下面兩個概念:語言展示(language一displaying)和語言運用(language一applying)。評分標準假如從語言展示的角度動身,主要考察的就是學生的產(chǎn)出性做答中詞匯、語法、句法、段落組織、長度等方面。依據(jù)交際語言測試的要求,真實性評分應當側(cè)重學生的語言運用實力,也就是側(cè)重考查學生做答的社會得體性、可理解性、是否完成任務等方面。Spence-Brown通過探討澳大利亞中學入學日語口語面試發(fā)覺:日本學生的分數(shù)都比較低,他們用“是”、“不是”、單詞或短語回答全部問題,因此沒有很好地展示他們的語言實力,也就不會獲得高分,而學習日語的澳大利亞學生的回答都比較具體,甚至有些做作,然而卻充分展示了他們的語言實力,因此分數(shù)都比較高。日本學生的回答在現(xiàn)實生活的語言運用中顯得更為簡練得體,但沒有對應測試情景的要求,而澳大利亞學生大多在面試前做了充分準備,事先練習了大量的面試句型和可能被問到的問題。由此面試分數(shù)來看,在實際的評分中測試者看重的是考生是否充分展示出他們的語言實力,而并不是真正意義上的語言運用。從這個意義上來說,語言測試中的問題并不算是真實性的問題。因此在產(chǎn)出性測試評分中,如何在語言展示標準的基礎上融入真實性標準,從而使測試的評分環(huán)節(jié)更加符合交際性測試的要求,是今后語言測試評分環(huán)節(jié)中有待解決的問題。五結(jié)束語及思索語言測試的真實性是個困難的問題,雖然學者們對真實性的理論構(gòu)成及其在測試實踐中的實現(xiàn)方式的看法不盡相同,但對真實性在語言測試中的重要性問題上已經(jīng)達成共識。但在真實性涉及的因素、真實性的本質(zhì)、真實性對于測試實踐的影響等很多方面尚無定論。在實踐中,真實性原則體現(xiàn)在整個語言測試的各個環(huán)節(jié)中,包括測試設計、文本、題型、題目、實施、評分以及分數(shù)釋義等各個方面,要達到真實性的要求、就要從測試的各個環(huán)節(jié)確保其真實性。思索:1、說說你對測試真實性的理解。2、選一套或一部分你曾經(jīng)測試過的試題,探討其真實性。第六節(jié)測試的功能和類型一、測試的功能(一)教學功能老師是測試試運用者的一部分,其他有關(guān)運用者包括學生本人、家長、教化管理部門。測試的教學功能主要體現(xiàn)在測試信息的反饋與運用上。對學生而言,測試反饋的信息在確定程度上反映學習上的進展和存在的問題;對于家長而言,考試反饋的信息是他們了解自己子女學業(yè)進展的主要途徑之一;對于教化管理部門,考試反饋信息可以作為評估教學或課程設置的一部分。(二)科研功能在應用語言學領(lǐng)域,測試作為一種具體的測量形式有其潛在的重要價值。Bachman:語言測試可以用在語言實力性質(zhì)(natureoflanguageproficiency)、語言處理(languageprocessing)、語言習得(languageacquisition)、語言流失(languageattrition/loss)、及語言教學(languageteaching)的探討中。(二、測試的類型)依據(jù)考試目的:水平測試(proficiencytest)、成就測試(achievementtest)、分班測試(placementtest)、診斷測試(diagnostictest)。依據(jù)考試方式:干脆測試(directtest)、間接測試(indirecttest)。依據(jù)測試形式:分別式測試(discrete-pointtest)、綜合測試(integrativetest)。依據(jù)評分方式:客觀測試(objectivetest)、主觀測試(subjectivetest)。依
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年消毒蒸飯車行業(yè)深度研究分析報告
- 熱維卡試驗機行業(yè)市場發(fā)展及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2025年中國沖壓件行業(yè)市場全景調(diào)研及投資規(guī)劃建議報告
- 中國血壓監(jiān)測行業(yè)市場深度分析及投資策略咨詢報告
- 2025年立方氮化硼定位芯軸行業(yè)深度研究分析報告
- CAB相關(guān)行業(yè)投資規(guī)劃報告范本
- 中國內(nèi)鏡超聲行業(yè)發(fā)展趨勢預測及投資戰(zhàn)略研究報告
- 充值續(xù)費合同范本
- 2025年中國進口保健品未來發(fā)展趨勢分析及投資規(guī)劃建議研究報告
- 2024-2030年中國氫燃料汽車行業(yè)市場深度分析及投資策略研究報告
- 圓柱的表面積(說課稿)-2023-2024學年六年級下冊數(shù)學北師大版
- 《神經(jīng)系統(tǒng)MRI解讀》課件
- 2024年江蘇信息職業(yè)技術(shù)學院高職單招語文歷年參考題庫含答案解析
- 2025年學校春季開學典禮校長講話致辭 (匯編11份)
- 城市軌道交通專業(yè)英語(第三版) 課件 U7 Tram
- 高等院校附屬醫(yī)院醫(yī)共體合作制度
- 2025年中國半導體第三方檢測行業(yè)市場集中度、市場規(guī)模及未來前景分析報告
- 2025年餐飲部主管年度工作計劃
- 學工管理系統(tǒng)功能設計方案
- 健康管理師考試題與參考答案
- 中華人民共和國保守國家秘密法實施條例培訓課件
評論
0/150
提交評論