課后練習(xí)答案-第7章_第1頁
課后練習(xí)答案-第7章_第2頁
課后練習(xí)答案-第7章_第3頁
課后練習(xí)答案-第7章_第4頁
課后練習(xí)答案-第7章_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第7章課后習(xí)題詳解1.語言測試發(fā)展大致經(jīng)歷了幾個階段?每個發(fā)展階段有什么不同的特點?答:語言測試的歷史可以追溯到19世紀(jì)末、20世紀(jì)初,大體經(jīng)歷了四個主要的發(fā)展階段,每個發(fā)展階段的特點包括:(1)傳統(tǒng)時期或前科學(xué)時期(自20世紀(jì)初~50年代初)這一時期,語言測試基本上不是在語言學(xué)理論的指導(dǎo)下開發(fā)的,測試方法主要是作文、口試、翻譯等,測試結(jié)果主要靠考試實施者的直覺來評判,缺乏科學(xué)性。(2)心理測量——結(jié)構(gòu)主義時期或科學(xué)時期(20世紀(jì)50年代末、60年代初~70年代)這一時期的語言測驗以結(jié)構(gòu)主義語言學(xué)為理論基礎(chǔ),同時,心理學(xué)的行為主義理論以及心理測量學(xué)的原則和方法對語言測試起到了重要的指導(dǎo)作用。這一時期,語言測試已經(jīng)成為一個相對獨立的學(xué)科并日趨走向成熟,一個標(biāo)志性的轉(zhuǎn)折點就是RobertLad0于1961年出版了著名的《語言測試——外語測驗的開發(fā)與使用》,這本書是第一部全面論述語言測驗的原理、原則和方法的專著,可以說RobertLad0是現(xiàn)代語言測試的創(chuàng)始人。這一時期的主要測試方法是所謂分力式測試。從測量學(xué)的角度看,這一時期特別重視測驗的信度。(3)心理語言學(xué)和社會語言學(xué)時期或后現(xiàn)代時期(20世紀(jì)70年代~80年代初)這一時期,語言測試的語言學(xué)理論基礎(chǔ)從結(jié)構(gòu)主義語言學(xué)轉(zhuǎn)向了社會語言學(xué),測驗更多地關(guān)注如何從功能性、社會性和語言應(yīng)用的角度考察被試,測試方法從分力式轉(zhuǎn)向了綜合式,新的測驗形式如完形填空(clozeTest)等應(yīng)運而生。這一時期,語言測驗的效度問題得到了足夠的重視,語言測試專家對語言測驗究竟測到了什么東西這樣的問題進(jìn)行了深入的探索,提出了一些假說,是著名的就是JohnOuer提出的“一元能力”假說(unitarycompetencehypothesis),Ouer認(rèn)為語言能力是一個單一的能力并用因素分析的方法驗證自己這一假說,產(chǎn)生了廣泛的影響。(4)交際法語言測試時期(20世紀(jì)80年代初至今)70年代末到80年代美國語言教學(xué)界開展了一場“水平運動”(ProficiencyMovement),很多語言教學(xué)界人士認(rèn)為,語言教學(xué)以及語言測驗要以語言水平為中心,而語言水平表現(xiàn)為交際的能力。這場運動的一個直接成果就是1982年美國外語教學(xué)委員會(AmericanCouncilonTeachingofForeignLanguages,簡稱ACTFL)制定的一個水平大綱(ACTFLGuidelines)。同一時期,歐洲相繼出現(xiàn)了建立在語言交際理論基礎(chǔ)上的《功能意念大綱》和《交際大綱》。這些文件對語言測驗的開發(fā)有很強(qiáng)的指導(dǎo)作用。這一時期,人們更多地把注意力集中在探討語言交際能力方面,在語言測試研究領(lǐng)域,到1990面,Bachman在Canale和Swain模型的基礎(chǔ)上提出的語言交際能力模型,成了語言測試發(fā)展史上一個新的轉(zhuǎn)折點。2.語言測試的主要作用是什么?舉例談?wù)務(wù)Z言測試在語言教學(xué)研究中的作用。答:(1)評價學(xué)習(xí)者的學(xué)業(yè)成就和語言水平、評估教學(xué)效果、選拔人才、改進(jìn)教學(xué)中的問題語言測試是語言教學(xué)的重要環(huán)節(jié),有教學(xué)就會有測試,語言測試任何時候都沒法脫離教學(xué),幾乎每一個語言教學(xué)工作者都會接觸到各種各樣的語言測驗。但語言測驗的作用又不僅僅局限于教學(xué)。(2)為語言研究和語言教學(xué)研究提供信息語言測驗作為一種測量工具,是語言研究和語言教學(xué)研究的一個重要手段。人類的語言是一個非常復(fù)雜的系統(tǒng),直至目前為止,人的語言能力還是一個“黑箱”,它究竟是由哪些東西構(gòu)成,還沒有人能說清楚。對于各種各樣有關(guān)人的語言能力的假說,都需要實證性的數(shù)據(jù)的證實或證偽,而語言測驗恰好在這方面可以充分發(fā)揮作用。從語言測試的角度看,第二語言習(xí)得研究的發(fā)展一定會帶動語言測試研究,而語言測試研究也一定會為第二語言習(xí)得研究提供更為可靠而游戲的方法和手段,可以說語言測試大有用武之地。3.客觀性測驗與主觀性測驗各有什么利弊?答:(1)主觀性測驗主觀性測驗的正確答案一般不止一個,而且往往不是實施測驗前能夠確定的,需要評分員在評分過程中自己作出主觀的判斷,對于同樣的考生答案,不同的評分員很可能會有不同的評判。①主觀性測驗的優(yōu)點a.考察有深度和層次主觀性測驗?zāi)軌蚴贡辉囉凶銐虻陌l(fā)揮自己水平的余地,特適合考查被試語言運用的能力和產(chǎn)出性技能,特別是書面表達(dá)能力和口頭表達(dá)能力。像作文這種主觀性測驗,一般認(rèn)為比一些客觀性測驗更能直接測出被試的書面表達(dá)能力,因而更有效。b.命題容易考寫作一般只需要一兩個、兩三個題目就可以了,口試即使是采取面試的形式,主考人一般也不需說過多的話,而主要把說話的機(jī)會留給被試。c.某種程度增加了測驗對考生能力的區(qū)分作用由于答案不惟一,而且不像選擇題那樣正確答案包括在幾個給定的選擇項里,因此被試很難猜測。②主觀性測驗的缺點a.評分結(jié)果的偏差由于評分標(biāo)準(zhǔn)不詳盡周到,不同的評分員理解和把握評分標(biāo)準(zhǔn)會存在差異,評分結(jié)果很難完全一致。即使評分標(biāo)準(zhǔn)十分詳盡,但由于評分標(biāo)準(zhǔn)帶有命題人或標(biāo)準(zhǔn)制定者個人傾向等主觀色彩,評分員會因有不同看法而不認(rèn)可事先制定的評分標(biāo)準(zhǔn),這樣,評分員在評判被試答案時就會發(fā)生偏差。另外,評分員自身的條件或因素,如水平、經(jīng)驗、態(tài)度、情緒等也會影響評分質(zhì)量。評分的不一致使主觀性測驗的信度難以保證。b.評卷費時費力,工作量大雖然命題柔以,省時省力,但閱卷評分時卻費時費力,工作量很大,因此,如果考慮到人力、物力、財力的因素,大規(guī)模的語言考試就很難采用主觀性測驗形式。(2)客觀性測驗客觀性測驗是指事先規(guī)定了答題方式、答題范圍和標(biāo)準(zhǔn)答案,在評分過程中不需要評分員主觀判斷對錯的測驗。①客觀性測驗的優(yōu)點a.題量大,內(nèi)容覆蓋面廣一份測驗有100多甚至200個題目,可以包括的測試點非常多,因此可以比較全面地了解被試的語言知識和語言技能,特別是接受性技能,例如聽力理解技能和閱讀理解技能??陀^性測驗的長度在很大程度上保證了測驗的內(nèi)部一致性信度。b.評分簡單、客觀由于事先規(guī)定了答題范圍和標(biāo)準(zhǔn)答案,評分非常簡單、客觀。另外,像多項選擇題這樣的客觀性測驗題目,一般都可以由光電閱讀機(jī)來閱卷,因此評分誤差很小,而且極其省時省力。c.為測驗質(zhì)量和特性的科學(xué)性研究提供條件由于客觀性測驗多采用0/1記分的方法,分?jǐn)?shù)是連續(xù)變量,再加上被試樣本一般比較大,因此可以滿足統(tǒng)計學(xué)上的一些要求,例如正態(tài)分布、分?jǐn)?shù)等距等,這為測驗質(zhì)量和特性的科學(xué)性研究提供了條件。②客觀性測驗的缺點a.不太適合測試出性語言技能和綜合運用語言能力十多年來,用客觀性測驗題目來比較間接地考查寫作能力和口語水平的嘗試,雖然信度很高,但其效度一致受到質(zhì)疑。b.測驗分?jǐn)?shù)不完全是真實能力水平客觀性測驗題目,特別是多項選擇題,都可以靠猜測來答題,四選一形式的多項選擇題猜對的可能性是25%,而是非判斷題猜對的可能性就是一半,這樣被試的測驗分?jǐn)?shù)并不完全是他真實水平的體現(xiàn)。近年來多項選擇題等客觀性測驗題目遭到了很多批評。c.題目的編制費時費力編制客觀性測驗題目比編制主觀性題目要費時費力得多,特別是多項選擇題的設(shè)計和編制對命題人員的經(jīng)驗、命題技巧等各方面的要求很高,每一道高質(zhì)量的多項選擇題都需要反復(fù)的推敲和打磨。4.舉例說明什么是分力式測驗?它的理論基礎(chǔ)是什么?答:(1)分力式測驗的內(nèi)涵分力式測驗是建立在結(jié)構(gòu)主義語言學(xué)理論基礎(chǔ)上的一種測驗,它把語言分解成語音、語法、詞匯等不同的語言要素或語言點來測。分力式測驗中的一個項目只測試被試對某一個具體的語言知識或語言要素是否掌握例如了解被試者是否掌握某一種語法結(jié)構(gòu),是否認(rèn)識某一個單詞,是否會寫某一個漢字。很多語言測驗(如TOEFL、HSK等)都包含分力式測驗的部分,如初中等漢語水平考試(HSK[初中等])的第二部分“語法結(jié)構(gòu)”就是典型的分力式測驗,這一部分一共有30個題目,每個題目分別測試一種句型結(jié)構(gòu)或一個虛詞,考生在這30個題目上的總得分被看成是其語法知識水平的體現(xiàn);HSK(初中等)中的“閱讀理解”的第一小部分“詞匯”也是分力式測驗,一共有20個題目,每題測試一個單詞。傳統(tǒng)的課堂測驗很多也是分力式的。分力式測驗往往采用多項選擇題、是否判斷題等題型,因此評分客觀、準(zhǔn)確、可靠。從測驗編制的角度看,分力式測驗命題針對性強(qiáng),測試點容易明確。(2)分力式測驗的理論基礎(chǔ)分力式測驗是建立在結(jié)構(gòu)主義語言學(xué)理論基礎(chǔ)上的一種測驗。5.為什么說語言測驗的開發(fā)是一個系統(tǒng)的過程?這一過程主要包括哪些步驟和環(huán)節(jié)?答:(1)語言測試的開發(fā)是一個系統(tǒng)的工程語言測驗的開發(fā)是一個系統(tǒng)的過程,這一過程既包含研制測驗也包括使用測驗。為了保證我們所開發(fā)的測驗有較高的科學(xué)性和可行性,我們需要遵循一定的步驟,并對每一個步驟都實行質(zhì)量監(jiān)控。Bachman和Palmer在《語言測試實踐》一書中用一張圖示意語言測驗的整個開發(fā)過程。如下圖所示:(2)語言測試開發(fā)的步驟和環(huán)節(jié)語言測驗的開發(fā)大體需要三個階段,即設(shè)計階段、操作化階段和實施階段,每個階段都有一系列的任務(wù)需要完成。①設(shè)計階段在設(shè)計階段,需要對測驗的幾個重要方面作出詳細(xì)的描述。a.對測驗?zāi)康牡拿枋鋈魏我环N測驗都有區(qū)別于另一測驗的特定的目的,有的是為了評價學(xué)生的學(xué)業(yè)成就,決定學(xué)習(xí)者是否成功地完成了學(xué)習(xí)任務(wù);有的是為了估計被試的語言熟巧程度,以確定被試能夠用語言做什么;有的是為了診斷教學(xué)過程中出現(xiàn)的問題,從而為改進(jìn)教學(xué)提供反饋信息;有的則是為了判斷學(xué)習(xí)者的能力傾向,從而選拔出有潛力學(xué)好語言的人才。在設(shè)計階段,必須對具體開發(fā)的某一特定測驗的目的和用途作出明確的說明,這是防止日后測驗被濫用、保證考試效度的首要措施。b.對目的語的使用范圍和需要用目的語完成的任務(wù)的確定和描述一個特定的測驗要求被試使用目的語的范圍以及要求被試用目的語完成的任務(wù)的類型是不同的,因此在測驗的設(shè)計階段,需要對這兩個方面都作出明確的概括和描述。c.對測試對象的描述在測驗的設(shè)計階段,還必須對測驗所針對的不同的潛在考生的特征作出盡可能詳盡的分析和描述,這樣做有助于提高測驗的效度。語言測驗的參加者代表的是實際生活中目的語的使用者。d.定義測驗所要測量的結(jié)構(gòu)與對目的語使用的范圍的描述不同,對測驗所要測量的結(jié)構(gòu)(construct)的定義一般是比較抽象的,即我們需要在理論上定義所要開發(fā)的惻隱試圖測到的語言能力的基本特征。e.對測驗的質(zhì)量監(jiān)控計劃在一個測驗的整個開發(fā)過程中,需要對每一個具體的步驟和開發(fā)措施進(jìn)行質(zhì)量監(jiān)控。主要包括信度和效度的評估和監(jiān)控以及影響效果和實用性等方面的評估和監(jiān)控。需要說明的是,在設(shè)計階段主要是要考慮監(jiān)控的計劃和方案,但實際的監(jiān)控要靠后面的開發(fā)環(huán)節(jié)提供的反饋(特別是施測階段提供的反饋)來完成,也可以說質(zhì)量監(jiān)控在整個開發(fā)過程中是貫穿始終的。f.開發(fā)資源的分配計劃如果是開發(fā)一個大規(guī)模的語言測驗,需要在人力、物力、財力、時間等方面作出合理的分配計劃,并制定出切實可行的開發(fā)資源的管理辦法,以保證測驗開發(fā)計劃的順序?qū)崿F(xiàn)。②操作化階段操作化階段中主要有兩項工作要做,一是要確定好整個測驗試卷的構(gòu)成,二是制定出測驗作業(yè)任務(wù)細(xì)則即題目細(xì)則。a.制定測驗作業(yè)任務(wù)細(xì)則測驗作業(yè)任務(wù)細(xì)則包括概述(即測驗總的說明)和題目細(xì)則兩方面內(nèi)容。在概述部分要介紹測驗的用途、對象、目的(要考查什么能力)、測試時間等;而在題目細(xì)則里要包括答題指導(dǎo)語、例題、題目形式及其他題目屬性、記分方式等。下面是某測驗的一個分測驗測試任務(wù)細(xì)則的例子。b.編制試卷構(gòu)成說明如果一個測驗包含若干個分測驗(若干部分),那么針對每個分測驗或每種題型都需要分別測驗任務(wù)細(xì)則。而試卷構(gòu)成說明,主要是確定各個分測驗的作業(yè)任務(wù),根據(jù)什么樣的設(shè)計原則和方式整合在一起,構(gòu)成一個完整的測驗試卷。③施測階段測驗根據(jù)測驗題目細(xì)則編制完成以后,接下來的工作就是實施測試。在施測階段要解決兩個問題,一是通過施測搜集數(shù)據(jù)以便對測驗的質(zhì)量作出分析和評估,二是根據(jù)測試結(jié)果作出關(guān)于被試能力等的推斷,以便為決策提供依據(jù)。a.預(yù)測預(yù)測是指在測驗正式投入使用之前,預(yù)先把按照測驗題目編寫好的題目讓一組對測驗?zāi)繕?biāo)團(tuán)體最有代表性的被試來做,然后收集關(guān)于測驗題目質(zhì)量的信息,為確定正式施測的題目提供反饋。b.實測預(yù)測的題目數(shù)量一般遠(yuǎn)遠(yuǎn)多于正式試卷時尚的題目,根據(jù)預(yù)測后的題目分析,把符合預(yù)先制定的質(zhì)量標(biāo)準(zhǔn)的題目篩選出來,再按照測驗試卷構(gòu)成規(guī)定的各分測驗的題目數(shù)量等要求拼合成正式的測驗試卷,排版印刷后就可以對測驗的目標(biāo)團(tuán)體正式實施測試了。6.應(yīng)該如何描述測驗的實施對象?答:在測驗的設(shè)計階段,還必須對測驗所針對的不同的潛在考生的特征作出盡可能詳盡的分析和描述,折這樣做有助于提高測驗的效度。(1)描述測試對象在個體特征、知識結(jié)構(gòu)和知識水平、一般語言能力水平等語言測驗的參加者代表的是實際生活中目的語的使用者,因此,我們必須對測試對象在個體特征、知識結(jié)構(gòu)和知識水平、一般語言能力水平等方面的情況作出概括和描述,比如在考生對象的個體特征方面,我們必須描述和知識水平、一般語言能力水平等方面的情況作出概括和描述,比如在考生對象的個體特征方面,我們必須描述他們的年齡、寫別、學(xué)歷或受教育程度以及母語背景等;(2)分析被測者的需求我們還必須對被試的需求作出分析,我們需要確定被試參加測試是為了謀職、求學(xué)、提升還是僅僅為了評價自己的語言水平。為了使所要開發(fā)的測驗在難度等方面適應(yīng)潛在的被試,還需要對他們的一般語言能力水平作出大體的估計,我們可以根據(jù)被試在另外的公認(rèn)有效的水平測驗(如HSK)上的得分,對他們作出大致的劃分。7.對語言測驗的質(zhì)量監(jiān)控主要應(yīng)該從哪些方面考慮?答:在一個測驗的整個開發(fā)過程中,需要對每一個具體的步驟和開發(fā)措施進(jìn)行質(zhì)量監(jiān)控。主要包括信度和效度的評估和監(jiān)控以及影響效果和實用性等方面的評估和監(jiān)控。(1)信度信度指考試結(jié)果的一致性和穩(wěn)定性程度,它是考試效度的必要前提條件。標(biāo)準(zhǔn)化測驗要求信度系數(shù)在0.9以上,“漢語水平考試(HSK)”信度系數(shù)一直保持在0.96~0.98。(2)效度效度是考試質(zhì)量的最重要的方面,它所涉及的是測試是否測到了它所想要測的東西。與信度不同,效度很難用一個具體的數(shù)字來表示。效度包括效標(biāo)關(guān)聯(lián)效度、內(nèi)容效度、表面效度和構(gòu)想效度等多種不同的效度,根據(jù)所開發(fā)的測驗的用途和性質(zhì),我們可以追求不同的效度,例如,如果所要開發(fā)的測驗是成績測驗,那么我們應(yīng)該更重視內(nèi)容效度,但如果所開發(fā)的測驗是水平測驗,構(gòu)想效度無疑是最重要的,其次是內(nèi)容效度。(3)影響效果后效(Washback)主要是指語言測驗對教學(xué)產(chǎn)生的影響。一般認(rèn)為,測驗后效果是由測驗本身帶來的。在測驗設(shè)計階段考慮后效問題,主要是預(yù)防測驗結(jié)果被決策者濫用。(4)實用性對于任何一個測驗,實用性是必須要考慮的問題,必須考慮所要開發(fā)的測驗是否便于實施、是否經(jīng)濟(jì)。像口語測驗和書面表達(dá)測驗,如果是大規(guī)模的而又找不到比較客觀化的測驗手段或評分手段,實施起來就非常困難。8.試按照本節(jié)所舉的例子,給某測驗?zāi)愁愵}目編寫一個題目細(xì)則。答:以語言運用測驗為例。概述測驗名稱:語言運用測驗對象:在中國高等院校從零起點開始學(xué)習(xí)漢語600~800學(xué)時的母語非漢語者。測驗?zāi)康模毫私獗辉囀褂脻h語進(jìn)行交際時的準(zhǔn)確性和恰當(dāng)性程度。測驗用途:評估被試的現(xiàn)有漢語水平,為用人單位選拔人才提供信息。測試時間:30分鐘。題目細(xì)則答題指導(dǎo)語:語言運用分測驗包括40個句子,每個巨資都有幾個地方標(biāo)有下劃線,其中只有一個地方含有錯誤。請考生找出含有錯誤的那一部分,然后在答題卡上找到相應(yīng)的題號,把代表考生認(rèn)為有錯誤的那一部分的字母框涂黑。例題:81他一會兒要打了一個電話,告訴小王我們今天晚上不能去參加宴會了。A.BCD刺激屬性:(1)題干的文字選字中國大陸出版的報紙、雜志以及其他一般性讀物,除了含有錯誤的那一部分,其他都是原文,不經(jīng)過改寫。內(nèi)容不涉及專業(yè)知識,不涉及敏感性題材,不能有性別歧視或種族歧視等冒犯性語言。(2)題干是單句,只有一個表示句子完結(jié)的標(biāo)點符號(如句號、問號、嘆號等)。(3)題干的句子最長不超過40字。(4)標(biāo)有下劃線的部分是詞或詞組。(5)每個題干(句子)中都只有一處包含錯誤。(6)題干(句子)中的錯誤可能是語法錯誤、詞性誤用、搭配不當(dāng)?shù)雀鞣N表達(dá)方面的錯誤,但不是漢字書寫錯誤或標(biāo)點符號使用錯誤。反應(yīng)屬性:(1)被試從試卷上標(biāo)有下劃線的四個部分中辨別出包含錯誤的那一部分。(2)被試需在答題卡上找到相應(yīng)的題號,然后用鉛筆將代表錯誤的部分的字母框涂黑。評分方法:客觀性(多項選擇)題目,使用光電閱讀機(jī)閱卷。記分方法:采用0/1記分方式,答對一題計1分,答錯1題計0分,漏答計0分;每題若選擇一個以上答案,即使包括正確選擇項,亦計0分。9.什么是客觀性題目?什么是主觀性題目?都有哪些客觀性題型?答:一個語言測驗根據(jù)測驗特定的目的和測驗內(nèi)容的特點,可以采用多種多樣的題型。我們在測驗的類型一節(jié)里,曾經(jīng)討論過主觀性測驗和客觀性測驗的問題,一般來講,為了保證測驗的信度和效度,一個測驗應(yīng)該既包括主觀性題目也包括客觀性題目。(1)客觀性題目客觀性題目是指題目不僅有題干,而且已經(jīng)將答案列出,由你做出選擇的題目??陀^性題目的形式是多種多樣的,如多項選擇題、是非題、排序題等。在標(biāo)準(zhǔn)化語言測驗中,最常用的客觀性題型就是多項選擇題。多項選擇題的好處是內(nèi)容覆蓋面大,評分客觀,但偏斜多項選擇題既費時又費力,需要遵循一定的原則,也要講究一些技巧,因此,我們主要介紹這種題型。(2)主觀性題目主觀性題目是指只有題干,答案需要你自己寫出來的那些試題,如名詞解釋、簡答、論述、案例分析等。10.多項選擇題核心的編寫原則是什么?為什么要遵循這樣的原則?答:多項選擇題是考查閱讀理解、聽力理解等語言技能時常用的題目形式。這種題型的最大好處就是評分客觀,而評分客觀可以為測試可能性(信度)提供一定的保證。多項選擇題的編寫原則具體包括:(1)題干本身要有意義并且應(yīng)該是一個清晰的問題,應(yīng)該清楚地點明問題的實質(zhì),讓被試明確被詢問的究竟是什么?不要讓被試猜測你小問他什么。(2)主干語應(yīng)盡可能多地包含師徒內(nèi)容,共漢的因素、重復(fù)性的詞語(如相同的敘述或修飾成分)應(yīng)放在主干語中,而不要在選擇項中重復(fù)使用,備選答案則要盡可能精煉。(3)題目與題目之間或答案與答案之間應(yīng)避免相互依賴,相互包含或相互暗示。(4)一個題目應(yīng)該只有一個正確答案或最佳答案。(5)每個迷惑項都應(yīng)該似是而非。(6)聽力理解和閱讀理解試題的備選答案應(yīng)盡可能回避語料中有的精辟。(7)所有備選答案難度應(yīng)大體相當(dāng)。(8)所有備選答案應(yīng)盡可能涉及同一類事物、活動或同一領(lǐng)域。(9)備選答案若用解釋性語言,應(yīng)避免牽強(qiáng)附會。(10)所有備選答案在譽發(fā)商應(yīng)該與主干語一致。(11)備選答案在形式上應(yīng)盡可能避免任何可能的暗示。(12)整個測驗中正確答案的位置不應(yīng)固定,應(yīng)保證出現(xiàn)頻率相等,出現(xiàn)順序隨機(jī)。總之,上述各條編寫原則圍繞著一個核心原則,即在設(shè)計多項選擇題的題干和備選答案時,應(yīng)盡可能避免任何對考生有意或無意的不必要的暗示,因為這類不必要的暗示往往會削弱題目的需分能力,最終導(dǎo)致整個考試的信度和效度被降低。11.如何用極端分組法來計算題目區(qū)分度指數(shù)?答:用極端分組的方法計算題目區(qū)分度指數(shù)的方法和步驟如下:(1)把所有被試按測驗總分,從高到低排隊,如果一個測驗包含若干分測驗,就應(yīng)該按分測驗分?jǐn)?shù)排隊。(2)取全體被試中分?jǐn)?shù)最27%的人作為高分組,取全體被試中分?jǐn)?shù)最低的27%的人作為低分組,中間的46%的人不參加計算。(3)按下列公式計算區(qū)分度指數(shù):例如,測驗一共有100人參加,第3題高分組的人(正好是27人)都答對了,而低分組的人都答錯了,則區(qū)分度指數(shù)為:“1”是區(qū)分度指數(shù)的最大值,一般不可能得到。12.一個難易度中、區(qū)分度高的題目是否絕對是好的題目?為什么?答:難易度適中、去高的題目絕非是好的題目,區(qū)分題目好壞的因素主要包括:(1)檢驗題目難易度是否合適,是否太難或太易,一般認(rèn)為,一個題目若有20%到80%的被試能夠做對,就比較恰當(dāng)。(2)檢驗各個題目在區(qū)分被試水平方面起了多大作用,一個好的測驗(特別是標(biāo)準(zhǔn)化的水平測驗(每個題目都應(yīng)該對區(qū)分被試的水平作出一定貢獻(xiàn)。(3)檢查多項選擇題各個干擾項是否起到了干擾水平差的被試的作用,干擾作用有多大。(4)檢查每個題目選擇各個干擾項的人數(shù)的分布情況,看各個干擾項的干擾作用是否大體相當(dāng)。(5)檢查各個題目的答案惟一性和正確性,如果一個題目的某個“非正確”答案有過多的高水平被試選擇,就可能存在正確答案不惟一或預(yù)設(shè)的正確答案并非正確答案的問題。13.為什么說信度和效度是語言測驗最重要的質(zhì)量標(biāo)準(zhǔn)?答:我們根據(jù)特定的目的編制測驗,并對特定的被試實施測驗,我們首先希望測驗?zāi)軌驕?zhǔn)確地反映出我們所要考查的東西,即我們希望測驗是有效的;其次,如果重新對被試施測,我們希望得到同樣的結(jié)果,即我們希望言的分?jǐn)?shù)是穩(wěn)定的、可靠的。不光是語言測驗,任何一種測量工具都存在可靠性(即信度)和有效性(即效度)的問題。因此,信和效度是測驗質(zhì)量評估的最重要的兩條標(biāo)準(zhǔn)。14.信的基本概念是什么?如何從測量學(xué)的角度理解信度的概念?答:(1)信度的基本概念信度是指測量結(jié)果的可靠性、一致性和穩(wěn)定性程度。一個高質(zhì)量的測驗,對同樣一組被試反復(fù)多次測量,其結(jié)果應(yīng)該保持不變。即信度指在不同的時間或不同的測試條件下,使用同一測驗(或者使用同一測驗的不同版本),對同一組被試實施多次測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論