《心理與教育測(cè)量》大綱知識(shí)要點(diǎn).doc

上傳人：f*** IP屬地：河南上傳時(shí)間：2020-01-15 格式：DOC 頁數(shù)：28 大?。?96.46KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

心理測(cè)量大綱知識(shí)要點(diǎn)考試總體要求 1.正確理解心理測(cè)量的基本概念,掌握心理測(cè)量的基本方法。2.掌握各種測(cè)量理論和各種測(cè)量指標(biāo)的計(jì)算方法；能夠正確使用各種測(cè)驗(yàn),并對(duì)其結(jié)果進(jìn)行解釋。三、心理測(cè)量的基本理論(一)心理測(cè)量的理論基礎(chǔ)1.心理測(cè)量的基本概念（03首師大，名）(1)基本概念：所謂心理測(cè)量，就是依據(jù)心理學(xué)理論，使用一定的操作程序，通過觀察人的少數(shù)有代表性的行為，對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段。（測(cè)量：按照一定法則使用量具給事物指派數(shù)字的過程。）(2)心理測(cè)量三要素：行為樣組、標(biāo)準(zhǔn)化和客觀性。（01華東師大，簡(jiǎn)答題）行為樣組是指以被測(cè)量的行為作為代表來推測(cè)與其關(guān)聯(lián)的心理特征。一個(gè)測(cè)驗(yàn)的好壞,首先決定于測(cè)題編制的好壞,即必須要求這些測(cè)題能夠引發(fā)和測(cè)量出具有高度代表性的行為樣組。標(biāo)準(zhǔn)化是指測(cè)驗(yàn)的一致性,也即：測(cè)驗(yàn)的編制、實(shí)施、記分以及測(cè)驗(yàn)分?jǐn)?shù)解釋的程序的一致性。心理測(cè)驗(yàn)的客觀性,是指測(cè)驗(yàn)不受主觀支配,其測(cè)量方法是可以重復(fù)的,被試外部的行為是客觀的，測(cè)驗(yàn)的實(shí)施、記分和解釋都是客觀的?？陀^性是衡量科學(xué)性的一個(gè)根本標(biāo)志,對(duì)于心理測(cè)驗(yàn)尤為重要,這是決定一個(gè)心理測(cè)驗(yàn)?zāi)芊翊嬖诘谋匾獥l件。行為樣組的代表性和測(cè)驗(yàn)程序的標(biāo)準(zhǔn)化,都是為了保證這種客觀性。(3)心理測(cè)量是動(dòng)詞意義，心理測(cè)驗(yàn)是名詞意義。心理測(cè)量的參照點(diǎn)是相對(duì)參照點(diǎn)；單位不等距。一般來說,心理測(cè)量是在順序量表上進(jìn)行的。但通過統(tǒng)計(jì)方法,可以把測(cè)量數(shù)據(jù)轉(zhuǎn)換為等距數(shù)據(jù)。（心理測(cè)量屬于哪一種水平上的測(cè)量，為什么？【02華東師大，簡(jiǎn)答題】）（4）對(duì)心理測(cè)量的評(píng)價(jià)貢獻(xiàn)：首先，為心理科學(xué)理論的發(fā)展，特別是個(gè)體差異心理提供了具體方法和手段，構(gòu)筑了差異心理理論的重要基石。其次，心理測(cè)量為社會(huì)實(shí)踐服務(wù)做出了巨大的貢獻(xiàn)。局限：首先，心理測(cè)量具有間接性，精確程度遠(yuǎn)遠(yuǎn)劣于物理測(cè)量。其次，心理測(cè)量所依據(jù)的理論尚不完善。2.心理測(cè)量的特征、分類(1)心理測(cè)量的特征心理測(cè)量的間接性研究者無法直接測(cè)量人的心理,只能測(cè)量人的外顯行為。根據(jù)心理學(xué)特質(zhì)（04首師大，名）理論,人們對(duì)行為測(cè)量的結(jié)果進(jìn)行推論,從而間接了解人的心理屬性。心理特質(zhì)是一組內(nèi)部相關(guān)或有內(nèi)在聯(lián)系的行為傾向，是個(gè)人對(duì)刺激作反應(yīng)的一種內(nèi)在傾向，是個(gè)體特有的、穩(wěn)定的、可辨別的特征。心理測(cè)量的相對(duì)性所謂測(cè)量就是看每個(gè)人處在這個(gè)序列的什么位置上,位置具有相對(duì)性。心理測(cè)量的比較標(biāo)準(zhǔn)的確定沒有永恒的標(biāo)準(zhǔn),從測(cè)量結(jié)果進(jìn)行推論所采用的標(biāo)準(zhǔn)不是一成不變的。心理測(cè)量的客觀性測(cè)量的客觀性實(shí)際就是測(cè)量的標(biāo)準(zhǔn)化問題。按照嚴(yán)格的科學(xué)程序去編制和使用的測(cè)驗(yàn)稱之為標(biāo)準(zhǔn)化測(cè)驗(yàn)。（測(cè)驗(yàn)為什么要標(biāo)準(zhǔn)化？怎樣保證測(cè)驗(yàn)的標(biāo)準(zhǔn)化？【03北師大，簡(jiǎn)答題】）為什么要實(shí)行標(biāo)準(zhǔn)化：a.可以減少無關(guān)因素對(duì)測(cè)驗(yàn)?zāi)康牡挠绊?使測(cè)量準(zhǔn)確、客觀；b.有統(tǒng)一標(biāo)準(zhǔn),便于對(duì)不同人的測(cè)驗(yàn)成績(jī)進(jìn)行比較和交流；c.同一份測(cè)驗(yàn)可用于許多人并可反復(fù)使用,較為經(jīng)濟(jì)。補(bǔ)充：心理測(cè)驗(yàn)的可行性（桑代克1918語凡是客觀存在的事物都有數(shù)量；麥柯爾1939語凡是有數(shù)量的事物都可以測(cè)量）。(2)心理測(cè)量的分類根據(jù)測(cè)量的對(duì)象分類a.認(rèn)知測(cè)驗(yàn)：又可稱為能力測(cè)驗(yàn),這類測(cè)驗(yàn)主要包括智力測(cè)驗(yàn)、能力傾向測(cè)驗(yàn)(又稱性向測(cè)驗(yàn))、教育測(cè)驗(yàn)(又稱成就測(cè)驗(yàn))及創(chuàng)造力測(cè)驗(yàn)等。b.人格測(cè)驗(yàn)：它測(cè)量的是個(gè)性中除能力以外的部分,亦可看作是非能力測(cè)驗(yàn)。主要測(cè)量性格、情緒、需要、動(dòng)機(jī)、興趣、態(tài)度、焦慮、氣質(zhì)及自我概念等方面的個(gè)性心理特征及其相關(guān)行為。根據(jù)測(cè)驗(yàn)的人數(shù)分類a.個(gè)別測(cè)驗(yàn)：通常是一個(gè)主試與一個(gè)被試面對(duì)面進(jìn)行。比如比奈西蒙智力測(cè)驗(yàn)、韋克斯勒智力測(cè)驗(yàn)等。優(yōu)點(diǎn)：主試對(duì)被試的言語、情緒狀態(tài)和行為反應(yīng)有仔細(xì)的觀察和控制的機(jī)會(huì),并且有充分的機(jī)會(huì)與被試合作,激發(fā)被試測(cè)試的積極性,所以其結(jié)果比較正確可靠,適用于一些特殊對(duì)象,如幼兒和文盲。缺點(diǎn)：時(shí)間長(zhǎng),施測(cè)手續(xù)復(fù)雜,對(duì)主試要求高,主試需要經(jīng)過嚴(yán)格訓(xùn)練,因而一般人不易掌握。所以個(gè)別測(cè)驗(yàn)僅在有特殊目的(如診斷)時(shí)才使用。b.團(tuán)體測(cè)驗(yàn)：在同一時(shí)間內(nèi)由一位主試對(duì)多數(shù)人施測(cè)。比如瑞文智力測(cè)驗(yàn)、大多數(shù)人格測(cè)驗(yàn)等。優(yōu)點(diǎn)：可以節(jié)省人力、物力和時(shí)間,主試也不必經(jīng)過嚴(yán)格的專門訓(xùn)練。團(tuán)體測(cè)驗(yàn)的記分和評(píng)分較個(gè)別測(cè)驗(yàn)更為嚴(yán)格和客觀。一般每題都有標(biāo)準(zhǔn)答案。另外,因?yàn)闃?biāo)準(zhǔn)化樣組規(guī)模相當(dāng)大,故團(tuán)體測(cè)驗(yàn)更易建立常模。缺點(diǎn)：無法對(duì)被試詳細(xì)觀察,不易控制被試的行為,容易產(chǎn)生誤差,難以發(fā)現(xiàn)被試的特殊反應(yīng),主試和被試之間無法建立和諧關(guān)系等。注意團(tuán)體測(cè)驗(yàn)可個(gè)別施測(cè),但個(gè)別測(cè)驗(yàn)不能以團(tuán)體方式實(shí)施。根據(jù)測(cè)驗(yàn)材料分類a.言語或文字測(cè)驗(yàn)：這類測(cè)驗(yàn)的題目是以語言或文字呈現(xiàn)的,受試者也要用文字或語言作答。優(yōu)點(diǎn)：它可以測(cè)量人類高層次的心理功能,其編制和實(shí)施也較容易,因而應(yīng)用范圍較廣。團(tuán)體測(cè)驗(yàn)多數(shù)采用文字測(cè)驗(yàn)形式。缺點(diǎn)：語言或文字測(cè)驗(yàn)不能應(yīng)用于語言有困難的人,而且對(duì)語言文化背景不同的被試加以比較時(shí),甚至在同一文化背景下,被試文化程度和教育背景的不同,也會(huì)對(duì)測(cè)驗(yàn)結(jié)果產(chǎn)生相當(dāng)大的影響,因而多少會(huì)損害其客觀性。b.非語言測(cè)驗(yàn)或操作性測(cè)驗(yàn)：此類測(cè)驗(yàn)題目不用文字來呈現(xiàn),而是以圖畫(圖形)、符號(hào)或?qū)嵨?如方塊、積木、儀器和工具等)為測(cè)驗(yàn)材料。優(yōu)點(diǎn)：被試的作答無需使用語言或文字,常以操作表達(dá)或回應(yīng)。具有文化公平性,因而可方便地用于學(xué)前兒童和不識(shí)字的成人,也可進(jìn)行不同文化背景的差異比較研究。缺點(diǎn)：費(fèi)時(shí)太多,不易團(tuán)體實(shí)施等。還有測(cè)驗(yàn)既包括言語測(cè)驗(yàn)又包括操作測(cè)驗(yàn),如韋克斯勒智力量表。依據(jù)測(cè)驗(yàn)的功能分類a.篩選性測(cè)驗(yàn)；只是對(duì)所欲測(cè)量心理特質(zhì)作一般性的考查。這類測(cè)驗(yàn)簡(jiǎn)便易行、省時(shí)省力,但是測(cè)驗(yàn)內(nèi)容不夠全面,因而不夠精確。b.診斷性測(cè)驗(yàn)：測(cè)驗(yàn)的內(nèi)容多而全面,一般為個(gè)別測(cè)驗(yàn)。它的目的是進(jìn)一步診斷被試某些方面的特殊優(yōu)點(diǎn)和缺點(diǎn)。按測(cè)驗(yàn)的要求分類a.最高作為測(cè)驗(yàn)：要求被試盡可能做出最好的回答，一般有對(duì)錯(cuò)之分。b.典型作為測(cè)驗(yàn)：要求被試按通常的習(xí)慣方式做出反應(yīng)，一般無對(duì)錯(cuò)之分。按測(cè)驗(yàn)的性質(zhì)分類a.結(jié)構(gòu)性測(cè)驗(yàn)：在測(cè)驗(yàn)中,所呈現(xiàn)的刺激和受測(cè)者的任務(wù)是明確的。b.投射性測(cè)驗(yàn)：在測(cè)驗(yàn)中,刺激沒有明確意義,問題模糊,對(duì)被試的反應(yīng)也沒有明確規(guī)定。羅夏、TAT等。按測(cè)驗(yàn)的應(yīng)用領(lǐng)域分類a.教育測(cè)驗(yàn)：是測(cè)驗(yàn)應(yīng)用最廣的領(lǐng)域,用得最多的是學(xué)績(jī)測(cè)驗(yàn)。注意速度測(cè)驗(yàn)和難度測(cè)驗(yàn)的區(qū)別。（速度測(cè)驗(yàn)和難度測(cè)驗(yàn)的定義和區(qū)別，【04北師大，簡(jiǎn)答題】）b.職業(yè)測(cè)驗(yàn)：主要用于人員選拔和安置,可以是能力和學(xué)績(jī)測(cè)驗(yàn),也可以用人格測(cè)驗(yàn)。c.臨床測(cè)驗(yàn)：主要用于醫(yī)務(wù)部門。許多能力和人格測(cè)驗(yàn)可用來檢查智力障礙或精神疾病,為臨床診斷和心理咨詢工作服務(wù)。依據(jù)測(cè)驗(yàn)結(jié)果的解釋模式分類常模參照測(cè)驗(yàn)：與常模比較，以評(píng)價(jià)被試在團(tuán)體中的相對(duì)位置為目的；標(biāo)準(zhǔn)參照測(cè)驗(yàn)：與一絕對(duì)標(biāo)準(zhǔn)相比較，以評(píng)價(jià)被試有無達(dá)到該標(biāo)準(zhǔn)為目的。（二者的區(qū)別，03北師大，簡(jiǎn)答題）。3.經(jīng)典測(cè)量理論和真分?jǐn)?shù)理論模型（03首師大，簡(jiǎn)答題）經(jīng)典測(cè)驗(yàn)理論又稱真分?jǐn)?shù)理論（有書上稱“隨機(jī)誤差理論”）。經(jīng)典測(cè)驗(yàn)由基本假設(shè)、信度和效度等概念組成。其中影響最大的是斯皮爾曼的真分?jǐn)?shù)模型。(1)真分?jǐn)?shù)模型真分?jǐn)?shù)的定義即是測(cè)量中不存在測(cè)量誤差時(shí)的真值或客觀值,操作定義就是無數(shù)次測(cè)量的平均值,通常用或T表示。另外,用或表示實(shí)得分?jǐn)?shù), 或表示誤差分?jǐn)?shù)。真分?jǐn)?shù)模型認(rèn)為,任何測(cè)驗(yàn)所測(cè)得的分?jǐn)?shù)都等于真實(shí)分?jǐn)?shù)和誤差分?jǐn)?shù)之和。真分?jǐn)?shù)理論的基本方程式如下：實(shí)得分?jǐn)?shù)是真分?jǐn)?shù)與誤差分?jǐn)?shù)的函數(shù),即實(shí)得分?jǐn)?shù)由和共同決定。進(jìn)行心理測(cè)量時(shí),一般被視為穩(wěn)定不變的,因此個(gè)體實(shí)測(cè)分?jǐn)?shù)的變化是由引起的。除了基本方程式,真分?jǐn)?shù)理論還有三個(gè)基本假設(shè)作為整個(gè)理論的支柱。其一,誤差分?jǐn)?shù)的平均數(shù)是零。其二,誤差分?jǐn)?shù)與真分?jǐn)?shù)相互獨(dú)立,即相關(guān)為零。其三,兩次測(cè)量的誤差分?jǐn)?shù)之間的相關(guān)為零。（2）信度；（3）效度見下文(4)經(jīng)典測(cè)驗(yàn)理論的方法體系可分為項(xiàng)目分析和標(biāo)準(zhǔn)化兩大部分。項(xiàng)目分析主要包括計(jì)算題目的難度、區(qū)分度以及項(xiàng)目特征曲線ICC（坐標(biāo)為總分或效標(biāo)分?jǐn)?shù)和通過率）（04華中師大）。測(cè)驗(yàn)的標(biāo)準(zhǔn)化是指對(duì)不同的被試在測(cè)試題目、施測(cè)條件和程序、計(jì)分和分?jǐn)?shù)解釋等各方面都采用一個(gè)固定的標(biāo)準(zhǔn)。（測(cè)驗(yàn)的標(biāo)準(zhǔn)化對(duì)提高測(cè)驗(yàn)質(zhì)量有何作用？它的局限是什么？測(cè)驗(yàn)最主要的質(zhì)量指標(biāo)是什么？06北師大，簡(jiǎn)答題） (二)測(cè)量的信度與效度（04浙大，名）1.測(cè)量的信度(1)信度的定義信度的描述定義指測(cè)驗(yàn)結(jié)果的一致性或穩(wěn)定性,其測(cè)量定義為一組測(cè)量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實(shí)得變異數(shù))的比率,含義是在實(shí)得分?jǐn)?shù)的變異中有多大比例是由真分?jǐn)?shù)的變異決定的。rxx=ST2/Sx2(2)信度系數(shù)的估計(jì)（種類）重測(cè)信度：a.求法是對(duì)同一批被試運(yùn)用某個(gè)測(cè)驗(yàn)實(shí)施首測(cè),相隔一段時(shí)間后對(duì)它進(jìn)行再測(cè),然后計(jì)算首測(cè)與再測(cè)所得分?jǐn)?shù)的相關(guān)（一般是積差相關(guān)）,即得重測(cè)信度。這種信度能表示兩次測(cè)驗(yàn)結(jié)果有無變動(dòng),反映測(cè)驗(yàn)分?jǐn)?shù)的穩(wěn)定程度,故又稱穩(wěn)定性系數(shù)。b.優(yōu)點(diǎn)：能提供有關(guān)測(cè)驗(yàn)結(jié)果是否隨時(shí)間而變異的資料,可作為預(yù)測(cè)受測(cè)者將來行為表現(xiàn)的依據(jù)。c.缺點(diǎn)：易受練習(xí)和記憶的影響,前后兩次施測(cè)間隔的長(zhǎng)短必須適度。如果相隔時(shí)間太短,則記憶猶新,練習(xí)的影響較大；如果相隔時(shí)間太長(zhǎng),則身心的發(fā)展與學(xué)習(xí)經(jīng)驗(yàn)的累積等都足以改變測(cè)驗(yàn)分?jǐn)?shù)的意義,而使相關(guān)降低。另外,第一次嘗試所發(fā)現(xiàn)的錯(cuò)誤也可能導(dǎo)致第二次反應(yīng)的變化而增加誤差變異。d.誤差來源：時(shí)間的不同所帶來的隨機(jī)影響,如氣候、偶然的噪音或其他干擾,以及引起被試本身身心狀態(tài)變化的因素如疾病、疲勞、情緒類型、焦慮等。重測(cè)信度代表測(cè)驗(yàn)成績(jī)能夠應(yīng)用于不同時(shí)間的程度,信度越高,受測(cè)驗(yàn)環(huán)境中日常的隨機(jī)因素的影響越小。由于測(cè)驗(yàn)的穩(wěn)定性系數(shù)受時(shí)間和其他各種因素的影響,故任何一個(gè)測(cè)驗(yàn)都可有不止一個(gè)重測(cè)信度系數(shù)。所以在測(cè)驗(yàn)手冊(cè)中報(bào)告此種信度時(shí)應(yīng)說明時(shí)間間隔以及在此間隔中被試的有關(guān)經(jīng)歷,如受過何種教育訓(xùn)練、心理治療以及有何學(xué)習(xí)經(jīng)歷等。復(fù)本信度:a.求法是先運(yùn)用同一測(cè)驗(yàn)的一型或A型施測(cè),隨后在最短的時(shí)間內(nèi)運(yùn)用二型或B型進(jìn)行再測(cè),然后再求它們得分的相關(guān)系數(shù)。b.誤差來源：測(cè)驗(yàn)兩種形式是否等值：測(cè)題取樣是否匹配,格式是否相同,內(nèi)容、題數(shù)、難度、平均數(shù)、標(biāo)準(zhǔn)差是否一致。再就是被試方面情緒波動(dòng)、動(dòng)機(jī)變化等,以及測(cè)驗(yàn)情境的變化,偶發(fā)因素的干擾。這些都會(huì)引起測(cè)量誤差。在報(bào)告復(fù)本信度時(shí),也應(yīng)說明兩次施測(cè)的間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。內(nèi)部一致性信度估計(jì)內(nèi)部一致性系數(shù)的方法通常有兩類：一類是分半法,另外一類方法需要對(duì)項(xiàng)目反應(yīng)的方差或協(xié)方差進(jìn)行分析。a.分半法是將一個(gè)測(cè)驗(yàn)分裂為兩個(gè)假定相等而獨(dú)立的部分,然后計(jì)算這兩部分的記分的相關(guān)系數(shù)(一般是以項(xiàng)目的奇數(shù)為一組,偶數(shù)為另一組),繼而再用斯皮爾曼布朗公式來估計(jì)整個(gè)測(cè)驗(yàn)的信度（斯布公式要求兩半的變異數(shù)相等）。公式如下：，其中是分半信度系數(shù),測(cè)驗(yàn)在原版時(shí)的信度的估計(jì)值。缺點(diǎn)：把測(cè)驗(yàn)劃分成兩半的方法實(shí)際上有多種,而每一種劃分方法產(chǎn)生的估計(jì)都有差別,因此用分半法得到的信度估計(jì)值不具備惟一性。b.克朗巴赫系數(shù)（03首師大，名）適用于非0,1記分的一種內(nèi)在一致性系數(shù),計(jì)算公式為：式中,n為人數(shù)，是測(cè)驗(yàn)每個(gè)項(xiàng)目的方差。Si2c.除了以上兩種方法,還有庫德理查遜公式（只適合于0、1記分的題目）；荷伊特信度；因素分析等方法。有些測(cè)量學(xué)家認(rèn)為因素分析是決定測(cè)驗(yàn)同質(zhì)性的最好方法。因素分析方法最初是由心理學(xué)家斯皮爾曼在研究智力理論時(shí)提出來的,后來發(fā)展成為一種復(fù)雜的統(tǒng)計(jì)技術(shù),用于確定一組變量間的相互關(guān)系最少需要幾個(gè)因素來解釋。在測(cè)驗(yàn)上,如果一個(gè)因素就足以解釋所有題目分?jǐn)?shù)的變異時(shí),這個(gè)測(cè)驗(yàn)就是同質(zhì)的,假如需要一個(gè)以上的因素時(shí),則測(cè)驗(yàn)的組成是異質(zhì)的。d.內(nèi)在一致性信度的優(yōu)點(diǎn)：只需施測(cè)一次,就可以估計(jì)信度系數(shù),省時(shí)節(jié)力。另外用內(nèi)在一致性系數(shù)一般要比重測(cè)信度、復(fù)本信度所算出的信度系數(shù)高。e.不足之處：求分半信度時(shí),分半的方法不同,估計(jì)出的信度系數(shù)就不同。而且,測(cè)驗(yàn)須要求具有同質(zhì)性。所以項(xiàng)目異質(zhì)的人格測(cè)驗(yàn),通常就不能用內(nèi)在一致性系數(shù)來估計(jì)信度。評(píng)分者信度（02西北師大，名）隨機(jī)抽取相當(dāng)份數(shù)的試卷,由兩位評(píng)分者按記分規(guī)則分別給分。然后根據(jù)每份試卷的兩個(gè)分?jǐn)?shù)計(jì)算其相關(guān)系數(shù),即得評(píng)分者信度。一般要求在成對(duì)的、受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)到0.90以上,才認(rèn)為評(píng)分是客觀的。綜上所述,信度高低是用相關(guān)系數(shù)表示的。不同的測(cè)驗(yàn)內(nèi)容,對(duì)相關(guān)系數(shù)的要求有所不同。一般說來,標(biāo)準(zhǔn)智力測(cè)驗(yàn)應(yīng)達(dá)到0.85以上,個(gè)性測(cè)驗(yàn)和興趣測(cè)驗(yàn)一般應(yīng)達(dá)0.700.80水平。學(xué)業(yè)成就測(cè)驗(yàn)要求信度在0.90以上,才能被稱為是一個(gè)良好的測(cè)驗(yàn)。(3)信度的影響因素與改進(jìn)（03、04首師大，簡(jiǎn)答題）信度與誤差變異之間有密切的關(guān)系。誤差變異越大,信度愈低。凡被試、主試、測(cè)驗(yàn)內(nèi)容和施測(cè)情境等各個(gè)方面能引起隨機(jī)誤差而導(dǎo)致分?jǐn)?shù)不一致的因素,都會(huì)降低測(cè)驗(yàn)的信度。被試方面身心健康狀況、動(dòng)機(jī)、注意力、持久性、求勝心、作答態(tài)度等。主試方面不按規(guī)定實(shí)施測(cè)驗(yàn),制造緊張氣氛,給予特別協(xié)助,評(píng)分主觀等。測(cè)驗(yàn)內(nèi)容方面試題取樣不當(dāng),內(nèi)部一致性低,題數(shù)過少,題意模糊等。施測(cè)情境方面測(cè)驗(yàn)現(xiàn)場(chǎng)條件,如通風(fēng)、溫度、光線、噪音、桌面好壞、空間闊窄等。除此之外,還有以下幾個(gè)因素會(huì)影響信度系數(shù)的大?。罕辉嚇颖居绊懶哦认禂?shù)的一個(gè)重要因素是用來確定信度的被試團(tuán)體的特性。團(tuán)體的異質(zhì)性（公式）如同所有相關(guān)系數(shù)一樣,信度系數(shù)受分?jǐn)?shù)的分布范圍影響,而分?jǐn)?shù)范圍與被試團(tuán)體的異質(zhì)程度有關(guān)。一個(gè)團(tuán)體越是異質(zhì),其分?jǐn)?shù)范圍越大。而一個(gè)經(jīng)過篩選、相對(duì)同質(zhì)的團(tuán)體分?jǐn)?shù)則較為均勻。rnn=1-So2(1-roo)/Sn2團(tuán)體的平均水平信度系數(shù)不僅受被試樣本的個(gè)體差異程度的影響,而且受被試團(tuán)體的平均水平的影響。這是因?yàn)?對(duì)于不同水平的團(tuán)體,題目具有不同的難度。每個(gè)題目在難度上的微小差異累積起來便會(huì)影響信度。由于信度系數(shù)與被試樣本的異質(zhì)程度和平均水平有關(guān),因此在編制測(cè)驗(yàn)時(shí),應(yīng)把常模團(tuán)體按年齡、性別、文化程度分為更同質(zhì)的亞團(tuán)體,并分別報(bào)告每個(gè)亞團(tuán)體的信度系數(shù),這樣測(cè)驗(yàn)才能適用于各種團(tuán)體。題目的數(shù)量（公式）題目的數(shù)量(亦即測(cè)驗(yàn)的長(zhǎng)度)也是影響信度系數(shù)的一個(gè)因素。一般說來,在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。因?yàn)樵黾訙y(cè)驗(yàn)的長(zhǎng)度可以加大分?jǐn)?shù)范圍。rkk=Krxx /1+(k-1)rxx這里要注意一點(diǎn),只有當(dāng)新題目是與原題目選自同一總體,即與原題目具有同質(zhì)性時(shí)，增長(zhǎng)測(cè)驗(yàn)才能改進(jìn)信度。測(cè)驗(yàn)難度測(cè)驗(yàn)的難度與信度間沒有簡(jiǎn)單的關(guān)系。然而,若測(cè)驗(yàn)對(duì)某團(tuán)體太難或太容易,則分?jǐn)?shù)范圍將縮小,從而使信度降低。這表明,要使信度達(dá)到最高,能產(chǎn)生最廣分?jǐn)?shù)分布的難度水平方為合適。間隔時(shí)間以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大；間隔時(shí)間越久,其他變因介入的可能性越大,受外界的影響也越多,信度系數(shù)便越低。2.測(cè)量的效度(1)效度的定義（04重慶大學(xué)，名）效度的測(cè)量定義：與測(cè)量目標(biāo)有關(guān)的真變異數(shù)與總變異數(shù)的比率,含義是在一組測(cè)驗(yàn)分?jǐn)?shù)中,有多大的比例是由測(cè)驗(yàn)所要測(cè)量的目標(biāo)引起的?？偡肿儾罘譃槿齻€(gè)部分：，：由所測(cè)量的心理特性引起的主要變差,或與所測(cè)量的心理特性有關(guān)的共同因素所引起的變差；：由與所測(cè)量的特性無關(guān)的其他個(gè)別特性所造成的變差(系統(tǒng)誤差引起的變差)；：誤差變差,是測(cè)量誤差的變差。描述定義：效度是指一個(gè)測(cè)驗(yàn)或量具能夠測(cè)量出其所要測(cè)量目標(biāo)的程度。(2)效度的估計(jì)測(cè)驗(yàn)的效度分為三大類：內(nèi)容效度、構(gòu)想效度、效標(biāo)效度。內(nèi)容效度（02西北師大，名）（表面效度【04首師大，名】）內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性。這種測(cè)驗(yàn)的效度主要與測(cè)驗(yàn)內(nèi)容有關(guān),所以叫內(nèi)容效度,指測(cè)驗(yàn)題目在要測(cè)量的行為領(lǐng)域的代表性。內(nèi)容效度的評(píng)估方法主要應(yīng)用于對(duì)學(xué)績(jī)測(cè)驗(yàn)的評(píng)估。一個(gè)測(cè)驗(yàn)要有內(nèi)容效度必須具備兩個(gè)條件：要有定義得完好的內(nèi)容范圍；測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。測(cè)驗(yàn)題目并不需要包羅該范圍的所有材料,而只需包含測(cè)驗(yàn)編制者認(rèn)為是重要的材料。確定內(nèi)容效度的方法主要有專家判斷、統(tǒng)計(jì)分析、經(jīng)驗(yàn)法等。a.專家判斷為了確定一個(gè)測(cè)驗(yàn)是否具有內(nèi)容效度,最常用的方法是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的符合性做出判斷。b.統(tǒng)計(jì)分析內(nèi)容效度可由一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來作數(shù)量的估計(jì)。若相關(guān)低,說明二者至少有一個(gè)缺乏內(nèi)容效度；若相關(guān)高,一般可推論測(cè)驗(yàn)有內(nèi)容效度。c.經(jīng)驗(yàn)法檢查不同年級(jí)的學(xué)生在測(cè)驗(yàn)上的得分和在每個(gè)題目上的反應(yīng)情況。一般說來,測(cè)驗(yàn)總分和題目通過率隨年級(jí)而提高,便是測(cè)驗(yàn)具有內(nèi)容效度的證據(jù)。構(gòu)想效度是指一個(gè)測(cè)驗(yàn)對(duì)某種心理學(xué)理論所涉及的抽象概念或心理特質(zhì)測(cè)得如何。效標(biāo)效度又稱實(shí)證效度,指的是測(cè)驗(yàn)對(duì)研究者所感興趣的外在行為能夠做出多好的預(yù)測(cè)。這種外在行為是衡量測(cè)驗(yàn)是否有效的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。構(gòu)想效度構(gòu)想效度就是測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度。研究和考察構(gòu)想效度要回答三個(gè)問題：一個(gè)測(cè)驗(yàn)測(cè)量什么心理構(gòu)想,對(duì)這構(gòu)想測(cè)得有多好,測(cè)驗(yàn)分?jǐn)?shù)中有多少比例的變異數(shù)是來自測(cè)驗(yàn)所要測(cè)的構(gòu)想。確定構(gòu)想效度的方法主要分為測(cè)驗(yàn)內(nèi)方法、測(cè)驗(yàn)間方法。a.測(cè)驗(yàn)內(nèi)方法主要是通過研究測(cè)驗(yàn)內(nèi)部構(gòu)造來界定所測(cè)量的構(gòu)想的范圍。如確定測(cè)驗(yàn)的內(nèi)容效度,分析被試對(duì)題目作反應(yīng)的過程,考察測(cè)驗(yàn)的同質(zhì)性等方式。b.測(cè)驗(yàn)間是通過研究幾個(gè)測(cè)驗(yàn)間的相互關(guān)系,找出他們的共同特點(diǎn),進(jìn)而推斷出所測(cè)的共同特質(zhì)是什么,便可確定這些測(cè)驗(yàn)是否有構(gòu)想效度。如確定相容效度、區(qū)分效度、因素分析（因素分析法在效度驗(yàn)證中的作用，【04首師大，簡(jiǎn)答題】）效度等方式。效標(biāo)效度（為了使效標(biāo)關(guān)聯(lián)效度的更準(zhǔn)確反映測(cè)驗(yàn)質(zhì)量，應(yīng)該關(guān)注哪些技術(shù)環(huán)節(jié)？06北師大，簡(jiǎn)答題）效標(biāo)效度又稱實(shí)證效度,指一個(gè)測(cè)驗(yàn)對(duì)處于特定情景中的個(gè)體的行為進(jìn)行預(yù)測(cè)時(shí)的有效性,也就是對(duì)于研究者所感興趣的行為能夠預(yù)測(cè)得怎么樣。其中,被預(yù)測(cè)的行為是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。確定效標(biāo)效度的方法主要有相關(guān)法、區(qū)分法、命中率和功利率等。a.相關(guān)法最常用來建立實(shí)證效度的方法是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量間的相關(guān),所得到的數(shù)量指標(biāo)稱作效度系數(shù)。在測(cè)驗(yàn)手冊(cè)中,一般用它來報(bào)告測(cè)驗(yàn)對(duì)每種效標(biāo)的效度。計(jì)算效度系數(shù)最常用的是積差相關(guān)法。b.區(qū)分法第二個(gè)決定效度的方法是看預(yù)測(cè)源的分?jǐn)?shù)是否可區(qū)分由效標(biāo)測(cè)量所定義的團(tuán)體。c.命中率（公式）當(dāng)測(cè)驗(yàn)用來作取舍的根據(jù)時(shí),其有效性的指標(biāo)就是正確決定的比例（總命中率）。(正命中率和總命中率)d.功利率為了確定測(cè)驗(yàn)的功效,人們還常常對(duì)使用測(cè)驗(yàn)所花掉的費(fèi)用與得到的利益進(jìn)行比較,看是否利大于弊。這種效度指標(biāo),叫功利率。(3)效度的影響因素與改進(jìn)影響測(cè)驗(yàn)效度的因素很多,在編制測(cè)驗(yàn)或選擇標(biāo)準(zhǔn)化測(cè)驗(yàn)時(shí),都應(yīng)該考慮到這些因素,以免影響測(cè)驗(yàn)結(jié)果的有效性。測(cè)驗(yàn)本身的因素a.測(cè)題中所用詞匯和句型不能過于困難。測(cè)題中的詞匯和句型應(yīng)適于被試的文化水平。b.試題的意思應(yīng)該清楚。題意含糊,容易產(chǎn)生歧義,以致被試產(chǎn)生誤解也會(huì)降低測(cè)驗(yàn)的效度。c.所編制的測(cè)題應(yīng)該造合所要測(cè)量的學(xué)習(xí)結(jié)果。d.測(cè)題中不能提供額外線索。若測(cè)題為被試提供了額外線索,就無法確認(rèn)測(cè)題是否真正測(cè)量到了所欲測(cè)量的學(xué)習(xí)結(jié)果。e.測(cè)題的編制要合理。一般地,測(cè)題以由易到難的順序排列。f.選擇題的正確答案不能有明顯的組型。如果測(cè)驗(yàn)正確答案的位置有明顯的規(guī)律,學(xué)生有可能發(fā)現(xiàn)規(guī)律答對(duì)一些原本較難的題目,從而影響測(cè)驗(yàn)結(jié)果的效度。g.測(cè)題數(shù)目。增加測(cè)題的數(shù)目(即增加測(cè)驗(yàn)長(zhǎng)度)通?？梢蕴岣邷y(cè)驗(yàn)的信度和效度。h.測(cè)題的難度要適當(dāng)。標(biāo)準(zhǔn)參照測(cè)驗(yàn)中的測(cè)題平均難度應(yīng)在0.05左右,并有適當(dāng)?shù)碾y度分布,測(cè)題太難或太易都無法區(qū)分學(xué)生的優(yōu)劣,從而降低測(cè)驗(yàn)的效度。標(biāo)準(zhǔn)參照測(cè)驗(yàn)并不強(qiáng)調(diào)測(cè)驗(yàn)分?jǐn)?shù)間的差異,也就不需要區(qū)分學(xué)生的優(yōu)劣,這時(shí)的測(cè)題難度就應(yīng)該與教學(xué)目標(biāo)的要求相一致。測(cè)驗(yàn)實(shí)施和計(jì)分方面測(cè)驗(yàn)情境,如場(chǎng)地的布置、材料的準(zhǔn)備等都會(huì)影響到測(cè)驗(yàn)的效度,此外,在實(shí)施測(cè)驗(yàn)的過程中,是否遵照測(cè)驗(yàn)使用手冊(cè)的各項(xiàng)規(guī)定進(jìn)行標(biāo)準(zhǔn)化的施測(cè),指導(dǎo)語是否已將答題方式說明清楚,是否按要求進(jìn)行時(shí)間限制等,也影響到測(cè)驗(yàn)的效度。如果沒有按照標(biāo)準(zhǔn)化的程序進(jìn)行施測(cè)和客觀的評(píng)分,就必然會(huì)使測(cè)驗(yàn)效度降低。被試的主觀方面被試的興趣、動(dòng)機(jī)、情緒、態(tài)度和身體健康狀況以及是否充分合作與盡力而為等,都會(huì)影響到測(cè)驗(yàn)結(jié)果的可靠性和正確性,即效度和信度。3.信度和效度的關(guān)系（03首師大，簡(jiǎn)答題）(1)信度和效度的關(guān)系：信度是效度的必要條件,但不是充分條件。具體是：信度低,效度不可能高。因?yàn)槿绻麥y(cè)量的數(shù)據(jù)不準(zhǔn)確,也并不能有效地說明所研究的對(duì)象；信度高,效度未必高。例如,如果我們準(zhǔn)確地測(cè)量出某人的經(jīng)濟(jì)收入,也未必能夠說明他的消費(fèi)水平；效度低,信度很可能高。例如,即使一項(xiàng)研究未能說明社會(huì)流動(dòng)的原因,但它很有可能很精確很可靠地調(diào)查各個(gè)時(shí)期各種類型的人的流動(dòng)數(shù)量；效度高,信度也必然高。信度和效度的差別在于所涉及的誤差不同。信度考慮的是隨機(jī)誤差的影響,效度的誤差則還包括由于測(cè)量了對(duì)測(cè)驗(yàn)?zāi)康膩碚f無關(guān)的變量所引起的系統(tǒng)誤差。(2)效度受到信度的制約(三)心理測(cè)量的誤差（誤差的來源及其控制）（詳述測(cè)量誤差的來源，【04首師大，論述】）1.測(cè)量誤差的定義(1)所謂誤差是指在測(cè)量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)果。測(cè)量誤差分為隨機(jī)誤差和系統(tǒng)誤差。(2)在測(cè)驗(yàn)中,有與測(cè)量目的無關(guān)的偶然因素引起的變化無規(guī)律的誤差,使得多次測(cè)量結(jié)果不一致,這種誤差的大小和方向是隨機(jī)的,叫做隨機(jī)誤差或偶然誤差。(3)有與測(cè)量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差,它穩(wěn)定地存在于每一次測(cè)量中,這種誤差叫做系統(tǒng)誤差。系統(tǒng)誤差只影響測(cè)量的準(zhǔn)確性,而隨機(jī)誤差既能影響準(zhǔn)確性,也能影響一致性。能帶來誤差的因素有很多,實(shí)際上任何與測(cè)驗(yàn)?zāi)康臒o關(guān)的變因都可能引起誤差。測(cè)驗(yàn)的標(biāo)準(zhǔn)化就是為了控制這些誤差因素,使測(cè)驗(yàn)分?jǐn)?shù)更可信、更有效。2.測(cè)量的隨機(jī)誤差來源及控制(1)測(cè)量的隨機(jī)誤差來源于施測(cè)過程引起的誤差,在測(cè)驗(yàn)的實(shí)施過程中可能引起誤差的因素很多,如測(cè)試環(huán)境、時(shí)間、主試者、意外干擾、評(píng)分記分等。測(cè)試環(huán)境的干擾。施測(cè)現(xiàn)場(chǎng)的溫度、光線、桌面高低好壞等對(duì)被試都有影響。例如,在測(cè)試過程中,光線充足,有利于被試正常地作答；光線暗淡,則會(huì)影響作答的效果。測(cè)試時(shí)間的影響。時(shí)間安排也是影響測(cè)試準(zhǔn)確性的一個(gè)重要因素,如果時(shí)間安排不當(dāng)或時(shí)限不統(tǒng)一,必然會(huì)引起測(cè)驗(yàn)結(jié)果的改變。主試因素。主試的年齡、性別、外表、言談舉止、表情動(dòng)作、對(duì)測(cè)驗(yàn)過程的熟悉程度等都能影響測(cè)驗(yàn)的結(jié)果。如果不按照規(guī)定施測(cè),如給予暗示、制造緊張氣氛等都會(huì)帶來很大的誤差。意外干擾。在測(cè)試環(huán)境復(fù)雜,特別是當(dāng)被試人數(shù)較多時(shí),可能發(fā)生意外情況,例如：停電、有人生病、作弊等等,無論哪種情況出現(xiàn),都會(huì)影響測(cè)驗(yàn)結(jié)果的準(zhǔn)確性。評(píng)分記分。評(píng)分不客觀和記分出現(xiàn)錯(cuò)誤也是較常見的誤差。一般來說,客觀題的評(píng)分較為準(zhǔn)確客觀,而主觀題的評(píng)分標(biāo)準(zhǔn)較難掌握,再加上閱卷者的風(fēng)格、情緒以及其他心理因素的干擾,因而很難保證分?jǐn)?shù)的一致性。(2)控制主試在測(cè)驗(yàn)前要把測(cè)驗(yàn)材料準(zhǔn)備好,以免短缺而臨時(shí)尋找。事先的充分準(zhǔn)備可減少實(shí)施過程的測(cè)量誤差,負(fù)責(zé)施測(cè)的主試也要有一本測(cè)題冊(cè)和一份答案記分紙,并請(qǐng)被試準(zhǔn)備好鉛筆或圓珠筆。測(cè)驗(yàn)被試的確定和測(cè)驗(yàn)場(chǎng)地和時(shí)間的約定也是一個(gè)不容忽略的問題。一定要與被試、被試的家長(zhǎng),或者被試所在學(xué)校(校長(zhǎng)和班主任)在被試對(duì)象、時(shí)間和地點(diǎn)等方面事先做好約定,不要臨時(shí)應(yīng)付,造成被試情緒上的波動(dòng),影響測(cè)試的正常進(jìn)行。主試應(yīng)努力聯(lián)系條件符合要求的測(cè)驗(yàn)場(chǎng)地。一般來說,測(cè)驗(yàn)場(chǎng)地應(yīng)保證良好的照明和空氣調(diào)節(jié),并避免噪聲和其他外界干擾,桌椅大小高低要適合,桌面要平整。評(píng)分記分要客觀。3.測(cè)量的系統(tǒng)誤差來源及控制(1)測(cè)驗(yàn)自身引起的誤差測(cè)驗(yàn)自身的誤差主要來源于測(cè)驗(yàn)的編制過程,其中項(xiàng)目取樣影響最大。測(cè)驗(yàn)所要測(cè)量的內(nèi)容是什么,測(cè)驗(yàn)的項(xiàng)目能否代表這些內(nèi)容,是至關(guān)重要的。當(dāng)測(cè)驗(yàn)的項(xiàng)目較少而取樣缺乏代表性時(shí),被試的反應(yīng)很難代表真實(shí)水平。對(duì)于有些類型的項(xiàng)目,例如是非題、選擇題,被試可能憑猜測(cè)作答,從而降低分?jǐn)?shù)的可靠性。此外,題目用詞模棱兩可,或?qū)σ髷⑹霾磺宓?也都會(huì)帶來誤差。(2)被試引起的誤差在測(cè)量工作中,最復(fù)雜的和最難控制的是由被試本身引起的各種誤差。應(yīng)試動(dòng)機(jī)。如果被試在兩次測(cè)試時(shí)的動(dòng)機(jī)不一樣,會(huì)使被試的回答態(tài)度、注意力、持久性以及反應(yīng)速度發(fā)生變化,就容易引起測(cè)量誤差。測(cè)驗(yàn)焦慮。研究表明,能力與測(cè)驗(yàn)焦慮呈負(fù)相關(guān),抱負(fù)水平與焦慮成正相關(guān),缺乏自信、情緒不穩(wěn)定的人焦慮較低等。測(cè)試經(jīng)驗(yàn)。被試對(duì)測(cè)驗(yàn)的程序、內(nèi)容材料的熟悉程度不同以及回答技巧的差異都會(huì)影響測(cè)量的一致性。所以正式測(cè)驗(yàn)之前,應(yīng)有示范或例子、練習(xí)。學(xué)習(xí)、發(fā)展與教育。重復(fù)測(cè)驗(yàn)中如果有個(gè)別人在首次測(cè)驗(yàn)后受到特殊訓(xùn)練(學(xué)習(xí)),重復(fù)測(cè)驗(yàn)中某些人在兩次測(cè)驗(yàn)間受到特殊訓(xùn)練,或教育學(xué)習(xí)量不同,均會(huì)造成測(cè)量誤差。反應(yīng)傾向。獨(dú)立于測(cè)驗(yàn)內(nèi)容的反應(yīng)傾向,也會(huì)使得本來能力相同的被試獲得不同的成績(jī)。對(duì)于速度測(cè)驗(yàn),由于測(cè)驗(yàn)時(shí)間有限,而題量又較大,求快與求準(zhǔn)兩種不同傾向會(huì)對(duì)測(cè)驗(yàn)成績(jī)產(chǎn)生影響；對(duì)于是非題,某些人有偏好選“是”或選“非”的傾向。這些都會(huì)給測(cè)驗(yàn)成績(jī)帶來誤差,為此在編制時(shí)一定要注意控制這些傾向的影響。生理因素。當(dāng)被試在測(cè)試前失眠,或在生病、疲勞的狀態(tài)下進(jìn)行測(cè)試,也容易引起則量誤差。能帶來誤差的因素還有很多實(shí)際上任何與測(cè)驗(yàn)無關(guān)的變因都可能引起誤差。測(cè)驗(yàn)的標(biāo)準(zhǔn)化就是為了控制這些誤差因素,使測(cè)驗(yàn)分?jǐn)?shù)更可信、更有效。(3)控制測(cè)題數(shù)量要適中,要有代表性,能代表所要測(cè)量的內(nèi)容。表達(dá)要簡(jiǎn)潔清晰,不要模棱兩可。測(cè)試中,通常應(yīng)告訴被試如何對(duì)測(cè)題作反應(yīng)。主試是通過指導(dǎo)語指導(dǎo)并幫助被試?yán)?。解測(cè)驗(yàn)的施行要求、方法和步驟,并讓受測(cè)者盡量放松心情,消除焦慮。4.測(cè)量誤差的估計(jì)（公式）（標(biāo)準(zhǔn)誤，【04華中】，名）(1)系統(tǒng)誤差僅與無限多次測(cè)量結(jié)果的平均值有關(guān),而與在重復(fù)性條件下得到的不同測(cè)量結(jié)果無關(guān)。因此,在重復(fù)性條件下得到的不同測(cè)量結(jié)果應(yīng)該具有相同的系統(tǒng)誤差。由于系統(tǒng)誤差和真值有關(guān),而真值是無法確切知道的,只能用約定真值代替,因而可能得到的只是系統(tǒng)誤差的估計(jì)值,并具有一定的不確定度。系統(tǒng)誤差可以通過對(duì)測(cè)量結(jié)果進(jìn)行修正而消除。由于誤差等于負(fù)的修正值,因此系統(tǒng)誤差的不確定度就是修正值的不確定度。(2)隨機(jī)誤差等于誤差減去系統(tǒng)誤差。因?yàn)闇y(cè)量只能進(jìn)行有限次數(shù),故可能確定的只是隨機(jī)誤差的估計(jì)值。若測(cè)量結(jié)果為無限多次測(cè)量結(jié)果的平均值,顯然此時(shí)的隨機(jī)誤差為零,也就是說測(cè)量結(jié)果中已經(jīng)不含有隨機(jī)誤差分量,只存在系統(tǒng)誤差。但實(shí)際上不可能進(jìn)行無限多次測(cè)量,因而在測(cè)量結(jié)果中隨機(jī)誤差和系統(tǒng)誤差分量都存在。在重復(fù)性條件下得到的不同測(cè)量結(jié)果具有不同的隨機(jī)誤差,但有相同的系統(tǒng)誤差。(四)心理測(cè)驗(yàn)的項(xiàng)目分析（02西北師大，名）1.題目的難度(1)概念：難度就是項(xiàng)目(或題目)的難易程度。能力測(cè)驗(yàn)中常以該項(xiàng)目的通過(或答對(duì))率表示,即以答對(duì)或通過該題的人數(shù)的百分比來表示：式中, 代表試題難度；為全體被試人數(shù)；為答對(duì)或通過該題的人數(shù)。在非能力測(cè)驗(yàn)中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中,能在答案范圍內(nèi)回答該題的人數(shù)。(2)難度的計(jì)算方法二分法記分的項(xiàng)目若試題為二分法項(xiàng)目(即答對(duì)給1分,答錯(cuò)記0分)時(shí),難度可以直接采用公式計(jì)算。當(dāng)被試人數(shù)較多時(shí),則可以根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組：分?jǐn)?shù)最高的27%的被試為高分組(),分?jǐn)?shù)最低的27%的被試為低分組(),中間46%的被試為中間組。分別計(jì)算高分組和低分組的通過率,再求試題的難度：其中代表難度,和分別代表高分組和低分組的通過率。非二分法計(jì)分的項(xiàng)目當(dāng)測(cè)驗(yàn)項(xiàng)目為問答題或其他不能用二分法計(jì)分的形式時(shí),常常對(duì)部分正確的反應(yīng)也給一定分?jǐn)?shù)。對(duì)于這類項(xiàng)目,一般用下面的公式計(jì)算難度：式中,為全體受測(cè)者在該題上的平均分,為該題的滿分。(3)難度水平的確定在測(cè)驗(yàn)編制過程中,分析項(xiàng)目難度主要是為了篩選項(xiàng)目。項(xiàng)目的難度水平多高合適,取決于測(cè)驗(yàn)的目的、項(xiàng)目的形式以及測(cè)驗(yàn)的性質(zhì)。0.5上下浮動(dòng)0.2。在教育工作中,有些測(cè)驗(yàn)的目的是為了考查學(xué)生對(duì)某些方面的知識(shí)、技能是否掌握,此時(shí)可以不考慮難度。當(dāng)測(cè)驗(yàn)用于選人時(shí),應(yīng)該比較多地采用那些難度值接近錄取率的項(xiàng)目。作為一個(gè)整體的測(cè)驗(yàn)的難度,直接依賴于組成測(cè)驗(yàn)的項(xiàng)目的難度。對(duì)整個(gè)測(cè)驗(yàn)的難度的綜合性檢驗(yàn),可由分?jǐn)?shù)的分布提供。當(dāng)分?jǐn)?shù)分布是正偏態(tài),分?jǐn)?shù)密集在低端,表明測(cè)驗(yàn)的難度偏高。當(dāng)分?jǐn)?shù)分布是負(fù)偏態(tài),分?jǐn)?shù)密集在高端,表明測(cè)驗(yàn)的難度偏低。2.題目的區(qū)分度（03華中師大，名）(1)概念：區(qū)分度是指項(xiàng)目對(duì)所測(cè)量的心理特性的區(qū)分程度或鑒別能力,也就是項(xiàng)目的效度。常以高分組與低分組在該項(xiàng)目得分的平均數(shù)的差異表示,或以該項(xiàng)目得分與測(cè)驗(yàn)總分的相關(guān)表示。(2)確定區(qū)分度的方法確定區(qū)分度常用的是相關(guān)法,即以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)(或測(cè)驗(yàn)總分)的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo),相關(guān)越高,區(qū)分能力越好。二列相關(guān)。二列相關(guān)適用于兩個(gè)可以連續(xù)測(cè)量的變量,但其中有一個(gè)由于某種原因被分成兩個(gè)類別。點(diǎn)二列相關(guān)。點(diǎn)二列相關(guān)適用于一個(gè)變量為連續(xù)變量,另一個(gè)變量為二分變量的資料。當(dāng)一個(gè)變量是雙峰分配時(shí)。盡管它并不是真正的二分變量,這種統(tǒng)計(jì)方法也適用。四分相關(guān)。四分相關(guān)適用于兩個(gè)常態(tài)的連續(xù)變量均被人為二分的資料。如果一個(gè)題目分?jǐn)?shù)被二分成通過不通過,效標(biāo)成績(jī)也被分成通過與不通過,這時(shí)就會(huì)得到四個(gè)類別,從而可組成一個(gè)四格表。計(jì)算四分相關(guān)最常用的是皮爾遜的余弦公式。相關(guān)。相關(guān)的統(tǒng)計(jì)方法適用于兩個(gè)變量都是點(diǎn)分配的資料,即兩個(gè)變量都是二分名義變量。項(xiàng)目和總分相關(guān)重疊的校正。在做項(xiàng)目分析時(shí),需要經(jīng)常計(jì)算項(xiàng)目和總分的相關(guān),這是一種局部和總體的相關(guān),在一個(gè)測(cè)驗(yàn)中,只有當(dāng)每一項(xiàng)目的變異數(shù)相同或項(xiàng)目非常多,以致每個(gè)項(xiàng)目所貢獻(xiàn)的變異數(shù)比例都很微小時(shí),才能把項(xiàng)目和總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。如果不具備這些條件,最好計(jì)算每一項(xiàng)目和所有其他項(xiàng)目合成分?jǐn)?shù)之間的相關(guān)。(3)鑒別指數(shù)的計(jì)算（項(xiàng)目鑒別指數(shù)的意義是什么，02華東師大，簡(jiǎn)答題）鑒別指數(shù)（04華中師大，名）的計(jì)算就是求區(qū)分度指標(biāo)。當(dāng)效標(biāo)測(cè)量是一個(gè)連續(xù)變量(例如學(xué)業(yè)分?jǐn)?shù))時(shí),可從分布的兩端選出高分組()和低分組(),然后將高分組和低分組通過每個(gè)項(xiàng)目的人數(shù)用百分比來表示,這兩個(gè)百分?jǐn)?shù)之間的差異就提供了題目區(qū)分度的指標(biāo)。計(jì)算公式表示為：其中為鑒別指數(shù),為高分組(27%)通過人數(shù)百分比, 為低分組(27%)通過人數(shù)百分比。區(qū)分度的值亦具有相對(duì)性,與計(jì)算方法、樣本大小、分組標(biāo)準(zhǔn)和樣本的同質(zhì)性有關(guān)。所以很難確定一個(gè)絕對(duì)的水平作為篩選項(xiàng)目的標(biāo)準(zhǔn)。對(duì)于教育成就測(cè)驗(yàn)來說,一般要求項(xiàng)目與總分的相關(guān)達(dá)到0.20以上,高分組與低分組通過率之差達(dá)到0.150.20以上。(4)區(qū)分度與難度的關(guān)系難度和區(qū)分度都是相對(duì)的,是針對(duì)一定團(tuán)體而言的(絕對(duì)的難度和區(qū)分度是不存在的)。一般說來，較難的項(xiàng)目對(duì)高水平被試區(qū)分度高,較易的項(xiàng)目對(duì)水平低的被試區(qū)分度高,中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。這與中等難度的項(xiàng)目區(qū)分度最高的說法并不矛盾。由于人的多數(shù)心理特性呈常態(tài)分布,所以項(xiàng)目難度的分布也以常態(tài)為好,即特別難與特別容易的題目較少,越接近中等難度的題目越多,而所有項(xiàng)目的平均難度為0.50。3.題目的綜合分析和篩選(1)鑒別力。取舍題目時(shí),首先要看鑒別力。按照測(cè)題的鑒別指數(shù)與優(yōu)劣之評(píng)鑒標(biāo)準(zhǔn),0.30以上的項(xiàng)目是比較好的。(2)難度。值一般在0.35至0.65之間為好,但就整個(gè)測(cè)驗(yàn)而言,難度為0.5的測(cè)題應(yīng)居多,也需一些難度較大或較小的測(cè)題。(3)選項(xiàng)。項(xiàng)目的選項(xiàng)分析是指對(duì)選擇題后面所提供的幾個(gè)答案的分析。選項(xiàng)分析的異常情況主要有：正確答案無人選擇,或少于其他選項(xiàng)人數(shù)；錯(cuò)誤答案選的人太多；正確選項(xiàng)上高分組選擇人數(shù)少于低分組；錯(cuò)誤選項(xiàng)上高分組選擇人數(shù)又多于低分組；某個(gè)選項(xiàng)無人選擇；未答的人數(shù)較多。 (五)心理測(cè)驗(yàn)的編制技術(shù)1.心理測(cè)驗(yàn)編制的基本程序編制的步驟主要有(1)擬訂測(cè)驗(yàn)編制計(jì)劃。包括確定測(cè)驗(yàn)的目的和目標(biāo)內(nèi)容、制定編題的雙向細(xì)目表（內(nèi)容以及所占的百分比）。（在編制學(xué)業(yè)成就測(cè)驗(yàn)時(shí)，確定雙項(xiàng)細(xì)目表有何價(jià)值？ 06北師大，簡(jiǎn)答題）(2)編選測(cè)驗(yàn)題目。根據(jù)編題的雙向細(xì)目表,編寫測(cè)題,測(cè)題數(shù)應(yīng)比最后所需的數(shù)目多一倍至幾倍,以備篩選和編制復(fù)本。(3)試測(cè)和分析。選擇與測(cè)驗(yàn)對(duì)象相近的團(tuán)體進(jìn)行試測(cè),試測(cè)的實(shí)施與情境應(yīng)力求與以后正式測(cè)驗(yàn)的情況相類似,項(xiàng)目分析應(yīng)從質(zhì)和量?jī)煞矫孢M(jìn)行,并對(duì)不適當(dāng)?shù)念}目予以修改或刪除。(4)編排。編排題目有兩種方式：一種是并列直進(jìn)式,即將整個(gè)測(cè)驗(yàn)題按題目材料的性質(zhì)歸為若干份測(cè)驗(yàn),同一份測(cè)驗(yàn)的題目依難度由易到難排列；另一種是混和螺旋式,即先將各類題目依難度分成若干不同的層次,再將不同性質(zhì)的題目作交叉排列,難度遞增。(5)建立常模。從將來要使用測(cè)驗(yàn)的全體對(duì)象中抽取標(biāo)準(zhǔn)化的樣本進(jìn)行施測(cè),計(jì)算出平均得分,即為該測(cè)驗(yàn)的常模。(6)鑒定測(cè)驗(yàn)一是鑒定測(cè)驗(yàn)的信度以了解其可靠性或一致性；二是鑒定測(cè)驗(yàn)的效度,考驗(yàn)其有效性和正確性。（7）編制測(cè)驗(yàn)手冊(cè)2.測(cè)驗(yàn)?zāi)繕?biāo)與命題雙向細(xì)目表(1)測(cè)量目標(biāo)概念：指所編制測(cè)驗(yàn)是用來測(cè)量什么心理變量或行為特征的。測(cè)驗(yàn)?zāi)繕?biāo)必須具有操作定義,即目標(biāo)要非常具體,如測(cè)量語文理解能力的目標(biāo)可定為測(cè)量閱讀時(shí)了解文義的能力。分析測(cè)量目標(biāo)主要包括兩個(gè)方面：一是確定能表征所欲測(cè)量的心理結(jié)構(gòu)的行為；二是確定每一類行為的項(xiàng)目比例。(2)命題雙向細(xì)目表概念：命題雙向細(xì)目表是測(cè)驗(yàn)編制過程中的重要依據(jù),即編題計(jì)劃。它指出測(cè)驗(yàn)所包含的內(nèi)容和要測(cè)定的各種技能,以及對(duì)每一個(gè)內(nèi)容、技能的相對(duì)重要程度。用途：在編題階段,命題雙向細(xì)目表指出應(yīng)該寫多少和寫哪些種類的題目,題目編好后可將題目的實(shí)際分布情況與測(cè)驗(yàn)計(jì)劃對(duì)照,以確定測(cè)驗(yàn)題目是否恰當(dāng)?shù)卮砹怂獪y(cè)量的領(lǐng)域,核對(duì)重要方面的內(nèi)容是否有遺漏。在記分時(shí)可按表中百分比確定每類題目的分?jǐn)?shù)。3.題目編制技術(shù)要編制一套好的測(cè)驗(yàn)題目,需要掌握命題的原則和一般要領(lǐng)。(1)命題的一般原則試題要符合測(cè)驗(yàn)的目的。內(nèi)容取樣要有代表性。題目格式要簡(jiǎn)潔,不要使被試發(fā)生誤解。文句要簡(jiǎn)明扼要,要避免使用艱深的字詞。應(yīng)有不致引起爭(zhēng)論的確定答案(創(chuàng)造力測(cè)驗(yàn)、人格測(cè)驗(yàn)除外)。每個(gè)試題必須彼此獨(dú)立,不要使一個(gè)題目的回答影響另一個(gè)題目的回答。題目中不可含有暗示本題或其他題正確答案的線索。題目?jī)?nèi)容不要超出受測(cè)團(tuán)體的知識(shí)和能力范圍。所提問題應(yīng)避免涉及社會(huì)禁忌與個(gè)人隱私。施測(cè)與評(píng)分省時(shí)。(2)測(cè)題編制題目形式根據(jù)應(yīng)答的方式,可以分成兩大類,即自由應(yīng)答型和固定應(yīng)答型。自由應(yīng)答型題目是讓受測(cè)者用自己的語言或行動(dòng)來對(duì)某一問題做出回答,包括填充題、簡(jiǎn)答題、論文題、聯(lián)想題等。固定應(yīng)答型題目又稱客觀性題目,是讓受測(cè)者從測(cè)驗(yàn)編制者事先定好的答案中辨認(rèn)出正確答案,包括多選題、是非題、匹配題等。這種題目因?yàn)樵u(píng)分客觀,所以在標(biāo)準(zhǔn)化測(cè)驗(yàn)中用得較多。（選擇題中什么樣的選項(xiàng)是可以被接受的？02華東師大論述）各種類型的題目均有自己的特點(diǎn)和編制原則,但在編制一套測(cè)驗(yàn)題目時(shí)應(yīng)該遵循這些基本原則。 1.選擇題（題干簡(jiǎn)明、選項(xiàng)扼要、答案唯一、選項(xiàng)等長(zhǎng)、題干選項(xiàng)用詞不一致、選項(xiàng)同一形式） 2.是非題（言之有據(jù)、每題一個(gè)概念、避免否定和雙重否定、表達(dá)意見說明來源、“是”“非”基本相等） 3.簡(jiǎn)答題（用問句、空格不宜過多、只有一個(gè)簡(jiǎn)短答案） 4.操作題（操作化、項(xiàng)目的真實(shí)性、指導(dǎo)語簡(jiǎn)明、制定評(píng)分標(biāo)準(zhǔn)）(六)心理測(cè)驗(yàn)的施測(cè)1.測(cè)驗(yàn)的設(shè)計(jì)測(cè)驗(yàn)的設(shè)計(jì)是指對(duì)測(cè)驗(yàn)的結(jié)構(gòu)和內(nèi)容、進(jìn)行測(cè)驗(yàn)可達(dá)到的目的、測(cè)驗(yàn)結(jié)果可提供的信息、測(cè)驗(yàn)的適用范圍、測(cè)驗(yàn)的心理測(cè)量學(xué)指標(biāo)(考察測(cè)驗(yàn)的信度、效度以及常?；?qū)φ諛?biāo)準(zhǔn)的有效性)等進(jìn)行設(shè)計(jì)。進(jìn)行心理測(cè)驗(yàn)前,主試應(yīng)該充分了解測(cè)驗(yàn)的設(shè)計(jì),根據(jù)考查目標(biāo),受測(cè)者特點(diǎn),測(cè)驗(yàn)設(shè)計(jì),選擇合適的測(cè)驗(yàn)。測(cè)驗(yàn)的使用一般應(yīng)按照測(cè)驗(yàn)手冊(cè)嚴(yán)格執(zhí)行。2.施測(cè)的程序和步驟心理測(cè)驗(yàn)的使用一般是由合格的心理測(cè)驗(yàn)專業(yè)工作者按下列順序進(jìn)行的,即依次為選擇測(cè)驗(yàn)、施測(cè)、評(píng)分、測(cè)驗(yàn)結(jié)果的解釋和報(bào)告及實(shí)際運(yùn)用。(1)測(cè)驗(yàn)的選擇測(cè)驗(yàn)的使用開始于測(cè)驗(yàn)的選擇。審慎挑選測(cè)驗(yàn)是避免測(cè)驗(yàn)誤用的首要環(huán)節(jié)。選擇與測(cè)驗(yàn)活動(dòng)目的相符的測(cè)驗(yàn),了解測(cè)試對(duì)象的受測(cè)條件,分析所選測(cè)驗(yàn)的特點(diǎn)。(2)測(cè)驗(yàn)的實(shí)施（主試應(yīng)該注意什么？01華東師大，簡(jiǎn)答題）測(cè)驗(yàn)的實(shí)施是保證測(cè)驗(yàn)有效性的重要環(huán)節(jié)。其中的關(guān)鍵是如何使測(cè)驗(yàn)標(biāo)準(zhǔn)化和盡量控制測(cè)量誤差。主試在測(cè)試前要熟悉測(cè)驗(yàn)的結(jié)構(gòu)和內(nèi)容及其使用方法,主試在測(cè)驗(yàn)前要把測(cè)驗(yàn)材料準(zhǔn)備好,在測(cè)試前一定要認(rèn)真核對(duì)每名被試的出生日期。標(biāo)準(zhǔn)化指導(dǎo)語（02西北師大，名）測(cè)驗(yàn)標(biāo)準(zhǔn)化的第一步是指導(dǎo)語標(biāo)準(zhǔn)化,即在測(cè)驗(yàn)實(shí)施過程中應(yīng)該使用統(tǒng)一的指導(dǎo)語。對(duì)被試的指導(dǎo)語一般包括：如何選擇反應(yīng)形式(畫鉤、口答、書寫等)；如何記錄這些反應(yīng)(答卷紙、錄音等)；時(shí)間限制；如果不能確定正確反應(yīng)時(shí)該如何去做以及計(jì)分的方法；例題；有時(shí)告知被試測(cè)驗(yàn)?zāi)康?。給主試的指導(dǎo)語通常單獨(dú)印在另一張紙上。主要包括對(duì)測(cè)驗(yàn)細(xì)節(jié)的進(jìn)一步解釋及其他注意事項(xiàng)。施測(cè)順序有效的測(cè)驗(yàn)結(jié)果有賴于主試遵從標(biāo)準(zhǔn)程序進(jìn)行測(cè)試。各種測(cè)驗(yàn)都有一些具體的程序規(guī)定,在指導(dǎo)手冊(cè)中都有詳細(xì)說明。標(biāo)準(zhǔn)時(shí)限時(shí)限的確定,在很多情況下受施測(cè)條件(如課堂時(shí)間)以及被試特點(diǎn)(如老人、兒童、病人)的限制,但最重要的考慮因素是測(cè)量目標(biāo)的要求。一般要通過預(yù)測(cè)來確定測(cè)驗(yàn)的時(shí)限。測(cè)驗(yàn)的環(huán)境條件測(cè)驗(yàn)的標(biāo)準(zhǔn)化不僅指指導(dǎo)語、時(shí)限、測(cè)驗(yàn)材料和其他測(cè)驗(yàn)本身的因素,也指施測(cè)的周圍環(huán)境。良好的物理環(huán)境包括安靜而寬敞的地點(diǎn),適當(dāng)?shù)墓饩€和通風(fēng)條件。在測(cè)驗(yàn)期間還要防止干擾。計(jì)算機(jī)輔助的測(cè)驗(yàn)實(shí)施計(jì)算機(jī)實(shí)施測(cè)驗(yàn),其指導(dǎo)語可以通過視覺呈現(xiàn)或錄音說明,測(cè)驗(yàn)的反應(yīng)可以自動(dòng)記錄下來。有時(shí)當(dāng)測(cè)驗(yàn)程序不太清楚時(shí),計(jì)算機(jī)可以給被試更明確的指導(dǎo)。主試和被試間的良好的協(xié)調(diào)關(guān)系主試應(yīng)該明白他的工作效果在很大程度上依賴于他與被試之間保持良好協(xié)調(diào)關(guān)系的能力。主試和被試的密切合作將有助于被試樂于表現(xiàn)各種能力和盡可能多的特點(diǎn),提供更多的信息,從而達(dá)到測(cè)試的目的。(3)測(cè)驗(yàn)的評(píng)分評(píng)分實(shí)際上應(yīng)包括在施測(cè)程序中,它是整個(gè)施測(cè)程序中的最后步驟,也是為被試測(cè)試結(jié)果的解釋和報(bào)告做準(zhǔn)備的。(4)測(cè)驗(yàn)結(jié)果的報(bào)告對(duì)測(cè)驗(yàn)結(jié)果的解釋和報(bào)告采取慎重態(tài)度。還必須參照其他各項(xiàng)資料,應(yīng)兼顧個(gè)體間差異與個(gè)體內(nèi)差異的分析。對(duì)于測(cè)驗(yàn)結(jié)果的分析,可從廣度與深度的兩個(gè)方面進(jìn)行。(七)測(cè)驗(yàn)常模（03華中師大和05首師大，名）1.常模與常模團(tuán)體(1)概念常模即指標(biāo)準(zhǔn)化樣本的測(cè)驗(yàn)作業(yè)情況。常模團(tuán)體是由具有某種共同特征的人所組成的一組群體,或是該群體的一個(gè)樣本。它用一組標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。常模團(tuán)體的一般平均分?jǐn)?shù)就是常模。1.構(gòu)成明確：小團(tuán)體常模2.常模團(tuán)體必須是所測(cè)群體的代表性樣本；3.樣本的大小要合適：全國(guó)性常模2000-3000為宜。4.標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物：地域性、時(shí)效性。（確定常模團(tuán)體時(shí)，應(yīng)注意哪些問題？【03北師大，簡(jiǎn)答題】）(2)建立常模的方法在將來要使用測(cè)驗(yàn)的全體對(duì)象中,選擇有代表性的一部分人(稱標(biāo)準(zhǔn)化樣本),對(duì)此樣本施測(cè)并將所得的分?jǐn)?shù)加以統(tǒng)計(jì)整理,得出一個(gè)具有代表性的分?jǐn)?shù)分布。標(biāo)準(zhǔn)化樣本的平均數(shù),即為該測(cè)驗(yàn)的常模。(3)類別常?？梢驑?biāo)準(zhǔn)化時(shí)選取樣本的不同而有不同的類別。常見的有年齡常模、年級(jí)常模、性別常模、地域常模、民族常模、職業(yè)常模等。2.分?jǐn)?shù)轉(zhuǎn)換與合成要使測(cè)驗(yàn)分?jǐn)?shù)具有意義,并且使不同的原始分?jǐn)?shù)（為什么說測(cè)驗(yàn)的原始分?jǐn)?shù)不能用來解釋測(cè)驗(yàn)的結(jié)果，02華東師大論述）可以比較,就要對(duì)它們進(jìn)行適當(dāng)?shù)霓D(zhuǎn)化處理或者與參照標(biāo)準(zhǔn)加以對(duì)照。經(jīng)過處理和對(duì)照參照標(biāo)準(zhǔn)得來的分?jǐn)?shù)就是導(dǎo)出分?jǐn)?shù)。(1)分?jǐn)?shù)轉(zhuǎn)換導(dǎo)出分?jǐn)?shù)可用下面兩種方法之一來描述：已經(jīng)達(dá)到的發(fā)展水平：在某一特殊團(tuán)體中的相對(duì)位置。依照前者而來的常?？煞Q之為發(fā)展性常模,后者為組內(nèi)常模,對(duì)應(yīng)的量表為發(fā)展性量表和組內(nèi)量表。常用的發(fā)展量表有：智齡；年級(jí)當(dāng)量(grade equivalence)；順序量表(ordinal scale)；發(fā)展商數(shù)。常用的組內(nèi)量表有：百分量表(percentile)；標(biāo)準(zhǔn)量表(standard scale),如離差智商（05北師大，02西北師大，名）、T量表、標(biāo)準(zhǔn)分?jǐn)?shù)等。(2)分?jǐn)?shù)合成（測(cè)驗(yàn)分?jǐn)?shù)為什么要合成？說明合成測(cè)驗(yàn)分?jǐn)?shù)的主要方法，【03北師大，簡(jiǎn)答題】）（選擇兩種分?jǐn)?shù)合成的方法，評(píng)述優(yōu)缺點(diǎn)？06北師大，簡(jiǎn)答題）（臨床、推理、多重分段、多重回歸）在使用測(cè)驗(yàn)時(shí),常常需要將幾個(gè)分?jǐn)?shù)或幾個(gè)預(yù)測(cè)源組合起來以獲得一個(gè)合成分?jǐn)?shù)或做出總的預(yù)測(cè)。分?jǐn)?shù)的組合可以在不同層次上進(jìn)行。題目的組合每個(gè)測(cè)驗(yàn)都包含許多獨(dú)立的題目,把各個(gè)題目分?jǐn)?shù)組合起來。不同的題目可以組成量表或分測(cè)驗(yàn),而得到量表分或分測(cè)驗(yàn)分；所有題目也可以合成一個(gè)測(cè)驗(yàn)總分。分測(cè)驗(yàn)或量表的組合有些測(cè)驗(yàn)是由幾個(gè)分測(cè)驗(yàn)或量表組成的,每個(gè)分測(cè)驗(yàn)或量表都有自己的分?jǐn)?shù),這些分?jǐn)?shù)可以組合到一起得到一個(gè)合成的分?jǐn)?shù)。測(cè)驗(yàn)或預(yù)測(cè)源的組合在做實(shí)際決定時(shí),常常將幾個(gè)測(cè)驗(yàn)或預(yù)測(cè)源同時(shí)使用。采用哪種組合方法取決于使用測(cè)驗(yàn)的目的。3.常模的編制(1)通過分析標(biāo)準(zhǔn)化樣組的實(shí)際作業(yè)情況,可以建立常模。常模的可信度取決于樣組的代表性和可靠性。前者又取決于樣組的取樣原則(堅(jiān)持隨機(jī)取樣)和容量大小。(2)標(biāo)準(zhǔn)化樣組的條件標(biāo)準(zhǔn)化樣組的成員必須給予確切的定義。標(biāo)準(zhǔn)化樣組的成員必須都是具有某一研究多特征的個(gè)體。標(biāo)準(zhǔn)化樣組必須是欲測(cè)量的全域的一個(gè)代表性樣組。取樣的過程必須有詳細(xì)的描述。它是說明樣組代表全域的程度。標(biāo)準(zhǔn)化樣組的規(guī)模要有適當(dāng)?shù)拇笮　Ｒ话銇碚f,取樣誤差與樣本大小成反比。所見在其他條件相同的情況下,樣本越大越好。但也要考慮具體條件(如人力、物力)的限制。在有代表性的前提下,樣本應(yīng)該大到足以提供穩(wěn)定的常模值。究竟應(yīng)該大到多少,可根據(jù)要求的可信程度與容許的誤差范圍進(jìn)行統(tǒng)計(jì)推算。標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物。我們?cè)谝欢ǖ臅r(shí)間和空間中抽取的標(biāo)準(zhǔn)化樣組,它只能反映當(dāng)時(shí)當(dāng)?shù)氐那闆r。隨著時(shí)間的推移、地點(diǎn)的變更,標(biāo)準(zhǔn)化的樣組就失去標(biāo)準(zhǔn)化的意義,這樣,常模就不

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《心理與教育測(cè)量》大綱知識(shí)要點(diǎn).doc

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《心理與教育測(cè)量》大綱知識(shí)要點(diǎn).doc

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔