心理測量第四章測量效度_第1頁
心理測量第四章測量效度_第2頁
心理測量第四章測量效度_第3頁
心理測量第四章測量效度_第4頁
心理測量第四章測量效度_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

心理測量第四章測量效度導(dǎo)學(xué)

效度是科學(xué)測量工具最重要的必備條件,一個測驗若無效度,則無論具有其他任何優(yōu)點,一律無法發(fā)揮其真正的功能。因此,選用標準測驗或自行編制測驗,必須首先評鑒其效度。高效度是一個良好測驗最重要的特性。心理測量第四章測量效度通過這一章的學(xué)習(xí),可解決四個問題一、明確效度的理論定義即操作定義;二、清楚信度與效度之間的關(guān)系;(重點)三、掌握三種效度的定義、性質(zhì)及估計方法;(重點)四、了解影響效度的因素,在效度估計時盡量避免由此造成的誤差。心理測量第四章測量效度內(nèi)容細目第一節(jié)效度的性質(zhì)第二節(jié)內(nèi)容效度第三節(jié)構(gòu)想效度第四節(jié)效標效度第五節(jié)影響效度的因素心理測量第四章測量效度第一節(jié)效度的性質(zhì)一、效度的定義二、效度的性質(zhì)三、效度的種類四、效度和信度的關(guān)系心理測量第四章測量效度一、效度的定義效度指的是測量的準確性,即一個測驗或量具能夠測量出其所要測量東西的程度。效度所要回答的基本問題是:一個測驗測量什么特性?它對所要測量的特性測得有多準?心理測量第四章測量效度在測量理論中,效度被定義為:在一列測量中,與測量目的有關(guān)的真實變異數(shù)(由所要測量的變因引起的有效變異)與總變異數(shù)(實得變異數(shù))的比率,即效度=

SV2/Sx2

式中SV2代表有效變異數(shù),

Sx2代表的是分數(shù)的變異數(shù),即總變異數(shù)。心理測量第四章測量效度一個測驗的效度表明,在一組測驗分數(shù)中,有多大比例的變異數(shù)是由測驗所要測量的變因引起的。心理測量第四章測量效度二、效度的性質(zhì)(一)效度是針對測驗結(jié)果的即測驗效度是“測驗結(jié)果”的有效性程度。(二)效度是針對某種特定的測驗?zāi)康牡男Ф仁轻槍δ撤N特殊用途而言的,不具普遍性。所以在描述和評價一個測驗的效度時,必須考慮這一測驗的特殊用途,指明該測驗對測量什么有效。心理測量第四章測量效度(三)效度只有程度上的差異效度只有程度上的差別,而不是“全”或“無”的差別。從上述后兩條性質(zhì)可看出,效度與信度一樣,是個相對的概念,即相對于某種特殊的用途,具有較高或較低的效度。心理測量第四章測量效度三、效度的種類內(nèi)容效度所涉及的問題是,從所感興趣的行為總體中取樣的測驗項目,其代表性如何。構(gòu)想效度是指一個測驗對某種心理學(xué)所涉及的抽象概念或心理特質(zhì)測得如何。效標效度又稱實證效度或準則關(guān)聯(lián)效度,指的是測驗對我們所感興趣的外在行為能夠做出多好的預(yù)測。這種外在行為是衡量測驗是否有效的標準,簡稱效標。心理測量第四章測量效度四、效度與信度的關(guān)系(一)高信度是高效度的必要而非充分的條件(二)測驗的效度受它的信度制約信度系數(shù)的平方根是效度系數(shù)的最高限度心理測量第四章測量效度第二節(jié)內(nèi)容效度一、內(nèi)容效度的性質(zhì)二、確定內(nèi)容效度的方法三、內(nèi)容效度的特點四、內(nèi)容效度的應(yīng)用與評價心理測量第四章測量效度一、內(nèi)容效度的性質(zhì)內(nèi)容效度指的是測驗題目對欲測的有關(guān)內(nèi)容或行為范圍取樣的適當性,從而確定測驗是否是所欲測量的行為領(lǐng)域的代表性取樣。即測驗用的測題對整個測驗內(nèi)容范圍的代表性程度。由于這種測驗的效度主要與測驗內(nèi)容有關(guān),所以稱內(nèi)容效度。心理測量第四章測量效度一個測驗要具有內(nèi)容效度必須具備兩個條件:首先,要有定義完好的內(nèi)容范圍,并使測驗的全部項目均在此范圍內(nèi)。所謂內(nèi)容范圍可以是具體知識或技能,也可以是復(fù)雜行為。心理測量第四章測量效度其次,測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。所謂代表性取樣,意味著根據(jù)材料與技能的重要性來選題目,而非隨機取樣,以便使選出的題目能包含所測內(nèi)容范圍的主要方面,并使各方面題目比例適當。心理測量第四章測量效度二、確定內(nèi)容效度的方法(一)專家判斷為了確定一個測驗是否有內(nèi)容效度,最常用的方法是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的符合性作出判斷,看測驗的題目是否代表了規(guī)定的內(nèi)容。由于這種衡量效度的方法是一個邏輯分析的過程,所以又稱作邏輯效度。心理測量第四章測量效度

為了使內(nèi)容效度的確定更為客觀,彌補不同專家對同一測驗內(nèi)容效度判斷可能不一致??刹捎靡韵聨讉€步驟:

1.定義好測驗內(nèi)容的總體范圍,并描繪出有關(guān)知識與技能及所用材料的來源;

2.劃分細綱目,并根據(jù)重要性規(guī)劃好各個綱目的加權(quán)比例,做出盡可能詳盡的描述;心理測量第四章測量效度3.確定每道題所測的知識與技能,將自己的分類與測驗編制者的綱目作比較;

4.制定評定量表來測量測驗的整個效度,如測驗包括的內(nèi)容、技能、材料的重要程度、題目對內(nèi)容的適用性等。由每位評分者在評定量表上作出判斷,總估獲得測驗內(nèi)容效度的證據(jù)。心理測量第四章測量效度(二)統(tǒng)計分析除了描述性語言外,內(nèi)容效度的確定也可采用一些統(tǒng)計分析方法。例如計算兩個評分者之間評定的一致性(評分者信度)作為內(nèi)容效度指標,雖然考察的是評分者的判斷信度,但由于來自兩個獨立的評判者,因此符合程度越高越能反映測驗的內(nèi)容效度。心理測量第四章測量效度克倫巴赫提出,內(nèi)容效度可由一組被試在獨立取自同樣內(nèi)容范圍的兩個測驗復(fù)本上得分的相關(guān)來作數(shù)量的估計。若相關(guān)低,說明二者至少有一個缺乏內(nèi)容效度;若相關(guān)高,一般可推論測驗有內(nèi)容效度。心理測量第四章測量效度另外,再測法也可用于內(nèi)容效度的評估。先將測驗施測于被試,由于被試對測驗內(nèi)容了解甚少,因而得分較低,然后對他們進行教學(xué)訓(xùn)練,結(jié)束時再測一次,如果成績提高很大,則說明測驗對于教學(xué)具有較高的內(nèi)容效度。心理測量第四章測量效度(三)經(jīng)驗推測法這種方法是通過實踐檢驗效度的。如兒童發(fā)展量表是否有效,通過對不同年齡階段兒童的調(diào)查,分析其結(jié)果,觀察不同年齡階段兒童對每個題目的反應(yīng)是否依年齡的發(fā)展而有所不同,若通過率隨年齡的增加而增加,就可推測該測驗有內(nèi)容效度。心理測量第四章測量效度三、內(nèi)容效度的特點

(一)內(nèi)容效度的特定性一般說來測驗使用者總是將測驗應(yīng)用于特定情況。他在每種情況下應(yīng)用測驗時,都是要測量他認為重要的行為。從這一觀點來看,內(nèi)容效度是由特定情況決定的。(二)要求內(nèi)容效度的測驗,并不一定要求測驗為同質(zhì)。心理測量第四章測量效度(三)內(nèi)容效度常與表面效度搞混表面效度是在受測者、使用測驗的行政人員及其他沒有受過專門訓(xùn)練的觀察者看來這個測驗是否有效,也就是從表面上看起來,測驗題目與測量目的是否一致。表面效度是由外行對測驗做表面上的檢查確定的有效性,而內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價而建立的。雖然二者都是根據(jù)測驗內(nèi)容做出的主觀判斷,但判斷的標準不同。心理測量第四章測量效度

表面效度不是效度的客觀指標,它雖然不能保證測量的正確性,但能對受測者的動機產(chǎn)生影響,因而也會影響到效度。所以編制測驗時,表面效度是一個必須考慮的特性。最高行為測驗要求有較高的表面效度;典型行為測驗卻要求有較低的表面效度。心理測量第四章測量效度四、內(nèi)容效度的應(yīng)用與評價內(nèi)容效度對于學(xué)績測驗、各種人員選拔和安置的職業(yè)測驗等都是適用的。但對于能力傾向測驗和人格測驗一般是不適用的。內(nèi)容效度的主要缺點是缺乏理想的數(shù)量指標,因而妨礙了信息交流和各測驗間的相互比較。心理測量第四章測量效度第三節(jié)構(gòu)想效度一、構(gòu)想效度的定義二、確定構(gòu)想效度的方法(一)測驗內(nèi)方法(二)測驗間方法(三)研究測驗的效標效度(四)實驗操作法三、對構(gòu)想效度的評價心理測量第四章測量效度

一、構(gòu)想效度的定義構(gòu)想效度的概念是1954年提出的,是處理效度的一種新方法。在心理學(xué)上,所謂構(gòu)想是指用來解釋人類行為的理論框架或心理特質(zhì),它是心理學(xué)中抽象的假設(shè)性的概念、特性或變量。如智力、焦慮、內(nèi)向、動機、創(chuàng)造性等都可稱為構(gòu)想。心理測量第四章測量效度構(gòu)想效度主要涉及的是心理學(xué)的理論概念問題,是指測驗對某一理論上的構(gòu)想或特質(zhì)測量的程度,即測驗的結(jié)果是否能證實或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。應(yīng)解決好三個問題:一、一個測驗測量什么心理結(jié)構(gòu)?二、對這構(gòu)想測得有多好?三、測驗分數(shù)中有多少比例的變異是來自測驗所欲測之構(gòu)想?心理測量第四章測量效度二、確定構(gòu)想效度的方法構(gòu)想效度沒有單一的效度指標,要從多方面的資料來源,經(jīng)過長期的、艱苦的搜集和積累證據(jù)資料的過程,才能逐步驗證測驗的構(gòu)想效度。常用于搜集構(gòu)想效度資料的方法有如下幾種:心理測量第四章測量效度(一)測驗內(nèi)方法這類方法主要是通過研究測驗內(nèi)部構(gòu)造(如測驗的內(nèi)容、對題目作反應(yīng)的過程、以及題目間或分測驗間的關(guān)系)來分析測驗的構(gòu)想效度。心理測量第四章測量效度主要包括:

1.測驗的內(nèi)容效度可以作為構(gòu)想效度的證據(jù)。對測驗所取樣的內(nèi)容或行為范圍確定后,就可利用這些資料來定義測驗所要測的構(gòu)想效度的性質(zhì)。即確定了測驗的內(nèi)容效度便提供了有關(guān)構(gòu)想效度的證據(jù)。心理測量第四章測量效度2.分析被試對題目作反應(yīng)的特點,可以作為構(gòu)想效度的證據(jù)。通過觀察受測者的操作,詢問他如何處理題目,以及必要的統(tǒng)計分析,可發(fā)現(xiàn)究竟哪些變量影響了反應(yīng),因而可確定測驗是否測量了所要測的特質(zhì)和心理結(jié)構(gòu)。例:“當事情不順利時,我常發(fā)怒”題目除了反映被試的行為外,也包括了社會贊許和道德評價。此類題太多,構(gòu)思效度不會太高。心理測量第四章測量效度3.考察測驗的同質(zhì)性可以為評估構(gòu)想效度提供證據(jù)。這種方法以測驗的內(nèi)在一致性系數(shù)(比如庫德—理查遜的K-R20、K-R21公式以及α系數(shù)等)為指標,判斷測驗測的是單一性質(zhì)還是多種性質(zhì),看它與所預(yù)期的結(jié)構(gòu)的相符度,也就是測驗的同質(zhì)性問題,從測驗的一致性就可以為構(gòu)想效度提供證據(jù)。心理測量第四章測量效度(二)測驗間方法通過研究幾個測驗的相互關(guān)系,找出它們的共同特點,進而推斷出所測的共同特質(zhì)是什么,便可確定這些測驗是否有構(gòu)想效度。具體方法如下:心理測量第四章測量效度1.相容效度確定構(gòu)想效度最簡單的方法。計算受測者在新測驗上的分數(shù)與另一個效度已知的同類測驗上的分數(shù)之間的相關(guān)。若相關(guān)高,說明兩個測驗所測的是相同的特質(zhì)。心理測量第四章測量效度2.會聚效度(求同效度)如果兩個測驗是測量同一特質(zhì)的,即使使用不同的方法進行測量,它們之間的相關(guān)也應(yīng)該是高的。心理測量第四章測量效度3.區(qū)分效度(求異效度)一個有效的測驗不僅應(yīng)與其他測同一構(gòu)想的測驗有關(guān),而且還必須與測量不同構(gòu)想的測驗無相關(guān)。換言之,測驗要有效,必須測量與其他變量無關(guān)的獨立的構(gòu)想。心理測量第四章測量效度

方法1方法2方法3

特質(zhì)A1B1C1A2B2C2A3B3C3

A1.90B1.53.89C1.35.40.81

A2.57.25.10.94B2.21.59.09.63.91C2.13.14.48.56.53.83

A3.52.23.11.68.48.33.94B3.22.60.14.40.67.33.66.90C3.10.12.48.32.34.55.61.62.87方法1方法2方法3心理測量第四章測量效度4.因素效度建立構(gòu)想效度的常用方法是因素分析。通過對一組測驗進行因素分析,可以找到影響測驗分數(shù)的共同因素。這種因素可能就是我們要測量的心理特質(zhì)(構(gòu)想)。每個測驗在共同因素上的負荷量,亦即測驗與各因素的相關(guān),稱作測驗的因素效度。而在測驗分數(shù)的總變異數(shù)中來自有關(guān)因素的比例,便可作為構(gòu)想效度的指標。心理測量第四章測量效度(三)研究測驗的效標效度若一個測驗有理想的效標效度,那么該測驗所預(yù)測的效標的性質(zhì)與種類就可作為分析測驗構(gòu)想效度的指標。另一種證實效標效度的方法是心理特質(zhì)的發(fā)展變化。心理測量第四章測量效度(四)實驗操作法觀察實驗前和實驗后分數(shù)的差異也是驗證構(gòu)想效度的方法。根據(jù)所要測量的特質(zhì)的理論構(gòu)想,我們可以預(yù)測在某種情況下或經(jīng)過某種訓(xùn)練,被試的測驗得分將會有所變化。如果預(yù)測得到證實,那就給構(gòu)想效度提供了證據(jù)。心理測量第四章測量效度三、對構(gòu)想效度的評價

總的看來,構(gòu)想效度的最大貢獻是把著眼點放在提出假設(shè)、檢驗假設(shè)上,使測驗有了更廣闊的發(fā)展前景。構(gòu)想效度的主要缺點是:(一)有些構(gòu)想概念模糊,缺乏一致的定義。由于其定義不同,研究結(jié)果無法比較;心理測量第四章測量效度(二)確定效度時沒有明確的操作步驟與程序,因此當預(yù)測失敗或假設(shè)得不到證實時,我們無法知道失敗的確切原因;(三)構(gòu)想效度是通過對測驗測量什么、不測量什么的證據(jù)加以累計確定的,因而沒有單一的數(shù)量指標來描述有效的程度。心理測量第四章測量效度第四節(jié)效標效度一、效標效度的定義二、效標三、確定效標效度的方法心理測量第四章測量效度一、效標效度的定義

所謂效標效度,又稱實證或準則關(guān)聯(lián)效度,是指一個測驗對處于特定情境中的個體行為進行預(yù)測時的有效性,也就是對于我們所感興趣的行為能夠預(yù)測得怎么樣。心理測量第四章測量效度

這里被預(yù)測的行為是檢驗測驗效度的標準,簡稱效標(準則)。由于這種效度是看測驗對效標預(yù)測的如何,所以稱效標效度。這種效度需在實踐中檢驗,所以又稱實證效度。根據(jù)效標資料搜集的時間,效標效度又可分為同時效度和預(yù)測效度。心理測量第四章測量效度

同時效度的效標資料可以和測驗分數(shù)同時搜集。此種效度通常與心理特性的評估及診斷有關(guān)。預(yù)測效度的效標資料需過一段時間才可搜集到。此種效度對人員甄選、分類與安置工作甚為重要。心理測量第四章測量效度二、效標

(一)效標定義所謂效標,即檢驗測驗效度的參照標準,指的是可以直接而且獨立測量特性的變量。通常是以一種測驗分數(shù)或活動來表示。心理測量第四章測量效度(二)效標測量的條件效標要為效度的驗證提供參考標準,它的確定與測量必須科學(xué)才能為效度的驗證指明方向。故必須具備以下幾個條件:

1.有效性

2.可靠性

3.客觀性

4.實用性心理測量第四章測量效度(三)效標的特性

1.多樣性

2.復(fù)雜性

3.特殊性

4.時間性心理測量第四章測量效度三、確定效標效度的方法

(一)相關(guān)法相關(guān)法是評估效標效度最常用的方法,通常用效標系數(shù)來表達。效度系數(shù)是指測驗分數(shù)和效標分數(shù)之間的相關(guān)系數(shù)。心理測量第四章測量效度(二)區(qū)分法(分組法)1.基本思想如果根據(jù)被試在效標上的行為表現(xiàn),將他們分為不同的組別,那么,這些組在預(yù)測分數(shù)上也應(yīng)該有顯著性差異。如果這些顯著性差異確實存在,那么,就說這個預(yù)測的效度是較高的。這實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論