SPSS信度和效度檢驗(yàn)全套文檔

上傳人：s*** IP屬地：天津上傳時(shí)間：2023-01-18 格式：DOCX 頁(yè)數(shù)：9 大?。?5.06KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩4頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于調(diào)查問(wèn)卷的信度和效度檢驗(yàn)（一）信度1、信度的含義測(cè)驗(yàn)的信度又稱測(cè)驗(yàn)的可靠性，是指同一個(gè)測(cè)驗(yàn)對(duì)同一組被試施測(cè)兩次或多次，所得結(jié)果一致形程度。一個(gè)好的測(cè)驗(yàn)必須是穩(wěn)定可靠的，多次使用所獲得的結(jié)果是前后一致的。例如，用直尺測(cè)量長(zhǎng)度，其結(jié)果是穩(wěn)定可靠的。用橡皮筋測(cè)長(zhǎng)度則是不可靠的，前后測(cè)量結(jié)果缺乏一致性。在測(cè)量理論中，信度被ST2定義為：某次測(cè)驗(yàn)分?jǐn)?shù)的真變異數(shù)與總變異數(shù)（即實(shí)測(cè)分?jǐn)?shù)）之比：R=S-2X式中Rxx表示測(cè)量的信度,ST2代表真分?jǐn)?shù)的變異數(shù)（方差）,Sx2表示實(shí)得分?jǐn)?shù)的變異數(shù)（方差）。從上式可看出，（1）信度是指實(shí)測(cè)值和真值相差的程度，實(shí)測(cè)值是指對(duì)某物實(shí)際進(jìn)行測(cè)量時(shí)所獲得值,也稱實(shí)測(cè)分?jǐn)?shù)（X）。真值是指被測(cè)事物的真實(shí)規(guī)模取值，也稱真分?jǐn)?shù)（T）。由于各種原因，實(shí)得分?jǐn)?shù)常不等于真分?jǐn)?shù)，兩者之差稱為測(cè)量誤差或誤差分?jǐn)?shù)（E）。從理論上看，實(shí)得分?jǐn)?shù)由真分?jǐn)?shù)和誤差分?jǐn)?shù)兩部分組成即：X=T+ERxx就是對(duì)一組測(cè)驗(yàn)數(shù)據(jù)的實(shí)測(cè)分?jǐn)?shù)與真分?jǐn)?shù)相差程度的最好估計(jì)。（2）信度又是指相同的測(cè)驗(yàn)對(duì)相同的被試再次測(cè)量時(shí)引起的同樣反應(yīng)的程度。如果兩次測(cè)驗(yàn)中，受測(cè)者所得分?jǐn)?shù)或所處等級(jí)前后一致，則說(shuō)明測(cè)驗(yàn)結(jié)果的信度較高。反之，兩次測(cè)驗(yàn)結(jié)果一致性低，說(shuō)明測(cè)驗(yàn)結(jié)果的信度低。信度是任何一種測(cè)量的必要條件（但不是唯一條件）,只有測(cè)量值接近或等于真值，用同一工具多次測(cè)量同一特性獲得相同或相近的結(jié)果，才能認(rèn)為這個(gè)測(cè)量結(jié)果是可靠的。信度對(duì)于教育測(cè)量尤其重要，只有信度高的教育測(cè)驗(yàn)才能成為教育工作者有用的工具，才能為教育工作者提供可靠的信息，為教育預(yù)測(cè)和決策提供客觀依據(jù)。2、信度的估計(jì)方法測(cè)驗(yàn)的信度是用信度系數(shù)的大小來(lái)表示的，根據(jù)測(cè)量理論，信度系數(shù)但是在實(shí)際測(cè)量中，一般只能獲得實(shí)得分?jǐn)?shù)（X）及實(shí)得變異數(shù)（Sx2）,而真分?jǐn)?shù)（T）及真變異數(shù)（ST2）是不知道的，因此，依據(jù)上述公式還無(wú)法機(jī)算信度系數(shù)。在統(tǒng)計(jì)上，主要采用相關(guān)分析的方法即機(jī)算兩列變量的相關(guān)系數(shù)，用相關(guān)系數(shù)的大小來(lái)表示信度的高低。主要用以下方法來(lái)求得信度：（1）再測(cè)法：用同一測(cè)驗(yàn)對(duì)同一被試，前后施測(cè)兩次，根據(jù)兩次測(cè)驗(yàn)分?jǐn)?shù)計(jì)算相關(guān)系數(shù)，即是再測(cè)信度。該信度反映了測(cè)驗(yàn)的穩(wěn)定性程度，故又稱穩(wěn)定性系數(shù)，是用皮爾遜積差相關(guān)公式計(jì)算的：R=XX式中X1.X2為同一被試的兩次測(cè)驗(yàn)得分,M1.M2為兩次測(cè)驗(yàn)的平均分?jǐn)?shù)，S1.S2是兩次測(cè)驗(yàn)的標(biāo)準(zhǔn)差,N是被試人數(shù)。用再測(cè)法估計(jì)信度，可以得到有關(guān)測(cè)驗(yàn)結(jié)果是否隨時(shí)間而變化及變化程度的資料，可以作為預(yù)測(cè)被測(cè)者將來(lái)行為表現(xiàn)的依據(jù)。但也存在明顯的局限性：前后兩次測(cè)驗(yàn)結(jié)果易受到練習(xí)和記憶的影響，前后兩次施測(cè)的時(shí)間間隔影響穩(wěn)定性系數(shù)，特別是對(duì)學(xué)績(jī)測(cè)驗(yàn)的影響較大。如果時(shí)間間隔太長(zhǎng)，被測(cè)者的身心因受環(huán)境影響將發(fā)生大的變化，從而對(duì)第二次施測(cè)結(jié)果產(chǎn)生較大影響，使穩(wěn)定性系數(shù)降低。如果間隔太短，則被試第一次完成測(cè)驗(yàn)時(shí)練習(xí)和記憶會(huì)對(duì)第二次測(cè)驗(yàn)產(chǎn)生較大影響，使第二次測(cè)驗(yàn)性質(zhì)發(fā)生變化。另外，有些測(cè)驗(yàn)不宜用再測(cè)法估計(jì)信度，如測(cè)量創(chuàng)造力測(cè)驗(yàn)，被試一旦掌握了解決問(wèn)題的辦法、原則，重測(cè)時(shí)，他將很容易作出反應(yīng)，這樣測(cè)驗(yàn)的性質(zhì)就發(fā)生了改變。因此，只有在沒(méi)有復(fù)本可用，測(cè)驗(yàn)不易受重復(fù)使用影響，現(xiàn)實(shí)條件又允許重復(fù)施測(cè)的情況下才使用重測(cè)法估計(jì)信度。用重測(cè)法估計(jì)信度，間隔時(shí)間長(zhǎng)短沒(méi)有嚴(yán)格的規(guī)定，一般說(shuō)，間隔時(shí)間越長(zhǎng)，穩(wěn)定性系數(shù)越低，最適

宜的時(shí)距應(yīng)根據(jù)測(cè)驗(yàn)?zāi)康?、性質(zhì)及被試特點(diǎn)而定，最好不超過(guò)六個(gè)月。對(duì)兒童的時(shí)距應(yīng)該短些，對(duì)成年人的時(shí)距可適當(dāng)長(zhǎng)些，因?yàn)閭€(gè)體早期的身心特征變化較大，而成年人的身心特征則相對(duì)穩(wěn)定。（2）復(fù)本法.根據(jù)同一測(cè)驗(yàn)?zāi)康木幹频脑S多平行德等值測(cè)驗(yàn)，可測(cè)定被試的同一特征，這些等值的測(cè)驗(yàn)叫做復(fù)本。對(duì)一組受測(cè)者間隔一定時(shí)間或同時(shí)施測(cè)兩個(gè)復(fù)本，根據(jù)兩次測(cè)驗(yàn)結(jié)果求得相關(guān)系數(shù)，即得等值性系數(shù)，又稱復(fù)本信度。對(duì)一組受測(cè)者間隔一定時(shí)間后施測(cè)兩個(gè)復(fù)本所求得的穩(wěn)定性系數(shù)又稱等值穩(wěn)定性系數(shù)。因?yàn)橛眠@種方法求得的信度不僅受復(fù)本質(zhì)量的影響，而且受時(shí)間練習(xí)等因素的影響，因此，等值穩(wěn)定性系數(shù)更全面地反映了測(cè)驗(yàn)的信度。計(jì)算等值穩(wěn)定性系數(shù)是對(duì)兩個(gè)復(fù)本測(cè)驗(yàn)結(jié)果計(jì)算斯皮爾曼積差相關(guān)系數(shù)（具體公式見(jiàn)前）。（3）分半法.當(dāng)測(cè)驗(yàn)沒(méi)有復(fù)本（復(fù)本的編制是很復(fù)雜的）而且測(cè)驗(yàn)只適合施測(cè)一次的情況下，可用分半法估計(jì)信度，即將測(cè)驗(yàn)題目分成對(duì)等的兩半，根據(jù)每人在這兩半測(cè)驗(yàn)中的得分，計(jì)算其相關(guān)系數(shù)，這個(gè)系數(shù)又稱內(nèi)部一致性系數(shù)。要求得分半信度，首先要將測(cè)驗(yàn)分成對(duì)等的兩半。絕大多數(shù)測(cè)驗(yàn)是由許多題目排列組成的，但是若將測(cè)驗(yàn)簡(jiǎn)單地分成前后兩部分，常常是不對(duì)等的，對(duì)等的兩部分起碼有兩個(gè)要求：一是測(cè)驗(yàn)的兩部分在難度、區(qū)分度及測(cè)驗(yàn)?zāi)繕?biāo)上基本是相同的。一是被測(cè)者以同等的態(tài)度來(lái)對(duì)待兩部隊(duì)測(cè)驗(yàn)，即在完成兩部分測(cè)驗(yàn)過(guò)程中，練習(xí)，疲勞，情緒等因素對(duì)被試產(chǎn)生了同等的影響。因此，將一個(gè)測(cè)驗(yàn)分成兩部分時(shí)，常用的是奇偶分半法，即將奇數(shù)題分為一部分，將偶數(shù)題分為一部分。特別是測(cè)驗(yàn)題目是按由易到難排列時(shí)，這種分法可以將測(cè)驗(yàn)分為大致相等的兩半，但是，對(duì)于速度型的測(cè)驗(yàn)不適合用奇偶分半法。用分半法求出的測(cè)驗(yàn)的信度系數(shù)并不能反映整個(gè)測(cè)驗(yàn)的信度。這是因?yàn)樾哦仁軠y(cè)驗(yàn)的長(zhǎng)度的影響，測(cè)驗(yàn)越長(zhǎng)，信度越高，將測(cè)驗(yàn)分成兩半求得的信度系數(shù)，低估了整個(gè)測(cè)驗(yàn)的信度，因此，需對(duì)測(cè)驗(yàn)系數(shù)加以校正，校正公式是斯皮爾曼―布朗校正，校正公式是斯皮爾曼―布朗（Spearman—Brown）公式：R2Rhhxx1+RhhRxx是整個(gè)測(cè)驗(yàn)的信度估計(jì)系數(shù),Rhh是兩個(gè)分半測(cè)驗(yàn)的相關(guān)系數(shù)。上述公式的前提假設(shè)是兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的變異性相等，但是若測(cè)驗(yàn)資料不符合這個(gè)假定，可用下列公式求得信度：弗朗那根（Flanagan）公式：R=2?（1- ）xx Sx2Sa2和Sb2分別代表兩個(gè)分測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù),Sx2代表整個(gè)測(cè)驗(yàn)的變異數(shù)。c,Sd2盧倫（Rulon）公式：Rxx=1--Sx2Sd2代表兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)之差的變異數(shù),Sx2代表總測(cè)驗(yàn)變異數(shù)。對(duì)于由客觀性題目組成的測(cè)驗(yàn)（即答對(duì)一題得一分，答錯(cuò)得0分）,則可用庫(kù)得一理查遜（Kuder一kZ（pq）Richardson）公式估計(jì)測(cè)驗(yàn)的內(nèi)部一致性：Rkk=（-一-）（1- ）k-1 Sx2k為測(cè)驗(yàn)的總題目數(shù),p為某一個(gè)題目的答對(duì)率或通過(guò)該題目的人數(shù)比例,q為未通過(guò)該題目的人數(shù)比例，p=1-q,Sx2為測(cè)驗(yàn)總分的方差。對(duì)于由客觀性題目和主觀性題目組成的測(cè)驗(yàn) ，有些題目是多重計(jì)分的情況下，則要用克倫巴赫kZSi2（Cronbach）公式計(jì)算a系數(shù)來(lái)估計(jì)測(cè)驗(yàn)的內(nèi)部一致性：a=（--）（1- ）k-1 Sx2k為測(cè)驗(yàn)題目總分,Si2是某一題目得分的方差,Sx2是整個(gè)測(cè)驗(yàn)分?jǐn)?shù)的方差。上面這些公式不適用于速度性測(cè)驗(yàn)，因?yàn)橹挥忻總€(gè)人做完所有的題目，題目的方差才是準(zhǔn)確的。3、提高測(cè)驗(yàn)信度的方法：影響測(cè)驗(yàn)信度的誤差歸納起來(lái)主要有：（1）抽樣誤差：簡(jiǎn)單說(shuō)，這是在抽樣過(guò)程中由于被試間的差異所造成的誤差。被試間的差異可以用全距和方差大小來(lái)表示。全距是指某一心理量最大值與最小值之差。全距大說(shuō)明被試間差異大，全距小說(shuō)明被試間差異小。被試間在某一心理量上參差不齊，差別懸殊，則該心理量的方差大。反之，方差小。對(duì)于方差小的樣本，被試間在某一心理特征上相差較小，則前后兩次測(cè)驗(yàn)結(jié)果的一致性較低，即降低了信度。因?yàn)楸辉囍g的差別越小其同質(zhì)性越高，被試的分?jǐn)?shù)只要發(fā)生小的變化，其名次就可能改變，從而降低信度。（2）隨機(jī)誤差：由于各種偶然因素的影響而產(chǎn)生的誤差，表現(xiàn)為用同一方法多次測(cè)量同一對(duì)象時(shí)結(jié)果上不一致。隨機(jī)誤差是由許多因素造成的，如量標(biāo)的質(zhì)量，測(cè)量的程序，被試的身心狀態(tài)，測(cè)量的環(huán)境等。根據(jù)影響測(cè)驗(yàn)信度的因素，可從以下幾方面來(lái)提高測(cè)驗(yàn)的信度：一是從測(cè)驗(yàn)本身考慮，如測(cè)驗(yàn)的長(zhǎng)度、難度、區(qū)分度、速度、程序、環(huán)境條件與計(jì)分方法等。一是從被試自身考慮，如被試在被測(cè)心理特征上的差異大小，參加測(cè)驗(yàn)的動(dòng)機(jī)水平，對(duì)測(cè)驗(yàn)的態(tài)度和積極性等。在此主要介紹如下幾種提高測(cè)驗(yàn)信度的方法：（1）適當(dāng)延長(zhǎng)測(cè)驗(yàn)的長(zhǎng)度：測(cè)驗(yàn)的長(zhǎng)度主要指量表所包含的題目多少。對(duì)一個(gè)測(cè)驗(yàn)來(lái)說(shuō)，測(cè)驗(yàn)的題目越少，得分越容易受偶然因素的影響，故測(cè)驗(yàn)的信度越低。反之如果測(cè)驗(yàn)題目較多，即測(cè)驗(yàn)長(zhǎng)度延長(zhǎng)，擴(kuò)大了被試得分范圍，可在一定程度上排除偶然因素的影響，從而提高測(cè)驗(yàn)信度。但是測(cè)驗(yàn)信度的增加并不是等比例提高信度系數(shù)。當(dāng)信度系數(shù)較小時(shí)，延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度信度系數(shù)增加較大。當(dāng)信度系數(shù)已經(jīng)較大時(shí)，延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度對(duì)信度系數(shù)的影響就較小了。而且，在延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度時(shí)，還需考慮其他因素的影響，如被試在回答問(wèn)題時(shí)是否疲倦或產(chǎn)生厭煩情緒，是否節(jié)省時(shí)間、物力和財(cái)力，測(cè)題是否附合測(cè)驗(yàn)?zāi)康牡?。?）測(cè)驗(yàn)的難度要適中：難度即測(cè)驗(yàn)的難易程度，當(dāng)測(cè)驗(yàn)難度太大時(shí)，被試得分普遍太低，呈負(fù)偏態(tài)分布。當(dāng)測(cè)驗(yàn)難度太小時(shí)，被試得分普遍較高，呈正偏態(tài)分布。太難太易的測(cè)驗(yàn)都使被試得分差異減小，使實(shí)得分?jǐn)?shù)方差減小，從而降低測(cè)驗(yàn)信度。參見(jiàn)公式：（3）測(cè)驗(yàn)的內(nèi)容盡量同質(zhì)：性質(zhì)相同的測(cè)驗(yàn)內(nèi)容，對(duì)被試也要求相同的能力、知識(shí)和技能。而內(nèi)容不同質(zhì)的測(cè)驗(yàn)，則要求被試不同的能力、知識(shí)和技能。因而為了提高測(cè)驗(yàn)信度，測(cè)驗(yàn)內(nèi)容應(yīng)盡量同質(zhì)。（4）測(cè)驗(yàn)的時(shí)間要充分：對(duì)某一測(cè)驗(yàn)而言，應(yīng)保證絕大多數(shù)被試在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn)。否則，如果被試不能從容回答所有問(wèn)題，就不能反映被試的真實(shí)水平。（5）測(cè)驗(yàn)的程序要統(tǒng)一：包括測(cè)驗(yàn)的題目統(tǒng)一，指導(dǎo)語(yǔ)、回答問(wèn)題的方式、分收試卷的方法、測(cè)驗(yàn)時(shí)間等都要統(tǒng)一。（6）評(píng)分要客觀：評(píng)分是否客觀對(duì)測(cè)驗(yàn)信度有直接的影響。對(duì)于客觀性題目，評(píng)分標(biāo)準(zhǔn)明確，評(píng)分容易做到客觀。但對(duì)于主觀性題目，受評(píng)分者影響較大，不易做到客觀。為了盡可能客觀評(píng)分，應(yīng)制定明確而易掌握的評(píng)分標(biāo)準(zhǔn)，盡量做到一卷多評(píng)，或一人只評(píng)一題等。（二）效度1、效度的含義效度（Validity）是指測(cè)量的有效程度或測(cè)量的正確性，即一個(gè)測(cè)驗(yàn)?zāi)軌驕y(cè)量出所要測(cè)量特性的程度。例如，用直尺測(cè)量長(zhǎng)度是有效的，而用來(lái)測(cè)量溫度則是無(wú)效的。對(duì)效度的定義可作如下理解：（1）任何一種測(cè)驗(yàn)只是對(duì)一定目的來(lái)說(shuō)才是有效的。（2）測(cè)驗(yàn)的效度是對(duì)測(cè)量結(jié)果而言的，即一種測(cè)量工具只有經(jīng)過(guò)實(shí)際測(cè)量，才能根據(jù)測(cè)量結(jié)果判斷它的效度。（3）測(cè)驗(yàn)的效度是相對(duì)的而非絕對(duì)的。測(cè)驗(yàn)是根據(jù)行為樣本，對(duì)所要測(cè)量的心理特性作間接推斷，只能達(dá)到某種程度的準(zhǔn)確性，而沒(méi)有全有、全無(wú)的差別。在測(cè)量理論中，效度被定義為：在一系列測(cè)量中，與測(cè)量目的有關(guān)的真變異數(shù)（即有效變異）與總變…、，cSy2異數(shù)之比：rxy2=——Sx2rxy表示測(cè)量的效度系數(shù),Sv2代表有效變異數(shù),Sx2代表總變異數(shù)。根據(jù)上述公式，可看出效度與信度的關(guān)系：???Sx2=Sv2+SI2+SE2ST2=Sv2+SI2cSy2 ST2—SI2SI2rxy2= = = Sx2 Sx2Sy2；.rxy2WrxxSI2表示系統(tǒng)誤差方差，它穩(wěn)定地與有效方差結(jié)合在一起，對(duì)信度沒(méi)有影響，而影響效度。從以上證明看出，測(cè)驗(yàn)的效度受測(cè)驗(yàn)的信度所制約，而且效度系數(shù)不會(huì)大于信度系數(shù)。效度高的測(cè)驗(yàn)，信度必定高。但信度高的測(cè)驗(yàn)，效度則未必高。效度在教育測(cè)量中有重要的意義。對(duì)一個(gè)測(cè)驗(yàn)來(lái)說(shuō)，效度比信度更為重要，測(cè)驗(yàn)首先要保證能如實(shí)地測(cè)量出所要測(cè)量的東西，否則，這種測(cè)量將是沒(méi)有意義的。在教育測(cè)量中，效度問(wèn)題尤其重要，首先，教育測(cè)量的對(duì)象大多是精神現(xiàn)象，只能對(duì)被測(cè)者的外部表現(xiàn)進(jìn)行測(cè)量，以間接了解其心理活動(dòng)特點(diǎn)或知識(shí)技能水平。其次，學(xué)生的心理活動(dòng)特征與其外部表現(xiàn)之間，僅有相關(guān)關(guān)系而沒(méi)有嚴(yán)格的函數(shù)關(guān)系，外部行為有時(shí)并不能準(zhǔn)確地反映某種心理狀態(tài)。再次，教育測(cè)量對(duì)象是有主觀能動(dòng)性的人，人是能夠有意識(shí)地調(diào)節(jié)自己的外部行為，掩蓋自己的內(nèi)心活動(dòng)，這就更增加了教育測(cè)量的難度。2、效度的類型與估計(jì)⑴內(nèi)容效度(ContentValidity):是指測(cè)驗(yàn)?zāi)康拇硭麥y(cè)量的內(nèi)容和引起預(yù)期反應(yīng)所達(dá)到的程度。例如，以考查學(xué)習(xí)成績(jī)?yōu)槟康牡臏y(cè)驗(yàn)來(lái)說(shuō),"所欲測(cè)量的內(nèi)容"是指教案大綱所規(guī)定的全部教材。"起預(yù)期反應(yīng)"是指學(xué)生學(xué)習(xí)這些教材所產(chǎn)生的行為變化，如對(duì)教材的記憶、理解和應(yīng)用。在編制測(cè)驗(yàn)時(shí)，內(nèi)容效度是一個(gè)相當(dāng)復(fù)雜的問(wèn)題，例如教師編制學(xué)績(jī)測(cè)驗(yàn)，其目的是了解學(xué)生在某一學(xué)科或?qū)ｎ}上對(duì)知識(shí)掌握情況，若條件允許，應(yīng)該對(duì)大綱規(guī)定的所有內(nèi)容進(jìn)行全面考試，這顯然是行不通的，只能從這一范圍總體內(nèi)容中選取有代表性題目(樣本),組成測(cè)驗(yàn)，根據(jù)測(cè)驗(yàn)分?jǐn)?shù)推論學(xué)生對(duì)該范圍總體知識(shí)的掌握。若測(cè)驗(yàn)題目較好地代表了這個(gè)知識(shí)范圍，則推論是有效的，即測(cè)驗(yàn)的內(nèi)容效度高。若選題有偏差，則推論是無(wú)效的，即測(cè)驗(yàn)的內(nèi)容效度低。從另一方面看，測(cè)驗(yàn)題目所引起的被試反應(yīng)(是一個(gè)樣本),若能代表其對(duì)本學(xué)科或?qū)ｎ}的全部行為反應(yīng)，也說(shuō)明該測(cè)驗(yàn)是有效的。反之，則是無(wú)效的。因此，一個(gè)測(cè)驗(yàn)要有較高的內(nèi)容效度應(yīng)具備如下兩個(gè)條件:1.要有定義好的內(nèi)容范圍。2.測(cè)驗(yàn)題目取樣應(yīng)有代表性(對(duì)所界定的內(nèi)容范圍而言)。估計(jì)內(nèi)容效度的方法：A、由專家進(jìn)行邏輯分析：即請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原來(lái)的內(nèi)容范圍是否符合進(jìn)行分析，作出判斷，看測(cè)驗(yàn)題目是否較好地代表了原來(lái)的內(nèi)容。B、統(tǒng)計(jì)分析：克倫巴赫(Cronbach)認(rèn)為內(nèi)容效度可以進(jìn)行數(shù)量估計(jì)，方法是從同一教案內(nèi)容總體中抽取兩套測(cè)題，分別對(duì)同一組被試進(jìn)行測(cè)驗(yàn)，兩種測(cè)驗(yàn)的相關(guān)系數(shù)可用來(lái)估計(jì)內(nèi)容效度。若相關(guān)系數(shù)大，則內(nèi)容效度高。若相關(guān)系數(shù)小，則兩個(gè)測(cè)驗(yàn)中至少有一個(gè)內(nèi)容效度低。另外，有經(jīng)驗(yàn)的任課教師對(duì)本學(xué)科測(cè)驗(yàn)的內(nèi)容效度有較好的判斷。當(dāng)然，若能與有關(guān)專家配合會(huì)更好些。(2)結(jié)構(gòu)效度(ConstructValidity):又稱構(gòu)想效度，是測(cè)驗(yàn)對(duì)某一理論概念或心理特質(zhì)量的程度。即某測(cè)驗(yàn)對(duì)所要測(cè)量的結(jié)構(gòu)或心理特質(zhì)實(shí)際測(cè)量的程度。心理測(cè)驗(yàn)都是建立在心理學(xué)理論基礎(chǔ)的，例如比納一西蒙智力量表的制訂，心理學(xué)家比納(Binet)首先詳細(xì)研究了智力的結(jié)構(gòu)，他認(rèn)為智力行為是一種連鎖性的過(guò)程，包括判斷、推理、解決問(wèn)題等。他根據(jù)這一理論編制的智力測(cè)驗(yàn)，確實(shí)測(cè)量出被試的判斷、推理和解決問(wèn)題能力，可以認(rèn)為他所編制的測(cè)驗(yàn)具有結(jié)構(gòu)效度。一般說(shuō),學(xué)科測(cè)驗(yàn)主要看內(nèi)容效度，心理測(cè)驗(yàn)主要看結(jié)構(gòu)效度。判斷內(nèi)容效度更容易一些，有教案大綱作依據(jù)。判斷結(jié)構(gòu)效度更難一些，因?yàn)槔碚摻Y(jié)構(gòu)和心理特質(zhì)不易把握。因此，要制訂有構(gòu)想效度的測(cè)驗(yàn)，首先要建立理論結(jié)構(gòu)，例如智力測(cè)驗(yàn)，先要確定關(guān)于智力的一套理論，如智力的概念、結(jié)構(gòu)、與環(huán)境的關(guān)系、與年齡的關(guān)系、與性別的關(guān)系等，在理論的基礎(chǔ)上提出若干假設(shè)并編制測(cè)題。確定結(jié)構(gòu)效度的方法：A、對(duì)測(cè)驗(yàn)題目進(jìn)行分析：主要是分析測(cè)驗(yàn)的內(nèi)容，被試對(duì)題目所作的反應(yīng)，測(cè)驗(yàn)題目的同質(zhì)性以及分測(cè)驗(yàn)之間的關(guān)系來(lái)判斷測(cè)驗(yàn)的構(gòu)想效度。B、計(jì)算與同類權(quán)威測(cè)驗(yàn)的相關(guān)：某一個(gè)新測(cè)驗(yàn)如果與同類的大家公認(rèn)有效的已有測(cè)驗(yàn)之間，在測(cè)驗(yàn)結(jié)果上相關(guān)很高，說(shuō)明這兩個(gè)測(cè)驗(yàn)測(cè)的是相同特質(zhì)，即新測(cè)驗(yàn)也有較高的結(jié)構(gòu)效度，如后編的智力測(cè)驗(yàn)常與斯坦福一比納智力量表進(jìn)行比較。C、因素分析：通過(guò)因素分析找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素，在測(cè)驗(yàn)分?jǐn)?shù)的總變異中來(lái)自有關(guān)因素的比例，可以作為構(gòu)想效度的指標(biāo)。⑶預(yù)測(cè)效度(PredictiveValidity):又稱實(shí)證效度，是指一個(gè)測(cè)驗(yàn)對(duì)個(gè)體將來(lái)的行為或獲得的成就進(jìn)行預(yù)測(cè)時(shí)的準(zhǔn)確性。一個(gè)測(cè)驗(yàn)預(yù)測(cè)得越準(zhǔn)確，預(yù)測(cè)效度越高。被預(yù)測(cè)的行為或成績(jī)是檢驗(yàn)預(yù)測(cè)效度的標(biāo)準(zhǔn)，簡(jiǎn)稱效標(biāo)(Criterion),即衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn)。效標(biāo)是估計(jì)預(yù)測(cè)效度的主要依據(jù)，應(yīng)具備如下一些條件1)有效性：即效標(biāo)測(cè)量本身必須有效。(2)可靠性：效標(biāo)測(cè)量要具有較高的信度。(3)客觀性：在效標(biāo)測(cè)量時(shí)要防止受評(píng)定者主觀印象和成見(jiàn)的影響，要防止效標(biāo)污染，即由于主試知道某個(gè)人原來(lái)的測(cè)驗(yàn)成績(jī)，因而影響了在效標(biāo)測(cè)量中對(duì)這個(gè)人的評(píng)定分?jǐn)?shù)。(4)效標(biāo)測(cè)量應(yīng)該簡(jiǎn)單省時(shí)，花費(fèi)少，經(jīng)濟(jì)實(shí)用。一般常用學(xué)業(yè)成就，等級(jí)評(píng)定，臨床診斷，實(shí)際的工作表現(xiàn)作為效標(biāo)。例如，一個(gè)智力測(cè)驗(yàn)其預(yù)測(cè)效度既可用被試的學(xué)業(yè)成就作效標(biāo)，也可用熟悉的班主任對(duì)其進(jìn)行等級(jí)評(píng)定作效標(biāo)。估計(jì)預(yù)測(cè)效度的主要方法是：A、相關(guān)法：即求某測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量間的相關(guān)，所得結(jié)果即效標(biāo)系數(shù)。當(dāng)測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量分?jǐn)?shù)都是連續(xù)變量時(shí)，用積差相關(guān)公式求相關(guān)系數(shù)(具體公式見(jiàn)統(tǒng)計(jì)教材)。當(dāng)測(cè)驗(yàn)分?jǐn)?shù)是連續(xù)變量，而效標(biāo)測(cè)量分?jǐn)?shù)是二分變量時(shí)，可用二列相關(guān)公式計(jì)算效度系數(shù)(具體公式見(jiàn)統(tǒng)計(jì)教材)。B、區(qū)分法：即看原先測(cè)驗(yàn)的分?jǐn)?shù)是否可以區(qū)分由效標(biāo)測(cè)量所化分的團(tuán)體。例如，某工廠通過(guò)測(cè)驗(yàn)錄用了一批工人，過(guò)一段時(shí)間后，根據(jù)工作成績(jī)將其分為稱職和不稱職兩種，然后回過(guò)頭來(lái)檢查他們的測(cè)驗(yàn)分?jǐn)?shù)，運(yùn)用t檢驗(yàn)看看兩組在測(cè)驗(yàn)上的平均分?jǐn)?shù)是否有顯著差異。若有顯著差異，說(shuō)明測(cè)驗(yàn)是有效的。若差異不顯著，說(shuō)明測(cè)驗(yàn)是無(wú)效的。C、功利率：為了測(cè)定測(cè)驗(yàn)的功效，人們還可對(duì)使用測(cè)驗(yàn)所化掉的費(fèi)用與得到的利益進(jìn)行比較，看其利弊大小，這種效度指標(biāo)叫功利率。U=B(Ns)-C(Nu)-SU代表功利率,B表示錄用一個(gè)合格的工人所產(chǎn)生的平均利潤(rùn)，C表示錄用一個(gè)不合格的工人所造成的損失,Ns和Nu分別代表所錄用的人中成功和不成功的人數(shù),S代表整個(gè)選人程序的費(fèi)用。計(jì)算功利率說(shuō)明，如果一個(gè)測(cè)驗(yàn)簡(jiǎn)單易做，適合于團(tuán)體施測(cè)，即使效度低些，也會(huì)有人采用。反之，如果測(cè)驗(yàn)復(fù)雜，只能個(gè)別施測(cè)，費(fèi)時(shí)費(fèi)力，那么只有效度極高，給人帶來(lái)極大好處時(shí)，人們才會(huì)使用它。提高測(cè)驗(yàn)效度對(duì)教育測(cè)驗(yàn)非常關(guān)鍵，效度系數(shù)多大合適？要根據(jù)測(cè)驗(yàn)的具體情況而定：(1)智力測(cè)驗(yàn)分?jǐn)?shù)與熟悉教師對(duì)學(xué)生智力等級(jí)評(píng)定之間的效度系數(shù)一般在0.30—0.50之間。教師評(píng)定常受許多其他因素的影響。(2)某一科目的標(biāo)準(zhǔn)測(cè)驗(yàn)成績(jī)與任課教師對(duì)學(xué)生名次排列之間的相關(guān)系數(shù)應(yīng)達(dá)到0.60—0.70。(3)兩種不同的智力測(cè)驗(yàn)或兩種標(biāo)準(zhǔn)測(cè)驗(yàn)之間的相關(guān)系數(shù)應(yīng)達(dá)到0.60—0.80效度系數(shù)可解釋為效標(biāo)分?jǐn)?shù)中的變異有百分之幾來(lái)源于測(cè)驗(yàn)的變異。例如效度系數(shù)為0.50,則說(shuō)明效標(biāo)分?jǐn)?shù)中有0.502=25%的變異來(lái)自原測(cè)驗(yàn)分?jǐn)?shù)的變異。若效度系數(shù)為0.71,則效標(biāo)分?jǐn)?shù)中有50%的變異來(lái)自原測(cè)驗(yàn)分?jǐn)?shù)。3、提高測(cè)驗(yàn)效度的方法：(2)控制系統(tǒng)誤差：系統(tǒng)誤差是影響測(cè)驗(yàn)效度的主要因素。它主要包括儀器不準(zhǔn)，題目和指導(dǎo)語(yǔ)有暗示性，答案按排不當(dāng)(被試可以猜測(cè))等，控制這些因素可以降低系統(tǒng)誤差，提高效度。(2)精心編制測(cè)題和測(cè)驗(yàn)量表：首先測(cè)題內(nèi)容要適合測(cè)驗(yàn)?zāi)康?，如知識(shí)性測(cè)題就不能全面反映被試的智力水平，它主要測(cè)量其知識(shí)水平。其次，測(cè)題要清楚明了，用語(yǔ)要讓被試?yán)斫猓帕杏梢椎诫y。第三，測(cè)題的難度和曲分度要合適。(3)嚴(yán)格按照測(cè)驗(yàn)程序進(jìn)行測(cè)量，防止測(cè)量誤差：要嚴(yán)格按照測(cè)驗(yàn)手冊(cè)進(jìn)行測(cè)量，不能作過(guò)多的解釋，按標(biāo)準(zhǔn)評(píng)分，兩次測(cè)驗(yàn)間隔要適當(dāng)。

(4)樣本容量要適當(dāng)：當(dāng)樣本容量增大時(shí)，樣本對(duì)總體的代表性提高，樣本大，被試的內(nèi)部差異增大，擴(kuò)大了真分?jǐn)?shù)的方差，使效度提高。樣本容量一般不應(yīng)低于30。另外，抽樣方法也很重要，一般用隨機(jī)抽樣，當(dāng)群體很大時(shí)，可分層抽樣，樣本容量擴(kuò)大時(shí)，其代表性才隨之增大。(5)正確處理好信度與效度的關(guān)系：信度是效度的必要條件，但信度高的測(cè)驗(yàn)，效度不一定高。而效度高的測(cè)驗(yàn)，信度卻比較高。但是，既要有高效度，又要有高信度是不容易做到的?！白畲罂煽慷?信度)要求測(cè)驗(yàn)工程之間有高度的組間相關(guān)；最大預(yù)測(cè)有效度卻要求低度的組間相關(guān)。最大可靠度(信度)要求工程等同的難度；最大預(yù)測(cè)有效度卻要求工程的難度有所區(qū)別。中等程度的組間相關(guān)(0.10—0.60),通?？僧a(chǎn)生良好的效度(0.30—0.80),并且產(chǎn)生滿意的信度(0.90)。”(郝德員：《教育與心理統(tǒng)計(jì)》，教育科學(xué)出版社,1962年版.P429)(6)適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度：增加測(cè)驗(yàn)的長(zhǎng)度可提高測(cè)驗(yàn)的信度，也可以提高效度，但增加測(cè)驗(yàn)的長(zhǎng)度對(duì)信度的影響大于對(duì)效度的影響。如果增加測(cè)驗(yàn)長(zhǎng)度到原來(lái)的n倍，則新測(cè)驗(yàn)的效度系數(shù)Rnxy計(jì)算公：Rnxy=：Rnxy=Rxy-1-Rxx:n+Rxx式中Rxy、Rxx分別是原測(cè)驗(yàn)的效度系數(shù)和信度系數(shù)。2.3.3信度和效度檢驗(yàn)(1)信度檢驗(yàn)采用Cronbacha系數(shù)、個(gè)別工程信度、潛在變量的組合信度(CompositeReliability,CR)進(jìn)行信度檢驗(yàn)，其中運(yùn)用SPSS15.0中的“Analyze-Scale-ReliabilityAnalysis”命令，并選擇“Statistics”中的“Scaleifitemdeleted”，來(lái)計(jì)算Cronbacha系數(shù)，利用LISREL8.70進(jìn)行驗(yàn)證性因子分析來(lái)計(jì)算個(gè)別工程信度和組合信度，驗(yàn)證性因子分析的運(yùn)算結(jié)果(詳見(jiàn)附錄3)經(jīng)整理如表2.6所示：從表2.6中關(guān)于Cronbacha系數(shù)的三欄中可以看出：C1、B4對(duì)應(yīng)的“校正得項(xiàng)總計(jì)相關(guān)性”(CorrectedItem-TotalCorrelation)偏低(相對(duì)于該部分量表中的其他指標(biāo)對(duì)應(yīng)值而言)，且刪除C1、B4有利于分別提升該部分量表的總體信度，故應(yīng)將C1、B4兩個(gè)指標(biāo)刪除。同時(shí)“個(gè)別工程信度”一欄中C1、C2、B3、B4、P1這5個(gè)指標(biāo)的因子負(fù)荷均小于0.50,根據(jù)社會(huì)科學(xué)研究特點(diǎn)，這5個(gè)指標(biāo)也應(yīng)刪除，且刪除后有利于提高整個(gè)因素的一致性；而另外35個(gè)指標(biāo)的因子負(fù)荷均大于0.5,滿足信度要求。除此之外，誠(chéng)信環(huán)境、企業(yè)素質(zhì)、投標(biāo)誠(chéng)信、履約誠(chéng)信、社會(huì)誠(chéng)信各個(gè)量表以及整體的Cronbacha系數(shù)分別為0.750、0.845、0.817、0.862、0.830、0.939,屬于很可信的區(qū)間范圍；且對(duì)應(yīng)的組合信度分別為0.75、0.85、0.83、0.86、0.83、0.96,均大于0.5,滿足信度要求。(2)效度檢驗(yàn)在信度檢驗(yàn)刪除5個(gè)指標(biāo)基礎(chǔ)上，首先，對(duì)有效樣本數(shù)據(jù)進(jìn)行KMO抽樣適當(dāng)性檢驗(yàn)和Bartlett球形檢驗(yàn)，檢驗(yàn)結(jié)果顯示KMO值為0.5,Bartlett球形檢驗(yàn)的x2值為250.278(自由度為105),達(dá)到顯著水平(p=0.000<0.001)。一般認(rèn)為，當(dāng)KMO值大于0.5時(shí)，即可進(jìn)行因子分析，而本次KMO的檢驗(yàn)值為0.5,說(shuō)明本調(diào)查問(wèn)卷的樣本數(shù)據(jù)基本適合進(jìn)行因子分析。其次，采用主成分分析法，進(jìn)行Varimax方差正交旋轉(zhuǎn)，最終提取特征值大于1的因子4個(gè)，7個(gè)共同因子累計(jì)解釋的變異量為60.74%,且正交旋轉(zhuǎn)后得到的因子負(fù)荷矩陣如表2.7所示：

表2.6第三輪問(wèn)卷信度檢驗(yàn)編號(hào)校正的項(xiàng)總計(jì)相關(guān)性對(duì)應(yīng)指標(biāo)刪除后的Cronbacha系數(shù)部分量表Cronbacha系數(shù)整體量表Cronbacha系數(shù)個(gè)別工程信度組合信度誠(chéng)信環(huán)境C10.3650.7520.7500.9390.310.750.96C20.4080.7350.33C30.4980.7120.63C40.6280.6740.80C50.5750.6900.77C60.4790.7170.59企業(yè)素質(zhì)E10.5040.8340.8450.590.85E20.5390.8310.57E30.5840.8270.62E40.6080.8240.60E50.4980.8350.55E60.5650.8280.64E70.5260.8320.62E80.5610.8290.64E90.5670.8280.62E100.4700.8370.56投標(biāo)誠(chéng)信B10.5540.7940.8170.630.83B20.5790.7910.66B30.4320.8100.44B40.4090.8210.42B50.4990.8010.53B60.6160.7850.71B70.6560.7800.76B80.5980.7870.71履約誠(chéng)信P10.4350.8620.8620.460.86P20.5160.8540.56P30.5630.8500.57P40.5580.8500.64P50.6340.8440.71P60.6340.8440.69P70.6090.8460.63P80.5580.8500.61P90.6170.8450.69P100.6190.8450.67社會(huì)誠(chéng)信S10.5480.8130.8300.650.83S20.6090.8010.74S30.5860.8050.66S40.6610.7890.69S50.6150.7990.62S60.5840.8060.62

表2.7旋轉(zhuǎn)后因子負(fù)荷矩陣共同因子1234567施工安全0.6820.0950.2830.1100.1180.0530.188合同工期0.6720.192-0.0660.1600.1940.0990.097工程質(zhì)量保證0.6720.2510.3070.1650.0180.0000.009保修義務(wù)履行情況0.6490.1950.1270.1090.1090.2790.025設(shè)備到位情況0.5640.1130.0650.0070.1920.1100.402工程索賠0.5220.3370.0130.1610.1700.238-0.097工人工資支付0.4840.3650.2330.1610.0230.2700.060締約過(guò)失行為0.2070.7390.1640.1580.1610.1540.016中標(biāo)放棄0.1640.7150.1070.2230.1760.132-0.006參與串標(biāo)圍標(biāo)0.2280.6770.2320.143-0.0160.2000.042低于成本價(jià)投標(biāo)0.1000.5940.0030.0250.1810.0670.268轉(zhuǎn)包違法分包0.4210.5510.2040.049-0.0280.1830.082資質(zhì)真實(shí)性0.2240.4640.3330.2960.0370.1130.143政府誠(chéng)信水平0.1220.1550.7840.1380.1380.0320.118誠(chéng)信法律環(huán)境0.0770.2870.7360.1650.1570.064-0.066誠(chéng)信文化環(huán)境0.1020.0350.681-0.0680.1820.1750.047征信體系建設(shè)水平0.1640.0940.6630.182-0.0630.163-0.002職工素質(zhì)0.3790.1000.3890.1810.275-0.0980.304工程業(yè)績(jī)0.0620.2130.0100.6810.100-0.0030.263建設(shè)單位評(píng)價(jià)0.3170.0600.2400.6470.1370.239-0.066守法誠(chéng)信評(píng)價(jià)0.2250.3540.3200.522-0.0430.3360.078資質(zhì)等級(jí)0.0180.1530.0490.5010.343-0.0460.363監(jiān)理單位評(píng)價(jià)0.3860.0090.1280.4460.3510.351-0.014工程部情況0.2850.3460.1700.419-0.057-0.0330.360資格審查材料真實(shí)性0.3630.2260.3410.3940.1130.0900.115管理素質(zhì)0.2790.2620.3580.3900.070-0.0370.384總資產(chǎn)收益率0.1330.1310.1000.1010.7670.0990.117資產(chǎn)負(fù)債率0.1820.1920.2490.0660.7020.1660.071企業(yè)凈資產(chǎn)0.177-0.0040.0450.1190.6620.0610.392銀行信用等級(jí)0.1180.2380.2890.4090.4250.184-0.012法院評(píng)價(jià)0.1060.2270.0660.1170.0860.8050.067納稅評(píng)價(jià)0.1050.2240.1910.1840.1420.7360.057勞動(dòng)保障評(píng)價(jià)0.3540.1240.150-0.0990.1370.7100.193機(jī)械設(shè)備0.0860.035-0.0190.0960.4300.0540.754技術(shù)創(chuàng)新0.0950.1200.0660.1780.0510.2120.737根據(jù)因子分析中對(duì)因子負(fù)荷的要求，由于“職工素質(zhì)”、“資格審查材料真實(shí)性”、“管理素質(zhì)”、三個(gè)指標(biāo)的因子負(fù)荷均小于0.4,故這三個(gè)指標(biāo)應(yīng)刪除；而第7個(gè)因素只包含

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

SPSS信度和效度檢驗(yàn)全套文檔

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

SPSS信度和效度檢驗(yàn)全套文檔

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔