信度與隨機(jī)誤差_第1頁
信度與隨機(jī)誤差_第2頁
信度與隨機(jī)誤差_第3頁
信度與隨機(jī)誤差_第4頁
信度與隨機(jī)誤差_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信度與隨機(jī)誤差第一頁,共二十六頁,2022年,8月28日誤差與測量的準(zhǔn)確性和穩(wěn)定性誤差就是在測量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確或不一致的效應(yīng)。準(zhǔn)確性與一致性的關(guān)系:一.測量的誤差第二頁,共二十六頁,2022年,8月28日誤差的種類:

隨機(jī)誤差系統(tǒng)誤差抽樣與測量誤差誤差的來源:(編制過程中,測題本身存在的誤差)

測量自身引起的誤差

題目取樣時,題量少,或無代表性其他編制過程

Eg:句子意義不明確,題目太難,測驗時間設(shè)定不對

施測過程引起的誤差:

物理環(huán)境測試時間主試因素意外干擾評分記分被試引起的誤差:

應(yīng)試動機(jī)測驗焦慮測驗經(jīng)驗練習(xí)效應(yīng)反應(yīng)傾向生理因素第三頁,共二十六頁,2022年,8月28日真分?jǐn)?shù)

指的是在測量沒有誤差時所得到的真值。

在測量學(xué)中,真分?jǐn)?shù)是一個很重要的概念。

?定義化?假設(shè)

?X=T+E?(Gullikson,1950):X=觀測分?jǐn)?shù)(你的實得分?jǐn)?shù))1對一個人測量無數(shù)T=真分?jǐn)?shù)(構(gòu)想分?jǐn)?shù))次,其平均誤差為0,E=誤差分?jǐn)?shù)(猜測,疲勞);即E=0

誤差是一種隨機(jī)的、2真分?jǐn)?shù)與誤差沒有正態(tài)的偏離關(guān)系,即rTE=03不同測量上的誤差沒有關(guān)系,即rE1E2=0

如果進(jìn)行無數(shù)次測量,X的平均值等于T第四頁,共二十六頁,2022年,8月28日對于一個團(tuán)體來說,實得分?jǐn)?shù)、真分?jǐn)?shù)和測量誤差之間有如下關(guān)系:

SX2=ST2+SE2

即實得分?jǐn)?shù)的變異數(shù)SX2等于真分?jǐn)?shù)的變異數(shù)ST2加上誤差變異數(shù)SE2

而真分?jǐn)?shù)變異數(shù)可分成與測量目的有關(guān)(有效)的變異數(shù)SV2和與測量目的無關(guān)但卻穩(wěn)定的變異數(shù)SI2

ST2=SV2+SI2最后二式合并可得

SX2=SV2+SI2+SE2第五頁,共二十六頁,2022年,8月28日穩(wěn)定性\可靠性\一致性你的觀測分?jǐn)?shù)在多大程度上反映了你的“真實”分?jǐn)?shù)?在不同時間測驗同一個人獲得的結(jié)果是一致嗎?人們通常把測量結(jié)果的可靠性稱為信度,即測量結(jié)果的一致性或可信性程度。信度的意義

1.信度指實測值和真值相差的程度

2.信度指統(tǒng)計量與參數(shù)之間的接近程度

3.信度是指一種測驗對相同的應(yīng)試者再次測驗時引起同樣反應(yīng)的程度二.測量信度第六頁,共二十六頁,2022年,8月28日信度定義一:

信度乃是一組測驗分?jǐn)?shù)中真分?jǐn)?shù)的變異數(shù)與實得分?jǐn)?shù)的變異數(shù)之比。即

rXX=ST2/SX2第七頁,共二十六頁,2022年,8月28日信度定義二:

信度乃是一個測驗X與它的任意一個平行測驗X'的相關(guān)系數(shù)。即

rXX=ρXX'第八頁,共二十六頁,2022年,8月28日信度定義三:

信度乃是一組測驗分?jǐn)?shù)中真分?jǐn)?shù)與實得分?jǐn)?shù)的相關(guān)系數(shù)的平方。即

rXX=ρ2TX第九頁,共二十六頁,2022年,8月28日實測分?jǐn)?shù)對真分?jǐn)?shù)的回歸圖第十頁,共二十六頁,2022年,8月28日1.穩(wěn)定性系數(shù)(重測信度)2.等值性系數(shù)(復(fù)本、分半信度)3.等值穩(wěn)定性系數(shù)(復(fù)本、分半信度)4.內(nèi)部一致性系數(shù)(同質(zhì)性信度)5.評分者的信度系數(shù)估計信度的方法第十一頁,共二十六頁,2022年,8月28日重測信度(Test-RetestReliability)定義:同一量表,同一被試群體,在不同時間,兩次施測,求其相關(guān)。實質(zhì):表示測驗結(jié)果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)(CoefficientofStability)形式:施測—適當(dāng)時間—再施測計算公式參見教材P43第十二頁,共二十六頁,2022年,8月28日時間間隔的把握間隔時間越長,穩(wěn)定性系數(shù)越低。適宜時間間隔依照測驗?zāi)康?、性質(zhì)及被試特點(diǎn)而定。幾分鐘至幾年。年幼兒童,間隔要??;年長群體,間隔可大。智力測驗的間隔不能太短,成就測驗的間隔不能太長。一般間隔時間不超過六個月。(既不能讓被試記住上一次測驗的內(nèi)容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識產(chǎn)生遺忘)第十三頁,共二十六頁,2022年,8月28日復(fù)本信度(Alternate-formraliability)因為任何測驗只是所有可能題目中的一份取樣(行為樣本),所以可編制許多平行的等值測驗,叫做復(fù)本。復(fù)本等值要符合下列條件:

1.各份測驗測量的是同一種心理特性。

2.各份測驗具有相同的內(nèi)容和形式。

3.各份測驗的題目不應(yīng)重復(fù)。

4.各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。

5.各份測驗的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。

6.復(fù)本編好后,應(yīng)再測一次,以確保各份測驗的等值。第十四頁,共二十六頁,2022年,8月28日計算方法:

兩個復(fù)本施測同一被試群體,求其相關(guān)。等值性系數(shù):同時連續(xù)施測,反映內(nèi)容變異。形式:復(fù)本A—最短時間—復(fù)本B穩(wěn)定性與等值性系數(shù):時間間隔施測,內(nèi)容變異+重測信度誤差形式:復(fù)本A—適當(dāng)時間—復(fù)本B第十五頁,共二十六頁,2022年,8月28日分半信度(Split-HalfReliability)定義:在測驗沒有復(fù)本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據(jù)被試在這兩半測驗中所得的分?jǐn)?shù)計算相關(guān)系數(shù),即得分半信度。計算分半信度先要對測驗分半。不同的分半法可能會得到不同的信度值。第十六頁,共二十六頁,2022年,8月28日為了使兩半基本等值,可將項目按由易到難的順序排列編號,然后按奇數(shù)和偶數(shù)序號將項目分半。要注意使那些性質(zhì)相同、聯(lián)系緊密的項目分在相同的一半,否則會使信度值偏高。由于分半信度實際上只是半個測驗的信度,測驗越長、項目越多,兩半分?jǐn)?shù)的相關(guān)就越高。因此,對長度不同的測驗,要用校正公式。

計算公式參見教材P35~36

斯皮爾曼—布朗校正公式弗朗那根公式盧倫公式第十七頁,共二十六頁,2022年,8月28日同質(zhì)性信度(HomogeneityReliability)同質(zhì)性指測驗的所有題目測量的是同一種心理特質(zhì),表現(xiàn)為各個題目得分之間有較高的相關(guān),相關(guān)越高則同質(zhì)性越強(qiáng)。因素分析的思路計算公式:

參見教材P36~37

基本公式庫德—理查遜公式克倫巴赫系數(shù)第十八頁,共二十六頁,2022年,8月28日評分者信度(ScorerReliability)評分者信度是指不同評分者之間在測驗結(jié)果計分上的一致性。在心理測驗中,評分者信度的計算,通常是隨機(jī)抽取若干份試卷,由至少兩位受過訓(xùn)練的評分者按計分規(guī)則分別判分,然后計算它們的相關(guān)。幾個評分者的評分越一致,評分者信度越高。第十九頁,共二十六頁,2022年,8月28日評分者信度最簡單的估計方法就是隨機(jī)抽取若干份答卷,由兩個獨(dú)立的評分者打分,再求每份答卷兩個評判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級相關(guān)方法。如果評分者在三人以上,而且又采用等級記分時,就需要用肯德爾和諧系數(shù)來求評分者信度。計算公式:肯德爾和諧系數(shù)W第二十頁,共二十六頁,2022年,8月28日各種信度系數(shù)相應(yīng)誤差變異的來源信度系數(shù)的類型誤差變異的來源再測信度復(fù)本信度(連續(xù)施測)復(fù)本信度(間隔施測)分半信度同質(zhì)性信度評分者信度時間取樣內(nèi)容取樣時間與內(nèi)容取樣內(nèi)容取樣內(nèi)容的異質(zhì)性評分者間的差異第二十一頁,共二十六頁,2022年,8月28日假設(shè)對100個六年級學(xué)生以兩個月的時間間隔先后施測一個創(chuàng)造力測驗的A\B兩個復(fù)本,所得的等值性與穩(wěn)定性系數(shù)為0.70。根據(jù)被試對每個復(fù)本的反應(yīng)計算出分半信度為0.80(先計算每個復(fù)本的分半相關(guān)系數(shù)。將二者平均后再用斯皮爾曼-布朗公式校正)。同時,我們讓另一個評分者隨機(jī)抽取50份卷子另外評分,得到評分者信度為0.92。然后,我們對這三種方法所產(chǎn)生的誤差變異進(jìn)行分析。第二十二頁,共二十六頁,2022年,8月28日這個假想測驗的誤差變異來源分析信度類型誤差變異量誤差變異來源復(fù)本信度(間隔施測)1-0.70=0.30時間與內(nèi)容取樣分半信度1-0.80=0.20內(nèi)容取樣上述二者差異0.30-0.20=0.10時間取樣評分者信度1-0.92=0.08評分者差異誤差變異總和0.20+0.10+0.08=0.38真實變異1-0.38=0.62第二十三頁,共二十六頁,2022年,8月28日這個假想測驗的誤差變異來源分析真實變異誤差變異時間上的穩(wěn)定性,復(fù)本之間的一致性,評分者之間的一致性內(nèi)容取樣誤差時間取樣誤差評分者間差異62%20%10%8%第二十四頁,共二十六頁,2022年,8月28日信度的作用

反映了測量過程中所存在的隨機(jī)誤差大小可以用來解釋個人測驗分?jǐn)?shù)的意義可以幫助進(jìn)行不同測驗分?jǐn)?shù)的比較影響信度的因素:

被試的樣本—樣本團(tuán)體的異質(zhì)程度與平均水平測驗的長度—一般說來,測驗越長,信度值超高測驗的難度—測驗難度水平使測驗分?jǐn)?shù)的分布范圍最大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論