心理咨詢師心理測量學(xué)基礎(chǔ)知識(shí)_第1頁
心理咨詢師心理測量學(xué)基礎(chǔ)知識(shí)_第2頁
心理咨詢師心理測量學(xué)基礎(chǔ)知識(shí)_第3頁
心理咨詢師心理測量學(xué)基礎(chǔ)知識(shí)_第4頁
心理咨詢師心理測量學(xué)基礎(chǔ)知識(shí)_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、心理咨詢師心理測量學(xué)基礎(chǔ)知識(shí) 什么是心理測量 ? 心理測驗(yàn) ? 簡單地說,心理測量就是依據(jù)一定的法則用數(shù)字對(duì)心理與人格特征加以確定的過程。是“動(dòng)詞”。從字面上看,該定義包括三個(gè)主要的因素: 1、心理與人格; 2、數(shù)字; 3、法則。 心理測驗(yàn)是實(shí)現(xiàn)心理測量過程所用的工具。是“名詞”。 測量要素 任何測量都應(yīng)該具備這樣兩個(gè)要要素:即參點(diǎn)和單位。參照點(diǎn) 參照點(diǎn)有兩種:一種是絕對(duì)零點(diǎn);另一種是人定的參照點(diǎn),即相對(duì)零點(diǎn)。單位 好的單位必須具備兩個(gè)條件:一為有確定的意義;二為有相同的價(jià)值,即相鄰兩個(gè)單位點(diǎn)之間的差別總是相等的。 測量量表 由于制定量表的單位和參照點(diǎn)不同,量表的種類也不同。根據(jù)量表的精確程度

2、,斯蒂文斯將測量從低級(jí)到高級(jí)分成四種水平,即命名量表、順序量表、等距量表和等比量表。命名量表 代號(hào)用數(shù)字來代表個(gè)別事物。類別用數(shù)字來代表某一具有某種屬性的事物的全體。例如,組別、班別。順序量表 它比命名量表水平高,其中的數(shù)字不僅指明類別,同時(shí)指明類別的大小或含有某種屬性的程度。在順序量表中,既無相等單位,又無絕對(duì)零點(diǎn),數(shù)字僅表示等級(jí),并不表示某種屬性的真正量或絕對(duì)值。例如,班級(jí)內(nèi)的考試成績。等距量表 不但有大小關(guān)系,而且具有相等的單位,其數(shù)值可以相互做加、減運(yùn)算,但沒有絕對(duì)的零點(diǎn),因此不能做乘、除運(yùn)算。例如,溫度計(jì),心理量表(通過非線性轉(zhuǎn)化為常態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù))。等比量表 是最高水平的量表,既有相

3、等單位又有絕對(duì)零點(diǎn)。 心理測驗(yàn)的性質(zhì)間接性相對(duì)性客觀性 首先,測驗(yàn)用的項(xiàng)目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時(shí)的物理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化。 其次,評(píng)分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對(duì)反應(yīng)的量化是客觀的。 最后,分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對(duì)結(jié)果的推論是客觀的 心理測驗(yàn)按測驗(yàn)的功能分類 智力測驗(yàn) 這類測驗(yàn)的功能是測量人的一般智力水平。如Binet-Simon智力測驗(yàn)、Stanford-Binet智力量表、Wechsler兒童和成人智力量表等,都是現(xiàn)代常用的著名智力測量工具,用于評(píng)估人智力水平。特殊能力測驗(yàn) 常用的如音樂、繪畫、機(jī)械技巧、文書才能測驗(yàn)。人格測驗(yàn) 一般有兩類,一類是問卷法,一類

4、是投射法。前者如MMPI、16PF、EPQ,后者如羅夏測驗(yàn)、主題統(tǒng)覺測驗(yàn)(TAT) 按測驗(yàn)材料的性質(zhì)分類文字測驗(yàn) MMPI、EPQ、16PF及Wechsler兒童和成人智力量表中的言語量表部分均屬于文字測驗(yàn)。操作測驗(yàn) 如羅夏測驗(yàn)、TAT、Raven測驗(yàn)及Wechsler兒童和成人智力量表中的操作量表部分均屬于非文字測驗(yàn)。按測驗(yàn)材料的嚴(yán)謹(jǐn)程度分類客觀測驗(yàn)投射測驗(yàn)按測驗(yàn)的方式分類個(gè)別測驗(yàn) 如Binet-Simon智力量表、Wechsler智力量表。團(tuán)體測驗(yàn) 團(tuán)體測驗(yàn)材料,也可以個(gè)別方式實(shí)施,如MMPI、EPQ、16PF等。但個(gè)別測驗(yàn)材料不能以團(tuán)體方式進(jìn)行,除非將實(shí)施方法和材料加以改變,使之適合團(tuán)體

5、測驗(yàn)。 錯(cuò)誤的測驗(yàn)觀測驗(yàn)萬能論測驗(yàn)無用論心理測驗(yàn)即智力測驗(yàn) 正確的測驗(yàn)觀1、心理測驗(yàn)是重要的心理學(xué)研究方法之一,是決策的輔助工具。2、心理測驗(yàn)作為研究方法和測量工具尚不完善。 心理測驗(yàn)的目的測量心理健康:發(fā)現(xiàn)心理問題和心理疾病測量心理素質(zhì):個(gè)性、愛好、職業(yè)咨詢、婚姻、學(xué)業(yè)、犯罪鑒定等測量心理能力:智力、記憶力、反應(yīng)速度幫助被試了解自己的心理特點(diǎn)選擇職業(yè)、學(xué)業(yè),特殊人才選拔分析比較不同民族、文化或群體的心理特征心理測驗(yàn)的臨床應(yīng)用智力落后兒童與行為兒童的鑒別。了解心理癥狀及嚴(yán)重程度。心理與行為正常變異還是病態(tài)的鑒別。器質(zhì)性精神病和功能性精神病的鑒別。腦器質(zhì)性病變的定位。觀察病情的程度、療效的比較、

6、病情 預(yù)后的評(píng)估。心理測驗(yàn)在心理咨詢中的應(yīng)用 智力測驗(yàn) 目前常用量表有:吳天敏修訂的中國比內(nèi)量表,龔耀先等人修訂的韋氏成人智力量表(WAIS-RC)、韋氏兒童智力量表(C-WISC)和韋氏幼兒智力量表(C-WYCSI),林傳鼎等人修訂韋氏兒童智力量表(WISC-CR),以及張厚粲主持修訂的瑞文標(biāo)準(zhǔn)型測驗(yàn)(SPM)和李丹等修訂的聯(lián)合型瑞文測驗(yàn)(CRT)等。心理測驗(yàn)在心理咨詢中的應(yīng)用人格測驗(yàn) 目前應(yīng)用較多的有:艾林確立人格問卷(EPQ),卡特爾16人格因素問卷(16PF),以及明尼蘇達(dá)多項(xiàng)人格調(diào)查表(MMPI)等。人格測驗(yàn)有助于治療者對(duì)求助者人格特征的了解,以便于對(duì)其問題有更深入的理解,并可針對(duì)性

7、地開展咨詢與心理治療工作。其中,MMPI還有助于治療者了解對(duì)方是否屬于精神異常范圍。 心理測驗(yàn)在心理咨詢中的應(yīng)用心理評(píng)定量表多用于檢查對(duì)方某方面心理障礙的存在與否或其程度如何,并可反映病情的演變。但作為咨詢者,有一點(diǎn)必須明確,那就是心理測驗(yàn)在咨詢和心理治療過程中并不是必不可少的一個(gè)環(huán)節(jié)。一般來講,心理測驗(yàn)應(yīng)在咨詢關(guān)系尚未建立之間實(shí)施,進(jìn)入正式的心理咨詢程序之后,要避免再進(jìn)行心理測驗(yàn)。 心理測驗(yàn)的發(fā)展史首先倡導(dǎo)科學(xué)心理測驗(yàn)的學(xué)者是英國生物學(xué)家和心理學(xué)家高爾頓。研究差異的遺傳性,便設(shè)計(jì)了測量差異的方法。這雖然不是正式的心理測驗(yàn)但可視為心理測驗(yàn)的開端。高爾頓也為心理測驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ)。1890年,

8、卡特爾在心理雜志上發(fā)表心理測驗(yàn)與測量一文,這是心理測驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。比內(nèi)(A.Binet)與助手西蒙(T.Sinmon)的精心研究,次年在心理學(xué)年報(bào)上發(fā)表了一篇文章,題為診斷異常獐智力的新方法,一個(gè)包括30個(gè)項(xiàng)目的量表,但它在心理測驗(yàn)史上極其重要,是世界是第一個(gè)正式的心理測驗(yàn)。 心理測驗(yàn)的發(fā)展史操作測驗(yàn)發(fā)展;團(tuán)體智力測驗(yàn)的發(fā)展;能力傾向測驗(yàn)的發(fā)展;人格測驗(yàn)的發(fā)展。是克雷丕林.Kraepelin),他最早將自由聯(lián)想測驗(yàn)施測于精神病人。而1920年問世的羅夏測驗(yàn)(Rorschach)則是投射測驗(yàn)的發(fā)端。 常模團(tuán)體的性質(zhì) 常模的選擇主要是基于對(duì)測驗(yàn)將要施測的總體的認(rèn)識(shí),常模團(tuán)體必須能夠代

9、表該總體。常模團(tuán)體的條件 1、群體的構(gòu)成必須明確界定。 2、常模團(tuán)體必須是所測群體的代表性樣本。 3、樣本的大小要適當(dāng)。 4、標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物。 取樣的方法簡單隨機(jī)抽樣 按隨機(jī)表順序選擇系統(tǒng)抽樣 總體為N,要選擇K分之一的被試作為樣本,則在取樣范圍內(nèi)選擇每個(gè)第K個(gè)人來構(gòu)成樣本。分組抽樣 先將群體分組,再在組內(nèi)進(jìn)行隨機(jī)取樣。例如,在全國取樣,可以先按行政區(qū)域劃分組,再在組內(nèi)依照一定的性質(zhì)進(jìn)行歸類,然后從各類中按隨機(jī)抽樣樣本。分層抽樣 這是在確定常模時(shí),最常用的方法,先將目標(biāo)總體按某種變量(如年齡、文化程度)分成若干層次,在各層次內(nèi)隨機(jī)抽取若干被試,最后把各層的被試組合成常模樣本。常模分

10、數(shù)與常模常模分?jǐn)?shù) 就是施測常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。常模 常模分?jǐn)?shù)構(gòu)成的分布,就是通常所說的常模,它是解釋心理測驗(yàn)分?jǐn)?shù)的基礎(chǔ)。 常模的類型發(fā)展常模 發(fā)展順序量表:最直觀的發(fā)展常模。 智力年齡:比內(nèi)-西蒙量表 年級(jí)當(dāng)量:教育成就測驗(yàn)常模的類型百分位常模百分等級(jí):指常模中低于這個(gè)分?jǐn)?shù)的人數(shù)百分比。85的百分等級(jí)表示在常模樣本中有85%的人比這個(gè)分?jǐn)?shù)要低。百分等級(jí)指個(gè)體在常模團(tuán)體中所處的位置,百分等級(jí)越低,個(gè)體所處的位置就越低。百分點(diǎn):指計(jì)算出某一百分位點(diǎn)對(duì)應(yīng)的測驗(yàn)分?jǐn)?shù)是多少。四分位數(shù)和十分位數(shù) :四分位數(shù)是將量表分成四等份,相當(dāng)于百分位等級(jí)的25%、50%、7

11、5%對(duì)應(yīng)的三個(gè)百分分成的四段。十分位數(shù)依次類推。百分等級(jí)及百分位數(shù)的優(yōu)缺點(diǎn)主要優(yōu)點(diǎn):易于對(duì)沒有多少統(tǒng)計(jì)知識(shí)的人進(jìn)行解釋計(jì)算簡便即使分?jǐn)?shù)不是常態(tài)分布,也可能進(jìn)行準(zhǔn)確的解釋。主要缺點(diǎn): 不容易用于進(jìn)行統(tǒng)計(jì)分析沒有給出關(guān)于分?jǐn)?shù)實(shí)際差異的信息。 正態(tài)分布標(biāo)準(zhǔn)分系統(tǒng) 標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均分?jǐn)?shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表,因?yàn)樗幕締挝皇菢?biāo)準(zhǔn)差,所以叫標(biāo)準(zhǔn)分。標(biāo)準(zhǔn)分能說明被試的得分在標(biāo)準(zhǔn)化樣本的成績分布圖上居何位置。這樣不僅說明被試成績與樣本比較在其上或在其下,而且還能說明相差幾個(gè)標(biāo)準(zhǔn)差。均數(shù)( ):反映樣本集中的趨勢(shì),是常模的普通形式,一般臨床量表常采用。標(biāo)準(zhǔn)差(SD):反映樣

12、本分散的趨勢(shì),是個(gè)人分?jǐn)?shù)與整體的平均分比較而得到的分?jǐn)?shù)差,可以更清楚地提供樣本更多的信息。 標(biāo)準(zhǔn)分常模 線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù) z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)。 公式5-2非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù) 當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時(shí),也可以使之常態(tài)化,這一轉(zhuǎn)換過程就是非線性的。常態(tài)化過程主要是將原始分?jǐn)?shù)轉(zhuǎn)化為百分等級(jí),再將百分等級(jí)轉(zhuǎn)化為常態(tài)分布上相應(yīng)的均值,并可以表示為任何平均數(shù)和標(biāo)準(zhǔn)差。 T=50+10z T分?jǐn)?shù)是當(dāng)以50為平均數(shù)(即加上一個(gè)常數(shù)50),以10為標(biāo)準(zhǔn)差(乘以一個(gè)常數(shù)10)來表示。標(biāo)準(zhǔn)九分(5為平均數(shù),2為標(biāo)準(zhǔn)差),標(biāo)準(zhǔn)九分(5為平均數(shù),1.5為標(biāo)準(zhǔn)差),標(biāo)準(zhǔn)十分(10為平均數(shù),3為標(biāo)準(zhǔn)差)

13、,離差智商使用最廣、影響最大。 正態(tài)分布標(biāo)準(zhǔn)分系統(tǒng)心理測量的記分方法能力測量:智力量表使用標(biāo)準(zhǔn)百分制記分,均值100,標(biāo)準(zhǔn)差15,(兩個(gè)例外:瑞文推理測驗(yàn)先轉(zhuǎn)化為百分位等級(jí)再轉(zhuǎn)化為IQ,比奈量表先使用比率智商,以后改為均值100,標(biāo)準(zhǔn)差16的離差智商 )個(gè)性測量:EPQ、MMPI使用標(biāo)準(zhǔn)T分記分,均值50,標(biāo)準(zhǔn)差10(16PF使用標(biāo)準(zhǔn)十分)臨床量表:SCL90、SAS、SDS等使用原始劃界分記分(因其樣本常常不是正態(tài)分布)標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算方法:標(biāo)準(zhǔn)T分:(IQ, MQ) 15( X )100 SD標(biāo)準(zhǔn)T分:(MMPI, EPQ) 10(X ) 50 SD 正態(tài)分布標(biāo)準(zhǔn)分系統(tǒng) 智商的概念及計(jì)算方法心

14、理年齡(或智力年齡):1908年比奈和西蒙首先采用了心理年齡的概念。比率智商:德國心理學(xué)家施太倫提出心理年齡除以實(shí)足年齡所得商數(shù)即為智力商數(shù)或比率智商。美國心理學(xué)家推孟在編制的“斯比量表”中正式引用。 其公式為:IQ=MA(心理年齡)/CA(實(shí)足年齡)100 其不足為不適用于20歲以上的成年人。智商的概念及計(jì)算方法離差智商:韋克斯勒在編制WAIS時(shí)提出了智商的另一種計(jì)算方法。它是采用統(tǒng)計(jì)學(xué)中的均數(shù)和標(biāo)準(zhǔn)差計(jì)算出來的。其公式為: 15( X )IQ100 SD 1960年推孟在修訂斯比量表時(shí)也使用了離差智商 測驗(yàn)的信度與效度信度Reliability: 工具的穩(wěn)定性和可重復(fù)性,分為重測信度、評(píng)定

15、者間信度、同質(zhì)性信度測驗(yàn)質(zhì)量的必要不充分條件。效度Validity: 工具的準(zhǔn)確性,分為內(nèi)容效度、結(jié)構(gòu)效度和診斷(效標(biāo))效度測驗(yàn)質(zhì)量的必要充分條件。一個(gè)測驗(yàn)的效度不會(huì)超過它的信度的平方根(P358頁公式)這說明效度總受到它的信度所制約。信度和效度都比較差效度與信度的關(guān)系圖示信度好,效度差信度效度都好 測驗(yàn)的信度 信度的定義信度是指同一被試在不同時(shí)間內(nèi)用同一測驗(yàn)(或用另一套相等的測驗(yàn))重復(fù)測量,所得結(jié)果的一致程度。信度只受隨機(jī)誤差的影響。隨機(jī)誤差越大,信度越低。 信度的指標(biāo)(一)信度系數(shù)與信度指數(shù).信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。信度指數(shù)是真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差之比值(理論上)。(二

16、)測量標(biāo)準(zhǔn)誤:用一組被試兩次測量結(jié)果來代替對(duì)同一個(gè)人的反復(fù)施測時(shí)有此指標(biāo)。 公式中SE為測量的標(biāo)準(zhǔn)誤,Sx是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx為測驗(yàn)的信度系數(shù)。從公式中可以看出,測量的標(biāo)準(zhǔn)誤與信度之間有互為消長的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越?。恍哦仍降?,標(biāo)準(zhǔn)越大。 信度評(píng)估的方法 重測信度 又稱穩(wěn)定性系數(shù),它的計(jì)算方法是采用重測法,即使用同一測驗(yàn),在同等條件下對(duì)同一組被試者前后施測兩次測驗(yàn),求兩次得分間的相關(guān)系數(shù)。最適宜的時(shí)距隨測驗(yàn)的目的、性質(zhì)和被試特點(diǎn)而異,一般是兩周到四周較宜,間隔時(shí)間最好不超過六個(gè)月。復(fù)本信度 又稱等值性系數(shù)。它是以兩個(gè)等值但題目不同的測驗(yàn)(復(fù)本)來測量同一群體,然后求得被試者在兩個(gè)測

17、驗(yàn)上得分的相關(guān)系數(shù),這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低.復(fù)本信度反映的是測驗(yàn)在內(nèi)容上的等值性,故又稱等值性系數(shù)。 信度評(píng)估的方法內(nèi)部一致性信度 內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系,表示測驗(yàn)?zāi)軌驕y量相同內(nèi)容或物質(zhì)的程度。1.分半信度 這種方法估計(jì)信度系數(shù)只需一種測驗(yàn)形式,實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。在其他條件相同的情況下,測驗(yàn)越長,信度越高。因而分半法經(jīng)常會(huì)低估信度,必須修正。其中常用的修正公式是斯皮爾曼布朗公式: (公式5-14)上述公式的假設(shè)條件是兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相同,當(dāng)假設(shè)不成

18、立時(shí)可采用佛朗那根公式或盧倫公式。 信度評(píng)估的方法2.同質(zhì)性信度 同質(zhì)性主要代表測驗(yàn)內(nèi)部所有題目間的一致性。當(dāng)各個(gè)測題的得分有較高的正相關(guān)時(shí)則測驗(yàn)為同質(zhì)的。 幾個(gè)計(jì)算同質(zhì)性信度的公式如下: 1庫德理查遜公式; 2克倫馬赫系數(shù)。評(píng)分者信度信度與測驗(yàn)分?jǐn)?shù)的解釋 一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān) 信度系數(shù)的分布是從0.00到1.00的正數(shù)范圍,代表了從缺乏信度到完全可信的所有狀態(tài).二、確定信度可以接受的水平 一般的能力測驗(yàn)、成就測驗(yàn)的信度系數(shù)在0.90以上,人格測驗(yàn)、興趣、態(tài)度測驗(yàn)的信度一般在0.80-0.85;一般原則是:當(dāng)rxx 0.7時(shí),測驗(yàn)不能用于對(duì)個(gè)人做出評(píng)價(jià)或預(yù)測,而且不能作團(tuán)體比較。當(dāng)

19、0.7 rxx0.85可用于團(tuán)體比較;當(dāng)rxx 0.85時(shí),才能用來鑒別或預(yù)測個(gè)人成績或作為。 信度與測驗(yàn)分?jǐn)?shù)的解釋三、解釋個(gè)人分?jǐn)?shù)的意義:它有兩個(gè)作用:其一是估計(jì)真實(shí)分?jǐn)?shù)的范圍;其二是了解實(shí)得分?jǐn)?shù)再測時(shí)可能的變化情形。 (公式5-15) SE為測量標(biāo)準(zhǔn)誤,Sx是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx為測驗(yàn)的信度。 X-1.96SEXTX+1.96SE (公式5-16)假設(shè)在一個(gè)智力測驗(yàn)中,某個(gè)被試的IQ為100,這是否反映了他的真實(shí)水平?如果再測一次他的分?jǐn)?shù)將改變多少?已知該智力測驗(yàn)的標(biāo)準(zhǔn)差為15,信度系數(shù)為0.84,則其IQ的測量標(biāo)準(zhǔn)誤和可能范圍分別為: SE=15 =6.0 IQ=1001.966=1

20、0011.7688112我們可以說這個(gè)被試的真實(shí)EQ有95%的可能性落在88至于112之間。即若再測一次,他的智商低于88、高于112的可能性不超過5%。信度與測驗(yàn)分?jǐn)?shù)的解釋四、比較不同測驗(yàn)分?jǐn)?shù)的差異 (公式5-17) 例:某被試在韋氏成人智力測驗(yàn)中言語智商為102,操作智商為110。已知兩個(gè)分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗(yàn)和操作測驗(yàn)的分半信度分別為0.87和0.88。問其操作智商是否顯著高于言語智商呢?首先計(jì)算出差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤,然后將差異標(biāo)準(zhǔn)誤乘以1.96。 影響信度的因素 樣本特征 1.樣本團(tuán)體異質(zhì)性的影響:可能會(huì)高估測驗(yàn)的信度,相反會(huì)低估測驗(yàn)的信度。 2.

21、樣本團(tuán)體平均能力水平的影響:對(duì)年幼和能力水平較低者,其信度值相對(duì)低.測驗(yàn)長度 P353頁計(jì)算題 1.測驗(yàn)越長,測驗(yàn)的測題取樣或內(nèi)容取樣就越有代表性。結(jié)果較為可靠 2.測驗(yàn)越長,被試的猜測因素影響就越小。結(jié)果較為可靠 K= (公式5-18)影響信度的因素測驗(yàn)難度 就難度與信度間的關(guān)系而言,并沒有簡單的對(duì)應(yīng)關(guān)系。然而,若測驗(yàn)對(duì)某團(tuán)體太難或太易,分?jǐn)?shù)范圍將縮小,從而使信度降低。時(shí)間間隔 兩次測驗(yàn)相間隔的時(shí)間越短,其信度系數(shù)越大,間隔的時(shí)間越長,信度系數(shù)會(huì)降低. 測驗(yàn)的效度 效度的定義:在心理測驗(yàn)中,效度是指測量的與所要測量的心理特點(diǎn)之間符合的程度,或者簡單地說是指一個(gè)心理測驗(yàn)的準(zhǔn)確性.在測驗(yàn)理論中,

22、效度被定義為在一組測量中,與測量目標(biāo)有關(guān)的真實(shí)方差與總方差的比率。 (公式5-21) 效度的性質(zhì) 1.效度具有相對(duì)性:測驗(yàn)只有用于與測驗(yàn)?zāi)繕?biāo)一致的目的和場合才會(huì)有效。不能籠統(tǒng)地說測驗(yàn)有沒有效,而應(yīng)該說它測量什么有沒有效. 2.效度具有連續(xù)性:測驗(yàn)效度只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。應(yīng)該用效度較高或較低來表示. 內(nèi)容效度什么是內(nèi)容效度: 內(nèi)容效度指的是測驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗(yàn)是否是所欲測量的行為領(lǐng)域的代表性取樣。首先要對(duì)所測量的心理特征有個(gè)明確的界定;其次,測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。內(nèi)容效度的特性:內(nèi)容效度不是普遍適用的,而是根據(jù)具體情

23、況分析得來。此外,內(nèi)容效度也有時(shí)間上的特定性。內(nèi)容效度的評(píng)估方法1專家判斷法 最常用的方法是請(qǐng)有關(guān)專家對(duì)測驗(yàn)題目與原定內(nèi)容的符合性做出判斷,看測驗(yàn)的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測驗(yàn)題目恰當(dāng)?shù)卮砹怂鶞y內(nèi)容,測測驗(yàn)具有內(nèi)容效度。由于這種估計(jì)效度的方法,是一個(gè)邏輯分析的過程,所以內(nèi)容效度有時(shí)又稱“邏輯效度” 2統(tǒng)計(jì)分析法 內(nèi)容效度的確定也可采用一些統(tǒng)計(jì)分析方法,例如計(jì)算兩個(gè)評(píng)分者之間評(píng)定的一致性;內(nèi)容效度可由一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測驗(yàn)復(fù)本上得分之相關(guān)來作估計(jì);另外,再測法也可用于內(nèi)容效度的評(píng)估。 3經(jīng)驗(yàn)推測法 通過實(shí)踐來檢驗(yàn)效度。構(gòu)想效度什么是構(gòu)想效度 是指測驗(yàn)?zāi)軌驕y量到理論

24、上的構(gòu)想或特質(zhì)的程度,即測驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。構(gòu)想效度的估計(jì)方法 1對(duì)測驗(yàn)本身的分析:這類方法是通過研究測驗(yàn)內(nèi)部結(jié)構(gòu)來界定理論構(gòu)想,從而為構(gòu)思效度提供證據(jù)。測驗(yàn)的內(nèi)容效度可以作為構(gòu)思效度的證據(jù);測驗(yàn)的內(nèi)部一致性指標(biāo)可以推斷測驗(yàn)是測量單一特質(zhì)還是測量多種特質(zhì),從而為評(píng)估測驗(yàn)的構(gòu)想效度提供證據(jù);有時(shí)分析被試者對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。2測驗(yàn)間的相互比較:通過分析幾個(gè)測驗(yàn)間的相互關(guān)系,找出其共同之處,進(jìn)而推斷這些測驗(yàn)測量的特質(zhì)是什么,也可以確定這些測驗(yàn)構(gòu)思效度如何。最簡單的是計(jì)算兩種測驗(yàn)之間得分的相關(guān);區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù)。測

25、驗(yàn)要有效必須測量與其他變量無關(guān)的獨(dú)立的構(gòu)思。相關(guān)越低,區(qū)分度越大;因素分析法也是建立構(gòu)思效度的常用方法。3效標(biāo)效度的研究證明一個(gè)測驗(yàn)的效標(biāo)效度理想,那么該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗(yàn)構(gòu)思效度的指標(biāo)。 效標(biāo)效度什么是效標(biāo)效度 反映的是測驗(yàn)預(yù)測個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡稱效標(biāo)。由于這種效度是看看對(duì)效標(biāo)預(yù)測得如何,所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn),所以又稱實(shí)證效度。效標(biāo)效度的評(píng)估方法 1相關(guān)法:相關(guān)法是評(píng)估效標(biāo)效度最常用的方法,它是求測驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。計(jì)算效度系數(shù)最常用的是積差相關(guān)法。 效標(biāo)效度2

26、區(qū)分法:區(qū)分法是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。計(jì)算公式如下: (公式5-22)3命中率法。用正確的比例作為效度指標(biāo)。 考查一個(gè)智力測驗(yàn)效度常用的方法求測驗(yàn)的結(jié)果與另一種已經(jīng)標(biāo)準(zhǔn)化的測驗(yàn)結(jié)果的相關(guān)。求測驗(yàn)結(jié)果與學(xué)生學(xué)業(yè)成績、教師評(píng)定之間的相關(guān)。觀察每項(xiàng)測題通過人數(shù)的百分比,是否隨年齡或年級(jí)而增加。觀察每項(xiàng)測題與全量表是否有連貫性。 效度的功能 一、預(yù)測誤差:測驗(yàn)分?jǐn)?shù)預(yù)測的準(zhǔn)確性 (公式5-25) 真正效標(biāo)分?jǐn)?shù)落在預(yù)測效標(biāo)分?jǐn)?shù)1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測效標(biāo)分?jǐn)?shù)2.58Sest的范圍內(nèi),有99%的可能性。二、預(yù)測效標(biāo)分?jǐn)?shù) (公式5-26) (公式5-27

27、) (公式5-28) 效度的功能 三、預(yù)測效率指數(shù): E=100(1-K) E值大小表明使用測驗(yàn)比盲目猜疑能減少多少差異。P366頁計(jì)算題。 影響效度的因素 測驗(yàn)本身的因素測驗(yàn)實(shí)施中的干擾因素 1.主試的影響因素 2.被試的影響因素樣本團(tuán)體的性質(zhì) 1.樣本團(tuán)體的異質(zhì)性 樣本團(tuán)體越異質(zhì),分?jǐn)?shù)分布,范圍越大測驗(yàn)效度就越高。 2.干涉變量:不同性質(zhì)的團(tuán)體,同一測驗(yàn)的效度會(huì)有很大不同。這些性質(zhì)包括:年齡、性別、教育水平、智力、動(dòng)機(jī)、興趣、職業(yè)和任何相關(guān)的特征。效標(biāo)的性質(zhì) 項(xiàng)目分析 項(xiàng)目難度定義:難度(difficulty),顧名思義,是指項(xiàng)目的難易程度。在能力測驗(yàn)中通常需要一個(gè)反映難度水平的指標(biāo),在非

28、能力測驗(yàn)中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該題的人數(shù),其計(jì)算方法與難度相同。難度的指標(biāo)通常以通過率表示,即以答對(duì)或通過該題的人數(shù)百分比來表示: (公式5-31) 項(xiàng)目難度計(jì)算方法二分法記分的項(xiàng)目 (公式5-32)式中,P代表難度,PH和PL分別代表高分組和低分組通過率。 (公式5-33)式中,CP為校正后的通過率,P為實(shí)際得到的通過率,K為備選答案的數(shù)目。非二分記分的項(xiàng)目 當(dāng)測驗(yàn)項(xiàng)目為問答題或不能用二分法記分的形式時(shí),一般用下面的公式計(jì)算難度。 (公式5-34) 難度水平的確定項(xiàng)目的難度 P值越接近于0或接近于1,越無法區(qū)分被試間能力的差異。相反,P值越接近

29、于0.50,區(qū)別力越高。為了使測驗(yàn)具有更大的區(qū)別力,應(yīng)選擇難度在0.50左右的試題比較合適。測驗(yàn)的難度(P370頁圖5-4) A為正偏態(tài)分布,即大多數(shù)得分集中在低分端,因此必須增加足夠數(shù)量的較容易的項(xiàng)目; B為負(fù)偏態(tài)分布,即大多數(shù)得分集中在高分端,因此必須增加足夠數(shù)量的較高難度的項(xiàng)目。 項(xiàng)目的區(qū)分度 定義 項(xiàng)目區(qū)分度也叫鑒別力,是指測驗(yàn)項(xiàng)目對(duì)被試的心理特性的區(qū)分能力。如果一個(gè)項(xiàng)目,實(shí)際水平高的被試能順利通過,而實(shí)際水平低的被試不能通過,那么我們就可以認(rèn)為該項(xiàng)目有較高的區(qū)分度區(qū)分度取值范圍介于-1至+1之間。計(jì)算方法-鑒別指數(shù) 1按測驗(yàn)總分高低排列答卷; 2確定高分組與低分組,每一組取答卷總數(shù)的

30、27%; 3分別計(jì)算高分組與低分組在該項(xiàng)目上的通過率或得分率; 4按下列公式估計(jì)出項(xiàng)目的鑒別指數(shù): D=PH-PL (公式5-35) 式中,D為鑒別指數(shù),PH為高分組在該項(xiàng)目上的通過率或得分率,PL為低分組在該項(xiàng)目上的通過率或得分率。 表5-6項(xiàng)目鑒別指數(shù)與評(píng)價(jià)標(biāo)準(zhǔn)鑒別指數(shù)(D)項(xiàng)目評(píng)價(jià)0.40以上很好0.300.39良好,修改后會(huì)更佳0.200.29尚可,但需修改0.19以下差,必須淘汰 項(xiàng)目的區(qū)分度相關(guān)法 計(jì)算區(qū)分度最常用的方法是相關(guān)法,即以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)成績或測驗(yàn)部分的相關(guān)作為該項(xiàng)目區(qū)分度的指標(biāo)。相關(guān)越高,表明項(xiàng)目越具有區(qū)分的功能。 點(diǎn)二列相關(guān):適用于一類變量為二分變量,一類變量為連

31、續(xù)變量。 二列相關(guān):適用于兩個(gè)連續(xù)變量。 相關(guān)法:適用于兩個(gè)二分變量。表5-7 D的最大值與項(xiàng)目難度的關(guān)系項(xiàng)目通過率D的最大值1.0000.900.200.800.400.700.600.600.800.501.000.400.800.300.600.200.400.100.2000 測驗(yàn)的目標(biāo)分析測驗(yàn)的對(duì)象:編制測驗(yàn)前首先要明確測驗(yàn)的對(duì)象,即該測驗(yàn)編成后用于哪些團(tuán)體。中國韋式城市版,農(nóng)村版。測驗(yàn)的用途 顯示性測驗(yàn)是指測驗(yàn)題目和所要測量的心理特征相似的測驗(yàn)。 預(yù)測性測驗(yàn)是指預(yù)測一些沒被測量的行為的測驗(yàn)。它最關(guān)心的是測驗(yàn)分?jǐn)?shù)與預(yù)測行為之間的關(guān)系。 測驗(yàn)的目標(biāo)指用來測量什么樣的心理變量或行為特征。

32、分三種情況:工作分析:預(yù)測性測驗(yàn)的主要任務(wù)就是要對(duì)所預(yù)測的行為活動(dòng)作具體分析包括兩個(gè)步驟:1、確定哪些心理特征和行為可以使要預(yù)測的活動(dòng)達(dá)到成功。2、建立衡量被試是否成功的標(biāo)準(zhǔn)-效標(biāo)。給所要測量的心理或行為特質(zhì)下定義,發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行測量。對(duì)于顯示性測驗(yàn)要確定顯示的內(nèi)容和技能,從中取樣。成就測驗(yàn)。 測題的編寫搜集資料,來源三方面: 1、已出版的標(biāo)準(zhǔn)測驗(yàn)。MMPI,WAIS 2、理論和專家的經(jīng)驗(yàn)。 3、臨床觀察和記錄。命題的一般原則內(nèi)容方面:符合測驗(yàn)?zāi)康模蝗右写硇?;題目見內(nèi)容相互獨(dú)立。文字方面:避免使用生僻的字句或詞匯;語句簡明扼要;一句話說明一個(gè)概念;

33、盡量少使用雙重否定句。理解方面:題目有確切的答案;不要超出受試團(tuán)體知識(shí)水平和理解能力。社會(huì)敏感性方面:應(yīng)盡量避免社會(huì)敏感性問題如涉及社會(huì)禁忌或個(gè)人隱私的題目。測題的編制要領(lǐng)選擇題,編制要點(diǎn): 1、題干所提的問題必須明確。 2、選題切忌太長,要簡明扼要。 3、每題只給一個(gè)正確答案,其他屬誘答。 4、各選項(xiàng)長度應(yīng)相等,盡量不要有長有短。 5、避免題干用詞與選項(xiàng)用詞一致,否則會(huì) 成為選擇答案的線索。 6、選項(xiàng)最好用同一形式。測題的編制要領(lǐng)是非題,編制應(yīng)注意: 1、內(nèi)容應(yīng)以有意義的概念、事實(shí)或基本概 念為基礎(chǔ)。 2、每道題只能包含一個(gè)概念。 3、盡量避免否定的敘述,尤其是雙重否定。 4、若是表達(dá)意見的

34、題目,最好說明意見的 來源和根據(jù)。 5、是非題的數(shù)目應(yīng)有比例,基本相等,且隨機(jī)排 列。 測題的編制要領(lǐng)簡答題,編制簡答題的三個(gè)原則: 1、宜用問句形式。 2、如果是填充形式,空格不宜太多。 3、每題應(yīng)只有一個(gè)正確答案,且要簡短而 具體。 測題的編制要領(lǐng)操作題,編制四條原則: 1、明確所要測量的目標(biāo),并將其操作化。 2、盡量選擇真實(shí)性程度較高的項(xiàng)目。 3、指導(dǎo)語簡明扼要,主要讓被試明白要他 們做什么和在什么條件下做。 4、制定評(píng)分標(biāo)準(zhǔn),制定記分方法。 測驗(yàn)的編排和組織選擇試題形式,需考慮以下幾點(diǎn): 1、測驗(yàn)?zāi)康暮筒牧系男再|(zhì)。 2、接受測驗(yàn)的團(tuán)體的特點(diǎn)。 3、各種實(shí)際因素。測驗(yàn)的編排和組織審定題目

35、,注意以下幾個(gè)問題: 1、題目的范圍應(yīng)與計(jì)劃所列的材料內(nèi)容以及所測量的認(rèn)知技能上的比率相符。 2、題目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍。 3、題目的難度必須符合測驗(yàn)?zāi)康牡男枰?4、題目的說明必須清楚明白。測驗(yàn)的編排和組織測題的編排 1、測題的難度排列宜逐步上升。 2、盡可能將同類型的測題組合在一起。 3、注意根據(jù)各種類型測題本身的特點(diǎn)排列題目。并列直進(jìn)式 WAIS混合螺旋式 比奈量表預(yù)測與項(xiàng)目分析預(yù)測應(yīng)注意的幾個(gè)問題: 1、預(yù)測對(duì)象應(yīng)取自將來正式測驗(yàn)準(zhǔn)備應(yīng)用的群體。 2、預(yù)測的實(shí)施過程與情境應(yīng)力求與將來正式測驗(yàn)時(shí)的情況相似。 3、預(yù)測的時(shí)限可稍寬一些,最好使每個(gè)被試都能將題目做完。 4、

36、預(yù)測過程中應(yīng)對(duì)被試的反應(yīng)情形加以記錄。 預(yù)測與項(xiàng)目分析項(xiàng)目分析,質(zhì)與量兩個(gè)方面: 質(zhì):適切性、題目的思想性以及表達(dá)是否清 楚等方面加以評(píng)鑒。 量:確定題目的難度、區(qū)分度、備選答案的 合適度。信度和效度考察信度效度常模制訂 編寫指導(dǎo)手冊(cè)測驗(yàn)的目的和功用測驗(yàn)編制的理論背景以及測驗(yàn)中的材料是根據(jù)什么原則。如何實(shí)施測驗(yàn)的說明。西方量表譯本的評(píng)價(jià)和修訂西方的心理量表用于中國臨床和科研不見得合適。需要用嚴(yán)格的方法對(duì)量表進(jìn)行評(píng)價(jià)和修訂。了解審定西方量表的發(fā)展評(píng)價(jià)和使用情況查閱有關(guān)所有文獻(xiàn)。三大類量表: 差別量表:區(qū)分不同個(gè)體 預(yù)測量表:預(yù)測個(gè)體屬于某一類 評(píng)定量表:評(píng)定某現(xiàn)象縱向變化程度 量表的翻譯和回譯用

37、詞力求按中文習(xí)慣。可提高使用效度,但與西方研究結(jié)果的可比性下降。對(duì)量表進(jìn)行初試和必要的修訂初試作用: 1、哪個(gè)條目含義不清、不明確、太復(fù)雜或無區(qū)別能力。 2、評(píng)價(jià)量表的格式:指導(dǎo)語是否清楚?要不要舉例說明?回答方法是否清楚?是否易誤解?要求受試:1、判斷難易程度。2、標(biāo)記看不懂的詞句。3、判斷區(qū)分能力。進(jìn)行正式研究以評(píng)價(jià)量表的應(yīng)用價(jià)值判別量表:使用價(jià)值取決于結(jié)構(gòu)效度和信度。檢驗(yàn)結(jié)構(gòu)效度的方法:1、看它能否對(duì)兩組不同的人群作出判別。2、與有關(guān)量表進(jìn)行比較看結(jié)果是否一致。信度:重測信度的相關(guān)系數(shù)。進(jìn)行正式研究以評(píng)價(jià)量表的應(yīng)用價(jià)值預(yù)測量表:使用價(jià)值取決于信度和效標(biāo)效度。平行效度:量表與金標(biāo)準(zhǔn)之間的符合率:KAPPA系數(shù)。KAPPA系數(shù)大于0.75平行效度好,0.4和0.75之間平行效度較好,小于0.4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論