版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
九、測驗分數的解釋基礎統計集中趨勢與離中趨勢MSD:標準差定義為方差的算術平方根,反映組內個體間的離散程度。方差是各個數據與平均數之差的平方和的平均數。方差是各個數據分別與其和的平均數之差的平方的和的平均數,用字母D表示。9.1常模參照和常模的概念9.1.1原始分數(RawScore)和導出分數(DerivedScore)(1)原始分數定義:依據測驗說明書,將個人反應與標準答案(記分標準)相比較,而直接得到的分數。原始分數僅僅代表由測驗或測量程序中抽樣出的行為的數量,其本身沒有意義,不同測驗的原始分數也不能相互比較。9級量表、7級量表、5級量表(2)導出分數定義:將原始分數經由統計方法轉換成具有一定參照點和單位的測驗量表上的數值,所得分數叫導出分數。分數轉換:按統計方法將原始分數轉化為導出分數的過程。根據解釋分數時的參照標準不同,可以將導出分數分為常模參照分數與標準參照分數兩大類。分數解釋方式常模參照解釋(normreferencedexplanation)將測量的原始分數與常模進行對照,從而對測驗分數進行解釋,如多少心理測驗。標準參照解釋(criterionreferencedexplanation)將測量的原始分數與某種特定的標準進行對照,從而對測驗分數進行解釋。如教育、培訓測驗。導出分數常模參照分數將個人測量的原始分數與參照團體的分數比較所得到得導出分數。
標準參照分數將個人測量的原始分數以某種具體標準或效標的分數為參照所得到的導出分數。9.1.2.常模及其目的標準化樣本的測驗分數(分布:M,SD)常模參照分數是把受測者的成績與具有某種特征的人所組成的有關團體作比較,根據一個人在該團體內的相對位置來報告他的成績。這里,用來作比較的參考團體叫常模團體,常模團體的分數分布就叫做常模。常模團體是由具有某種共同特征的人所組成的一個群體。通常選擇一個能夠代表總體的樣組,該樣組就叫做標準化樣組,也就是常模團體。確定常模團體時,必須注意以下幾個問題:(1)群體的構成必須明確界定在制定常模時,必須清楚地說明所要測量的群體的性質和特征。可以用來區(qū)分和限定群體的變量是很多的,如年齡、性別、年級、職業(yè)、地區(qū)、民族、文化程度、社會地位等。依據不同的變量確定樣本,可得到不同的常模。當一個群體內的各個子團體在一個測驗上的作為有差異時,要為每一個子團體分別建立常模。當一個群體過大,樣本難以充分代表總體時,可根據實際取樣的范圍,重新界定測驗所適用的群體,即使一個有代表性的常模適用于大范圍的群體,分別為每個子團體建立常模也是有益的。(2)常模團體必須是所要測量的群體的一個代表性取樣常模團體缺乏代表性,會使常模資料產生偏差而影響對測驗分數的解釋。(3)取樣的過程必須詳盡地描述在一般的測驗手冊中,都有相當的篇幅介紹常模團體的大小、取樣策略、取樣時間以及其他有關情況。(4)樣本的大小要適當所謂“大小適當”并沒有嚴格的規(guī)定。一般說來,取樣誤差與樣本大小成反比,所以,在其他條件相同的情況下,樣本越大越好,但也要考慮具體條件(如人力、物力)的限制。有時從一個較小的但具有代表性的樣本中所得到的分數比來自較大的但定義模糊的團體中得到的分數還要可靠。不過,在有代表性的前提下,樣本應該大到足以提供穩(wěn)定的常模值。究竟應該達到多少,可根據要求的可信程度與容許的誤差范圍進行統計推算。(5).要注意常模的時間性由于教育、時代變遷等多種因素的影響,幾年前所編制的常??赡懿辉龠m合,因此常模必須定期地修訂,要以批判的眼光看待舊的常模,并盡可能采用新近的常模。(6).要將一般常模和特殊常模結合起來測驗手冊上所列的常模通常是為典型團體建立的,不一定適合使用者的具體情況。對此問題的一個解決辦法是為每個特定目的建立特殊常模。9.2常模抽樣簡單隨機抽樣(simplerandomsampling)等距抽樣分成隨機抽樣(stratifiedrandomsampling)
兩階段隨機抽樣(twostagesrandomsampling)9.2.1,簡單隨機抽樣這是一種最簡單的抽樣方法,常用的具體抽取方式有抽簽法和隨機數字法。(1)抽簽:把總體中的每一個個體編上號并作出簽,充分混合后從中隨機抽取一部分,這部分簽所對應的個體就組成一個樣本。(2)隨機數字表:用隨機數字表來抽取數字。
評價:簡單隨機抽樣從理論上來講最符合隨機原則,但這種方法在實踐中運用受到一些限制,存在一些不足。簡單隨機取樣需要把總體中的每一個個體編上號,如果總體很大,這種編號幾乎是不可能的。這種方法常常忽略總體已有的信息,降低了樣本的代表性。9.2.2等距抽樣將已編好號碼的個體排成順序,然后每隔若干個抽取一個。例如,調查某個年級的學生的心理健康水平,總數為300名,取50個,每隔6個取一個,則抽取1、7、13、19等。評價:抽樣方法比簡單隨機取樣簡便易行,而且它能比較均勻地抽到總體中各個部分的個體,樣本的代表性比簡單隨機取樣好。樣本如果存在周期性變化,樣本的代表性則不如簡單隨機取樣。如,前面的調查,如果男生的編號是奇數、女生的編號是偶數,那么抽到的都將是男生,顯然這樣的樣本缺乏代表性。同簡單隨機取樣一樣也容易忽略已有信息。如,調查某地區(qū)中學生的智力水平,該地區(qū)有一所重點中學,人數為199人,其編號是602-800,按照總體和樣本大小,決定每隔200人取1人,則為1、201、401、601、801,以此類推,這樣重點中學的同學正好沒抽到,顯然這樣的樣本也缺乏代表性。
9.2.3.分層隨機抽樣按照總體已有的某些特征,將總體分成幾個不同的部分(每個部分叫一個層),再分別在每一部分中隨機取樣。它充分利用了總體已有的信息,因而是一種非常實用的抽樣方法。對一個總體應該如何分層,分幾層,要視具體情況而定??偟脑瓌t是,各層內的變異要小,而層與層之間的變異要大。各層的人數分配:按各層人數比例分配:這是在各層內的標準差未知的情況下常用的一種分配方式,基本思想是人數多的層多分配,人數少的層少分配。設總體人數為N,所需樣本容量為n,各層的人數分別為N1、N2……Ni……Nk,每層應分配的人數為n1、n2……ni……nk。則,N=10000,N1=500,n=1000,,X=500/10000*1000=50評價:能充分利用總體已知信息,提高樣本的代表性?;ㄙM小。9.2.4兩階段隨機抽樣進行兩階段隨機抽樣時,首先將總體分成M個部分,每一部分叫做一個“群”,第一步從M個群中隨機抽取m個作為第一階段的樣本,第二步再從所選取的m個群中抽取個體構成第二階段樣本評價:一般而言,兩階段隨機取樣對于簡單隨機取樣,標準誤要大一些,即抽樣誤差要大一些,這主要是由于存在第一階段的取樣,使得第二階段取樣時已不是從總體中抽取。但兩階段取樣簡便易行,節(jié)省經費,因而它是大規(guī)模調查研究中常被使用的抽樣方法。
back9.3常模的類型9.3.1.發(fā)展常模:發(fā)展常模表示個體在正常發(fā)展線上心理特征處于什么樣的發(fā)展水平。例如我們可以說一個8歲兒童具有10歲兒童的智力水平,也可以說一個四年級的學生具有五年級或三年級閱讀水平。大一新生的生涯探索達到了大四的水平。如果測驗所測量的特質是隨著年齡的增長而持續(xù)穩(wěn)定地變化的,則可以將不同年齡階段的平均表現制成常模,這一常模就是發(fā)展常模:生涯探索、生涯困難、生涯承諾等發(fā)展常模通常是以各年齡階段或年級被試的平均水平為參照點,以年(月)為單位,將常模團體的原始分數轉化成相應的年齡或年級水平后而得到的量表分數連續(xù)體。智齡、智商、年級當量、順序量表嬰幼兒頭圍與胸圍發(fā)育的正常值(生理發(fā)展常模)年齡(月)036912182436項目頭圍(厘米)男34.341.043.945.146.347.348.249.1女33.740.042.844.245.646.247.148.1胸圍(厘米)男32.841.343.845.046.147.649.250.8女32.640.342.743.945.046.648.249.8兒童口語獲得的年齡和不同階段的特征(心理發(fā)展常模)口語習得的年齡口語習得的各階段特征
剛出生
9-12個月
18-24個月
3-4歲
7歲前
能夠分辨語音刺激與其它刺激
說出第一個指示詞
出現雙詞說話
出現完全符合語法的完整句子
獲得完全符合語法的口頭語言大學生生涯發(fā)展常模生涯意識:興趣、能力、價值觀生涯探索:自我探索、環(huán)境探索生涯困難:信息獲得、決策生涯應變力:職業(yè)認同職業(yè)承諾職業(yè)效能感集體效能感Savickas的4C:生涯關注(careerconcern)、生涯自主(careercontrol)、生涯好奇(careercuriosity)和生涯自信(careerconfidence)維度生涯疑問態(tài)度與信念能力生涯問題適應性行為生涯干預關注我有未來嗎?有計劃的做計劃不關心覺察、投入、準備生涯定向訓練自主誰擁有我的未來?堅定地作決策猶豫堅定、有條理、執(zhí)著決策訓練好奇未來我想做什么?好奇的主動探索不切實際嘗試、冒險、詢問獲取信息的活動自信我能做到嗎?有效的解決問題壓抑堅持、努力、勤奮建立自尊
常用的發(fā)展常模:A智力年齡(mentalage)比奈在本世紀初認為:測量兒童心理成長,可以將一個兒童的行為與各年齡水平的兒童比較,以獲得該兒童的心理發(fā)展水平。在此設想基礎上,他首先尋找并設計出可區(qū)分各種年齡兒童智力的題目,因為兒童在這些題目上的反應,隨著年齡的變化而有系統的改變。每個題目放在大部分的兒童都能成功地完成的那個年齡水平。例如標準化樣本中大多數8歲兒童都能通過的那些項目,就代表8歲兒童的智力水平,就將該題放在8歲水平。每個年齡水平制定適當的題目,可以得到一個可評價兒童智力發(fā)展水平的年齡量表。一個兒童在年齡量表上所得的分數,就是最能代表他的智力水平的年齡,這樣的分數就稱作智力年齡,簡稱智齡。所有的年齡量表基本上都是利用相同的推理與步驟制定的,年齡量表將個人的行為與各年齡組的一般兒童比較而給予一個年齡分數。
(比率智商
=智齡/實齡
)在1916年推孟在斯坦福-比奈量表中采用了智商的概念智力年齡是一個絕對量數,而智商是一個相對量數智商(IQ)(intelligencequotient)被定義為智齡(MA)與(CA)實齡之比。為避免小數,將商數乘以100,其計算公式為:年齡量表的基本要素是:(1)一組可區(qū)分不同年齡組的題目。(2)一個常模團體。該團體是由各個年齡的被試所組成的具有代表性的樣本。(3)常模表,即一個表明答對哪些題目或得多少分就該歸入哪個年齡的對照表。年齡常模最大的優(yōu)點是易于理解與解釋,并可以與同年齡團體作直接比較。但必須注意人在很多方面發(fā)展的速率是先快后慢并隨著年齡的增長而逐漸減慢,當長到青春期或成年期,便逐漸停止。此時,年齡常模便不再適用。B年級當量(gradeequivalents)教育成就測驗上的分數經常按照年級當量來解釋,即將被試的測驗成績與某一年級的學生的平均分數作比較,以確定他相當于哪一年級的水平。這種年級當量選擇題目與指定分數的方法與步驟與年齡常模類似,所不同的是用年級水平代替了年齡水平。例:一個學生如果能解答六年級的題目或他(她)在測驗上的得分與六年級的平均分數相同,則他(她)在該測驗上的年級當量便是6。對生涯發(fā)展研究與應用特別有啟發(fā)C順序量表(ordinalscales)這種常模源于兒童心理學的研究。通過對嬰兒的行為發(fā)展的經驗觀察,人們描述各種機能隨著年齡發(fā)展的典型行為。(如前例)例:《格塞爾發(fā)展順序量表》按月份表明,從4周到36周的兒童在運動、適應性、語言、社會性等四個方面的大致發(fā)展水平。如嬰兒的感覺運動發(fā)展順序是:4周,控制眼睛運動,能追隨一個對象看等;16周,能使頭保持平衡;28周,能用手抓握并玩弄東西等。(P.133)順序量表用來鑒別兒童在具體行為機能的發(fā)展中所達到的階段。同樣適用于生涯發(fā)展課題4周16周28周40周52周不能控制頭部,仰臥姿勢左右不對稱頸可豎直,頭微搖動,仰臥姿勢左右對稱扶起獨坐,身體前傾可獨坐,爬行,扶著物件站立攙一手行走,搖擺9.3.2.團體內常模常模也可以表示為具有同一身份的人的平均水平,這時的常模稱為組內常模(Within-gropNorm)?,F在幾乎所有的標準化測驗都提供某種形式的組內常模。百分位數標準分數離差智商(1)百分位數與百分等級在統計學上,會先將收集得來的資料由小至大或由大至小排列,經由排列之后的數據才再加以分析解釋。百分位數:1.將數據分成相等的一百個部份,中間的99個切割點可以稱之為第1、第2,…及第99個百分位數。2.百分位數是一各位置量數,旨在將有序數據量的相對位置標示出來,百分等級(簡稱PR值)百分等級是應用最廣的表示測驗分數的方法。一個原始分數的百分等級是指在常模團體中低于這個分數的人數的百分比。例如,一被試在一項測驗中得82分,經過換算,百分等級分數為75,就表示參加該項測驗的人得分低于82分的占全體被試的75%,并說明超過他的成績82分的人僅有25%。我們通常用PR來表示百分等級。百分等級取值越大,說明成績越優(yōu)秀。
百分等級的計算方法:將被試團體的全體原始分數從大到小排序,然后采用下列公式計算:
PR=100-(100R-50)÷N式中PR為百分等級,R為排名順序的序號,N為被試總人數。例:某被試在一次由50人參加的成績測驗中得80分,排名第9,則該生成績(80分)的百分等級為:
PR=100-(100R-50)÷N=100-(100×9-50)÷50=83其百分等級為83,說明?總體中有83%的人分數低于80分。
百分等級的優(yōu)缺點:百分等級是一種相對位置量數,具有可比性,便于計算、易于理解等優(yōu)點。主要缺點是單位不等,尤其在分數分布的兩端。原始分數轉換成百分等級時,靠近分布中央(平均數或中位數附近)的原始分數的分數之間的差異被夸大了,而靠近分布兩端的原始分數的差異被縮小了。另一個缺點是百分等級只具有順序性,而無法用它來說明不同被試之間分數差異量。例:某被試甲在一個成就測驗中的百分等級為10,被試乙為20,被試丙為30,我們只能說丙優(yōu)于乙,乙優(yōu)于甲,而不能推斷他們之間差異的程度相等。在使用百分等級時應注意,百分等級是相對于特定的被試團體而言的。所以,解釋時不能離開特定的參照團體。被試得分不變,但參照團體改變了,百分等級值就可能發(fā)生變化。所以在報告百分等級時,一定要說明是相對于什么的參照團體來說的。(2)標準分數是一種具有相等單位的量數。它是將原始分數與平均數的距離以標準差為單位表示出來的量數,它的基本單位是標準差,所以叫標準分數。
標準差定義為方差的算術平方根,反映組內個體間的離散程度。方差是各個數據與平均數之差的平方和的平均數。標準分數可分為兩類:線性轉換的標準分數(簡稱z分數)非線性轉換的標準分數(稱為正態(tài)化標準分數,常見的有T分數、標準九分)。方差是各個數據分別與其和的平均數之差的平方的和的平均數,用字母D表示。在概率論和數理統計中,方差(英文Variance)用來度量隨機變量和其數學期望(即均值)之間的偏離程度。A)線性轉換的標準分數z分數就是我們通常所說的z分數,原始分數轉換成標準分數的計算公式是:
表示某一分數與平均數之差是標準差的幾倍?例2:一位學生的數學測驗成績是78分,該次測驗此生所在班級的平均成績?yōu)?6分,標準差為10,求該生數學成績的標準分數。
通過線性轉換得到的標準分數稱為Z分數它是將個體原始分數與平均數的距離以標準差為單位表示出來。z分數之間差異的相對大小,準確地反映了原始分數之間的相對大小。z分數的計算方法z分數具有以下幾個性質:①z分數是以一批分數的平均數為參照點,以標準差為單位的等距量表。②z分數的正負符號表示原始分數在平均數之上或之下,絕對值表示原始分數與平均數的距離。③z分數分布形態(tài)與原始分數分布完全一樣。z分數之間差異的相對大小,準確地反映了原始分數之間的相對大小。由于z分數在計算中經常出現負數和小數,且單位過大(一個標準差單位),使用起來不夠方便,所以通常需要將Z分數進行進一步線性轉換,其形式為:
Z’=A+B·Z
(Z′為轉換后的標準分數,A,B為常數)加上一個常數目的是為了去掉負值,乘上一個常數是為了使單位變小從而去掉小數點。原來分數間的關系不會改變。例如,美國大學入學考試委員會的學業(yè)評定測驗(SAT)所使用的分數轉換公式為:
CEEB分數=100·Z+500
(平均分數為500,標準差為100)。我國一種出國人員英語水平考試(EPT)所使用的分數轉換公式為:
EPT分數=20·Z+90
(平均分數為90,標準差為20)B)
轉換的標準分數a.正態(tài)化的標準分數為了能將來源于不同分布形式的分數進行比較,可使用非線性轉換,將非常態(tài)分布轉換成正態(tài)分布。怎樣將原始分數轉換成正態(tài)化的標準分數呢?先把原始分數轉換成百分等級,然后按照百分等級查正態(tài)分布表,得到對應Z分數,這一分數就是常態(tài)化的標準分數。例3:下表是某一智力測驗常模團體的分數分布。請將下面的次數分布表正態(tài)化,求正態(tài)化的標準分數。分組fcfL百分等級累積比率Z值55-2100990.992.3350-298970.971.8945-696930.931.4840-890860.861.0835-1282760.760.7130-1470630.630.3325-2456440.44-0.1520-1232260.26-0.6415-1620120.12-1.1810-4420.02-2.05合計100
表7-2某一智力測驗分數的次數分布表將測驗分數正態(tài)化有個條件,當總體分布是正態(tài),由于取樣的偏差等因素造成樣本的分布是偏態(tài),這樣有必要把它的分布正態(tài)化,使其更符合實際情況。一般很多心理特質都是正態(tài)分布。b.T分數T分數:正態(tài)化的標準分數也可以被轉換成任何一種方便的形式。因為正態(tài)化標準分數有負數和小數,給計算和解釋都帶來不便。當以50為平均數,10為標準差來表示時,正態(tài)化的標準分數就轉換成T分數。把正態(tài)化標準分數乘以10(以消除小數)再加上50(消除負號),它就被轉換成T分數。即:T=10·Z+50
對標準分數的評價:優(yōu)點:a.用等距量表來表示測驗分數使進一步統計分析成為可能。b.常態(tài)化標準分數可以參照常態(tài)曲線面積直接轉換成百分等級,因而容易解釋。c.允許將幾個測驗或量表上的分數作直接的比較。如,某生數學80分,語文75分,不能進行比較,如果已知數學測驗的平均分為70分,標準差為10分,語文成績平均分為60分,標準差為10分。請比較該生語文、數學成績的好壞:缺點:1.難以理解。d.在實際應用時通常用標準分數來表示,沒有區(qū)分線性轉換的標準分數還是常態(tài)化的標準分數。e.常態(tài)化標準分數是人為使分數呈常態(tài)分布,當所測特質的分數在實際上不是常態(tài)時,便扭曲了分布的形狀。9.3.3離差智商美國心理學家韋克斯勒針對比率智商的缺陷提出了離差智商。1)智商分布在不同年齡階段標準差不同,因而相同的智商分布在不同的年齡水平意義不同。10歲的115與12歲的125地位相當2)成人的智商應該以多大實足年齡作為除數尚無統一標準高年齡、成人組的CA?智力生長何時達到頂點?實齡是等距的,而智齡不等距(智力發(fā)展不是直線)各年齡組的標準差不相等,相同的比率智商對于不同年齡具有不同的意義離差智商的原理是將各個年齡階段的智力分布視為正態(tài)分布,其平均數即為該年齡的平均水平。而一個人的智力與平均水平的離差(以標準差為單位)就代表了其智力的高低。離差智商就是由此而得名的。韋氏1949量表中轉換成離差智商的步驟:1.
將言語和操作各個分量表的得分(原始分數)轉換成常態(tài)化的標準分數Z2.
將言語和操作部分的各個分量表的量表分數相加,得言語量表總分和操作量表總分,將言語量表總分和操作量表總分相加得全量表總分3.將言語量表總分、操作量表總分和全量表總分轉換成言語智商、操作智商和全量表智商,其方法是:
實際上就是平均數為100,標準差為15的常態(tài)化標準分數。標準分數的優(yōu)點:具有相等的單位,便于作進一步的統計分析;正態(tài)化標準分數可利用正態(tài)曲線面積表直接轉換成百分等級分數,易于理解;允許將兩個或兩個以上的測驗的分數作直接的比較。標準分數也有它的缺陷:分數比較抽象,不易讓一般人理解;正態(tài)化標準分數是人為使分數呈正態(tài)分布,當所測特質的分數不是正態(tài)時,便扭曲了分布的形狀。9.4.總常模和分常模總常模的團體范圍廣泛,一般是指對全國范圍內的被試團體取樣所制定的常模。分常模有地區(qū)常模、職業(yè)常模等。9.5常模的相對性與可比性1.測驗之間的比較:測驗內容一致?量表單位一致?常模樣本一致?2.常模樣本樣本量;是不是做考慮的總體代表規(guī)定樣本所能推廣的特殊總體3.如何解決常模的可比性錨常模特殊常模:亞團體、地方常模固定參照組:例:SAT:1941年考生組;1990年考生組9.6參照標準的分數參照常模的分數是將被試的分數和常模團體測驗分數進行比較來的,并且主要以個人在常模團體中所處的相對位置來確定。參照標準的分數不同,一個人的測驗成績不是和其他人比較,而是和某種特定的標準比較。它關心的是一個人是否達到某種標準,它反映的是一個人的行為水平或成就水平如何。標準參照分數可分為內容參照分數和結果參照分數。如可轉換職業(yè)能力測試9.6.1內容參照分數內容參照分數主要依據被試對某個確定的材料內容或技能的掌握和熟悉程度來確定的。使用內容參照分數,關鍵是要預先制定一個能判定被試是否已掌握某種內容或熟練程度的標準,這種標準主要有:1掌握分數最簡便的方法是訂出一個判別被試是否通過或掌握某種內容的最低分數線,即最低標準水平。在此分數以上,表明被試已達到掌握或熟練的水平;在此分數以下,表明被試沒有達到掌握或熟練的水平。如何確定這個水平?通常是選擇有80%到90%的人通過的那一水平。如:考查科分合格與不合格兩級。2正確百分數正確百分數指被試在測驗中答對題目的百分比。這一指標更為常用,因為它能更好地反映被試對所測內容的掌握或熟練程度。采用這一指標解釋測驗分數時必須注意測題應該確是該目標范圍的代表性的取樣,否則答對多少題并不反映對該目標的掌握程度。3.內容標準分數內容標準分數是把內容分數與常模分數結合起來使用。編制內容標準量表時,不但要明確界定內容、范圍,還要詳細說明每一種水平的“典型”人物正確回答和不正確回答的問題的類型。這樣,將一個人的測驗分數與此種量表對照,便既能指出他正確反應的百分比,又能指出他的成績達到了哪種人的水平以及他能解決哪一類問題。如:智力年齡、勝任力模型4.等級評定量表在某些情況下,我們感興趣的不是人們是否掌握了某種知識,而是一個人完成某種過程或生產出某種產品的技能。通常我們需要采用等級評定量表來報告一種活動的熟練水平或一種產品的質量。為了使評定盡可能客觀,需要對各種等級定出標準。對每種水平都定出標準樣本,并作出詳細說明。如:各種等級考試內容參照分數的主要優(yōu)點是用個人所掌握的知識或技能的水平來描述行為,指出一個人知道什么和能做什么。在大多數情況下,這比知道一個人在團體中的相對位置更有價值。內容參照分數主要用于成就測驗以及能確定出可接受的最低標準的資格測驗(如醫(yī)生或司機的證書考試),對于大多數能力傾向和人格測驗來說,由于所測的范圍很難確定,因而一般不用內容參照分數。9.6.2結果參照分數結果參照又叫效標參照。它是將效標材料直接結合到測驗結果的解釋過程中。這種分數適合于用測驗來作預測的情況。例如,高考平均分數在80分(各科滿分為100分)以上的人,我們可以預測其入大學后的學習成績將為優(yōu)等。這里,是用結果來解釋測驗分數,而不是用常模和內容來解釋。要得到結果參照分數必須有兩個前提條件:①需要有效度證據,即測驗分數必須與一個重要的效標具有高相關。②要有將測驗分數和效標之間的關系結合起來的方法,如轉換圖表。例如,如果一個學生在大學入學考試委員會的學術測驗(SAT)上得530分,他在一所具體大學的一年級平均成績處于A、B、C、D、F等類的可能性各是多少?高考長盛不衰、狀元、少年班?
九種可轉換技能溝通創(chuàng)造性批判思維領導力生活管理研究/計劃開發(fā)與管理社會責任感團隊合作技術/科學技能9.7測驗分數的解釋9.7.1如何看待測驗分數的意義9.7.2如何向受測者報告測驗分數某智力測驗常模表(部分)男大學生16PF常模表(部分)某職業(yè)抉擇量表的常模得分百分等級158513701150930715返回9.7.1如何看待測驗分數的意義1.施測者進行測驗結果的解釋必須:①對所做的測驗(包括它的常模的代表性、信度、效度、難度等)要熟悉了解。②對受測者的情況(文化程度、職業(yè)、是否可能接觸測驗中的有關問題等)也要有所了解。③對當時測驗的具體情況,例如是否有干擾,受測者當時有無情緒波動或身體不適等情況的了解。同一個分數可能是由于不同原因造成的,應結合以上三方面的因素對測驗分數作出解釋。同一分數可作出不同解釋。例如,用具有初中文化程度的標準化樣本常模的智力測驗來測量一個小學文化程度的受測者,如果測得IQ為85,就可以認為他基本上是中等智力水平;如果受測者原來文化程度是大學畢業(yè),也測得IQ為85,就可解釋為受測者可能由于某種原因而使智力有所減退,屬于中下水平。2.解釋測驗分數有4種類型:(1)敘述的解釋:指描述個人的心理特征狀態(tài)。例如,這個學生是一位怎樣的學生,聰明的?中等的?或愚笨的?他的語文推理是否優(yōu)于非語文推理?他喜歡做些什么?有什么樣的性格特點?(2)溯因的解釋:指追溯過去以解釋個人目前的發(fā)展情況。例如,他為什么會這樣?他的閱讀困難是否是情緒困擾的結果?或缺乏基本的閱讀技能?或缺乏學習的興趣?他拒絕機械的學習活動是否由于父母的壓力?或過去的失???或興趣太廣泛所致?(3)預測的解釋:指推估個人未來的可能發(fā)展情形。例如,他上高中的成績會怎樣?他升入大學的可能性有多大?他在理科方面的發(fā)展是否比在文科方面的發(fā)展更能成功?他是否可能成為一個問題青年?(4)判斷(或評價)的解釋:指作價值的判斷或做決定。此種解釋是依據上述幾種解釋而作的判斷。例如,準許入高中或大學。他應該學習什么樣課程。進什么樣大學。他應該成為工程師或商務經理。3.解釋分數的意義應遵循的基本原則(1)主試應充分了解測驗的性質與功能。測驗使用者必須具備心理測驗的基本知識。使用者在解釋之前必須從其編制手冊中,詳細了解編制過程的標準化及測驗的信度、效度、常模等是否適當。更重要的,應知道測驗能測量什么,不能測量什么,分數在使用上有何限制。有時兩個測驗的類型雖然相同,但測量的功能往往不同。例如,卡特爾測驗16PF與明尼蘇達多相人格調查表MMPI都是人格測驗,但后者更多地發(fā)揮臨床診斷的功能,前者則更多地針對正常人。(2)對導致測驗結果的原因的解釋應慎重,謹防片面極端。遺傳特征、測驗前的學習與經驗以及測驗情境對一個人的測驗成績都會產生影響。所以我們應該把測驗分數看成對受測者目前狀況的測量,至于他是如何達到這一狀況的,則受許多因素的影響。為了能對分數作出有意義的解釋,必須將個人在測驗前的經歷或背景因素考慮在內,比如,在詞匯上得到相同的分數,對于大城市的孩子與邊遠山區(qū)的孩子具有不同的意義。(3)必須充分估計測驗的常模和效度的局限性對測驗分數作出確切的解釋,只有常模資料是不夠的,還必須有效度資料。沒有效度證據的常模資料,只告訴我們一個人在一個常模團體中的相對等級,不能做預測或更多的解釋。在解釋分數時人們最常犯的錯誤就是僅根據測驗的標題和常模數據去推論測驗分數的意義,而忽略效度的不足或缺乏。假若一個測驗的名稱是內外向量表,并有可利用的常模資料,那么就很容易把得高分的人說成是內向性格。(4)解釋分數應參考其他有關資料。測驗分數不是了解學生的唯一資料,為正確了解其心理特質尚需參考其他有關資料。例如,某生智力測驗上得到IQ為80,在不考慮其他資料的情況下,只能解釋:“某生的智力屬于中等偏下”。但是,如果考慮他的在校成績時,解釋可能大不相同,如果他的在校成績經常保持在年級前五名,則不可能作出如上的解釋,可能需要進一步探討他在做測驗時的動機,態(tài)度,情緒與健康狀況等,有了這些資料作為佐證,才能正確判斷其智力是否全部正常發(fā)揮,測驗結果是否可靠。解釋時亦可參考其它的測驗資料,只憑單一的測驗分數加以解釋,可能全然不同于綜合考慮幾個測驗分數。
例如,根據自陳量表測驗的分數,某生的性壓抑分數高于平均數兩個標準差;但在投射測驗中有關性的反應,卻高于平均數一個標準差,如僅依自陳量表的分數解釋時,只能解釋說:“某生的性壓抑傾向甚強?!钡绻Y合投射測驗的分數作出綜合解釋,則可解釋說:“某生的性興趣強于一般人(投射測驗),但他卻將性興趣加以嚴重的壓抑(自陳量表)??傊瑴y驗分數的解釋應盡可能多種資料相互參照,綜合評定。Triangle/360度(5)對測驗分數應以“一段分數”來解釋,而不應以“特定的數值”來解釋。
由于每個測驗均會受到測量誤差的影響,因此在解釋測驗分數時也應考慮到測量誤差的存在。測量誤差的大小與信度的高低有關,信度越高,則誤差越小,但永遠不可能完全消除誤差,因此,應該把測驗分數視為一個范圍而不是一些確定的點,也就是要對測驗分數提供帶狀的解釋。倘若使用確切的分數,應說明這些分數不是精確的指標,而是我們對某人真實分數的大體估計。(6)對來自不同測驗的分數不能直接加以比較。即使兩個測驗名稱相同,由于所包含的具體內容不同(因而所測量的特質不完全相同),建立標準化樣本的組成不同,量表的單位(如標準差)不同,其分數也不具備可比性。如來自兩個智力測驗的分數,在沒有其他信息的情況下,我們無法判斷誰高誰底。必須把它們放在統一的量表上進行比較。
具體做法是:將兩個測驗都對同一個樣本進行施測,并把兩種測驗的原始分數都轉換成百分等級,然后用該百分等級作為中轉點,就可以做出一個等價的原始分數表。如果某人在測驗A中原始分數55是90百分等級,而測驗B中原始分數36也是90百分等級,那么他在測驗A獲得的55分就與在測驗B獲得的36分等值。9.7.2如何向受測者報告測驗分數如何向當事人及與當事人有關的人員(如家長,教師,雇主等)報告測驗分數,使他們更好地理解分數的意義是一件非常重要的事,下面所列舉的一些原則,可供報告測驗分數時作參考。1)使用當事人所理解的語言測驗具有自己的詞匯,你所理解的詞并不意味著當事人也一定理解。你懂得標準差和標準分數,然而當事人可能不懂。因此你必須用非技術性的用語來解釋標準分數,可以把它解釋成相對位置(如百分等級)。2)
要保
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版二手飛機維修保養(yǎng)合同示范文本3篇
- 2024首付款支付與房地產開發(fā)項目合作協議3篇
- 2025年度留置車輛交易傭金借款合同模板4篇
- 2024項目專業(yè)技術咨詢服務合同書
- 二零二五年度羽絨服產品線上營銷推廣合同規(guī)范3篇
- 2025年電商物流運輸長期服務合同2篇
- 二零二四年塔吊信號工施工現場安全巡查聘用合同3篇
- 二零二四年土工布材料研發(fā)與生產采購合同3篇
- 2024版銷售合同模板英文
- 二零二五年度籃球館贊助商合同3篇
- 2024年黑河嫩江市招聘社區(qū)工作者考試真題
- 第22單元(二次函數)-單元測試卷(2)-2024-2025學年數學人教版九年級上冊(含答案解析)
- 藍色3D風工作總結匯報模板
- 安全常識課件
- 河北省石家莊市2023-2024學年高一上學期期末聯考化學試題(含答案)
- 2024年江蘇省導游服務技能大賽理論考試題庫(含答案)
- 2024年中考英語閱讀理解表格型解題技巧講解(含練習題及答案)
- 新版中國食物成分表
- 浙江省溫州市溫州中學2025屆數學高二上期末綜合測試試題含解析
- 2024年山東省青島市中考生物試題(含答案)
- 保安公司市場拓展方案-保安拓展工作方案
評論
0/150
提交評論