教育測量與評價(jià)復(fù)習(xí)高效筆記

上傳人：1*** IP屬地：北京上傳時(shí)間：2025-02-15 格式：DOCX 頁數(shù)：38 大小：120.29KB 積分：1.2 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩33頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

the

Measurement

教育測量與評價(jià)主要是研究對教育現(xiàn)象進(jìn)行測量和價(jià)值判斷的理論方法和技術(shù)。本門課程分為兩大部分：第一教育在課程設(shè)置和學(xué)科建設(shè)中，教育測量與評價(jià)可以看成是測量學(xué)和評價(jià)學(xué)內(nèi)容的整合，而且側(cè)重于教育測量，是綜合性教育科學(xué)。又可以看成兼容了教育統(tǒng)計(jì)教育測量心理測量教育評價(jià)教育評估教育督導(dǎo)甚至教育科學(xué)研究方法在內(nèi)在教育學(xué)科分類中，教育測量與評價(jià)屬于研究如何運(yùn)用方法分析教育活動。總之教育測量學(xué)是應(yīng)用性學(xué)科，又是綜

教育評價(jià)的應(yīng)用，包括課程評價(jià)（課程大綱教學(xué)設(shè)計(jì)等）學(xué)生評價(jià)（老師的評價(jià)學(xué)生自己的評價(jià)同學(xué)的評價(jià)等）

第三許多學(xué)術(shù)團(tuán)體都加盟對教育評價(jià)的研究，成立了一些全國性的教育評價(jià)協(xié)會：全國教育測量委員會全國教育進(jìn)

年在日內(nèi)瓦成立，當(dāng)時(shí)有

個(gè)國家參加。其宗旨是幫助世界各地的教育機(jī)構(gòu)通過發(fā)展和應(yīng)用評價(jià)技術(shù)來提高

在教育系統(tǒng)運(yùn)轉(zhuǎn)過程中，除了對教育效果（輸出）要進(jìn)行測量與評價(jià)外，還要針對影響教育效果的諸因素（輸入）

學(xué)校教育考試制度和評價(jià)制度是教育制度的一個(gè)組成部分，但教育考試和教育評價(jià)具有很強(qiáng)的導(dǎo)向功能。英國

教師需要對學(xué)生的性向成就態(tài)度興趣潛能及發(fā)展等作出一系列決策和判斷，需要采用教育測量與評價(jià)多種方法，以手段不再是唯一的書面考試，而是測量與非測量的一整套評價(jià)技術(shù)。目的不再局限于給學(xué)生分等級排名次，而是發(fā)測量和評價(jià)的指導(dǎo)思想非常重要。指導(dǎo)思想是為了創(chuàng)造適合學(xué)生發(fā)展的教育環(huán)境，而不僅僅是為了選拔適合精英教

在許多經(jīng)濟(jì)發(fā)達(dá)的國家和地區(qū)，雖然教師教育模式不一定相同，但對所有想當(dāng)教師的學(xué)生至少要學(xué)習(xí)十門左右的教

第一單位。單位是測量的基本要求，具有明確的意義和相等的價(jià)值；教育測量的單位常常是，難以達(dá)到這個(gè)要第三量表（具）：能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體。確定了測量單位和參照點(diǎn)并具有取值系統(tǒng)的測量工

）教育測量的特點(diǎn)：間接性和推斷性；測量對象的模糊性和測量誤差的不可避免性；量表具有多樣性，結(jié)果具有任何一個(gè)測量必須具有明確的目的，教育測量必須為實(shí)現(xiàn)教育目的而服務(wù)。不能脫離教育目的和教材的要求，任意

教育評價(jià)的概念。當(dāng)把評價(jià)一詞特別地用于學(xué)校教育領(lǐng)域或課堂教學(xué)情境時(shí)，在一些情況下，評價(jià)就是教育評價(jià)是為了確定學(xué)生達(dá)到教學(xué)目標(biāo)的程度，收集分析和解釋信息的系統(tǒng)過程；評價(jià)包括對學(xué)生的定量描述和定性描評價(jià)是一種劃定獲取和提供敘述性和判斷性信息的過程。他認(rèn)為：評價(jià)最重要的意圖不是為了證明，而是為了改評價(jià)是與教育的目標(biāo)和價(jià)值有明確關(guān)系的概念，是按照教育目標(biāo)和價(jià)值觀對學(xué)生的學(xué)習(xí)成果及教育計(jì)劃的效果等進(jìn)在《教育評價(jià)》一書中對評價(jià)作了兩種解釋：第一種解釋在本質(zhì)上是針對教育評價(jià)來說的；評價(jià)是系統(tǒng)收集證第二種解釋實(shí)際上是針對教育目標(biāo)分類來說的。教育目標(biāo)分認(rèn)知情感和動作技能三大領(lǐng)域，認(rèn)知領(lǐng)域的教育目標(biāo)又

教育評價(jià)的內(nèi)容既可以是教育計(jì)劃，也可以是課程；既可以學(xué)生的學(xué)習(xí)結(jié)果，也可以是某種教育現(xiàn)象教學(xué)活動教

按照一定的價(jià)值標(biāo)準(zhǔn)和教育目標(biāo)，利用測量和非測量的種種方法系統(tǒng)地收集資料信息，對學(xué)生的發(fā)展變化及其影響教育測量與評價(jià)是兩個(gè)不同的概念，教育測量以量化為主要特征的事實(shí)判斷；教育評價(jià)在定性和定量資料基礎(chǔ)上做出的價(jià)值判斷；測量關(guān)心的是數(shù)據(jù)的多少，評價(jià)關(guān)心的是價(jià)值的高低。測量是一種純客觀的過程，是一種單一的活教育評價(jià)與評估既有聯(lián)系又有區(qū)別。第一根據(jù)《

從概念的分析和理解中，我們可以看到教育評價(jià)教育評估和教育測量三個(gè)概念之間是兩兩既有聯(lián)系又有區(qū)別，即交測驗(yàn)是測量的工具，用它能引起人的代表性的行為，以便對人的行為特性或心理特性進(jìn)行測量與評價(jià)，是教育測驗(yàn)test廣義的考試泛指人類社會一切測度和甄別人的身心各個(gè)方面之群體或個(gè)體差異的活動。狹義指由主試根據(jù)一定社會的要求，在一定場所，采取一定的方式方法，選擇適當(dāng)?shù)膬?nèi)容，對應(yīng)試者的德學(xué)才識體諸多方面或某方面所進(jìn)行有教育考試是根據(jù)教育內(nèi)容和目標(biāo)，選擇有代表性的內(nèi)容與問題，按照一定的方式，對應(yīng)試者的知識技能等進(jìn)行測量

科舉制度就是開科取士，即國家設(shè)立許多科目，通過定期的統(tǒng)一考試選拔人才，這種制度開始于隋煬帝大業(yè)二

中國科舉考試雖然對世界文官考試制度有過重要作用，但我國古代對科舉制度缺乏教育學(xué)心理學(xué)統(tǒng)計(jì)學(xué)哲學(xué)等科學(xué)

桑代克的《精神與社會測量導(dǎo)論》提出假設(shè)：無論什么東西，只要存在的，總存在于數(shù)量之中；美國麥柯爾：

心理測驗(yàn)的發(fā)展與應(yīng)用促進(jìn)了教育測量學(xué)的發(fā)展，如

年比納等人發(fā)表的《比納量表》英國斯皮爾曼的能力背景：

年期間，經(jīng)濟(jì)危機(jī)。美國高中學(xué)生人數(shù)大量增加，教學(xué)理論脫離實(shí)際，許多人要求重新協(xié)定高中

其一傳統(tǒng)測驗(yàn)是片面的。其二只是關(guān)注客觀的信度。其三測驗(yàn)是教科書主義。其四對測驗(yàn)或考試的過分依賴必然養(yǎng)課程編制原理和評價(jià)活動原理。確定多元需要的價(jià)值目標(biāo)用行為表達(dá)教育目標(biāo)構(gòu)建合宜的教育情境選擇包括測驗(yàn)在內(nèi)的多種評價(jià)手段對達(dá)標(biāo)程度做出判斷對學(xué)生優(yōu)缺點(diǎn)進(jìn)行分析并提出改建措施修改教育方案，如此循泰勒在八年研究報(bào)告中首次提出了教育評價(jià)的概念，教育評價(jià)在本質(zhì)上是確定課程和教學(xué)大綱在實(shí)際上實(shí)現(xiàn)教雖然受到了批評，但泰勒的行為目標(biāo)評價(jià)模式思想和方法，在當(dāng)今世界教育測量與評價(jià)領(lǐng)域，以及對課程編制和教國內(nèi)外學(xué)者對教育測量與評價(jià)的分類，不僅角度不同，而且看法不一。其中格朗蘭德的分類具有代表性和啟發(fā)

在教學(xué)過程中經(jīng)常實(shí)施的，在性質(zhì)上大致相當(dāng)于現(xiàn)在的中小學(xué)單元測驗(yàn)。形成性測量與評價(jià)對于教師以及學(xué)生的作

對經(jīng)常表現(xiàn)出學(xué)習(xí)困難的學(xué)生所作的測量與評價(jià)，它的目的是對個(gè)人的問題行為及其原因進(jìn)行診斷。診斷性多半是

用于教學(xué)結(jié)束后，在性質(zhì)上相當(dāng)于現(xiàn)在學(xué)校中所進(jìn)行的期末考試。其目的有兩個(gè)：其一是在教學(xué)目標(biāo)之下，檢查學(xué)

常模參照測量與評價(jià)是將被試水平與測驗(yàn)常模相比較，以評價(jià)被試在團(tuán)體中的相對地位的一種測驗(yàn)與評價(jià)類型。也

將被試的表現(xiàn)與既定的教育目標(biāo)或教育行為標(biāo)準(zhǔn)相比較，以評價(jià)被試在多大程度上達(dá)到該標(biāo)準(zhǔn)。測評和教育目標(biāo)常

被試實(shí)際水平與其自身潛在水平相比較，以評價(jià)被試有無充分發(fā)揮自身潛力為目的。在強(qiáng)調(diào)人性化動態(tài)化和個(gè)別化

目的在于測量與評價(jià)個(gè)人的潛在才能，預(yù)測個(gè)人能力發(fā)展傾向。分為兩種：一是關(guān)于能力傾向測量與評價(jià)；一是特

指的是同一主試在同一時(shí)間內(nèi)只能測量一個(gè)被試。主試與被試有更多的交流機(jī)會，對于一些特殊的被試，如幼兒文

指的是同一時(shí)間內(nèi)由一位主試測量多位被試。優(yōu)點(diǎn)是節(jié)省時(shí)間，可以在短時(shí)間內(nèi)收集到大量的數(shù)據(jù)，不足是不易有教育測評有許多重要的功能，如評定的功能判斷的功能選拔的功能反饋的功能教育功能導(dǎo)向的功能威懾的功能預(yù)測

在教學(xué)或教育前，教師可以先針對學(xué)生實(shí)施一次測量，用來評價(jià)學(xué)生在學(xué)習(xí)之前已具有的背景知識，以作為有效教

教師可以針對不同學(xué)習(xí)類型的學(xué)習(xí)行為特征，以及不同的認(rèn)知結(jié)構(gòu)缺陷的所在，有針對提出符合個(gè)別需要的補(bǔ)救教

根據(jù)測評結(jié)果，教師可以知道目前的教學(xué)情況，是否需要修正目標(biāo)或改變教學(xué)策略，是否需要改換教材以及教法

教育測量與評價(jià)是根據(jù)教育目標(biāo)進(jìn)行的，通過對現(xiàn)狀與目標(biāo)之間的差距進(jìn)行判斷，能有效地促進(jìn)被測量與評價(jià)的對

利用教育測量與評價(jià)，可以全面地掌握教育的各種情況，及時(shí)發(fā)現(xiàn)教育過程中存在的問題，對教育教學(xué)任務(wù)完成的error定義的后半部分從準(zhǔn)確性和一致性兩方面對誤差做了區(qū)分。準(zhǔn)確性和一致性的關(guān)系可以用射擊靶環(huán)來說明。假設(shè)有

心理測量工具往往是一套量表。當(dāng)量表在測出人的某種心理特質(zhì)時(shí)，若項(xiàng)目所測的東西與我們所欲測的目的之間出

對于人格測驗(yàn)如果主試沒有講清測驗(yàn)?zāi)康暮统霈F(xiàn)不合適的表情動作，也會使受測者產(chǎn)生焦慮，尤其對于年齡較小的焦慮和作業(yè)成績的關(guān)系呈倒形的

字曲線，適度的焦慮可以提高作業(yè)成績，焦慮水平太高和太低都不利于受測者水有些測驗(yàn)需要第二次應(yīng)用，甚至多次應(yīng)用。比如，在開始一項(xiàng)教學(xué)改革前對學(xué)生的能力和學(xué)習(xí)成績進(jìn)行前測，過半

受測者的疲勞失眠心境等都可以影響測驗(yàn)成績，心理學(xué)研究表明，人的智力情緒體力等都存在著節(jié)律性的變化，生

Classical

真分?jǐn)?shù)的變異可以分成兩個(gè)部分：與測驗(yàn)?zāi)康挠嘘P(guān)的變異（有效的變異數(shù)

）和與測驗(yàn)?zāi)康臒o關(guān)的變

）信度是一組測量分?jǐn)?shù)的特性，不是某個(gè)測量分?jǐn)?shù)的特性。是對一個(gè)人測量多次或?qū)σ粋€(gè)群體進(jìn)行測量得到一組）在不同的情況下，對于不同的樣本，采用不同的方法會得到不同的信度系數(shù)，因此一個(gè)測驗(yàn)可能不止一個(gè)信度）獲得較高的信度系數(shù)并不是心理測量有效的充分條件，只是一個(gè)必要條件。二信

一般能力與學(xué)績測驗(yàn)的信度系數(shù)為

以上，有的可以達(dá)到

；標(biāo)準(zhǔn)智力測驗(yàn)的信度系數(shù)應(yīng)達(dá)到

以上，個(gè)性和興趣測驗(yàn)的信度系數(shù)可稍低，一般應(yīng)達(dá)到

）。

由于誤差的存在，一個(gè)人通過測量得到的分?jǐn)?shù)很難等于真分?jǐn)?shù)。理論上，我們可以對一個(gè)人施測無數(shù)次，然后求得在實(shí)際工作中，我們用一組被試（人數(shù)足夠多）兩次施測的結(jié)果來代替對同一個(gè)人反復(fù)施測，以估計(jì)測量誤差的變異數(shù)。此時(shí)，個(gè)人在兩次測驗(yàn)中的分?jǐn)?shù)差異就是測量誤差。據(jù)此可制成誤差分?jǐn)?shù)的分布。這個(gè)分布的標(biāo)準(zhǔn)差（誤差

如果選用

值）為

％的可能落入

的范圍之內(nèi)，也可以寫成

則用公式

代入?；蛴?/p>

％的可能落

，已知

的標(biāo)準(zhǔn)差為

，信度系數(shù)為

，對一名

歲的兒童實(shí)施該測驗(yàn)后，

，那么他的真

對真分?jǐn)?shù)做的是區(qū)間估計(jì)，不可能由此得到一個(gè)確切的點(diǎn)。這就是說，測驗(yàn)分?jǐn)?shù)不是一個(gè)定點(diǎn)，而是具有

如，某班期末考試，小明的數(shù)學(xué)成績是

分，語文成績是

分。另外，已知小明所在班級的數(shù)學(xué)平均成績是

為差異的標(biāo)準(zhǔn)誤，

為相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差，

分?jǐn)?shù)為

分別為兩個(gè)測驗(yàn)的先將原始分?jǐn)?shù)化成標(biāo)準(zhǔn)分?jǐn)?shù)，然后將兩個(gè)標(biāo)準(zhǔn)分?jǐn)?shù)的差異與

顯著性水平）進(jìn)行比較，如果其絕對值

分，此次測驗(yàn)的信度系數(shù)是

；第二次考了

分，此次數(shù)學(xué)測驗(yàn)?zāi)昙壠骄质?/p>

分，標(biāo)準(zhǔn)差是

分，此次測驗(yàn)

再測信度

，也叫重測信度，也叫穩(wěn)定性系數(shù)。用同一個(gè)測驗(yàn)，對同一組被試前后施測兩次所得結(jié)果的一致性程度。對兩次測驗(yàn)分?jǐn)?shù)求相關(guān)，其相關(guān)系數(shù)就叫再測信度。其計(jì)算公式（皮爾遜積差相關(guān)公式的變式中

X1X2

為同一被試的兩次測驗(yàn)分?jǐn)?shù)，為全體被試兩次測驗(yàn)的平均數(shù)，S1S2

為兩次測驗(yàn)的標(biāo)準(zhǔn)差，

：假設(shè)有一份主觀幸福感調(diào)查表，先后兩次施測于

名學(xué)生，時(shí)間間隔為半年，結(jié)果如表所示，求該測驗(yàn)的重

再測信度要考慮時(shí)間間隔的問題。到底多長合適呢？一般來說，無論對于那種被試，初測與再測的間隔最好不要超

用兩個(gè)平行（等值）的測驗(yàn)對同一組被試施測，得到兩組測驗(yàn)分?jǐn)?shù)，求這兩組測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)，這就是復(fù)本信

）被試易出現(xiàn)疲勞失去積極性等反應(yīng)，還會出現(xiàn)遷移。這些稱為順序效應(yīng)，為了抵消順序效應(yīng)，可隨機(jī)分配一半

等值穩(wěn)定性系數(shù)是用兩個(gè)平行的（等值的）測驗(yàn)，間隔適當(dāng)時(shí)距施測于同一組被試得到兩組測驗(yàn)分?jǐn)?shù)，求這兩組測

等值穩(wěn)定性系數(shù)也是采用復(fù)本對被試施測，但等值性系數(shù)的測驗(yàn)要求兩次測驗(yàn)的時(shí)間間隔盡可能短，而計(jì)算等值穩(wěn)利用一次測驗(yàn)所獲得的資料來計(jì)算信度系數(shù)。這樣計(jì)算出來的信度系數(shù)反應(yīng)的是測驗(yàn)內(nèi)部的一致性，即測驗(yàn)項(xiàng)目的分半信度（

分半信度就是將測驗(yàn)題目分成等值的兩半，分半求出量表題目的總分，再計(jì)算兩部分半的方法很多，常見的方法是把一個(gè)量表按題目番號分為兩半，一半是奇數(shù)題，另一半數(shù)偶數(shù)題。求出每個(gè)人的奇數(shù)題的總得分和偶數(shù)題的總得分，然后求出奇數(shù)題總得分和偶數(shù)題總得分的相關(guān)系數(shù)，最后對相關(guān)系數(shù)進(jìn)行校Spearman-Brown

采用斯皮爾曼－布朗（Spearman-Brown）公式進(jìn)行校正時(shí)，假定兩半測驗(yàn)等值，亦即兩半測驗(yàn)具有相同的平均數(shù)

：有一個(gè)由

題構(gòu)成的量表施測于

個(gè)高三學(xué)生。測驗(yàn)一次后，應(yīng)試者即畢業(yè)離?！，F(xiàn)在怎樣評介測驗(yàn)結(jié)果X1X2），見表

）在使用斯皮爾曼－布朗公式時(shí)要求全體被試在兩半測驗(yàn)上的得分的變異數(shù)相等。當(dāng)一個(gè)測驗(yàn)不宜分成對等的兩）當(dāng)試卷中存在任選題時(shí)，不宜采用分半法。速度測驗(yàn)也不宜采用分半法。因?yàn)樗俣葴y驗(yàn)中試題的難度低，被試）將一個(gè)測驗(yàn)分成兩半的方法很多（如，按題號的奇偶性分半按題目的難度分半按題目的內(nèi)容分半等），因此，分半法實(shí)際上是對測驗(yàn)內(nèi)部一致性的一個(gè)粗略估計(jì)。但對于同一個(gè)測驗(yàn)分半的方法是很多的，而且用不同的分半方法求出的分半信度都不一樣，因此分半信度不是最好的內(nèi)部一致性的估計(jì)。為了彌補(bǔ)分半法的不足，可以采用其它

庫德（）理查遜（）針對分半法的不足，提出以項(xiàng)目統(tǒng)計(jì)量為轉(zhuǎn)移，利用項(xiàng)目統(tǒng)計(jì)量來計(jì)算信度。

式中

表示構(gòu)成測驗(yàn)的題目數(shù)，

為通過第

題的人數(shù)比例，

為未通過第

題的人數(shù)比例，為測驗(yàn)總分的變

庫德－理查遜公式只適用于兩級記分的測驗(yàn)，而對多級記分的測驗(yàn)，則可以采用克倫巴赫（）的α系數(shù)，

隨機(jī)抽取部分試卷，由兩個(gè)或多個(gè)評分者獨(dú)立按評分標(biāo)準(zhǔn)打分，然后求其間的相關(guān)，所得的相關(guān)系數(shù)即為評分者信

：甲乙兩位教師評閱

份試卷，他們對每一試卷各自所評的分?jǐn)?shù)列入下表

，問這兩位教師評分的一致性如

。求六位

各種方法具有不同的意義，每一種信度系數(shù)不能代替其他的信度系數(shù)，所以編制或使用測驗(yàn)時(shí)，應(yīng)該盡可能收集各

中看出，一個(gè)測驗(yàn)的誤差變異主要來自主試施測環(huán)境評分的客觀性被試等因素，當(dāng)除被試外的另一些因素固定后，由于信度系數(shù)與被試團(tuán)體的異質(zhì)性有關(guān)，因此，如果一本測驗(yàn)手冊中，所報(bào)告的信度系數(shù)是從全體中小學(xué)生的樣本中得到的，我們不能認(rèn)為把該測驗(yàn)用于小學(xué)五年級的團(tuán)體時(shí)也能得到同樣高的信度。當(dāng)一個(gè)測驗(yàn)用于比常模更同質(zhì)團(tuán)體異質(zhì)性不同，分?jǐn)?shù)的標(biāo)準(zhǔn)差亦不同。當(dāng)將測驗(yàn)用于標(biāo)準(zhǔn)差不同的團(tuán)體時(shí)，可用下面的公式（克萊公式）推算出式中

為信度系數(shù)已知的分布的標(biāo)準(zhǔn)差，Sn

為信度系數(shù)未知的分布的標(biāo)準(zhǔn)差，

為原團(tuán)體的信度，

為異質(zhì)程

：一記憶力測驗(yàn)實(shí)施于某市全體初中生，其分?jǐn)?shù)的標(biāo)準(zhǔn)差為

，信度系數(shù)為

，若將該測驗(yàn)施測于初二年

由于信度系數(shù)與被試樣本的異質(zhì)程度有關(guān)，因此，在編制測驗(yàn)時(shí)，應(yīng)把常模團(tuán)體按年齡性別文化程度職業(yè)愛好等分測驗(yàn)的長度，即題目的數(shù)量，也是影響信度系數(shù)的一個(gè)因素。一般說來，在一個(gè)測驗(yàn)中增加同質(zhì)的題目，可以使信

由表

可以看出，增加題目數(shù)量可以提高信度，但并非多多益善。測驗(yàn)過長是得不償失的：（）測驗(yàn)過長，編制。（

如果測驗(yàn)太難，分?jǐn)?shù)集中在低分段，如果測驗(yàn)太易，分?jǐn)?shù)分布集中在高分段，這樣都使分?jǐn)?shù)分布的范圍變窄，從而當(dāng)測驗(yàn)題目形式為選擇題時(shí)，測驗(yàn)太難，受測者會對許多題目做隨機(jī)反應(yīng)，分?jǐn)?shù)的差別將主要取決于隨機(jī)誤差，因

個(gè)學(xué)生進(jìn)行某種測驗(yàn)，得分分別為

。為了考察這個(gè)測驗(yàn)的信度，在

天后用原量表再次測驗(yàn)，得

人參加的一項(xiàng)測驗(yàn)，本擬再測一次以估計(jì)信度，但因?qū)W生畢業(yè)離校，無法再測，現(xiàn)把各人奇數(shù)題得分和偶數(shù)

已知某態(tài)度量表有

道題，被試在各題上得分的方差分別是

，測驗(yàn)總分的方差為

效度是指測量的有效性，一個(gè)測驗(yàn)是否達(dá)到了測驗(yàn)?zāi)康模_地測量了所要測量的心理特質(zhì)的程度。在測量理論和信度一樣，這個(gè)效度的概念也是理論上構(gòu)想的概念。不可能通過這個(gè)公式計(jì)算得到，我們只能靠已有資料對效度

SI2

可以看出，當(dāng)隨機(jī)誤差的變異數(shù)減小時(shí)，真實(shí)分?jǐn)?shù)的變異數(shù)增加，測驗(yàn)信度隨之提高。信度的提高只給有效變異數(shù)的增加提供了可能。至于是否能提高效度，還要看系統(tǒng)誤差的變異數(shù)的大小?？梢姡哦雀卟灰欢ㄐФ雀?。但一個(gè)測驗(yàn)要想效度高，真分?jǐn)?shù)的變異數(shù)必須占較大的比重，即測驗(yàn)的信度必須高。因此，信度高是效度高的根據(jù)信度和效度的定義（）可以得到，這就是說，一個(gè)測驗(yàn)的效度總是受它的信度的制約，信度系數(shù)考驗(yàn)效度的方法很多，每種方法側(cè)重的問題不同，名稱也隨之而異。美國心理學(xué)會在

年所發(fā)行的《教育和心理

），

如果把所有的內(nèi)容視為一個(gè)總體，那么測驗(yàn)項(xiàng)目可以視為一個(gè)樣本，這個(gè)樣本要具有代表性，這個(gè)樣本能夠代表總確定所要測量的全部內(nèi)容范圍。比如要考察某一學(xué)科測驗(yàn)是否有效度，就要根據(jù)教材和教學(xué)大綱列出這門課程的根據(jù)教育目標(biāo)的要求，將測驗(yàn)?zāi)康木唧w化為不同層次的測驗(yàn)?zāi)繕?biāo)。教育測驗(yàn)?zāi)繕?biāo)一般采用布魯姆教育目標(biāo)分類學(xué)

對測題進(jìn)行必要的修改，直至多數(shù)專家對測驗(yàn)的內(nèi)容效度感到滿意為止。最后，報(bào)告專家評定的情況，這個(gè)評定克倫巴赫認(rèn)為，內(nèi)容效度可由一組被試在取自同樣內(nèi)容范圍的兩個(gè)測驗(yàn)復(fù)本上得分的相關(guān)來作數(shù)量上的估計(jì)。當(dāng)相在教學(xué)或訓(xùn)練之前施測某一測驗(yàn)，經(jīng)過一段時(shí)間的學(xué)習(xí)或訓(xùn)練后再次施測，如果后測的成績顯著高于前測，則可以讓本專業(yè)的專家對取樣的代表性進(jìn)行分析，評價(jià)某一測驗(yàn)項(xiàng)目是否具有代表性，統(tǒng)計(jì)出專家中認(rèn)為某一項(xiàng)目能代表

根據(jù)內(nèi)容效度比，刪除內(nèi)容效度比低的項(xiàng)目。計(jì)算全部項(xiàng)目的內(nèi)容效度比的平均數(shù)，作為內(nèi)容效度的指標(biāo)。

雖然兩者都是對測驗(yàn)內(nèi)容作出的主觀判斷，但判斷的標(biāo)準(zhǔn)不同。前者只考慮測驗(yàn)項(xiàng)目與測驗(yàn)?zāi)康闹g的明顯的直接表面效度不是效度的客觀指標(biāo)，不能保證測驗(yàn)的正確性，但能對受測者的動機(jī)產(chǎn)生影響，因而也會影響到測驗(yàn)的效編制測驗(yàn)時(shí)應(yīng)根據(jù)編制測驗(yàn)的要求提高或降低表面效度，如人格測驗(yàn)，表面效度應(yīng)該低，使被試看不出來，從而讓內(nèi)容效度適合于測驗(yàn)所要測量的內(nèi)容總體能夠明確界定的情況。因此尤其適合對教育測驗(yàn)的效度的考察。內(nèi)容效度對各種用于人員選拔和安置的職業(yè)測驗(yàn)也是適用的。職業(yè)測驗(yàn)關(guān)心的是被試是否具有從事某項(xiàng)職業(yè)的知識技能等，內(nèi)容效度對能力傾向測驗(yàn)和人格測驗(yàn)不是很合適，因?yàn)樗鼈円獪y量的往往是較抽象的特質(zhì)，其范圍難以明確界定，一構(gòu)想效度（

結(jié)構(gòu)：心理學(xué)理論中所涉及的抽象而假設(shè)性的概念構(gòu)想效度是指一個(gè)測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度。也就是測驗(yàn)分?jǐn)?shù)能夠說明某一理論概念或特質(zhì)的程度。考察構(gòu)想效度的宗旨是要回答下面一些問題：一個(gè)測驗(yàn)測量的是什么心理構(gòu)想？對這個(gè)構(gòu)想測得有多好？欲建立具有構(gòu)想效度的測驗(yàn)，必須先從某一構(gòu)想的理論出發(fā)，導(dǎo)出各項(xiàng)關(guān)于心理特質(zhì)或行為的基本假設(shè)，根據(jù)這些如，從一般的智力理論，可提出四項(xiàng)主要的假設(shè)：（）智力隨年齡的增長而增長；（）智商是相對穩(wěn)定的；（

在施行個(gè)別測驗(yàn)時(shí)，要求被試邊想邊說，從而可以分析被試解題時(shí)的心理過程，以核實(shí)測驗(yàn)是否真正測到了所要測這種方法是以測驗(yàn)的內(nèi)在一致性系數(shù)（如

，以及系數(shù)等）為指標(biāo)，判斷測驗(yàn)測的是單一特質(zhì)還

如，斯坦福－比奈量表和韋氏量表是公認(rèn)的效度較高的智力量表，后人編制的智力測驗(yàn)常計(jì)算與這些量表的測驗(yàn)分

一個(gè)有效的測驗(yàn)不僅應(yīng)與其他測同一構(gòu)想的測驗(yàn)有關(guān)，而且還必須與測量不同構(gòu)想的測驗(yàn)無關(guān)。用此種方法確定的因素效度（

）：通過對一組測驗(yàn)進(jìn)行因素分析，找到影響測驗(yàn)分?jǐn)?shù)的共同因素，每個(gè)測驗(yàn)在共同因如，舉行兩場考試，使被試相信一場考試關(guān)系重大，另一場考試無關(guān)緊要，在考試前進(jìn)行焦慮測驗(yàn)，看被試的焦慮所謂效標(biāo)關(guān)聯(lián)效度，是指測驗(yàn)分?jǐn)?shù)與某一外部效標(biāo)間的一致性程度，即測驗(yàn)結(jié)果能夠代表或預(yù)測效標(biāo)行為的有效性

例如：大學(xué)入學(xué)考試的觀念效標(biāo)通常是大學(xué)學(xué)習(xí)成功，它的一種常用的效標(biāo)測量便是大學(xué)頭兩年或一年相關(guān)學(xué)科在保證有效性的前提下，效標(biāo)測量必須盡可能簡單省時(shí)花費(fèi)少。三效標(biāo)效標(biāo)關(guān)聯(lián)效度一般可以通過統(tǒng)計(jì)分析得到一個(gè)數(shù)量指標(biāo)，因此有人將它稱為統(tǒng)計(jì)效度。常用的估計(jì)方法有相關(guān)法分相關(guān)法是一種最常用的計(jì)算效標(biāo)關(guān)聯(lián)效度的方法，測驗(yàn)分?jǐn)?shù)與效標(biāo)間的相關(guān)系數(shù)稱為效標(biāo)系數(shù)。測驗(yàn)分?jǐn)?shù)與效標(biāo)分

二列相關(guān)適用的情況是，測驗(yàn)分?jǐn)?shù)和效標(biāo)的總體分布均為正態(tài)，測驗(yàn)分?jǐn)?shù)為連續(xù)變量，效標(biāo)測量被人為地分成兩根據(jù)受測團(tuán)體在效標(biāo)上的行為表現(xiàn)，將他們分成不同的組別，看不同組別的測驗(yàn)分?jǐn)?shù)是否存在顯著差異。若測驗(yàn)分組間平均數(shù)差異在統(tǒng)計(jì)上的顯著性取決于團(tuán)體的大小。當(dāng)團(tuán)體較大時(shí)，平均數(shù)的小差異在統(tǒng)計(jì)上也會變得有意義，重疊量有兩種計(jì)算方法。一種方法是：計(jì)算出成功組中低于失敗組平均數(shù)的人數(shù)，再計(jì)算出失敗組超過成功組平均因此，研究者在提供效度資料時(shí)，應(yīng)該把平均數(shù)標(biāo)準(zhǔn)差統(tǒng)計(jì)上的顯著性重疊量等一起報(bào)告，以防止實(shí)際上并無差總命中率指根據(jù)測驗(yàn)選出的人當(dāng)中工作合格的人數(shù)，以及根據(jù)測驗(yàn)淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之正命中率指用測驗(yàn)選出的人中合格者所占的比例。（只關(guān)心被選者中合格者有多少，不關(guān)心被淘汰者中是否有合格

提高測驗(yàn)效度對各種心理測驗(yàn)都非常重要，但效度系數(shù)要達(dá)到多大才符合要求呢？這要根據(jù)各種測驗(yàn)的具體情況來

相同科目的標(biāo)準(zhǔn)測驗(yàn)成績與教師對學(xué)生名次的排列之間的相關(guān)系數(shù)一般應(yīng)達(dá)到

之間，這是因?yàn)樵跍y驗(yàn)的

對效度系數(shù)大小的要求，也受原測驗(yàn)與獲得效標(biāo)的測驗(yàn)之間的相似性的制約。若兩者不相似，則效度系數(shù)偏低；若相似，則效度系數(shù)會高些。所以，有的測驗(yàn)效度系數(shù)達(dá)到

即已符合要求，有的卻要大到

才能認(rèn)為是

，某一次數(shù)學(xué)測驗(yàn)，

名學(xué)生中，高分組和低分組各有

人。其中高分組答對第一題的共有

人，低分組答

在是非題和選擇題中，由于允許猜測，被選答案的數(shù)目越少，機(jī)遇的作用越大，就越不能反映項(xiàng)目的真實(shí)難度。為

，一個(gè)五擇一的測題，未校正前的難度指數(shù)為

，一個(gè)四擇一的測題，未校正前的難度指數(shù)為

，請問校前面我們計(jì)算的難度是用百分比來表示難度。百分量表是等級量表，不是等距量表，缺乏相等的單位，只能表示事物之間位次的關(guān)系，不能用來對項(xiàng)目之間的難度作精確的比較，也不能由各試卷的難度來計(jì)算整份試卷的平均難

先將某題的通過率視作正態(tài)曲線下的面積，然后查正態(tài)分布表找出正態(tài)曲線右側(cè)的面積所對應(yīng)的

分?jǐn)?shù)。這一

delta

標(biāo)準(zhǔn)正態(tài)分布的全距一般包括

個(gè)標(biāo)準(zhǔn)差的距離，即從

到＋，當(dāng)

時(shí)，表明通過率達(dá)到

％，這種情況極少發(fā)生，此時(shí)Δ＝；當(dāng)

時(shí)，表明通過率為

％，也是不大可能出現(xiàn)的情況，此時(shí)Δ＝。Δ的取值范圍

當(dāng)測驗(yàn)的分?jǐn)?shù)（預(yù)試結(jié)果）呈偏態(tài)分布時(shí)，可以通過改變項(xiàng)目難度的比例對測驗(yàn)的難度加以調(diào)整，通常，如果被試過難和過易的測驗(yàn)，會使測驗(yàn)分?jǐn)?shù)的分布相對集中于高分段和低分段，從而縮小分?jǐn)?shù)的分布范圍。分?jǐn)?shù)分布范圍影響信度，范圍越廣，信度越高，分?jǐn)?shù)分布范圍越小，信度越小。

年，艾伯爾用三套測驗(yàn)進(jìn)行研究，發(fā)現(xiàn)當(dāng)難度

總結(jié)：一般能力測驗(yàn)和成就測驗(yàn)的平均難度在

左右為宜。出現(xiàn)偏態(tài)情況時(shí)，宜對項(xiàng)目進(jìn)行調(diào)整，以使測驗(yàn)分?jǐn)?shù)標(biāo)考試屬于負(fù)偏態(tài)分布。第二節(jié)

），

這是項(xiàng)目區(qū)分度分析的一種簡便方法，比較測驗(yàn)總分高分組和低分組在某一項(xiàng)目上的通過率的差異，作為項(xiàng)目鑒別其中，

為鑒別指數(shù)，

為高分組在該項(xiàng)目上的通過率，

為低分組在該項(xiàng)目上的通過率。

值越大，項(xiàng)目的區(qū)

，某高中物理測驗(yàn)，被試共

人，高分組和低分組各取總?cè)藬?shù)的

％，則兩組各為

人，第五題高分組

兩個(gè)變量都是正態(tài)連續(xù)變量，其中一個(gè)變量被人為地分成兩類。測驗(yàn)總分或效標(biāo)分?jǐn)?shù)某個(gè)測驗(yàn)項(xiàng)目的分?jǐn)?shù)都是連續(xù)變量，其中一個(gè)變量被人為地分成兩類，可以是測驗(yàn)總分或效標(biāo)分?jǐn)?shù)被人為地分成兩類，也可以是某個(gè)項(xiàng)目的分?jǐn)?shù)

，下表是某學(xué)校的

名學(xué)生在一次語文測驗(yàn)中的總分和作文題的得分情況，作文題被人為地分成兩種情況，

適用資料：兩列數(shù)據(jù)都是測量的數(shù)據(jù)，具有連續(xù)性；兩列變量各自總體的分布都呈正態(tài)，即正態(tài)雙變量。求項(xiàng)目分

練習(xí)

：下表是

個(gè)學(xué)生一次測驗(yàn)的分?jǐn)?shù)，試計(jì)算第三題的難度；若第三題是是非題，答案分對和錯(cuò)，請計(jì)算其區(qū)練習(xí)

：下表是某大學(xué)學(xué)生的一次普通心理學(xué)期末考試的成績總分和某一論述題的得分（滿分為

-0.44——11.24

從此表我們可以看出，難度越接近于

，項(xiàng)目潛在的區(qū)分度越大，而難度越接近

時(shí)，項(xiàng)目的潛在區(qū)分度如果我們想使我們的所測驗(yàn)到的心理特質(zhì)的分?jǐn)?shù)分布呈正態(tài)，我們考慮難度選擇項(xiàng)目時(shí)，應(yīng)使項(xiàng)目的難度分布也呈

項(xiàng)目的難度分布也呈正態(tài)分布，特別難和特別容易的題目少一些，中等難度的項(xiàng)目多一些，在編制測驗(yàn)時(shí)一般要求項(xiàng)目的難度在

之間，而所有項(xiàng)目的平均難度要保持在

左右。當(dāng)題目之間正相關(guān)時(shí)，題目難度值應(yīng)分

一般能力測驗(yàn)和成就測驗(yàn)的平均難度在

左右為宜。出現(xiàn)偏態(tài)情況時(shí)，宜對項(xiàng)目進(jìn)行調(diào)整，以使測驗(yàn)分?jǐn)?shù)的分布接近正態(tài)。但項(xiàng)目難度還與測驗(yàn)的目的有關(guān)，正偏態(tài)分布適合于篩選性測驗(yàn)。此時(shí)項(xiàng)目的難度和整個(gè)測驗(yàn)的難度應(yīng)

埃貝爾（）的標(biāo)準(zhǔn)是針對鑒別指數(shù)的，如果區(qū)分度是用相關(guān)系數(shù)計(jì)算得來的，則挑選項(xiàng)目的最低標(biāo)準(zhǔn)是不低于）如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇，說明該項(xiàng)目不具迷惑性，錯(cuò)得過于明顯，一般來說，除非有

％以上的）如果高分組被試的選擇集中在兩個(gè)答案上，二者選擇率相近，說明該題可能有兩個(gè)正確答案或另一個(gè)答案也有）如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)被選答案的人數(shù)相等，則說明題目過難或題意不清，使得被試無法

確定每一類行為的項(xiàng)目比例，通常是一張雙向細(xì)目表，指出測驗(yàn)所包含的內(nèi)容和要測定的各種技能，以及對每一個(gè)

混合螺旋式：先將各類項(xiàng)目依難度分成若干不同的層次，再將不同性質(zhì)的項(xiàng)目予以組合，作交叉式的排列，其難度

西方國家，多種學(xué)業(yè)能力傾向測驗(yàn)在學(xué)校情景中被廣泛使用

；我國在學(xué)業(yè)能力傾向測驗(yàn)方面的研究和應(yīng)用還相當(dāng)缺

以教師等級評定和成就測驗(yàn)為效標(biāo)的考驗(yàn)表明，本測驗(yàn)具有較高的同時(shí)效度；以期末成績?yōu)樾?biāo)的考驗(yàn)表明，本測

心理測驗(yàn)的使用一般包括這么幾個(gè)方面：選擇測驗(yàn)施測評分測驗(yàn)結(jié)果的解釋和報(bào)告將測驗(yàn)結(jié)果用于指導(dǎo)學(xué)習(xí)和生活主試必須具有操作心理測驗(yàn)的專業(yè)技能。一般來說，團(tuán)體測驗(yàn)較容易掌握，只要在測驗(yàn)前熟悉量表，對量表的指導(dǎo)語注意事項(xiàng)評分解釋等熟練掌握，實(shí)施是不困難的。但對于個(gè)別測驗(yàn)如韋氏量表投射測驗(yàn)如羅夏墨跡測驗(yàn)等掌握較難，必須經(jīng)過反復(fù)的練習(xí)。還有一點(diǎn)必須指出的是已經(jīng)會使用一種測驗(yàn)的主試，不一定會使用另一個(gè)測驗(yàn)，因此主受測者的年齡文化背景是否殘疾等因素都需要進(jìn)行考慮。如，如果是小學(xué)三年級以下的兒童則不適合團(tuán)體測驗(yàn)，適選擇測驗(yàn)時(shí)要看看測驗(yàn)是否經(jīng)過標(biāo)準(zhǔn)化，它的信度和效度如何，常模樣本是否符合你的測試對象，如常模樣本是中學(xué)生，那么就不適合運(yùn)用于小學(xué)生，如果是城市常模，則不適合運(yùn)用于農(nóng)村，因?yàn)槿狈Ρ容^的樣本；測試資料如常事先應(yīng)通知被試，使被試知道測驗(yàn)的時(shí)間地點(diǎn)內(nèi)容范圍試題類型等，使被試對測驗(yàn)有一定的心理準(zhǔn)備，可以及時(shí)調(diào)）主試必須熟悉測試的具體程序。主試在測驗(yàn)前必須仔細(xì)閱讀測驗(yàn)指導(dǎo)手冊，測驗(yàn)的施測細(xì)則，熟練記住測驗(yàn)的步驟，如何記分記時(shí)，在測驗(yàn)前可以先自己演示一遍，必須保證準(zhǔn)確無誤。尤其是個(gè)別測驗(yàn)，一般對施測程序較為）主試必須做好應(yīng)付突發(fā)事件及被試提問的心理準(zhǔn)備。主試對施測過程中可能會發(fā)生的突發(fā)事件應(yīng)該有所預(yù)測并做好相應(yīng)的心理準(zhǔn)備，尤其是對于團(tuán)體測驗(yàn)，由于人數(shù)較多，可能會出現(xiàn)一些突發(fā)事件，主試必須做好從容應(yīng)付的測驗(yàn)材料包括測驗(yàn)題目答卷紙記分鍵指導(dǎo)書紙筆記時(shí)器有關(guān)器具等必需的材料和工具，測驗(yàn)前主試必須仔細(xì)檢查核心理測驗(yàn)對環(huán)境要求較高，許多研究表明，智力測驗(yàn)在炎熱的夏天得到的結(jié)果和正常天氣得到的結(jié)果是有差異的。所以施測前，主試要選擇好環(huán)境，包括測驗(yàn)時(shí)的光線通風(fēng)等情況。不過去中小學(xué)的測驗(yàn)一般都是在他們原來的教室

在施測過程中，主試和被試之間應(yīng)當(dāng)建立良好的協(xié)調(diào)關(guān)系，即一種友好合作的并能促使被試最大限度地做好測驗(yàn)的一種關(guān)系。例如，在能力測驗(yàn)中，要讓被試最大限度地發(fā)揮，表現(xiàn)出自己的能力；人格測驗(yàn)中，要讓被試誠實(shí)地回由于測驗(yàn)的性質(zhì)和被試的年齡及其它情況不同，建立協(xié)調(diào)關(guān)系的方法也應(yīng)該有所不同，對于幼兒園兒童，主試應(yīng)以友好親切的態(tài)度對待幼兒，消除他們的陌生感和恐懼心，對待他們要有耐心，讓他們慢慢熟悉環(huán)境，測驗(yàn)時(shí)也是采用個(gè)別測驗(yàn)，并且盡量生動有趣。對于年齡大一點(diǎn)的兒童，可以通過競爭來提高他們的測驗(yàn)興趣，對于成人，則要主試應(yīng)嚴(yán)格按照測驗(yàn)指導(dǎo)手冊提供的評分規(guī)則對被試的測驗(yàn)結(jié)果進(jìn)行評分，評出被試在每個(gè)項(xiàng)目上的得分，然后

）主試一般不要將測驗(yàn)分?jǐn)?shù)告訴被試及相關(guān)人員，告訴的應(yīng)該是測驗(yàn)結(jié)果的解釋。因?yàn)?，心理測驗(yàn)尚不完善，測驗(yàn)結(jié)果也只能是一個(gè)參考，而外行的被試往往對測驗(yàn)的科學(xué)性有過高的估計(jì)，這樣如果把測驗(yàn)得到的分?jǐn)?shù)告訴被試

Aptitude

是一種認(rèn)知或心理運(yùn)動的測量，它用來預(yù)測一個(gè)人在某一科目（代數(shù)外語音樂）某一工作（機(jī)械工速記員焊接

提供能力剖面圖：測驗(yàn)結(jié)果提供若干個(gè)分?jǐn)?shù)，每個(gè)分?jǐn)?shù)既代表被試在所測能力傾向上的相對位置水平，又能代表被

Scholastic

Assessment

Aptitude

美國各大學(xué)申請入學(xué)的重要參考條件之一分為

兩部分，即推理測驗(yàn)（reasoning

test）和學(xué)科測驗(yàn)

testⅡ主要測量考生在某一學(xué)科的知識和運(yùn)用這些知識的能力，共有

個(gè)主題科目，各自獨(dú)立，包括：英文數(shù)學(xué)歷

主要測驗(yàn)考生的英文程度和數(shù)學(xué)推理能力，作為預(yù)測考生進(jìn)入大學(xué)后成績的參考資料，同時(shí)也可作為比較不

最初由美國心理公司

等于

年出版發(fā)行，

年又進(jìn)行了修訂，是應(yīng)用最廣

(Industrial)

Aptitude

）；

(Armed)用于軍隊(duì)的選拔和分類。如：

Aptitude

ASVAB 供所有軍種使用，含以下

個(gè)分測驗(yàn)：算術(shù)推理數(shù)字運(yùn)算文章理解字詞知識編碼速度一般科學(xué)數(shù)學(xué)知識電子知識機(jī)械理解自動化及工廠知

我國的行政職業(yè)能力考試用于錄用機(jī)關(guān)工作人員，內(nèi)容包括數(shù)量關(guān)系判斷推理常識判斷言語理解與表達(dá)資料分析

機(jī)械裝配和靈活性測驗(yàn)：要求受測者根據(jù)形狀將物體插入板上相應(yīng)的孔中；把螺帽擰在螺絲上；把大頭針放進(jìn)指定

Art

16PF

-(3A+2G)16PF

2(11-A)+2B+E+2(11-F)+H+2I+M+(11-N)+Q1+2Q2

B+G+Q3+(11-F)

F-

測驗(yàn)實(shí)施以后，將受測者的反應(yīng)與答案作比較即可得到每個(gè)人在測驗(yàn)上的分?jǐn)?shù)。這種直接從測驗(yàn)上得到的分?jǐn)?shù)叫做為了使原始分?jǐn)?shù)有意義，也為了不同的原始分?jǐn)?shù)可以相互比較，必須把它們轉(zhuǎn)換成具有一定的參照點(diǎn)和單位的測驗(yàn) 常模參照分?jǐn)?shù)是把受測者的成績與具有某種特征的人所組成的有關(guān)團(tuán)體作比較，根據(jù)一個(gè)人在該團(tuán)體內(nèi)的相對位置在制定常模時(shí)，必須清楚地說明所要測量的群體的性質(zhì)和特征。可以用來區(qū)分和限定群體的變量是很多的，如年齡

當(dāng)一個(gè)群體過大，樣本難以充分代表總體時(shí)，可根據(jù)實(shí)際取樣的范圍，重新界定測驗(yàn)所適用的群體，即使一個(gè)有代

所謂大小適當(dāng)并沒有嚴(yán)格的規(guī)定。一般說來，取樣誤差與樣本大小成反比，所以，在其他條件相同的情況下，樣本越大越好，但也要考慮具體條件（如人力物力）的限制。有時(shí)從一個(gè)較小的但具有代表性的樣本中所得到的分?jǐn)?shù)比來自較大的但定義模糊的團(tuán)體中得到的分?jǐn)?shù)還要可靠。不過，在有代表性的前提下，樣本應(yīng)該大到足以提供穩(wěn)定由于教育時(shí)代變遷等多種因素的影響，幾年前所編制的常?？赡懿辉龠m合，因此常模必須定期地修訂，要以批判的測驗(yàn)手冊上所列的常模通常是為典型團(tuán)體建立的，不一定適合使用者的具體情況。對此問題的一個(gè)解決辦法是為每

抽簽：把總體中的每一個(gè)個(gè)體編上號并作出簽，充分混合后從中隨機(jī)抽取一部分，這部分簽所對應(yīng)的個(gè)體就組成

抽樣方法比簡單隨機(jī)取樣簡便易行，而且它能比較均勻地抽到總體中各個(gè)部分的個(gè)體，樣本的代表性比簡單隨機(jī)取如，前面的調(diào)查，如果男生的編

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

教育測量與評價(jià)復(fù)習(xí)高效筆記

文檔簡介

溫馨提示

最新文檔

評論

教育測量與評價(jià)復(fù)習(xí)高效筆記

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔