教育測量與評價(jià)復(fù)習(xí)高效筆記_第1頁
教育測量與評價(jià)復(fù)習(xí)高效筆記_第2頁
教育測量與評價(jià)復(fù)習(xí)高效筆記_第3頁
教育測量與評價(jià)復(fù)習(xí)高效筆記_第4頁
教育測量與評價(jià)復(fù)習(xí)高效筆記_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

the

Measurement

教育測量與評價(jià)主要是研究對教育現(xiàn)象進(jìn)行測量和價(jià)值判斷的理論方法和技術(shù)。本門課程分為兩大部分:第一教育在課程設(shè)置和學(xué)科建設(shè)中,教育測量與評價(jià)可以看成是測量學(xué)和評價(jià)學(xué)內(nèi)容的整合,而且側(cè)重于教育測量,是綜合性教育科學(xué)。又可以看成兼容了教育統(tǒng)計(jì)教育測量心理測量教育評價(jià)教育評估教育督導(dǎo)甚至教育科學(xué)研究方法在內(nèi)在教育學(xué)科分類中,教育測量與評價(jià)屬于研究如何運(yùn)用方法分析教育活動。總之教育測量學(xué)是應(yīng)用性學(xué)科,又是綜

教育評價(jià)的應(yīng)用,包括課程評價(jià)(課程大綱教學(xué)設(shè)計(jì)等)學(xué)生評價(jià)(老師的評價(jià)學(xué)生自己的評價(jià)同學(xué)的評價(jià)等)

第三許多學(xué)術(shù)團(tuán)體都加盟對教育評價(jià)的研究,成立了一些全國性的教育評價(jià)協(xié)會:全國教育測量委員會全國教育進(jìn)

年在日內(nèi)瓦成立,當(dāng)時(shí)有

個(gè)國家參加。其宗旨是幫助世界各地的教育機(jī)構(gòu)通過發(fā)展和應(yīng)用評價(jià)技術(shù)來提高

在教育系統(tǒng)運(yùn)轉(zhuǎn)過程中,除了對教育效果(輸出)要進(jìn)行測量與評價(jià)外,還要針對影響教育效果的諸因素(輸入)

學(xué)校教育考試制度和評價(jià)制度是教育制度的一個(gè)組成部分,但教育考試和教育評價(jià)具有很強(qiáng)的導(dǎo)向功能。英國

教師需要對學(xué)生的性向成就態(tài)度興趣潛能及發(fā)展等作出一系列決策和判斷,需要采用教育測量與評價(jià)多種方法,以手段不再是唯一的書面考試,而是測量與非測量的一整套評價(jià)技術(shù)。目的不再局限于給學(xué)生分等級排名次,而是發(fā)測量和評價(jià)的指導(dǎo)思想非常重要。指導(dǎo)思想是為了創(chuàng)造適合學(xué)生發(fā)展的教育環(huán)境,而不僅僅是為了選拔適合精英教

在許多經(jīng)濟(jì)發(fā)達(dá)的國家和地區(qū),雖然教師教育模式不一定相同,但對所有想當(dāng)教師的學(xué)生至少要學(xué)習(xí)十門左右的教

第一單位。單位是測量的基本要求,具有明確的意義和相等的價(jià)值;教育測量的單位常常是,難以達(dá)到這個(gè)要第三量表(具):能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體。確定了測量單位和參照點(diǎn)并具有取值系統(tǒng)的測量工

)教育測量的特點(diǎn):間接性和推斷性;測量對象的模糊性和測量誤差的不可避免性;量表具有多樣性,結(jié)果具有任何一個(gè)測量必須具有明確的目的,教育測量必須為實(shí)現(xiàn)教育目的而服務(wù)。不能脫離教育目的和教材的要求,任意

教育評價(jià)的概念。當(dāng)把評價(jià)一詞特別地用于學(xué)校教育領(lǐng)域或課堂教學(xué)情境時(shí),在一些情況下,評價(jià)就是教育評價(jià)是為了確定學(xué)生達(dá)到教學(xué)目標(biāo)的程度,收集分析和解釋信息的系統(tǒng)過程;評價(jià)包括對學(xué)生的定量描述和定性描評價(jià)是一種劃定獲取和提供敘述性和判斷性信息的過程。他認(rèn)為:評價(jià)最重要的意圖不是為了證明,而是為了改評價(jià)是與教育的目標(biāo)和價(jià)值有明確關(guān)系的概念,是按照教育目標(biāo)和價(jià)值觀對學(xué)生的學(xué)習(xí)成果及教育計(jì)劃的效果等進(jìn)在《教育評價(jià)》一書中對評價(jià)作了兩種解釋:第一種解釋在本質(zhì)上是針對教育評價(jià)來說的;評價(jià)是系統(tǒng)收集證第二種解釋實(shí)際上是針對教育目標(biāo)分類來說的。教育目標(biāo)分認(rèn)知情感和動作技能三大領(lǐng)域,認(rèn)知領(lǐng)域的教育目標(biāo)又

教育評價(jià)的內(nèi)容既可以是教育計(jì)劃,也可以是課程;既可以學(xué)生的學(xué)習(xí)結(jié)果,也可以是某種教育現(xiàn)象教學(xué)活動教

按照一定的價(jià)值標(biāo)準(zhǔn)和教育目標(biāo),利用測量和非測量的種種方法系統(tǒng)地收集資料信息,對學(xué)生的發(fā)展變化及其影響教育測量與評價(jià)是兩個(gè)不同的概念,教育測量以量化為主要特征的事實(shí)判斷;教育評價(jià)在定性和定量資料基礎(chǔ)上做出的價(jià)值判斷;測量關(guān)心的是數(shù)據(jù)的多少,評價(jià)關(guān)心的是價(jià)值的高低。測量是一種純客觀的過程,是一種單一的活教育評價(jià)與評估既有聯(lián)系又有區(qū)別。第一根據(jù)《

從概念的分析和理解中,我們可以看到教育評價(jià)教育評估和教育測量三個(gè)概念之間是兩兩既有聯(lián)系又有區(qū)別,即交測驗(yàn)是測量的工具,用它能引起人的代表性的行為,以便對人的行為特性或心理特性進(jìn)行測量與評價(jià),是教育測驗(yàn)test廣義的考試泛指人類社會一切測度和甄別人的身心各個(gè)方面之群體或個(gè)體差異的活動。狹義指由主試根據(jù)一定社會的要求,在一定場所,采取一定的方式方法,選擇適當(dāng)?shù)膬?nèi)容,對應(yīng)試者的德學(xué)才識體諸多方面或某方面所進(jìn)行有教育考試是根據(jù)教育內(nèi)容和目標(biāo),選擇有代表性的內(nèi)容與問題,按照一定的方式,對應(yīng)試者的知識技能等進(jìn)行測量

科舉制度就是開科取士,即國家設(shè)立許多科目,通過定期的統(tǒng)一考試選拔人才,這種制度開始于隋煬帝大業(yè)二

中國科舉考試雖然對世界文官考試制度有過重要作用,但我國古代對科舉制度缺乏教育學(xué)心理學(xué)統(tǒng)計(jì)學(xué)哲學(xué)等科學(xué)

桑代克的《精神與社會測量導(dǎo)論》提出假設(shè):無論什么東西,只要存在的,總存在于數(shù)量之中;美國麥柯爾:

心理測驗(yàn)的發(fā)展與應(yīng)用促進(jìn)了教育測量學(xué)的發(fā)展,如

年比納等人發(fā)表的《比納量表》英國斯皮爾曼的能力背景:

年期間,經(jīng)濟(jì)危機(jī)。美國高中學(xué)生人數(shù)大量增加,教學(xué)理論脫離實(shí)際,許多人要求重新協(xié)定高中

其一傳統(tǒng)測驗(yàn)是片面的。其二只是關(guān)注客觀的信度。其三測驗(yàn)是教科書主義。其四對測驗(yàn)或考試的過分依賴必然養(yǎng)課程編制原理和評價(jià)活動原理。確定多元需要的價(jià)值目標(biāo)用行為表達(dá)教育目標(biāo)構(gòu)建合宜的教育情境選擇包括測驗(yàn)在內(nèi)的多種評價(jià)手段對達(dá)標(biāo)程度做出判斷對學(xué)生優(yōu)缺點(diǎn)進(jìn)行分析并提出改建措施修改教育方案,如此循泰勒在八年研究報(bào)告中首次提出了教育評價(jià)的概念,教育評價(jià)在本質(zhì)上是確定課程和教學(xué)大綱在實(shí)際上實(shí)現(xiàn)教雖然受到了批評,但泰勒的行為目標(biāo)評價(jià)模式思想和方法,在當(dāng)今世界教育測量與評價(jià)領(lǐng)域,以及對課程編制和教國內(nèi)外學(xué)者對教育測量與評價(jià)的分類,不僅角度不同,而且看法不一。其中格朗蘭德的分類具有代表性和啟發(fā)

在教學(xué)過程中經(jīng)常實(shí)施的,在性質(zhì)上大致相當(dāng)于現(xiàn)在的中小學(xué)單元測驗(yàn)。形成性測量與評價(jià)對于教師以及學(xué)生的作

對經(jīng)常表現(xiàn)出學(xué)習(xí)困難的學(xué)生所作的測量與評價(jià),它的目的是對個(gè)人的問題行為及其原因進(jìn)行診斷。診斷性多半是

用于教學(xué)結(jié)束后,在性質(zhì)上相當(dāng)于現(xiàn)在學(xué)校中所進(jìn)行的期末考試。其目的有兩個(gè):其一是在教學(xué)目標(biāo)之下,檢查學(xué)

常模參照測量與評價(jià)是將被試水平與測驗(yàn)常模相比較,以評價(jià)被試在團(tuán)體中的相對地位的一種測驗(yàn)與評價(jià)類型。也

將被試的表現(xiàn)與既定的教育目標(biāo)或教育行為標(biāo)準(zhǔn)相比較,以評價(jià)被試在多大程度上達(dá)到該標(biāo)準(zhǔn)。測評和教育目標(biāo)常

被試實(shí)際水平與其自身潛在水平相比較,以評價(jià)被試有無充分發(fā)揮自身潛力為目的。在強(qiáng)調(diào)人性化動態(tài)化和個(gè)別化

目的在于測量與評價(jià)個(gè)人的潛在才能,預(yù)測個(gè)人能力發(fā)展傾向。分為兩種:一是關(guān)于能力傾向測量與評價(jià);一是特

指的是同一主試在同一時(shí)間內(nèi)只能測量一個(gè)被試。主試與被試有更多的交流機(jī)會,對于一些特殊的被試,如幼兒文

指的是同一時(shí)間內(nèi)由一位主試測量多位被試。優(yōu)點(diǎn)是節(jié)省時(shí)間,可以在短時(shí)間內(nèi)收集到大量的數(shù)據(jù),不足是不易有教育測評有許多重要的功能,如評定的功能判斷的功能選拔的功能反饋的功能教育功能導(dǎo)向的功能威懾的功能預(yù)測

在教學(xué)或教育前,教師可以先針對學(xué)生實(shí)施一次測量,用來評價(jià)學(xué)生在學(xué)習(xí)之前已具有的背景知識,以作為有效教

教師可以針對不同學(xué)習(xí)類型的學(xué)習(xí)行為特征,以及不同的認(rèn)知結(jié)構(gòu)缺陷的所在,有針對提出符合個(gè)別需要的補(bǔ)救教

根據(jù)測評結(jié)果,教師可以知道目前的教學(xué)情況,是否需要修正目標(biāo)或改變教學(xué)策略,是否需要改換教材以及教法

教育測量與評價(jià)是根據(jù)教育目標(biāo)進(jìn)行的,通過對現(xiàn)狀與目標(biāo)之間的差距進(jìn)行判斷,能有效地促進(jìn)被測量與評價(jià)的對

利用教育測量與評價(jià),可以全面地掌握教育的各種情況,及時(shí)發(fā)現(xiàn)教育過程中存在的問題,對教育教學(xué)任務(wù)完成的error定義的后半部分從準(zhǔn)確性和一致性兩方面對誤差做了區(qū)分。準(zhǔn)確性和一致性的關(guān)系可以用射擊靶環(huán)來說明。假設(shè)有

心理測量工具往往是一套量表。當(dāng)量表在測出人的某種心理特質(zhì)時(shí),若項(xiàng)目所測的東西與我們所欲測的目的之間出

對于人格測驗(yàn)如果主試沒有講清測驗(yàn)?zāi)康暮统霈F(xiàn)不合適的表情動作,也會使受測者產(chǎn)生焦慮,尤其對于年齡較小的焦慮和作業(yè)成績的關(guān)系呈倒形的

字曲線,適度的焦慮可以提高作業(yè)成績,焦慮水平太高和太低都不利于受測者水有些測驗(yàn)需要第二次應(yīng)用,甚至多次應(yīng)用。比如,在開始一項(xiàng)教學(xué)改革前對學(xué)生的能力和學(xué)習(xí)成績進(jìn)行前測,過半

受測者的疲勞失眠心境等都可以影響測驗(yàn)成績,心理學(xué)研究表明,人的智力情緒體力等都存在著節(jié)律性的變化,生

Classical

真分?jǐn)?shù)的變異可以分成兩個(gè)部分:與測驗(yàn)?zāi)康挠嘘P(guān)的變異(有效的變異數(shù)

)和與測驗(yàn)?zāi)康臒o關(guān)的變

)信度是一組測量分?jǐn)?shù)的特性,不是某個(gè)測量分?jǐn)?shù)的特性。是對一個(gè)人測量多次或?qū)σ粋€(gè)群體進(jìn)行測量得到一組)在不同的情況下,對于不同的樣本,采用不同的方法會得到不同的信度系數(shù),因此一個(gè)測驗(yàn)可能不止一個(gè)信度)獲得較高的信度系數(shù)并不是心理測量有效的充分條件,只是一個(gè)必要條件。 二信

一般能力與學(xué)績測驗(yàn)的信度系數(shù)為

以上,有的可以達(dá)到

;標(biāo)準(zhǔn)智力測驗(yàn)的信度系數(shù)應(yīng)達(dá)到

以上,個(gè)性和興趣測驗(yàn)的信度系數(shù)可稍低,一般應(yīng)達(dá)到

)。

由于誤差的存在,一個(gè)人通過測量得到的分?jǐn)?shù)很難等于真分?jǐn)?shù)。理論上,我們可以對一個(gè)人施測無數(shù)次,然后求得在實(shí)際工作中,我們用一組被試(人數(shù)足夠多)兩次施測的結(jié)果來代替對同一個(gè)人反復(fù)施測,以估計(jì)測量誤差的變異數(shù)。此時(shí),個(gè)人在兩次測驗(yàn)中的分?jǐn)?shù)差異就是測量誤差。據(jù)此可制成誤差分?jǐn)?shù)的分布。這個(gè)分布的標(biāo)準(zhǔn)差(誤差

Sx

如果選用

值)為

%的可能落入

的范圍之內(nèi),也可以寫成

則用公式

代入?;蛴?/p>

%的可能落

,已知

的標(biāo)準(zhǔn)差為

,信度系數(shù)為

,對一名

歲的兒童實(shí)施該測驗(yàn)后,

,那么他的真

對真分?jǐn)?shù)做的是區(qū)間估計(jì),不可能由此得到一個(gè)確切的點(diǎn)。這就是說,測驗(yàn)分?jǐn)?shù)不是一個(gè)定點(diǎn),而是具有

如,某班期末考試,小明的數(shù)學(xué)成績是

分,語文成績是

分。另外,已知小明所在班級的數(shù)學(xué)平均成績是

為差異的標(biāo)準(zhǔn)誤,

為相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,

分?jǐn)?shù)為

分?jǐn)?shù)為

分別為兩個(gè)測驗(yàn)的先將原始分?jǐn)?shù)化成標(biāo)準(zhǔn)分?jǐn)?shù),然后將兩個(gè)標(biāo)準(zhǔn)分?jǐn)?shù)的差異與

顯著性水平)進(jìn)行比較,如果其絕對值

分,此次測驗(yàn)的信度系數(shù)是

;第二次考了

分,此次數(shù)學(xué)測驗(yàn)?zāi)昙壠骄质?/p>

分,標(biāo)準(zhǔn)差是

分,此次測驗(yàn)

再測信度

,也叫重測信度,也叫穩(wěn)定性系數(shù)。用同一個(gè)測驗(yàn),對同一組被試前后施測兩次所得結(jié)果的一致性程度。對兩次測驗(yàn)分?jǐn)?shù)求相關(guān),其相關(guān)系數(shù)就叫再測信度。其計(jì)算公式(皮爾遜積差相關(guān)公式的變式中

X1X2

為同一被試的兩次測驗(yàn)分?jǐn)?shù), 為全體被試兩次測驗(yàn)的平均數(shù),S1S2

為兩次測驗(yàn)的標(biāo)準(zhǔn)差,

:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測于

名學(xué)生,時(shí)間間隔為半年,結(jié)果如表所示,求該測驗(yàn)的重

再測信度要考慮時(shí)間間隔的問題。到底多長合適呢?一般來說,無論對于那種被試,初測與再測的間隔最好不要超

用兩個(gè)平行(等值)的測驗(yàn)對同一組被試施測,得到兩組測驗(yàn)分?jǐn)?shù),求這兩組測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),這就是復(fù)本信

)被試易出現(xiàn)疲勞失去積極性等反應(yīng),還會出現(xiàn)遷移。這些稱為順序效應(yīng),為了抵消順序效應(yīng),可隨機(jī)分配一半

等值穩(wěn)定性系數(shù)是用兩個(gè)平行的(等值的)測驗(yàn),間隔適當(dāng)時(shí)距施測于同一組被試得到兩組測驗(yàn)分?jǐn)?shù),求這兩組測

等值穩(wěn)定性系數(shù)也是采用復(fù)本對被試施測,但等值性系數(shù)的測驗(yàn)要求兩次測驗(yàn)的時(shí)間間隔盡可能短,而計(jì)算等值穩(wěn)利用一次測驗(yàn)所獲得的資料來計(jì)算信度系數(shù)。這樣計(jì)算出來的信度系數(shù)反應(yīng)的是測驗(yàn)內(nèi)部的一致性,即測驗(yàn)項(xiàng)目的分半信度(

分半信度就是將測驗(yàn)題目分成等值的兩半,分半求出量表題目的總分,再計(jì)算兩部分半的方法很多,常見的方法是把一個(gè)量表按題目番號分為兩半,一半是奇數(shù)題,另一半數(shù)偶數(shù)題。求出每個(gè)人的奇數(shù)題的總得分和偶數(shù)題的總得分,然后求出奇數(shù)題總得分和偶數(shù)題總得分的相關(guān)系數(shù),最后對相關(guān)系數(shù)進(jìn)行校Spearman-Brown

采用斯皮爾曼-布朗(Spearman-Brown)公式進(jìn)行校正時(shí),假定兩半測驗(yàn)等值,亦即兩半測驗(yàn)具有相同的平均數(shù)

:有一個(gè)由

題構(gòu)成的量表施測于

個(gè)高三學(xué)生。測驗(yàn)一次后,應(yīng)試者即畢業(yè)離?!,F(xiàn)在怎樣評介測驗(yàn)結(jié)果X1X2),見表

)在使用斯皮爾曼-布朗公式時(shí)要求全體被試在兩半測驗(yàn)上的得分的變異數(shù)相等。當(dāng)一個(gè)測驗(yàn)不宜分成對等的兩)當(dāng)試卷中存在任選題時(shí),不宜采用分半法。速度測驗(yàn)也不宜采用分半法。因?yàn)樗俣葴y驗(yàn)中試題的難度低,被試)將一個(gè)測驗(yàn)分成兩半的方法很多(如,按題號的奇偶性分半按題目的難度分半按題目的內(nèi)容分半等),因此,分半法實(shí)際上是對測驗(yàn)內(nèi)部一致性的一個(gè)粗略估計(jì)。但對于同一個(gè)測驗(yàn)分半的方法是很多的,而且用不同的分半方法求出的分半信度都不一樣,因此分半信度不是最好的內(nèi)部一致性的估計(jì)。為了彌補(bǔ)分半法的不足,可以采用其它

庫德()理查遜()針對分半法的不足,提出以項(xiàng)目統(tǒng)計(jì)量為轉(zhuǎn)移,利用項(xiàng)目統(tǒng)計(jì)量來計(jì)算信度。

式中

表示構(gòu)成測驗(yàn)的題目數(shù),

為通過第

題的人數(shù)比例,

為未通過第

題的人數(shù)比例, 為測驗(yàn)總分的變

庫德-理查遜公式只適用于兩級記分的測驗(yàn),而對多級記分的測驗(yàn),則可以采用克倫巴赫()的α系數(shù),

隨機(jī)抽取部分試卷,由兩個(gè)或多個(gè)評分者獨(dú)立按評分標(biāo)準(zhǔn)打分,然后求其間的相關(guān),所得的相關(guān)系數(shù)即為評分者信

:甲乙兩位教師評閱

份試卷,他們對每一試卷各自所評的分?jǐn)?shù)列入下表

,問這兩位教師評分的一致性如

。求六位

各種方法具有不同的意義,每一種信度系數(shù)不能代替其他的信度系數(shù),所以編制或使用測驗(yàn)時(shí),應(yīng)該盡可能收集各

中看出,一個(gè)測驗(yàn)的誤差變異主要來自主試施測環(huán)境評分的客觀性被試等因素,當(dāng)除被試外的另一些因素固定后,由于信度系數(shù)與被試團(tuán)體的異質(zhì)性有關(guān),因此,如果一本測驗(yàn)手冊中,所報(bào)告的信度系數(shù)是從全體中小學(xué)生的樣本中得到的,我們不能認(rèn)為把該測驗(yàn)用于小學(xué)五年級的團(tuán)體時(shí)也能得到同樣高的信度。當(dāng)一個(gè)測驗(yàn)用于比常模更同質(zhì)團(tuán)體異質(zhì)性不同,分?jǐn)?shù)的標(biāo)準(zhǔn)差亦不同。當(dāng)將測驗(yàn)用于標(biāo)準(zhǔn)差不同的團(tuán)體時(shí),可用下面的公式(克萊公式)推算出式中

S0

為信度系數(shù)已知的分布的標(biāo)準(zhǔn)差,Sn

為信度系數(shù)未知的分布的標(biāo)準(zhǔn)差,

為原團(tuán)體的信度,

為異質(zhì)程

:一記憶力測驗(yàn)實(shí)施于某市全體初中生,其分?jǐn)?shù)的標(biāo)準(zhǔn)差為

,信度系數(shù)為

,若將該測驗(yàn)施測于初二年

由于信度系數(shù)與被試樣本的異質(zhì)程度有關(guān),因此,在編制測驗(yàn)時(shí),應(yīng)把常模團(tuán)體按年齡性別文化程度職業(yè)愛好等分測驗(yàn)的長度,即題目的數(shù)量,也是影響信度系數(shù)的一個(gè)因素。一般說來,在一個(gè)測驗(yàn)中增加同質(zhì)的題目,可以使信

由表

可以看出,增加題目數(shù)量可以提高信度,但并非多多益善。測驗(yàn)過長是得不償失的:()測驗(yàn)過長,編制。(

如果測驗(yàn)太難,分?jǐn)?shù)集中在低分段,如果測驗(yàn)太易,分?jǐn)?shù)分布集中在高分段,這樣都使分?jǐn)?shù)分布的范圍變窄,從而當(dāng)測驗(yàn)題目形式為選擇題時(shí),測驗(yàn)太難,受測者會對許多題目做隨機(jī)反應(yīng),分?jǐn)?shù)的差別將主要取決于隨機(jī)誤差,因

個(gè)學(xué)生進(jìn)行某種測驗(yàn),得分分別為

。為了考察這個(gè)測驗(yàn)的信度,在

天后用原量表再次測驗(yàn),得

人參加的一項(xiàng)測驗(yàn),本擬再測一次以估計(jì)信度,但因?qū)W生畢業(yè)離校,無法再測,現(xiàn)把各人奇數(shù)題得分和偶數(shù)

已知某態(tài)度量表有

道題,被試在各題上得分的方差分別是

,測驗(yàn)總分的方差為

效度是指測量的有效性,一個(gè)測驗(yàn)是否達(dá)到了測驗(yàn)?zāi)康模_地測量了所要測量的心理特質(zhì)的程度。在測量理論 和信度一樣,這個(gè)效度的概念也是理論上構(gòu)想的概念。不可能通過這個(gè)公式計(jì)算得到,我們只能靠已有資料對效度

SI2

可以看出,當(dāng)隨機(jī)誤差的變異數(shù)減小時(shí),真實(shí)分?jǐn)?shù)的變異數(shù)增加,測驗(yàn)信度隨之提高。信度的提高只給有效變異數(shù)的增加提供了可能。至于是否能提高效度,還要看系統(tǒng)誤差的變異數(shù)的大小??梢姡哦雀卟灰欢ㄐФ雀?。但一個(gè)測驗(yàn)要想效度高,真分?jǐn)?shù)的變異數(shù)必須占較大的比重,即測驗(yàn)的信度必須高。因此,信度高是效度高的根據(jù)信度和效度的定義( )可以得到,這就是說,一個(gè)測驗(yàn)的效度總是受它的信度的制約,信度系數(shù)考驗(yàn)效度的方法很多,每種方法側(cè)重的問題不同,名稱也隨之而異。美國心理學(xué)會在

年所發(fā)行的《教育和心理

),

如果把所有的內(nèi)容視為一個(gè)總體,那么測驗(yàn)項(xiàng)目可以視為一個(gè)樣本,這個(gè)樣本要具有代表性,這個(gè)樣本能夠代表總確定所要測量的全部內(nèi)容范圍。比如要考察某一學(xué)科測驗(yàn)是否有效度,就要根據(jù)教材和教學(xué)大綱列出這門課程的根據(jù)教育目標(biāo)的要求,將測驗(yàn)?zāi)康木唧w化為不同層次的測驗(yàn)?zāi)繕?biāo)。教育測驗(yàn)?zāi)繕?biāo)一般采用布魯姆教育目標(biāo)分類學(xué)

對測題進(jìn)行必要的修改,直至多數(shù)專家對測驗(yàn)的內(nèi)容效度感到滿意為止。最后,報(bào)告專家評定的情況,這個(gè)評定 克倫巴赫認(rèn)為,內(nèi)容效度可由一組被試在取自同樣內(nèi)容范圍的兩個(gè)測驗(yàn)復(fù)本上得分的相關(guān)來作數(shù)量上的估計(jì)。當(dāng)相 在教學(xué)或訓(xùn)練之前施測某一測驗(yàn),經(jīng)過一段時(shí)間的學(xué)習(xí)或訓(xùn)練后再次施測,如果后測的成績顯著高于前測,則可以讓本專業(yè)的專家對取樣的代表性進(jìn)行分析,評價(jià)某一測驗(yàn)項(xiàng)目是否具有代表性,統(tǒng)計(jì)出專家中認(rèn)為某一項(xiàng)目能代表

根據(jù)內(nèi)容效度比,刪除內(nèi)容效度比低的項(xiàng)目。計(jì)算全部項(xiàng)目的內(nèi)容效度比的平均數(shù),作為內(nèi)容效度的指標(biāo)。

雖然兩者都是對測驗(yàn)內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。前者只考慮測驗(yàn)項(xiàng)目與測驗(yàn)?zāi)康闹g的明顯的直接表面效度不是效度的客觀指標(biāo),不能保證測驗(yàn)的正確性,但能對受測者的動機(jī)產(chǎn)生影響,因而也會影響到測驗(yàn)的效編制測驗(yàn)時(shí)應(yīng)根據(jù)編制測驗(yàn)的要求提高或降低表面效度,如人格測驗(yàn),表面效度應(yīng)該低,使被試看不出來,從而讓 內(nèi)容效度適合于測驗(yàn)所要測量的內(nèi)容總體能夠明確界定的情況。因此尤其適合對教育測驗(yàn)的效度的考察。內(nèi)容效度對各種用于人員選拔和安置的職業(yè)測驗(yàn)也是適用的。職業(yè)測驗(yàn)關(guān)心的是被試是否具有從事某項(xiàng)職業(yè)的知識技能等,內(nèi)容效度對能力傾向測驗(yàn)和人格測驗(yàn)不是很合適,因?yàn)樗鼈円獪y量的往往是較抽象的特質(zhì),其范圍難以明確界定, 一構(gòu)想效度(

結(jié)構(gòu):心理學(xué)理論中所涉及的抽象而假設(shè)性的概念構(gòu)想效度是指一個(gè)測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度。也就是測驗(yàn)分?jǐn)?shù)能夠說明某一理論概念或特質(zhì)的程度。考察構(gòu)想效度的宗旨是要回答下面一些問題:一個(gè)測驗(yàn)測量的是什么心理構(gòu)想?對這個(gè)構(gòu)想測得有多好?欲建立具有構(gòu)想效度的測驗(yàn),必須先從某一構(gòu)想的理論出發(fā),導(dǎo)出各項(xiàng)關(guān)于心理特質(zhì)或行為的基本假設(shè),根據(jù)這些如,從一般的智力理論,可提出四項(xiàng)主要的假設(shè):()智力隨年齡的增長而增長;()智商是相對穩(wěn)定的;(

在施行個(gè)別測驗(yàn)時(shí),要求被試邊想邊說,從而可以分析被試解題時(shí)的心理過程,以核實(shí)測驗(yàn)是否真正測到了所要測這種方法是以測驗(yàn)的內(nèi)在一致性系數(shù)(如

,以及系數(shù)等)為指標(biāo),判斷測驗(yàn)測的是單一特質(zhì)還

如,斯坦福-比奈量表和韋氏量表是公認(rèn)的效度較高的智力量表,后人編制的智力測驗(yàn)常計(jì)算與這些量表的測驗(yàn)分

一個(gè)有效的測驗(yàn)不僅應(yīng)與其他測同一構(gòu)想的測驗(yàn)有關(guān),而且還必須與測量不同構(gòu)想的測驗(yàn)無關(guān)。用此種方法確定的因素效度(

):通過對一組測驗(yàn)進(jìn)行因素分析,找到影響測驗(yàn)分?jǐn)?shù)的共同因素,每個(gè)測驗(yàn)在共同因如,舉行兩場考試,使被試相信一場考試關(guān)系重大,另一場考試無關(guān)緊要,在考試前進(jìn)行焦慮測驗(yàn),看被試的焦慮 所謂效標(biāo)關(guān)聯(lián)效度,是指測驗(yàn)分?jǐn)?shù)與某一外部效標(biāo)間的一致性程度,即測驗(yàn)結(jié)果能夠代表或預(yù)測效標(biāo)行為的有效性

A.

例如:大學(xué)入學(xué)考試的觀念效標(biāo)通常是大學(xué)學(xué)習(xí)成功,它的一種常用的效標(biāo)測量便是大學(xué)頭兩年或一年相關(guān)學(xué)科在保證有效性的前提下,效標(biāo)測量必須盡可能簡單省時(shí)花費(fèi)少。 三效標(biāo)效標(biāo)關(guān)聯(lián)效度一般可以通過統(tǒng)計(jì)分析得到一個(gè)數(shù)量指標(biāo),因此有人將它稱為統(tǒng)計(jì)效度。常用的估計(jì)方法有相關(guān)法分相關(guān)法是一種最常用的計(jì)算效標(biāo)關(guān)聯(lián)效度的方法,測驗(yàn)分?jǐn)?shù)與效標(biāo)間的相關(guān)系數(shù)稱為效標(biāo)系數(shù)。測驗(yàn)分?jǐn)?shù)與效標(biāo)分

二列相關(guān)適用的情況是,測驗(yàn)分?jǐn)?shù)和效標(biāo)的總體分布均為正態(tài),測驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)測量被人為地分成兩根據(jù)受測團(tuán)體在效標(biāo)上的行為表現(xiàn),將他們分成不同的組別,看不同組別的測驗(yàn)分?jǐn)?shù)是否存在顯著差異。若測驗(yàn)分組間平均數(shù)差異在統(tǒng)計(jì)上的顯著性取決于團(tuán)體的大小。當(dāng)團(tuán)體較大時(shí),平均數(shù)的小差異在統(tǒng)計(jì)上也會變得有意義,重疊量有兩種計(jì)算方法。一種方法是:計(jì)算出成功組中低于失敗組平均數(shù)的人數(shù),再計(jì)算出失敗組超過成功組平均因此,研究者在提供效度資料時(shí),應(yīng)該把平均數(shù)標(biāo)準(zhǔn)差統(tǒng)計(jì)上的顯著性重疊量等一起報(bào)告,以防止實(shí)際上并無差總命中率指根據(jù)測驗(yàn)選出的人當(dāng)中工作合格的人數(shù),以及根據(jù)測驗(yàn)淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之正命中率指用測驗(yàn)選出的人中合格者所占的比例。(只關(guān)心被選者中合格者有多少,不關(guān)心被淘汰者中是否有合格

提高測驗(yàn)效度對各種心理測驗(yàn)都非常重要,但效度系數(shù)要達(dá)到多大才符合要求呢?這要根據(jù)各種測驗(yàn)的具體情況來

相同科目的標(biāo)準(zhǔn)測驗(yàn)成績與教師對學(xué)生名次的排列之間的相關(guān)系數(shù)一般應(yīng)達(dá)到

之間,這是因?yàn)樵跍y驗(yàn)的

對效度系數(shù)大小的要求,也受原測驗(yàn)與獲得效標(biāo)的測驗(yàn)之間的相似性的制約。若兩者不相似,則效度系數(shù)偏低;若相似,則效度系數(shù)會高些。所以,有的測驗(yàn)效度系數(shù)達(dá)到

即已符合要求,有的卻要大到

才能認(rèn)為是

,某一次數(shù)學(xué)測驗(yàn),

名學(xué)生中,高分組和低分組各有

人。其中高分組答對第一題的共有

人,低分組答

在是非題和選擇題中,由于允許猜測,被選答案的數(shù)目越少,機(jī)遇的作用越大,就越不能反映項(xiàng)目的真實(shí)難度。為

,一個(gè)五擇一的測題,未校正前的難度指數(shù)為

,一個(gè)四擇一的測題,未校正前的難度指數(shù)為

,請問校前面我們計(jì)算的難度是用百分比來表示難度。百分量表是等級量表,不是等距量表,缺乏相等的單位,只能表示事物之間位次的關(guān)系,不能用來對項(xiàng)目之間的難度作精確的比較,也不能由各試卷的難度來計(jì)算整份試卷的平均難

先將某題的通過率視作正態(tài)曲線下的面積,然后查正態(tài)分布表找出正態(tài)曲線右側(cè)的面積所對應(yīng)的

分?jǐn)?shù)。這一

delta

標(biāo)準(zhǔn)正態(tài)分布的全距一般包括

個(gè)標(biāo)準(zhǔn)差的距離,即從

到+,當(dāng)

時(shí),表明通過率達(dá)到

%,這種情況極少發(fā)生,此時(shí)Δ=;當(dāng)

時(shí),表明通過率為

%,也是不大可能出現(xiàn)的情況,此時(shí)Δ=。Δ的取值范圍

當(dāng)測驗(yàn)的分?jǐn)?shù)(預(yù)試結(jié)果)呈偏態(tài)分布時(shí),可以通過改變項(xiàng)目難度的比例對測驗(yàn)的難度加以調(diào)整,通常,如果被試過難和過易的測驗(yàn),會使測驗(yàn)分?jǐn)?shù)的分布相對集中于高分段和低分段,從而縮小分?jǐn)?shù)的分布范圍。分?jǐn)?shù)分布范圍影響信度,范圍越廣,信度越高,分?jǐn)?shù)分布范圍越小,信度越小。

年,艾伯爾用三套測驗(yàn)進(jìn)行研究,發(fā)現(xiàn)當(dāng)難度

總結(jié):一般能力測驗(yàn)和成就測驗(yàn)的平均難度在

左右為宜。出現(xiàn)偏態(tài)情況時(shí),宜對項(xiàng)目進(jìn)行調(diào)整,以使測驗(yàn)分?jǐn)?shù)標(biāo)考試屬于負(fù)偏態(tài)分布。 第二節(jié)

),

這是項(xiàng)目區(qū)分度分析的一種簡便方法,比較測驗(yàn)總分高分組和低分組在某一項(xiàng)目上的通過率的差異,作為項(xiàng)目鑒別其中,

為鑒別指數(shù),

為高分組在該項(xiàng)目上的通過率,

為低分組在該項(xiàng)目上的通過率。

值越大,項(xiàng)目的區(qū)

,某高中物理測驗(yàn),被試共

人,高分組和低分組各取總?cè)藬?shù)的

%,則兩組各為

人,第五題高分組

兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地分成兩類。測驗(yàn)總分或效標(biāo)分?jǐn)?shù)某個(gè)測驗(yàn)項(xiàng)目的分?jǐn)?shù)都是連續(xù)變量,其中一個(gè)變量被人為地分成兩類,可以是測驗(yàn)總分或效標(biāo)分?jǐn)?shù)被人為地分成兩類,也可以是某個(gè)項(xiàng)目的分?jǐn)?shù)

,下表是某學(xué)校的

名學(xué)生在一次語文測驗(yàn)中的總分和作文題的得分情況,作文題被人為地分成兩種情況,

適用資料:兩列數(shù)據(jù)都是測量的數(shù)據(jù),具有連續(xù)性;兩列變量各自總體的分布都呈正態(tài),即正態(tài)雙變量。求項(xiàng)目分

練習(xí)

:下表是

個(gè)學(xué)生一次測驗(yàn)的分?jǐn)?shù),試計(jì)算第三題的難度;若第三題是是非題,答案分對和錯(cuò),請計(jì)算其區(qū)練習(xí)

:下表是某大學(xué)學(xué)生的一次普通心理學(xué)期末考試的成績總分和某一論述題的得分(滿分為

-0.44——11.24

從此表我們可以看出,難度越接近于

,項(xiàng)目潛在的區(qū)分度越大,而難度越接近

時(shí),項(xiàng)目的潛在區(qū)分度如果我們想使我們的所測驗(yàn)到的心理特質(zhì)的分?jǐn)?shù)分布呈正態(tài),我們考慮難度選擇項(xiàng)目時(shí),應(yīng)使項(xiàng)目的難度分布也呈

項(xiàng)目的難度分布也呈正態(tài)分布,特別難和特別容易的題目少一些,中等難度的項(xiàng)目多一些,在編制測驗(yàn)時(shí)一般要求項(xiàng)目的難度在

之間,而所有項(xiàng)目的平均難度要保持在

左右。當(dāng)題目之間正相關(guān)時(shí),題目難度值應(yīng)分

一般能力測驗(yàn)和成就測驗(yàn)的平均難度在

左右為宜。出現(xiàn)偏態(tài)情況時(shí),宜對項(xiàng)目進(jìn)行調(diào)整,以使測驗(yàn)分?jǐn)?shù)的分布接近正態(tài)。但項(xiàng)目難度還與測驗(yàn)的目的有關(guān),正偏態(tài)分布適合于篩選性測驗(yàn)。此時(shí)項(xiàng)目的難度和整個(gè)測驗(yàn)的難度應(yīng)

埃貝爾()的標(biāo)準(zhǔn)是針對鑒別指數(shù)的,如果區(qū)分度是用相關(guān)系數(shù)計(jì)算得來的,則挑選項(xiàng)目的最低標(biāo)準(zhǔn)是不低于)如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇,說明該項(xiàng)目不具迷惑性,錯(cuò)得過于明顯,一般來說,除非有

%以上的)如果高分組被試的選擇集中在兩個(gè)答案上,二者選擇率相近,說明該題可能有兩個(gè)正確答案或另一個(gè)答案也有)如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)被選答案的人數(shù)相等,則說明題目過難或題意不清,使得被試無法

確定每一類行為的項(xiàng)目比例,通常是一張雙向細(xì)目表,指出測驗(yàn)所包含的內(nèi)容和要測定的各種技能,以及對每一個(gè)

混合螺旋式:先將各類項(xiàng)目依難度分成若干不同的層次,再將不同性質(zhì)的項(xiàng)目予以組合,作交叉式的排列,其難度

西方國家,多種學(xué)業(yè)能力傾向測驗(yàn)在學(xué)校情景中被廣泛使用

;我國在學(xué)業(yè)能力傾向測驗(yàn)方面的研究和應(yīng)用還相當(dāng)缺

以教師等級評定和成就測驗(yàn)為效標(biāo)的考驗(yàn)表明,本測驗(yàn)具有較高的同時(shí)效度;以期末成績?yōu)樾?biāo)的考驗(yàn)表明,本測

心理測驗(yàn)的使用一般包括這么幾個(gè)方面:選擇測驗(yàn)施測評分測驗(yàn)結(jié)果的解釋和報(bào)告將測驗(yàn)結(jié)果用于指導(dǎo)學(xué)習(xí)和生活主試必須具有操作心理測驗(yàn)的專業(yè)技能。一般來說,團(tuán)體測驗(yàn)較容易掌握,只要在測驗(yàn)前熟悉量表,對量表的指導(dǎo)語注意事項(xiàng)評分解釋等熟練掌握,實(shí)施是不困難的。但對于個(gè)別測驗(yàn)如韋氏量表投射測驗(yàn)如羅夏墨跡測驗(yàn)等掌握較難,必須經(jīng)過反復(fù)的練習(xí)。還有一點(diǎn)必須指出的是已經(jīng)會使用一種測驗(yàn)的主試,不一定會使用另一個(gè)測驗(yàn),因此主受測者的年齡文化背景是否殘疾等因素都需要進(jìn)行考慮。如,如果是小學(xué)三年級以下的兒童則不適合團(tuán)體測驗(yàn),適選擇測驗(yàn)時(shí)要看看測驗(yàn)是否經(jīng)過標(biāo)準(zhǔn)化,它的信度和效度如何,常模樣本是否符合你的測試對象,如常模樣本是中學(xué)生,那么就不適合運(yùn)用于小學(xué)生,如果是城市常模,則不適合運(yùn)用于農(nóng)村,因?yàn)槿狈Ρ容^的樣本;測試資料如常事先應(yīng)通知被試,使被試知道測驗(yàn)的時(shí)間地點(diǎn)內(nèi)容范圍試題類型等,使被試對測驗(yàn)有一定的心理準(zhǔn)備,可以及時(shí)調(diào))主試必須熟悉測試的具體程序。主試在測驗(yàn)前必須仔細(xì)閱讀測驗(yàn)指導(dǎo)手冊,測驗(yàn)的施測細(xì)則,熟練記住測驗(yàn)的步驟,如何記分記時(shí),在測驗(yàn)前可以先自己演示一遍,必須保證準(zhǔn)確無誤。尤其是個(gè)別測驗(yàn),一般對施測程序較為)主試必須做好應(yīng)付突發(fā)事件及被試提問的心理準(zhǔn)備。主試對施測過程中可能會發(fā)生的突發(fā)事件應(yīng)該有所預(yù)測并做好相應(yīng)的心理準(zhǔn)備,尤其是對于團(tuán)體測驗(yàn),由于人數(shù)較多,可能會出現(xiàn)一些突發(fā)事件,主試必須做好從容應(yīng)付的測驗(yàn)材料包括測驗(yàn)題目答卷紙記分鍵指導(dǎo)書紙筆記時(shí)器有關(guān)器具等必需的材料和工具,測驗(yàn)前主試必須仔細(xì)檢查核心理測驗(yàn)對環(huán)境要求較高,許多研究表明,智力測驗(yàn)在炎熱的夏天得到的結(jié)果和正常天氣得到的結(jié)果是有差異的。所以施測前,主試要選擇好環(huán)境,包括測驗(yàn)時(shí)的光線通風(fēng)等情況。不過去中小學(xué)的測驗(yàn)一般都是在他們原來的教室

在施測過程中,主試和被試之間應(yīng)當(dāng)建立良好的協(xié)調(diào)關(guān)系,即一種友好合作的并能促使被試最大限度地做好測驗(yàn)的一種關(guān)系。例如,在能力測驗(yàn)中,要讓被試最大限度地發(fā)揮,表現(xiàn)出自己的能力;人格測驗(yàn)中,要讓被試誠實(shí)地回由于測驗(yàn)的性質(zhì)和被試的年齡及其它情況不同,建立協(xié)調(diào)關(guān)系的方法也應(yīng)該有所不同,對于幼兒園兒童,主試應(yīng)以友好親切的態(tài)度對待幼兒,消除他們的陌生感和恐懼心,對待他們要有耐心,讓他們慢慢熟悉環(huán)境,測驗(yàn)時(shí)也是采用個(gè)別測驗(yàn),并且盡量生動有趣。對于年齡大一點(diǎn)的兒童,可以通過競爭來提高他們的測驗(yàn)興趣,對于成人,則要主試應(yīng)嚴(yán)格按照測驗(yàn)指導(dǎo)手冊提供的評分規(guī)則對被試的測驗(yàn)結(jié)果進(jìn)行評分,評出被試在每個(gè)項(xiàng)目上的得分,然后

)主試一般不要將測驗(yàn)分?jǐn)?shù)告訴被試及相關(guān)人員,告訴的應(yīng)該是測驗(yàn)結(jié)果的解釋。因?yàn)?,心理測驗(yàn)尚不完善,測驗(yàn)結(jié)果也只能是一個(gè)參考,而外行的被試往往對測驗(yàn)的科學(xué)性有過高的估計(jì),這樣如果把測驗(yàn)得到的分?jǐn)?shù)告訴被試

Aptitude

Aptitude

Aptitude

是一種認(rèn)知或心理運(yùn)動的測量,它用來預(yù)測一個(gè)人在某一科目(代數(shù)外語音樂)某一工作(機(jī)械工速記員焊接

提供能力剖面圖:測驗(yàn)結(jié)果提供若干個(gè)分?jǐn)?shù),每個(gè)分?jǐn)?shù)既代表被試在所測能力傾向上的相對位置水平,又能代表被

Scholastic

Assessment

Aptitude

美國各大學(xué)申請入學(xué)的重要參考條件之一分為

兩部分,即推理測驗(yàn)(reasoning

test)和學(xué)科測驗(yàn)

testⅡ主要測量考生在某一學(xué)科的知識和運(yùn)用這些知識的能力,共有

個(gè)主題科目,各自獨(dú)立,包括:英文數(shù)學(xué)歷

主要測驗(yàn)考生的英文程度和數(shù)學(xué)推理能力,作為預(yù)測考生進(jìn)入大學(xué)后成績的參考資料,同時(shí)也可作為比較不

最初由美國心理公司

G.

K.

等于

年出版發(fā)行,

年又進(jìn)行了修訂,是應(yīng)用最廣

A.

D.

(Industrial)

Aptitude

);

(Armed)用于軍隊(duì)的選拔和分類。如:

Aptitude

ASVAB 供所有軍種使用,含以下

個(gè)分測驗(yàn):算術(shù)推理數(shù)字運(yùn)算文章理解字詞知識編碼速度一般科學(xué)數(shù)學(xué)知識電子知識機(jī)械理解自動化及工廠知

我國的行政職業(yè)能力考試用于錄用機(jī)關(guān)工作人員,內(nèi)容包括數(shù)量關(guān)系判斷推理常識判斷言語理解與表達(dá)資料分析

機(jī)械裝配和靈活性測驗(yàn):要求受測者根據(jù)形狀將物體插入板上相應(yīng)的孔中;把螺帽擰在螺絲上;把大頭針放進(jìn)指定

Art

16PF

-(3A+2G)16PF

2(11-A)+2B+E+2(11-F)+H+2I+M+(11-N)+Q1+2Q2

B+G+Q3+(11-F)

Dd

Dd

F-

測驗(yàn)實(shí)施以后,將受測者的反應(yīng)與答案作比較即可得到每個(gè)人在測驗(yàn)上的分?jǐn)?shù)。這種直接從測驗(yàn)上得到的分?jǐn)?shù)叫做為了使原始分?jǐn)?shù)有意義,也為了不同的原始分?jǐn)?shù)可以相互比較,必須把它們轉(zhuǎn)換成具有一定的參照點(diǎn)和單位的測驗(yàn) 常模參照分?jǐn)?shù)是把受測者的成績與具有某種特征的人所組成的有關(guān)團(tuán)體作比較,根據(jù)一個(gè)人在該團(tuán)體內(nèi)的相對位置在制定常模時(shí),必須清楚地說明所要測量的群體的性質(zhì)和特征。可以用來區(qū)分和限定群體的變量是很多的,如年齡

當(dāng)一個(gè)群體過大,樣本難以充分代表總體時(shí),可根據(jù)實(shí)際取樣的范圍,重新界定測驗(yàn)所適用的群體,即使一個(gè)有代

所謂大小適當(dāng)并沒有嚴(yán)格的規(guī)定。一般說來,取樣誤差與樣本大小成反比,所以,在其他條件相同的情況下,樣本越大越好,但也要考慮具體條件(如人力物力)的限制。有時(shí)從一個(gè)較小的但具有代表性的樣本中所得到的分?jǐn)?shù)比來自較大的但定義模糊的團(tuán)體中得到的分?jǐn)?shù)還要可靠。不過,在有代表性的前提下,樣本應(yīng)該大到足以提供穩(wěn)定由于教育時(shí)代變遷等多種因素的影響,幾年前所編制的常??赡懿辉龠m合,因此常模必須定期地修訂,要以批判的測驗(yàn)手冊上所列的常模通常是為典型團(tuán)體建立的,不一定適合使用者的具體情況。對此問題的一個(gè)解決辦法是為每

抽簽:把總體中的每一個(gè)個(gè)體編上號并作出簽,充分混合后從中隨機(jī)抽取一部分,這部分簽所對應(yīng)的個(gè)體就組成

抽樣方法比簡單隨機(jī)取樣簡便易行,而且它能比較均勻地抽到總體中各個(gè)部分的個(gè)體,樣本的代表性比簡單隨機(jī)取如,前面的調(diào)查,如果男生的編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論