设计和编制任何一种测验,都必须使其在效度、信度、难度和区分度方面达到一定要求,即起码达到有效、可信,具有一定难度和区分度。此部分的知识点,考察相对较少,但是较难理解。
一、信度
信度是指测验结果的稳定性或可靠性,即某一测验在多次施测后得到的分数的稳定、一致程度。它既包括时间上的一致性,也包括内容和不同评分者之间的一致性。和信度相关的一个概念是效度,信度是效度的前提条件。信度只受随机误差的影响,随机误差越大,信度越低。如,用同样的数学卷子测量同一批学生,昨天和今天的测量结果是一样的,这就表示这个数学卷子的信度较高;若同样的数学卷子测量同一批学生,昨天和今天的测量结果不一样,这就表示这个数学卷子的信度很低。
(1)重测信度
又称为稳定性系数,统一测验,在不同时间对同一群体施测两次,这两次测量分数的相关系数即为重测系数。如,人格测验,在学期开始前对本班学生施测,学期末再测一次,求两次测量分数之间的相关系数。相关系数越大,说明重测信度越高。
(2)复本信度
是以两个测量复本来测量同一群体,然后求得应试者在这两个测验上得分的相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度。如,某语文单元测验,有两个复本,用两个复本来测量班级学生,最后求两次测验得分的相关系数。相关系数越大,说明两个复本的内容越等值。
(3)评分者信度
是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随机抽取若干份试卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。
二、效度
效度是指测量的正确性,即一个测验能够测量出其所要测量的东西的程度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。就一个测验的优劣而言,效度是一个比信度更为重要的指标。
(1)内容效度
内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。如,用体重计测量身高,必然测不出想要的东西;数学卷子的题干由于太长,难懂,使得学生在作答时由于题干难理解而成绩较低,这样的都是内容效度低的表现。
(2)构想效度
指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。如,在语言方面,女性比男性口语发展早,在语言流畅性及读、写、拼等方面均占优势,但男性在语言理解、言语推理等方面又比女性强。如果有一份测量测量明显符合这一理论,那就说明这个测验的构想效度高。
(3)效标效度
效标效度又称实证效度,反映的是测验个体在某种情境下行为表现的有效性程度。如,某一测验测出该名学生的抽象逻辑思维占优势,在后续学习物理、化学相关抽象的内容时能够获得好成绩。如果该名学生的确表现出物化学学习方面的优势,就说明这一测验的效标效度较高。
三、信度与效度的关系
信度是效度的基础,只有信度高时,效度才可能高。
(1)信度高,效度不一定高。想用体重计来测量身高,发现多次测量,成绩几乎一样,说明信度很高,但是没有测出想要的东西,说明效度很低。
(2)信度低,效度一定低。信度是效度的基础。
(3)效度高,信度一定高。如果某测验已经能够测出它想要测得东西,那么这个测验的信度必然也是很高的。如,某数学测验测出了学生的四则运算能力,那么多次测量,得分也相对稳定。
(4)效度低,信度不一定低。用数学卷子进行测验,却主要考察了学生语文理解的能力,说明该测验效度很低,但是多次测量,结果都比较稳定,说明该测验信度很高。
[点击关注]
欢迎关注中公张家口教师招聘考试频道
免责声明:本站所提供试题均来源于网友提供或网络搜集,由本站编辑整理,仅供个人研究、交流学习使用,不涉及商业盈利目的。如涉及版权问题,请联系本站管理员予以更改或删除。