|
第一节 教育与心理测量法概述
一、教育与心理测量的概念
(一)测量
史蒂文斯(S.S.Stevens)曾就测量的基本性质把测量定义为,测量就是按照一定的法则,用数学方法对事物的属性进行数量化描述的过程。这是对一切事物差异进行区分的测量定义。
(二)教育与心理测量
心理测量:是根据心理学的有关理论假设,使用一定的操作程序,给体现人的心理活动的行为确定出一种数量化价值的过程。
教育测量:是在心理测量学的基础上发展起来的。是按照教育目标规定的要求,使用一定的程序,对某种教育现象用数字加以确定的过程。
(三)测量的共同要素
1.测量的对象
2.测量的理论假设和工具
3.数字表达形式
二、教育与心理测量的性质和量表类型
(一)性质
1.间接测量;
2.测量结果的相对稳定性;
3.对行为相关关系的描述;
4.结果一般为顺序关系,因此,教育与心理测量一般是属于等级测量或顺序测量。
(二)量表类型
从某种意义上讲,测量就是按照法则给事物指派数字。也就是说,如果要使描述事物的特性与分派数字的法则具有意义,就要用数来代表事物的特性,使事物具有类似数的性质与形式。于是,依据事物的特性和设定的法则,用一组数字描述事物的特性所能达到程度不同,就导致了测量的水平不同,并从而产生了不同类型的量表。
量表(scale)是指在进行测量时体现测量规则的连续体。如前所述,测量是将事物特伯数量化,即在一个数字量尺上表示事物的属性,而这一量尺又必须具有单位和参照点这两个要素。也就是说,数量化的价值是在一个有单位和参照点的连续体上表现出来的。
所谓连续体的单位,是指计量事物属性的标准量的名称。一个量表的单位首把必须有明矽的定义,任伺人对其意义的理解是一致的,如测量时间的单位为小时、分、秒;单位的另一个条件是单位之间的距离应该是等值的。
所谓参照点,是指进行数量化计算的起点,也称为零点。参照点不同,测量的结果便无法直接相互比较。参照点有两种。一种是绝对零点。例如,对长短与轻重的测量参照点是绝对零点。另一种是相对零点,又叫人定的零点。例如,山脉高度的测量是以海平面为零点。在教育与心理测量中,所用的参照点大部分是人定的,一般都是相对零点。例如,在某项测验中得零分的学生,并不能说明该生对这方面的知识一无所知或完全是空白的。对于在参照点为相对零点的连续体上,只能表示差异的大小,而不能以“倍数”的方式来解释。
由于对事物属性给予数量化描述的水平不同,史蒂文斯把测量从低级到高级分为四种水平,即称名测量、顺序测量、区间测量、比率测量。根据这四种测量的不同测量水平,就有四种类型的量表。
称名量表。只说明某一事物与其他事物在属性上的不同或类别上的差异,并不表述事物间差异的大小。
顺序量表。不仅说明事物名称、性质的不同,还能说明事物间等级的顺序。
区间量表。既能说明事物间特点的异同,又能表示量的大小,而且又有相等的单位。
比率量表。既具有相等的单位,能表明量的大小,又具有绝对
第二节 教育与心理测验
一、测验的定义
根据测量学的理论,测验学家曾对测验(test)下过各种定义。例如,布朗(P.G.Brown)提出:“所谓测验,是对一个行为样组进行测量的系统程序。”安娜斯塔西(A.Anastasi)认为:“心理测验实质上是对行为样组的客观的和标准化的测量。”其实,就这两个定义来看,其基本含义是一致的,只是在完整和明确的程度上不同而已。我们认为,测验是对行为样组的标准化的测量。而且,可从这些定义中概括出以下共同因素o
(一)测验是对行为样组的测量
(二)测验是一种标准化的测量
二、测验的种类
(一)按测验对象的数目分
1.个别测验
2.团体测验
(二)按测验的性质分
1.智力测验
2.能力倾向测验
3.学绩测验
4.人格测验
(三)按测验材料的特点分类
1.语言文字测验
2.非文字测验或操作性测验
3.投射性测验
4.情境测验
(四)按测验目的的要求分
1.难度测验
2.速度测验
3.预测性测验
4.诊断性测验
(五)按测验结果评价标准分
1.常摸参照测验:是指用常摸作为解释个人测验分数的参照标准的一种测验。所谓常摸,是解释测验结果的参照指标,评价每名被试在总体分布中的相对位置。
2.效标参照测验:就是以被试必须达到的标准,来决定他是否具备某种能力的测验。所谓效标,是指衡量测验有效性的参照标准,是可以直接而且独立测量的行为。在学绩测验中,效标是指教学目标。
三、测验的功能
(一)选拔人才
(二)因材施教
(三)指导就业与安置
(四)诊断
对智力落后者的鉴别;单科的诊断测验还可以确定学生犯错误的类型,找出每个学生在学习中的弱点,以采取适当帮助和补救措施。
(五)咨询
(六)评价
测验既可用于评价人们在学习和能力上的差异、人格特点以及相对的优缺点,评价儿童已达到的发展阶段等,也可用于评价教师的教学效果和教学方法,既可用于评价个人,也可用于评价集体,还有助于人们的自我了解和自我评价。
第三节 测验的信度与效度分析方法
测验的基本要求是测验必须稳定、准确,即要可信和有效。
一、测验的信度(reliability):即可信程度,一致性。是反映测验成绩在不同条件下的一致性程度的指标。
影响信度的因素有四:
1.测验的长度
2.测验团体的同质性
3.测验的难度
4.评分者的主观因素
二、测验的效度(validity):也称有效性。是反映测量的正确性和准确性的程度的指标。
估计效度的方法:内容效度;构想效度;效标效度
影响效度的因素有三:
1.测验的系统误差
2.样本的性质
3.被试的主观状态
三、效度与信度的关系
第四节 心理测验的项目分析方法
1.项目分析:依据被试在测验题目上的反应,对组成测验的各个题目(项目)进行分析。包括定性分析和定量分析。通过项目分析,研究者可以筛选出有价值的测验题目,从而提高测验的信度和效度。
2.定性分析:包括考虑内容效度、题目编写的恰当性和有效性等;
3.定量分析:主要是对题目难度和区分度的测量。
4.难度(difficulty):指测验项目的难易程度。它是正确回答试题人数(R)与参加测验总人数(N)之比,用字母P表示。
5.区分度(discrimination):指测验项目对被试实际水平的区分程度或鉴别能力,也就是测验项目的效度。
6.题目区分度和难度之间应该是一种适当的关系。一般认为,一份测验题目的难度分布,应该是0.30~0.70,而平均难度在0.50左右,这时的区分度将能最好地区分出被试的实际水平。
第五节 测验的编制与标准化
一、编制测验的一般程序
1.明确测验对象和目的
2.制定测验计划
3.选择测验材料
4.合理选择测验题目及类型
5.测验的生成与鉴定
6.编制测验指导书
二、测验的标准化:指测验全过程的标准化,包括五个过程的标准化。
1.内容的标准化
2.命题标准化
3.施测标准化
4.评分标准化
5.建立常模 |