测验题目是构成测验的基本元素,题目编制得恰当与否直接关系到整个评价的好坏。为此,从本节开始将介绍有关纸笔测验试题的类型、特点及设计命题的要求、原则和技巧。为了保证测验试题的高质量,教师在自编成就测验时,应严格遵循下列各类题型的设计命题要求,降低试题品质的不良率,增强试题的鉴别力和有效性,从而真正达到评价的目的。
一、什么是是非题
(一)是非题的含义及使用
是非题也叫二项选择题、正误判断题。它基本上是只有两个选项的选择题,当选项只有两种可能性时,出是非题比选择题更适合。是非题一般是由陈述句组成的,其基本形式是提供一个叙述,让学生判断叙述正确与否。常见的是非题的变形有丛集题型(cluster variety)和改正题型(correction variety)。丛集题型也称多重是非题(multiple true -false items),它提供一个题干,根据题干,设计若干对或错的答案叙述供学生判断。改正题型要求学生对叙述所强调部分(通常是字或词)的对错作判断,并将错误的部分加以改正。下面是两个是非题的示例。
例1
指导语:阅读下列命题,并作出判断。正确的在题号前的括号内画“T”,错误的画“F”。
(F)1.只有一对对边平行的四边形是菱形。
(F)2.《中俄尼布楚条约》是中国历史上的第一个不平等条约。
(F)3.某数的80%是200,那么该数比200小。
例2(选择题的变例,只有一个题干和多个对与错的陈述,即多重是非题。)
下面是关于等边三角形特点的叙述,正确的在题号前的括号内画“T”,错误的画“F”。
(T)三个内角都等于60°。
(T)任意一内角的平分线都是对边的中线。
(T)任意一内角的平分线都是对边的高。
(F)面积等于两边乘积的一半。
一般而言,是非题最适合考查学生对基本概念、性质、原理定则等的认知和判断能力。对低年级儿童的思维能力及对态度、兴趣等方面的测验等不宜采用是非题。
(二)是非题的优点及不足
是非题可以说是一种简化了的选择题,它在编制与使用中具有这样一些优点:(1)与选择题相比,是非题的编制较容易,评分也客观、公正;(2)是非题的作答迅速,能在较短时间内考核较多的教学内容,效率较高;(3)可以和解释性试题连用,来测量学生更高水平的认知能力和复杂的学业成就;(4)是非题的命题内容很广。
但是,是非题也有其不足之处。(1)猜测因素很强。由于是非题只有两个选项,即使学生对命题的内容一无所知,也有50%的机会猜对答案,不能真正反映出学生对知识的理解和掌握程度,而且很容易使学生在学习中产生侥幸心理,从而导致教师对学生实际知识的评价失真,使得评价的鉴别力低,信度也不高。(2)虽然是非题的命题内容广泛,但很难编制出能测量较高层次的认知能力的试题。是非题一般适用于测量学生较低层次的认知能力,如判断概念、定律或规则的是与非,而对较高层次的认知能力目标就难以测量。
为了提高是非题的信度和鉴别力,可以采用以下方法来减少学生对试题的猜测因素。(1)当所有的学生都不知道正确答案时,鼓励他们都去猜测。由于学生的猜测行为是不可阻止的,所以只有让所有学生都去猜测才能平衡猜测效应。(2)要求学生改正错误。运用这种方法时,在每个选项后面都留出一点空隙,如果学生判断题项有错误,就在空隙处给以改正,并要求学生把不正确的部分用横线标示,写出正确的内容。(3)鉴于是非题存在的不足,可采用将是非题与说明题相结合的办法。这种方法既让学生判断,又让其说明理由,既可以减少学生猜测的机会,也可以测量学生较高层次的认知能力。([美]G.D.Borich & M.L.Tombari:《中小学教育评价》,81页,北京,中国轻工业出版社,2004。)
例1
判断下列陈述,正确的在题号前的括号内画“T”,错误的画“F”,并改正。
(F)Television is rapidly becoming the literature of our periods. (time)
(F)闰年的八月都要加一天。(二月)
(T)造纸术是中国古代的四大发明之一。
例2
判断下列陈述,正确的在题号前的括号内画“√”,错误的画“×”,并说明理由。
(×)太阳由西方升起,东方落下。
理由:
(三)是非题的设计
鉴于是非题自身的特点,为了教师能够编制出高质量的是非题试题,发挥其鉴别的功能,教师在编制试题时应遵循以下命题要求。
1.应尽量避免用否定句,尤其是双重否定
学生在答题时很容易忽视否定陈述中的否定词,从而导致判断错误。双重否定则使叙述的语句模糊,从而增加了学生对内容理解的不确定性。在不得不使用否定句来陈述时,应突出强调否定词眼,起到提醒的作用。
【不良试题】
(T)几乎不可能没有一个人在其成长过程中不曾遇到挫折。
【修正试题】
(T)几乎每一个人在其成长过程中都曾遇到挫折。
2.避免使用具有暗示性的字词或特殊的限定词句
避免在题目的陈述中使用“所有”“通常”“只有”“可能”等词。
【不良例题】
(F)只有考上重点高中,才能考上名牌大学。
3.每一题只能包含一个核心的概念
应避免两个或两个以上的概念在同一试题中同时出现,而造成“似是而非”的情形,干扰学生的判断及回答。
【不良例题】(叙述中的概念,一个是对的,另一个是错的)(余民宁:《教育测验与评量:成就测验与教学评量》,155页,台北,心理出版社,2002。)
(F)妯娌是属于姻亲关系,而叔侄是属于直系血亲关系。
【修正例题】
(T)妯娌是属于姻亲关系。
(T)叔侄是属于旁系血亲关系。
4.题目的陈述应简洁
是非题中,试题题目陈述的内容应当简洁、明了,尽量使用简单句来表述,避免使用复杂的句法结构,否则会使其变成阅读能力的测验,而达不到测试的目的。
【不良例题】([美]R.L.Linn & N.E.Gronlund:《教学中的测验与评价》,104页,北京,中国轻工业出版社,2003。)
(T)尽管在判断溶液的pH值时存在理论和实验方面的困难,我们还是有可能通过将石蕊试纸插入溶液视其颜色变化来判断其酸性。
【修正例题】
(T)石蕊试纸在酸性溶液中变红。
上面的例子中,我们完全可以去掉那些无用的部分,保留重要的观点即可。也可以改变句子的句法结构使句子变得简洁、明了,利于学生正确作答。
5.试题正确与错误的题数应大致相同,且以随机排列的方式呈现
是非题很容易造成学生猜测作答。当学生遇到不会做的试题时,就会作出猜测。因此,为了避免学生作答时盲目猜测,在编制试题时,应尽量让正确与错误的试题数大致相同,防止因学生猜题而造成能力评价的误差。正确与错误的试题应按随机的方式呈现,以降低学生猜测的倾向。
6.试题的表述应清晰、明确
是非题中试题的表述要清晰、明确,不能含糊其辞、“或左或右”,否则会影响学生作出正确的评判。
7.试题中的陈述应避免直接使用教材中的原话
试题的取材不能一成不变地引用教材的内容,应适当地加以组织加工,以达到评价学生能力的目的,而不至于只评价学生的再认能力。
8.避免使用没有任何来源的观点,意见性的陈述必须指出参考资料的出处或依据
一般情况下,意见性的陈述并无对错之分,不能让学生把它视为事实来作答。因此,为了避免有争议,在凡涉及相关的个人意见、观点等时,都应列出其来源或依据,这样材料才具有说服力。
【不良例题】
(T)五权分立的政府比三权分立的政府要好。(余民宁:《教育测验与评量:成就测验与教学评量》,158页,台北,心理出版社,2002。)
【修正例题】
(T)根据孙中山先生的观点,五权分立的政府比三权分立的政府要好。
二、什么是匹配题
(一)匹配题的含义及使用
匹配题(matching item)是由两列词或短语组成的,要求学生将一列中的每一条与另一列的相匹配,又称为配对题。需要从另一列中找到对应信息的项目称为前提项,从中作出选择的那部分称为反应项。两列项目数完全相同的称为完全匹配题,不相同的称为不完全匹配题。
凡是学习结果强调的是判断两种事物之间联系的能力,并且有同质的前提项和反应项,那么就可以使用匹配题。一般认为,比较重要的联系有:([美]R.L.Linn & N.E.Gronlund:《教学中的测验与评价》,106~107页,北京,中国轻工业出版社,2003。)
人物……成就 日期…… 历史事件
术语……定义 规则…… 例子
符号……概念 作者……书名
外语单词……英文对应词 机器……用途
动植物……类别 原理……说明
物体……物体名称 部件……功能
匹配题的具体形式如例1。
例1
认真阅读下列历史事件和日期,从右边的反应项中选出一个最适合的,并填写在左边前提项的括号里。
前提项 反应项
(H)1《辛丑条约》签订于 A1840年
(B)2《南京条约》签订于 B1842年
(F)3《马关条约》签订于 C1858年
(E)4《中法新约》签订于 D1860年
(C)5《天津条约》签订于 E1885年
F1895年
G1899年
H1901年
(二)匹配题的优点及不足
匹配题使用的范围很广,可与其他类型的试题连用来测量较高层次的认知能力。它的形式紧密,效率高,能在较短时间内测量到大量的相关内容,评分简便、客观、快速、公正,有效地避免了人为的主观因素的干扰。但是,匹配题大多只能测量一些关系性的死记硬背的知识,不利于学生知识的应用和迁移;而且相关的线索较多,对学生的作答有一定的暗示性。编制具有足够同质性反应项的试题很困难,而且对编题人员的要求相对较高。
鉴于编制匹配题同质性难的问题,可以采用多项选择来解决,因为每个题目都与一个特定的结果直接相联系。只有当同质材料使匹配题能更加有效地测量同样的成就时,才选用匹配题。
(三)匹配题的设计
1.指导语必须明确、清晰
在试题中,指导语必须清楚明确地说明答题的要求、原则,不至于学生因不懂题意而盲目作答,导致不必要的错误。同时,也可以节省测量的时间。
2.题目陈述的内容必须是同质的或接近的(应都属于同一类别或同一性质、关系的事物)
在编制试题时,必须注意内容的同质性,不要泛泛而谈,这样有利于增强试题选项的迷惑性,达到辨别学生层次和所掌握的知识水平的目的。否则,会增加或降低试题的难度而达不到评价的目的。
【不良试题】
前提项 反应项
(3)中国最长的河流 1. 1840年
(4)《花非花》的作者 2.珠穆朗玛峰
(2)世界最高的山峰 3.长江
(1)鸦片战争发生于 4.白居易
该试题中前提项分别涉及河流名称、人名、地名、事件发生日期,学生即使缺乏相应的知识,也可以根据反应项的不同性质作相应的分析,猜出正确的答案。因此,在设计试题时,题目的内容应是同质的,以增强选择的迷惑性,利于鉴别学生的能力。
3.应尽量编制不完全的匹配题,而且每个备选项被选的次数应不受限制
编制试题时,尽量采用不完全的匹配题,对备选项被选的次数不加限制,可以被选一次或两次或三次等,这样有利于减少学生在作答时凭借猜测来回答的机率,增强试题的有效性和鉴别力。反之,若题干与选项一一对应,作答中最后一对选项就如同虚设,甚至对学生的整个作答产生暗示作用。因此,设计匹配题时,应尽量使用不完全的匹配题,如下例。
例1
请思考下列叙述,从右边的反应项中选出一个最适合的,并填入左边前提项的括号内。(余民宁:《教育测验与评量:成就测验与教学评量》,162页,台北,心理出版社,2002。)
前提项 反应项
( F )1.恍然 A.轻巧的样子
( G )2.妩媚 B.辽远的样子
( D )3.沸沸然 C.稀少的样子
( E )4.烂漫 D.腾涌的样子
( C )5.寥寥 E.光彩纷呈的样子
F.忽然领悟的样子
G.姿态美好的样子
H.模糊不清的样子
4.题目陈述的内容应当简洁
在试题的陈述中,题目应简洁、明确,将更简练的反应项放在右边,而且反应项应按一定的规律如时间先后顺序、数字大小或字母的先后顺序等随机呈现,这样可以减少学生凭记忆的线索或盲目的猜测方式来作答。如下例。
例1
仔细阅读下列陈述,从右边的反应项中选出一个最适合的,并填入左边前提项的括号内。注意:B栏的信息可以使用一次、多次或不使用。
A栏 B栏
(A)1.《中国社会各阶级的分析》 A.1921~1927
(D)2.《论十大关系》 B.1927~1935
(C)3.《〈共产党人〉发刊词》 C.1935~1945
(B)4.《反对本本主义》 D.1945~1958
(A)5.《国民革命与农民运动》 E.1958~1976
(D)6.《目前我们的形势和任务》
(B)7.《星星之火,可以燎原》
5.试题中选项和被选项的数目应在10个以内,同时应减少与答题有关的线索
试题中前提项和反应项的配对数目过多,就会使材料难以达到同质的要求,而且容易给学生提供不必要的作答线索,也会增加学生作答的时间。在限定的时间内,反应项数目过多的匹配题就很容易变为对学生的阅读和理解速度以及反应的准确性进行评价,而偏离了命题的本意。因此,试题中选项和被选项的数目应在10个以内,4~7个为佳,这样利于学生在限定的时间内作答。
6.应将同一匹配题中的所有选项和被选项放在同一页试卷上
将试题的所有部分放在同一页上,有利于学生减少翻页寻找选项的时间,而且也不会出现漏答的情况,同时也有利于提高学生作答的速度和测验的效率。
三、什么是简答题
(一)简答题的含义及使用
简答题是指要求被试(学生)对所提问题用简短的语句来回答的一种题型。回答的内容可以是几个字词,也可以是几句话。常用的简答题类型有解释题、直接问答题、列举题、简要说明题等。
例1(直接问答题)
“西安事变”发生在哪一年?
例2(列举题)
我国古代的四大发明是什么?
例3(解释题)
什么是光合作用?
例4(简要说明题)
请简要说明唐朝兴盛的原因。
(二)简答题的优点及不足
简答题适合于测量学生对所学基础知识、定义、原理等内容的回忆和再现的情况,在一定程度上也可以评价学生推理和解决问题的能力。和填空题一样,简答题的编制较灵活、简便,可以从不同方向、不同侧面考虑出题的内容,有利于增强对学生所学知识进行评价的准确性,而且不受学生猜测因素的影响。
由于简答题的以上特征,也限制了它难以对高层次的教育教学目标(如对知识的综合、分析、评价等)进行很好的评价,而且评分易受主观因素的影响(如学生作题时字迹清晰度、错别字、教师评分时的主观性等),客观性不强。
鉴于简答题的限制,可将简答题与多项选择题相结合,组成新的题型——选择说明题,即要求学生在所提供的选项中选出正确的答案,然后解释原因。
选择正确的答案,并指出其理由。
我国社会主义的根本任务是(B)
A.把我国建设成高度发展的社会主义强国
B.发展生产力
C.实现祖国的统一大业
D.在社会主义基础上实现中华民族的伟大复兴
理由:
(三)简答题的设计
鉴于简答题的优缺点,在设计简答题时应注意遵循以下编制原则。
1.问题的陈述应简洁、明确
简答题的试题陈述要简洁、明确,使学生能够明确掌握试题的要求,并能正确作答,而不会在理解题意上花费过多的时间。
【不良例题】
写出世界上五大人口众多的城市名称及其所在的国家。
【修正例题】
写出世界上五大人口最多的城市名称及其所在的国家。
2.问题的答案要简洁、唯一,避免有争议的答案存在
问题的答案要尽量唯一,避免有争议的答案。如果答案确实难以确定时,应选择最佳的,以利于评分的客观性和公正性。
【不良例题】
我国的四大发明是什么?
【修正例题】
我国古代的四大发明是什么?
3.应侧重于考查学生对所学知识的应用和迁移
问题的陈述应着重于考查学生对知识的应用和迁移,要灵活多样,注重与实际生活相结合,而不要只考查书本上的“死知识”,那样不利于学生能力的提高。
4.在考查某一公式的实际应用时,所提供的数字要便于计算
试题中,涉及计算的数字不要复杂化而要简洁,避免给学生的计算带来困难,而影响学生的作答。
5.问题的陈述应尽量以直接陈述为主,避免间接陈述
问题的直接陈述较自然,而且问题的结构很严谨,也便于学生理解。而间接陈述则会影响学生对问题的理解,不利于学生对问题的掌握及正确作答。因此,在设计试题时,应侧重于以问题的直接陈述为主,避免使用间接陈述。
四、什么是选择题
(一)选择题的含义及使用
选择题在当今客观测验中被认为是最基本、使用最广、影响最深远的一种试题类型,尤其是配合电脑的使用,使得阅卷、记分、试题与测验分析结果都相当快速与正确。
选择题(multiple -choice item)是指从多项选择中挑选一项正确选项的试题类型,它由一个“题干”和几个“选项”组成。题干是根据所要考查的内容而编制的一个问题或一句不完整的话。选项则是根据题干而设计的几个备选答案。备选答案中正确的答案称为“正确答案”或“最佳答案”,错误的答案称为“错误答案”或“迷惑性答案”。选择题按备选答案中正确答案的个数,分为单项选择题和多项选择题。单项选择题在备选答案中只有一个正确答案,多项选择题在备选答案中有两个或两个以上的正确答案。因此,在编制试题时,应明确说明选择的要求。
选择题的类型有许多,每种类型都有其编制目标和功能特性,如能熟悉各类型的编制目标和格式,再配合每次编制测验的目的,就能编制出符合使用需要的成就测验来。因此,这里有必要先介绍这些常见的选择题类型。常见的选择题,可以按照其所能测量到的认知目标层次的高低,归纳为下列由低到高排列的五类。其中每类题型都有其特别的编制格式,只要熟悉此格式,并加以变化,就能随时设计出各式不同内容的复本试题来。现分别说明如下(其中,P表示“问题的命题,并且写在题干里”;C表示“结果,为K个可能的选项”;→表示“产生、导致、得到”的意思)。(余民宁:《教育测验与评量:成就测验与教学评量》,132~137页,台北,心理出版社,2002。)
类型Ⅰ:P→C(最佳式选择题)
说明:此题型表示一个命题只产生一个结果,即学生必须根据试题命题的陈述,从K个备选项中挑选出一个正确(或最佳)的答案。
目标:主要是测量名词的记忆能力,也可以用来测量理解和应用等层次的学习目标。
例1(选一个正确的答案)
《鲁提辖拳打镇关西》一文选自下列哪一本书?(*为正确答案,以下同)
A.《西游记》 B.*《水浒传》 C.《三国演义》 D.《红楼梦》
例2(选一个最佳答案)
一份测验在1万名青少年中测试,用KR20公式计算它的信度系数是0.98,我们可以说这份测验的_________
A.效度高 B.区分度高 C.信度高 D.*内部一致性高
注:这种类型的试题有个变例,即:「如果……则」。
例3
如果函数y=ax2+bx+c是偶函数,则( )(黄光扬:《教育测量与评价》,92页,上海,华东师范大学出版社,2002。(略有改动))
A.c=0 B.*b=0 C.a≠0 D.bc≠0
类型Ⅱ:P1∩P2∩……∩Pn→C(推理式选择题)
说明:此题型表示交集(即∩)数个命题以产生一个结果。学生必须在多个命题条件的共同限制下进行思考,然后从K个备选项中挑选出一个正确的答案。这种类型可以增加试题的难度和复杂性,能测量出较高层次的认知能力。
目标:主要是测量应用、分析及推理层次的认知能力。
例1
某班平均成绩为90分,标准差为4,A学生的得分为94,问A学生的Z分数是多少?
A.2.0 B.*1 C.-1.5 D.-0.5
例2
兄弟二人共有50元,哥哥买了20元的文具,弟弟买了10元的糖果后,二人的钱变得一样多,问:原来兄弟二人各有多少钱?
A.哥31元,弟弟19元 B.*哥哥30元,弟弟20元
C.哥哥20元,弟弟30元 D.哥哥36元,弟弟14元
类型Ⅲ:P∈C(归类式选择题)
说明:此题型表示命题是属于(或包含于,即∈)结果中。学生必须能够知道所陈述的命题应该归到哪一类结果中,然后从K个选项中来分辨。这种类型的试题只要变化一下命题或结果(二者之一皆可),便能产生另一复本试题。
目标:主要是测量分类层次的认知能力。
例
孔子的最大成就在哪一方面?
A.政治方面 B.艺术方面 C.*教育方面 D.历史方面
类型Ⅳ:(P1∩P2)∪(P1∩
)∪(
∩P2)∪(
∩
)……→C(组合式选择题)
说明:此题型表示题干中有M个命题,各有对或错之分,然后要求学生分别判断其对错,再从2M个可能结果中,选出正确的一个。如果题干所提供的命题数是两个(即M=2),则可能产生4个不同的选择,其中有一个是正确的,三个是错误的(即诱答选项);如果命题数是三个(即M=3),则可以产生8个不同的选择,其中有一个是正确的,七个是错误的,当这种情况出现时,选择题的四个选项最好是安排“两错一对”或“两对一错”的选择,而不要安排“三错一对”“三对一错”“全对”或“全错”的选择让学生挑选,以降低学生猜中的几率。
目标:主要测量综合与评鉴层次的认知能力。
例1(两个命题时)
(1)失败「乃」成功之母──你的 (2)家祭勿忘告「乃」翁──你的
上述「乃」字的用法,哪一个正确?
A.(1)和(2)都正确 B.(1)正确,(2)不正确
C.*(1)不正确,(2)正确 D.(1)和(2)都不正确
例2(三个命题时)
(1)使用DIMENSION和DECLARE来定义数组是没有区别的
(2)刚定义的数组中每个元素都是没有值的
(3)同一数组中的各元素不但取值可以不同,数据类型也可以不同
以上对数组的描述中,哪个是正确的?
A.*(1)和(3)正确,(2)不正确
B.(2)和(3)正确,(1)不正确
C.(1)和(2)不正确,(3)正确
D.(2)和(3)不正确,(1)正确
类型Ⅴ:P1:P2::P3:C(类推式选择题)
说明:此题型表示第一个命题对(versus,即:)第二个命题的关系,犹如或相当于(same as or similar to,即::)第三个命题对一个结果的关系。即要求学生必须先判断前面两个命题间的关系,然后推论后两个命题间应有的关系是什么,再从四个或多个选项中选出一个正确的选项。
目标:主要是测量演绎及归纳相关事项的能力,以及应用、综合、评鉴等认知能力。
例1
中国:北京::英国:_________
A.华盛顿 B.莫斯科 C.*伦敦 D.巴黎
注:这种类型的试题有个变例,即「P1:C1::P2:C2」
说明:第一个命题对(即:)第一个结果的关系,犹如(即::)第二个命题对第二个结果的关系;这种变例通常也用来测量推理与判断能力。
例2
四川对_____的关系,犹如广东对_____的关系。
A.*成都,广州 B.银川,广州
C.成都,济南 D.南京,深圳
例3
黄瓜→冬瓜,苹果→?
A.水果 B.糖果 C.*橘子 D.果树 E.国光
(二)选择题的优点及不足
选择题可以测量出学生各种不同层次的学业成就,也可适用于不同学科范畴的课程内容,用来评价学生的认知能力。选择题可以与电脑配合使用,使得评分快速、客观、公正,更科学化。因此,它已成为当今教师自编成就测验所普遍使用的一类题型。
选择题具有以下优点:(1)适用范围广,能较好地考查学生各个层次的认知能力,如学生的记忆、分析、推理和应用知识的能力等;(2)取材广泛,受学生猜测因素的影响较小,信度较高;(3)编制比较灵活,可以根据测试的目的,调整试题的难度,从不同的角度评价学生各层次的能力;(4)评分较客观公正,而且可以与电脑联合使用,评分省时、省力。
但是,选择题在使用与编制中也存在一些不足:(1)与论述题相比,选择题的编制相对费时、费力;(2)要编制出“似是而非”的良好的诱答选项或迷惑性选项很困难;(3)由于选择题的选项是相对固定的,测不出学生问题解决、材料的组织与表达等能力;(4)选择题中试题的得分可能受学生阅读理解能力的影响。
(三)选择题的设计
一份有效的选择题,不仅能够很好地鉴别出学生对知识的掌握程度,也能甄别出学生对问题的解决能力和知识的迁移能力。为了更好地发挥选择题应有的功能,在编制选择题时应遵循以下设计原则。
1.题干陈述的内容应完整、简洁、明确
题干的陈述应简洁、明确,而不要叙述太过直接或冗长。如果一句话无法完整、清楚地表达而被选项分割成两部分,这样就会增加学生对题意的误解。因此,解决的最好办法就是将题干的叙述改为间接问法,使句子的叙述完整、明确,以减少学生对试题的误解,而不至于盲目作答。
【不良试题】(题干的叙述被选项分割,而造成题意被干扰或误解)
Tom_______
A.talk to B.speaks
C.is speaking D.is talking to
his teacher.
【修正试题】
Tom________his teacher
A.talk to B.speaks
C.is speaking D.*is talking to
2.试题所考查的内容应是重要的或关键性的知识
试题中,试题的内容和结构应测量学生学习的重要成果,并且是教材中重要的或是关键性的知识,而不能出现教材中无关紧要的、模糊的或不重要的内容。否则,一方面会增加试题不必要的难度;另一方面,也不能达到评价的真正目的。
【不良例题】
解放战争时期,毛泽东提出十大军事原则,其内容有_________。
A.夺取敌人的据点和城市
B.不打无准备之仗
C.先打中小城市和广大乡村,后取大城市
D.消灭敌人的有生力量
【修正试题】
解放战争时期,毛泽东提出十大军事原则,其核心是__________。
A.夺取敌人的据点和城市
B.不打无准备之仗
C.先打中小城市和广大乡村,后取大城市
D.*集中优势兵力,各个歼灭敌人
3.所编制的试题中,各试题的备选项的个数应相同,一般以四个为宜
一般而言,各试题中备选项的数目应保持一致,不可偏多也不可偏少,以四个为宜,但至多不能超过五个,这样有利于阅卷和评分,也便于对整个试题的统计分析。备选项过少,就会降低试题的迷惑性,学生靠猜测得分的机会就可能增大;而备选项过多,虽有利于增强试题的信度,减少学生猜测的机会,但是编制“似是而非”的诱答项很困难,同时也会降低试题的鉴别力,无法发挥出选择题的区辨功能。
4.正确答案的呈现应该是随机的
通常,教师在编制试题时倾向于将正确答案的选项往后放,以避免学生一眼就看出正确答案,同时,为了减少学生的阅读而尽量将答案放在中间。如果题量少,这种设计是可以的,也是行之有效的;但若试题较多,这种设计就会使正确答案的出现呈现某种规律,为学生的作答提供猜测的机会。一份高质量的测验试题,应避免易被学生猜对的情况。因此,正确答案出现的位置应以随机的方式呈现,避免有规律性的排列;而且,各试题中正确答案在各选项中出现的几率应大致相同,以降低学生猜测的机会。
5.试题应与学生的生活实际相结合,利于学生知识的应用和迁移
在编制试题时,不要照搬教材的内容,而应将内容重新整合,创设新的问题情境,并与学生的实际生活相结合。这样既利于学生对问题的解决,也利于学生对知识的迁移,达到学以致用的目的,也增强了学生对知识的理解和掌握。
6.试题中各备选项在形式上和结构上应大致相同,而且相互独立
在试题中,各备选项应在形式上一致、结构上大致相同,且相互独立,这既有利于增强试题的迷惑性,也可以减少对学生的暗示。如果出现不一致,就很容易产生暗示答案的线索,让具有考试技巧的学生依据线索作答,从而使诱答选项丧失迷惑的功能。
【不良试题】
电子变压器可以被用做([美]R.L.Linn & N.E.Gronlund:《教学中的测验与评价》,126页,北京,中国轻工业出版社,2003。)
A.为了贮存电量 B.*为了增强交流电的电压
C.它可以把电能转换为机械能 D.交流电被转换为直流电
【修正试题】
电子变压器可以被用做
A.储电 B.*增强交流电的电压
C.把电能转换为机械能 D.把交流电转换为直流电
7.选项表述要简洁、清晰,相同的表述应放在题干中
试题中,备选项的表述要简洁,尽可能将各选项中相同的内容放在题干中,避免有重复的材料出现。这样不仅有利于试题的题意清楚、明确,增加试题的可读性,而且可以减少学生阅读选项所花费的时间,提高学生作答的效率。
【不良试题】
两条异面直线的概念是( )(张敏强:《教育测量学》,70页,北京,人民教育出版社,1998。)
A.指在空间中不相交的两条直线
B.指在空间中位于两个不同平面上的两条直线
C.*指空间中不在同一平面上的两条直线
D.指在空间中某一平面与这一平面外的两条直线
注:本例中,选项中出现了相同的字词“指在空间中……两条直线”,并不断重复,因此应将这些相同的内容放入题干中,使试题的题干清晰、明确,也可以使选项简洁。
【修正试题】
两条异面直线是指在空间中_________的两条直线。
A.不相交
B.位于两个不同平面上
C.*不在同一平面上
D.某一平面与这一平面外
8.试题陈述的内容应是唯一的
试题的题干应只提出一个问题,而且问题陈述的内容应该简洁、清楚;同时,试题的答案应是唯一的,应避免有争议的答案存在。要求选出最佳答案时,应在题干或指导语中明确说明,以避免引起争论。
【不良试题】
商品的价值量
A.任何商品都具备的
B.由社会必要劳动决定
C.与生产商品的劳动生产率成正比
D.在商品供过于求时下降,在商品供不应求时上涨
【修正试题】
商品的价值量是由什么决定的?
A.使用价值的大小
B.*生产该商品所消耗的劳动时间
C.*社会必要劳动时间
D.商品的供求关系
9.备选项应具有诱惑力,错误答案要有迷惑性
各备选项与题干都要有一定的逻辑联系,错误的答案应具有“似真性”,错误不能太明显。选择题编制的优劣就在于错误选项的描述是否具有似真性。一个“似真性”的错误选项很容易发挥出选择题应有的诱答或迷惑功能,能将“能力高低”与“能作答与否”的学生区别开来。同时,诱答项只应吸引那些不具备该知识的学生,而不能使所有学生都陷入这个“迷惑”中,否则达不到选择题应有的鉴别功能。
【不良试题】
英国的首都是( )
A.东京 B.华盛顿 C.*伦敦 D.坎贝拉
【修正试题】
英国的首都是( )
A.伯明翰 B.曼彻斯特 C.*伦敦 D.阿伯丁
增加诱惑项迷惑度的方法一般有:(1)使用学生共同的常犯的错误来作诱惑项;(2)以学生惯用的模糊性用语来作诱答项;(3)诱惑项的长度、措辞的复杂性与正确答案应相似;(4)诱惑项中使用迷惑性的线索,如与题干有某种语义联系等;(5)保持诱惑项表面上的同质性。
10.试题中应尽量避免出现“以上都是”或“以上都不是”的选项
“以上都是”或“以上都不是”的选项,很容易使学生觉得它具有暗示作用。当学生在对备选项进行判定时,若判定两个是正确答案时,他就会选择“以上都是”,而判定两个错误的选项时,他就会立即选择“以上都不是”。因此,这种题项的出现,增加了学生猜测的机会。而且,在选择最佳答案时若出现该选项就会引起争议,达不到答案唯一的目的,还会降低试题的有效性。因此,应尽量避免这种选项的出现。
【不良试题】
下列日常用具中,哪种用具是使用电动机作为动力的?
A.电话机 B.烤面包机 C.电视机 D.*以上都不是
11.题干和选项的表述中应避免出现暗示学生作答的线索
一般而言,无论是正确答案还是诱答选项,如果叙述冗长、语法结构不一致、使用特殊的字词或内容重复等,都会对学生的作答提供暗示,引起学生的猜测行为。为了减少这种猜测行为,在编制试题时,题干和选项都应简洁、清晰,各选项在形式上应一致,句法结构上也要大致相同。
【不良试题】
Lili : Lucy, let’s_______to the movie tonight
Lucy: Sorry, I don’t like to go to the movie
A.play B.listen C.*go D.run
注:本例中,题干与正确答案的叙述,都使用了相同的词,对学生的作答有暗示。
12.试题的数目不要过多
一份测验中试题的多少,应根据学生在一次考试情境中所能作答的数量为参照。试题过多,会变成速度测试,达不到评价的目的;试题过少,信度就会降低,也不容易评价出学生的学业成就。因此,试题的数目不应过多,要适中,要视学生群体的年龄特点而定。
13.试题中应尽量使用肯定的陈述,若有否定的字词出现,应着重强调,以警示学生
通常,试题的题干应用肯定陈述,避免用否定陈述。否定结构过多地使用,会给学生带来阅读理解上的困难,不利于学生作答,也不利于教师了解学生对知识的掌握程度;而且,在某种程度上,肯定结构要比否定结构更具有教育、启发意义。所以,应尽可能少用否定的题干叙述方式。不过,在鉴别错误时,还是可以使用否定陈述,此时应特别强调或突出题干中的否定字词,以提醒学生不要忽略该字词而错误作答。
【不良试题】
请选出没有对偶的句子_________
A.海阔凭鱼跃,天高任鸟飞
B.*水不在深,有龙则灵
C.横眉冷对千夫指,俯首甘为孺子牛
D.朱雀桥边野草花,乌衣巷口夕阳斜
注:本例中,没有特别强调否定陈述中的否定字词,很容易导致学生错答。
【修正试题】
请选出没有对偶的句子__________
A.海阔凭鱼跃,天高任鸟飞
B.*水不在深,有龙则灵
C.横眉冷对千夫指,俯首甘为孺子牛
D.朱雀桥边野草花,乌衣巷口夕阳斜
14.根据评价的目的,可以通过改变试题题干或选项来调整试题的难易程度
通常,根据评价的目的,为了增强试题的难度或复杂性,鉴别学生更高的认知能力,可以通过改变题干或选项中的任何一个来控制试题。但各备选项之间应是在教育意义上的差别,并且能与所要评价的学生的学业成就相一致。
15.在同一测验中,各试题间应彼此独立,没有任何逻辑上的联系
各试题间应是彼此独立的,这样可以避免这个试题为另一试题提供暗示答案的线索,即每一试题的作答都应与其他的试题无关,是完全独立的,而且也不存在任何逻辑上的联系。因此,在试题编制完成时,应仔细检查各试题,使各试题的回答与记分都能相互独立,从而促进评价的客观公正性。
16.若有其他类型的试题更适合评价的要求或目的时,就不要使用选择题
上述的编制原则,可以灵活使用,以编制出更具新颖性、创造性和有效性的试题。根据评价的目的,如有更好的题型能达到该要求,就尽可能地使用该题型,而不要仅仅使用选择题型。
五、什么是填空题
(一)填空题的含义及使用
填空题是指在一个完整的陈述中,命题者故意抽去关键性的短语、词组、时间或重要性的概念、地名、人名等,让被试(学生)来补充完整。如下例。
《红楼梦》的作者是___________。
(二)填空题的优点及不足
填空题的编制容易,而且取材范围广,可用来测量学生对知识的回忆、再现及理解能力,可特别使用于诊断性的测验中。该题型大大减少了学生作答时的猜测因素,也省时。
但是填空题也有其不足:命题陈述中唯一的正确答案较难得到,评分相对于前面的几种试题类型要麻烦、费时,而且学生作答的各种情况如字迹的清晰性、有无错别字、是否有增字或漏字的情形等都会影响评分的客观性和公正性;测量学生的能力层次有限,只能评价学生对知识的回忆和再现能力,而较难对更高层次的认知能力进行评价,也易养成学生死记硬背的不良学习习惯,不利于学生对知识的应用和迁移。
可以将填空题型与选择题型相结合,编制改良式的完形测验(cloze test)。这种题型是从所选择的文章中故意省去较为重要的内容,然后要求学生根据文章的内容进行分析,从所提供的众多选项中选择出正确的答案。这类题型在外语测验中运用较多。
(三)填空题的设计
1.所要测试的应是重要的或关键性的知识内容
试题中空格处所填写的内容应是重要的或关键性的知识,能体现出学生对该知识的掌握和理解程度,具有一定的代表性。否则,填空题就很容易成为只评价学生零散知识的工具,而使得评价变得毫无意义。
【不良试题】
珠穆朗玛峰是世界___________。
【修正试题】
世界最高的山峰是___________。
2.填空题的内容陈述要简洁、明确,而且所填写的答案应唯一
试题的题意要明确、限定要严密,并且答案应是唯一的。若题意不清,模棱两可,就可能出现多种答案,达不到评价的目的,也不利于阅卷评分,所以要避免有争议的答案出现。
【不良试题】
只要努力学习,就能__________。
注:该例中的限定不严密,所要填写的答案也不唯一,达不到考核学生的目的。
3.试题中所要填写内容的空格不要太多,应突出重点
试题中所要填写的空格数目应适中,而且应突出重点。如果空格过多,学生很难理解题意,难于作答,也很容易造成学生死记硬背答案的现象,而不能真正地掌握知识。待填写的空格也不要过于宽泛,否则会出现众多的答案,不利于评分的客观统一性。
【不良试题】
运动是物质的_________和_________,包括_________。
4.命题中应尽量采用直接提问的方式来要求学生作答,少用不完全的陈述
使用直接提问的方式来命题,题意清楚、明确,符合答案唯一的要求,同时也可以避免为学生提供作答的暗示性线索。而不完全陈述则可能会引起不必要的争论,造成题意不明,使学生难以正确作答。
5.试题中所要填写空格的长度应相同
所填空格的长度应大致相同,避免随正确答案字数的多少而使空格长短不一,为学生的正确作答提供线索或让学生形成定势:空格长的,填写的内容要多些;空格短的,所要填写的内容就较少。因此,所要填写的空格应留得一样长,并且让学生充分作答,可以避免无意中为学生的作答提供暗示性的线索。
6.如果答案是数字,则应明确作答要求
在试题中,若是有关计算的,最好应指明所填答案的要求,如相关的单位、数字的精确程度等,以利于学生正确作答。这样,既有利于学生所填答案的准确性,也可以使他们避免在进行过多的计算上浪费时间,从而提高学生作答的效率。
【不良试题】
一个圆的半径为5 cm,则其面积为_________。
注:该例题没有明确指明数字的精确度,容易导致争议性的答案,且答案不唯一。
【修正试题】
一个圆的半径为5 cm,则其面积为_________。(精确到小数点后两位数字。)
7.所要填写的空格应尽量放在句末
把空格放在句末,可以使试题看起来更清楚,也可以使记分快而准确,同时还可避免将空格放在句中将试题分割成两部分而造成的误解。
【不良试题】
__________写了传世神话之作《西游记》。
【修正试题】
《西游记》的作者是_________。
8.试题的陈述应避免直接摘抄原文
在编制试题中,若以教材中的内容为题材时,不应直接照搬原文,应对其进行适当的加工。可依据内容创设新的问题情境,促进学生对知识的应用和迁移,避免学生只是一味的对知识进行死记硬背而得不到提高。
9.根据评价的目的,可以采用多种形式的填空题
在命题中,可根据不同的评价要求,编制不同类型的填空试题。如,为了避免学生对知识的死记硬背,保证答案的唯一性,当所要考查的内容具有序列性时,可采用序列型的填空试题,即让学生按提供的事物的先后次序,根据问题的要求,将其排成先后次序,用1、2、3、4等数字来代表其次序。
例1(序列型试题)
依据下列著作写作的先后顺序排列其先后。
( )《中国社会各阶级的分析》 ( )《〈共产党人〉发刊词》
( )《关于修改党章的报告》 ( )《反对自由主义》
( )《整顿党的作风》 ( )《反对本本主义》
改错型试题既能检查学生对知识的再认能力,又能考查学生的再现能力。当所要考查的是比较容易混淆的内容时,采用该题型是比较适当的。这种题型要求学生在试题中错误的部分下边画线,将正确的内容填入括号内。