上一节已介绍了几种客观式的评价题型,虽然它们对评价很重要,但它们大多数只能评价学生较低层次的认知目标和能力,而对学生较复杂或较高层次的学业成就的评价则难以胜任。因此,本节将介绍一些对较高层次的学业成就进行评价的方法及其编制原则,以利于增强教学评价的有效性,促进学生对所学知识更好地应用和迁移。
一、什么是解释性练习
(一)解释性练习的含义及使用
解释性练习(interpretive exercise)又称归类学习(classification exercise)、答案分类题(key-type item)或万能列表题(master-list item),它是由一系列基于同一资料的客观题目组成的,这些资料是以书面材料或图表的形式呈现的。([美]R.L.Linn & N.E.Gronlund:《教学中的测验与评价》,138页,北京,中国轻工业出版社,2003。)即给学生一篇导论性的阅读材料,要求学生根据该文章所提供或所隐含的信息,在一连串事先编制好的问题上作答,问题常以题组的形式呈现。其中,导论性材料也可称为背景材料,它可以为叙述性文字、图表、公式、符号、模拟的情境等。
解释性练习的题型形式多样,它可以与上述客观性测验中的任一题型相组合,不过大多是以选择题或是非题来呈现的。它不仅能测量客观性评价所能评价的认知能力,也能测量学生的理解和推理能力、问题解决能力及创造性等。
一份解释性练习编制的好坏,关键在于教师所提供的背景材料。只有选好适当的导论性材料,教师才能综合上述各类型试题的命题原则,以不同的方式、从不同的角度来编制高质量的解释性练习试题。解释性练习试题的编制内容取材广泛,可以是文字性的阅读材料、图表资料,也可以是一个情景故事或一些实验的公式等。
例1(阅读式的解释性习题)(余民宁:《教育测验与评量:成就测验与教学评量》,170、171页,台北,心理出版社,2002。)
青青河畔草,郁郁园中柳,盈盈楼上女,皎皎当窗牖,娥娥红粉妆,纤纤出秀手。昔为倡家女,今为荡子妇,荡子行不归,空床独难守。
1.本文属于何种体裁的诗?
A.*古诗 B.乐府 C.绝句 D.律诗
2.本诗中,“郁郁”一词,以下哪种解释是对的?
A.形容人的心情郁闷 B.形容天气不好
C.*形容草木茂盛 D.形容光线太暗
3.本诗的主旨是:
A状述春天的风光明媚 B描写倡家女悲惨的身世
C形容倡家女的美貌 D*抒写倡家女的悲怨情怀
例2(情景式的解释性习题)(余民宁:《教育测验与评量:成就测验与教学评量》,170、171页,台北,心理出版社,2002。)
清明节,小强和爸爸、妈妈、妹妹从台北到南部祖父家,一同和亲戚上山扫墓。小强调皮好玩,不慎跌倒摔了一跤,妈妈赶紧替他止血敷药,并说:“小强,痛不痛,好了一点儿吗?清明节扫墓是表示对祖先的敬意与怀念,不可以那么调皮,知道了吗?”妈妈帮小强包扎好了之后,祖父带领他们到了一墓地前说:“我们现在所要祭拜的先人是中国的抗日英雄,也是我的哥哥。”请问:
(1)小强台北家的组织性能是什么?
A.血缘家庭 B.*核心家庭 C.中家庭 D.折中家庭
(2)小强摔了一跤后,妈妈对他说的一番话,包含了家庭的何种重要功能?
A.教育和生物 B.心理和娱乐 C.安慰和责备 D.*心理和教育
(3)祖父带领他们祭拜的先人是小强父亲的什么人?
A.故伯祖父 B.故叔祖父 C.*故伯父 D.故叔父
(二)解释性练习的优点及不足
解释性练习具有以下优点:(1)可以测量学生较复杂的学习结果,也可诊断学生过程性的学习;(2)题型多样,可与前述各类题型结合,组成不同种类的解释性习题;(3)背景性或导论性材料的使用,为学生的回答及对其评分提供了相同的标准和前提;(4)解释性试题如同选择性试题一样,评分较容易、客观、可靠。
但是,解释性练习也存在一些需要注意的地方:(1)切合的背景性或导论性材料难找,编制有独创性的解释性习题比较费时;(2)由于这一题型是以背景性或导论性的材料为前提的,这就要求学生必须具备相应的阅读理解能力,因此,此类题型不适合于对低龄学生的评价;(3)背景性或导论性材料的提供也为学生作答提供了线索、思路;(4)虽然解释性练习能评价较高层次的认知能力,但难以对学生的创造性、语言组织及表达能力进行很好的评价。
(三)解释性练习的设计
解释性练习是综合前述各类题型而产生的一种新题型,因此,无论采用哪种形式的试题来命题,都应遵循相应的命题原则。而且,要编制一份高质量的解释性习题就必须选好切合的导论性材料来进行设计。因此,设计解释性练习题时,应遵循以下原则。
1.背景材料的选择应以教学目标为依据,而且必须符合学生现有的身心特征
背景材料选择得适当与否,直接关系着解释性练习试题质量的优劣。如果所选择的背景材料偏离了教学目标,编制再好的解释性练习试题也无济于事,达不到评价的真正目的。因此,教师在编制试题时,应以教学目标为依据,根据学生现有的身心特点,选择符合学生现有程度和教学目标的背景材料,这样才能提高试题的质量,使评价有效地进行。
2.所选择的背景材料应具有可读性、趣味性,内容也应具有一定的新颖性
为了评价学生复杂的学习结果,背景材料不应只是重复学生已熟悉了的材料内容,而应是具有新颖性的材料。这些材料可从有关的报刊、杂志、课外读物里挑选,使其符合学生现有的阅读水平,内容简短、清楚,富有教育意义和趣味性,可读性应较强,这样可以有效地拓宽学生的知识视野,利于学生对知识的整合、应用和迁移。
3.背景材料应简短,具有一定的价值(如启发教育意义等)
所挑选的背景材料应简短,内容清楚、明确,这样可以减少阅读技能对评价的影响。如果选择的材料相对较长,应适当对材料进行重新加工、整合,同时要保持原材料的特点和主旨,体现材料的相对完整性。同时,这些材料应对学生的学习或生活有一定教育、启发意义,利于激发学生的学习动机,促进学生的学习。
4.依据测验的目的,对选择的背景材料可进行适当的加工、组织,整合后的材料内容应清晰、简洁,但又不失原文的风格或写作特点
一般而言,所选择的背景材料多数都要根据测验的目的进行一些加工、整合,充分发挥材料的有效性。在对材料进行加工时,应尽量保持原材料的风格、特点,整合后的材料内容清楚、明确,这样利于更好地评价学生的各种认知能力。
5.背景材料所涉及的文字、数字、图表、图片等应印刷清晰,而且应准确无误
背景材料中,有关的文字、数字、图表等都应印刷清晰,正确无误,易于辨认,这样可以有效地减少因印刷不清而造成的阅读困难,便于学生的阅读和提高学生作答的效率。
6.在依据背景性材料设计试题时,应将同质性问题进行归类,以避免重叠,同时应遵循相关类型试题的设计原则
根据背景材料设计试题时,应将同质性问题进行归类且各类别之间不应有重叠,每个选项都是独立的,而且每个试题应只有唯一的答案。同时,测验题目的设计也应参考相关客观式题目的设计原则,使之有效地组合成一份高质量的解释性练习试题。题目中,还应避免有暗示性的作答线索。
7.试题数目的多少应与所提供背景材料的长度成比例
在编制试题时,应根据背景材料的长度来设计试题的数目。如果材料简短却提出过多的问题,或者让学生分析一篇相对较长的材料而只提一两个问题,显然,效率都是很低的,不经济,同时也不能达到评价的目的。因此,试题数目的多少应根据所选背景材料的长度而定,这样才能使编制的试题效率更高,也更经济。
二、什么是论述题
(一) 论述题的含义及使用
1.论述题的含义
一般来说,前面所介绍的几种类型的试题可以归结为客观式的测验试题。虽然它们所评价的学生能力层次较广,但仍然难以对学生的组织、表达、思维的流畅性等能力进行评价。要达到对这些高级能力的评价,只有选择主观性测验,其中论述题是最常用的方式。
论述题是指向被试(学生)提出问题,要求他们根据问题的要求,自己组织语言来呈现一份相对较长答案的试题。该题型允许学生根据试题的要求自由作答。学生的回答可以是一个简明、扼要的答案,也可以是学生对所提问题的深层次的思考,并充分陈述自己的观点。根据学生陈述己见的自由发挥程度,论述题分为两类:限制性反应论述题和扩展性反应论述题。
(1)限制性反应论述题。限制性反应论述题是指限定了答题的内容和形式,学生的作答必须在一定的范围内进行,作答的篇幅也受到限制,不能自由发挥。限制性反应论述题有口头和书面两种形式。口头形式是指要求学生以口头表达的方式来回答被提的问题,书面形式则是要求学生以写作的形式呈现自己对问题的理解、看法和观点等。这两种形式的问题都限定了题目的反应方式和答案标准。
例1(口头形式的限制性反应论述题)
说说两次国共合作的异同点。
例2(书面形式的限制性反应论述题)
描述HIV、AIDS的三种主要传播途径,100字以内。
限制性反应论述题可以评价学生的多种学习结果,如对事物的表达关系、比较关系、对问题提出相应的假设、得到问题适当的结论、解释问题的因果关系、对问题的陈述作出预测等。它主要适合评价学生的理解、应用和分析等层次的学习结果,不太适宜评价综合、评鉴等层次的学习成果。
限制性反应论述题有以下缺陷:和选择题相比,它在阅卷和记分上较费时、费力,而且评分较不易客观;试题取样范围有限,较不具有代表性,内容效度较差。和扩展性反应论述题相比,它难以评价组织、统整和创意表达的能力。
(2)扩展性反应论述题。扩展性反应论述题是指在所提出的问题下,学生可以自由地组织相关的知识材料,有条理地陈述自己的观点,回答的自由度很大,也称之为申论题。由于自由度大,学生对同一问题的理解不尽相同,故而会出现不同的答案,这就增加了评分客观性和标准化的难度;同时,试题的代表性也不强。扩展性反应论述题侧重于对学生较高层次的认知能力的评价,适合于年龄较大的学生或语言表达能力较好的学生。
扩展性反应论述题有以下限制:给予学生作答的自由度大,不适合用来评价特定的学习结果,而且造成记分上的困难;和限制性反应论述题相比,它的记分难度增大,试题取样范围也更为局限,信度和内容效度受到的影响更大。
2.论述题的使用及评分
(1)限制性论述题的使用及评分。限制性反应论述题在以下几种情况中最适合使用。①教学目标要求学生能够呈现知识,而不是再认知识。原来的选择性反应题目往往难以评价呈现知识的情况。②需要测查的内容相对较少。如果有30个学生,你设计了一个由六道限制性反应论述题组成的测验,这样评分将会花费大量时间。这时,你可以选用少量几道限制性反应论述题,并与客观题目结合起来使用。③还需要考虑测验的安全性。如果担心学生很容易抄袭选择题目的答案,这时选择限制性反应论述题就比较好。通常情况下,编制一个限制性反应论述题比编制一个好的客观题目能节省更多的时间。([美]G.D.Borich & M.L.Tombari:《中小学教育评价》,100页,北京,中国轻工业出版社,2004。)
在对限制性反应论述题评分时,大多是教师事先列出参考答案,然后根据学生的回答来进行参照评分。由于不同的人对限制性反应论述题的评分很难达到相同,即使是同样的回答,也难以给出相同的分数。因此,这类题型的评分易受主观因素的影响。为了尽量做到评分的客观性,增强评价的有效性,应做到如下几点。①编制一份质量较优的限制性反应论述题。问题的表述必须清楚明了,明确规定回答的长度,如规定在多少字以内等,要求学生应尽量减少不必要的错误,如错别字、语法错误等。②应采用多个限制性反应论述题。可以将一个大问题分解成几个相对较小的限制性反应论述题,从不同的角度来评价学生,让学生从多方面展示自己的能力。③对每个问题都要有一个相应的参考答案,并列出相关的评分标准及细则,最好能在最大限度内包括与该问题有关的答案。在评分时,各评分者评价的尺度应尽可能地统一,而不要各持一个标准。
(2)扩展性反应论述题的使用及评分。扩展性反应论述题也适合于测验学生对某事物进行比较和对比、阐述自己对问题的看法和立场并阐明理由、对其他的选择进行讨论和评价等。和限制性反应论述题一样,对年龄较小的学生应以口头表达的方式来进行,对年龄较大的学生则采用书面的形式来进行。
扩展性反应论述题的评分分为整体评分和分项评分。
①扩展性反应论述题的整体评分。整体评分是指从整体的角度来关注论述题的答案。它比分项评分省时。但它们不能给学生提供作出的优良反应和要改进的反应的具体方面的反馈。整体评分时也需要对分数的等级作出相应的详细说明,以利于教师把握评分的尺度,尽可能对学生的回答作出客观的评价。美国国家教育进步评价委员会(The National Assessment of Education Progress,NAEP)使用六点整体评分细则来评价写作(见表2-2)。
表2-2美国国家教育进步评价委员会(NAEP)所规定的写作的整体评分规则([美]R.L.Linn & N.E.Gronlund:《教学中的测验与评价》,169页,北京,中国轻工业出版社,2003。)
|
分数 |
分数点描述 |
|
1 |
对主题的反应只有非常少的信息是与任务相关的。 |
|
2 |
学生开始作出反应,但是没有展开,而是以一种小型、混乱或者毫无联系的方式进行的。 |
|
3 |
内容展开得很少:学生对任务的反应是简单、含糊的,而且有点混乱。 |
|
4 |
展开的:反应包含了必要的元素,但是还没有完全展开或者详细叙述。 |
|
5 |
详尽的:超出任务基本元素部分的良好的展开,以及详细的反应。 |
|
6 |
广泛、详细的描述:反应表现了高度的对写作的各种元素的控制。与那些得分为“5”的文章相比,这些得分为“6”的文章在内容上相似,但是组织得更好,书写更清楚,而且错误更少。 |
②扩展性反应论述题的分项评分。分项评分使教师尽量注意学生答题的细节,并具体到每一个标准的评分方法。这类评分方法可以帮助教师看到学生回答中的优点及不足,并且可以依据评分的标准给学生更多细节上的反馈。但是,有时候教师可能过度地专注于某个细节,计较太多,就会出现偏差,忽视了学生回答的整体性。沃尔夫(Woif)等人设计了记叙文的评分细则,它有五个分项维度。([美]R.L.Linn & N.E.Gronlund:《教学中的测验与评价》,169页,北京,中国轻工业出版社,2003。)这五个维度是:(a)主题,包括考虑主题表达的明确或含蓄的程度,以及教诲或启迪的程度;(b)人物,包括人物塑造的单一、静态或者“丰满”、动态的程度;(c)场景,包括场景是简单还是多功能的,以及它仅仅是陪衬的还是故事展开所必需的;(d)情节,包括它是简单还是复杂的,以及它是静态还是冲突的;(e)意义的传达,包括故事是基于上下文的,还是读者可以考虑的,以及是字面意义的还是象征意义的。 每个维度上的六个表现水平都有具体的描述。
3.论述题评分原则的建议
论述题属于主观式测验,它的评分易受评分者个人主观因素的影响,而且阅卷也较费时,客观性不强。因此,为了尽可能做到评分公正、客观,降低评分者的主观影响,在评分时教师应遵守以下评分原则。
(1)事先应拟订一份评分的纲要,作为正式评分的依据或参照。在论述题的编制中,可能会参照不同的资料而导致出现不同的答案,这就给教师的评分造成了难度。为了评分客观、公正,在进行评分之前,教师应先准备一份评分的纲要,指明每一试题评分的标准及相应答案点的分数值,如答案的重点内容、待评价的答案的组织及各答案点的分值权重等。事先准备的这个评分细则有利于为评价学生的答案提供一个统一的基础,利于评分的客观性。
(2)应根据题目所要评价的认知目标来评价。对学生答案的评价应严格按照该题目所要评价的认知目标来进行。若要评价学生对问题的“理解”和“分析”能力,那么评价学生答案的标准就应放在“理解”和“分析”是否正确和有理上,而对其他的内容如语法的错误、错别字等应尽量少地加以考虑。
(3)在评分时应尽量采用匿名评分。由于在教学中教师对每个学生都形成了一定的印象,因此,在评定学生的试卷时教师很容易受到这种印象的影响,而导致评分出现偏差。如平时一个学习很好的学生,在回答某一问题时,做得很糟糕,这时教师会根据该学生平时的表现而认为“这个学生是勤奋的,只是对问题的表述不够准确而已”,从而出现“差题高分”的现象。为了避免受这种印象的影响,在阅卷时,应尽量采用匿名评分。如将学生的试卷装订在一起,并密封姓名,让教师在评分时能尽量地保持客观、公正,不受对学生印象的影响。
(4)为了评分的客观、公正,评分者应最好一次只评阅一道试题。 一次应只评定同一个问题,等所有学生的这一问题评完后再继续评下一道试题,这样有助于消除影响试题评分的因素,也比较容易保持评分的一致性和客观性,提高评分的信度。同时,应在同一时间段内评阅所有的试卷,避免因评分者的情绪、生理状况等影响评分的客观性。
(5)评分时应将整体评分和分项评分相结合,避免无关因素影响评分的客观性。评分的标准应侧重于试题答案的内容,而不应太重视学生作答的形式。在评分时,应尽量减少学生书写的易读性、有无错别字等因素的干扰。同时,为了对学生进行更真实的评价,教师应先明确试题评价的目的所在,在必要时,可适当对一些不相关或不正确的事实信息进行扣分,促使学生积极思考问题,而不要盲目作答,想到什么就写什么。
(6)如果条件允许,应尽可能让两位或两位以上的评分者独立评阅每一道试题。这样做有利于提高评分的信度,因此,在实际评分时如果条件允许,应尽可能这样。尤其在一些重要的或是重大的考试中,这种评分有利于得到一个令人满意的结果,也有利于增加评分的可靠性。
以上谈及了客观式测验和论文式测验的编制及设计的一般要求与技术,而要编制一份高质量的测验,在很大程度上取决于教师对教学实际情况的掌握和对学生现有学习特点的了解。只有紧密联系教学实际,教师才能编制出一份真正有效的评价工具,才能对学生的学业成就进行有效的评价,促进教与学相互提高。
(二)论述题的优点和不足
1.限制性反应论述题的优点及不足
限制性反应论述题的问题比较容易编制,而且与具体的学习结果有直接的联系,记分也较容易且客观。但是,这种题型很难显示出学生对知识的组织、统整和发展新的反应组织的能力。由于它的这些限制,限制性反应论述题较适合测量理解、应用、分析层次的学习结果,而对综合、评鉴层次的学习结果的评价则价值不大。因此,对于限制性反应论述题的这些缺陷,可采用扩展性反应论述题来解决。
2.扩展性反应论述题的优点及不足
扩展性反应论述题为学生提供了整合知识观念的机会,以及对材料的整体评价和问题解决的机会。它对这些重要学习结果的评价是其他类型的试题无法做到的。但是,其最大的缺陷在于怎样提高评价这些答案的信度,真正有效地对学生的学业成就进行评价。如下例。
例
试描述孟德尔(Mendel)的遗传法则对生物学发展有怎样的影响。
总体而言,论述题具有以下优点:(1)能够评价学生理解、分析、应用、评鉴等多方面的学习结果,这些结果是客观式测验所不能评价到的;(2)论述题的编制相对方便、容易;(3)可以促进学生思维能力和问题解决能力的提高,利于改进学生的学习方法等;(4)可以促进学生语言材料的组织和表达能力的提高,增强写作能力。
此外,论述题在编制和使用中也存在这样一些不足:(1)论述题的取材范围相对狭窄,代表性不强;(2)评分的主观性很强,而且对同一试题内容的评分也不尽相同,有时差别很大;(3)评分易受学生写作能力和作答技巧的影响,而且诸如学生的字迹清晰与否、有无错别字、句法结构是否正确等因素也会影响评分的客观、公正;(4)学生作答及教师评卷都很费时。
(三)论述题的设计
单独就限制性反应论述题而言,无论是口头形式还是书面形式,在编制时都应注意下列问题:(1)编制试题前,应明确要测试学生哪方面的能力,即评价的目的要明确;(2)问题的陈述应清晰、明了,并明确指出有关学生作答的要求及相关的评分标准,使学生做到心里有数;(3)对有关的热点问题或争议性的问题,应让学生陈述自己的态度、观点并给出相关的理由,只要言之有理即可(例如有些人认为教育经费应由政府来承担,你是否同意该观点,并陈述相应的理由);(4)规定学生在限定的时间内作答,并指明问题作答的详细程度;(5)对于低龄学生应尽量限制其作答的时间,而不要规定他们对问题作答的篇幅;(6)问题的陈述应侧重于考查学生理解、分析、应用的能力,而不要只是评价学生回忆的能力。
另外,针对论述题存在的不足,在编制论述题时,需要遵循下列命题原则来提高论述题的质量。
1.应当使用论述题来测量那些不能被客观题很好测量的较复杂或较高层次的学业成就
一般而言,大多数知识层次的认知能力,都不适合用论述题这一题型来评价,而适合使用客观测验试题来评价。因为客观测验试题的取材广泛,具有代表性,评分客观公正,而论述题在这些方面较难办到。论述题只适合于对理解、应用、分析、综合和评鉴等较高层次的认知能力进行评价。只有在这些条件下,它才能有效地发挥自己的功能。
2.论述题的题目所陈述的要求应清楚、明确,以便学生作答
论述题的陈述应清楚、明确,而不能含糊不清、模棱两可。对学生所提出的问题,应以限制性反应论述题为宜,指出答题范围,使学生在所学的教材内容中作答,而不应使试题过于笼统。在考查学生复杂层次的能力时可以使用“比较”“推论”“应用”“综合”“评鉴”等字眼,来引发学生的作答反应。而且,这些专门术语的使用也可以视所要评价的学业成就的复杂程度来灵活决定(见表2-3)。
表2-3常用来测量复杂学习结果的论述题术语(余民宁:《教育测验与评量:成就测验与教学评量》,182页,台北,心理出版社,2002。)
|
结果 |
术语样本 |
|
比较
解释
推论
应用
分析
创立
综合
类化
评鉴 |
比较、分类、描述、区别、阐释、提要、摘要
转述、归纳、估计、例示、解释、复述、摘要、翻译
归纳、估计、延伸、外推、预测、提出、关联
安排、计算、描述、显示、例示、重安排、关联、摘要
分割、描述、图示、区分、分开、列举、提要、分隔
组合、设计、发明、归纳、形成、制作、表示、提出
安排、合并、建构、设计、重安排、重组织、关联、叙写
建构、发展、解释、形成、产生、制作、提出、叙述
赞赏、批评、辩解、描述、评鉴、解释、判断、叙写
|
例
试比较英、法两国资产阶级革命的异同。
3.不允许学生对问题进行有选择性地作答,而应全部回答,不能有遗漏
由于论述题本身已不具有较强的代表性,若再让学生自由地选题作答,就会增加评分的难度,也难以对学生的学业成就进行有效的比较,而且测验的信度、效度也不高,也难以达到统一评价学生的目的。因此,论述题应避免学生选择作答,应要求统一全部作答,这样才能为统一评分提供前提,也利于对学生的评价和鉴别。
4.论述题的试题设计应多用多题短答的限制性反应论述题,少用扩展性反应论述题
由于测验的时间有限,学生不可能在有限的时间内回答较长的论述题目,而且试题数目较少,测验的误差就会增大,信度也不高。同时,扩展性反应论述题取材范围较狭窄,代表性不强,效度也很低。因此,为了使试题达到评价的目的,提高评分的客观性,可采用多题短答的限制性反应论述题来代替少题长答的扩展性反应论述题,以提高测验的信度。但是,也不能将试题编制得过细,以免丧失了论述题所特有的功能。
5.论述题所要评价的目的应与教学目标相一致
论述题中所能评价的目的应和教学目标上要求的相一致,要侧重于对学生较高层次能力的评价。因此,试题的编制中,应以教学目标为指导,设计出高质量的试题。
6.论述题的题目应有启发性、思想性和教育性
论述题的题目应能够激发学生积极地思维,充分应用所学知识来分析所呈现的问题,有条理地论述问题,而不是让学生死记硬背教材中的某些原理知识或观点。而且,论述题的题目应具有思想性和教育性,能对学生的学习和生活起到一定的指导和启发作用。
7.论述题的答案应是既定性的或是相关争议较少的知识内容
没有定论的题目,不能达到对学生实际知识和能力的评价 ,而且还会造成评分的难度增大,误差也很大,不利于对学生的正确评价。为了减少这些不必要的干扰,在编制试题时,一般要限制学生作答所采用的观点,如“请根据或结合……的原理来分析……问题”等,从而有效地避免有争议的问题。
例
结合马克思主义政治经济学基本原理和当前宏观经济形势,说明应当如何进一步完善宏观调控体系、提高宏观调控水平。
8.应规定学生对每一题的作答时间,让学生在这一时间内充分作答
由于论述题需要学生对问题进行一定的思考并回答,因此,在编制试题时,要考虑到大多数学生的作答速度,在既定的时间内充分作答,以免使试题变成速度题,而减弱了评价的精确性。而且,限定一定的时间,有利于学生合理分配每一题的答题时间,在这一时间内有效地作答。
三、什么是操作测验
(一)操作测验的含义及使用
在许多学科中,对操作方法和过程的把握与应用同样也是重要的测量目标。如数学课程学习、实验课、体育课、音乐课等。因此,在大多数的教学领域中,操作测验已成为纸笔测验的辅助测验。操作测验介于纸笔测验和未来真实情境的实际活动之间,具有真实的情境模拟性。它是指模拟一些在自然情境下操作的测验,其模拟的程度高于一般的纸笔测验。
操作测验的分类很多。以测验情境真实性的程度来分,可将操作测验分为四类。
1.纸笔操作测验
纸笔操作测验是指利用纸笔测验模拟真实的实验情境来考查学生知识和技能的应用。与传统的纸笔测验最大的不同在于,它比较注重在模拟真实的情境下考查知识与技能的应用。这些应用能力的纸笔测验,可以引发所预期的学习结果,也可以用来作为高度真实性操作行为的初步测量。如让学生编制电路图。
2.辨认测验
辨认测验是指包括各种不同真实性程度的测验情境。有时只是要求学生简单地辨认某物,并指出其功能;有时会要求学生根据一个具体的操作工作,辨认完成该项工作所需的工具、装备和程序等;有时则会要求辨认事物的具体问题之所在,并提出相应的解决办法。如上生物课,要求学生辨认排列在教室中的生物标本,或辨认实施某个具体实验操作的装备和程序。辨认测验常被用来作为指导学生在真实或模拟情境中操作行为的教学设计。
3.模拟操作测验
模拟操作测验是指要求学生在模拟的情境中完成与真实作业相同的动作,其特点是强调操作程序的正确性。如在体育课中,要求学生对着想象的球挥棒,或者与假想的对手练习对攻等。有时,模拟操作测验也可作为操作技能的最后评估,如生物实验、化学实验,或采用角色扮演的方式进行模拟的法庭辩论、模拟的教学试讲等。
4.工作样本操作测验
这种测验要求学生完成所测量工作的部分活动。在所有的操作测验评价中,工作样本操作测验的真实性最高,通常样本工作包括了全部真实作业中最根本的要素,而且需要在控制的条件下去完成这些作业。
上述四类均有某种程度上的重叠,它们提供了测量应用操作技能的有用方法。
(二)操作测验的优点及不足
操作测验可以在需要对某一特定课题的熟悉程度进行验证,但又不能通过知识测验来测量的情境中发挥它的作用。操作测验的编制方法与其他类型的成就测验的编制大致相同,但在程度上要复杂很多。通常,操作测验的情境很难有效地控制,也不容易标准化,而且测验的准备和实施都比较费时,评分也较为困难。一般而言,测验情境越接近于真实的作业情境,在评估时所遇到的问题就越复杂。
(三)操作测验的设计
针对操作测验的优点和不足,在编制过程中应注意以下几点。
1.明确说明所要测量的目标和学习结果,并将其操作化
要对整个操作进行工作分析,找出整体作业中具有代表性的工作样本,而且所选取的活动要能反映出教学时所强调的内容,并为每一个操作建立一个作业标准,包括对作业的精确性、步骤的正确性等的最低标准。
2.选择合适的真实性程度
在操作测验中,应根据教学目标的性质、客观条件的限制、工作本身的性质等多方面的因素来确定操作情境。因此,在准备操作测验时,应对这些因素进行权衡,力图获得最真实的情境。
3.以指导语来明确操作测验的情境
指导语应具体明确,不能因人而异,让学生知道要做什么和在哪些条件下去做,以及具体的评价标准是什么。
4.确定评分的方法
通常对操作测验的评分有两种方法。(1)作品量表法(product scale),是指用一系列不同品质层次的作品作为样本,将学生的作品与量表中的样本作品相比较来进行评定。这种量表对作品品质的判断很有帮助,通常被用来评定书法作品、艺术品及各种类型的职业计划。(2)核查表和评定量表。如果一个操作行为或作品可分别从几个不同的层面来评鉴时,可采用核查表来考查学生每一个步骤或层面是否都做到了。用来评鉴作品的核查表,一般包括各层面(如大小、颜色等)的一览表和核查每一个理想的特征是否具备的空格。评定量表进一步评定每一个层面符合理想特征的程度。评定量表和核查表同是用来判断所有学生在同一组层面的优劣方式,它提供一种记录判断结果的简便形式。