设为主页
加入收藏夹
当前位置:首页>>课程教材研究所>>教材研究>>教材评价
 

人民教育出版社课程研究室任长松

教材在编制完成以后,要接受国家教委教材审定委员会的评审(审查和审定),这一评审工作是对教材所进行的评价。评审通过的各套教材,在被各地教育机构选择使用之前,也面临一个评价的问题。这些评价工作,都是在教材编制工作完成之后进行的,属于终结性评价的范畴。但是,教材评价工作并不是只存在于教材编制完成之后。实际上,在整个教材编制过程的各个阶段,都存在着各种形式的评价问题。而且,教材编制过程中的这些评价工作,对于教材编制的质量具有举足轻重的作用。只有使评价贯穿在教材编制过程的始终,编制出的教材才可能是高质量的。

然而,对于教材编制过程中评价问题的重要性、意义和作用,尚未得到应有的重视。在实践中,我国在教材编制过程中从事的评价工作仍有待加强和改进;在理论上,我国对课程教材评价的研究基本上还是一片空白。联合国教科文组织儿童基金会注意到了我国在教材编制过程中对评价问题的忽视,提醒我们加强教材编制过程中的评价工作,并提供专款资助我社课程教材研究所分别于今年1月份和10月份,召开了第一次和第二次全国中小学课程教材评价研讨会,以促进我国对课程教材评价的研究。

在这一背景下,要促进我国课程教材评价研究与实践的发展,一方面要了解和研究我国教材编制工作的具体实践状况,了解和研究我们在教材编制过程中曾从事了哪些评价工作,是怎样进行评价的,另一方面,我们要认真学习和研究其他各国在实践上是怎样开展教材评价的,在理论上他们有哪些研究成果。在这一基础上,再来思考和研究如何加强和改进我们的课程教材评价工作。

目前我国还没有对国外课程教材评价的实践进行系统全面的实地考察。因此,本文试图在学习和研究国外课程教材评价的理论的基础上,通过了解和调查我国课程教材评价的实践状况,对教材编制过程中的评价问题提出自己尚不成熟的一点看法,以求教于各位老师和朋友。

由于作为教材核心的教科书是供学生学习使用的学习材料,因此,教材评价的核心就是所编写的教科书是否充分体现了学生的“学”,是否充分考虑了学生的年龄特点、学习规律和阅读心理,是否全面系统地了解、深刻地理解、并灵活地运用了发展心理学、学习心理学和阅读心理学方面等方面已有的研究成果和已有的个人经验。在整个教材编制过程中,评价的重点是新教材与旧教材不同的改进之处。但在教材编制的不同阶段,评价的目的任务或意义作用(为什么评价)、内容对象(评价什么)、程序方法(怎样评价)、评价者(谁来评价)都有所不同。根据我国的具体实践,可以把教材编制的过程分为启动、设计、编写、实验、送审五个阶段。

由于教材的编制工作主要集中在教材设计和编写两个阶段完成,而教材一旦编写完毕,一般不宜再进行较大规模的调整和修改,因此,教材设计和编写两个阶段的评价工作显得更为重要,需要更加细致深入、系统充分地开展。本文也把主要篇幅放在探讨这两个阶段的评价工作上。

一 教材启动阶段的评价

教材启动是教材编制过程的始端和教材设计的准备,主要是对整个教材编制过程进行规划,确定编制哪些学科的教材,大体落实编制队伍,确定整套教材总的指导思想和编写原则;更主要的是开展准备性、背景性的调查研究,如对我国21世纪社会需求的调查研究,对我国教育方针政策(尤其是《纲要》、新的课程计划和教学大纲)的研究,对国内外教育理论最新研究和进展的研究,对国内外教育实践改革实验和思潮的研究,对我国当前教育教学实际的研究,对我国(包括港台澳)及国外教材及其编制经验的研究,等。

教材启动阶段准备性、背景性研究是否进行得充分细致、系统深入,是影响后续各个阶段工作质量的基础。

为了发扬我社教材“继承,改革,创新”的编制原则,在教材启动阶段的教材评价,主要是评价已有的旧教材有哪些优点、长处,以便继承,有哪些需要改进之处,以便改革和创新。同时,也可通过同类教材的横向比较来开展教材评价,以借鉴各家之长,为我所用。但注意不同类型教材(如内地版、沿海版等)往往面向对象不同,要求也有差异,因此这种评价一般仅作参考之用。

二 教材设计阶段的评价

在正式开始编写各科教材之前,首先要对如何编写新教材、编写什么样的新教材进行设计,提出较为明确的设想。具体包括:确定教材编写的原则、指导思想及其所要达到的目标,并围绕原则、指导思想对构建怎样的教材体系,具体选择哪些教材内容,教材中的各部分具体学习内容采用怎样的编写方法或各个具体学习活动如何设计,教科书、练习册、教学参考书等各部分教材如何配合,以及编写体例、版式设计、图文配合等方面的技术性问题,提出种种想法,并从中选择和确定出一种教材编写思路和教材编写设想。

在教材编制的设计阶段,对教材各个方面所提出的各种设计进行评价是很有必要和益处的。美国课程论专家泰勒指出:当为编制一个计划、一套教材或一种教学手段提出一种或几种想法时,马上就应该进行评价,看一看在早先的实验或经验中是否有表明这个想法有效的证据。泰勒当时说:在考察最近的各种课程编制规划时,我失望地看到,人们常常接受那些以往已经尝试过、检验过并证明是谬误的想法;那么多的课程规划指导者是课程编制的新手,他们不熟悉课程编制的过去和经验,这是很遗憾的。“因而,在提出想法阶段上就进行评价,可以避免许多徒劳的尝试。”(参见《课程与教学的基本原理》,第141-142页)

(一)评价目的

设计阶段评价的目的,一是通过对各种设计或设想的合理性、有效性进行预测、分析和比较,以便在众多的可供选择的设计设想(备择设计)中作出鉴别和选择;二是找出所选定的教材设计设想中存在的明显错误或不足之处,以便加以改进。

(二)评价内容

由于新的教材编制工作,往往是在对已有的旧教材进行反思的基础上开展的改革或重建工作,因此在教材设计阶段所提出的种种设计设想,往往也就是对如何改进旧教材所提出的种种想法和设计。这些设计或设想,有的是对旧教材的局部的或程度较小的改革、改进,有的则是“来一个大动作”──完全打破旧教材的模式,在较大程度上进行改革、改进,提出全新的设计设想。

设计阶段的评价,就是对这些改革幅度或大或小的设计设想进行评价。具体地说,主要是针对以下几个方面进行评价:

教材设计阶段的评价指标体系

1.所提出的教材设计思想是否合理:

★是否符合国家确定的教育目的、培养目标;

★是否符合国家教委颁布的课程计划、各科教学大纲的最新精神和要求。

2.拟选择的教材内容是否合理:

★是否科学正确,是否符合最新的科研成果中所取得的共识;

★是否有利于完成教学大纲中所规定的该科科目目标;

★对深度和广度的确定是否符合大纲要求,学习难度、学业负担是否合适;

★是否注意了内容的弹性(必学与选学的问题);

★是否注意与相关学科的联系;

★是否注意了联系生活、生产实际的内容;

★是否注意了在内容设计中合理渗透思想教育。

3.所设计的教材组织(教材编排体系)是否合理:

★是否符合学生的生理、心理特点;

★学习的密度和节奏(学习难点、重点的分布情况)是否合理;

★学习的坡度是否合理;

★是否注意了与相关学科在进度上的配合。

4.对具体学习活动的设计或具体学习内容的编写所作的规定是否合理:

★是否适合学生的生理心理特点和已有经验,是否有利于提高学习效率;

★是否有利于学生能力的培养;

★是否注意了在学习过程中进行学习习惯、学习方法、学习能力的培养;

★课文的设计是否合理;

★练习的设计是否合理。

5.教材系列化的设计是否合理

(三)评价方法

在对教材的各种设计设想的合理性、有效性进行评价时,因尚没有编写完的教材作为试验的对象,因而并不能开展试验来进行评价。我们往往采用召开多次小型研讨会的方法:与会者畅所欲言、各抒已见,针对这些教材设计设想(在上述各个方面)是否合理、孰优孰劣,与旧教材相比是否有改进,改进在哪里,以及如何进一步完善等问题,根据各自的已有经验和所持的观念、所掌握的理论和研究成果,提出各自的看法和理由。

由此可见,在设计阶段对各种教材设计设想在上述各个方面的合理性进行评价时,各个评价者评价的主要依据是评价者(主要是在教材领域的)已有经验、评价者所持的有关观念和理解(如对新的义教课程计划和教学大纲的理解,对素质教育的认识等)、所了解的理论(如儿童心理学、发展心理学等领域的理论)、所掌握的有关的最新研究成果(如关于某学科知识的社会需要状况的调查报告),等。但是,作为评价依据的评价者的个人经验,往往因人而异,而且这种个人经验本身的科学性、合理性如何,也有很大的疑问;而评价所能依据或参考的理论上的已有研究也未必都是科学正确的,它们或者不够成熟,或者不够具体,或者存在分歧。因而以此为依据所作的评价,往往也就容易引起争议,“公说公有理,婆说婆有理”,主观性较大。

因此,在教材编制的设计阶段,以评价者各自的已有经验和所掌握的理论和研究成果为依据对教材设计各个方面的合理性、有效性所作的评价,也就并不具有最终的权威性,有待通过实验或试教接受实践的检验(在设计阶段无法解决的争议可以留待在编写和实验阶段解决),设计阶段的评价只在一定程度上是可信的(最终的权威应该是实践,详见关于实验阶段的教材评价的探讨)。认识到设计阶段的教材评价所固有的这一局限性,有助于评价者在对各种教材设计设想的合理性进行评价时持谨慎的态度,并形成认真倾听与研究不同观点的习惯和自我反思、自我批判的意识。这对教材评价质量和教材质量的提高都具有重要然而常常被忽视的作用和意义。

在国外,为了在设计阶段的整个评价过程中能听取各种意见,以便同时阐明教材的各种设计、设想的优点和缺点,常常在组织评价小组时事先就安排有各种不同观点、甚至相反观点的评价者参加。通过公开进行的相互诘问过程(cross-examination),相互对立的评价者都尽力出示更好的、更有说服力的证据,并揭露对方任何经验材料和逻辑上的假象,从而使定量和定性的材料真实可靠。

这种评价方法在理论界,常常被称为对手式评价(adversaryevaluation)。由于采纳了有计划的对抗,这种方法相当于提供了两种独立的评价。据称,已经出现了九种对手式评价,各种评价都采用不同的方法,其中包括司法式模型、听证式模型和辩论式模型等。(参见《简明国际课程百科全书·教育测量与评价》,第1-3、89页)

这种评价方法值得我们认真研究。需要注意的是,对手式的方法在对各种设计、设想进行选择时,是极有用的;但在择定了某种设计、设想,进入教材的编写阶段时,编写人员之间又必须统一思想、统一认识,不能各自为政,相互对立。

由于设计阶段的课程评价强调评价者的个人经验和评价者所掌握的理论上的研究成果,因而同艺术评论或品酒鉴定中的评价过程极为相似:总的说来,这种判断定向的方法(judgment-orientedapproaches)强调在评价过程中进行判断和个人智慧的核心作用。艾斯纳(Eisner)所提出的评价的“鉴赏模式(connoisseurshipmodel)把评价者看作教育的评论家,他们具有精确的洞察能力(这种能力基于对所评价的事物的知识及个人经验的积累),他们能够对有待评价的计划的质量及重要性给予公开的评论。(参见《简明国际课程百科全书·教育测量与评价》,第88-89页)

(四)评价者

教材评价中关键性、决定性的问题是:由谁来对所提出的各种设计、设想进行评价呢?这些评价者之间如何分工合作来共同完成这一评价呢?由谁承担评价者以及评价者之间如何组织,决定了评价的质量(信度和效度)。

由于设计阶段教材评价的上述局限性,这就对评价者和评价过程带来两方面的要求:一方面,由于评价主要是根据评价者的个人经验、所掌握的有关的已有探讨和研究成果(如调查报告等),因此高质量的评价就要求评价者有较高的理论素养、研究能力和丰富的实践经验。而作为个人是难以在这三个方面同时胜任的,因此这就要求“采用集体的方法”,而且评价者作为一个群体应该有一个合理的专业结构、素质结构,以便尽量扩大教材编制时建设性参与的范围,从而充分考虑到教师、学科专家、课程专家、心理学家、社会学家和人的发展方面的专家所提供的建议和判断,并用有助于建设性决策的方式来审议这些建议和判断可能带来的后果,以此作为择定最初的设计、设想的基础,并供在实际的教材实验中检验它们的可行性和它们的效果。这就是泰勒几次声明“我建议采用施瓦布在《实践的艺术》一文中论述过的集体审议(deliberation)程序”的原因。(参见《课程与教学的基本原理》,第144、135-136页)(关于审议制的深入探讨可参见《课程审议:教师参与学校课程决策的一个参考框架》)

另一方面,审议强调的参与是高质量的参与,而不是高数量的参与。审议小组会议所花的时间常常与过程的质量成反比。尤其是,由于评价所依据的已有探讨和已有各种理论之间存在争议,评价者的个人经验也往往存在迥异之处,而各方又都不具有最终的权威性,这就往往导致不同评价者之间的分歧无法调和。这就要求教材评价群体在对所提出的各种设计、设想进行审议时,要尽量以“有助于建设性决策的方式”来开展(参见《课程与教学的基本原理》,第136页)。另外,看重实际效用的评价组织者应该由熟练的小组联系人来承担,他拥有在评价活动中与有关人员积极共事的丰富经验(参见《简明国际课程百科全书·教育测量与评价》,第16-17页)。

对于这种集体审议程序,国外在实践和理论上已有大量丰富的经验和深入的研究,值得我们认真研究和学习。在我国,设计阶段的教材评价者主要是本套教材的编制人员本身(内部评价),也邀请编制群体之外的人参与评价(外部评价),主要有参与制订课程计划或教学大纲的人员,其他各套教材编制的参与者(包括参与过国外或海外教材编制的有经验的回国人员),大学或研究所中相应的学科教学法专家,以及有丰富实践经验的第一线教师或教研员等。

三 教材编写阶段的评价

在教材设计阶段,对于教材编写的原则、思路等大的方面的问题基本是确定下来了,但对于其中的许多具体问题往往无法明确规定。因此,在开始编写教材时,往往首先是根据所确定的编写设想编写样章。再通过小型研讨会对样章进行评价,对编写样章中出现的种种具体问题进行研讨,并最终对教材编写做出更为明确的规定。然后,教材编写者们才开始分头编写各自所负责的部分,最后编辑印装成册、成套。

(一)评价目的

教材编写阶段评价的主要目的是:一、评价所编写的教材是否符合设计阶段所确定的教材编写思想和教材设计;二、评价设计阶段所确定的教材编写思想和教材设计在多大程度上能在具体的教材编写过程中得到实现,发现教材设计中不合理、不可取、不现实或不可行的地方,以便加以改进;三、对在设计阶段尚有争议或把握不准的某些教材内容的编写方法(具体学习活动的设计)的合理性进行比较,以便根据最合理的方法编写教材;四、评价所编辑的教材在技术方面(如版式设计等)的合理性。

(二)评价内容

在教材编写阶段除了要评价设计阶段所评价的几个方面以外,还要对所编写的教材的技术方面加以评价,主要是:

教材编写阶段的评价指标体系

1.教材所反映的设计思想是否合理:

★是否符合国家确定的教育目的、培养目标;

★是否符合国家教委颁布的课程计划、各科教学大纲的最新精神和要求。

2.教材的内容是否合理:

★是否科学正确,是否符合最新的科研成果中所取得的共识;

★是否有利于完成教学大纲中所规定的该科科目目标;

★对深度和广度的确定是否符合大纲要求,学习难度、学业负担是否合适;

★是否注意了内容的弹性(必学与选学的问题);

★是否注意与相关学科的联系;

★是否注意了联系生活、生产实际的内容;

★是否注意了在内容设计中合理渗透思想教育。

3.教材的组织(教材编排体系)是否合理:

★是否符合学生的生理、心理特点;

★学习的密度和节奏(学习难点、重点的分布情况)是否合理;

★学习的坡度是否合理;

★是否注意了与相关学科在进度上的配合。

4.教材中具体学习内容的编写方法(具体学习活动的设计)是否合理:

★是否适合学生的生理心理特点和已有经验,是否有利于提高学习效率;

★是否有利于学生能力的培养;

★是否注意了在学习过程中进行学习习惯、学习方法、学习能力的培养;

★课文的设计是否合理;

★练习的设计是否合理。

5.教材系列化的安排是否合理。

6.教材的陈述或表达是否合理。

7.教材的版式设计是否合理:

★图文的设计和编排是否合理;

★字体字号的选择和组织安排是否合理,是否符合不同内容课文的性质,是否符合不同年龄阶段的学生的发展心理、学习心理和阅读心理待征。

8.教材的编校是否合格。

9.教材的印装是否合格、合理,如纸张颜色是否符合学校卫生学的特殊要求等。

教材编写阶段评价的重点在:教材中具体学习内容的编写方法(课文、练习等)、配图的设计、版式设计、纸张品种等,是否充分考虑了学生的年龄特点、学习规律和阅读心理,是否全面系统地了解、深刻地理解,并灵活地运用了发展心理学、学习心理学和阅读心理学方面等方面已有的研究成果和已有的个人经验;编校质量、印装质量是否合格,等。例如:

在课文的设计方面:

(1)课文的结构是否合理:课文在整体上是否连贯和条理清楚?它们有较好的组织结构吗?通过章节的名称、标题、概要、前言、结论和主题,能使学生明了它的结构并激发学生利用相关的先前知识吗?研究表明,组织较好的课文以及对读者来说组织方式很清楚的课文,可以增加读者对所学课文知识的理解、记忆和应用的可能性。

(2)课文的局部相关性是否合理:课文在局部上是否连贯和条理清楚?代词所指对象明确吗?概念之间的关系是否清楚?各种观点之间的关系是否明朗,一种观点到另一种观点之间是否有一种逻辑上的联系?研究已经证实,在理解和记忆课文方面,课文局部的相关性或内聚力具有明显的重要性:对于用明确的连接词,特别是表示原因的连接词所连接起来的句子,儿童更喜欢阅读,而且读得很快,有较好的记忆,但对需要猜测的连接词的句子记忆效果差。

(3)课文的密度是否合理:课文中重要知识与非重要知识的比例或主要概念与细节的比例是否合适?课文是否以适当的比率引进新的重要概念?在主要概念之间插入的概念是清楚地阐明主要概念之间的关系,还是插入了一些不必要的细节?课文是否有助于学生集中注意力在主要概念上而避免在细节上分散时间?研究表明,阅读原文1/5长度的概要的学生,与那些阅读全文的学生相比,能够较好地掌握要点和学习新的相关材料。

(4)课文的语言风格是否符合读者的知识水平,是否生动活泼、直观形象。

在练习的设计方面:

(1)在每章末尾和辅助练习册中,学生的练习是否有助于学生选择性地注意学习和加工课本中的重要知识?研究表明,设计得较好的问题对学习行为和学习结果有显著的集中效果。

(2)每章末尾的问题是否有助于他们阅读和理解下一章或新学年的课本?

(3)练习是否有助于学生学习能力的培养?

(4)练习的难度和量是否合适?

在课文的配图上是否清晰鲜艳、主题突出。有研究生在毕业论文中对我国已出版的几套教材中的插图进行了评价,发现其中在性别差异问题上存在偏差:插图中男性明显多于女性,而且男性所扮演的角色多为正面人物,而女性所扮演的角色多为反面人物。

在版式设计方面是否合理,这涉及图文的编排,字体字号的选择和组织安排(对不同年龄阶段的学生、不同性质的课文内容等,要根据发展心理学、学习心理学和阅读心理学方面已有的研究成果和已有的经验,选择有利于促进学习的字体字号和组织方式),彩色、双色或黑白本,装订方式(活页或合订),等等

(三)评价方法

根据所评价的内容不同,评价的方法也不同。如对教材编校质量、印装质量的评价,可根据已有有关规定加以评价。对教材中具体内容的编写方法是否合理进行评价时,则要以这种编写方法的实际教学效果为根据。

如在编写小学数学教材中20以内加、减法这一部分内容时,对于采用哪种编排方法来编写教材这一问题,可以采用实验法,通过对不同编写方法的实际教学效果进行评价和比较来确定。(参见《小学数学教育改革文集》,第219页)

在教材的编写阶段,对于教材编写中的具体问题,已经可以在实际运用不同设计方法的实践中,通过考察真实的使用结果来对各种不同的教材设计方法加以比较和评价,从而择定根据哪种教材设计来编写教材。因此,相对于教材设计阶段的评价,这一阶段的评价有较大的客观性、权威性,在评价者之间较容易取得一致,达成共识。

这里需注意的一个问题是,在根据不同编写方法的实际教学效果来对它们进行评价和比较(如对新的教材编写方法与旧教材的编写方法进行比较)时,对于不同编写方法的教学效果要有一个全面的考察:既要考察学生在知识方面的学习成绩,也要考察学生在能力、态度等方面的发展;既要考察学生是否达到了教学目标中所规定的要求(目标定向的评价),又要考察目标范围之外的非预期的实际学习结果(目标游离评价)。

如上所述,通过考察使用课程教材原型的学习结果是否令人满意,即通过将实际的学习结果与所期望的学习结果相比较,可以确定实际结果与学习目标之间相一致的程度,从而据以评价所设计的课程教材原型的有效性、合理性;如果实际的学习结果与所期望的学习结果之间存在差异,实际的结果没有达到期望的目标,这就说明需要做出努力,以改进不足之处。这种以课程目标为评价标准的评价方法最早是泰勒提出来的,后人称之为“成绩-目标一致法(performance-objectivescongruenceapproaches)”。它对以后的评价实践与理论产生了巨大的影响。哈蒙德(Hammond)的EPIC评价模式、普罗沃斯(Provus)的差异模式(discrepancymodel)、波帕姆(Popham)的教学目标法等显然都只是泰勒模式的变式,或干脆就是泰勒模式的另一种表述方式。(参见《简明国际教育百科全书·教育测量与评价》,第86-87页)

但是,上述这种目标定向的评价并不是完美无缺的,因为如果把评价考察的范围局限在课程目标的实现上,会阻碍人们判断所设计的课程教材是否符合多方利益,因此在进行以目标为评价标准的课程评价(可称之为目标定向评价)的同时,也要进行目标游离评价(goal-freeevaluation)(参见《简明国际教育百科全书·课程》,第198页)。在“目标游离”的评价中,不仅忽略了课程的目标,而且实际上,还要努力避免知道这些目标。这样,评价者就可以自由考察全部的实际效果(不论是希望的还是不希望的、预期的还是意外的),而不必将注意力或考察范围局限在设计者的目标或意图所关注的范围内;从而把考虑重点由“方案想干什么”转到“方案实际干了什么”。(参见《简明国际教育百科全书·教育测量与评价》,第88、51-53页)

另外,要尽可能创造条件采用随机的受控实验的方法,设立实验组和对照组,控制非实验变量(即所谓“无关变量”),尽量排除非实验变量在两组之间的差异,从而使两组在学习结果上的差异可以主要由编排方法这一教材变量来解释。只有这样,才能不仅确定学习结果与教材之间的相关性,而且更准确严格地确定这两个变量之间的因果联系,从而客观地评价出不同教材编写方法(如新的教材编写方法与旧的编写方法)之间在有效性或合理性上的真实差异,进而查明按不同方法(如新的教材编写方法)编写的教材在哪些方面是有效的、合理的,在哪些方面是不合理的、有待改进的。由于教育实验大多是在自然情境下进行的,因而往往无法严格做到实验组和对照组之间在非实验变量方面完全一致。这时,可以在结论分析时,采用统计学上的一些方法,通过统计处理,来排除非实验变量的影响。

但是,由于各种困难,在实践中往往并没有设立对照组(参见《小学数学教育改革文集》,第221页),对非实验变量没有加以控制,只是通过扩大实验规模并在尽可能多样的情境中开展实验,或依据评价者的个人经验,来对某教材编写方法的各种结果(通过学习结果评价等得知)加以归因:认定某一试验中学习结果令人满意(或不满),主要是(或不是)由于使用某种教材编写方法所致。而这就可能会影响到试验阶段课程评价的客观性、权威性,从而使试验阶段的课程评价也带有一定的局限性。然而评价者不应该让“完美无缺的评价一定要做到什么”这样一种念头使自己失去信心;他们应该记住,从来没有任何完美无缺的评价。如果遇到挫折,评价者只负责提供在目前情况下可能提供的最有用的信息。(《课程导论》,第169-170页)

编写阶段的评价者欲通过考察某种教材编写方法的实际教学效果来对这种编写方法的合理性进行评价,还可以采用其他方法,如通过“现场收集资料──分析资料──提炼并提出新问题──回到现场进一步收集资料”的不断循环,对这种编写方法为什么有效,以及如何改进等进行分析和研究。这种与对比实验法不同的评价方法被称为自然主义评价。实际上,我社在编写阶段所采用的评价方法,以自然主义评价为主。其主要的形式就是在实验班依据新的教材编写方法开展教学,教材编写人员深入实践,反复听课并与实验教师切磋交流,有时要到全国各地调查研究,听取各方面意见。据此,进一步改进教材编写方法,并再次实验,观察实验效果,最终将这一部分学习内容的教材编写方法确定下来。

自然主义评价一般能为发生在复杂的“真实世界”中的计划的实施过程及其结果提供丰富详尽的记述和从整体出发的解释。自然主义评价适合于鉴别计划的效果和计划受到的影响。更广泛地说,当评价的目的是为了改进计划的制定、增强管理效果、检查它的实施或对特定地区的适用性时,自然主义评价是一种强有力的方法。

由于自然主义评价者认为,只有在计划安排中实际地进行工作的人才能层层“剥开”并理解现象中的前后关系、意义、系统的相互依赖关系,因此,自然主义评价强调从参与者的观点或从整体的观点去理解计划的活动。这样,评价人员就要长时间地现场研究一个群体在自然环境下的活动,并且这一调查研究是从极其广阔的问题开始的,如“这里发生了什么事情?它是否是由被调查的计划引起、并以这一计划的名义提出的?它的作用是否与计划密切相关?”。

以这些初始问题为向导,评价者就可以去现场收集资料。并进而对资料进行分析,找出现场记录中明显的矛盾,指出还有哪些资料没不完全,竭力审视自己的设想和偏见可能会对记录的积累产生怎样的影响,从而得出这里“正在发生什么事情?”的推断。由于评价者以这种方式检查他们的记录,自然就会提出自己的判断和进一步的疑问。这些将在评价者重返现场时再作调查。这样,通过“现场收集资料──分析资料──提炼并提出新问题──回到现场进一步收集资料”的不断循环,他们第一个作出的主观判断就会发展为比较稳定的假说,并随着进一步的调查来收集其它更详尽的材料,可以对它们进行检验,以便加以确认、重组和否定,最终,就可以得出结论。作为评价结论的调查报告要在强调计划参与者观点的背景上对所观察到的现象进行描述和阐明;如果愿意,也可以同时作出评价性判断,但此时要对所使用的参照系作出说明,以防止产生误解。

(四)评价者

编写阶段的评价者主要是教材编写者,参加某一教材编写方法的实验的教师。

四 教材实验阶段的评价

教材编写完毕后,就可以进行大规模的教材实验工作。这不同编写阶段为评价不同教材编写方法而采用的实验法。作为一种教材评价方法的实验法,是在一个或几个实验班中对教材某一部分具体内容某种编写方法的考察和评价。而在教材实验工作中,则是在较大规模上,在更自然的情境中,对编写印装好的成本或成套教材的整体考察和评价。

(一)评价目的

为了避免在教材编写完毕后又要进行较大程度的调整,在教材设计、教材编写阶段进行的评价工作要求细致深入,对教材各个方面的合理性、有效性的评价也主要是在设计、编写阶段进行的。实验阶段的教材评价对于教材本身在编写上的合理性、有效性也要进行评价,但评价目的侧重于考察各科教材的协调性,整套教材的教学效果,以及教材在不同地区、不同教育条件下的不同学校的可行性程度。

(二)评价内容

在教材实验阶段,不仅要评价所编制的课程教材是否合理,而且还要评价这一课程教材在各种学校情境中的适用程度如何。对可行性的评价,主要包括评价:教师能否胜任,教师要胜任本教材的教学,需要在哪些方面得到提高;学生学业负担是否过重,能否通过某些方面的改革使学生在合适的学业负担下顺利学完本教材,需要进行哪些方面的改革。

(三)评价方法

在教材的合理性方面,实验阶段的教材评价指标体系可参见编写阶段的教材评价指标体系,此不赘述。而对于可行性的评价则首先要获得三方面的信息:

1.使用某一课程教材所需满足的必要条件(校舍、设备、师资、社会文化的适应性等);

2.各学校在这些方面的现状(包括教师和学生对教材适应性的自我报告);

3.某一段时期内,学校在这些方面可望改进的最大程度。

通过对所获得的以上三个方面的信息进行对比,就可以判断出该课程教材的可行性。

如我社义教教材在教材实验阶段设计的一套调查测试量表,包括实验班教师调查表、实验班学生情况统计表,实验班任课教师对教材的评价表,实验班学生期末成绩统计表,实验班学生对教材的评价调查和统计表,实验班学生家长意见调查和统计表,实验学校领导对教材实验评价表等14个量表,其中就有对各学校实验班状况,尤其对于其中教师和学生对教材适应性的自我报告的调查和评价。(参见《教材评价的指标体系的制订》)

(四)评价者

在教材实验阶段,承担评价者责任的主要是各地参加教材实验的教师和教材编制者。

五 教材送审阶段的评价

通过大面积的教材实验和进一步的完善修改,教材在合理性、可行性方面都基本达到了令人满意的水平。这时,编制者就可以满怀信心地准备送审报告,并将所编制的教材一本本地送审。

这时,所送审的每一教材都要经过国家教委审查和审定委员会的评审(终结性评价)。评审意见下来后,教材编制者还要根据评审意见,对教材进一步进行修改和完善,并准备从大规模使用或推广的角度来研究教材投入使用的问题。

通过审定的教材推向市场,并在其必要条件(如校舍、设备、教师培训等)加以保证的基础上得到推广后,仍要不断地进行追踪调查和评价,从而为进一步修改完善提供信息。

参考资料

〖美〗麦克尼尔著,施良方等译:《课程导论》,辽宁教育出版社1990年版。

江山野主编译:《简明国际教育百科全书·课程》,教育科学出版社1991年版。

许建钺等编译:《简明国际教育百科全书·教育测量与评价》,教育科学出版社1992年版。

〖美〗泰勒著,施良方译、瞿葆奎校:《课程与教学的基本原理》,人民教育出版社1994年版。

曹飞羽著:《小学数学教育改革文集》,人民教育出版社1996年版。

(本文主要内容发表于《课程·教材·教法》1996年第7期。)



 
【上一篇】
【下一篇】