教育评价论文

2022-05-05

本论文主题涵盖三篇精品范文,主要包括《教育评价论文(精选3篇)》,供大家参考借鉴,希望可以帮助到有需要的朋友。赏识教育评价体系的核心是赏识,以赏识的眼光看待身边的人,在承认差异、允许失败的基础上对学生进行信任、尊重、理解、激励、宽容、提醒等教育评价方法,达到激发学生主动性的目的。

教育评价论文 篇1:

完善教育评价机制 推进教育评价改革

评价是教育活动的关键环节,对各级各类学校提高办学水平和人才培养质量发挥着重要的引导作用。评价标准、评价方式方法的变革能够更好地促进人才培养模式和办学体制机制的改革,推动教育质量的提升。《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称《教育规划纲要》)明确要求把育人为本作为教育工作的根本要求,把提高质量作为教育改革发展的核心任务。要求树立科学的质量观,把促进人的全面发展、适应社会需要作为衡量教育质量的根本标准,努力使各类人才服务国家、服务人民和参与国际竞争的能力显著增强。这些战略思想进一步明晰了我国教育评价改革的根本目标。近年来,随着素质教育的推进,教育评价理念、内容和方式方法也在变革,学生身心健康、能力发展等逐步纳入评价指标体系,取得了实质性的进展。但是,我国教育评价仍然存在一些亟待解决的问题,要继续推进教育评价机制的变革。

一、綜合全面评价学生发展的政策和理念已经确立。

中央和地方教育管理部门先后出台了一系列相关政策,明确教育评价改革的重要意义,努力完善教育评价体系,借鉴国际上先进的评价理念。2001年6月,经国务院批准,教育部印发了《基础教育课程改革纲要(试行)》,其中评价改革被列为六大课程改革目标之一,要求“改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能”,并对课程评价提出了具体的意见。2002年12月,为进一步贯彻落实《中共中央国务院关于深化教育改革全面推进素质教育的决定》和《国务院关于基础教育改革与发展的决定》精神,教育部印发了《关于积极推进中小学评价与考试制度改革的通知》,提出建立以促进发展为目的的评价体系。要求“评价内容要多元”,既要重视学生的学习成绩,也要重视学生的思想品德以及多方面潜能的发展,注重学生的创新能力与实践能力。评价标准既应注意对学生、教师和学校的统一要求,也要关注个体差异以及对发展的不同需求,为学生、教师和学校有个性、有特色的发展提供一定的空间。确立了包括基础性发展目标和学科学习目标的评价标准。基础性发展目标包括道德品质、公民素养、学习能力、交流与合作能力、运动与健康、审美与表现,学科学习目标以各学科课程标准为依据。应该说,这些评价标准的变化是评价理念的一大进步。同时,还明确要求不得将学生的成绩排名次、公布。另外,对中小学升学考试与招生制度的改革也作出了相关规定,鼓励在中考、高考中参考学生综合素质评价结果,并特别要求“任何单位和个人不得以任何形式按中考成绩给地区、学校和学生排队并公布名次”。

为了遏制片面追求升学率的倾向,部分省市出台相关规定,禁止利用考试成绩排名炒作学校的社会知名度,以纠正过分看重考试成绩的做法。例如,山东省教育行政部门2008年出台了“高考考生成绩作为个人隐私、严禁进行高考成绩排名”的规定,并对违规公布高考成绩、炒作“高考状元”的学校和有关负责人进行了严肃处理。2009年继续坚持对高考考生的成绩严格保密,以禁止各地对高考成绩排名,炒作升学率。同时,稳步推进普通高校招生考试改革,强化中学生综合素质评价信息在招生录取中的作用。山东省教育招生考试院要求高校进一步改进录取程序和办法,充实录取工作人员,审阅考生电子档案和综合素质评价信息等内容,以更好地落实在一定分数段内结合高考成绩和中学综合评价择优录取考生的办法。

二、教育评价仍然存在一些亟待解决的问题。

1.过分强调教育评价的甄别与选拔功能,加重了学生课业负担。

过分强调教育评价的甄别与选拔功能,助长了对学业成绩的片面追求,加重了学生课业负担,不利于学生全面发展。据2010年对8省79个县1409所中小学四、八年级学生抽样调查显示,49.4%(四年级)和17.8%(八年级)的学校每学期统一考试的次数在“6次及以上”,18.6%(四年级)和54.8%(八年级)的学校每次考试都排名次并公布。很多地区以学生考试成绩排名作为“奖优罚劣”的依据,特别是作为教师、校长、学校绩效考核的指标,与切身利益直接挂钩,导致学校狠抓学习成绩,强化课业训练,中小学生课业负担沉重。

2.教育评价指标重智、轻德、轻能,不利于促进学生全面发展。

尽管近年来学生身心健康逐渐受到关注,但文化课成绩仍然是最主要的评价内容和指标。单一的评价标准导致教育评价对教育实践的导向功能出现偏差,片面追求升学率、周课时超标、音体美课时遭挤占、课外辅导等乱象都是其直接后果。社会评价体系对教育系统内部评价的偏差起到了推波助澜的作用。当前,很多用人单位选拔人才的最重要依据还是学历文凭,选人用人看毕业生就读大学的层次,“985”、“211”高校毕业生会优先录用。因此,家长送子女接受教育最直接的目标是要取得好成绩、上重点中学、考上重点大学,社会用人制度导向产生的功利心态,进一步助长了基础教育追求考试成绩、名校升学率的不良倾向。

3.单一的书面考试方式难以考查学生的多方面能力。

多年来,书面考试一直是大多数学校评价学生发展的最主要的评价方式。学生发展过程的记录、解决实际问题能力的观测、参与社会实践活动的记录等反映学生发展过程和多方面素质发展水平的评价方式尚未得到广泛应用。单一的书面考试的评价方式,一方面造成学生综合素质的发展水平未能进入评价者视野,从而弱化了学生追求全面发展的动力;另一方面,书面考试多局限于知识的记忆,难以考查学生真实的能力,很多学生靠机械记忆或突击式的复习也能取得优异的评价结果,这在一定程度上束缚了学生创新潜能的发挥,将贻误学生创新精神和实践能力的发展。

4.对教育与经济社会发展需求的匹配度缺乏全面评估。

对于靠近“出口”的职业教育、高等教育,其人才培养的数量、质量和结构必须与经济社会发展的需求相匹配,才能满足各行各业的人才需求。如何判断这种匹配水平?这就需要从人才的使用者角度开展测量和评估。目前,这方面的工作有了一些局部的探索,但是还缺乏整体的、全面的判断。

人才素质是否满足社会需要,应由用人单位说了算。2006年,广州大学委托独立的第三方调研机构———零点调查广州分公司开展毕业生用人单位满意度专项调研,这在国内高校中尚属首次。通过第三方评估机构建立高校与用人单位之间的沟通桥梁,让高校获得了人才培养质量的有价值的反馈信息,对推进高校人才培养机制改革具有重要作用。但这种做法目前仍是“星星之火”,未能形成“燎原之势”。

2009年以来,麦可思数据有限公司连续发布中国大学生就业蓝皮书,其中一些评估结果在一定程度上反映出我国高等教育专业结构对经济社会发展的适应性问题。比如,2008届大学毕业生求职与工作能力调查中,呈现了高职高专毕业生工作与专业对口率最低的10个专业,这些数据可以直接表明人才培养结构即专业结构与就业市场需求的匹配度。例如,法律事务、会展策划与管理等专业对口就业率低,很大程度上是因为人才供给过剩,应在专业设置调整过程中重点考虑招生规模缩减问题。应積极鼓励这种第三方机构参与教育质量评估的做法,让更多类似的机构建立起来、参与进来,发挥客观、科学地判断人才供给水平的重要作用。《教育规划纲要》的序言中深刻地指出,“我国教育还不完全适应国家经济社会发展和人民群众接受良好教育的要求”,“学生适应社会和就业创业能力不强,创新型、实用型、复合型人才紧缺”,“教育结构和布局不尽合理,城乡、区域教育发展不平衡”。但是,我们的教育究竟在何种层面、何种程度上不适应经济社会发展需要,尚无法依托数据作出客观全面的判断,教育评价模式的变革亟待推进。

三、继续推进教育评价改革的着力点。

教育评价包含评价标准、评价主体、评价过程与方法等多个要素和环节。评价标准就是教育追求的目标,评价标准和评价指标的确立,自始至终对教育过程发挥着强大的引导作用。评价指标是否全面、科学,直接影响着教育活动指向学生全面发展的可能性,甚至影响到人才培养与经济社会发展的匹配度。评价主体的合理构成在一定程度上决定了评价的客观性和透明度,是更好地发挥评价的引导、监督、问责功能的重要制度保障。我国教育评价改革需要在完善评价标准、促进多元评价主体的参与等方面着力。

1.进一步增加身心健康评价指标的权重。

身心健康是一个健全人的基本素质要素,直接影响着人的生活质量和工作效率。身心不健康的人,即使有丰富的知识,也可能成为一个无益于社会进步的“废人”或“危险的人”。2011年9月发布的《2010年国民体质监测公报》显示,我国学生体质健康状况总体有所改善,中小学生身体素质持续下滑的趋势得到初步遏制。但是,大学生身体素质继续呈现缓慢下降的趋势,令人担忧。造成这种状况的主要原因是大学生的生活方式不健康。大部分大学生达不到每天一小时的运动量,吃得多、睡得晚、动得少直接导致体质下降。调研结果显示,19-22岁年龄组除坐位体前屈指标外,爆发力、力量、耐力等身体素质水平进一步下降,城市男生、农村男生立定跳远成绩分别平均下降1.29、0.23厘米,引体向上成绩分别平均下降1.44、1.45次,1000米跑成绩分别平均下降3.37、3.09秒;城市女生、农村女生立定跳远成绩分别平均下降2.72、0.92厘米,仰卧起坐成绩分别平均下降3.02、2.48次/分钟,800米跑成绩分别平均下降3.17、1.87秒。另外,城市男生、城市女生握力分别平均下降0.18、0.35千克;城市男生、城市女生、农村女生50米跑成绩分别平均下降0.06、0.10、0.05秒。2011年江苏省的调查也显示,在读大学生的速度、力量、耐力等身体素质指标,与往年相比呈下滑趋势,在多数机能与素质指标变化趋势上,大学生甚至不及中小学生。江苏省人民医院营养科的专家认为,目前大学生体质下降已成为普遍现象。现在走路的大学生越来越少,出门就坐车,许多学生室外活动量明显减少。从接诊情况看,许多大学生的饮食很不规律,有挑食、偏食的习惯。有数据显示,江苏省南京市在校大学生不吃早餐的约占三成,尤其以男大学生居多。长期不吃早餐容易引起胆囊炎、消化系统疾病,还会导致人体的抵抗力下降。南京航空航天大学体育教师认为,由于体育课并不是“主课”,学生上课热情不高,竞技类运动在体育课中有被弱化的趋势,田径项目多被合并到足球课、篮球课等专项课中,导致大学生运动量不足。

目前,中小学已经建立了评先评优中体育工作不达标的一票否决制,但是高校还没有这样的制度。建议在各级各类学校教育质量评价和学生素质评价中,进一步增加身心健康指标的权重,保障学生体育运动时间。2012年12月,山东省教育厅规定,建立本科高校教学质量年度报告发布制度,大学生体质测试达标率作为支撑数据纳入发布范围。这种做法应大力推广。

2.重视对关键能力发展的评价。

《教育规划纲要》将“坚持能力为重”确立为教育改革发展的战略主题之一,要求“着力提高学生的学习能力、实践能力、创新能力,教育学生学会知识技能,学会动手动脑,学会生存生活,学会做人做事,促进学生主动适应社会,开创美好未来”。只有具备了这样的关键能力,才能在未来的职业生涯中获得可持续发展,才能在国际竞争中立于不败之地。

近年来,各国课程教学改革都把培养学生终身发展所需要的关键能力、通用能力作为重要目标,并开设了综合学习、实践类的课程,也开发了相关的评价标准并实施了相关评价项目。20世纪90年代,美国国家教育和经济中心、匹兹堡大学等联合提出并研究开发了《应用学习能力表现标准》(Applied Learning Performance Standards),几十所大学和中小学参加了研制。“应用学习”是指学生把在校内外所学到的知识应用于分析问题和解决问题,有效地与别人进行交流和合作,使用信息技术和工具的过程。应用学习主要是指跨学科的应用学习,旨在使学校教育更好地适应未来社会发展对人能力提出的新需求,力求使学生在学校的学习和社会生活紧密联系起来,和未来社会的要求紧密联系起来,使学生能够成为对社会有用的人才。“能力表现”是指在学习过程中,通过学生的语言、行为、作品等反映出来的能力、态度、情感以及应用知识的水平。“标准”是根据应用学习的结构以及涉及的能力类别提出的,对学生学习中的行为、能力、态度等方面的评价标准。经济合作与发展组织(英文简称 OECD)提出了“关键能力”框架,这一框架分为3类、9项(见表1)。

此外,欧盟、日本、我国香港和台湾等国家和地区也提出了学生适应现代社会生活需要具备的关键能力的框架,开设了相关课程,同时也开发了相关的测评标准、工具和方法。这些成果和经验值得我们借鉴。

通过参与国际学生评估项目(英文简称PISA)等国际评价项目的方式,引导教育工作者关注对学生一生发展至关重要的关键能力的评价和培养,对深化教育改革将产生推动作用,对提升我国各类人才的国际竞争力也具有深远的意义。

3.将人才培养结构作为教育质量评价的关键指标。

多年来,我们习惯于将各级各类教育总体发展规模、人才供给数量作为评判教育发展成就的重要指标,这对衡量教育普及水平、国民素质和人力资源总量具有重要意义。但是,作为教育“产品”的各类人才在整体结构上是否与国家经济社会发展需求相匹配,直接关系着国家的综合竞争力,也直接关系着每个人的就业机会、就业质量和生活质量。因此,教育结构、人才培养结构是教育质量的核心指标之一。结构的维度既表现在不同类型的教育上,也表现在同一类教育内部的层次和专业结构上,还表现在各级各类教育的空间布局上。评价人才培养结构与经济社会发展需求匹配度的可操作的办法,是进行人才供求统计与分析。通过统计各行业人才供给缺口和各专业毕业生就业率,能够在一定程度上反映出人才培养结构的状况。

4.培育第三方评估机构,推动教育评价透明化。

高校在形成教学质量报告的过程中,会将难以获得数据的“用人单位对毕业生满意度”等指标进行简化处理,而对学校的工作亮点加重笔墨,出现“报喜不报忧”的现象。那么,为了增强教育质量评价的客观性、科学性,迫切需要积极鼓励第三方参与教育评价。

国家应通过政策引导,扶持第三方机构的设立,变政府评估为非政府评估,实现政府的宏观调控功能,并真正实施科学的质量评价。这方面,国际经验值得借鉴。1996年,经美国多所大学的校长投票后成立了“高等教育评估机构委员会”(Council for Higher Education Ac- creditation,简称CHEA),CHEA通过对高等教育评估机构的认证来促进大学学术质量的提高,调控评估机制,规范评估制度,为学生与家长、高等学校、政府、社会投资机构服务。它的成立,标志着由高等院校发起成立但又独立于高校与政府之外的、具有权威性的高等教育评估体系的建立。美国高等教育第三方评估与认证的流程是:首先,由政府授权CHEA评估全国的高等院校及其各专业;然后,由CHEA认可地区性以及全国性认证机构、专业性认证机构,这些机构再到各个学校、各个开设具体专业的院(系)进行认证;最后,向学生、家长、社会等利益相关主体公布认证结果,以便学校吸引捐款、吸引优质生源,并向国家申请各种资金和研究基金支持。但是,对认证机构的认可评估须由美国教育部官员主持,认证机构要获得官方认可,必须在学生成就、教育计划、师资、设施设备、财政、行政管理、学生后勤服务、教务、学位与证书、投诉等方面制定科学的评估标准,这样美国教育部就通过认证机构和评估标准,实现了对高校教育质量间接地施加影响。各评估机构采集的信息纳入高等教育综合数据系统,包括学校特性、学生注册、学生完成学业率、畢业率、全职教师的工资、任期、福利、财政统计、教育设施情况等。供教育消费者参考的信息包括院校和专业认证、州许可证、伤残学生服务、学费和助学金、学位和专业、师资和员工、学生成就、学生投诉方法、校园治安情况等。美国教育部依据这些信息确定各种拨款与资金,间接调控学校的办学与专业设置。

我国应逐步培育一批国家级、地区级的评估机构,制定评估流程和管理规范,鼓励评估机构研究制定科学的评估标准和指标,这样既可以化解政府直接评估容易引发的矛盾,又能促进教育质量评价的公开透明,发挥社会监督作用。

注:本文为中国教育科学研究院公益金集体项目“中国教育改革进展报告2012”(项目编号:GY2012036)研究成果。

(作者单位:中国教育科学研究院课程教学研究中心)

作者:马延伟

教育评价论文 篇2:

17基于“互联网+”教育评价的赏识教育评价体系构建

赏识教育评价体系的核心是赏识,以赏识的眼光看待身边的人,在承认差异、允许失败的基础上对学生进行信任、尊重、理解、激励、宽容、提醒等教育评价方法,达到激发学生主动性的目的。我校以赏识教育评价理念为指导,依托“互联网+”技术,构建一套较完善的学生评价系统,运用“互联网+”平台建立学校管理、班级管理、课堂教学中相应的激励性评价机制,全方位评价学生,使管理者、教师、家长及学生之间关系融洽,相互欣赏,形成和谐的校园人际关系。

一、挖掘评价内容

赏识教育评价体系的内容主要指向学生的核心素养,针对小学生的年龄特点和发展需要,我们将评价内容确定为公民素养、学习经历、习惯养成、义工服务和个性发展。虽然这些评价内容无法体现核心素养的方方面面,但基本可以涵盖小学生学习生活的重点培养方向。

二、发挥评价优势

根据评价体系的主要内容,我校充分运用现代信息技术在收集、选择、储存、数据传递等方面的强大功能,着手开发学校信息系统,助力赏识教育评价体系的建立,初步形成“互联网+”赏识教育评价管理模式。首先,学校根据自身需求研发与学籍管理系统兼容的赏识教育评价管理系统,系统涵盖数据汇总、分析和查询等功能,从而构建高效、简单、快捷的全面管理应用。教师、学生、家长均可以登录系统,围绕公民素养、学习经历、习惯养成、义工服务和个性发展等方面评价内容,根据开通的不同功能在系统中进行互动式评价,提高家校互动的有效性。其次,它不再受时间空间的限制,便于家校联系、查询和监管评价。家长可以通过手机或电脑上的对应软件及时了解学生的学习表现情况,也可以及时将学生在家庭或校外活动的表现情况反馈给教师,双管齐下,学生无论在校还是在家都能享受赏识教育的滋润与评价积分,同时也能够更好地引导和提醒学生的言行。“互联网+”教育评价系统的评价方式更加注重互通性、针对性、过程化、个性化,让教育评价改革及时有效,真正落地生根。

三、确定评价指标

学校在“赏识课程”实施过程中,根据课程理念、课程目标、课程结构等,参照学生综合素质评价指标,针对公民素养、学习经历、习惯养成、实践创新、义工服务和个性发展等构筑了具有“赏识教育”特色的多元课程评价体系。

道德品質10%:主要针对学生的爱国意识、诚信友善、思想品德、法制观念等方面进行赏识性教育评价,从学生的思想表现、道德品质、行为规范、综合获奖、违规违纪等进行奖惩。

学业水平40%:主要针对学生课程学习、学习能力、学习习惯、学习的过程和效果进行赏识教育评价与激励,包括对语、数、英等学科质量检测成绩、课堂表现、课后学习情况、学习习惯养成等进行考评。

运动健康15%:主要从体育运动方面进行考量,包括体育类各级各类比赛、体质健康、体育技能、体育监测、肥胖率、近视率、体检情况等进行加减分。

艺术审美15%:主要以音乐、美术学科及艺术方面的特长发展为评价标准,学生在艺术领域的学习、比赛、考级、获奖等均可纳入奖励。

实践体验10%:主要包括社会实践活动、社区服务、调查体验、科技创新以及我校特色义工服务工作,包括班级义工(不再设立班干部)、学校义工、社会活动义工等。

交流合作10%:主要针对学生团结协作、人际相处、合作意识、心理健康、家庭生活习惯和文明礼仪习惯等进行赏识培养和激励。

四、开发评价方式

运用“互联网+”技术进行赏识教育评价必须将过程性评价与阶段性评价、文本记录评价与信息系统评价相结合。过程性评价与阶段性评价这里不再赘述,文本记录评价与信息系统评价相结合指的是学生在平时的活动中采用文本记录评价,能保证学生及时获得同伴、家长或教师的激励式评价,一定的阶段再以汇总的形式储存到信息系统中,完成信息的汇总、分析和记录。文本记录重在学生学习生活的点滴评价,每个学生可以有一张评价记录卡,对平时的学习生活表现进行同伴、家长和教师的互动评价,每学期班级教师通过系统软件平台为学生汇总平时的评价情况,全体任课老师通过学生的课堂表现、学习情况、品德言行、实践活动、兴趣特长、身心健康、比赛获奖、评优评先等进行加分或提醒。家长可以通过扫描学校微信公众号,绑定学生账号密码,随时查看学生的在校表现情况,同时也可根据学生在家表现、课外参加的实践活动、获奖荣誉等情况直接用手机等电子设备向学校提出加分申请,由班主任审核通过。

五、实施评价步骤

在完成了基于“互联网+”教育评价的赏识教育评价体系的设计之后,操作步骤的合理就成为能否顺利实施的关键,在结合文本记录评价和信息系统评价的过程中,应合理安排操作过程。第一,在学习了评价卡和信息系统的基础上,每位教师有一枚评价专用章,用以在记录卡上记录学生平时的学习生活表现。第二,每个班级还设置一位评价小义工,这位评价小义工手上也有一枚评价专用章,家长和同伴的赏识性激励评价由教师认可后由专门的义工学生为其盖章。第三,每学期中和学期末将文本记录的内容进行汇总,输入学生的个人信息评价系统,评价结果以雷达图的形式予以体现。第四,要给予学生兑换评价奖励的机会。学生通过平时盖章的积累,有了诸多积分,在雷达图上可以体现公民素养、学习经历、习惯养成、义工服务和个性发展五个评价方向的优点和不足,以改进自己的学习生活方式,同时五个方面也有总积分,学校可以根据不同的总积分给予不同的奖励兑换。奖品的设置不仅限于物质奖品,还增设了精神奖品和特权申请等,如到老师家过一次周末、听听老师自己的故事、国旗下讲话的机会、学校活动主持人、社区义工活动的召集者等。第五,学校还可以根据全面发展情况和特质发展情况,在每学年末为每个学生颁发特质星证书,如智慧星、博学星、责任星、品德星、奉献星、勤奋星、科学星、艺术星、运动星、快乐星等,同时在学校网络信息平台予以记录,成为学生小学阶段各年级学习情况的评价反馈。

基于“互联网+”教育评价的赏识教育评价体系构建与实施顺应了“互联网+”的时代要求,优化了学生评价体系,能进一步促进学生健康、快乐、自信地成长。

(作者单位:福建省厦门市滨东小学 摇责任编辑:林彦 刘贞辉)

作者:郭松辉

教育评价论文 篇3:

美国NAEP科学教育评价对我国基础科学教育评价的启示

[摘 要] NAEP是美国国家教育进展评估的简称,本文主要从科学知识维度评价、科学能力维度评价、科学教育评价项目等方面探讨了NAEP科学教育评价的趋向,对我国科学教育评价及改革的启示。

[关键词] 美国;NAEP;科学教育;评价

一、NAEP简介

NAEP是美国国家教育进展评估(National Assessment of Educational Progress)的简称。它是由美国国会授权教育部国家数据中心持续开展的全国学生学业成就评价体系,是美国国内最权威的学生学业成就评价体系,科学教育评价是其中的一部分。NAEP首次评价于1969年进行,评价对象是来自全美的4、8、12三个年级的学生。评价框架由4个部分组成:学科领域(地球、物质和生命科学),知与行(概念理解、科学研究、实际推理),科学本质(科学和技术发展史、体现科学和技术特征的思维习惯、探究方法和问题解决),统一的概念(模型、系统、变化方式)。有关部门运用这一框架分别于1996年、2000年和2005年进行了测试。

在此基础上,它又汲取了科学教育、认识科学以及教育评价等诸多领域的研究成果,于2006年推出了“NAEP2009科学评估框架”和“NAEP2009科学评估与测试题规则”两个重要文件,旨在为2009年以及更为长期的科学教育评价提供指导框架和实践手册。该评价体系试题编制技术从学生“表现期望”入手,根据其认知及实践能力生成的规律,开发出一套详细的试题编制细则,目的是通过测量学生的学业成绩反映美国教育成就的进展情况,目前,NAEP已成为美国国家及其各州政府衡量其教育发展状况的一个重要指标。2009框架中的评价内容及项目与原来的框架发生了什么变化,说明了什么问题,是本文探讨的重点。

二、NAEP科学教育评价的趋向

资料显示,NAEP2009科学评估框架相对于1996~2005框架来说,在保持历史连贯性的同时,也做了一些调整,以适应科学教育理论和实践的变化,主要变化趋势如下。

1.科学知识维度评价的趋向

在科学知识维度上,两个框架的具体内容都是物质科学、生命科学和地球空间科学这三个领域,只是维度方面不同,主要归纳为下列几点。

(1)对综合性主题的评价。新框架对综合性主题的评价侧重于三大领域中交叉的话题,如能量守恒问题。这种交叉不是抽象概念的交叉,而是具体科学内容的交叉,即试题情境尽量接近真实世界,测试能反映真实世界所需的科学知识和技能,从而更好地评价学生科学素养中科学知识的迁移能力。这种理念与国际科学课程改革趋向相吻合。现代科学课程作为一门综合性课程,其独特价值在于引导学生整体地观察、研究自然现象,从而更好地构架学生科学学习与实际生活之间的连结,使学生能迁移运用所学知识于现实生活中。

(2)对科学本质的评价方式不同。科学教育一直提倡让学生理解科学的本质,然而,一直没能很好地落实于实践之中。1996~2005框架提出,至少要有15%的评价内容围绕科技发展史以及对科技发展有重大影响的科学本质的重视。2009框架将科学本质归类到科学能力的维度去评价。这说明NAEP期待不仅仅在知识层面上理解科学本质,还要能运用于实际之中。从能力的角度出发,结合具体实际情境,也更能真实地评价学生对科学本质的理解。

(3)对评价内容的呈现和描述不同。1996~2005框架说明了内容主题涉及的概念术语,并分年级说明各主题的具体评价内容。2009框架一方面按年段划分科学教育内容,另一方面也汲取了一些研究成果,对评价内容进行更深入的说明,从而更清晰地勾勒出美国科学教育对不同年级学生应该知道什么的要求,更确切地提出了符合学生认知发展的科学素养知识目标。因此,2009框架与原框架相比,物质科学领域仍是“物质”、“能量”和“运动”三大主题,生命科学领域的主题则由原来的4个改为“生物体的结构和功能”、“生物体的变化”2个主题,地球空间科学领域的主题则由原来的4个改为“时空的地球”、“地球结构”和“地球系统”3个主题。这不仅有利于提高NAEP科学素养的评价效度,对学科课程开发和实施都具有重大意义。

2.科学能力维度评价的趋向

相对于科学知识维度,2009框架在科学能力维度上的变化要更大些。

(1)2009框架评价四类科学能力。1996~2005框架主要评价3种科学能力:“概念理解”,评价学生运用科学概念解释或预测所观察到的真实现象的能力;“科学研究”,评价学生运用适宜的工具和方法进行研究、获取新知识的能力;“实践推理”,评价学生运用科学知识和技能有效解决日常问题的能力。

2009框架对科学能力的评价更加清晰明确,评价的四类能力分别是“识别科学原理”、“运用科学原理”、“运用科学探究”和“运用技术设计”。此框架描绘了期待学生在这四类科学能力上的表现。如“运用科学原理”的4种成就表现,分别要求运用科学知识作出解释、预测、例举说明和评价分析。“运用科学探究”则要求能进行设计,进而能去实施,并能将数学运用于探究结果的分析与说明,能用数据类型进行理论建模,最后能对结论进行证明和批判。“运用技术设计”则规定了三类能力表现,一是能依据科技提出解决实际问题的办法,二是能在运用科技的时候考虑利害关系,三是能预测决策带来的风险。后两类能力的期待,涉及科学情感态度与价值观,更全面地评价了学生的科学素养。

NAEP认为,一位具有科学素养的人首先是熟悉自然界的,能理解科学的主要事实、概念、原理、定律和理论,即具有“识别科学原理”的能力。其次是能运用对科学的认识和理解正确解释或预测所观测到的现象,即“运用科学原理”。再次是知道如何运用科学知识和科学思维去提高对自然界的认识,即“运用科学探究”,以及知道如何依据科学技术解决真实世界的问题,即“运用技术设计”。

(2)2009框架结合学生的认知需求评价其能力。1996~2005框架对科学能力的考查大部分是基于学生经验的。也就是说,通过测题真实情境的创设,学生解答试题需要调动类似的科学体验,而不是依靠对科学的死记硬背。这些科学体验可以来自科学课堂,也可以来自实际生活。2009框架对科学能力的考查则进一步强调要从学生的认知出发,编制试题时要从问题解决的认知需求出发,而不只是关注科学体验的有无。这使得NAEP科学评价结果不仅仅是一个分数,还是对学生的一次认知诊断。

2009框架评价4种认知类型:第一类是陈述性知识;第二类是程序性知识;第三类是图式知识;第四类是策略性知识。

上述4种认知类型与4种能力不是一一对应的,每种能力可能涉及不只一类认知,如都需要调动陈述性知识。从侧重点来看,“识别科学原理”主要涉及陈述性知识;“运用科学原理”侧重于图式知识;“运用科学探究”和“运用技术设计”主要涉及程序性知识,也与策略性知识密切相关。

(3)2009框架评测学生的学习进步。美国在学生科学学习进步方面取得的研究成果以及测评技术的发展,使NAEP在2009框架中能着眼于学生学习进步测评。NAEP认为,学生在科学学习上的进步,就是他们的“朴素理论”越来越多的发展成为科学理论。或者说,学习的新手进步为胜任者,进而成为专家,是他们在某一领域的相关体验、科学知识和技能逐渐增多并结构化的结果。因此,通过评价四、八、十二年级在某一主题内容方面的知识和能力水平,将获得的学业成就与年段进行联系,在整体上(不针对个别学生)得知学生进步的情况。

3.NAEP科学教育评价项目的趋向

2009框架除了保留原来的评价项目以外,还新增了2类评价项目:组合题和计算机交互式任务。

(1)组合题。为了检测学生对某个主题理解的深度,或者对科学理解的广度,NAEP运用多道有联系的试题,作为组合题进行评价。这些组合试题可以都是选择题,或是简答题,或是选择题和简答题的混合。在纸笔评价中,组合题有试题串(item cluster)和预测-观察-解释系列题两类。前者是一系列有联系的试题,可以涉及多个内容领域,可探测学生的“心智模型”、“朴素理论”;后者要求学生对某一现象进行预测、观察和解释。

(2)计算机交互式任务。2009框架指出,计算机交互式任务是对操作类任务的补充,而不是取代。它强调,要有效检测学生的能力,操作类任务需要给学生富有挑战性的、具体真实的问题,让学生通过运用所学的科学知识和技能,自己探寻解决问题的途径和方法,最后得出结论。作为操作类任务的补充,计算机交互式任务则要发挥计算机的独特功能,针对现实中在短时间内难以观察到的现象,如波运动的慢镜头、江河腐蚀;或是肉眼观察不到的现象,如气体分子的运动进行科学知识和能力的检测。这样,运用计算机进行评价的好处还在于无需准备实验场地和实验材料,也不需要经过培训的监考人员,无需整理实验现场,无需要求学生按序进行,并可建立数据库由计算机来评分。

交互式计算机任务有4种类型:信息收集和分析,使学生主动寻找有关信息进行问题解决;信息研究,以经验为基础进行调查,使学生为实现问题解决而研究;计算机模拟,使学生巧妙地运用科学处理多变的问题;概念图,探测学生组织知识进行逻辑推理的能力。实践证明,概念图能有效检测学生对各学科概念之间关系的理解和联系能力。2009框架要求八年级和十二年级必考概念图,可用于“识别科学原理”的评价,也是对陈述性知识的评价。

总体来说,2009科学评估框架评价内容更贴近学生的现实生活,评价要求更深入、更全面、更明确。既能更全面

地评价学生的科学素养,又能适应现代社会的发展趋势。

三、NAEP科学教育评价的趋向对我们的启示

由上可见,NAEP科学教育评价给我国科学教育改革提供了很多借鉴之处,但鉴于我国教育文化背景的不同,我国要进行科学教育评价改革,不能照抄照搬,应注意下面几个方面。

1.重视学生科学学习的认知发展,构建清晰的评价内容体系

NAEP科学评价框架的发展趋向告诉我们,构建评价内容最为重要的是要与学生认知发展相匹配。也就是说,要构建清晰有效的评价内容,我们就要摸清学生科学概念的认知发展,明确某一核心概念在某年级可以评价什么。唯有遵循学生认知发展的评价内容体系,评价反馈的结果才能有效促进科学课程与教学的改进,实现科学素养的培养目标。

在知识维度上,可根据我国现行的中小学各理科课程标准,梳理出核心科学概念体系,确定评价学生“应该知道什么和能做什么”的主要内容。在能力维度上,可以评价科学理解能力、科学运用能力与科学探究能力。受NAEP的启发,还可以评价学生运用科学技术解决现实问题的能力,并由此涉及科学情感态度与价值观的考察。

2.重视科学教育的认知评价方式,构建有效的评价项目体系

毕比指出,科学教育对科学素养的界定,主要围绕“作为一个具有科学和技术素养的公民,应该知道什么、能判断什么、会做些什么”这一问题展开讨论。也就是说,科学素养具有“功能性”,具备科学素养的评价,则就要从认知评价的角度出发,才有信度和效度。NAEP科学教育评价的趋向以评价学生陈述性知识、程序性知识、图式知识和策略性知识来进行科学素养的认知评价,值得我们学习和借鉴。在评价的能力维度上,哪种能力最适宜于通过哪种认知类型的评价,则需要我们进一步去摸索,以更清楚科学素养的认知评价方式。

在评价项目上,我们也常采用选择题、简答题,也会使用选择题与简答题的组合,或者几个简答题的组合。如何选择最匹配的评价项目,提高评价的信度和效度,则需要向NAEP学习。例如,NAEP的组合题、概念图的评价确实值得我们借鉴,但鉴于我国的国情,要量力而行。如采取操作类任务评价学生动手的能力,如何在全国层面的评价中使得操作类任务具有信度和效度,则需要进一步积极试验和摸索。再如计算机交互式任务能在更多情境中评价学生动手的能力,确实非常可取,但鉴于我国中小学计算机教学现状,只能选点试验,全面推广要慎重。

3.重视学生学业能力,构建学业成就评价的理论与模式

目前,我国基础教育评价的弊端,突出反映在强调甄别与选拔功能,忽视改进与激励的功能;注重学习成绩,忽视学生全面发展和个体差异;关注结果而忽视过程,评价方法单一等方面。考试本应是对学业的评定,但因担负着选拔任务,学业成就评价的本体功能被扭曲,进入了小考为大考服务、大考为升学和选拔服务、教育教学为考试服务的恶性循环。为了转变因考试造成的恶性循环,充分研究和开发注重学生学业能力、促进学生发展的学业成就评价模式迫在眉睫。

可见,以什么工具怎样评价学业成就是决定学业成就性质和高低的不可忽视的因素。也就是说,学业成就评价工具的信度与效度以及评价形式决定着是否能够真正测试出学生的学业成就。当前,在我国以学科课程考试来获取学生学业成就现象非常普遍,因为学校课程考试命题的随意性和人为性较大,很多课程考试只能考出学生掌握知识的水平,达不到测试学业能力的要求,以课程考试成绩来代表学业成就难免有不妥之处。为了学生学业成就评价的客观准确性,认真研究和开发学业成就评价理论与模式就显得尤为重要。

4.重视学生的不同价值,构建衡量学生不同价值的标准体系

由于我国人口众多、教育条件差异很大,所以学生的学习环境、水平及能力差异明显,若只用一种价值、一把“尺子”去判断所有学生,必定“制造”出很多“差生”,这实际上是传统教学评价的致命问题。因此,对于不同地域或某方面学习有困难的学生来说,应该用不同评价方法去评价,减少高考“一把尺子”的负面影响。因为多一种价值判断,“多一把衡量的尺子”,就会多出一批有用人才。即使考不上大学,也为今后的人生打下良好基础。因此,对于不同地域的学生如何制定评价标准?对于同一地域不同类型的学生又如何制定评价标准,以达到促进每一个学生发展的目的等问题都值得探究。

总之,NAEP科学教育评价的发展趋势,不仅对我国基础科学教育的评价有所启示,更启示我们要缩减科学教育“理想课程”与“实际课程”之间的差距。要落实科学素养的培养目标,迫切需要科学素养评价的“保驾护航”。而我们当前首要的任务是要构建与学生认知发展相适应的,适合我国评价不同地域、不同类型学生的内容和标准,达到有效提高每一个学生科学素养的目的。

参考文献

[1]赵保钢.美国全国教育进步评价(NAEP)中的科学探究.物理教学探讨[J],2005(7).

[2]张布和.我国学业成就评价改革现状及对策.中国教育学刊[J],2009(4).

[3]林静.美国NAEP科学素养评价新趋向——基于美国2009NAEP科学评价框架的分析研究.课程·教材·教法[J],2009(8).

[4]http://www.fzyz.net/news_open.aspx?ID=8879.

作者单位 山东省泰山学院教师教育学院

(责任编辑 王永丽)

作者:刘 超

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:语文媒体教育论文下一篇:国外农业保险论文