时间:2023-03-30 11:30:39
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇教育评价论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
然而,目前我国尚未形成有效的学生、教师、学校评价机制,影响了教育改革的步伐。认清制约教育评价的因素,探索符合素质教育和基础教育课程改革的评价机制,对当前的教育教学改革具有深远的意义。
一、教育评价的发展过程教育评价(reducationevaluation)是评价者按照一定的评价标准在对教育活动及其相关因素进行系统分析的基础上,就教育活动满足社会和个体需要的程度的判断的特殊认识活动
教育评价的发展大体经过四个阶段:
(一)心理测验时期。自19世纪中叶起到20世纪30年代的80多年,为教育评价的第一个时期,教育测量的研究取得了一些成果,特别是在考试的定量化、客观化与标准化方面,取得了很大的进展。强调以量化的方法对学生学习状况进行测量。然而,当时的考试与测验较为片面地要求学生记诵教材的知识内容,无法真正反映学生的学习过程。
(二)目标中心时期。20世纪30年代至50年代是教育测量的第二个时期,当时泰勒(Tyler•R)提出了以教育目标为核心的教育评价原理,并明确提出了“教育评价”的概念,从而把教育评价与教育测量区分开来,教育评价学就是在泰勒原理的基础上诞生与发展起来的。
(三)标准研制时期。20世纪60年代是教育评价的第三个时期,以布卢姆为主的教育家,提出了对教育目标进行评价的问题。美国教育学家斯克里文(Scriven.M.)、斯塔克(Stake.R.E.)和开洛洛(Kellogg•T.E.)等人对教育评价理论作出巨大的贡献,学者们把这一年定为美国教育评价发展的转折点。
(四)结果认同时期。20世纪70年代以后,教育评价发展到第四个时期。在这一时期关注的是评价结果的认同问题。关注评价过程,强调评价过程中评价给予个体更多被认可的可能,重视评价对个体发展的建构作用。近年来,随着我国素质教育的全面推进和基础教育课程改革的不断深入,有智慧的教育和培养有特长的学生已成为时代教育改革和发展的主旋律。教育评价在教育发展中起着导向、鉴定、改进、反馈、展示、激励、检查、监控的作用,评价机制的改革与创新倍受社会关注。但现行的基础教育的评价和考试制度与全面推进素质教育的要求还有一些不相适应的地方,影响了素质教育的推进和新课程的改革步伐,制约了素质教育的积极有效推进。
二、影响教育评价的因素
(一)教育体制教育体制是影响教育评价的重要因素之一,集权的教育体制,强调评价模式的统一性,强化评价的鉴定评比功能;而分权的教育体制容易形成多元化的教育评价模式,并把评价的功能主要放在为教育的发展与完善提供咨询信息上,我国的教育体制正处在集权化向分权化转化的过程中,各级各类学校在办学方面的主动权不大,主要控制在国家及省市等各类教育行政部门的手中,且教育评价还使用统一的评价方案,从而影响了教育评价的发展。
(二)评价对象窄化评价对象作为评价的内容主体在教育评价中占有非常重要的地位,因为整个教育评价都是围绕评价对象展开的,不同类别的评价对象、不同发展阶段的同一类评价对象,对应的评价模式都是不同的。我国传统的教育评价是由上级评价下级,管理者评价被管理者,教育行政部门评价校长,学校(校长)、教师为恒定的评价主体,而校长、教师、学生分别成了评价的客体,实际的评价对象主要集中在学生学业成绩、优秀教师的比例、学校硬件条件几个方面,而把评价的其他内容放在了次要位置。
(三)评价方法单一评价方法指的是为达到某种目的,根据评价原则选定的有利于各种评价力量协同工作的一套活动方式和操作程序。它是计划、组织、调控、评价实施活动的技能和手段,以及搜集、整理、优化评价信息资料的知识和经验。我国近几年在评价方法方面投入的力量很多,主要集中在实证主义方法论范畴,重点研究的是如何制定指标体系,从而造成目前主要以定量分析为主的教育评价模式,对指标体系能否真正反映评价对象的本质考虑的不多,用这种单一的方法来评价教育,必然会造成不良的评价后果。
(四)教育价值观念的影响教育价值观直接影响评价指标的确定与它们的判别标准。教育评价观是一种关于教育事物价值判断的过程,它是以人们的教育价值观为基础的,持不同教育价值观的人对同一教育事物的评价结果必然有差异,而教育管理的主体和客体因各自所从事的实践不同,就必然会产生不同的教育价值观。目前我国的教育评价的价值取向主要强调教育的工具价值,而忽视了教育主体的发展价值,评价往往是外在的强制性的,强调其鉴定功能,忽视评价的改进、激励和发展功能,注重外部目标的实现,忽视了评价对象的内部需要,忽视了利用评价机制激发主体的内部动机和促进评价对象的主动发展,笼罩着功利主义、实用主义和行政管理主义的色彩。
(五)教育评价基础理论薄弱,评写作论文价者素质不高我国的教育评价研究及实践是从20世纪70年代末80年代初开始的,时间短,评价基础理论薄弱,对教育评价中的有些问题还很难找到合适的方法,如对学生的非认知因素、思想道德素质、心理健康水平等方面,缺乏科学有效的评价技术手段,教育评价指标体系的设计缺乏坚定的科学依据,可操作性较差;另一方面评价者的素质不高,教育评价是一项专业性很强的工作,要求教育评价者不但要懂得本门学科的专业知识,还要掌握教育学、心理学、测量学及评价学方面的知识,有丰富的实践经验者才能胜任。
三、提高教育评价质量应采取的对策
(一)加深对教育评价的认识,树立正确的教育价值观教育评价的基本目的就是为教育的发展提供必要的证明、改进、决策、定向的作用,因此教育评价不应该是外在的力量强加给学校的一次性管理活动,而应成为学校完整的科学管理过程中的一个重要环节,把它作为学校赖以生存和发展的内在基础,是学校教育活动实现自我调控、自我发展、自我完善的内在活力,应成为学校的自觉行为。同时必须明确我国教育评价的价值取向的主要依据是党的教育方针和培养目标,也就是说教育评价的价值取向应该是看其是否有利于提高民族素质。
(二)使用多样化的评价方法教育现象的复杂性和评价过程的多阶段性,决定了评价方法的多样性和整体性。发展性的教育评价,强调的是评价者要对评价对象的过去、现在作全面了解,根据评价对象过去的基础和现实表现,预测评价对象的未来发展目标,鼓励学生之间、同行之间互评,评价对象可以自选评价者,或者评价者和评价对象共同协商制定发展目标。自我评价也是当前比较提倡的方法,因为它能调动自身的积极性和主动性,不受时间和场合的局限,简单易行,并可长时间反复使用。评价方法必须作到四个结合:终结性评价与形成性评价有机结合;静态评价与动态评价有机地结合;定性评价与定量评价有机地结合,综合评价与单项评价结合。超级秘书网
(三)突出评价对象的主体地位教育评价的整体过程要围绕评价对象,不仅是学生、教师、校长、教育界领导等,还涉及课程、教学计划、政策法规、教育改革方案、教育发展战略等各种教育现象和事物,包括软件评价,也包括硬件的评价。评价的目的是促进教育事业向更完善的方向发展。评价对象是发展的主体,教育评价应重视提高评价对象的参与价值,重视评价对象的主体意识、创新精神,教育评价应是一种双向性的评价活动,应采取教育行政部门与校长、校长与教师、教师与学生互评,消除原来主客体之间的不平等关系,这对于双方扬长避短、互相学习、促进工作,提高教育教学质量大有裨益。
素质教育的根本目标是促进学生的全面发展,而教育评价自然应该关注学生的综合素养。《关于积极推进中小学评价与考试制度改革的通知》指出:中小学评价要“从德、智、体、美等方面综合评价学生的发展”,对学生的评价内容也要多元化,“既要重视学生的学习成绩,也要重视学生的思想品德以及多方面潜能的发展,注重学生的创新能力与实践能力”。而2013年6月颁布的《教育部关于推进中小学教育质量综合评价改革的意见》所附《中小学教育质量综合评价指标框架(试行)》,也将教育评价内容定为“品德发展水平”“学业发展水平”“身心发展水平”“兴趣特长养成”和“学业负担状况”等五个方面,并提出了20项教育评价的关键指标,这说明我国已充分认识到教育需要综合评价才能全面考察学生的综合素养。而该信中提到的“对你的成绩我们感到非常骄傲,我们觉得你已经尽了你最大的努力”则反映出该校的教育评价并不是只关心学生的考试成绩,它还对学生的学习态度做了肯定性评价。学生的考试分数虽然是一种评价指标,但它却不是唯一的评价指标,因为分数无法考察出信中所提到的学生的“演奏音乐”“唱歌”“跳舞”“写诗或者写歌”等多种能力,也不能考察出学生“善良,深思,可信赖”的人格魅力,更无法考察出学生“每一天都在让自己变成一个更好的人”的积极心态。所以,教育评价应彻底改变只关注学生分数的现状。今天的教育评价更应关注学生的综合素养,这样才能全面而公正地评价学生,并让学生全面地认识自我。
二、教育评价应以积极性评价为主
以表扬和鼓励为主的积极性评价能够对学生起到激励和督促作用,促使学生看到自己的成就和不足,找到或发现成功或失败的原因,激发学生的学习动机,调动学生学习的主动性和积极性,增强学生学习的热情和信心,最终保证教育过程顺利有效地进行。同时,积极性评价还可以正面引导学生按照评价活动所提倡的方向发展,对整个教育工作起到定向指导的作用。该信中提到对学生的成绩“感到非常骄傲”,显然是具有激励作用的积极性评价。此外,信中还对学生成绩以外的各个方面都给予了关注,这也是积极性评价,具有正面引导的作用,不仅能帮助学生建立自信,还能帮助学生形成正确的世界观、人生观和价值观。而信的末尾还特别提醒学生要记住“人可以有很多种伟大的存在方式,考试绝对不是唯一的一种”,这句忠告堪称教育箴言,是进一步对学生进行正面引导,不仅能鼓励成绩欠佳者看到自己未来的希望,而且还能让成绩优秀者戒骄戒躁,从而使每个学生都能正确地认识自我。
三、教育评价要将形成性评价和终结性评价相结合
在教育教学过程中,我们对学生的评价应该将形成性评价和终结性评价相结合。过去的教育评价常常以终结性评价为主,更多地关注以学生成绩为主的教育结果,却忽略了对学生成长过程的关注,缺少了学生学习过程中的形成性评价。而形成性评价是一种面向未来的评价,更关注学生学习和成长的过程,它不仅关注学生过去的成绩,还要根据学生的日常表现从多个角度加以分析、反馈,来促进学生自我反思和调整,并确定其未来发展的努力方向。所以,今后教育工作者在日常的学生评价过程中应尽量淡化学生之间的评比,而应提倡学生与新课程标准、教育目标作比较,并与自己的过去作比较,以此来引导学生发现自己的进步与不足。在此基础上,还可以提出具体的改进建议,使学生知道怎样可以做得更好,从而激励学生向更高水平的目标迈进。该信中提到对学生的成绩“感到非常骄傲”,同时又以排比句列举了学生诸多方面的能力和优秀品质,这正体现了形成性评价和终结性评价相结合的教育评价方式,值得我们学习和借鉴。《关于积极推进中小学评价与考试制度改革的通知》指出:对学生的评价“不仅要注重结果,更要注重发展的变化过程。要把形成性评价与终结性评价结合起来,使发展变化的过程成为评价的组成部分”。而《教育部关于推进中小学教育质量综合评价改革的意见》也明确提出教育评价要“将形成性评价与终结性评价相结合,注重考查学生进步的程度和在学校的努力程度,改变单纯强调结果不关注发展变化的做法”。这都为教育工作者的教育评价方向提供了很好的指导。
四、教育评价要将定性评价和定量评价相结合
在教育教学过程中,我们对学生的评价还应该将定性评价和定量评价相结合。所谓定性评价,是指采用开放的形式获取评价信息,运用定性描述的方法做出结论的评价。如教师在学生手册中填写的教师评语,往往是对学生各方面的表现进行综合评价,指出其进步、潜能及不足,这就属于定性评价。该信中提到的学生各方面的表现也属于定性评价。而定量评价是指采用结构式的方法,预先设定操作化的评价内容,收集并量化学生的信息,运用数学方法做出结论的评价。如该信中提到的“成绩”即是通过统一考试得出的具体分数,就属于定量评价。定量评价往往只能考查学生某一时段、某一方面的学习结果,而无法考察学生的学习过程、学习态度,也无法考察学生的综合素养。以往的教育评价过多地强调定量评价,而忽视了定性评价。《教育部关于推进中小学教育质量综合评价改革的意见》指出:教育评价要“将定量评价与定性评价相结合,注重全面客观地收集信息,根据数据和事实进行分析判断,改变过去主要依靠经验和观察进行评价的做法。”这为教育工作者进行教育评价提供了指导。今后,我们对学生进行教育评价,应将定性评价和定量评价相结合,可在教育教学过程中为学生建立成长记录袋,收集反映学生学习过程和结果的各种信息资料,从而反映学生多样化的发展需求、优势及不足,记录学生成长的过程,促进其自我认识能力的提高。这样的评价方式才能促进学生综合素养的提高,才会有利于学生的成长和发展。
1.督导能促进教育评价系统的有效性。在某种意义上说,督导机制能监控评价工作的顺利实施,保证评价工作的客观性、公正性,使评价工作意向明确、方法有效、结果可信。进而,通过教育督导既能提高基础教育阶段素质教育评价系统的信度,更能提高基础教育阶段素质教育评价系统的内在效度和外在效度。内在效度往往以素质教育评价自身系统目标指向的实现率为体现,外在效度则以素质教育评价系统的应用范畴的有效程度为体现。无论是素质教育评价系统的信度,还是素质教育评价系统的内外效度,都依赖于教育督导对评价系统的功能的发挥。2.督导能促成评价信息的及时反馈。评价本身的功效还在于激励、选择、导向。无论哪一种评价功能的发挥,都有赖于评价信息的及时反馈,而评价信息的及时反馈则有赖于督导机制。通过督导,可以使评价所获得的信息及时地双向反馈,即上情下传,下情上达,进而能沟通评价者与被评价者之间的关系,沟通评价者之间的关系,乃至于被评价者之间的关系,使评价信息真正发挥应有的功效,即有效的为评价者和被评价者所用,也使评价工作能真正成为教育性活动,使素质教育评价成为基础教育阶段素质教育活动过程中的生动现实。3.督导能促成评价工作的制度化。通过素质教育评价系统对教育督导系统的包含,可以使素质教育评价工作在一定时间期限内定期地进行或者使素质教育评价工作经常化、常态化,保证评价工作对教育活动的驱动。通过督导式评价,可以使评价过程所获得的信息或材料规范化地汇总,完善其评价系统的档案制度,使评价工作真正体现其过程性和有序性,从而有助于全面、动态、客观地分析、比较被评价者的变化发展情况。因此,督导式评价体系能够真正体现其更加完善的工作制度,使素质教育评价工作经常化、系统化与制度化。4.督导能促成评价范围的必要拓展。通过督导式评价系统的构建,可以解决传统意义上的评价范围的有限性问题。使基础教育阶段素质教育评价不单是教育系统内部的事,而拓展成社会大系统之事,我们不仅可以评价教育内部系统,我们还可以评价教育外部系统即影响教育的社会系统;评价主体不仅可以是教育者或受教育者,还可以是家庭、社区、政府行政机制以及教育行政部门。通过督导机制在评价系统中的充分发挥,可以使评价的内容系统、评价的主体系统、评价的客体系统、评价的指标系统等方面得到进一步的扩展,使评价系统与教育系统建立在同一社会系统基础之上,并有效地纳入整个社会人系统中,成为互相驱动的两个自然组织系统。
二、构建基于督导评估的素质教育评价机制应解决的关键问题
(一)基础教育阶段素质教育评价体系涉及的范畴及因素基础教育阶段的素质教育评价是一个长期而复杂的系统工作,它关系到“让谁来评”、“去评价谁”、“评价些什么”、“按照什么去评”以及“该怎么来评”,这些问题自然就涉及评价的主体、客体、内容、标准、方法等诸多问题。教育评价的作用在于客观准确的找出影响教育正向发展的外在因素,这就要求在进行教育评价的时候,除了要严格按照教育评价的程序执行外,还必须健全评价主客体系统,完善评价指标系统,优化教育评价方法系统,建立一个协同而互动的教育评价大系统。素质教育评价的目的旨在通过社会、政府、学校、教师、家长、学生全面地对教育系统的学校、校长、教师、学生进行科学评价,从而发现问题与不足,为教育教学的改进与完善提供依据。所以素质教育评价体系应该是一个评价主客体多样化、评价方法模式科学化、评价指标多元化、评价内容全面化的体系。在教育评价工作中,既要注重评价的结果,也要注重评价的过程;在评价的方法上既要定性也要定量;在素质教育评价系统中,不但要对评价客体进行评价,也要注重对评价系统自身的元评价,还要对外部评价系统的作用进行评价,从而有效地保障教育教学的质量,为教育教学工作做出正确的指导。然而这一保障机制要实现就必须拥有完善的评价系统,而完整的素质教育评价系统又包含了评价的主客体系统,这个主客体系统当然涵盖了外部评价主体,所以完整的评价系统必须在由教育督导机制下的外部评价系统的参与下才能实施,这便是基于教育督导的素质教育评价的价值所在。
(二)素质教育评价对督导机制的需求及要求上个世纪80年代,在存在主义和现象学、解释学、建构主义等哲学思潮的影响下,库巴和林肯(Guba,E.G.&Lincoln,Y.S.)提出了自然主义探究评价模式,主张教育评价应该在自然的情境下进行,认为评价所得到的结果往往会适用于特定的某种情境。针对以往的教育评价大多是以促进管理而不是以服务为主要目的、同时缺少对评价客体进行更多的主体性关注的倾向,自然主义探究评价模式正是充分地借鉴了斯塔克应答评价模式的基本理论,认为教育评价的主要意义在于服务,所以评价主体首先需要关心的是评价对象的问题、兴趣和焦点,以“回应”评价对象为起点。这就需要评价主体运用一定的质性研究方法,从评价客体的基本需求出发,以促进评价客体的未来的发展为主要目的,更多地去考虑评价客体的相关发展背景以及整体的发展情境对评价结果的影响,充分地听取各个方面的看法、建议,通过评价主体、评价客体以及所有教育评价参与者进行不断的对话和交流,最后形成科学的评价结果,达成一定的共识。这种新的评价方法,改变了以往评价主体与评价客体之间制约与被制约的关系,体现了多元并存的价值理念。素质教育评价正是这样一种新的教育评价机制,它不同于以往的评价,素质教育评价是一种民主多元化的评价机制,它更多地关注评价客体的未来发展,更加关注过程性评价,注重评价结果的导向功能,而基于教育督导的素质教育评价机制正是整合了内部评价体系和外部评价体系,形成了系统完整的评价机制,更好地服务于素质教育评价。以此理论为指导,建立的包括教育督导在内的素质教育评价大系统,这种评价系统就给教育督导评估提出了新的要求。在评价目的上,由侧重鉴别、选拔和奖惩转向侧重促进发展和改进工作,从关注结果的评价转向更加关注诊断性评价和过程性评价;在评价内容上,注重全面性和整体性,从办学的理念和目标、办学条件、课程与教学、队伍建设、教育质量等多方面进行全面、综合的评价;在评价方法上,强调多样化,注重把质性评价与量化评价结合起来,运用测验、问卷调查、自然观察、访谈等多种方法;在评价主体上,强调多元性和合作性,注重调动评价对象的参与性,重视自评和互评的作用;在评价指标的设计上,强调弹性化、个性化和特色化;在评价者和评价对象的关系上,追求平等,协商解决问题;在评价结果的生成上,重视评价者与评价对象的共同认可和接受,等等。
(三)教育评价与教育督导的联系与区别教育督导评估是以教育督导机构为评估主体,代表政府或教育行政部门对下级政府及教育行政部门和学校等教育机构的教育教学工作进行的教育评价。它是国家对教育进行管理的一种政府行为,也是政府对教育进行管理的行政执法行为,它还是教育法律对教育实施监督过程中的一种行政监督行为,是教育行政部门的教育行政监督行为。教育评价则不同,它“是按照一定的价值准则对系统收集起来的关于某教育客体的各方面信息进行处理、分析、综合,对客体做出价值判断的活动过程”。1.评价主体的不同。督导评估是以教育督导机构为评估主体,代表同级政府或教育行政部门对下级政府及教育行政部门和学校的教育工作进行的教育督导评估。而教育评价的主体可以是政府(督导室),或是教育行政部门,也可以是其他具有监督职能的国家机关、组织和机构以及办学单位自身,甚至还可以是社会中介组织。实质上,二者在评价主体上的区别主要体现在主体权限范围及关系上,因此,明晰教育督导评估和其他教育评价的关系本质上是要理顺教育督导部门与其他教育评价主体之间关系。2.评价对象的不同。教育督导评估的对象十分广泛,既包括督政,又包括督学,涵盖了教育工作的诸多方面。督导评估的范围除中小学校和幼儿园、成人教育机构外,还包括各级政府部门和教育行政机构。既涉及下级人民政府和教育行政部门的教育工作、学校的教育工作,还会涉及相关教育管理者———地方各级政府的有关领导、教育行政部门的领导以及中小学校的校长。而我国现行的教育评价制度评价的主要对象是各级各类学校、教师以及学生,目的是为了加强政府对各级各类学校的宏观调控,以提高学校的办学水平和教学质量。其对象往往是一个个办学实体、教师或学生群体。3.评价内容的差异性。督导评估对象的广泛性,使得督导评估的内容丰富化。首先,对于教育评价和教育督导评估对象的交集———学校来说,二者在评价内容上各有侧重。督导评估主要包括中小学实施素质教育工作评估,对学校的管理体制、领导班子、教师管理与培训,办学方向、办学条件、教学质量、办学效益以及校园文化、校外教育等方面的督导评估。科学有效的教育督导评估的内容具有整体性、综合性的特点。其次,督政是教育督导评估特有的内容,包括对同级或下级政府部门教育执法行为的督查,对学习化社区的评估等。而教育行政部门或教育机构的评价则侧重于对学校教育教学活动或相关教育要素等微观层面的评估,评价内容往往是具体的、专项的。例如对教师综合素质、某学科教学质量、学生对知识的掌握水平、实验室设施设备等相关方面进行具体客观的评价。
三、构建督导视野下的素质教育评价机制的路径思考
督导式的评价组织应属于政府与教育系统的中间机构,也是教育行政部门的内部常设机构。它的督导评价对象既包括教育内部系统,也包括教育外部系统即社会系统,责任在于监督、检查、评价与指导。教育督导评估机制下的素质教育评价体系可以行使教育评价客体系统中的外部系统即社会系统的评价,它进行的是一种垂直方式的,即自上而下的督导评价,它要求是上级督导组织对下级政府部门的教育评价。这一评价组织通过对政府部门等教育外部系统的教育评价,可以排除外在干扰,优化教育的外部环境,切实保证教育条件的真正满足。
(一)从多元化的层次构建督导视野下的素质教育评价机制素质教育不同于应试教育,他要求全面提高学生思想道德,文化科学,劳动技能和身体心理素质,所以素质教育的评价目的也就不是以前简单的选拔、筛选学生,从而为高一级的学校输送精英人才了,素质教育的评价目的主要是通过社会、政府、学校、教师、家长、学生全面地对教育系统的学校、校长、教师、学生进行科学评价,从而发现问题与不足,为教育教学的改进与完善提供依据。1.从宏观层面构建督导视野下的素质教育评价机制。宏观层面的素质教育评价机制是通过社会、政府、家庭、学校、个人的联动效应而组成的一个动态的、系统的、全程的教育评价机制。这个评价机制从整体出发,运用整齐划一的形式把素质教育评价的各个部分统一起来,从而使教育评价发挥作用。建立督导视野下的素质教育评价机制可以按统一的方式来运行,从而发挥不同层次或不同方面教育评价的作用,为教育教学活动的改进提供科学有效的依据。2.从微观层面构建督导视野下的素质教育评价机制。微观的素质教育评价机制是指从素质教育评价的各个组成部分着手,充分调动各个组成部分的积极性来发挥教育评价的作用。对于素质教育评价而言,就是要把评价的主体、评价的客体、评价内容、评价的方法手段、评价模式等因素的积极性充分调动起来,通过各个单体因素发挥其自身的积极性因素,从而发挥素质教育评价整体的功能,构建基于教育督导的素质教育评价机制正是充分结合教育督导的外部社会评价功能和一般的学校教育评价的积极性因素,从而更好地发挥素质教育评价的作用。这种微观教育评价机制的特点一个在于它的基层性,另一个就是它的个别性。
(二)构建形式多样的督导视野下的素质教育评价机制1.行政计划式的素质教育评价机制。这种机制充分发挥了督导的作用,政府各级督导部门以及督学可以运用行政的手段和计划的手段将素质教育评价的各个部分有机地整合起来,使之发挥更有效的作用。诸如可以运用下发行政文件、例行开会、不定期的检查、科学评估和按期汇报等方式把各级各类学校素质教育评价的方方面面统一起来,从而使教育评价更加高效的运行。2.指导服务式的素质教育评价机制。指导服务式机制是教育督导评估在素质教育评价中独特的作用方式。在素质教育评价中教育督导部门可以给予相关评价机构一定的指导或者提供实质性的服务,但不直接参与评价,在有关指导的方面,教育督导部门对于评价的主体只是提供有益的建议,适当的指正;而在提供实质服务上,政府督导部门对评价主体仅仅是提供一定物质上的支持和有关信息资料上的参考建议等。这种评价机制实质上也就是政府督导领导下的第三方评价机制。
教育评价是一种在教育价值观的指导下的价值判断,可是目前由于过于专注于事实判断。缺乏监督和制约,评价垄断性和随意性较强,只以这一规则为准,所以依旧以传统的纸笔考试为主,来当做主要判断标准,仍过多地倚重量化的结果,而很少采用体现新评价思想的、质性的评价手段与方法。
二、忽略学生的主动性
新课改要求在教育过程中,学生为主体,学生要主动学习而不是被动。评价不是评价者的独占物,它需要评价者与评价对象的共同参与、相互作用。而目前的现状是,课堂上,老师硬性的教学生发声方法,没有互动,也没有创新,依旧是被动学习。
三、掌握建立评价体系的要求及基本规则
以促进发展为主要目的。评价与目标是相适应的,建立评价体系就是要与教育相辅相成,起一个监督和制约的作用。通过教育评价体系反馈给我们的信息来反思我们在教育过程中存在的问题,也可以发现我们的优点,从而发扬光大。所以,必须要以促进发展为主要目标。要体现全新的教育观念和课程评价发展的趋势。关注全人类的发展,我们不能完全沉浸在知识的世界里,两耳不闻窗外事,要时常转变内容及规则,强调评价的民主化和人性化的发展,以适应时代的发展。评价内容综合化,要将政府评价、社会评价和学校自我评价三者有机地结合起来。要满足社会多样化的需求,就要使外部评价与内部评价共存,二者取长补短、相互促进。关注发展过程,有机结合形成性评价与终结性评价。关注学生、教师、学校和课程发展中的需要,突出评价的激励与调控的功能。学生的成长和发展是一个漫长、渐进的过程,在这个过程中,学生会经历不同的阶段,有着不同的心理特征,所以,我们要时刻关注并且给予高度重视,这也直接关系到学生未来的发展。
四、结合声乐教育特点,建立健全评价体系
通过查阅文献和在美国访学期间对美国东西海岸著名大学和知名大学的一些理工科课程考试试题进行了研究,其考题大多数来源于实际问题的解决,其最突出的优势就是考核的科学性和实用性。如加工一个特定功能的部件,该选择什么性能的材料?加工过程有什么特别的工艺要求?如何检验评价最终成品的功能?物料成本多少?有时试题中夹有学生兴趣问卷,注重激发学生学习兴趣。在英国和日本,大学课程的考核则注重能力考查,考试的层次和内容多元化。在国内,尽管创新教育和素质教育的口号喊了二三十年,可高校现行的考试体系依然存在违背素质教育和创新教育宗旨的弊端。课程学习的考查依然主要沿袭几十年来采用的闭卷笔试形式,绝大多数的课程考试的内容以课堂教学采用的课本为唯一的内容。这样的考试几乎都可以在书本上找到答案,忽略了学生对知识的理解和运用能力的考查。因此,随着教育改革向素质教育和创新教育方向的不断推进,改革现行的考试形式和内容势在必行,设计不同层次的考试形式,内容新颖、科学性和趣味性强的试题,激发学生学习兴趣,使学生能够积极主动探索和创新。
二、高校现行课程教学考试评价体系存在的主要问题
从某种意义上讲,高校现行的课程教学评价体系基本上是传统考试制度延续,这种考试制度的弊端主要体现在以下几个层面:
1.对考试评价目的认识层面出现偏差。
(1)注重考试过程和试卷分数,轻视考试信息分析。课程考试的目的之一在于更充分评价学生对所学知识的理解、掌握和运用的基本情况;反映教师教学效果和教学质量以便及时发现问题和改进教学方法。而现行的考试虽然也要求教师对考试试卷反映的教学问题进行分析,但实际上大多数对学生答题中反映出来的教学问题及学生知识应用能力的分析只是敷衍应付而已。
(2)现有的考试体系抑制了学生的个性化发展,不利于创新型人才的培养,不适于素质教育模式改革。高校教育的评价体系直接决定高校培养和造就人才的模式。然而现行的考试关注的是学生对书本知识的记忆,忽略了学生个性化发展和创造力的考察。在知识经济为主要特征的今天,这样的考试导向不利于高校创新人才的培养,同时也不能适应当今社会对创新精神和创新能力人才大量需求的新要求。
2.考试形式限制了学生多方面能力培养。
高校的课程考试绝大部分在课程教学结束后或期末进行,考试成绩对学生学习优劣的评价占据了很大的权重。显然,一次考试,因受试卷考题涵盖的教学内容及主要知识点的考查限制,很难完整地反映学生获取的知识水平和综合运用知识的能力。因此,仅凭期末考试成绩不能全面、客观、准确地反映教学全过程的实际效果。不同性质课程的特点很难通过一次闭卷笔试体现,一次闭卷考试形式也难以按教学大纲的要求考查学生创新意识和创新能力以及运用知识的综合技能,从而导致学生仅为应付考试过关而学习,限制了自身创新意识的养成和创新能力的培养。其次,高校现行的课程考试体系呈现如下特点:闭卷考试多,开卷考试少;笔试方式多,面试、答辩考试少;理论考试多,技能、操作、实践能力考察少;统一考试多,因材施考少。最后,目前高校课程考试评价体系直接导致学生只关注分数不重视能力,因为考试分数不仅直接关系到大学生的升级、毕业、学位等,而且还成为大多数高校学生奖学金、评优推优的主要依据。
3.考试内容呆板,阻碍了学生想象力与创造力的展示。
至今,绝大多数高校课程考试命题范围只限课堂所讲授的内容,通常很少顾及对教学大纲所要求掌握的知识体系的全盘考虑。主要体现在:
(1)命题内容几乎局限于教材和课堂笔记。考查的只是学生对课堂知识的死记硬背,体现不出学生对所学知识的理解与运用能力。这样的考试极大制约了对学生独立思考能力和灵活运用知识能力的培养,导致学生知识面狭窄,逐渐丧失学习兴趣。
(2)试题类型缺乏新意。长期以来,国内绝大多数高校课程考试题型几乎主要采用填空、单选、多选、判断、简答等有限的传统题型,而综合性与设计性考题、分析论述题等主观性试题较少。这种几十年不变的考试内容及形式已经不能适应当今高等教育的新发展。
4.试卷命题质量不高。
高质量的试题应该体现出学生对知识掌握和运用能力的全面考察以及教师教学效果的整体评价。一套高质量的试题,除应符合教学大纲的基本要求外,还应检验出老师实现教学目标的情况和测试学生掌握所学知识和能力的程度和水平,不仅如此,还应能区别测出每个学生学习情况的个体的差异。
5.教师命题自由度受限,妨碍“因材施考”。
高等教育的宗旨除传授知识外,更主要的是要培养学生独立判断与选择的能力以及创新精神、协作精神等当今社会所要求的基本素质。高校课程教学的重点应着重培养学生的创新精神和创新能力,教会学生如何发现问题、分析和总结问题的方法;真正做到授人以渔,使学生能终身受用;鼓励学生在质疑中思维。然而,现行的考试制度与此宗旨似乎背道而驰。受教学大纲的限制,同一门课程由若干不同教师授课,而不同老师教授的学生采用同一试题测评,要求试题必须完全符合教学大纲,且教师授课必须严格按照教学大纲的要求从事教学活动。这样的课程教学只会限制充分发挥每个教师的教学特色、扼杀学生的个性。
三、几点建议
高等教育应以人的个性发展和培养创新意识为根本。高等教育现行的管理培养模式单一化和标准化与全社会对人才多样化和人才成长模式多样化的需求形成了强烈反差。我国的教育方针早就强调全面均衡发展,而如今几乎所有高校都在用统一流程和标准的“流水线”进行人才生产,鲜有学生的个性发展空间和环境;与此同时,标准化考试的引入使得教育工作者及其管理者方便用“标准答案”统一学生的思维,不乐见甚至很难容忍学生对教育现状提出的批评。这些在高校教育理念中刻下的深深的烙印处处体现在我们的管理和培养模式和对课程教学活动的评价即考试中,限制着学生个性的发展与创新意识的养成。
1.破除传统“分数决定一切”的旧观念,建立科学的教与学的考试评价体系。
破除“分数决定一切”的旧观念是教学考试评价体系改革的前提。科学的考试评价制度强调的是人的素质的全面协调发展,应体现从“人”出发。课程教学考试评价的目的不仅是为了检查学生对所学知识的掌握和运用状况,更重要的是通过考试评价活动引导学生学会主动积极学习,促进学生强化掌握知识的能力。同时,科学的评价制度要求增加对学生非智力因素的考查,促进学生在掌握知识技能的同时,形成科学的世界观、人生观、价值观,充分体现其教育功能。因此,建立科学的教育评价体系,为改革人才培养模式和营造良好的思想氛围,对深化高等教育改革、推进高校素质教育和大学生创新能力培养都有重大意义。
(1)确立课程考试是对前一段课程学习的学习效果总结不是为了课程学习过关。毋庸讳言,不少在校大学生有“60分万岁”的思想,其可怕之处就是为课程过关而学习,其后果就是消极应付课程学习,渐渐失去学习兴趣。
(2)树立考试是师生对课程教学的一种互动方式的理念,不是课程教学的结束。通过考试,教师可以了解学生对知识的掌握程度,知晓自己的教学效果和教学过程中的疏忽和缺陷,以便日后与学生的交流中能针对性指出前期学习中的不足,鼓励他们积极思考和深入探索。
2.树立构建主义学习思想,激励大学生主动积极学习。
构建主义学习理论认为,学习不是师生间知识的简单传递,而是学生自己构建知识体系的过程,主要包括两个方面:一是弄清事物的本质、规律及内在联系,将所学知识所反映的信息尽量与自己已有的认知结构相联系,并对这种联系认真思考,实现对新信息意义的构建。二是在原有的经验基础上对已有的知识的再理解与再创造过程。这种过程必须是由学生自己亲自去完成,其他人替代不了。对刚入大学的学生用已有的知识解决常见问题并不困难,但他们对老师的依耐性导致缺乏知识的自我构建能力,一旦遇见新情况、新问题就显得束手无策。
3.针对课程特点,改进充实新型评价考试形式。
现在大学课程教学的教与学评价还主要是卷面考试,很难全面反映学生对课程知识掌握和运用的真实水平和能力,这种评价分数不能够全面考查学生的综合素质。
(1)依据课程内容特点,选择有效可行的科学考试方式。大学课程考试基本形式主要有:闭卷考试、开卷考试、面试或答辩考试、操作合作考试和网络考试等形式。不同的考试形式各有其自身的特点,一般来说,对于平行班教学课程考试,由于涉及考试效率与环境容易控制等因素,大多习惯采用闭卷考试形式,这种考试考查的知识面广,可设计的题型多。对知识的理解能力、综合应用能力、学习能力和查阅资料的能力的考核,开卷考试有独到的优势。面试或答辩考试不仅能客观评价学生对所学知识掌握的广度与深度,还可以全面考查和检测其口头表达能力、思维能力、反应能力、想象能力、环境适应能力和创造性思维能力以及心理素质、仪表风度和个性特征等。这种开放式的面试或答辩考试既能将学生置于提问范围所创设的环境中,让其随心所欲运用所学知识表达自己的见解,充分展现自己的才能,又能较好地激发学生学习兴趣,培养创新能力和综合应用所学知识解决实际问题的能力。对于操作技能和协作素质相关的能力评价,操作合作考试是较好的考试形式。此外,这种考试能够较好地增进学生间的相互配合与分工协作,促进学生的团队精神。计算机网络考试方式,不但可以有效评价学生的计算机操作能力,还可以客观考核学生的认知能力。在信息化社会应加强研究和开发这种考试评价方法,大力完善并推广这种高效绿色的考试方法。
(2)改进规范评价标准,让考试有机地融合于学习全过程。基于考试评价实践的现实,充分完善和规范课程评价考核的制度建设,增强其科学性和有效性是关键。通过评价考核的导向效应,最终实现课程教学评价考核目标多元化、考核内容多样化、考核方式灵活化以及考核评价个性化的改革。
(3)通过课程考核实现“要我学”到“我要学”的转变。作为评价教学活动质量的重要手段,考试要实现全面、客观和公正评价的目标,评价工作就必须贯穿教学全过程。在平时的教学活动中,老师可设计一些讨论题或小论文,要求学生在规定时间内完成,教师安排讨论学生论文中的各种问题,鼓励创新,营造学生独立思考的学习氛围,有意识地培养学生综合分析问题及解决问题的能力。在课程结束后,通过设计若干个综合题,以开卷的形式在规定时间内通过查阅文献完成考试,学生可以自主选择独自或小组合作完成考试。这样不仅锻炼了学生调研和查阅文献的实际能力,还增强实际写作能力,分散减轻了学生期末考试压力,让考试变成实现和体验自我价值的一种“游戏”,引导大学教育向能力培养方向迈进。
4.依据大纲创新设计考试内容。
现行的考试命题大多数是知识再现型,考试考查的是学生的记忆能力,不是对知识的构建能力和创新能力。当今社会对人才能力需求的日益提高,要求高校课程教育考试在内容上应坚持考查能力为主,同时注重培养和考查创新精神,公正客观评价综合素质。这就要求老师在考试命题和评分标准方面力求开放性和人性化。
(1)考试命题不仅要着重立足培养目标的全局,反映课程教学的目的,还要激发学生独立思考,突出能力考核,评价标准要鼓励学生发表自己的独到见解。大学教育应该充分调动学生自主学习的主观能动性。实现真正意义上的开放。这种开放性要求:教师命题要事先设置好问题背景,科学提出问题,要求学生全面进行分析,提出解决问题的方法,考查学生解决问题的能力。试题答案无标准化答案。根据试题的要求,学生根据自己的理解可充分发挥想象进行解答。答题方法的开放。允许学生采取各种有效的答题方法,鼓励创造性思维。
(2)考核评价标准人性化。命题的开放性也决定了评价标准的灵活性。人性化的评价标准将激励学生通过研究,得出有创意并符合科学的答案从而获优异成绩,而根据教材原文或课堂笔记做出答案的学生则不能得到高分奖励。这种人性化的评价标准使得学生在考试过程中乐于独立思考,勇于展现自己的个性和创新能力。
四、总结
关键词:义务教育阶段;中小学;绩效评价;体系构建
随着社会主义市场经济体制的完善和建设服务型政府的推进,很多地方政府和部门在学校管理中引入了政府绩效评价,并把它作为管理创新的突破口。以义务教育阶段各中小学校为研究对象,将各项主观性的评估指标进行改进量化,构建出一套适合中小学校日常管理评估的绩效评价体系,既有利于学校进行科学决策,合理配置教育资源,诊断分析出教学管理中存在的问题从而加以改进,也有利于国家和地区更好的制定义务教育阶段的战略发展规划,统筹考虑教育教学资源的利用与配置问题,监督引导学校讲求效益、关注效果、强化绩效意识。
一、中小学校绩效评价的指标设计原则
(一)综合性原则
义务教育阶段中小学校的绩效评价是一项系统性很强的工作,由多项评价指标共同构成,这些指标之间相互联系但又侧重点不同,因此对于指标的选取要综合考虑、平衡各方面因素,从多方面、多角度去综合考量分析。
(二)客观性原则
为了更加科学客观的反映被评估对象的实际情况,在指标设计时应尽量选取量化的客观性的数据指标,同时充分考虑到数据之间的可比性,减少主观评判性指标的选取。
(三)可操作性原则
对中小学校绩效评价指标的选取应可操作、易获得,这就要求设计指标时要明确清晰的表述指标的含义和构成,定量化指标容易被评估人员统计,对评估人员技术要求不高。
二、中小学校绩效评价体系的构建
根据《黑龙江省县级政府教育工作督导评估指标体系》要求,对于县域义务教育均衡发展的评估主要包括履行政府职责和教育水平两大部分。政府职责主要考察教育地位、教育规划、教育管理、教育资源、教育投入、教育经费管理、教师队伍建设七个方面,其中:对于教育地位、教育规划、教育资源三个方面的考察权重总和不到2%,且均为主观评价,因此在构建绩效评价体系时将这三方面排除;对于教育管理、教育投入、教育经费管理、教师队伍四个方面,将其按照评估侧重点归纳为两方面进行量化指标评估,即教育经费投入、教师队伍建设;同时,考虑到中小学校对教育教学器材设施的需求,增加教学设施方面的绩效评估指标。教育水平主要考察学前教育、义务教育、普通高中、职业教育、特殊教育、民族教育、其他教育七个方面,由于本文的研究重点为义务教育阶段中小学校绩效评价体系建设,因此将学前教育、义务教育、普通高中、职业教育、特殊教育、其他教育六方面教育成果整理归纳为一项,即教育成果,重点突出对中小学校教育教学成果的绩效考核;考虑到各县域间少数民族分布及特点存在差异,因此将民族教育作为绩效评价指标体系的附加项进行考评;同时,考虑到近年来学生及家长等社会因素对教育情况的影响,增加社会满意度方面的绩效评估指标;并将学生体质健康、社会实践活动、安全工作纳入指标评价体系,以期更加全面客观综合对教育水平进行绩效评价。为了消除不同县域间经济发展水平、人口、地域面积等因素的差异,使得县域间中小学校绩效管理具有可比性,将绝对化的数值改进为可供比较的相对化比例数值。如:在考虑教育经费投入时,由于不同县域之间财力不同,单纯比较财政拨付的教育经费绝对指标也就毫无意义,因此本文将教育财政拨款这项绝对数指标进行改进完善,研究财政教育支出占财政总支出的相对比例、财政拨付教育经费占财政计划拨付教育经费的比例即教育经费拨付率,将绝对性指标改为相对性的指标进行比较,使县域间中小学校的绩效评价指标更具有可比性。
三、结语
综上所述,对义务教育阶段中小学校进行绩效评价,要同时兼顾政府履行职责和取得的教育成效两个部分,并考虑数据之间的可比关系,尽可能将各项主观性的评估指标进行改进量化,从而构建出一套适合义务教育阶段中小学校日常管理评估的绩效评价体系。
参考文献:
[1]陈明选.中小学校园网投入教育绩效评价指标体系的构建[J].电化教育研究,2007(7):72-75.
10 年间中国大陆地区教育技术学领域研究人员的科研绩效进行了评价,评选得到了“1998 至 2007 年段中国大陆地区教育技术 学领域最具科研绩效的前 30 位研究人员”,并对 h 指数与其他评价指标进行了相关性分析。分析结果表明,利用 h 指数来评价 研究人员的科研绩效,一定程度上可以反映“总被引频次”、“论文数量”、“篇均被引频次”三项指标的评价结果,h 指数可以 说是一项更为综合的评价指标。
【关键字】h 指数;教育技术学;研究人员;科研绩效评价
【中图分类号】G40-051 【文献标识码】A 【论文编号】1009―8097(2009)01―0021―07
一 问题的提出
h 指数是美国加州大学圣迭哥分校的物理学家 J.E.Hirsch 教授在 2005 年提出的一项旨在评价科学家个人绩效的指标。h 指数的定义是:一个科学家的分值为 h,当且仅当在他(她) 发表的 Np 篇论文中有 h 篇论文每篇获得了不少于 h 次的引文 数,科学家剩下的(Np-h)篇论文中每篇论文的引文数都小于h 次。[1]根据 h 指数的定义,假如一个研究人员的 h 指数为 9,则意味着他发表了至少 9 篇论文,并且仅有 9 篇论文的被引次 数不少于 9 次。在计算某位研究人员的 h 指数时,可以将这位 研究人员的论文按照其引文数降序排列,然后从排序最高的论 文开始向下逐条计数,一直到某篇论文的排序号大于该篇论文 的引文数,则该篇论文的序号数减 1 就是该位研究人员的 h 指 数数值。Hirsch 讨论了 h 指数在评价研究人员个人绩效中的应 用,并且提出了他们晋升应达到的门槛。例如,他认为研究型 大学教师晋升为正教授的指数的典型值应约为 18。[2]
在 h 指数的基础上,中国科技大学的吴强提出一种新的科学家个人绩效的评价指标――w 指数。[3]w 指数与 h 指数类似, 但做了些巧妙的修改。举例来说,假如一个研究人员的 w 指数 为 9,意味着研究者发表了至少 9 篇论文,并且仅有 9 篇论文 的被引次数不少于 90 次。吴强指出,w 指数是对 h 指数的重要 改进,因为它“更准确的反映了一个科学家的高质量论文的影 响”,并且他也承认这一指数“可以被称为 10h 指数”。根据 吴强的研究,研究人员的 w 指数为 1-2 意味着他“已经具备了 某一领域的基础”。w 指数为 3-4 意味着这位研究人员已经掌 握了“科学活动的艺术”,而“杰出的研究者”属于那些 w 指数为 10 以上的人。吴强把“顶尖科学家”留给了通过 20 年工作 w 指数达到 15 或者通过 30 年工作达到 20 的科学家。
在 h 指数提出之前我们通常是采用信息计量学的方法来 评价研究人员,从信息计量的角度定量地对研究人员进行评 价,其结果比较客观、比较准确。在信息计量学中,研究人 员的学术成就和对学科贡献主要体现在发表的文献数量和文 献被引次数两个方面,其中文献数量说明作者生产的文献产 量或科研能力,而文献被引频次则更能说明作者生产的文献 的质量,交流程度和学术水平。因此,一般从论文数量和被 引频次两个方面考察作者的影响力。路秋丽、田雨等人(2008) 曾从论文数量、总被引频次、篇均被引频次三个方面考察中 国教育技术学领域研究人员的科研绩效,并评选出了 16 位教 育技术学领域的关键学者。[4]然而,正如 J.E.Hirsch 教授 所指出的,应用“论文数量”、“总被引频次”、“篇均被 引频次”等单项评价指标存在一定的缺陷。他认为“论文数 量”的缺点是不能测度论文的重要性和影响力;“总被引频 次”的缺点是作者的影响力会被少数重要的合作论文夸大; “篇均被引频次”缺点是数据不容易获得,容易造成奖少惩 多。[1]J.E.Hirsch 教授认为 h 指数能够测度科学家个人工作 的主要影响力,并能够避免上述指标的一系列缺点。 J.E.Hirsch教授进一步指出,即使两个科学家的论文数或 引文数量有很大差别,但假如他们具有相似 h 指数,那么仍 然可以认为他们的整体科学影响力是可比的。反之,科学生 涯相同的两个科学家,即使具有相近的论文或引文数量,假 如他们的 h 指数有很大差别,同样可以认为具有较高指数的科学家是一位更加“优秀”的科学家。因此,本研究将采用 h 指数作为主要指标来对中国大陆地区教育技术学领域的研究 人员进行科研绩效评价(这里“中国大陆地区”用于限定研 究人员的学术活动范围,而不是限定研究人员的所在研究机 构),并辅之以 w 指数的计算,同时与“论文数量”、“总被 引频次”、“篇均被引频次”等三项指标的评价结果进行比 较,以发现不同评价指标之间的差异。
二 研究方法
本文的研究对象是中国大陆地区教育技术学领域的研究 人员,我们可以从中国大陆地区教育技术学领域重要的学术期 刊中获得该领域研究人员的信息以及论文被引用的 信息,并以此为基础开展对研究人员科研绩效的评价。笔者参 考《CSSCI 来源期刊(2006-2007)》[6],选取该引文索引来源期 刊中属于教育技术学领域的学术期刊包括《电化教育研究》、《中国电化教育》、《中国远程教育(上)》、《开放教育研究》、《现代教育技术》、《现代远距离教育》等六个期刊(后文简称 为“六大学术期刊”),并获得这六大学术期 1998 年至 2007 年 所刊发的论文及其引文信息以作为分析数据(尽管在《CSSCI 来源期刊(2008-2009)》[5]中,《现代远距离教育》已经不在其中, 但这并不影响对该期刊 2007 年以前的论文的分析)。本研究所 选择的期刊范围较路秋丽、田雨等人(2008)选取的期刊范围 更广,可以对中国大陆地区教育技术学领域的研究人员科研绩 效做出一个更为客观的评价。研究的具体过程包括利用中国知 网(CNKI)的中国期刊全文数据库[7]完成“六大学术期刊”论 文基本信息下载与整理、利用中国知网(CNKI)的中国引文数 据库 0完成“六大学术期刊”被引用信息下载与整理、研究人 员所的数量、总被引频次与平均被引频次计算、研究 人员的 h 指数和 w 指数计算、各项评价指标的综合比较等环节。
这里笔者没有采用 CSSCI 数据库,因为从 CSSCI 数据 库中下载相关数据效率较低。当然,CSSCI 的引文数据库更 具权威性,其引文来源仅限于 CSSCI 为数不多的来源期刊。 而中国知网(CNKI)的中国引文数据库的引文来源则更为广 泛,其来源包括中国知网(CNKI)的中国优秀硕士学位论文全文数据库、中国知网(CNKI)的中国博士学位论文全文数 据库、中国知网(CNKI)的中国期刊全文数据库、中国知网(CNKI)的中国重要会议论文全文数据库等,相比于 CSSCI 引文数据库,更能反映论文的影响范围。两个引文数据库各 具特色,在本研究中笔者选用中国知网(CNKI)的中国引文 数据。感兴趣的读者可以采用 CSSCI 的引文数据库来分析。
1期刊论文基本信息下载与整理
中国期刊全文数据库提供专业检索界面,可编写检索语句,于是笔者编写了如下检索语句,如图 1 所示。
经检索(检索时间为 2008 年 9 月 2 日),返回 14102 条 记录,其片段如图 2 所示。
在中国知网(CNKI)的中国期刊全文数据库的初级检索系统中不能进行每个作者所发论文数量的分类汇总计算,我们需要将这些结果逐页复制到 Microsoft Excel 软件的表格中, 并清除所有格式,可得到如图 3 所示的 Excel 表格。
在这个表格的基础上我们便可以进行分类汇总计算了。由于具有 10000 行以上记录的 Excel 表格操作起来非常缓慢, 于是笔者将 Excel 表格中的数据导入到 SQL SERVER 2000 数 据库中,得到“论文数据表”,其片段如表 1 所示。
通过 T-SQL 语言对论文数据表进行查询分析,可对“六大学术期刊”的所有作者及发表文章情况进行统计。经对“论 文数据表”以“第一作者”作为分类字段(这里忽略同名作者 的干扰),以论文计数作为汇总方式进行分类汇总,得到“作 者-论文分类汇总表”,共有 6462 名作者(这里指第一作者, 下同)以及每位作者的数量,其片段如表 2 所示。
然而,仅仅依据“论文数量”进行排名,大量来自“六 大学术期刊”的编辑将进入前列(如表 2,论文数量位居前 5 位的就有 4 位期刊编辑),这就会大大影响研究人员在“论文 数量”上的排名。这里,笔者将借助下文提到的“引文数据 表”(因为通讯稿或评论等文章的被引频次往往很低),先查 询“引文数据表”得到“总被引频次”居于前 100 位的作者 列表,再查询“论文数据表”得到“论文数量”排名居于前100 位的作者列表,然后取这两个列表的交集,发现“论文数 量”排名居于前 100 位的作者列表中有 34 位作者不在交集 中。通过查询这 34 位作者的单位信息,发现有 16 位是期刊编辑。这 16 位编辑的文章需要从“论文数据表”中剔除出去。 另外,笔者发现,编辑所撰写的文章在论文记录的“单位”信 息上均有“本刊记者”的字样,于是笔者先查询论文记录的 “单位”字段包含“本刊记者”的记录,并对这些记录中的作 者字段进行分类汇总,发现共有 40 位作者。将前后两次得到 的编辑名单加以合并,并将这些编辑发表的论文从“论文数据 表”中剔除。然后对“论文数据表”以“第一作者”作为分类 字段,以论文计数作为汇总方式再次进行分类汇总,并以“论 文数量”逆序排列,得到新的“作者-论文分类汇总表”,其 中数量居前 50 位的研究人员列表如表 3 所示。
2期刊被引用信息下载与整理
笔者通过中国知网(CNKI)的中国引文数据库的专业检 索界面,编写如图 4 所示检索语句。经检索(检索时间是 2008 年 9 月 2 日下午 3 时),共得到 7927 条记录,结果如图 5 所示。
同样,在中国知网(CNKI)的中国引文数据库中无法进 行每位研究者的被引频次求和计算,也需要将这些结果逐页 复制到 Excel 表格中,在去除标记并对一些列如“被引文献作 者”、“被引文献来源”进行分列操作后,如图 6 所示。
为方便计算,笔者将这个 Excel 表格导入到 SQL SERVER 2000 的数据库中,得到“引文数据表”,其片段如表 4 所示。
然后通过 T-SQL 语言对引文数据表进行查询分析。通过SQL SERVER 的查询分析器,可以对每位作者的“总被引频 次”、“平均被引频次”、“被引文献数”等三项指标进行 计算。经对“引文数据表”以“第一作者”作为分类字段, 以“被引频次”求和作为汇总方式进行分类汇总,接着再以 论文计数作为汇总方式进行分类汇总,并计算每位作者的“篇均被引频次”,最后以“总被引频次”逆序排列,得到“作者-引文分类汇总表”(这里忽略同名作者的干扰),该 表共有 4211 名作者(这里的作者指的是第一作者,下同)以 及每位作者的“被引文献数”、“总被引频次”和“篇均被 引频次”。其中,“总被引频次”居前 50 位的研究人员列表 如表 5 所示。
3研究人员的 h 指数和 w 指数计算
按照 h 指数和 w 指数的定义,笔者利用 SQL SERVER的查询分析器编写相关算法对“引文数据表”中所有作者进行两个指数的计算,并将计算结果按 h 指数逆序排列,得到“作者-h 指数-w 指数数据表”,其中 h 指数不小于 7 的作者 共有 36 位,如表 6 所示。
笔者认为,导致教育技术学领域研究人员 h 指数偏低的原因有两个:一是本研究选取的文献数据持续时间不长,只有 10 年,相对于一个研究人员的科研生涯还是比较短暂的;二是国 内论文的参考文献数量普遍偏低,根据张伟远(1999)的一项 比较研究[9],中国大陆地区有参考文献的文章中,60%的文章只有 1 到 4 份参考文献,在英美两国的期刊中,60%的论文有9 份以上的参考文献,45%的论文有 20 份以上的参考文献。
前文已经提到,w 指数为 3-4 意味着这个研究者已经掌握了“科学活动的艺术”。表 6 是依据 h 指数排名得来,可能会 将一些发文量较少、然而“篇均被引用频次”却很高的作者排除在外。下面笔者再以 w 指数为条件,选取 w 指数不小于 3 的作者名单,仍然按 h 指数逆序排列,得到如表 7 所示结果。
表 7 中灰色区域部分的作者是表 1 中未曾出现的作者, 这些作者虽然较少,但论文的被引频次却很高,如 李克东教授 1998 至 2007 年间在“六大学术期刊”以第一作者名义 8 篇,有 5 篇论文的被引频次在 50 次以上。
4各项评价指标的综合比较
为了比较研究人员科研绩效评价不同评价指标之间的差异,下面笔者把按照三项不同的评价指标即“论文数量”、 “总被引频次”、h指数分别得到的“作者-论文分类汇总 表”(取前 50 条记录,记为数据表 T1,其内容即文中的表 3)、 “作者-引文分类汇总表”(取前 50 条记录,记为数据表 T2, 其内容即文中的表 5)、“作者-h 指数-w 指数数据表”(取 h 指数不小于 7 的记录,记为数据表 T3,其内容即文中的表 6) 进行整合,把这三个表中所包含的所有作者的三项指标计算 出来,并对作者是否在 T1、T2、T3 等三个数据表出现加以标 识(1 表示出现,0 表示未出现),并按 h 指数为主关键字, “总被引频次”为次关键字,“论文数量”为第三关键字, 三个关键字均为逆序排列,得到“作者-三项指标综合数据 表”。笔者将在 T1、T2、T3 等三个数据表均出现的作者选择 出来,形成如表 8 所示的研究人员列表,共 30 位作者。笔者 将这 30 位作者界定为“1998 至 2007 年段中国大陆地区教育 技术学领域最具科研绩效的前 30 位研究人员”。
关于表 8,这里需要做一些说明:
(1) 列“T1”用于表示该作者是否在数据表 T1 出现,
1 表示出现,0 表示未出现;列“T2”用于表示该作者是否在 数据表 T2 出现,1 表示出现,0 表示未出现;列“T3”用于表 示该作者是否在数据表 T3 出现,1 表示出现,0 表示未出现。
(2)每位作者在“作者-论文分类汇总数据表”中的排 名在列“论文数量排名”中给出,在“作者-引文分类汇总数 据表”中的排名在列“被引总频次排名”中给出。读者可以 比较表 8 中的三个不同排名以了解不同评价指标的差异。
(3) “作者单位”根据每位作者最新发表的论文的署 名单位得来。
(4) 表 8 中,有两位作者是例外,即张倩苇和胡小勇, 这两位作者由于论文数量的关系未能在 T1 中出现,但是由于 这两位作者的 h 指数较高,因此笔者仍然将这两位作者纳入 到“1998 至 2007 年段中国大陆地区教育技术学领域最具科研 绩效的前 30 位研究人员”行列。
以表 8 为基础,笔者对不同评价指标进行相关性分析, 以进一步了解不同评价指标之间的关系。笔者采用 SPSS 15.0 For Windows 的 Pearson Correlation 相关性计算方法对四项评 价指标即 h 指数、“总被引频次”、“论文数量”、“篇均 被引频次”两两之间的相关性进行计算,其结果如表 9 所示。
从表 9 中我们可以看出,h 指数与其他三项指标均呈显 著的正相关,且与“总被引频次”的相关性系数非常高,达 到了 0.906;论文数量与篇均被引频次的相关性系数为 0.038, 相关性不显著。以上相关性分析表明,利用 h 指数来评价研究人员的科研绩效,一定程度上可以反映“总被引频次”、“论文数量”、“篇均被引频次”三项指标的评价结果,h 指 数可以说是一项更为综合的评价指标。当然,在使用 h 指数作 为评价指标时,仍然需要结合其他评价指标来对具有相同 h 指 数的作者进行内部排名。
为进一步了解大陆地区教育技术学领域科研机构的科研绩 效情况,笔者对表 8 以“作者单位”作为分类字段,以“第一 作者”计数作为汇总方式进行分类汇总,得到如表 10 所示结果:
如表 10 所示,上述 30 位作者中,有 7 位来自北京师范大学,4 位来自华南师范大学,占总人数的 36.7%,说明这两 所学校在教育技术学领域有着较强的学术实力。
三 研究结论
本研究采用 h 指数作为主要评价指标,并辅之以 w 指数,对中国大陆地区教育技术学领域 1998 年至 2007 年 10 年间研 究人员的科研绩效进行了评价,评价得出了“1998 至 2007 年 段中国大陆地区教育技术学领域最具科研绩效的前 30 位研究 人员”,这是对路秋丽、田雨等人(2008)评价得出的“中 国教育技术学领域的关键学者”的一次较大调整,有助于对 当前阶段中国教育技术学领域的研究人员状况有一个更为客 观的认识;并与其他评价指标进行了相关性分析,分析结果 表明利用 h 指数来评价研究人员的科研绩效,一定程度上可 以反映“总被引频次”、“论文数量”、“篇均被引频次” 三项指标的评价结果,可以说是一项更为综合的评价指标, 一定程度上改进了路秋丽、田雨等人(2008)采用的科研绩 效评价方法。当然,本研究所作出的科研绩效评价结果并不 能完全真实的反映当前中国大陆地区教育技术学领域研究人 员科研绩效,究竟此次得出的“1998 至 2007 年段中国大陆地 区教育技术学领域最具科研绩效的前 30 位研究人员”是否客 观还需交由教育技术学领域的广大研究人员一起来评议。
本研究所采用的论文和引文数据的持续时间只有 10 年, 这对于一个研究人员的科研生崖和研究人员 h 指数的计算都 显得过于短暂,这可以说是本研究的主要缺陷。由于国内的 期刊数据库起步较晚,许多期刊虽然创刊较早,但是期刊数 据库中的数据却只存储了近十几年的数据,而不是全部的数 据。以《中国电化教育》和《电化教育研究》为例,两个杂 志创刊于 20 世纪 80 年代初,中国知网(CNKI)期刊数据库 中所收录的这两个期刊的论文却是从 1994 年开始的。因此, 要利用 h 指数对中国教育技术学领域的某一代研究人员作出 更为全面的评价,还需等待 15 到 20 年时间。
参考文献
[1] J.E. Hirsch.衡量科学家个人成就的一个量化指标[J].科学观 察,2006,(1):2-7.
[2] Henk F. Moed,刘俊婉,金碧辉. h 指数构建有创意 用于评价 要慎重[J].科学观察,2006,(1):15.
[3] Qiang Wu. The w-index: A significant improvement of the h-index[DB/OL].省略/ftp/arxiv/papers/0805/0805.4650.pdf, 2008-9-3.>
[4]路秋丽,田雨,魏顺平.教育技术领域关键学者研究[J].电化教 育研究,2008,(8):26-31.
[5] 南京大学中国社会科学研究评价中心.CSSCI 来源期刊(2008-2009)学科分类[DB/OL]. [6] 南京大学中国社会科学研究评价中心.CSSCI 来源期刊(2006-2007)学科分类[DB/OL].
[7] 中 国知网 (CNKI). 中 国期刊 全文 数据库 [DB/OL].省略/login/autonavi.aspx?id=1, 2008-9-3.>