人民网>>教育>>热评酷评

不同类型大学能够相互比较吗?
武书连
  2004年03月19日16:12 【字号 】【留言】【论坛】【打印】【关闭
  长期以来,不同类型大学能否相互比较一直是高教评估界争论不休的话题,因为医药类大学与财经类大学、工科类大学与综合类大学、艺术类大学与农林类大学之间的学科差距是如此之大,以致很难想象它们能够直接相互比较。主张不同类型大学不能相互比较的研究者认为,相同类型即同质才能相互比较,不同类、不同质的事物不能相互比较,各类大学的各个不同学科是不同质的,所以不同类型大学是不能相互比较的。主张不同类型大学可以相互比较的研究者认为,无论从科学的意义或者哲学的意义来讲,不同类、不同质的事物都可以通过某种方式转化为同质的事物,而同质的事物是可以相互比较的,因此不同类型大学是可以相互比较的。

  本书作者自1992年开始探索解决不同类型大学相互比较的技术方法,于1993年10月6日发表了对自然科学和社会科学 "按人均得分相等确定转换系数"的观点,试图实现不同类型大学的直接比较(武书连等 《欢迎讨论"评价"-复捷光同志》广东科技报 1993年10月6日)。1995年11月,由国家教委组织、国家教委直属的学位与研究生教育评估所实施完成的《中国普通高等学校研究生院评估》是国内学术界为解决此难点所作的又一次重要努力(王战军等 《我国普通高校研究生院评估指标体系研究》中国高等教育评估 1996年第3期)。1997年7月17日、2001年11月17日,本书作者在《中国大学研究与发展成果评价(节录)》和《2001中国大学研究生院评价》中以"不同类型大学的科研人员平均具有相同创新能力"、"不同学科的科研人员平均具有相同创新能力"的科学假设为基础,建立了分类难度系数的概念,有效地解决了不同类型大学的相互比较问题。

  解决不同类型大学相互比较的关键是实现不同类型大学科研成果的直接可比。现以1992-1999年中国所有的综合类、工科类、农林类、医药类大学自然科学研究与发展全时人员连续8年的自然科学科研成果,和1992-1999年中国所有的综合类、工科类、农林类、医药类、师范类、财经类、民族类、政法类大学社会科学研究与发展全时人员连续8年的社会科学科研成果,对"不同类型大学的科研人员平均具有相同创新能力"和"不同学科的科研人员平均具有相同创新能力"的科学假设做一个简单的检验,以此说明不同类型大学之间、不同学科之间是可以相互比较的。之所以选用1992-1999时间段的数据,是因为1992年以前教育部公开发布的数据不完整,而2000年中国高校合并重组后,中国各主要大学的学科结构已经改变,许多单科大学已经成为综合大学或多科大学。如果在2000年以前各种单科型大学相互之间都具有可比性,那么2000年合并重组后的中国大学就更具可比性了。

  表一是1992-1999年我国综合、工科、农林、医药类大学自然科学研究与发展全时人员(不含支持人员)人均科研成果得分一览表。综合、工科、农林、医药4类大学分别代表了自然科学的理学、工学、农学、医学4大学科。表一的投入总人次和各项科研成果得分是1992-1999连续8年之和,各项指标的数量源于教育部科技司按年度出版的1993-2000《高等学校科技统计资料汇编》(以下简称《汇编》),指标权重源于1997年广东管理科学研究院组织收集的1927名专家连续三轮共4448份书面意见的中位数,其中国内论文均按1分计算。1927名专家的资格为:中国科学院院士、中国工程院院士、国务院学位委员会学科评议组成员、国务院或国务院学位委员会审批的博士研究生指导导师。专家意见征询过程见《中国大学研究与发展成果评价(节录)》(武书连 吕嘉 郭石林 《科学学与科学技术管理》杂志1997年第7期)。

 

  从表一可见,4类大学的人均得分十分接近,实际差别不超过±5%。不少学者后来认为国家级奖权重偏低(只相当于两部专著),本书作者也有同一看法。当本书作者尝试提高国家级奖和省部级奖得分即提高优质科研成果的得分而获得新的人均得分时,在总得分不变的前提下,4类大学人均得分的实际差别缩小到不超过±1%。见表一的参考人均得分。

  表一直观地证明了在自然科学领域,理学、工学、农学、医学4大学科的科研人员确实具有基本相同的创新能力。表一说明,在自然科学领域,不同类型大学之间、不同学科之间能够直接比较。

  表二是1992-1999年我国综合类、工科类、农林类、医药类、师范类、财经类、民族类、政法类大学社会科学研究与发展全时人员人均科研成果得分一览表。由于"不同类型大学的科研人员平均具有相同创新能力"的前提是有足够多的科研人员,所以表二将科研人员较少的民族类和政法类大学合并计算。表二的投入总人次和各项科研成果得分是1992-1999连续8年之和,各项指标的数量源于教育部社科司按年度出版的1992-1999《全国高等学校社科统计资料汇编》(以下也简称《汇编》),指标权重来源与自然科学相同。

 

  从表二可见,各类大学的人均得分也十分接近,实际差别为±5.2%。当只计算科研人员中的中高级职称时,人均得分进一步接近。见表二的参考人均得分。

  表二直观地证明了在社会科学领域,不同类型大学的科研人员也具有基本相同的创新能力。表二说明,在社会科学领域,不同类型大学之间、不同学科之间也能够直接比较。

  因此,本书作者提出的"不同类型大学的科研人员平均具有相同创新能力"和"不同学科的科研人员平均具有相同创新能力"是中国数百所大学十多万研究与发展全时人员连续8年的科研实践所揭示的客观存在。只要准确地收集到完整的数据,在自然科学领域或者社会科学领域,不同类型大学之间的不同质的科研成果是能够直接比较的。

  不过,观察表一和表二可以发现,尽管各类大学自然科学人均得分基本相同且各类大学社会科学人均得分也基本相同,但是各类大学社会科学人均科研成果得分却远高于同类大学自然科学人均科研成果得分,致使自然科学得分与社会科学得分不能直接比较。为了更方便地观察中国大学自然科学与社会科学人均科研成果的差别,现将上述表一、表二中的合计数字制成表三。

 

  表三的自然科学和社会科学的年投入人力、年平均得分、论文得分、专著得分、专利授权得分、提交成果得分、成果鉴定得分、成果授奖得分均是所统计的大学连续8年的简单算术平均数,也就是表一、表二的同类成果得分除以8。

  从表三可以看到,中国大学社会科学6.2528分的人均得分已经远远超过了自然科学2.8850分的人均得分。在这种情况下,寻找自然科学和社会科学人均得分悬殊的原因并采取相应的措施予以解决成为高教评估人员无法回避的问题。

  没有证据证明在1992-1999连续8年期间,中国大学的社会科学家享有比自然科学家更优越的科研和生活条件(不排除相反)。因此,接受同等教育的自然科学家和社会科学家在相同的社会环境下产生如表三所示的2.17倍(6.2528÷2.8850=2.17)的人均科研成果差距,只能解释为由于学科差异而导致社会科学与自然科学取得相同数量的科研成果难度不同,即社会科学家和自然科学家获得相同数量的科研成果所付出的劳动时间不同,而不能解释为社会科学家的人均创新能力是自然科学家的2.17倍。如果不存偏见,就应该承认自然科学的一项成果比社会科学同样指标的一项成果凝结着更多的劳动。中国一千多所大学十多万研究与发展全时人员连续8年的科研实践已经无可争辩地证明了这一点。若不加区别地对自然科学和社会科学的同类科研成果都取相同得分并按绝对值相加排名,显然有失公平。
为了解决这个问题,为了使以自然科学为主的大学(例如工科类)与以社会科学为主的大学(例如财经类)以及与自然科学社会科学均衡发展的大学(例如综合类)能够直接比较,本书作者建立了难度系数的概念。难度系数的第一个作用就是调节不同类型大学自然科学与社会科学学科比例的不同,使同等数量的自然科学家与同等数量的社会科学家在相同时间内获得相同得分。有关难度系数的准确定义见《中国大学研究与发展成果评价(节录)》中的评价公式。

  表一、表二、表三的数据都源于《汇编》。如果《汇编》的数据准确,以《汇编》为基础,就能够初步完成中国大学科研评价。最初的大学评价的研究者,例如1989年中国管理科学研究院、1992年湖南大学、1993年广东管理科学研究院的研究人员都尝试过用《汇编》编制中国大学排名并予发表。

  然而《汇编》有一个严重的缺陷,就是虽然总体上《汇编》的数据是比较准确的,可是具体到每一所大学,由于领导的重视、统计人员的素质都不相同,致使《汇编》标准不统一,数据不准确、不稳定,甚至不合理。例如,清华大学1996年发表科技专著21部,1997年猛增到193部,增长819%;北京医科大学1996年自然科学研究与发展全时人员637人,1997年陡降为207人,减少67.5%;北京大学1994年发表社科论文1591篇,1995年也是1591篇,1996年还是1591篇,三年不变。各大学统计标准不统一、统计数据不准确且无法核实,使《汇编》难以继续成为中国大学评价的主要数据源。此外,《汇编》还有另一个缺陷,就是没有引文数,无法对不同学科的影响因子作归一处理,即无法用同一标准评价不同学科的论文质量。

  目前代替《汇编》成为中国大学评价主要数据源的,是各类可检索数据库;其中美国的SCI、EI、SSCI、A&HCI,中国的CSCD、CSTPC、CSSCI、CNTAP等最著名。可检索数据库标准统一、数据准确且能核实,以及引文翔实的性质,受到大学评价人员的欢迎。但是可检索数据库来源期刊(不含CNTAP,以下同)的选择取决于该类数据库的价值取向和判断能力,不同的价值取向和判断能力决定了各可检索数据库中各学科期刊的不同比例。如果各可检索数据库都能严格遵循同类相比的原则和入选源期刊比例与所在学科人数比例一致的原则,那么不同学科的科研人员人均得分肯定相同。但若因价值取向不同和主观判断的差异,使各学科入选源期刊的比例与人数比例相差较大,那么人数比例高于期刊比例的学科人均得分就会低于其他学科,反之则高于其他学科。

  例如,我国农林院校的科研人员约占高校科研人员总数的8.07%;在CSCD中,收录的农林类论文占收录论文总数的9.53%,该百分比略高于农林类科研人员占科研人员总数的百分比;如果按CSCD评价大学,农林学科的人均得分将略高;但在SCI收录的我国论文中,农林类论文只占论文总数的1.61%;如果按SCI评价大学,农林学科的人均得分将低于其他学科。CSCD和SCI都是《评价》的数据源,但被CSCD收录的论文每篇1.5分,被SCI收录的论文每篇3.8分。收录农林类论文多的CSCD的低分不能平衡收录该类论文少的SCI论文的高分,农林类大学人均得分就会低于其他类大学。也正是因为我国农学家向SCI源期刊投稿较为谨慎,使得农林类论文的平均质量高于其他学科。科学计量学家武夷山和梁立明两位教授写道:"在许多人心目中,包括本书作者过去的想法在内,我国的农业研究水平在世界上的地位远逊于物理学。但美国科学情报所刘煜所作的适当的比较分析则表明,中国的农业科学、生态及环境科学和植物及动物科学的论文在最近5年的平均被引量(影响因子)已经接近或处于这些学科的世界平均水平。"(武夷山 梁立明  《采用文献计量学指标进行科研绩效量化评价应注意的几个问题》中国科技期刊研究 2001.2)显然,如果对被SCI收录的已经接近或达到世界平均水平的农林类论文与距世界平均水平较远的其它类论文同等对待,对农林类大学不公正,但对每一篇论文都重新打分又不可能。

  为了解决上述问题,本书作者又一次使用了难度系数。难度系数的第二个作用就是调节因可检索数据库不同的价值取向和主观判断差异所造成的各学科源期刊比例的不平衡(包括国家最高科技奖、国家级奖、省部级奖等的评选),使不同学科的科研成果能够公正地相互比较。

  如上所见,"不同类型大学的科研人员平均具有相同创新能力"、"不同学科的科研人员平均具有相同创新能力"的科学假设和使其实现的难度系数概念,较好地解决了中国大学自然科学与社会科学科研成果的相互比较问题,也解决了自然科学不同学科科研成果相互比较和社会科学不同学科科研成果相互比较的问题,最终实现了中国不同类型大学的统一排名。

  同样的方法也适用于不同类型大学之间、不同学科之间科研经费总额的比较。1991~1996年,全国1075所大学的165,405名研究与发展全时人员共获得科研经费223.9495亿元(科研经费均按当年价格计算,以下同),其中136,919名自然科学全时人员获得科研经费216.6965亿元,人均l5.8266万元,年人均2.6378万元。28,486名社会科学全时人员获得科研经费7.2530亿元,人均2.5462万元,年人均0.4244万元。对比以上数据,可知平均每一名自然科学全时人员获得的科研经费是社会科学全时人员的6.2158倍。

  自然科学家和社会科学家在相同的社会环境、接受基本相同的教育的情况下产生如此巨大的人均科研经费差距,只能解释为由于学科差异而产生的不同学科完成同等工作量所需的科研经费不同,即平均一个社会科学家维持一年的科学研究与一个自然科学家维持一年的科学研究所需的经费不同,而不能解释为自然科学家获取科研经费的能力是社会科学家的6.21倍。实际上,通过一次简单的招标,课题委托人(政府部门或企事业单位)就会清楚地知道委托给大学的自然科学或社会科学科研课题应付多少钱。这就使社会科学家获取0.4244万元与自然科学家获取2.6378万元具有同等难度。1991~1996年连续6年的中国大学自然科学和社会科学科研经费总额的差距己经证明了这一点。

  因此,实现不同类型大学、不同学科之间科研经费的比较,也不能直接取经费的绝对值,应该按"不同类型大学的科研人员平均具有相同的获取科研经费能力"、"不同学科的科研人员平均具有相同的获取科研经费能力"的科学假设将实际科研经费转化为标准科研经费,之后才能相互比较。标准科研经费的计算公式见《中国大学评价-1996 研究与发展》(武书连 吕嘉 郭石林 《科学学与科学技术管理》杂志1998年第4期)。

  科学研究如此,人才培养或其他评价指标也有相通之处。艺术学校、外国语学校的师生比就不能很高。艺术学校上钢琴课,每个学生一架钢琴,一个老师就不能指导40个学生的40架钢琴,但是其他一些文科专业就可以一个班40个学生。这些都需要统计分析后作归一处理。

  本文作者研究的目的是探讨如何实现不同类型大学、不同学科之间的相互比较,研究结果也证明了不同类型大学之间可以相互比较。即使在这一研究过程中最终发现不同类型大学、不同学科之间确实存在着如表一、表二的±5%或±1%左右的差距,例如最后证明工学的创新能力恒等于各学科创新能力平均值的0.9779(只是假设),医学的创新能力恒等于各学科创新能力平均值的1.0239(也只是假设),或者各学科的创新能力可以以某种函数表示,也同样达到了实现不同类型大学、不同学科之间直接相互比较的目的。

(摘自武书连主编、中国统计出版社出版的《挑大学 选专业-2004高考志愿填报指南》、《挑大学 选专业-考研择校指南》

来源:人民网 (责任编辑:宋丽云)
相关专题
· 中国大学排行榜
精彩推荐:
25年冒死拍摄火山
25年冒死拍摄火山
猪贩拉猪险象环生
猪贩拉猪险象环生
四川凉山发生泥石流
四川凉山发生泥石流
吊车斗车砸进教室
吊车斗车砸进教室



热点新闻榜
...更多
  
人民网搜索  互联网搜索


   

镜像:日本  教育网  科技网
E-mail:info@peopledaily.com.cn 新闻线索:rm@peopledaily.com.cn

人民日报社概况 | 关于人民网 | 招聘英才 | 帮助中心 | 广告服务 | 合作加盟 | 网站声明 | 网站律师 | 联系我们 | ENGLISH 
京ICP证000006号|
网上传播视听节目许可证(0104065)| 京朝工商广字第0394号
人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright © 1997-2007 by www.people.com.cn. all rights reserved