注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

《科学新闻》杂志官方博客

服务职业科学家

 
 
 

日志

 
 
关于我

《科学新闻》最早创刊于1999年1月,2008年底杂志进行了全面的改版,由为Science/Nature撰写科学新闻报道的精英团队打造,力图用社会化的视角报道科学,用人文化的情怀服务职业科学家群体,用专业化的手法剖析重大科学事件以及科学界在重大公共事件中的角色和价值,是国内第一本针对科学界核心人群的专业新闻杂志。

网易考拉推荐

科研“指数”江湖  

2009-06-23 18:47:50|  分类: 焦点 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

■记者 徐治国

穿衣指数、幸福指数、出行指数、污染指数、防晒指数、洗车指数……日常生活中,人们经常会遇到各种形形色色的指数,数不胜数。
而科研江湖中也存在各种“指数”。它们令考评人棘手、令当事人着迷。
指数面面观
SCI,即科学引文索引(Science Citation Index),诞生至今已整整48年之久。1961年美国科学家Eugene Garfield创建SCI的时候,没有想到这一旨在显示科技论文在发表之后引用情况的工具,如今已成为一个在中国科研界人人通晓的词汇。
Eugene Garfield告诉《科学新闻》:“SCI诞生的初衷是为各学科领域提供一种先进的信息检索方法。”并没有今天的SCI如此“丰富”的意义。
与SCI联系在一起的,就是该系统所收录期刊的“影响因子”(Impact Factor), 即某种期刊在前两年发表的论文在这段时间被引用的总次数除以该期刊同期论文总数的结果。一个期刊的“影响因子”越高,该期刊的影响力也就越大。
2005年,另一个指数的诞生,同样引起了全世界学术界的广泛关注。
这一年,美国加州大学圣地亚哥分校物理学家Jorge E Hirsch提出一种定量评价科研人员学术成就的方法——H指数[1]。H代表“高引用次数”(high citations)。一个人的H指数是指在一定期间内他发表的论文至少有H篇的被引频次数不低于H次,剩下的文章被引频次数少于H次。
而Hirsch本人的H指数是49,这表示他已发表的论文中,每篇被引用了至少49次的论文总共有49篇。他告诉《科学新闻》:“H指数能够比较准确地反映一个人的学术能力。H指数越高,论文的影响力就越大。”
然而,文章引用次数是指科研人员所发表论文的他引次数的总和。这种算法实际是基于一个假设,即该人对所有署名论文都拥有全部荣誉。对于有多位作者的论文,这种假设很可能是错误的,因为并不是每位作者都有同等贡献。
于是,为了克服这一不足,天津大学教授张春霆院士创立了根据基础研究论文中作者排序的权重引用次数的W指数,即带有权重的H指数。该研究成果(W指数)于2009年5月发表在EMBO Reports杂志上[2]。
“如果是评价多作者中的每一位作者,只能用W指数。”张春霆指出。
上世纪80年代末,南京大学将SCI论文数作为一种评价体系引入了中国大陆。进入90年代,各种考评、职称晋升、申请项目、高额奖励等都与在SCI收录期刊上的论文发表数量及其期刊的影响因子等联系起来。
这一点在Elesvier英国有限公司出版经理李霞看来,“这一现象与中国的文化因素有关。例如,许多中国人习惯于根据官方标准来衡量或评判。因此这一现象在中国整个科研群体如此繁荣昌盛就不足为奇”。
由论文的影响因子作为评价学术杂志的引用率及影响力的量化指标,虽然受到中外学术界多方面多角度的批评,但仍不失为一个重要的参考。
Eugene Garfield认为,通常来讲,除非所有的变量(因素)都有所考虑,否则不能仅仅依靠影响因子评价科学家的研究,这是一个非常复杂的问题。
但是,如果只用这个指标来考评科研人员的能力的话,“这种做法绑架了中国科学。因为你明知道这么做不对,但是不得不这么走。”张春霆斩钉截铁地说。
后来居上?
就在SCI和IF在中国的热捧和批判中轮回之时,H指数短短几年就风靡全球,很快被引用于科研院所、大学、项目基金、学科发展等不同领域。
“H指数的主要作用是确定科学家研究成果的重要性和影响力,评价科学家的科研绩效。我认为它是比文章的出版数量、总被引频次数或影响因子更加优越的一个量化指标。”Hirsch告诉记者。
迄今为止,H指数最高的为沃尔夫医学奖获得者、约翰斯·霍普金斯大学神经生物学家Solomon H. Snyder,他告诉《科学新闻》:“影响因子容易被一篇文章的大量参考文献所歪曲,而H指数能够真正反映被高引用文章的数量。”
Hirsch指出,在过去的20年中,诺贝尔物理学奖的H指数在22~79之间,平均值为41;美国国家科学院物理学与天文学2005年新科院士的H指数在20~71之间,平均值为44;美国国家科学院2005年生物与生物医学部新科院士的H指数在18~135之间,平均值为57。Hirsch认为,在美国,要想在研究型大学获得副教授,H指数应在10~12之间,晋升为正教授H必须在18以上,要想成为美国物理学会会员,H指数要在15~20之间,而要想成为美国国家科学院院士,H指数必须大于45[1]。
转战中国
基于Elsevier开发的全球最大的文摘与引文数据库Scopus统计计算出的结果发现,刚刚入选“千人计划”的清华大学生命科学与医学研究院副院长施一公教授的H指数为45。(详见本期第51页《品评“千人”》)中国科学院化学研究所研究员王鸿飞对此给予了高度评价:“施一公学术成就毋庸置疑,在美国都可以当选院士了。”
王鸿飞在科学网博客中指出,通过对一位年轻的“千人计划”引进人才和国内同领域两位卓有成就而且处于壮年的院士进行比较后发现,这两位院士无论在H指数还是文中被引频次数,都远远落后于“千人计划”入选者。
Hirsch认为H指数达到20,才算是一名成功的科学家;达到40,则是杰出科学家;达到60才是首屈一指的大科学家。而如果按此推断,美国大物理学家、诺贝尔物理学奖得主查德·菲利普·费曼(Richard Phillips Feynman)也只能算是一名“成功科学家”,因为他的H指数仅为21。
“运用SCI(计算H指数)一个主要的问题是,对于中国人来说,存在很多同名同姓的人,导致英语缩写一致,很难区分开。” Hirsch说。
此外,张春霆也指出,H指数不仅受学科影响,其实“它也是通过论文引用次数得出的,并没有考虑作者排名,导致总引用次数人为放大,存在一定的泡沫现象”。而张春霆提出的W指数,可以很好地权衡多作者的不同贡献率。然而W指数的一个困惑就是如何给每一位作者赋予不同的权重值。目前,张春霆提出两个原则来计算作者的权重系数:
1.荣誉三分原则:将一篇论文所获得的荣誉等分为3份,作为项目负责人的通讯作者和主要完成人的第一作者的权重系数均为1,其他作者的权重系数的总和为1。
2.线性原则:除通讯作者和第一作者外,其余作者所分得的荣誉按其作者排列顺序以等差级数递减。
这样就可以有效地避免文章所有作者都获得全部引用次数的做法。
学术未来
Hirsch通过实证研究还发现,相比文章总数、文章引用次数、总被引频次数等指标,H指数还具有很好的未来预测性,H指数的预测准确性比总引用率、论文总数和平均引用率都要高[3]。
“H指数可以作为一个判断标准,可以对科学家作出的贡献给予评估和预测。”Hirsch告诉《科学新闻》。
此外,他还声称,H指数很难作假,因为作假者必须大规模自引才能提高H指数。
在H指数最高的生物学家Solomon H. Snyder看来:“虽然我在文献引用领域并无太多建树,然而我个人认为,在衡量科研产出时,H指数要比影响因子等其他指数更有意义。欧美国家已经将H指数作为一个最重要的工具来评判科学家的科研工作。”
德国开姆尼斯技术大学物理学家Michael Schreiber对此也表示赞同,不管你喜不喜欢,H指数确实存在:“不过把一个人的研究水平浓缩为一个数字,总是会引发一些问题,所以我们在使用的时候要特别当心它的局限性[4]。”
加州大学圣地亚哥分校政治学系副教授James Fowler等在研究中发现,科学家的一半引用率都与自引有直接或者间接的关系[5]。他告诉《科学新闻》:“我认为H指数是解决数量和质量问题极好的方法,但是所有的方法都有其缺憾,例如,H指数就低估了一位对科学具有极大影响的科学家——Mark Granovetter,因为他很少有文章。”
中国科学院科学前沿分析中心副研究员杨立英则指出:“H指数目前主要应用于研究层面,实践层面上尚缺乏可操作性。由于H指数特有的局限性,在使用时还需要谨慎。特别是对于国内大量的青年科研人员,H指数的区分度很低,在职称评定、绩效挂钩等方面尚不具可操作性。”
如何客观
“同行评议是评价科研人员的学术成就最基本、也是最合理的方法。但这种方法受到时间、同行水平、主观因素等诸多因子的影响。如果只是小同行内,什么指标都不需要,谁行谁不行,一目了然,”张春霆在6月2日举行的“杰出科教人才引进评估高层战略研讨会”上指出。
但是,“无论是SCI、H指数,还是W指数或其他任何指标,都不能代替同行评议以及对其创新内容的具体分析和历史检验。”张春霆认为。
“现在的问题是需要做中同行评议、大同行评议、甚至外行评议。”张春霆指出,“所发表论文、所获得SCI刊物他人引用总次数是衡量一位科研人员学术影响力的重要指标,因为它体现了真正意义上的在世界范围内小同行的署名评议,具有广泛性、公开性、公平性、真实性和客观性的优点。学术评价的基础和核心就是同行评议(Peer Review),原则是客观公正和公开。”
所以,“未来的评价应综合考虑H指数以及其他衡量标准,任何指数都应该谨慎使用。但是,同行评议的定性判断还是很重要的,事实上,没有定量的证据作出的判读也会是客观的。”Fowler强调。
李霞认为:“运用这些方法去评价科学家或研究机构,存在诸多困难和瑕疵。牛津大学和剑桥大学并没有太多的评价系统,但是他们却有非凡的成绩。这值得我们好好学习和深思。”

参考文献:
[1] PNAS, 2005, 102:16569-16572
[2] EMBO Reports, 2009, 10: 416-417
[3] http://arxiv.org/abs/0708.0646
[4] Nature, 2007, 448:737
[5] Scientometrics, 2007, 72:427-437

  评论这张
 
阅读(1353)| 评论(10)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017