一手交钱一手挂名,中中原人民共和国舆论贩卖

日期:2019-05-06编辑作者:ca88手机版登录

(IvyP/译)两名计算机生物学家在利用PubMed搜索引擎了解最新研究动态时,偶然发现中国的论文贩卖公司依然在运作,而在1年前,《科学》(Science)期刊就已经发表过一篇文章,深入分析了这一结构复杂又利润丰厚的产业。

《Nature》杂志上的那些“零被引”论文

今年1月,诺贝尔奖得主、遗传学家奥利弗•史密斯(Oliver Smithies)去世,享年91岁。1953年,他发表了一篇关于测量渗透压的论文。用他自己的话说,这篇论文“有着从未被引用的可疑之处”。他在2014年德国林道举行的一次会议上对学生们说:“没有人引用过它,也没有人使用过这种方法,”事实上,史密斯的论文比他想象中的受到了更多关注:在论文发表的十年内,有九篇文章引用了它。但他的错误认知是可以理解的,因为许多科学家对未被引用的研究——包括其应用范围和对学术的影响——都怀有错误的印象。

1990年发表在《科学》杂志上一篇有争议的文章中,提到了一项被广泛重复的估量:有超过一半的学术文章在发表五年后仍未被引用。西雅图华盛顿大学(University of Washington)的信息科学家杰文•韦斯特(Jevin West)表示,科学家们确实对这个问题感到十分担忧。毕竟引文被广泛认为是衡量学术影响力的标准,它不仅可以被人阅读了解,而且对后来的研究也有一定的价值。研究人员担心,高的不被引用率意味着一堆无用或无关的研究。“我无法告诉你有多少人在吃饭的时候问我:‘有多少文献从未被引用过?’”韦斯特说。

事实上,未被引用的研究仍然有其存在的价值。加拿大蒙特利尔大学(University of Montreal)的信息科学家文森特•拉里维尔(Vincent Lariviere)说,更重要的是其实并没有很多文献从来没有被引用过。

为了更好地把握已发表的研究论文中具体有多少“零被引”的作品,《自然》杂志对数据进行深入挖掘以便能够找出到底有多少论文从来没有被引用过(这些方法可以在补充信息中找到)。由于引文数据库是不完整的,因此“零被引”的论文数量很难确定。但很明显的是,在位于宾夕法尼亚州费城的科睿唯安公司的大型数据库Web of Science中的12,000多个期刊组成的核心小组中,零引用论文数量比人们普遍认为的要少得多。

Web of Science数据库的记录表明,只有不到10%的科学文章可能没有被引用。但真实的数字可能更低,因为数据库记录的大量未被引用的论文实际上已经被某个人引用过了。这样的结果并不意味着低质量研究的减少,毕竟仍然有成千上万的期刊没有被Web of Science编入索引。而且科学家用毫无意义的论文填写他们的简历的现象依然存在。对一些未被引用的论文进行仔细研究后发现,尽管这些论文被多数人忽略了,但它们确实被引用过,而且被阅读过。科睿唯安的高级引用分析师戴维•彭德尔伯里(David Pendlebury)表示:“缺乏引用不能被解读为文章毫无用处或毫无价值。”

论文“零被引”的研究最早可以追溯到《科学》杂志上发表于1990年和1991年的两篇文章。1990年的文章中指出,1981年至1985年间发表的文章中有55%在其发表后的5年里没有被引用。但这些分析具有一定的误导性,主要是因为他们统计的出版物包括信件、会议摘要和其他编辑材料等文件,这些文件通常不会被引用。如果去掉这些只留下研究论文和文献综述的话,不被引用的比率就会大幅下降。延长五年的截止时间可以进一步降低利率。

2008年,拉里维耶尔(Larivière)及其同事重新审视了Web of Science数据库中呈现的数据。他们表示,不仅“零被引”论文比人们想象的要少,而且未被引用的论文的比例已经持续下降了几十年。《自然》杂志邀请拉里维耶尔和印第安纳大学布卢明顿分校的卡西迪杉本(Cassidy Sugimoto)一起进行详细的文本分析。

包括学术论文和文献综述在内的新的数据表明,在大多数学科中,论文被“零引用”的比例在发表后的5到10年间趋于平稳,尽管每个学科的比例有所不同。在2006年发表的全部生物科学论文中,到今天为止只有4%的“零被引”文章;在化学学科中,这个数字是8%;在物理学科中,数据接近11%。(当研究人员引用自己论文的案例被删除时,这一比例会上升——在某些学科,这一比例会再次上升)。在工程和技术领域,2006年这批科学索引论文的未被引用率为24%,远高于自然科学。拉里维耶尔认为,这一较高的数字可能与许多论文的技术性质有关。这些报告的目的旨在解决具体问题,而不是为其他报告提供铺垫,供其后期深入研究发展。

从整体上看,1900年至2015年底,Web of Science共收录了3900万篇各个学科的研究论文,其中约21%尚未被引用。不出所料,这些未被引用的论文大多出现在鲜为人知的期刊上。几乎所有知名期刊的论文都会被引用。

这些数据只反映了部分情况。但填补文献中的空白是一项不切实际的任务。对论文进行检查是一件难度很大的工作。例如在2012年,布拉格查尔斯大学的生物学家彼得·赫尼伯格(Petr Heneberg)决定对13位诺贝尔奖得主收录在Web of Science中的论文进行研究,以便细查一篇看起来很荒谬的论文。这篇论文声称,约有10%的诺贝尔奖得主的研究成果没有被引用过。他第一次查阅Web of Science数据库的时候发现这个数字接近1.6%。然后在检索谷歌学者的时候,赫尼伯格发现很多其余的论文实际上已经被其他在Web of Science数据库中索引的著作引用过了。但是由于论文中的数据输入错误或者拼写错误而被遗漏了。此外,在Web of Science数据库从未索引过的期刊和书籍中,赫尼伯格还发现了一些额外的引用。在工作了大约20个小时后赫尼伯格准备放弃搜索工作时,他将这“零被引”论文比例又降低了5倍,仅为0.3%。

这些困难就是为什么“零引用”的论文的真实数量无法得知的原因:如此大规模地重复赫尼伯格的人工检查会花费太长时间。不同学科也会因为测量中的这些困难而受到不同程度的影响。例如,Web of Science数据库中显示2006年发表的65%的人文学科的文献尚未被引用过。确实很多人文文献都没有被引用——部分原因是与科学相比,新研究较少依赖于前人的研究。但是Web of Science并没有准确反映这一领域,因为它忽略了许多期刊和书籍。

同样的因素也困扰着国与国之间的较量。Web of Science数据库表明,中国,印度和俄罗斯学者撰写的论文与美国和欧洲的论文相比更容易被忽视。但拉里维耶尔表示,该数据库并没有追踪到很多地区语言期刊,如果将这一因素考虑在内,引用率的差距将会进一步缩小。拉里维耶尔表示尽管有关于绝对数字的警告,但在Web of Science中,“零被引”论文比例的下降是一种稳健的模式。互联网让查找和引用相关论文变得容易得多。(让文章开放获取的权限可能也有推动作用。)但他警告说,不要过度解读这一趋势。他和其他学者在2009年的一项研究中发现,由于科学家发表了更多的论文,并在文章中加入了更多的参考文献,未被引用率正在下降。荷兰莱顿大学(Leiden University)的文献计量学研究员卢多•沃特曼(Ludo Waltman)对此表示赞同。“我不倾向于把这些数据解读为是在保证我们的科学工作更多的是在提供有用的目的。”

沃特曼说尽管有很多论文难以逃脱“零被引”的情况,但是也有很多引用都是相当肤浅或者敷衍了事的。通过沃特曼和拉里维耶尔在Web of Science数据库中的独立计算可以看出,只被引用一两次的论文数量大大超过了“零被引”论文的数量。纽约市马科斯公共与国际事务学院(marx School of Public and International Affairs)的健康经济学家戴利亚•雷默勒(Dahlia Remler)表示,这也可能是学者们互相推托的迹象。她表示:“即便是被高度引用的研究也可能是学者们一起约定好的事情,对任何人都没有好处。”

一些研究人员可能仍然倾向于将未被发表的论文视为无关紧要的成果。毕竟,如果它们真的重要——哪怕重要性只有一点点——难道就不会有人提起它们吗?

可能事实并非总是如此。路易斯安那州立大学(Louisiana State University)什里夫波特的植物学家迈克尔·麦克罗伯茨说,大多数学术作品的完成是吸取了远超于其引用文献数量的论文。在2010年的一篇关于引文分析缺陷的文章中,麦克罗伯茨引用了他自己1995年发表的关于在德克萨斯州发现点头棒苔藓(Palhinhaea cernua)的论文。这是该论文第一次也是唯一一次被引用,但其中的信息已被记录在植物图册和大型在线数据库中,使用这些数据库的人依赖于这篇论文和成千上万的植物学报告。大多数人已经使用过这些所谓未被引用的文章的资料,但是它只是显示出没有被引用的状态。

“零被引”的论文不等于没有被阅读过。2010年,纽约市卫生和心理卫生署(Department of Health and Mental Hygiene)的研究人员发表了一项研究,利用软件分析了一项唾液HIV测试中的性能缺陷。几年前,该试剂盒在诊所已经停止使用,不过后来又恢复了使用。作者希望利用诊所的经验作为案例研究,研究是否可以在问题出现时使用该软件分析试剂盒的性能。

对于任何一位希望自己的论文能够被引用的研究者来说,阿尔伯特•佩克(Albert Peck)的故事是有具有励志性的。艾伯特•佩克(Albert Peck)1926发表的论文《描述玻璃中的一种缺陷》(the kind of defect in glass)在2014年首次被引用。在20世纪50年代,由于制造商研究出了如何制造没有这种缺陷的光滑玻璃,该论文变得多余。但在2014年,英国剑桥大学的材料研究员凯文·诺尔斯(Kevin Knowles)在对该领域进行调查时发现了该论文,因为他的研究工作是利用这些缺陷来漫射光。他现在已经在四篇文章中引用了它,他说:“我喜欢写论文,在写作我可以发现并挑选出晦涩难懂的文章。”

里斯本大学(University of Lisbon)博士生弗朗西斯科·皮纳-马丁斯(Francisco Pina-Martins)在2016年发表了一篇关于解释基因序列数据的论文,他非常肯定这篇论文永远不会被引用。因为文中提到的技术是由生物技术公司454生命科学(454 Life Sciences)开发的,已经过时,而且正在被逐步淘汰。2012年,他将自己的数据分析软件上传到GitHub的代码共享网站上,然后有几篇论文引用了他的数据分析软件。但他说,这项研究花了四年时间才得以发表,主要是因为它涉及到一个同行评审员都不理解的罕见问题。

许多“零被引”的论文都给人带来不愉快的学术体验。2010年,神经科学家阿德里亚诺·切卡莱利(Adriano Ceccarelli)在《公共科学图书馆·综合》上发表了一篇论文,内容是关于网虫黏菌基因调控的。他申请资助继续研究的申请失败了,因此这篇论文也从未被引用过。“你知道研究是怎么进行的——结果证明这是一个盲目的方向,”他说,“我的想法没办法获得资金支持。所以现在我只能教书,等着退休。如果我明天得到资助,我将继续做这项工作。

他发表在《公共科学图书馆·综合》杂志上的论文从未被引用过。但该论文的作者之一、现供职于北卡罗来纳州达勒姆市杜克全球卫生研究所(Duke Global Health Institute)的乔•艾格(Joe Egger)指出,该报告的浏览量超过1500次,下载量接近500次。他说:“这篇文章的目的是改善公共卫生实践,而不是推动科学领域的发展。”

英国卡迪夫大学(Cardiff University)的化学家尼古拉斯•布尔玛(Niklaas Buurma)表示,还有一些文章可能仍未被引用,因为它们产生了一些没有成果的研究结果。2003年,布尔玛和他的同事们发表了一篇关于“等容争议”的论文。“等容争议”是关于在反应过程中,阻止溶剂收缩或膨胀是否有用的争论。从理论上讲,这项具有技术挑战性的实验可能有助于了解溶剂如何影响化学反应速率。但布尔玛的实验表明,化学家并没有从这类实验中学到新的信息。他表示:“我们一开始是为了证明某件事不值得去做,后来我们证明了这一点。”他补充到:“作为一篇完全完全无用的论文,我感到非常自豪。”

奥利弗·史密斯(Oliver Smithies)在林道会议(Lindau meeting)上说,他意识到了自己1953年发表的一篇论文的价值,尽管他认为那篇论文从来没有被引用过。他告诉听众,这篇论文背后的工作帮助他获得了博士学位,成为一名成熟的科学家。从本质上讲,它代表了未来诺贝尔奖获得者的学徒生涯。“我很喜欢这样做,”他说,“我学会了如何做好一个科学研究。史密斯发表的论文中确实有至少一篇没有被引用过的论文。他发表于1976年的一篇文章表示,一种特殊的免疫系统基因位于人类15号染色体上。但该论文的合作者马萨诸塞州波士顿哈佛医学院(Harvard Medical School)的遗传学家拉朱•库切拉帕蒂(Raju Kucherlapati)说,即便这一点也很重要,但还有其他原因。他表示这篇文章是他与史密斯实验室长期合作的开始,最终在老鼠遗传学方面的研究为史密斯赢得了2007年诺贝尔生理学或医学奖。库切拉帕蒂说:“对我来说,那篇论文的意义在于我认识了奥利弗。”

相关链接:

翻译 | Juno,同济大学高等教育研究所

(VeraS/译)克劳斯·凯泽(Klaus Kayser)从事电子期刊的出版工作已经多年,他甚至记得当初给订户邮寄存有电子期刊的软盘。19年来的出版经验,让他对学术造假问题相当敏锐。他认为自己采用了不同寻常的方式以保护自己正在编辑出版的电子杂志《诊断病理学》(Diagnostic Pathology)。举例来说,为了避免作者冒名使用网络上的显微镜图片,他会要求作者发给他玻片原本。

巴塞罗那基因组调控中心的吉拉姆·菲利翁(Guillaume Filion)和法布拉大学的卢卡斯·凯瑞(Lucas Carey)从PubMed下载了2012年1月到今年4月期间的论文出版记录。通过利用一种称为自然语言处理(natural language processing,NLP)的技术,二人将这200万篇论文的摘要部分进行比对分析,找出了2014年出现频率最高的词汇。

尽管他的警觉性很高,但还是有些疑似不端的文章偷偷潜入了《诊断病理学》。比如,在2014年5月刊上,14篇文章中有6篇有着可疑的重复段落和其他不合常理之处。在《科学美国人》告诉他之前,凯泽显然并不知情,他对我们表示:“没人跟我说过这个,真是太感谢了。”

菲利翁表示,他们本来是希望通过这种方法找到会成为热点的新研究方向。不出所料,他们发现与前沿话题有关的研究论文的数量有所增加,例如CRISPR(clustered regularly interspaced short palindromic repeats,规律成簇的间隔短回文重复),一种被《科学》(Science)期刊提名为2013年最重要科学突破第二名的基因编辑技术;以及目前基因组学研究中的热门——长链非编码RNA(long non-coding RNA,lncRNA)。

《诊断病理学》由德国施普林格出版社出版,一般认为这是一本声誉良好的期刊,在主编凯泽的管理下,其期刊影响因子为2.411,这使得它在汤森路透的《期刊引文报告》(Journal Citation Reports)中,稳居所有学术期刊排名的前25%,在76本病理期刊中位居第27名。期刊影响因子是根据文章被获得出版的学术文献所引用的次数来计算的,是衡量期刊声誉的粗糙标准。

但除了这些意料之中的研究趋势,还有一个很突出的词汇——由位于伦敦的补充医学研究委员会(Research Council for Complementary Medicine)运作的一个鲜为人知的数据库CISCOM。菲利翁和凯瑞指出,2014年之前,“CISCOM”这个字眼每年仅会出现在2-3篇论文中,而从2014年2月起,这个数据库突然间开始每个星期就出现一次。

凯泽的期刊并非特例。在过去几年中,在学术出版界的同行评议文献中,类似这样的违规信号时有出现,包括威立出版社(Wiley)、公共科学图书馆(Public Library of Science)、泰勒弗朗西斯集团(Taylor & Francis),以及出版《科学美国人》的自然出版集团(Nature Publishing Group)这样的大型出版社,都有涉及。

二人通过进一步分析发现,一组32篇有关不同主题的论文却都有着相同的特征——都是利用数据库里已发表得文章写出的综述文章,这些数据库不但包括CISCOM,还包括一些较常用的数据库,如谷歌学术搜索、PubMed和Web of Science等。此外,这些文章全部来自分布于中国若干城市的28个不同的研究小组。

在学术出版界(和研究界)快速变化的同时,明显的不端行为时有发生。对于将发表论文当作晋升升职的敲门砖,或是获得资金支持的研究者来说,谋得同行评议期刊上的一席之地的竞争相较以往已变得更加激烈。尽管互联网上的学术期刊数量激增,但供给仍旧赶不上数量庞大的学术产出所带来的不断增长的需求。人们担忧,这种压力会滋生剽窃行为。

菲利翁在10月4日发表的一篇博文中描述了这些论文如何惊人的相似,后来他决定与凯瑞一起探查背后的隐情。他们通过各种方式下载了这25篇论文的全文。而将这些论文用剽窃检测程序iThenticate进行分析后,他们并没有发现抄袭的情况。

可疑的论文并不容易被辨识出来。单独来看,每篇研究论文似乎都没什么问题,但是在《科学美国人》的一项调查中,通过对100多篇学术文献的遣词进行分析,我们发现了一些令人担忧的模板痕迹——这是一种信号,表明目前有一场大规模的对同行评议系统进行戏弄的尝试。

不过,所有这些文章的讨论部分都有类似的文字陈述,只有句式上有略微变化。比如一篇文章写道:“重要的是,有关研究对象和对照组的选择标准在这些所有的研究中都没有明确描述,因此可能会对我们的结果造成影响(Importantly, the inclusion criteria of cases and controls were not well defined in all included studies and thus might have influenced our results)”;而另一篇则写道:“重要的是,有关研究对象和对照组的选择标准在这些所有的研究中都没有明确描述,而这可能也会对我们的结果造成影响(Importantly, the inclusion criteria of cases and controls were not well defined in all included studies, which might also have influenced our results)”。

ca88手机版会员登录 1尽管本文涉及的很多期刊都有严格的同行评议制度,但显然这种制度无法阻止论文造假问题的泛滥。图片来源:physicsworld.com

另外,4篇文章中出现了相同的语法错误——在“我们的结果过去没有足够的数据支持(our results had lacked sufficient statistical power)”中无缘无故出现“过去(had)”一词。在试图找出这些文章之间的联系时二人注意到,文章作者们使用的文字描述似乎来自多个模板中,这意味着这些作者在有意调整这些文字的顺序,而这种方法正是用来逃避剽窃检测软件的,这种手法被称为“洗文”(text laundering)。

举例来说,发表在2014年《诊断病理学》5月刊上的一篇论文,表面上来看是一篇典型经过同行评议的荟萃分析论文,其作者为中国广西医科大学的8名研究者。在文中,作者评估了XPC基因的不同变种与胃癌之间是否有关联。他们发现这两者之间并无关联,并表示这不是该问题的最终定论:

这些论文中的大多数提交于2013年末,而同一时期发表的论文之间不可能相互抄袭。因此菲利翁和凯瑞推测,这些论文可能都出自同一个公司之手。在来自上海复旦大学的遗传学家余垚的协助下,二人找到了一家公司,其网站广告称可以代写荟萃分析论文。于是他们联系了该公司并询问服务细节,公司表示可在影响因子2或3的期刊上发表荟萃分析论文,价格为每篇1万美元。

“However, it is necessary to conduct large sample studies using standardized unbiased genotyping methods, homogeneous gastric cancer patients and well-matched controls. Moreover, gene–gene and gene–environment interactions should also be considered in the analysis. Such studies taking these factors into account may eventually lead to our better, comprehensive understanding of the association between the XPC polymorphisms and gastric cancer risk.”
“然而,运用标准化的无偏的基因分型方法,对同类型胃癌病人和相应的治疗手段进行大样本研究是很有必要的。此外基因与基因、基因与环境的相互作用也应该在分析报告中有所考虑。综合这些因素的研究,可能最终会让我们更好、更全面地理解XPC基因多态性与胃癌风险之间的关联。”

ca88手机版会员登录 2以“代发论文”为关键词在百度搜索,可以找到大量承接这种业务的公司,这些公司一般都有一整套完善的代发流程。图片来源:网站截图

对于一篇极为普通的论文来说,这是一个极为普通的结论,并不应当引发任何警报信号。但是,将其与《欧洲人类遗传学杂志》(European Journal of Human Genetics ,自然出版集团下属杂志)中,早些年发表的一篇关于CDH1基因的变种是否可能与前列腺癌(PCA)相关的荟萃分析论文进行对照的话:

2013年发表在《科学》期刊上的一篇文章就是有关一次长达5个月的卧底调查,调查中发现了许许多多类似这样的公司。这些公司提供一系列的服务,旨在帮人发表能出现在重要索引中的论文,包括汤森路透(Thomson Reuters)的科学引用索引和社会科学引用索引,以及爱思唯尔(Elsevier)的工程索引,而这些指标在中国许多研究机构内都是提职称的重要参考。除了利用客户提供的数据创作论文以外,这些公司还可以伪造实验数据、在已被期刊接收的论文中加作者,并出售写好的原稿。

“However, it is necessary to conduct large trials using standardized unbiased methods, homogeneous PCA patients and well-matched controls, with the assessors blinded to the data. Moreover, gene–gene and gene–environment interactions should also be considered in the analysis. Such studies taking these factors into account may eventually lead to our better, comprehensive understanding of the association between the CDH1−160 C/A polymorphism and PCA risk.”
“然而,在评估者对数据单盲的情况下,运用标准化的无偏的基因分型方法,通过对同类型的前列腺癌病人和相应治疗手段进行大量实验是很有必要的。此外基因与基因、基因与环境的相互作用也应该在分析报告中有所考虑,综合这些因素的研究,可能最终会让我们更好、更全面地理解CDH1-160C/A基因多态性与前列腺癌风险之间的关联。”

在论文成品中最受欢迎的就是荟萃分析论文,可能是因为写这类论文不需要原始数据。2013年6月发表在《公共科学图书馆·综合》(PLOS ONE)期刊上的一篇研究论文发现,2003到2011年间,来自中国的荟萃分析论文的增长速度比美国快16倍。如果在PubMed中搜索其它研究趋势,可能会找出更多有关不正当科研行为的证据,但是菲利翁表示,他和凯瑞目前打算将注意力转向其他地方,因为“我们不是打假人,而是大数据分析专家”。(编辑:球藻怪)

整段的措辞几乎完全相同,甚至包括“让我们更好更全面的理解”(lead to our better, comprehensive understanding)这个不怎么流畅的短语,唯一实质性的差别就是具体的基因(CDH1而不是XPCca88手机版会员登录,)和疾病(胃癌而不是前列腺癌)。

文章题图:liputan6.com

这并非一起简单的抄袭事件。很多看似独立的研究团队一直都在抄袭同一段文章——《公共科学图书馆·综合》(PLOS ONE)上的一篇论文中写的是可能最终会让“我们更好、更全面地理解”XRCC1基因突变和甲状腺癌风险之间的关联;另一篇在《国际癌症杂志》(International Journal of Cancer ,由威立出版社出版)上的论文则是可能最终会让“我们更好、更全面地理解”XPA基因突变与癌症风险之间的关联,诸如此类。有时候措辞之间的变化是很轻微的,但是在十几篇论文之中,我们都能找到几乎一模一样的语句,只是嵌入了不同的基因和疾病名称——就像是“疯狂填词”游戏一般,游戏参与者们在一段文章中填入缺失的字眼。

我们还找到了其他像这样“填空研究”的样例。搜索短语“由于显然不相关而被排除在外”(excluded because of obvious irrelevance),我们找到了超过十几篇各式各样的研究论文。除了其中一篇外,其他均由中国研究者撰写;搜索“使用标准形式,公开发表的研究中的数据”(Using a standardized form, data from published studies),也找到了超过十几篇研究论文——依然,全部来自中国;搜索“贝格尔漏斗图”(Begger's funnel plot)则对应着几十篇文章——再一次,全部来自中国。

“贝格尔漏斗图”尤其能够说明问题,因为实际上,并没有贝格尔漏斗图这种东西。西班牙巴塞罗那基因调节中心的生物学家吉拉姆·菲利翁(Guillaume Filion)表示:“它不存在,这是关键。”一位名叫科林·贝格(Colin Begg)的统计学家和另一位名叫马提亚·埃格尔(Matthias Egger)的统计学家,各自发明了测试工具来寻找综合分析中的偏差——“贝格尔漏斗图”似乎只是这两个名字的意外杂交体。

“贝格尔”这一检测抄袭的方法是菲利翁偶然发现的。他在医学期刊文章中寻找行业动态时,发现这些论文有着几乎完全相同的标题、类似的图表、以及相同的奇怪错误,就像“贝格尔漏斗图”。他猜测这些论文有同一个来源,尽管它们表面上是由不同的作者团队撰写的。“很难想像这28个人都是自己独立发明了一个统计测试的名字。”菲利翁说道,“所以我们非常震惊。”

通过在网上快速检索,我们可以发现有现成的成套服务提供,只需支付一定费用即可成为作者,在同行评议期刊上发表论文。研究者寻找在有声望的国际科学期刊上发表论文的捷径,而这些服务商们正是为了迎合这种需求。

今年11月的时候,《科学美国人》要求一位讲中文的记者与MedChina联系。MedChina是一家提供许多“论题出售”和学术期刊“文章所有权转让”服务的公司。记者假装想要购买学术论文的作者资格,与MedChina的代表商商谈。该代表解释说,这些论文已经基本算是被同行评议期刊接受,唯一需要做的只是一点编辑和润色工作,而价格则取决于目标刊物的影响因子,以及论文是实验性质的,还是荟萃分析性质的。在这次会谈中,MedChina的代表提供了一篇蛋白质与乳头状甲状腺癌的相关性进行荟萃分析的论文。这篇论文计划将要发表在一本期刊影响因子为3.353的期刊上,该论文的作者署名售价为人民币9.3万元。

MedChina出售的这篇论文最可能打算投稿的就是《临床内分泌学》(Clinical Endocrinology),这是5本影响因子为3.353的期刊之一,命题上也最吻合。这本期刊的高级编辑约翰·贝文(John Bevan)表示:“显然,这是一个极受关注的问题。想到这类事情一直在发生,并且越来越泛滥,我深感悲痛。”在《科学美国人》与他联系大约两周后,贝文确认了一篇可疑的论文,题目是关于乳头状甲状腺癌生物指标的,并且论文在修订过程中新加了一名作者。这篇论文最终被鉴定有问题,并被拒绝。

这些可疑的论文中,相当部分的资金支持来自中国政府。第一批被《科学美国人》辨识出来的100篇论文中,就有24篇收到过中国国家自然科学基金会(NSFC)的资金支持;而另有17篇承认收到了其他政府来源的资金支持。中国国家自然科学基金会的主任杨卫确认,有24篇被《科学美国人》认定为可疑的论文,后来被交付到基金会的纪检监察审计局,该局每年调查几百起针对不当行为的指控。杨卫在邮件中写道:“每年NSFC都要执行几十起针对学术不端行为的处罚,但代笔行为则没有那么常见。”去年,该机构其中一起处罚案例涉及了一名从互联网上购买申请拨款提案的科学家。杨卫强调,NSFC正在采取措施对抗不端行为,包括近期安装的“相似检索”功能,以针对申款提案中可能发生的剽窃内容进行检索。(杨卫表示,该系统上线后的一年以来,已经从15万申款请求中检出了几百个“相当雷同”的内容)。但是一旦到了论文工厂层面,杨卫表示:“我们对于这个问题并无太多经验,十分乐意听取你们的建议。”

ca88手机版会员登录 3这次《科学美国人》公布的100篇可疑论文中,绝大多数都出自中国的研究团队。图片来源:scientificamerican.com

一些出版商到现在才意识到中国的论文工厂问题。“我并不清楚还有一个买卖论文署名权的市场存在。”英国生物医学中心(BioMed Central)负责科研诚信的副主编洁吉莎·帕特尔(Jigisha Patel)表示,但他们中心(隶属于德国斯普林格出版社,发行《诊断病理学》期刊)已经开始注意并警惕这个问题。帕特尔说:“我们现在会调查并着手解决这个问题。”在《科学美国人》联系他们之后的不到两周,生物医学中心宣布,约有50篇手稿是谎称接受过同行评议的。出版商向撤稿监察(Retraction Watch)博客表示,“可能有第三方卷入,并影响了同行评议程序”,这些手稿很可能就来自论文工厂。我们可以看到大约6篇论文的标题和作者。所有这些论文在形式和主题上都非常相似,这意味着其他论文工厂的存在——制作荟萃分析性质的论文,这些论文全都来自中国的作者团队。

其他出版商也已经开始着手对抗可疑论文的泛滥。《公共科学图书馆·综合》的编辑部主任达米安·帕廷森(Damian Pattinson)表示,去年四月,期刊就已经创立了安全措施。他们收到的每一篇荟萃分析论文都必须经过特殊的编辑检查强制作者提交附加信息,包括他们开展研究的目的。“基于以上原因,论文被提交给评议者的比率已经下跌了90%。我们已经非常清楚地意识到这个问题。”尽管如此,《科学美国人》提供的列表中,仍旧包括4篇可疑的论文,它们均在《公共科学图书馆·综合》执行安全措施之后发表。而MedChina上仍有即将被《公共科学图书馆·综合》收录的论文的作者署名权在明码标价地贩卖。当我们询问帕廷森这一问题时,他回答说:“如果有不端行为的指征,我们会修正并撤销这些论文。这是一个麻烦的问题,我们对此十分了解。”

英国医学委员会(BMC)、公共科学图书馆以及其他出版商都在使用剽窃检测软件,以试图减少剽窃现象。但是,软件并不是总能解决文章的剽窃问题。帕特尔告诫说,论文工厂“令问题的复杂性更进了一层”,这令人十分忧心。

目前,出版商们正在进行一场艰苦的战斗。《临床内分泌学》的贝文表示:“由于缺少内幕消息,监管非常困难。”《临床内分泌学》及其出版商威立出版社试着堵住编辑流程中的漏洞,如作者署名后期更改,以及其他不端行为。贝文表示:“你必须承认,大部分人提交的内容还是以诚信为本的。”

这是非常严重的威胁。由于许多公司已经想到了如何从学术不端行为中牟取利益,所以假定别人都是诚实的就不再符合时代,是一种很危险的做法。“同行评议的整个机制是建立在信任基础上的。”帕廷森表示,“一旦这点被摧毁,同行评议机制就很难应对了。”

菲利翁指出:“我们面临着问题。”他认为,泛滥才刚刚开始,“压力如此巨大,而且涉及了巨额的金钱利益,因此将来必然会有各种各样,更为过分的行为。”(编辑:球藻怪)

文章题图:indiamart.com

本文由ca88手机版会员登录发布于ca88手机版登录,转载请注明出处:一手交钱一手挂名,中中原人民共和国舆论贩卖

关键词:

大俗大雅才是活着趣味,那大千世界竟有开放就

世界上再未有贰个国度像中华这么,对竹子有那样浓重的情丝。我们攻城有箭,报告有简,储物有筒,吃饭有笋,竹...

详细>>

关于转基因,关怀转基因

近年来,关于“转基因”的话题一直颇具争议。公众对于转基因食品的看法也是各执一词。那么,当今的中国公众群...

详细>>

至于癌症的10大传言,期骗大家的1一大癌症没有

(文/LisaWinter)最近,国外网站总结了西方社会中流行的十个关于癌症的谣言,其中很多谣言在我们周围也有广泛的传...

详细>>

中国农民自制微潜艇上榜,未来或能反航母反隐

1. 日本本田公司(Honda)开发的机器人阿西莫(ASIMO),是具备人类双足行走能力的类人型机器人。图为2011年10月6日,...

详细>>