计算机领域惊爆论文“花式造假”,中国作者频现可疑期刊

率先揭示这波“花式造假”的法国计算机学家呼吁,各领域同行共同深入调查这一伪造论文的新手段。

撰文 | 小叶

近期,“撤稿观察”(RetractionWatch.com)网站报道了一桩手法惊人的疑似学术不端事件。2021年7月中旬,国际学术出版商爱思唯尔(Elsevier)宣布调查旗下期刊《微处理器和微系统》(Microprocessors & Microsystems),对其发表过的400多篇论文进行逐一“重新独立评估”。而这些需要被调查的文章主要来自该期刊的6份“特刊”(Special Issues)[1]。

有别于常规正刊,特刊往往以更加明确细分的特定研究课题为主,邀请客座编辑监督编撰。因此,发表在特刊上的文章有独特优势:在同一领域内的可见度更高,出版速度也因文章独立正刊发表而更快。

《微处理器和微系统》是一本什么期刊?数据显示,其刊物影响因子1.525,是中科院工程技术及计算机科学四区期刊。该刊论文内容涵盖所有与嵌入式系统硬件相关的设计和架构,包括计算机、人工智能、通信、网络技术等多个学科领域。该刊官网介绍称,近5年来,其刊物文章通讯作者的第一大来源国是中国,紧随其后的是印度。(如下图)

来源:https://www.journals.elsevier.com/microprocessors-and-microsystems

爱思唯尔的发言人接受《自然》(Nature)采访时表示,根据目前已知情况,需要被调查的400多篇文章的作者很可能使用了反向翻译软件来掩饰剽窃行为,但调查仍在进行中。[2]

几乎同时,法国图卢兹大学(University of Toulouse)的计算机科学家Guillaume Cabanac和他的同事们在预印本网站arXiv.org上发布了一篇文章[3],揭示了一种伪造学术论文的新方式——用扭曲短语(tortured phrase)代替常规专业术语,躲过查重,让文章顺利发表。而被发现有此问题的文章多一半来自《微处理器和微系统》。

所谓“扭曲短语”是将约定俗成的英文专业术语通过软件翻译成某一门外语,再翻译回英语,最终得到与原术语意思类似,但看上去非常奇怪的同义词短语。比如,研究人员亲自试验,将“artificial intelligence”(人工智能)在相关软件内多次替换之后,就顺利出现了“counterfeit consciousness”(仿造意识),“man-made brainpower”(人造智力)或者“computerized reasoning”(计算推理)等由“artificial intelligence”扭曲而来的画风奇异的术语。

论文对比了30个正确的英文术语和发表在论文中的“扭曲短语”[3]

这些隐蔽的问题是怎么发现的?

原来,今年4月,Cabanac和他的同事们先是在一些计算机科学的论文中发现了些许长相怪异的短语,于是搜集了30个奇怪短语(如上图所示)放入引文数据库中搜索,结果一下子搜出860多篇文章!而其中500多篇来自同一本期刊:《微处理器和微系统》。

随后,他们选取了《微处理器和微系统》以及其他期刊上已经发表的一些论文摘要,使用自然语言处理模型GTP(生成预训练,Generative Pre-Training)检测器对其进行分析,筛查出可能是人工智能转写出来的合成文本,并肉眼阅读了其中几篇,果然发现了不少公开发表的论文中不该出现的问题,包括:

- 重复使用文本/图片,但未加标注;

- 引用根本不存在的文献;

- 引用论文中并不存在的公式或变量;

- 文中掺杂着无法解释、没有意义的语句;

这种新的造假手段十分惊人。著名学术打假人Elisabeth Bik称其“非常新颖”而又“令人不安”。

除了这些“不可接受”的错误之外,论文评审过程也疑点重重。研究人员下载了2018-2021年间发表于《微处理器和微系统》上的所有论文,发现从2021年2月起,论文平均接收时间比原来缩短了5倍,但发表数量却比此前三年(2018年-2020年)发表的总数还多。此间,有404篇论文从提交到接收的整个过程不到30天,其中394篇(97.5%)的作者来自中国大陆。而在同行评审时间超过40天的615篇论文中,只有58篇(9.5%)的作者来自中国大陆。

另外一个可疑之处是,有些论文的提交日期、修改日期和接受日期均为同一天,其中大部分发表在特刊上。对此,Cabanac表示,如果评审、编辑过程符合规范操作,那便无法合理解释这一现象。

而且,Cabanac和同事所调查的扭曲短语问题论文,尤其是《微处理器和微系统》第80-83卷涉及的不少超速评审论文,行文结构相当统一、小标题相似、图表用色相同。因此,研究人员推测,这些论文可能出自论文作坊,并且还使用了论文降重改写软件,类似于spinbot.com这样的免费或者付费软件/网站。Spinbot类的软件工作原理很简单,就是同义词替换。既可以替换单词,也可以替换整段文本。这样,作假者就很容易随意截取他人论文素材,用软件反复替换为自己所用,并躲过论文查重。

所有案例和数据都是触目惊心的!在论文的最后,研究人员写道:使用人工智能合成文本的欺骗行为严重危害了科研诚信,所有问题仍然脱离不了学术界长久以来“不发表,就烂掉”(publish or perish)的不良风气。因此,他们呼吁各领域的同行共同深入调查这一伪造论文的新手段,监督论文发表的生态环境。目前,他们的研究范围仅限于计算机科学,还没有人检查其他领域内是否存在“扭曲短语”现象。

虽然此次大规模论文重新调查事件尚未定论,但据目前情况来看,学术不端行为的泛滥面临两个严重新问题,值得警示:

首先,近年来,人工智能技术逐步应用在学术不端控制与预防方面,包括大数据智能检索防止文字、数据和图像FFP[指伪造(Fabrication)、篡改(Falsification)和抄袭(Plagiarism)],AI辅助同行评审,智能身份识别等等,为提高科研诚信做出了贡献。然而,带来利的人工智能技术也可为有心学术不端的人所利用。除了已揭发的“扭曲短语”造假手段之外,未来是否会继续出现更加便捷的智能造假技术,应用在更多学科领域的研究中呢?果真如此,又该采取怎样的措施来预防并打击各种新花招呢?

其次,这次事件还暴露了正刊之外特刊出版中的潜在缺陷,让学术不端趁虚而入。爱思唯尔为特刊推出了一种新的出版流程:特刊文章可独立发表,这样可避免文章出版的延迟,克服了传统流程的缺点,即必须等所有稿件都完成之后才能出版。所以,特刊文章发表速度更快些,不过即使再快,正如Cabanac研究所发现的,400多篇论文在30天内即完成从投稿到接收的过程,其中有些文章同一天投稿、修改、接收,这一明显“超载行为”让人无法不去怀疑其流程中有什么“猫腻”。

从原则上说,无论正刊还是特刊,编辑们都遵循相同的编辑和同行评审政策。对此,爱思唯尔发言人向《自然》解释:“编辑系统中出现了配置错误(configuration error)”,也就是说,主编或者指定负责处理特刊论文的客座编辑在投稿没有通过应有审批的情况下直接收到了这些文章,不过这只是“系统迁移时的临时问题,一经发现很快就会修正。”[2]

尽管如此,爱思唯尔发言人曾回复《撤稿观察》:“爱思唯尔对其所有主题特刊的整体流程进行总体审查,除了现有的验证特刊提案和客座编辑身份和资格的流程外,我们会进一步审查,以确保所有稿件接收的决定都得到主编或编辑委员会成员的一致确认,同时也会提醒员工注意特刊中的违规行为。”[4]如此看来,关于特刊和客座编辑,不可避免需要一些改革,堵上其中漏洞,防止学术不端“钻空子”。

参考文献

[1] https://retractionwatch.com/2021/07/19/tortured-phrases-lost-in-translation-sleuths-find-even-more-problems-at-journal-that-just-flagged-400-papers/#more-122688

[2] https://www.nature.com/articles/d41586-021-02134-0

[3] https://arxiv.org/abs/2107.0 6751

[4] https://retractionwatch.com/2021/07/12/elsevier-says-integrity-and-rigor-of-peer-review-for-400-papers-fell-beneath-the-high-standards-expected/