惊天学术造假!400余篇论文竟来自同一“论文工厂”?

“学术打假人”Elisabeth Bik 再次拉响了学术造假警报。她和团队发现了 400 多篇来自不同机构的论文,在条带、图形版式和标题上高度雷同,似乎都产自同一个“论文工厂”。

根据 Bik 爆料显示,这些论文几乎全部来自中国的几十家医院,其中包含了多家三甲医院。截止发稿前,共有 412 篇论文在列表中。Bik 认为,这样的出自论文工厂的文章可能有几千篇。疑似造假论文列表还在更新中:https://suo.im/6bWNkK

(图源:forbettercsience)

这次的打假团队包括 Elisabeth Bik(实名)、Smut Clyde、Morty、TigerBB8 等人。

打假团队成员告诉 DeepTech,国外科研圈对此事的反应激烈,“这几百篇文章会给科学论文带来很多污染。”具体来说,这些批量生产的论文,其错误结果可能会误导那些将其作为参考文献的其他研究者,造成科研资源的浪费。

同时,此次涉及的期刊不是所谓的“灌水刊”,整体质量还不错,这也是此次造假事件引起很大轰动的原因。

值得强调的是,Elisabeth Bik 的打假团队成员都有良好的学术背景,有些目前工作在科研一线,打假是一份业余爱好。

从 Elisabeth Bik 本身来说,她是一名微生物学家和科学诚信顾问,此前曾是斯坦福大学助理研究员,后来去往生物技术公司 uBiome 工作,2018 年离开该公司,全职无薪从事学术打假工作。

她是科研打假网站 Retraction Watch 和 PubPeer 的积极撰稿人。她的调查揭露了数种期刊中严重的学术不端行为,尤其在检测科学出版物中的照片处理方面被广泛认可。在过去五年中,她大约花费 5000 个小时检查论文,她的工作促成了数十次撤稿。

图 | Elisabeth Bik(来源:The Scientist)

从数据到标题“流水线作业”

早在 2018 年,图像数据完整性分析师 Jana Christopher 就在 FEBS Letters 上发表了一篇论文描述“论文工厂”。她发现有 12 份手稿都用了蛋白质印迹法,结果图都具有非常规则的间隔和形状特别的条带,而且缺少污点和染色剂。这些手稿来自不同机构的不同研究小组。

一个月前,匿名用户 Indigofera Tanganyikensis 在同行评议网站 PubPeer 上首次指出了一些论文的蛋白质印记检测板之间的背景相似性。之后他们发现,不仅是同一篇论文的背景相似,不同论文的检测板之间也出乎意料地相似。

Elisabeth Bik 注意到这条线索,并跟进研究,发现在 400 多篇论文中,蛋白质印迹条带之间的间隔都非常规则,外观呈哑铃或者蝌蚪状,没有常见的污迹。所有的条带都放在相似的背景上,表明它们是从其他来源复制和粘贴过来的,或者是电脑合成的。

图 | 背景图高度相似(来源:PubPeer)

另外,流式细胞图也被发现极为相似。以下的这些 “红毛球” 是 FACS 散点图,每一个小红点是一个细胞,通过其表面蛋白质的测量来定位。许多细胞在这些独立的实验中产生了相同的值。

图 | 对比图 4D 中的第 3 和第 6 个 FACS 图(菏泽市立医院心内科唐守义等人论文 Long noncoding RNA MEG3 deteriorates inflammatory damage by downregulating microRNA‐101a)

除了数据图本身,这些论文的柱状图也很有规律:以灰色调居多,左边是黑色条,每幅图都是双边误差线。不排除这样的布局可能是一个比较流行的标准图像样式,但不同机构上百篇论文的版面设计都一样,这的确少见。

图 | 以灰色调居多,左边是黑色条,每幅图都是双边误差线(来源:Elisabeth Bik)

最后,Elisabeth Bik 总结出了这些 “论文工厂” 的标题模板:

图 | 插入一个分子名称、选一个动词(一般现在式、第三人称单数形式)、选一到两个细胞转化过程、选择一种癌症或者细胞类型、选一个连词、选一个动词(现在进行式)、插入 miRNA 或者神经通路的名称(来源:Elisabeth Bik)

在被发现的 400 多篇论文中,用模板套出的标题比如:

Bilobalide alleviates tumor necrosis factor‐alpha‐induced pancreatic beta‐cell MIN6 apoptosis and dysfunction through upregulation of miR‐153

mir-488 inhibits cell growth and metastasis in renal cell carcinoma by targeting hMgn5

Baicalein retards proliferation and collagen deposition by activating p38MAPK‐JNK via microRNA‐29

一位中国科学院遗传与发育研究所的专家看过上述证据后,告诉 DeepTech,“证据都是直观的,感觉靠谱。”

点名六种期刊、六家医院,出版社:我们正在紧急调查

这批涉事论文中,许多作者都来自中国的医院或者医学院附属医院,其中涉及到多家三甲医院,Elisabeth Bik 的博文中提到了以下 6 家三甲医院:

济宁市第一人民医院(三甲):101 篇论文(几乎没有重复作者。涉及到儿科 15 篇、心脏病学 6 篇、内分泌学 6 篇、肾病学 6 篇、血管外科 5 篇等不同科室)

吉林大学中日联谊医院(三甲):59 篇论文

青岛大学附属医院(三甲):23 篇论文

临沂市中心医院(三甲):16 篇论文

郑州大学第一附属医院(河南最大的三甲):16 篇论文

济宁医学院附属医院(三甲):12 篇论文

她的博文中写道,这些相似的论文中,最早一篇发表在 2016 年,大部分论文出自 2018-2020 年间。被列出的 400 多篇论文大部分发表在以下 6 种期刊中,涉及多家出版社,其中,Cellular Physiology and Biochemistry 已于 2019 年 1 月被踢出 SCI:

Artificial Cells Nanomedicine and Biotechnology (Taylor & Francis): 76 篇论文,影响因子:4.462

Journal of Cellular Biochemistry (Wiley): 57 篇论文,影响因子:3.448

Biomedicine & Pharmacotherapy (Elsevier): 45 篇论文,影响因子:3.743

Cellular Physiology and Biochemistry (Karger): 26 篇论文

Experimental and Molecular Pathology (Elsevier): 26 篇论文,影响因子:2.350

Journal of Cellular Physiology (Wiley): 21 篇论文,影响因子:4.522

图 | 知名学术期刊出版商 Wiley 回应打假斗士 Morty(来源:Twitter)

团队表示,他们已经主动联系四大学术出版社包括 Springer,ELSEVIER,WILEY 和 Taylor&Francis Group,其中多数已经回复称,会组建团队对事件进行调查。

Wiley 出版的《细胞生物化学杂志》(journal of Cellular chemistry)尤其受到论文工厂有组织的“攻击”。它的编辑委员会汇集了许多杰出的美国科学家,但也包括某些名声不太好的科学家。多年来,这份杂志一直由学术编辑、现年 77 岁的 Gary Stein 管理,直到 2020 年 1 月中旬,Gary 辞职,来自 Wiley 的员工现在担任临时主编。

该出版社此前曾表示:在最近的期刊中,大约 90% 的论文都有中国作者,好像有某种模式。

Taylor&Francis 出版道德经理表示感激,并补充说:“ 我们正在紧急调查受影响的文章。”

论文作者青睐更可靠的“论文工厂”

这批全部来自中国,但作者、机构甚至科室都不同的论文中,一系列可疑的特征均指向:这批论文可能出自同一个“论文工厂”。

在众多论文中,Bik 团队发现多篇论文中的图片存在背景完全一致的现象,而这在正常论文中是不可能出现的情况。上文提到的模板式的标题也是一个非常明显的特征。

Bik 团队认为,对图像和数据进行分析是揪出论文造假漏洞的重要途径,这些明显模板式的文章背后极有可能出自同一个团队之手,他们甚至怀疑某些期刊内部有期刊编辑是所谓的“内线”,配合论文工厂让问题论文顺利发表。

据团队介绍,在正常情况下,论文作者所在地并不是需要统计的数据,而在整理数据库过程中,团队感觉到作者所在地与往常不太一样,随即将地理位置信息也加入到数据库中。

结果发现,这 400 篇论文作者出现了明显的聚集的情况。

在此前疑似论文数量只有 320 例的时候,有超过一半的论文来自山东省,近五分之一来自吉林,十分之一来自河南。根据最新的统计,仅有 1 篇来自北京,9 篇来自广东,1 篇来自上海,117 篇来自山东。

TigerBB8 披露,这些客户都聚集在山东济宁周围。

在医学界,2017 年的撤稿事件还历历在目,当时,医学期刊《肿瘤生物学》一次性撤下与德国学术出版商 Springer 合作期间发表的 107 篇论文,创下正规学术期刊一次性撤稿数量的纪录,而这涉及的超过 500 名作者全部与中国研究机构有关。

而在最新披露的一批 “问题论文” 中,大部分论文出自 2018-2020 年间,这两次事件之间是否存在内在联系?

团队推测,在 2017 年撤稿事件之后,部分医生对于 “买论文” 变得更加谨慎,这一定程度上让更多医生买家在周边关系中寻找更加可信的“论文工厂”,依赖半公开式甚至是口口相传的推广模式,也就一定程度上导致了这批论文作者过于集中的现状。

图 | 老虎 BB8 披露,这些客户都聚集在山东济宁周围(来源:forbettercsience)

“这次你暴露我们,可能使我们丢了工作”

德国独立科学记者 Leonid Schneider 撰文揭露了更多细节。一些通讯作者留下了前缀奇怪的 Gmail 地址,比如 CaseyPeiffer8311@gmail.com,他认为这些账户肯定不是中国某个被列为论文作者的医生,而是论文工厂的经营者。

他认为,中国的论文工厂甚至会处理提交的作品、同行评审(如果有同行评审的话),并在版权同意书上签字,同时假装是作者。

另外,论文工厂还会为客户创建虚假的 ORCID 账号。ORCID 是为研究学者创建唯一身份验证的系统,它会将研究活动和研究成果与账号相关联。部分期刊会使用该系统进行作者识别。目前已经发现一些学者在提交手稿之后注册虚假身份。

论文工厂也会注册一些一次性的电子邮箱,比如在 Journal of Cellular Biochemistry 中就发现,有作者在不同的论文中用不同的邮箱:

Dexin Yin:

yindexin221 @ sina.com;

mudanren8646ktd @ 163.com

Dajun Sun:

dajunsun0060@sina.com;

sundajun0056@sina.com;

sundajun221@sina.com

TigerBB8 提到了一个提供服务的网站“鹏程 SCI”,其官网挂着它可帮客户在 SCI 和 EI 索引期刊上发表论文的说明,同时标榜规避作者风险、保护作者成果、确保每一篇文章成功发表的宗旨。并称,迄今为止已经成功发表文章上万篇。

图 | 鹏程官网

论文工厂会通过邮件等方式联系有发论文需求的学生、老师,某位在医院工作的人士曾收到过很多类似广告,他向 DeepTech 提供了如下截图:

甚至还有关于此次疫情的相关论文:

“许多论文似乎都是医院或医学院附属的作者,这并不奇怪。要成为中国医学院校博士,一部分要求是至少要发表一篇出版物”,Elisabeth Bik 在博文中写到。

在中国,如果临床医生希望晋升,就需要在国际期刊上发表一定数量的研究论文。一个简单的方式就是找论文工厂,只要付钱就能买到全套服务。

TigerBB8 在揭露论文造假过程中,曾收到过来自中国论文买家的信息,轻吐苦水,“白天,我有门诊手术;下班后,我得照顾我的孩子。晚上 10 点以后,我只有一点点时间,但这远远不够,因为科学研究需要大量的时间。”“只要系统保持不变,游戏规则保持不变,伪造数据的类似行为肯定会继续。”

“这次你暴露了我们,可能使我们丢了工作。”信息中写到。

图 | TigerBB8 在揭露论文造假之中,曾收到过来自中国论文买家的信息(来源:forbettercsience)

Bik 拉响的警报并不止于 “论文工厂” 的存在,也不止于这些论文都通过了同行评审。她收到的消息称,一些特定的 “论文工厂” 或许已经成功 “感染” 了某些期刊,这些期刊有可能正在和工厂合作催生更多的造假论文,并将此出售给渴望完成学术理想的大批有抱负的医学博士。

更严重的情况或许还在水面之下,正如 Bik 在一条推特中的感慨,“我只是抓住了一些比较傻的造假者。聪明的坏人留下的痕迹更少。”

打假团队成员与 DeepTech 的问答

DeepTech:此次事件的影响有多大?

A:这次科技界反应非常大,因为这些论文发表之后,不仅仅是占用了篇幅,而是这几百篇文章会给科学论文带来很多污染。

因为期刊本身是国际期刊,且影响力较大。那么学生在规划课题的时候就可能看到这些论文,从而被这些论文的错误结果误导。一个学生可能只有三年时间来做一篇论文,作假论文如果不幸被用作论据来支持自己的实验设计,那么某个学生几年的心血都可能因此荒废,甚至人生都被耽误了。不光是学生,对其他研究人员也是这样的。

对文献的污染是大家关注的焦点。

第二点就是,一直以来科学界都是假定论文是真实的,而几乎不会考虑是否有专门造假的情况。这么大规模的造假会让很多人无所适从,让很多人花更多时间,看看论文到底是真的还是假的,这会产生颠覆性影响。

DeepTech:发表学术论文有严格的流程,包括审稿和同行评议等,为何无法阻止论文造假事件发生?

A:首先,同行评议环节的审稿人在收到论文之后,一般不会怀疑数据、图片的真实性。审稿人会去看论文中的实验设计是否合理、是否存在不严谨的地方等等,而这批论文在这些部分并不是完全造假的,这也可看出此次造假水平并不差。

第二点,审稿过程也有可能是被破坏的,比如 2017 年撤稿事件中出现的伪造同行评审意见的事件,这也是怀疑期刊内部有 “内线” 编辑的原因。

第三点,假如一篇论文投稿失败,论文工厂会锲而不舍地把论文依次投到其他期刊,这样可能在某些情况下混了过去。

我们希望期刊编辑部在做调查的时候,能公开涉案文章的审稿意见,但我认为这是不可能的,因为每个期刊都有自己的审稿人库,如果把审稿人惹怒了,以后就可能不帮你审了。

DeepTech:所以要从同行评议的环节进行改善对期刊来说是一件非常高成本的事情?

A:这对审稿人来说也是不现实的,如果审稿人每篇文章都要花很长时间去看图片、数据有没有造假,那么审稿时间就会非常长,要知道审稿人是完全没有审稿费的,而且不能占用日常做研究的时间来做审稿工作,都是占用自己的空闲时间。所以如果还要花更多时间来看图片是不是造假,那干脆说不审就好了。

我认为大期刊应该对审稿人进行一个培训,能够快速发现论文中的可疑信号。也有不少人同意,期刊应该设立专门的审查人员,专门做这个环节的工作。目前已经有一些期刊设立了这么一个职位,不过还是极少数。