怎样实现“科学证据和逻辑面前人人平等”?

最近几年来,知名生物医学杂志上的著名论文造假事件,令人目不暇接,其性质恶劣影响广泛,堪称空前,惟愿绝后。例如著名的波蒂(Potti)医生造假案[1],以及最近发生的藏敬五造假案[2]。这些造假者的行径严重损害了社会公众对科学社区以及“科学自治”的信赖,势必动摇生物医学研究的基础。对这些造假者当然应该加以谴责,但仅止于空泛的谴责以及对当事人的惩处是远远不够的。科学社区应该进一步反思,如何进一步规范科学研究的具体运作,以及如何杜绝造假和防范不端行为的机制。

我们在此提出的一个论点是:以Cell, Nature, Science (CNS)为代表的顶级大型科学刊物引领的论文发表“规范”或曰“时尚”,对此类造假是否也应承担部分责任?

随着现代生物学研究技术的进展,科学家们开始有机会对一些复杂生物学现象来利用多种技术手段进行综合研究。在这种情况下,出现了一种不好的倾向:即将高水平的同质性研究(探测方法一致,样本例数多,反映传统统计学假设检验模型)等同于利用多种研究手段来阐明某种复杂生理现象机制的研究。也就是说,一个高水平的研究必须包括一个能够反映当今特定学科发展思潮的假设;要利用现有的各种先进方法对这个假设进行多个角度的验证(从基因,蛋白质相互作用,细胞内细胞外各种干预手段的运用);最后结论要求能够阐明一条新的可能存在的调控通路或者新的生物学现象。我们必须承认,这种复杂的研究方式在某些程度上能够避免一些因设计缺陷造成的不严谨科研结论的出现,从而获得高水平的研究成果的。这种复杂研究范式,也正是CNS等顶级刊物所一力提倡的。

然而,遗憾的是,顶级杂志所提倡的这种研究范式,也给造假者提供了最合适的造假环境:一个将所有关键中间步骤都垄断在其中的大项目,很容易让这些给最终结论提供坚实根基的步骤,失去被其它研究者检验的机会,从而给作弊留下了巨大的生存空间。生物医学类的研究,其关键核心步骤的重复验证所需成本巨大。如果最终结论的达成经由多篇已发表的论文,经由多个独立的实验室步步推进,那么任何一个关键中间环节的作弊,都很容易暴露。但是,当前顶级学术期刊所青睐的重量级论文,事实上在推动由一个人或一个实验室(或利益密切相关的数个联合实验室)独立完成所有中间步骤,发表一篇或几篇所谓的重量级论文,而所有关键环节事实上被垄断,或许在很长一段时间内,都不会被其它研究者检验。在这种情形下依赖于某个研究者或某个实验室的科学良知,那是对人性的巨大考验。可以想象,一旦研究者在已耗费巨大研究资源的前提下,发现某个关键环节的实验结果出了意外,那么修改部分数据,强行发表研究成果,就会成为一种策略。所以,我们认为,正如中国谚语所言“上有所好,下必胜焉”,这种由CNS等杂志倡导的,崇尚繁琐化论证的研究风尚,应当为近年来频频发生的重大造假案负上部分责任。然而,科学是求真的,任何重大而虚假的成果,迟早必会暴露。这些重大作假事件的发生,必然会影响公众对科学自治社区的信任,是毋庸讳言的。

我们并不否认,的确存在某个实验室和科学家,诚实严谨地完成了某个大项目,获得巨大突破的可能性,这样的论文当然是重量级论文,并值得在CNS发表。但是,在作弊层出不穷的时候,对这些重大成果,应该采用更加严谨严格的检验。我们建议,对此类成果的关键中间环节,应有独立实验室进行再次重复。而不是仅仅围绕论文的文字图片数据进行同行评议。同时,我们还认为,面对生物体固有的复杂性,企图一招制胜搞定复杂疾病的研究策略,也应有所反思。

实际上,越来越多的证据表明,大多数慢性人类疾病是一种机体信号调控网络出现紊乱的复杂综合现象,对上述现象的深入理解和解释必须是在已有的知识基础之上提出新的系统概念框架。诚如生物学大师EnrstMayr所言,“在生物科学中,绝大多数的重要进展是由引入新概念或改善现存的概念而取得的”,在这种情况下,试图经由繁琐化的“严谨”工作,通过阐明人体生理病理信号调控网络中的某一“pathway”从而一劳永逸的解决复杂疾病的机制问题,是行不通的。

我们认为,在现有的生物学研究构建过程中,重要的工作包括两种情形:一种是提供大量的反应各种生理病理活动真实情况的数据,这些数据和现象并不一定需要马上获得立竿见影的最终解释,但是一定要能如实的反应特定实验条件下细胞或者个体的各种反应的真实状况。另一方面,则是通过统合大量的原始研究的真实数据,利用数据挖掘、大数据分析以及数据可视化等计算机科学研究手段,对特定疾病或者生理现象提出新的概念框架进行解释,这样的研究更适合于解释人类这一千百万年进化而来的机体的复杂病理生理过程,也应该成为未来生物医学研究的前进方向。

但是很遗憾,坦白地说,目前以CNS为代表的传统生物医学刊物的审稿制度和发表机制无法满足上述要求。审稿人对于所谓逻辑严密,证据充分的追求使得“严谨”的研究成为了少数可以获得巨大资源的实验室的禁脔。与此同时,现有的论文发表体系对原始数据的公开性并没有提出特别的要求。巨大的研究投入和资助者“限期出成果”的要求,会使得很多研究者在研究的设计阶段就会准备好一个符合编辑和审稿人胃口的预设结论。在这种情形下,所有的实验过程都会围绕着论证一个必须实现的假设来进行。实验中产生的与证明假设无关的各种数据将会被有意抛弃。在实验结果的解释过程中的倾向性更是显而易见。

所有的这一切最后将导致一个可怕的结果:为了获得论文在CNS等高水平刊物发表的机会,研究者可能不得不通过故意隐藏某些不支持预设结论的数据甚至强行修改数据来获得更加“有意义”的结论。不过,反讽的是,很可能一些真实深刻的洞见就隐藏在在那些被抛弃的数据中!此类事例在科学史上屡见不鲜。在逻辑碰壁的时候,在偏离实验者预设结论的数据出现的时候,往往就是重大突破出现的时候,如果你抓得住机遇。什么是机遇?意想不到才是机遇。但是,由CNS所提倡的这种垄断式研究,从头到尾追求的都是设计精良,意外事件往往只会被实验者故意忽略或抛弃。因为,显而易见的是,意外就代表真正的未知领域,投入其中,谁敢言一定能成功?

如果说,如巴斯德等生物医学的前贤在时刻等待着意外(机遇)的降临,那么现在的许多生物医学研究者,则是对机遇则是避之唯恐不及。以人类胚胎干细胞的作弊事件(韩国黄禹锡)为例,他所抛弃的意外,让他实验失败后作弊发表的论文的意外中,就蕴含着机遇。他错把孤雌生殖所得的干细胞,通过修改实验数据,将其论证为克隆所得的胚胎干细胞。2007年,戴尔(Dale)教授就已经指出,黄禹锡无意中创造了首个来源于未受精卵的人类干细胞系,这本应该成为一个重大的发现。那么,我们现在应该反思的正是,是什么样的科研风气和环境,导致黄禹锡宁可作弊也要抛弃重大机遇?

为避免这种状况,也许在不远的将来,会有激进的科学家提出:让CNS统统关门才是消除浮躁之风的一种正本清源的好法子。从他们的眼光看来,CNS这类杂志的存在,使得某些知名实验室的科学家和审稿人可以根据自己对于科研的理解来左右论文发表的趋势,对某些不合其固有思维模式的实验结果提出苛刻的验证要求,反之亦然。这种情况造成的论文发表偏倚会严重阻碍科学的进步,而不公开的实验数据更是大大降低了通过大数据挖掘来获得新的知识的可能性。此种论文发表环境下,CNS等传统刊物已经不再是发表真正有意义的研究的学术平台,而是成为一种高级学术政治游戏的名利场--学术的公器成了门阀世家的玩物。长此以往,顶级期刊的编辑们将把“先看门第,再论科学”的恶习视作当然,而顶级审稿人们也难以放弃这样的问题:“我们需要这个结论吗?”并且将这样的思考美化为“我想看看这个实验是否具有重要的科学意义”…

2000年,贾德森(Judson)已经指出“虽然同行评议和稿件评审看起来是合理的、不可或缺的和不可改变的…但它既不是自然法则,也不是认识论法则”(《大背叛:科学中的欺诈》)。在同一本书中,Judson更进一步指出,虽然近年来对于同行评议制度的研究已经出现了很多,但由于缺乏数据,这类研究很难得出确定性的结论。然而,同行评议,尤其是所谓顶级期刊的稿件同行评议,缺乏客观性和可量性,却已经是科学编辑共同体中的一种共识。怎样跨越这种挑战?我们认为,在计算机网络和计算机科学已经进入到21世纪第二个十年的今天,去寻求一种更为客观的评价科学论文的方法已经具有了可能性。简而言之,我们提出了以下几点建议:

1

严格执行研究数据开源,鼓励对已发表研究的数据进行二次挖掘。这样有两个好处

1)防止刻意的学术造假。和经典的物理化学研究相比,生物学研究数据受到多种因素的影响。利用大数据分析,机器学习等数据挖掘的方法,有可能从中挖出很多重要的研究者没有注意到的相关性信息。这种相关性信息一方面可以提示进一步的研究方向。同时也可以让未来的研究者对数据进行核查:如果某些本来应该相关的变量“不自然”的出现了不相关的随机分布。那么则很可能意味着这些数据是需要进一步解释。例如,在著名的波蒂(Potti)医生案中,揭露造假的保罗·戈尔德堡(Paul Goldberg)等人正是通过主成分分析对论文数据进行二次挖掘发现了数据内部缺乏自洽性,从而揭开了这一重大造假案的盖子。

2)研究数据开源本质上是一种科学研究的民主化。研究数据开源,不仅能从源头上解决造假和扭曲解释研究结果的问题,更有助于促进研究者利用已发表数据进行再次研究。随着现代生物科学的发展,越来越多的证据表明,单独一个实验室并不一定能够对实验数据所蕴含的全部信息进行完全的解析。在这种情况下,上传原始研究数据的并开放使用,能够为其他研究者对数据进行深度解读创造出基础。只要数据的真实性有保障,即使结论并不见得激动人心,其价值也有可能为未来的研究者加以利用和挖掘,并得出可能为原作者所未曾料到的重要发现,或者用以建立新的概念框架。同时,以数据的真实性作为导向的论文发表政策也有助于消除基于地域、名气的歧视和不平等,为科学界创造一个良好的研究环境。

2

过分严苛的同行评议标准,倡导对跨学科研究更加宽容的发表环境

研究数据开源带来的另外一个后果就是,不同的人对于大量的开源数据的解读完全可能是不一样,甚至是矛盾的。很有可能在一个人眼中认为是一组蕴含着重要信息的数据在另外一个人眼中则是无关紧要的干扰信息。在这种情况下,实验的严密性和严谨性就需要更客观的定义。审稿人对于是否决定接受论文发表,就应该首先着眼于这篇论文的数据质量,而不是结论是否满足于证明某种特定的观点或假设。我们甚至可以大胆预测,对于观点更加宽容,对于数据要求更加严格的发表政策将带来一套全新的、更为客观的论文质量评议方法,这种方法在很大程度上可以抵消审稿人和编辑主观上对于新思想和新概念框架的偏见。而顶级期刊在组建审稿人数据库时,应当注重纳入更多的具有多学科背景的专家。如此,则同行评议将获得新生。

3

对知名研究机构和新的、不知名机构一视同仁

对知名研究机构和新的、不知名机构一视同仁。

4

开放获取

网络出版和开放获取,最终会彻底改变科学发表的现状。同行评议还会继续存在下去,然而,其内在规则一定需要变革。应当为新的思路和新的交叉学科研究范式提供更大更快更宽容的发表平台,只要逻辑自恰,证明有效,就应该让科学界同行尽快看到。最好的防止作假的办法,就是原始研究数据同步上传。然而在今天,不公开的审稿制度和不公开的原始数据似乎已经成为了把世界各地不同专业的科学家分割开来的坚固屏障。

CNS这三本杂志中的每一本,都曾经是并且依然是推动科学进步的重要力量,我们期待,在接下来的十年中,这些科学家们和公众们寄予厚望,承载了全人类科学梦想的杂志,能够勇于变革,不负众望。我们愿意用另外一句中国古语来结束这篇评论“苟日新,又日新,新又新”。我们期待,CNS以及变革以后的科学论文发表机制,能够成为科学创新的发动机之一。

文:江华

参考资料

[1] (Retraction:Genomic signatures to guide the use of chemotherapeutics.Nat Med. 2011Jan;17(1):135 )

[2](Crucialrole of interleukin-7 in Thelper type 17 survival and expansion in autoimmune disease.Nature Medicine 16,191–197 (2010) doi:10.1038/nm.2077)

联合作者

江华,医学博士1,2; 彭谨,医学学士,医学硕士1; 周志远,生物学学士1; 周舜泰,医学博士3; 陈伟,医学硕士1,4; 彭曦,医学博士5; Charles Damien Lu,哲学博士1; 李太生,医学博士6

四川省医学科学院·四川省人民医院创伤代谢组多学科实验室

四川省医学科学院·四川省人民医院创伤外科

Departmentof Infectious Disease, University of North Carolina at Chapel Hill

中国医学科学院北京协和医院肠外与肠内营养科

第三军医大学全军烧伤研究所

中国医学科学院北京协和医院感染内科