2021年1月,科技部发布《有关论文涉嫌造假调查处理情况的通报》引发热议。这是近年来关于几个涉嫌学术造假事件的正式调查。20年前,美国物理学界曾发生过一场席卷世界的学术不端风波,他们的调查结果公开透明,处理方式令人信服。他们是如何做到的?实际上,人们只是希望得到科学、详实的调查报告。
撰文 | 瞿立建
2021年1月,中国难得发布学术不端调查结果。
本世纪初,美国也调查了一起严重的学术不端丑闻,调查结果出炉之后,人人服气。他们的学术不端调查是如何做到的?
我们先从这起丑闻的主角说起。
新星冉冉升
图1. 贝尔实验室如今归诺基亚所有
故事发生在贝尔实验室,它曾是地表最强企业实验室,涌现出15位诺贝尔奖得主,7位图灵奖得主。贝尔实验室的成就和氛围吸引着全世界头脑最聪明、志向最远大的科学才俊。
1997年,贝尔实验室入职了一位27岁的应届博士,德国青年扬·亨德里克·舍恩(Jan Hendrik Sch?n)。
图2. 扬·亨德里克·舍恩 (Jan Hendrik Sch?n, 1970年-)
舍恩的论文产出非常高,入职一年半,到1999年的时候,发表了6篇论文。
2000年,舍恩在Science上发表了5篇论文,在Nature上发表了3篇论文,且都是第一作者。
2001年,舍恩再接再厉,以第一作者身份在Science和Nature上各发表了4篇论文。2001年也是舍恩极为高产的一年,平均每8天就有一篇署名论文发表出来。
他究竟做了什么研究能在顶刊发文如灌水?舍恩研究的课题蕴涵着改变世界的潜力,他用有机分子做出了晶体管、超导体、激光器!晶体管是现代半导体工业的最基本元件,如果做出分子大小的晶体管,那么相当长时间内不必担心著名的摩尔定律失效,并且有机分子晶体管易加工、成本低,如果能产业化,必将像硅一样改变世界。
舍恩的研究,给人无限的想象,短时间内,各种科学奖项拿到手软,成为物理界最炙手可热的新星,并被视为已经预定了诺贝尔奖。
但在璀璨星光下,有一点小阴影——世界上多个研究组重复舍恩的实验,都失败了。
2002年3月,美国物理学会年会——全球物理界每年一次最盛大的聚会——上,有少数物理学家在报告中表达了对舍恩一些结果的疑虑,但收到的回应往往是:你的实验有问题;舍恩是天才,天才不犯错。一众物理学家津津乐道于关于舍恩的各种传言,比如他已经获得本年度诺贝尔奖提名,已经获得普林斯顿大学的教职,将回德国马普学会任Director等。(注:Director是德国马普学会各研究所一种科学家职位,名额极少,要求极高,科研自由度极大。)
就在许多科学家迷失于舍恩的天才光环下时,舍恩的论文爆雷了。
2002年春,贝尔实验室两名工作人员在准备申请专利的过程中发现,舍恩2001年在Nature和Science上分别报道了两种晶体管,晶体管材料不同,得到的数据曲线却几乎一样。两位工作人员将这个情况通报给了普林斯顿大学的一位科学家。
舍恩回应说,自己把数据搞混了,并在Science上发表了勘误。
不久,来自康奈尔大学的一位科学家发现,这两条几乎一样的曲线还出现在舍恩2000年发表在Science上的一篇文章里。
到底是从什么时候开始把数据搞混的?
普林斯顿和康奈尔的这两位科学家联手在舍恩的论文里玩连连看,又在6篇论文里找到多条几乎一样的曲线。
相关论文陆续被期刊撤稿。
图3. 舍恩三篇不同的论文,呈现了类似的曲线。
面对这些疑点,贝尔实验室管理层于2002年5月组织了一个委员会进行调查。委员会共5人,一位来自贝尔实验室,三位来自美国著名大学,还有一位来自产业界,其中主任委员来自斯坦福大学
指控与调查
调查委员会决定首先重审舍恩的原始数据。舍恩说,对不起,数据没了,电脑硬盘太小,以前的数据删除了。
调查委员会说,用样品重做实验。舍恩说,对不起,样品也没了,有些样品损毁了,有些样品扔掉了。
调查委员会只获得了舍恩论文稿件配图所用的数据。
调查委员会利用这有限的数据,做了细致的分析,最终形成了一份长达129页的报告。报告提出24项指控,24项指控分为三类:数据替换(Data Substitution)、数据的精度不切实际(Unrealistic Precision)、违反物理基本原理(Contradictory Physics)。这24项指控分布在25篇论文里,而不仅仅是最早明确提出疑点的9篇论文。报告中对每一项指控进行了详尽的分析,并且收录了舍恩对指控的回应。
调查委员会找到9个数据替换之处。举个例子,下图是舍恩发表的论文中的一张图。
图4 舍恩论文中的图
调查委员会发现,图中最后两条曲线其实是一样的,只是差了一个因子3.96。把上图中倒数第二条曲线除以3.96,便可与图中最下面一条曲线重合。调查委员会给出下图:
图5. 将图4最后两条曲线平移在一起完全重叠,显示做图的数据是编造的
舍恩对该项指控沉默以对。对于调查委员会指出的其他8处数据替换行为,舍恩都承认了,尽管带有辩护说辞。
调查委员会还找到9处数据的精度不切实际。比如舍恩论文中有下图:
图6. 舍恩论文中的曲线
规律非常漂亮。
调查委员会根据上图所用数据,得到原曲线的二阶导数的曲线,如下图所示:
图7. 这是图6中的曲线的二阶导数,过于光滑,说明上图不可能是实验实测数据所绘。
一条非常光滑的曲线。做过实验的人,对实验误差有常识的人,都明白这是不可能的,求导会放大相对噪声。
舍恩承认,论文中的图是自己编造了一个函数做出来的,而不是实际测的。舍恩对于其他8条指控,也都承认下来。
调查委员会细致分析了手中有限的数据和曲线,找到6个数据图违反物理原理,无可辩驳地表明数据必是伪造。具体内容太过专业,这里不再举例。
舍恩对大部分指控都承认了,但依然坚称,论文中报道的最重要的物理结论是正确的,他造假也只是让曲线更好看一些,犯了全天下科研人都忍不住想犯的错。
调查委员会还调查了论文其他作者的责任,调查发现其他作者主要工作是制备样品,没有参与数据造假活动,没有识别出舍恩的不端行为是可以理解的,结论是其他作者没有责任。这使得舍恩的合作者之一、华裔女科学家鲍哲南在这件影响巨大的学术不端事件中保持清白,没有影响她日后事业的腾飞,后来她当选为美国工程院院士,2017年还获得世界杰出女科学家奖。
图8. 舍恩与鲍哲南,后者在舍恩丑闻中是清白的。
后果很严重
2002年9月,贝尔实验室收到调查报告当天就将舍恩开除。
自2002年10月至2003年5月,舍恩陆陆续续有28篇论文被撤稿。
2004年6月,舍恩的母校德国康斯坦茨大学撤销了他的博士学位,理由是学术造假,“行为不体面”,尽管这些行为不是博士在读期间犯下的。康斯坦茨大学物理系新闻发言人说,舍恩的行为是“50年来物理界最大丑闻”,“使整个科学的公信力受损”。
2010年,舍恩将康斯坦茨大学告上法庭,初审胜诉。康斯坦茨大学上诉,反败为胜。舍恩又上诉至德国联邦最高行政法院,败诉,又上诉至德国联邦宪法法院,依然败诉。
调查之典范
舍恩事件早已尘埃落定,作为史上最恶劣的学术不端丑闻无可翻案,而调查过程也成为学术不端调查的典范。舍恩事件调查的特点有三条:一是快速响应,从学术不端露出端倪到开始调查也就隔了两三个月;二是科学坚实,调查结果在科学上无懈可击,甚至使当事人无从狡辩;三是公正公开,事情快过去20年了,调查报告依然可下载到,经得住历史检验。这三个特点也体现在舍恩事件之后的两起知名学术不端事件——韩国黄禹锡事件和日本的小保方晴子事件——的调查中。
首尔大学教授黄禹锡在本世纪初以干细胞克隆研究震撼世界,一度令他成为韩国人的民族英雄,朝鲜民族摘下诺贝尔奖的希望。且不说他的研究本身就存在伦理争议,到了2005年11月,黄禹锡研究的伦理争议已转为学术不端。当年12月,韩国开始对黄禹锡展开学术不端调查,2006年1月形成了最终的调查报告。调查报告全文虽在网上搜索不到,但报告的英文概要至今依然挂在网上。从这4页的概要上足可看出,调查对黄禹锡的指控做了细致的科学分析。最终,黄禹锡被首尔大学解职,并被法院追究刑事责任。
图9. 一度成为韩国人的民族英雄科学家黄禹锡被学术不端搞得灰头土脸
2014年1月,日本理化学研究所的细胞生物学家小保方晴子在Nature上发表了两篇论文,称成功培育出了新型“万能细胞”——“STAP细胞”,引起轰动。文章甫一发表,有人就质疑,图片有篡改迹象,文字有抄袭嫌疑。2月,日本理化学研究所就成立调查委员会开始调查,4月1日发布调查报告,共11页。但由于有人指出小保方文章的遗传学分析依然有疑点,9月,理化学研究所又成立一个调查委员会。12月26日,第二次调查的报告发布,共34页。调查过程中,小保方晴子亲自重复自己的实验,但失败。调查报告详细说明了相关指控,并呈现了小保方晴子的自我辩护意见。
图10. 小保方晴子在新闻发布会上
启示与借鉴
这三起学术不端事件都引起过广泛关注,是科学的污点,但都得到了彻底的调查,起到了亡羊补牢的作用。重要的是,调查报告详实科学,是呈现给科学同行和学生的绝佳案例,进而能让人引以为戒。
反观国内引起热议的学术不端事件虽不少见,但得到圆满处理的很罕见,相关部门快速响应的不多见,公开发布过科学详实的调查报告的更是几乎没得见。
图11 韩春雨一度被热捧为草根科学家一鸣惊人的典范
比如韩春雨事件。
与前文中三个案例的快速响应不同,韩春雨被质疑一年后,调查才开始。结果仅围绕这一篇论文,调查竟然进行了一年多,最后公众得到的只是一则几百字的新闻稿,给出结论“撤稿论文已不再具备重新发表的基础,未发现韩春雨团队有主观造假情况。”调查委员会是如何得到这个结论的?这个结论到底是何含义?调查委员会由何人组成?这些信息一概没有。
河北科大的新闻稿说:“韩春雨主动要求退回基于撤稿论文所获得的科研项目、绩效奖励、荣誉称号、社会任职等。”可是,为韩春雨设立的河北科技大学基因编辑技术研究中心依然在运行,韩春雨因这篇论文当上了河北科协副主席,论文早撤了,副主席的位子却没有撤。
图12. 河北科大基因编辑技术研究中心依然在运行
图13. 韩春雨依然是河北科协副主席
2021年1月,科技部发布《有关论文涉嫌造假调查处理情况的通报》(简称《通报》),称“对网络质疑曹雪涛院士的63篇论文,经调查未发现有造假、剽窃和抄袭,但发现较多论文存在图片误用……”,“对网络质疑李红良教授的21篇论文,经调查未发现有造假,但发现较多论文存在图片误用,反映实验数据处理不严谨。”
这是由科技部、教育部、卫健委、中科院、工程院、自然科学基金委6部门组成联合工作机制,专家给出的结论。但是,“图片误用”太笼统,没有细致明确的科学解释,难以服众。若深追下去,还会有更多疑问:有图片误用的论文,对其结论有何影响?有没有严重到需要撤稿的程度?(《通报》未表示撤稿)是不是每篇论文都应该详加说明?对于调查结论,都是“图片误用”,却有“实验室管理不严谨”和“实验数据处理不严谨”之分,几人的处理措施也均不同,原因是什么?希望调查组能发表一个附件,来说明这些问题。
美国调查舍恩事件,一条曲线一条曲线地审查,对有问题的曲线给出了无可辩驳的科学分析。如果我们的调查处理结果也有科学详实的报告,专业人士自然清楚图片误用与造假的边界在哪里,大家也就无可吐槽了。
这也并非是一个过分的要求。
从后续采访报道中了解,联合工作机制的专家组有9大院士坐镇,表示“要拿出一个经得起推敲、实事求是的结论”,“形成的材料有五千多页。整个复核过程是严谨的,经得起检验的。”
科学最看重的是结论吗?是论证过程!
学术不端调查之后,该如何止息吐槽声,重树公信力?显然只有写出并公布专业的调查报告,像舍恩事件和小保方晴子事件的调查报告那样,而非发布新闻通稿。
种种学术不端的定义都是抽象的,边界不是截然清晰的。如何清晰起来?就是靠每个案例的科学详实的调查。没有公开的调查报告,所有科学工作者——尤其是青年学者和学生——会白白失去学习机会。
正如颜宁教授所说:“对学术不端事件处理得越公开、越清晰,这些标准也就越公开、越清晰,人们去触犯这些道德标准的可能性就越小。不对这些事件进行认真公开的调查处理的话,再多的学风建设和学术规范教育都是徒劳。”
希望下一次学术不端争议时,有关方面能快速响应,细致调查,拿出一份科学、公正、令人信服的调查处理报告。
这样的机会应不难等到。
参考资料
1. 舍恩调查报告全文:
https://media-bell-labs-com.s3.amazonaws.com/pages/20170403_1709/misconduct-revew-report-lucent.pdf
2. 黄禹锡调查报告的英文概要:
https://en.snu.ac.kr/snunow/snu_media/news?md=v&bbsidx=71497
3. 小保方晴子调查报告1全文
https://www3.riken.jp/stap/e/f1document1.pdf
4. 小保方晴子调查报告2全文
https://www3.riken.jp/stap/e/c13document52.pdf
5. Investigation Finds that One Lucent Physicist Engaged in Scientific Misconduct Physics Today 55, 11, 15 (2002)
6. Bell Labs Convenes Committee to Investigate Questions of Scientific Misconduct Physics Today 55, 7, 15 (2002)
7. https://en.wikipedia.org/wiki/Sch%C3%B6n_scandal
8. https://en.wikipedia.org/wiki/Haruko_Obokata
9. Looking back on the Sch?n affair https://natelson.web.rice.edu/Schon_recollections_090418.pdf
10. 有关论文涉嫌造假调查处理情况的通报
https://www.most.gov.cn/tztg/202101/t20210121_160971.htm
11. 联合工作机制有关负责同志回应论文调查有关问题
https://www.stdaily.com/kjrb/kjrbbm/2021-02/03/content_1078388.shtml