基因检测预测不了你的未来,但它能计算人类的命运

我成长于西北地区一个普通的小城市,历史上大多数时候属于中原王朝边界,也有很长一段时间被鲜卑、羌族甚至匈奴占领。包括我在内的很多对历史感兴趣的朋友都会琢磨自己身上“汉族”的成分究竟有多少。仅仅是出于对血统的兴趣,而非民族主义,有的人确信自己有蒙古人的血统,有的人吹牛说自己是西夏李氏的后代。

祖宗的传说或多或少不可信,免不了过继、有不可告人的秘密之类,但是基因骗不了人。拜消费级基因测试行业的勃兴所赐,我和一位宁夏的朋友非常踊跃地参与了基因测试,只需要 2 毫升的唾液,宗族血脉、祖源图谱、血统图谱、祖源迁徙路线一览无余。

基因测试不是沉重的医学检测,而更像是一项互联网数据服务

自 2006 年起,第二代测序技术推出,DNA 测序成本下降速度甚至超过了摩尔定律,全基因组测序成本从 30 万美元下降到 1000 美元,测序成本的下降、公众对基因的好奇催生了市场的繁荣。芯片检测,是一项更低成本的技术,直接对 SNP(单个核苷酸的多态性)进行检测。在国内,这项服务已经跌至 499 元。

我们选择了 WeGene,一家国内最早为中国人提供个人基因组服务的创业公司。WeGene 的检测套件针对中国主要人群的遗传特点设计,提供 1000 万位点的基因原始数据下载,并据此提供了祖源分析、健康风险、运动基因、遗传性疾病、药物指南、遗传特征和营养代谢等七个方面,提供近 200 项的解读服务。

通过微信下单,两天后我收到了 WeGene 寄过来的检测套件。套件里有详尽的说明和操作步骤,以及对基因检测原理的简单介绍,通过微信绑定账号,之后每一步实验进度都会有微信消息提醒。

按照提示,往试管里吐 2mL 的唾液,摇匀封存,并交给顺丰快递陆路寄回,接下来就是检测的过程了,漫长又熬人的三个礼拜,坦白讲,如果不是因为 WeGene 的公众号隔三差五进行推送,我可能已经忘记自己在不断接近祖宗这件事。

整个服务流程,清晰又完整,它不像是医学检验,反而像一个极简的互联网产品,你只要吐一下口水,就能直接获得解读报告,背后复杂的科学计算原理就交给专业人士完成。

三个礼拜后,我收到了检测完成的提醒。我通过微信查看了我的检测报告,我只关心两件事,我的祖源脉络及健康风险。

· 我并不是一个纯正的汉族(中华民族),我还有 46.64% 的少数民族血统,甚至还有 11.2% 的日韩血统。祖源时间线上显示我日本的血统最早混进身体里最早是 1889 年时候。

· 我在运动方面确实没有天赋,我过去的尝试告诉我确实是这样的,爆发力和耐力都不行,基因检测的结果更是如此;

· 我确实有乳糖不耐症,喝不了牛奶。但却对酒精和咖啡有很强的分解能力,这是事实;

· 我患渐冻症和帕金森的风险比别人高了那么一点点。

看了五分钟报告,这事就算过去了。我第一时间问了下宁夏的那位朋友,他体内的西夏皇族血统有没有被检测出来,他很失落地告诉我,并没有,他 90% 的基因是汉族。

在基因检测中,我们两个人的反应属于绝大多数。有人觉得意外,有的人看了结果之后为自己损失了 499 块钱而愤懑。这取决于做这项检测的动机以及预期。

然而,WeGene 一类面向消费者的基因检测真正想服务用户的是什么?第一就是,自身是否携带了遗传性致病基因,比如癌症、高血压等家族病史等。

好莱坞著名影星安吉丽娜·朱莉在接受基因检测后,发现由于她患乳腺癌和卵巢癌的几率较高,分别是 87% 和 50%,而她母亲也因乳腺癌去世。为防乳腺癌的发生,她切除了乳腺。当然这还要看是否有家族病史,但基因所能体现的健康风险对于普通大众确实十分必要。

第二个基于基因数据的解读是,对正确选择用药的指导,因为基因差异,个体对服用同种药物会有不同机体反应。当然,这个指导和临床处方可不一样。但是,如果你的基因告诉你对青霉素过敏,那么你肯定不需要被打了一针后产生过敏才知道自己的体质不适。

你待基因检测如体检,检测服务公司待你如未来医疗的小白鼠

就在几天前,成立了 11 个年头的 23andMe 公司宣布了新一轮 2.5 亿美元的融资,估值已经达到 17.5 亿美元,是估值最高的个人基因检测创业公司,对 23andMe 来说,直接面向消费者(DTC)的基因检测服务已经不是核心战略了,科研和药物研发才是他们最想做的,也就是说,他们计划转型为一家大数据公司。只不过,和互联网领域的比特数据不一样,他们的数据是基因数据。

23andMe 的成就代表了这个行业的想象力和终极目标,23andMe 通过与 NGO 和政府的合作,已经积累了庞大的多维健康数据,他们从这些数据里找到遗传关联,然后反哺疾病科研、公共卫生决策和药物研发。

当然,用户的声音是多元的,拒绝把自己的基因数据贡献给此类公司的一个时髦的原因是隐私安全。也是本月,美国科学院院士、“科学怪才”克雷格·文特发表论文称,一旦检测机构获取了你的 DNA 序列,通过机器学习算法,就可以反推知道该 DNA 序列的拥有者的肤色、瞳孔,甚至声音。

然而,事实是,以美国为例,有基于 HIPAAA 的隐私保护和医学伦理的约束;其次,即使有不良动机的人通过你的基因信息“反向编译”你的长相和个人特征,其用途是什么呢?如果是诈骗或者恐吓,这个成本难免有点太高。这自然不是我们抗拒基因检测的理由。

那么是什么在阻挡 WeGene、23andMe 一类公司转型大数据研究、聚焦“医学研究”的未来医疗呢?

答案还是数据。在涉及到基因检测的整个行业里,上游是测序仪器耗材的研发,被美国 Illumina 等公司所垄断;中游是提供测序服务和分析的公司;下游是为用户解读测序数据报告输出,医院临床和科研应用的公司。

前两者是垄断型的存在,而且容易形成壁垒,但是不具备未来的想象力。我们之前分享过的一些“瞬间修复”、“延缓衰老”的医疗技术都是基于分子结构和 DNA ,也就是说,未来医疗的真正落点在于通过基因大数据的挖掘来推动科研和医学应用。

相比而言,23andMe 的消费级基因检测样本量已达到百万级别,而国内消费级基因检测量却停留在十万级的水平。

用基因测序技术在肿瘤治疗中的应用来举个例子,主要有两种方式:一是肿瘤易感基因检测,即利用 DNA 测序技术,确认导致患者患病的基因或者受检者是否携带有肿瘤易感基因,寻找患者适用的肿瘤靶向治疗药物或者其他适宜的治疗手段;二是肿瘤靶向药靶点检测,即在分子靶向药使用之前检测病人是否携带药物靶点,实现肿瘤的个体化治疗,以提高用药效率,达到最佳疗效并减少治疗费用。(引自财经杂志)

这两种方式,都需要你这个“未来病人”参与到基因检测中去,不管是从风险预估还是靶向药物的研发,基因样本数据太少都会严重限制其准确性。因此,除却你在基因检测上的个人私心,其真正前途和本质是一件功在千秋的大事。

基因检测揭示不了你个人的命运,但却隐藏着人类的秘密

一句话,基因检测行业面临一个困境。没有用户测就没有数据,没有数据就没有后端的研发,没有研发就不会有基于测试数据的更高层次的解读,没有后端的产业测试公司就永远是一个收服务费的公司。

人类基因组包含 30 亿个碱基对。做一次全基因组检测,会产生 100 多 G 海量数据,其中能被用于科研与临床应用的,只是蛋白编码基因与少量的非蛋白编码基因,占整体数据的 1%-2% 之间;而这部分数据中,被研究透彻的、能将之与疾病关联后得以应用的,仅占 1%。

许多接受过朴素科学教育的人将基因神秘化,从而把基因当做一件写死了命运的神奇存在,在他们眼里,基因所能呈现的东西自然和塔罗牌、面相一样。

有更大一部分人认为基因检测等同于体检,体检完的诉求自然是医嘱、临床指导甚至是处方,现阶段基因检测所能提供的后向服务和数据解读并不能满足他们。

第三种人对基因检测的理解是“多一事不如少一事”,万一检测出健康风险就会惶惶不可终日。这个隐患政府也考虑到了,23andMe 曾经有一度被叫停,理由是 FDA 担心万一检测失误,人们由于恐惧将来会得乳癌就做了乳房切除手术,谁来担此责任?是否都有像安吉丽娜·朱莉一样的抗压和主宰命运的能力?

这几种心态都是对基因解读的误解,平心而论,以 WeGene 为代表的消费级基因检测服务已经提供了相当多的解读,并在耐心地积累数据,我们作为基因数据的“小白鼠”,自然还不能奢望针对性的分子治疗、重大疾病预防甚至基因编辑等前沿医学快速运用到我们身上。

而更不能忽视的事实是,人体的各种性状和疾病是基因和环境共同作用的结果,基因只对性状产生部分作用,基因是否表达也受到内外环境的较大影响,且概率永远只是概率,而概率数值也受限于数据库样本。

因为想体现出基因检测的更高价值,我参与了 WeGene 社区的讨论,在社区里,针对检测报告的五部分有不同的主题板块,就像一个汽车爱好者的论坛,人们对基因的好奇是方方面面的。当我了解的横向知识越多,我能从基因检测报告里读懂的也越多。

WeGene论坛里的“研究所”,各种各样的调查研究试图发现基因与一些表征的关联

第二件可以做的事情是,不管是计划去做检测还是检测完毕,都需要找一些基因相关的书籍(诸如《自私的基因》、《遗传的革命》、《上帝的手术刀》)来读,这样可以加深你对基因检测、分子医学和运用前景的理解,否则仅仅花五分钟粗扫一遍报告就置之脑后,那真的就像是小白鼠了。

如果将基因检测理解为数据的原始积累,那么这个行业的后向——数据分析和与医学产业的联动才有可能。相反,如果从一个粗浅的报告里,得到“多喝热水、多吃青菜、多运动”的结论,我倒觉得这才是骗人。