搜狗王小川:肠道如同前20年的互联网,期待参与和见证历史!

编者按:

王小川,搜狗公司 CEO,前搜狐高级副总裁兼 CTO。曾获第8届国际信息学奥林匹克竞赛(“IOI”)金牌,之后毕业于清华大学计算机科学与技术专业,拥有工学学士、工学硕士, 以及 EMBA 学位。

他先后发明搜狗输入法、搜狗搜索等互联网标志性产品,被公认为中文信息化的重大突破;人工智能时代,他带领搜狗公司发展语音、图像、翻译等 AI 技术并率先实用化,成长为国内用户规模第四大互联网公司,以及赴美上市中国人工智能第一股。

① 写在前边 by 热心肠小伙伴

我们向大家介绍一位在密切关注肠道研究和转化的成功创业者——搜狗公司 CEO 王小川先生。这是否让你感觉很惊喜?肠道的魅力也让在互联网领域取得巨大成就的王小川着迷吗?

确实是这样,最近我们与王小川先生有多次互动,包括他到热心肠研究院来做深度的交流,热心肠先生参加他和碳云智能首席数据官鲜翾女士一起组织的闭门会,讨论关于中药现代化与肠道菌群的话题。

我们深切体会到这位互联网大咖对生命科学、传统中医的热爱,也很直接感受到他的视野和智慧。今天我们就特别编发我们对王小川先生的专访,以及他近期阐述如何“向生命学习做公司”的内容。

希望藉由这篇文章,向大家介绍王小川先生对肠道、生命、管理的思考,更希望能通过他的分享,让中国肠道领域的研究、产业界人士都能感受鼓舞,更加自信和努力的推进自己的事业。

②《肠道产业》专访王小川先生

问:作为在特定领域取得巨大成功的人士,为何会关注到肠道?肠道领域有哪些让你兴奋的点?

答:我2000-2003年在清华高性能所读研期间,做的课题就是基因测序的拼接算法,算是很早的 bioinformatics,也对生命科学就产生了浓厚的兴趣。而肠道菌群微生态,或许是破解中医和当代科学连接的秘密。

问:您已经在规划或参与什么肠道相关的项目吗?进展如何?对项目有何期待?有哪些困惑?

答:几年前我了解到一个有趣的实验,吃寒性的食物,会让肠道菌群代谢出更多的丁酸盐,具有还原性。我就猜想是否吃热性食物,会让菌群代谢出更多的氧化性。寒性、热性是东方文化独有的概念,包括上火、败火等概念。

如果这个因果性成立,那么是一座架起东西方经验和科学之间的桥梁。这个事情一过就很多年,大量研究投入到类似的实验中,我想这方面的突破很快就会有了。

问:结合您之前的成功项目,您认为肠道领域的机遇有什么跨界可以做的事?

答:免疫学、干细胞、肠道微生态这些本来都是西方前沿医学的突破。这里面,肠道菌群和食物关系最大,以及“药食同源”,和中药关系也很大。我想把我们大量的传统文化和临床经验引进来,再有大数据的分析,可能对于食物和药物的研发与实践,会有革命性的意义。

问:对于热心肠先生提出的“肠道产业≈大半个大健康产业”,您怎么评价?

答:热心肠先生提出的这个断言,我高度认可,我也相信热心肠会在这里面扮演重要的角色,做出重大贡献。

问:作为成功创业者,您对肠道领域的创业者有什么建议?

答:如同前20年的互联网创业,开创了难以想象的局面,有了天翻地覆的变化。投入这个领域的创业者,是幸福的。一起来参与和见证这段历史吧。

③ 王小川先生阐述如何向生命学习做公司

● 误打误撞与基因测序结缘

大学本科毕业后我进入收分最高的清华大学计算机系高性能计算研究所(简称“高性能所”)读研。高性能所主要研究巨型计算机,最重要的一个产品是做天气预报的高性能计算,那时我就知道天气预报需要强计算力的。

2000年正好有人类基因组计划,清华大学和高性能所也会分到一点任务,我想做应用型的新东西,老板让我去做基因测序这个事情,所以误打误撞的和基因测序结缘,兴趣有了用武之地。

基因测序现在已经非常成熟,一个人测序只需要1000元量级就基本可以去做,高通量也高很多。但是测得越多,我们以为解决了基因的问题,但更多的事情是不明白的。

比如说,人的 DNA 与基因是两回事,DNA 上只有5%的区域是基因,可以转录成 RNA 然后变成蛋白质,剩下95%大家觉得没用是垃圾。后来发现,那95%不仅有用,可能它能决定另外5%什么时候表达转成蛋白质,称为调控网络。

这就更复杂,就像暗物质,平时看它不工作,但具体工作反而变得更加复杂。

再到后来发现人体内的基因还有不同的变异,甚至在人的大脑里面每个神经元都有变异的结构,然后发现线粒体里也有 DNA 的问题,然后又发现蛋白质还有修饰的问题。比如猪,每个猪的 DNA 是一样的,但为什么花色不一样,因为上面修饰的蛋白质不一样。

最后发现每解决一个问题又会出现十个问题,这里面我觉得更多不是测序本身,而是打开生命科学的门之后发现越来越复杂。

● 生命是超越复杂性的科学

一旦做生命科学的时候,会发现数学的方法、物理的方法甚至加上化学的方法是无法解释生命现象的。生命本身是绕过了复杂性的科学。

天气预报对高性能计算的要求很高,大体的原理是把空间分成很多个格子,用有限元方式在里面去继续迭代。每个格子里是温度、湿度这些,然后去计算下一时刻的变化,格子分得越细,最后计算的精度会越高;格子分得越粗,最后的变化就越模糊。

基本上,格子每分细1倍,计算的复杂度增加 32 倍。2000 年美国亚特兰大奥运会能够做到知道一个体育场下不下雨,这是把精度放得特别高,在极其强大的计算机里计算。

当我们要去模拟一个物理规律运行的时候,需要极高的计算力。即便这样,气象学家洛伦兹在做天气预报时提出一个很著名的概念——蝴蝶效应,只要小数点后的精度差一点,随着时间的迭代,这种误差会呈指数级增长,最后的结果就完全变成一种混沌了。

这种混沌来自于计算天气预报,我在实验室耳濡目染之后形成一个基本的理解:对一个复杂事物,如果是非线性的,随着时间的推移,最后的结果就不确定了,会走上一个不确定的注定的结果。用数学能力是绕不过这件事情的。

我登山的时候发现,在山上,山体更复杂,天气变化更快,一天会变好几次,一会下雨一会出太阳。越复杂的事情,最后结果的确定性越差。这是在数学、物理得到的一个基本概念。一旦到生物学突然发现好像不符合这件事,生物学叫做比复杂性更复杂,按照钱学森的说法是叫复杂巨系统。

一个 DNA 做成一段基因转录成 RNA 变成蛋白,蛋白变成身体的催化剂,或者身体的酶又产生后面的反应,人的体内每一秒中以蛋白质为核心的这种反应变化可能是数以百亿计的。如果用超级计算机计算下一时刻怎么去变,这件事比天气预报复杂特别多。

所以当时我们实验室里就想去计算一个细胞的半透膜的运动,计算好了就能博士毕业。半透膜是一种单向的膜,一边浓度低,一边浓度高。通常情况下是浓度高向浓度低的地方渗透物质,半透膜不是,在有能量(即三磷酸腺苷)的刺激下能实现浓度低向浓度高的地方去流动。

比如人的皮肤里面,我们喝水都有这种情况,不然喝杯白水下去,体内的盐分就出来了。所以身体里面有大量的构件,用计算机去计算的时候,会发现它最后产生了一定的确定性,但背后底层的分子是极其复杂的一件事情。

人体里一个 DNA 怎么变成人,这个过程听完之后可以完全摧毁掉数学、物理关于复杂性科学的共识,为什么?要算一个 DNA 最后长成什么东西,是算不出来的。我问过华大基因的朋友,他们说有这个计算能力。

首先对现有的一个物种测序,做成数据库,最后其实做的是比对工作。给一段 DNA 之后去比对,与原来那个东西是一样的,那大体就是这个生物。这不是通过演化的方法去做这个计算,现在还没有这个能力。

别说一个完整 DNA 长成什么生命,就是中间一段东西产生的变化变成什么蛋白质都搞不清楚。Google 的 DeepMind 在 AlphaGo 之后很重要的一个工作是做了 AlphaFold,去预测蛋白质三维折叠之后长什么样。

基因变成蛋白质长成什么样子的研究就已经成为人工智能最前沿的课题。靠的不是推演的算法,不是演化算法,是靠大数据算了之后做中间的一种统计规律。

生命是能够超越复杂性,在复杂性之后呈现出有序的规律,数学、物理、化学是没法去应对生命这样一个问题的。

今天一个人的 DNA 拿到之后,不仅能知道是男是女,甚至长得跟老爸老妈一样像,这是常识。但从生物学底层看,是一个不可思议的问题,它怎么就能够从 DNA 经过无穷复杂的演化之后,得到一个清晰的结果。

今天包括生物学问题和经济学问题跟数学物理不是一件事,后者是停留在一个无机世界当中,有机世界当中的规则体系是有限的,更多是靠归纳方法或实验方法去做的。科学有自己的边界。

● 用生命的方法去看待世界

我读了一本很重要的书《复杂》(《Complexity》),书里有一个最重要的初级的东西叫定义什么是生命。每个人都知道生命这个词,看一个物体是不是生命,是需要有判断力的。

如果对生命的标签是有统一认识,是不是应该可以给生命下一个定义?但这件事情很可笑的是,我问了一百个人,一百个人都不知道什么是生命。连什么是生命都不知道,谈生命可贵、向生命学习就无从谈起了。

《复杂》里用了两句话给生命做定义,第一句叫性状相对稳定,第二句叫可以自我复制。性状相对稳定不是指一个花有五个瓣、颜色比较稳定,那叫性状,性状稳定是指环境对它产生一个作用的时候,它有复原能力,能对抗外界对它的破坏,是一种反脆弱的东西,这是一种生命力。

比如人身上划了个口子,它会愈合;还发现高级生命,如果拿刀去砍它,它拔腿就跑了,防止自己进入到一个自我不能复原的状态里去。这个定义很精妙,生命是能够保持高度一致的。

看了这个定义之后我又陷入到另一个困境。

DNA 是双螺旋结构,它能够自我复制,通过 PCR(聚合酶链式反应)的过程,在一种酶和适当温度的刺激下,双螺旋会解开,然后旁边的核糖核苷酸上面会形成两个链条。

DNA 就是有序中的一个整体,我们体内的 DNA 是无时无刻不在发生断裂的,但双螺旋结构能够修复回去,修复不回去就变异,很有可能往癌症上走了。

我是生命,体内还有细胞核、DNA 是生命,到底是什么关系?我很想把它们(细胞核、DNA)排除在生命的定义之外,以保证我自己是生命的绝对的权威性。

高山夜话现场,文厨(左)对话王小川(右)

还有什么是生命?按照这个定义理解,最后会发现,一个国家其实蛮像一个生命的,它里面有很多结构,也想自己活下去;一个民族,也像一个生命;思想也是有生命的,它会传播,而且相对稳定,能净化的。

所以在研究生期间,我建立了对世界新的认知方法。我不是从物理规律去看这个世界,而是从生命的方法来看待世界。这件事情非常有意义,因为非生命带来的词是脆弱性、无序性、无机、没有意义,生命带来的词是反脆弱、有机、有意义、有确定性。

物理学热力学第二定律讲到熵增就是一个封闭系统,它的熵增最后会走向无序、越来越不确定。而生命的世界讲的是熵减,最后讲一致性、有序性。

一个熵增的世界,我研究它干嘛?它本身主要是无序的,对无序的事情是没有什么好研究的。苹果落地好像是一个固定的事情,但它的可复制性非常差,苹果滚走了就没了。这只是在一个最粗浅的科学里面找到了一个不变的东西,但它离复杂世界中的规律差之甚远。

当我们理解数学、理解物理之后,没法对这个世界产生更精确的描述,但是生命才是更本质的一件事情。活着、存在性是一个有意义的事,甚至我认为生命才叫存在,不是生命就没有存在性。

生命变成一件很重要的事情,而且这才是宇宙中我们最需要关注的事情。因为它就代表了存在,代表了有序,代表了有规律可循。这时候,我们在想,公司是什么?

● 用生命的方法做公司

大家觉得向生命学习,好像公司像生命,但其实每个人做一家公司,就是在做一个生命。公司要是垮台的时候怎么办?要活下去,对吧?就像一个细胞,一个人一样,它已经变成了一个有机的整体。

它是反脆弱的,有员工流失会招新人,这个市场没有空间了,它会换赛道,以保证自己还能够摄取到外界的能量和物质来滋养它。但是我们很多时候学得不好,因为今天能活百年生命的公司很少,IBM 百年历史,大部分公司都挂掉了。

以前我看过一本书《基业长青》,里面有标杆组和对照组,讲要做造钟的人不要做报时的人等一堆道理。十年后再翻这本书,里面一大半公司已经挂掉了,即便它认为标杆的公司也挂掉了。

当我们做公司,如果把生存下去和发展下去作为目标,我们离生命差远了。生命搞了几百万年还活到现在,但一个公司能活过十年的就不多。

做公司不仅是叫做像生命,就是在做一个生命。它做的是两个事,第一它能够性状相对稳定,就是活着别死掉了,但我们没有做好的是自我复制,因为自我复制是面对环境复杂性很重要的一种适应方法。否则一个公司很容易最后走向组织结构更臃肿,衰亡死掉。

搜狗现在没叫做复制。其实很多时候拆分之后做子公司是一件很重要的事情,面对环境变化之后,像母体能够长存下去,这不是最有效的方法。主要面对环境变化很快的时候要这么做。

搜狗,我用个词来讲叫做“狐狸生了条狗”,搜狐生了搜狗。搜狐是一个媒体经营公司,搜狗是一个技术基因的公司。

生态是生命的一种方式,而且是一种很强大的高级的方式。做生态和做生命体是类似的做法,而且它能保证多样性,保证之间是一种和谐的、不冲突的状态。阿里巴巴做得很好,它知道一个品牌就意味着一种社会承诺,为了这个社会承诺它就得形成一个组织,就以公司为边界来做好。

④ 高山大学对话王小川先生

No.1:作为普通人,怎样才能走近科学,把科学观指引到生活这个层面?

答:首先科学不能解释所有的事情。懂科学不一定能做好公司。过程当中,我觉得更多理解什么是知道这个事的边界,就是什么事我会,什么事我不会,什么事我不知道。

我知道我不知道就是一个很大的进步。另外,我们在学东西的时候,你得先信它,才能学。学科学要学经典的东西,不要学太多东西。因为第一你敢信它,而且它讲的东西是锤炼过的。

No.2:生物学思维跟别的思想体系、方法论有什么不同,先进性在哪里?

答:科学如果往俗里讲,不严格定义这件事情,科学对我最大的价值是能够帮助我去一种规律的解释,能帮我解释过去,预测未来。

你心中可能有把尺子去量,当你茫然的时候过去解释不了,为什么不知道,未来长什么样也不知道。所以我们的管理工作背后或者做很多事情背后都有一个解释和预测的过程。使得你不断调整你的模型,这个模型跟过去发生事情最大化去解释它,最大可能预测未来。

所以当我有了生命视角之后,我会认为我能够解释的东西和预测东西会更多、更准。因为它本身像生命运作,它不是用一个物理、数学能解释的,它不是一个线性的东西。

No.3:企业真的能基业长青吗,是不是像生命体一样注定老去?

答:我的推论说生命体会老去,而且干嘛非避免呢。如果有人说我一定要活 1000 年,也挺吓人的。一个企业活千年,我觉得这是小概率的事件。它可以通过新陈代谢做一些替换,但是在适应环境中间不如里面孕育新生命,把它长出来,而不要追求一个企业要活 1000 年这样的事情,只要把使命完成就 ok 了。

它里面会有很多老化的东西,比如一个人升值是老化的表现,一个人加薪也是老化的表现。因为加薪就减不回去了,给他这个职位他可能就退不回去了,除非像华为那种全员下岗再来一次。打破原来的链条再回去,逆商可以做这些东西,但大多数企业是对抗不了这种变化的,或者局部趋势能够缓解,能年轻一些,但是要一直活下去,这件事情我觉得既不现实也没必要。