11 月 20 日,由苏州市相城区人民政府与《麻省理工科技评论》联合主办的 EmTech China 2020 全球新兴科技峰进入第二天议程。今年,EmTech China 邀请到了数十位顶级科学家、海内外院士、商业领袖、科创精英莅临现场,探讨新兴科技发展现状及其为人类社会带来的巨大影响。第四范式创始人、首席执行官戴文渊发表了主题演讲,以下为经过整理后的演讲实录:
大家上午好,非常高兴有机会能在这边跟大家交流我们在 AI 驱动产业升级方面的一些思考。实际上,这些年我们一直在人工智能驱动产业升级领域探索。我们探索的内容有零售行业从线上到线下的转型,金融行业的营销、风险、合规,制造业的数字化,以及石油石化能源企业用什么更高效的方式去运维遍布世界各地的设备。
我们发现,今年疫情加速了这方面的升级。在过去的两年,我们跟很多客户聊的时候,他们都会感兴趣,未来一定是数字化、智能化的世界,但是什么时候开始做?不一定。有可能明年,有可能后年。因为我们现在线下的生意还是能赚钱的。但是在今年的大环境下,由于我们是个企业服务公司,我们能看到真正在数字化转型、智能化升级的领域投入最多的,恰恰是那些受新冠疫情影响最大的行业,比如线下零售的企业。
过去可能很多行业在探索弯道超车,我举个例子,我们服务的一家企业,他们在前些年探索怎么用智能化、数字化的方式做更好的合规反洗钱。我们尝试了两条路。
第一条路是中国金融的业务专家在总结更多反洗钱的思路。但是在业务领域,我们可能至少落后海外先进经验有 10 年、20 年,通过业务专家的努力,我们两三年能追回别人五年的工作已经是非常了不起。
另外一条路是我们基于中国的企业所拥有的庞大数据,我们知道中国的这些金融企业,无论先进、落后,它的规模都是在世界领先的。比如工商银行是全球最大的银行,其拥有全球银行业最多的数据。基于这些数据,我们可以去发现更多的业务规律,我们发现机器通过数据是可以实现弯道超车的。我们合作的这家银行在掌握用机器去发现反洗钱的业务规律之后,一下子走向了世界领先。前些年他们还代表人民银行前往世界反洗钱组织介绍了中国在反洗钱领域的先进经验。这是中国金融企业第一次在世界反洗钱组织介绍先进经验,我们知道中国的银行过去在海外都是因为反洗钱做的不太好被罚款,从来没有机会在世界范围内介绍先进经验。但是通过数据、智能化转型,我们的金融机构在这个领域走向了世界前列。
我们看到的提升主要是来自于机器在各个行业里面发现的数据。从数据发现规律和效益,远远大于过去的效率。在改革开放以来的 30 多年时间,我们学习了大量的西方经验,我们仍然是追赶的步伐,然而可能过去是落后 100 年,现在则是落后 10 年。
通过这几十年的发展,我们积累了比西方更多的数据。如果机器能够从这些数据里更高效地发现规律,我们做的能比海外更好。我这边举一些例子,这是金融机构,这是一家全国领先的股份制银行,他们过去的营销是有些业务专家每天在总结给什么样的人推荐什么样的金融产品是最好的,我们帮助他们从数据里面去发现更多的客户喜欢什么样的金融产品,过去人类可能总结了十几年才发现了几百条规律,现在我们可以用机器从数据里面帮助它在一天内总结上亿条什么样的人喜欢什么样的金融产品的规律,一下子帮助他们把金融产品的营销效率提升了 600%。
过去这家银行的业务人员都在像 SaaS 的业务专家那样学习,但通过这样的变迁,他们已经不太想向海外学习了。
我第一次去中国的一家领先的金融机构去交流的时候,当时我跟他们讲互联网公司是怎么运用大数据、人工智能实现转型,他们问我,你知不知道美国银行、汇丰银行是怎么运用大数据、AI?但今天再也没有一家银行会问我这个问题,反倒是我们在去年开始服务汇丰银行,汇丰银行非常感兴趣招商银行、工商银行是怎么做的,这是一个非常大的变化。因为招商银行、工商银行拥有比汇丰银行多得多的数据,从数据里面能找到比汇丰银行多得多的业务经验,所以招行和工行现在已经远远领先于汇丰银行了。
同时在能源企业领域,我们帮助了一家国有的能源企业预测它的化工品价格。过去他们请很多海外咨询公司,帮助他们去解决这个问题,海外咨询公司也会请很多海外的专家来梳理化工品的价格走势。我们帮助它从数据里面用机器去发现了化工品价格的走势,原先一个顶尖的咨询团队可能花了一年左右时间总结了上百条规律,我们帮助它在一天时间内总结了大概上千万条规律,一下子让中国的能源企业在化工品价格预测领域远远领先于西方的企业了。
同时在医疗领域,我们和一家全国领先的慢病管理的医院合作过。他们的院长告诉我们,他在 10 年前每年夏天都要去以色列访问一个月,学习以色列医院的先进经验。但是这两年反过来了,以色列的医院院长每年夏天都想到他们医院里来工作两个月,因为以色列没有多少人。
这家医院从 2005 年开始到现在,整理了大概 100 万人慢病的数据,是现在我们知道的全球最大的数据,大概花了这家医院几亿的经费。但是这个成本并没有我们想象的那么高。我可以分享一下两年前 Google 的一个计划,投入了 10 亿美金,收集了 5 万人的慢病数据。我们帮助它从瑞金医院 100 万人的数据里找到了百万级别的规律,帮助他们把识别的准确率提升了三倍左右。
过去我们用这样的方法帮助过 15 家企业,我们可能帮助每家企业解决的问题不太一样,但实际上背后的原理是类似的 —— 机器怎么能够帮助人类做的更好。实际上过去各行各业的人都在总结经验。人可能每两三天总结一条规律,但机器一天时间内就可以总结一千万条规律。这可能比过去几十年、几百年所有人总结出来的规律还要多,从而能够帮助我们做的更好。
今天我能看到的特别大的机会,是 AI 怎么赋能产业升级,AI 怎么赋能产业升级的基础设施。
我们国家在改革开放以后,首先把规模做到了,做到了全世界最大。
由于我们的规模做大了,我们就拥有了全世界最大的数据库,我们在各行各业都能做到最大。我们服务的很多企业都是全世界最大的,比如说工商银行,全世界最大的银行;比方说肯德基,肯德基拆分了中国公司成为独立公司以后,肯德基成为了全球最大的餐饮连锁企业;比如说瑞金医院拥有全球最大的慢性病病人的病体库;再比方说最近在一家养鸡的公司,他们的鸡蛋产量在今年成为了全球最大。
这些数据会成为我们弯道超车的基础,这些数据里面蕴含着业务经验、业务规律和产业规律,实际上是远远大于过去一些先进产业所总结出来规律的数量,甚至有可能通过计算机在一天时间内总结出来。一天时间,所有行业总结出来的规律会大于人类过去几百年总结出来的规律,这是我们看到的最大产业升级机会。
前面讲的都是好的,我们也能看到,虽说我们畅想人工智能干好很多事情,看到人工智能在各个行业能够帮助很多企业实现转型,看到很多企业运用人工智能以后真的变成另外一家企业,我们看到美国已经害怕抖音了,但是为什么还有很多企业还不是很先进?为什么业界说人工智能可能会有很大的泡沫?
如果每家企业都能像抖音那样影响到让美国感到可怕的话,人工智能为什么会有泡沫?照理说人工智能不会有泡沫,甚至被低估了。为什么会这样?实际上我们发现在人工智能的基础上仍然有很大的缺失。
首先每个人都知道人工智能缺少科学家,缺人才。有很多先进的人工智能公司他们有很多人才,可能我们的企业没有。
与此同时,我们也缺设备。领先的这些人工智能巨头公司,他们的数据中心里面有几十万台服务器,我们的企业只有几台,是不是有很大的差距?
实际上还有很多标准的缺失。我们企业可能收集了很多数据,这些数据有的时候好像也没有什么用,真的用 AI 时我们过去建的大数据平台,数据仓库里面的数据一个都没有用。
这些是我们今天发现人工智能在落地环节当中所遇到的重重挑战。
实际上,作为人工智能领域企业服务公司来说,我们需要解决这些问题。
人才匮乏我们怎么办?我们要去想办法降低人才进入的门槛,我们不可能培养数以百万级的 MIT 的 Phd。
虽然今天是 MIT 的场合,但 MIT 的 Phd 不是什么人都能当的。如果人工智能的落地靠 MIT 的 Phd 的话,人工智能不会有广泛的发展。我们也不可能要求每一家企业都像 BAT,像头条这样去买几十万台服务器。那么,我们是不是有可能不需要买那么多服务器也能把 AI 做出来,能不能把成本降下来,我们是否有可能让这个数据更符合 AI 的标准,AI 的规范?这都是我们需要解决的问题。
过去六年左右的时间,我们一直致力于解决这个问题,建立标准、建立规范,降低 AI 的算力使用门槛以及建设更低门槛的 AI 开发平台,帮助我们的企业做到,来一个普通的工程师,训练 1-2 天的时间,就能开发出 MIT 的 Phd 开发出来的应用,帮助他们能够在 1-2 天内落地一个场景,而不是半年、一年,帮助他们获得只有原来成本十分之一的 AI 算力是我们一直努力的方向,并且我们也希望我们能够不停朝着这个路径走,并不仅仅满足于今天做到的状态,我们需要不断努力做的更好。
过去的六年时间我们做到了小小的成绩,首先去年我们在 IDC 机器学习平台的整个市场份额第一次出现在了机器学习平台的赛道,我们获得了 IDC 的认可,现在位居中国市场份额的第一,今年我们也蝉联了中国市场的第一。
Forrester Wave 也把我们评为整个机器学习平台市场的领先者,这个是我们过去做到的成就。但是我们远远不满足于成就,我们希望不断降低 AI 使用的门槛,降低 AI 使用的成本,并且缩短 AI 落地的周期,让每一家企业都实现数据和智能的转型,让我们每一个产业最后都能像我们今天看到的,像 BAT,像头条,像抖音一样实现真正的转型。能够让每一个产业在世界上像抖音那样,对海外有着深远的影响,这是我们想做的事情,也希望我们不断在这条路上走的更远,帮助到更多的企业,谢谢大家。