作为一家成立于今年 1 月的初创科技公司,Cortex Labs 是由一群机器学习及区块链高手所组成,首席执行官陈子祺、首席技术官王威扬和首席科学家田甲全部毕业于国内的清华大学,陈子祺、王威扬毕业后赴美攻读硕士,均擅长机器学习及人工智能理论,其中王威扬还是竞赛高手,不仅在 Kaggle 竞赛获得银牌,也曾带领团队开发基于 IBM Hyperledger 区块链框架设计的资产证券化(ABS)系统并获 2017 Dorahack 黑客马拉松冠军。
其中,Cortex Labs 首席科学家田甲因为物理和生物竞赛保送至清华大学计算机系,与 Pony.ai 创始人、圈子称为"楼教主"的楼天城是同学。他曾在百度、阿里巴巴工作,负责每日 PV 过亿的搜索引擎和推荐引擎架构师。其他成员同样技术实力坚强,“在科技竞赛圈排名前 100 名的华人,公司就占了 5 个名额”,王威扬表示。
Cortex 在成立后获得了比特大陆、FBG 资本的投资,以及现代密码学之父、图灵奖获得者 Whitfield Diffie 担任学术顾问。
图|Cortex Labs 团队成员,CEO 陈子祺(左二)、首席科学家田甲(右二)、CTO 王威扬(右一)
不可讳言,区块链暴冲式的发展,参杂了一些炒作或鱼目混珠,不过,陈子祺、王威扬、田甲三人身为开源精神的信仰者。他们认为,区块链模式是天生用来让小公司颠覆大公司的,“区块链的前奏是共享经济,就是去中介,然后区块链更进一步加强了”,特别是 AI 公司掌握数据、模型、甚至是用户的隐私,但外头的人不知道它在做什么,也没办法优化它的流程,似乎只能指望公司创始人莫忘初心。
“所以,我们就把它(指模型)放到区块链上来,让他们(指掌握 AI 数据及资源的大公司)不得不公开原型。你不拿出来,我们的社区开发者就提供跟你性能类似的模型,通过区块链的奖励机制,在一个生态里面把 AI 一次民主化。因为如果 AI 不民主化,掌握在少数人的手里,是很危险的,”陈子祺愤愤地说。
在如此剧烈地改变我们这个时代的两项技术
人工智能与区块链分别是去年跟今年最火的名词,当有人说要把这两项技术结合,很容易让人怀疑这是否又是一场营销炒作或赶流行,不过实际上,两个技术皆催化了创新,并在多个行业掀起剧烈的改变,但两者皆有缺点,而如何将两者截长补短,创造更趋于完备的技术,就很可能创造出科技行业的一场新革命。
人工智能与区块链的融合可以简单分为两类,一是 AI 如何改变优化区块链,像是将机器学习算法用于工作量证明(PoW)或权益证明(PoS)的共识机制上,以减少算力及能源浪费,或是加强区块链上的安全防护、区块链自治组织的管理效益等。
另一种就是区块链如何改变 AI,比如提供数据、算法、算力的交易市集(marketplace)、帮助解开 AI 黑盒子之谜等,目前来看市集可说是最热门的模式。
美国斯坦福大学物理系讲座教授张首晟在今年 3 月一场《量子计算、人工智能与区块链》的演讲上也点出了上述模式,他认为人工智能最缺少的是数据,今天的世界每个人产生出很多的数据,个人的基因、医疗、教育、行为数据等,但是这些数据都掌握在某些中心机构里面,没有达到真正的去中心化。区块链的产生正好能够产生一个数据市场,这个市场里每个人将拥有自己的去中心化数据,加密算法使个人隐私得到保护,从而实现区块链和人工智能互相共存。
由于人工智能需要使用大规模的数据,但在某些领域数据取得困难,如医疗,再加上 Facebook 数据丑闻爆发后,大多数用户不再随便/随意分享自身数据,以及欧盟推出史上最严格的个人资讯保护法 GDPR,都让数据搜集难上加难,而区块链可建立一个数据流向清楚的交易市集,既然数据可以交易,算法及算力同样可以。
像是打造 Sophia 机器人的 Hanson Robotics 公司首席科学家 Ben Goertzel 所创立的 SingularityNET,旨在打造分散式的 AI 数据市集,用户可以按比例购买和销售数据或算法,中间就是通过该公司的 AI 代理人(AI Agent)来对接买方跟卖方的需求。另外,由国内人工智能领域第一批创业者何永所创立的深脑链(DeepBrain Chain)也做数据交易,并且建构一个分散式神经网络平台,通过世界各地的节点为企业提供运行 AI 时所需的算力。前阵子,这两家公司结了盟,创建一个允许在两个平台之间共享数据的框架。
除了上述概念,还有没有其他的可能性,同时改变 AI 也改变了区块链?
把 AI 推论模型搬到区块链
区块链的设计框架决定了一些先天上的弱势,举例来说,区块容量的限制,加上工作量证明需要时间,因此一直有难以规模化(scaling)导致效率较差的问题,所以也催生一些扩容方案。另外,相对于比特币,以太坊可以执行更复杂的计算,并为区块链增加了图灵完备的智能合约,但是以太坊上的智能合约主要是针对短小的程序,访问小量的资源,而不适用于执行复杂的程序。
而 AI 在近几年蓬勃发展下,相关问题也陆续浮现,比如数据跟算法集中在几个科技巨头的手里,同时,AI 游走道德边缘的问题开始受到更多人的关注,在行业里流传着一个“杀熟”的公开秘密,某家知名在线旅行网站,通过背后的算法会将同一张机票以较昂贵的价钱呈现给熟客,如果是新客户查询反而会看到比较便宜的价钱,因为企业就是看中老客户的高黏着度,不会到其他平台消费,所以提供熟客更贵的价格,类似的情况也出现在重量级的电商公司里,虽然这种用 AI 对客户提供差别待遇的商业手段,作恶程度不像发展 AI 武器那样严重,但相信没有一个消费者愿意自己是一只肥羊。
为了想解决上述问题,Cortex Labs 旨在打造一条独立公链,将 AI 推断(inference)模型的运算放上区块链,并利用区块链的特性:数据不可篡改性、运算的公开透明,把 AI 执行过程透明化,并且发展具备学习能力和自我进化规则的智能合约(Smart AI Contract),与目前的智能合约是纯粹基于简单规则(rule-based)与递归调用的子程序集合完全不同。同时 Cortex 链也兼容以太坊虚拟机(EVM)的智能合约。
用更简单一句话解释,就是他们以及 AI 开发者在 Cortex 链上提供一批机器学习模型,用户可以使用链上的智能合约进行 AI 推断。
目标颠覆 AI 垄断、防止作恶
Cortex Labs 首席科学家田甲在接受 DT 君的专访时表示:“AI 世界天生就是一个中心化的世界,区块链是去中心化,但是它缺乏中心化的效率,而 AI 则是有一个效率很高,但是你没法控制的大脑,我们希望利用区块链世界的激励逻辑颠覆中心化的 AI 模式。”
一般来说,打造 AI 系统有两个层次,分别是训练以及推论,Cortex Labs 只选择把“推断”上链,有两大原因,首先,链上“训练”有不可行性,包括网络带宽、同步参数难度以及训练进度共识,都很有难处。
Cortex Labs CEO 陈子祺进一步解释:区块链利用了密码学的特色,就是他给你出一道数学题,在算这个数学题的过程中,你会花很多的工作量来解这道题,解完了之后,你把这结果扔给提问者,他通过验证这个结果来反推你做了多少功,这个概率上是非常准确的。不过,机器学习的训练过程是“对称性的”,如果让结果的验证者和真正干活的人做一样的活,就没有意义,必须得有非对称,所以训练这个过程是没法拿到区块链上,不过在推断这一块是可行的,因为同是属于非对称。
另一个原因,他们想干一件更大的事——颠覆现阶段 AI 过于中心化的现象。
目前有许多的 AI 公司,乐于将部分 AI 方面的研究开源出来,让大家能够一起发展,但不可讳言,有一些公司利用开源资源加上一些自己内部研究的成果,得到了一些新的进展,却基于某些动机不愿意把研究内容开源,“因为 AI 真正有价值的是模型”,导致现今 AI 发展越来越中心化,而且可能还利用小手段来作恶,比如上述的“杀熟”,或是 Facebook 滥用数据。当 AI 一路走向高度中心化后,某些公司就可能垄断行业跟市场。
“AI 如果藏在后面作恶的话,你没有任何还手之力,因为没有办法进到它系统里,看发生什么事,”Cortex Labs CTO 王威扬直言
打造自主化区块链(autonomous blockchain)
所以 Cortex Labs 想做的事,一方面是以区块链解决 AI 作恶、资源垄断的问题,另一个更大的目标就是让 AI 改造去中心化的区块链。田甲指出:“区块链的执行都是非常机械化,不像 AI 比较灵活,能够适应环境,随着环境变化做出反应,像以太坊想升级喊了两年,也没有升级成,所以我们想的是一个自主化区块链(autonomous blockchain)概念,一个可以根据数据调节、有弹性的服务。”
细节怎么实现?根据 Cortex Labs 白皮书,机器学习开发者可以将已经训练好的相应数据模型上传到平台的链下存储层,其他用户想要使用这些模型时,只要支付费用给模型提交者,就能够在模型上进行 AI 推断。此外,每次推断的时候,全节点会从存储层将模型和数据同步到本地,通过 Cortex 开发的虚拟机 CVM(Cortex Virtual Machine)进行一次推断,将结果同步到全节点,并返回结果。
费用的收取比例采用市场博弈价格,类似以太坊中 Gas 的机制,用户每发起一笔交易,执行带有数据模型的智能合约和进行推断需要支付一定的 Endorphin,每次支付的 Endorphin 数量取决于模型运算难度和模型排名等。同时 Endorphin 和 Cortex Coin(CTXC)有一个动态的转换关系,就像以太坊中的 Gas 和 Ether,而 Endorphin 对应的 Cortex Coin 会分成两个部分,一部分支付给模型提交者,另一部分支付给矿工作为打包区块的费用。
此外,用户可以在 Cortex Labs 链上进行和机器学习相关的编程,并且提交一些依赖其他合约的交互,可以实现类似带有人工智能的各种应用。举前阵子在以太坊很火红的养猫游戏—加密猫 CryptoKitties 为例,每一只加密猫的差异主要在于外型,先前 DT 君采访加密猫联合创始人江家俊时,曾询问他未来是否可能在游戏里加入 AI,让小猫变得更个性化?当时江家俊的回答:有思考这件事。Cortex Labs 就举例,用户可以通过编程或是上传 AI 模型,就能让小猫进化,变得有个性,或是把宠物之间的交互变成是动态、智能,会变得更加有趣。
图|用户可以在机器学习平台上发布任务,提交模型,利用智能合约调用模型进行推断,创建自己的 AI DApps。(图片来源:Cortex Labs 白皮书)
涉及交易的应用
“只要涉及交易有关的,都是 Cortex AI 智能合约可能的应用情境,”陈子祺说。以自动驾驶做例子,每一辆自动驾驶车都是一个 AI,各自有不同的驾驶习惯、行驶数据、充放电数据,同时全球的道路规则也不尽相同,在未来众多自动驾驶车上路的环境里,车跟车之间在路上进行通信发生交易,就能以智能合约做为交易保障,在这个过程当中需要的大量数据运算,是一种 AI 的推断运算,而非简单的 CPU 计算。
而车与车之间的交易,除了保险之外,路权的优先就是一种可能。大家都知道开车时遇到救护车、消防车必须礼让,这就是一种路权优先的概念,设想一下当你驾驶自动驾驶车,急着想快点到达目的地,但前方车多挡路,“我赶时间,你不赶时间,我给你一点钱,你车子先让我走,”此类车连网之间的沟通,以付费方式换取更快速的优先路权,其他车就自动避让,就可以通过协议级别保证来完成。
另外,智能电网也可以使用这样的 AI 智能合约概念,电价随时段变化而波动,像是半夜多半比较便宜,因为使用的人少,以电动车充电的情境来说,有人是早上 10 点回家,下午 4 点用车,有人则是晚上 9 点回家,早上 6 点用车,电价多少、充放速度多少等算出多少电费,背后的动态调整机制需要一个透明的算法,同样可以用 AI 智能合约来达成电费的交易。
目前,按照进度规划,Cortex Labs 预计在第三季让挖矿测试链 Bernard 上线,明年第一季智能测试链 Dolores 上线,明年第二季主链 Arnold 创世区块发布。
或许你已经注意到,链的命名 Bernard、Dolores、Arnold 就是热门美剧《西部世界》剧中主角的名字,近期《西部世界》第二季正在上演,出现了机器人对人类复仇的大反转剧情,而 Cortex Labs 能否利用区块链的特性反转人工智能资源垄断的现况,有人认为远大梦想但不切实际,有人则觉得很有机会,一切只有拭目以待。