“深度学习之父”后悔投少了?

“如果 AI 在现实场景中不具备自主性,就没有任何价值,也没有任何意义。” 90 后华人学者陈曦(Peter Xi Chen)的观点一针见血、毫不妥协。

陈曦是美国加州大学伯克利分校的博士、OpenAI 的前研究科学家,他的另外一个身份 — — AI 机器人公司 Covariant 的联合创始人兼首席执行官 — — 如今让他更加亮眼。“就我个人而言,其实我特别喜欢做两类事情,一类是在科研上实现突破,解决科技难题,另一类就是做有价值的事。”

一个多月前,Covariant 刚刚完成了 4,000 万美元的 B 轮融资,正式退出了两年多的 “隐身模式”。消息一出,2018 年图灵奖得主、“深度学习之父” 杰弗里 · 辛顿(Geoffrey Hinton)随即发推表示十分后悔,甚至感叹 “我应该多投资 100 倍”。

(来源:Twitter)

对于此般认可,陈曦表示,“辛顿之所以会看好并投资我们,一方面,他认识我们团队中的很多人,认可我们的实力;另一方面,他在一年前就看过并肯定了 Covariant 的技术成果。”

相比于辛顿的认可,更令 Covariant 吸引眼球的是,这家公司背后的投资人阵容堪称豪华。不仅有感慨 “投少了” 的辛顿,另外一位图灵奖得主、“卷积神经网络之父” 杨立昆(Yann LeCun),华人学者、斯坦福大学教授李飞飞,谷歌大脑负责人杰夫 · 迪恩(Jeff Dean),以及美国科学院、工程院两院院士迈克尔 · 乔丹(Michael Jordan)等诸多 AI 领域的大牛,也投资了这家近几年 “默默无闻” 的 AI 初创公司。此外,国内风险投资机构百度风投也是其投资机构之一。

图|Covariant 的投资人

这不禁让人好奇,Covariant 究竟是一家怎样的科技公司,才能让图灵奖得主在线公开表示后悔?才能吸引如此豪华的投资人阵容?带着这些问题,DeepTech 不久前采访了这位 90 后首席执行官。他的回答,让我们看到了 AI 在现实世界落地的潜在场景和可能性。

大材小用?

Covariant 成立于 2017 年,其创始团队是一名 70 后 “带” 3 名 90 后的硬实力组合。

“70 后” 彼得 · 阿比尔(Pieter Abbeel)是 Covariant 的总裁和首席科学家,是美国加州大学伯克利分校电气工程与计算机科学系教授,是强化学习领域的大牛。

2010 年,阿比尔教授创建了第一个可以折叠成堆毛巾的机器人 BRETT,证明可以解决家用机器人的硬件问题,并入选《麻省理工科技评论》2011 年 “35 岁以下创新 35 人”(MIT TR35)。

图|Covariant 总裁和首席科学家彼得 · 阿比尔

值得注意的是,他还是吴恩达的第一个博士生,阿比尔在攻读博士期间就与导师吴恩达提出了学徒学习(Apprenticeship learning)这一增强学习领域的新概念。

3 名 90 后陈曦、段岩(Rocky Duan)和张天浩(Tianhao Zhang)都是阿比尔教授的学生。首席技术官段岩,在加入 Covariant 之前,也曾是 OpenAI 的研究科学家,而另一位联合创始人张天浩也是实打实的学霸,门门成绩 A 及 A+,且获得了计算机科学和统计学的双学位。

图|Covariant 创始团队,从左到右依次为,段岩、张天浩、彼得 · 阿比尔和陈曦。

但他们选择的第一个应用场景是自动分拣机器人,这着实让人觉得有点 “大材小用” 了。他们使用包括强化学习、模仿学习在内的多种 AI 方法训练机器人,并与机器人手臂、吸力夹持器和 2D 摄像系统结合。

当下,尽管已有很多科技公司将 AI 应用到了翻译、搜索引擎等线上场景,但在现实场景中的应用还比较少。其中一个原因是,现实世界是无序的、没有规律的,将 AI 应用到现实世界会产生实实在在的后果,这就需要 AI 具备很强的自主性。

“把 AI 用在我们的日常生活中,是一件非常难的事。” 陈曦说。

他甚至认为,从一定意义上讲,如今的很多科技公司算不上是真正的深科技公司。“尽管开发一个程序、一款手机软件或者一个网站都不是一件非常容易的事,但也没有那么难,都是有模式和套路可循的。而在 AI 和机器人领域,目前就恰好需要深科技创新,也有相应的市场需求。”

其实,自动分拣机器人并不简单

“我们希望做一件既可以在科学技术上有所突破,也能在现实生活中产生实际应用价值的事情。” 陈曦说。

自动分拣听上去并不是一件很难的事,就是把一个物体从一个地方移动到另一个地方,如果机器人每次只是做一模一样的动作,其实一点都不难。但陈曦认为,这一看似十分简单的应用场景,其实有着很多的复杂性。

那么,自动分拣究竟难在哪里?

事实上,即便是同一个物体,也可能会以不同的姿态出现在不同的地方,导致反光不一样,相机中看到的内容也就不一样。一旦引入到一个无序的场景中,AI 是否可以在每一个场景中都能自主完成任务?这就是困难所在。

“这只是只有一个物体的情况,如果让一个 AI 机器人去处理 10 个、100 个,甚至 10,000 个不同物体时,它就变成了一个非常复杂的问题。” 陈曦说,“当一个机器人需要在现实生活中面对无序、多样的场景时,它就必须具备可以处理从未预料、从未见过的复杂场景的能力。”

那么,为什么自主性对 AI 系统至关重要?无人驾驶就是一个很好的现实案例,无人驾驶至今不能落地的一个原因是,它没有办法在现实世界中具备足够的自主性。

在陈曦看来,一个 AI 系统在现实场景下需要的人工干预次数越多,就越没有价值。虽然做一个 AI 机器人 demo 并不是很难,但如何保证它不需要人为干预就可以长时间自主运作,这是很难的事。“如果不能解决那些不常出现但却可能出现在现实生活中的长尾问题,AI 机器人就不会有很好的自主性,就不能产生真正的、很大的商业价值。”

陈曦认为,如果有一款自动分拣机器人可以完成 10 万种甚至 100 万种商品的自动分选,就不能说存在 “大材小用” 的问题,“因为这个事情确实比较难”。

同时,将自动分拣机器人作为首个应用场景的另一个原因是,虽然我们要求自动分拣机器人在仓储物流环境下具备一定的自主性,但相比于无人驾驶,这一要求相对较低。

“如果无人驾驶汽车每小时出一次错,是不可能商用的。” 但如果一个自动分拣机器人在运作一小时后,把某个物品弄掉了,只需要有人把东西捡起来,并不会出现大的问题,“是可以接受的后果”。

将 AI 机器人应用在仓储物流中是一个难度适中的问题,但并不简单,“要让分拣机器人几个小时都不出错,不需要人为干预,这也很难,需要解决很多 AI 问题,但并没有无人驾驶那么难,因为它的失败成本比较低。”

“这是一个既可以进行深科技创新研究,又可能实现商业落地的场景。” 陈曦说,他们的 AI 系统还需要在实际生产过程中继续收集数据,作进一步学习。

抓取准确率高达 95%

目前,Covariant 已与顶级工业机器人公司 ABB 和世界前十的仓储自动化提供商 KNAPP 建立了合作。

“每次只要涉及到抓取不熟悉的物品时,最擅长的总是 Covariant Brain。” ABB 全球服务机器人技术总监马克 · 塞古拉(Marc Segura)如此评价道。

去年,为寻找可以帮助其实现仓库自动化的公司,ABB 向 Covariant 等多家公司寄送了各种适用于其系统的物品包装箱,对各家公司进行受控实验测试。据塞古拉表示,Covariant 是唯一能够在没有任何失误的前提下,成功抓取各种类型包装箱的公司。

此外,另一个合作伙伴 KNAPP 也对 Covariant Brain 的表现印象深刻。KNAPP 创新发展副总裁彼得 · 普切温(Peter Puchwein)表示,Covariant 的机器人可以抓取透明袋子中的物品,甚至连摄像机都很难去识别这些物品。“即便对于人类来说,如果一个纸箱里有 20 个用透明塑料袋包装的物品,也很难精准地把其中一个物品拿出来。”

如今,Covariant Brain 在自动化仓库中表现出色,它的准确度达到了惊人的 95%。但陈曦认为,Covariant Brain 还不完美。“一方面是 AI 系统需要更多的训练数据,另外一方面是机器人的机电一体化约束太重,或者说机械夹具没有可以抓取的地方。”

在完成 B 轮融资后,Covariant 希望将这笔资金用于探索 AI 在其他领域的应用,比如密集型制造业、垃圾分类回收等,同时也将雇佣更多的产品经理及工程师,进一步提高公司的产品化及大规模产品部署能力。

“在仓储物流领域,除了商品的拣取,还有很多其他方向的应用,我们会继续拓展应用场景。” 陈曦表示,他们近期将重点关注机器人操纵,短期内不会触及无人驾驶领域。

“我们只卖 AI 软件”

他们的商业模式也很简单,只卖 Covariant Brain 这一 AI 软件。

“我们会与少量的潜在伙伴合作,让这些合作伙伴在 Covariant Brain 上开发完整的机器人解决方案,不断实现拓展。” 陈曦表示,这样的好处在于,Covariant 可以快速获得合作伙伴的行业知识。

比如,KNAPP 是一个世界前十的仓储自动化提供商,他们可以将几十年的仓储自动化经验带进来,借助 Covariant Brain 这个平台开发出一套完整的机器人解决方案;与 ABB 的合作也是如此,他们有几十年的工业自动化的经验,是世界前三的机器人本体制造商。

谈及未来对 Covariant 的期望时,陈曦表示,从商业层面讲,他希望可以把 Covariant Brain 应用到多个不同领域,并在每个领域内有不同场景的渗透,进而推动机器人自动化的进程,缓解劳动力稀缺的痛点。

从技术上来讲,他们会继续针对实际生产环境中遇到的问题进行创新。