近30篇论文被AI顶会接收背后|对话腾讯优图吴运声

现在,人脸识别已经可以用来支持安检、检索手机、进行支付等,当我们正日益习惯这项技术的存在以至于觉得这是一种自然而然的日常体验时,还是会有人会因为这个技术迎来完全不同的人生走向。

近日,腾讯守护者计划利用优图跨年龄人脸识别技术,在海量的数据库中搜索比对,最终帮助一位寻子 10 年的父亲重新找回了孩子。

因为此事,作为腾讯 AI 三大部门之一的优图也“高调亮相”马化腾微信朋友圈。

和此前优图对外展示的一些商业应用不同,这一次,马化腾朋友圈配文“科技向善”,显然已将优图这个项目作为腾讯这一新理念的践行典范。

(来源:互联网)

一直以来,腾讯优图都在为腾讯的各项服务提供 AI 能力支撑。今年是优图成立的第 7 年,伴随着腾讯将技术战场从消费互联网延伸到产业互联网,这支主攻计算机视觉的研究团队也在发生着一系列的变化,例如在云与智慧产业事业群成立后,归属到这一产业互联网战略产物的旗下;例如团队的学术研究输出在今年迎来新高,CVPR 接收了来自优图的 28 篇文章;同时,这些研究也越来越多地和产业应用相结合(此前,业内有声音认为,部分企业的 AI Lab 只负责输出论文,并无将研究落地产业的机会和价值)。

在近日的腾讯数字大会上,DeepTech 对话优图实验室总经理吴运声博士,他于 2012 年从零开始搭起了优图实验室。现在,优图实验室正在以计算机视觉 AI 技术为核心,专注人脸、人体、交通、医疗影像、自动驾驶等视觉领域的前沿研究和产品落地,已经产生了 12 种 AI+行业解决方案,接入超过 70 项腾讯产品业务合作,覆盖零售、安防、金融、文旅、工业、医疗、汽车、教育、社交娱乐等领域。

接下来,优图实验室将在腾讯宏大的产业互联网上发挥什么样的作用,其AI能力又将如何输出到这张网上,从这次对谈中我们亦能一窥一二。

图丨优图实验室总经理吴运声 (来源:2018中国计算机大会)

DeepTech:在行业内,腾讯优图相较其他竞争对手的优势在哪里?

吴运声:首先是在腾讯内部,我们的技术就可以有很多的应用,例如说用在 QQ 上,在 to B 这一块,腾讯优图会结合腾讯云应用到产业中,形成跟 AI 相关的生态。到现在为止,我们已经发布了超过 12 个行业解决方案。

所以,我们的一个优势在于解决方案上可以和腾讯云无缝对接。我们在整个的解决方案上,AI 只是一部分能力,我们整个云的解决方案还包括很多腾讯其他的能力,比如说大数据的能力、企业微信的能力。

和一些行业里的初创公司相比,他们团队规模可能可以让其在某些点上更快地反应,而腾讯优图更偏向于在整个大体系上关注一些更加完整的解决方案。相较于优劣势的说法,我认为这更能说是各家各有特点。

DeepTech:超过12种的产业解决方案,部署最多或者商业价值最高的是针对什么场景?

吴运声:具体的数据上我没有关注,但其实各个行业我们都在关注,比如说一项简单的技术适配的是手机上常用的功能,那么它每天的调用量就会非常大。但是像跨年龄识别,这种调用量非常小,但是你不能说它不重要。

DeepTech:优图现在更倾向于 to B、to C 还是 to G?

吴运声:优图是做底层技术支撑的,这三个方面的解决方案我们都有涉及。

to C 上,我们有应用在 QQ 音乐、美图、直播场景中的方案;在 to B 里面,有零售、医疗,在 to G 上,我们有智慧建筑、安保、交通、智慧社区的解决方案,所以从我们的角度来讲,腾讯优图其实并不明确区分自己是 B、C 还是 G 的属性。

而且,B、C 两端也有互通的地方,比如说我们的直播技术,现在在整个的市场占有率是非常高的,但是这个技术是通过腾讯云输出的。我们大部分的 AI 能力都已经搭载到腾讯云上。

图|大会的优图展区,其中展示的智能硬件是一款打包了优图视觉识别算法的硬件模组(来源:DeepTech)

DeepTech:在学术研究上,今年 CVPR 的大会腾讯共有 58 篇论文被接收了,总数应该是比去年翻了一倍多,其中优图有 28 篇论文被接收,这是怎么实现的?是人员招募上有了很大进步吗?

吴运声:应该是我们各方面整体的提升,包括优图的研究越来越深入,越来越扎实等。

而且就像我刚才提到的,随着优图的技术落地到各个行业,这个过程中就会发现越来越多的问题,我们必须想方法去解决这些问题。去解决问题,自然而然就可以提炼出一些创新的点,所以才有了这么多论文。

DeepTech:今年很多 AI 顶会都收到了非常多的论文,但是有声音认为其实大家都在做差不多的东西,比如说都在用深度学习,由此产生了对创新的多元性缺失的忧虑,你怎么思考这个现象?

吴运声:我并不认为这会扼杀创新性,大家可能都在用深度学习,但实际上是可以有不同的网络,不同的结构,还有不同的思路。

其实,现在除了深度学习之外,我们也已经有很多其他的研究方向。比如 AutoML,自动化机器学习,也就是机器不需要太多的人工调参就能够完成机器学习。现在还有很多新的方向值得探索,已有的方向也还有很大的改善空间。

比如说我们最近也在尝试做工业检测,针对流水线上的产品检测瑕疵,判断它是不是次品。我们最近也在研究集装箱的检测,例如是否有破损生锈等等。计算机视觉领域还是有非常多的问题没有得到解决或改进。

DeepTech:对于计算机视觉领域的青年学生来说,您认为他们适合加入优图,还是去一些初创公司?

吴运声:人各有志,但在腾讯优图,我们能够提供非常好的计算机视觉基础设施、计算资源,以及整个平台的资源非常好。而且,腾讯有比较多的落地场景,能够很好地把技术落地到各个行业,带来价值。

(来源:DeepTech)

DeepTech:腾讯最近提出了“科技向善”,但最近的一个新闻可能也在预示这个理念实践起来的难度,即美国旧金山成为全球首个禁止使用脸部识别技术的城市。您怎么看这种冲突?

吴运声:技术在发展的过程中需要考虑人们怎么去使用这些技术。

腾讯优图一直在技术的使用过程中有非常明确的底线,即有些东西是可以做,有些东西需要非常坚守自己。

所以在很多科技向善的尝试中,虽然它可能不带来收入,但是我们反而会更加的关注。例如优图最近做的跨龄识别,去帮助公安寻找走失儿童,去帮助特殊的群体做手势识别等等,在我们的跨龄识别项目中,腾讯是和公安合作的,已经不是一个单纯的企业行为。

这些我们都希望能够做得更深入一些,有更多的这样的尝试,包括我们的技术在医疗领域的合作。在医疗 AI 上能够做到更普惠大众。现在一些创业企业已经在 AI 影像上因为找不到商业模式而退缩了,但是腾讯是还有资源继续去做这件事情,也因为它对我们来说能带来价值。

DeepTech:马化腾在朋友圈转发优图跨龄识别的消息,也为此配文腾讯的新理念“科技向善”,是优图做的一系列事情让腾讯有了新的思考,还是说在这个理念指导下你们有了这些行动?

吴运声:其实科技向善是我们一直在推崇和遵循的价值观。找寻走失儿童只是科技向善的一系列案例中的一个。我们还有其他的项目,像是用 AI 连接食物、能源、水,这三个词就是和人类最基本生存问题去结合,这些努力都是之前已经在做,包括我们之前在医疗这一块和很多医院的合作,其实也都是在践行这个理念。

DeepTech:所以科技向善这个理念会主要由 AI 这边的优图来践行吗?

吴运声:这件理念并不强调优图是行为主体,应该是整个腾讯都在做这件事情。