日前,麻省理工科技评论中国、DeepTech 联合 COLMO AI 科技家电举行的一场线上 TR35 青年科学家分享会圆满落幕,已累计吸引超过 10 万在线点播。
这次分享会主要围绕 “ AI 重构未来 ” 的主题展开,针对新基建浪潮、市场环境变化、AI 芯片、机器人、AI 技术产业趋势等时下热点,邀请了来自投资机构、学术界、产业界的多方专家精英进行了专业分享和讨论。
本次活动的嘉宾阵容包括韩国成均馆大学教授、美的集团洗衣机事业部研究院院长高弘锡,上海交通大学研究员、博士生导师、非夕机器人首席 AI 科学家卢策吾,快手 AI 平台部、Ytech 西雅图人工智能实验室、FeDA 商业化智能实验室负责人刘霁,赛灵思人工智能业务高级总监、前深鉴科技联合创始人兼 CEO 姚颂, 瑞莱智慧创始人兼 CEO 田天,真格基金投资总监尹乐等。
嘉宾在观念的交流与碰撞之间,为我们展现了 AI 领域最新的技术走向和市场趋势解读。
智能家电正在告别 “ 伪 ” 智能
美的集团洗衣机事业部研究院院长高弘锡表示,近年来,随着智能家居、智慧生活概念的火热,很多厂家都开始跟风把物联网、语音交互等技术跟家电产品进行简单结合,这给消费者造成了不少认知上的偏差,很多产品并没有从实用和体验层面出发给用户生活带来切实有效的改变。
真正的智能家电还是应该从产品最本质的核心使用功能出发,基于 AI、IoT、大数据等最新的技术,在最能改善用户使用体验的环节进行精细化研究和系统性提升。
图|美的集团洗衣机事业部研究院院长高弘锡(来源:COLMO)
现在,全自动洗衣机几乎已成为家庭标配,但很多最基本的问题一直没有被很好解决。例如,一堆衣物是否可以混合在一起清洗 ?这些衣物是什么材质应该选择什么洗涤模式 ?洗这些衣物需要匹配怎样的洗涤液的和用水量 ?用户通常的做法是把一堆衣服一股脑塞进洗衣机滚筒里,选择一个标准模式,洗成什么样算什么样,这种情况不仅废水废电,衣物也得不到最佳的洗涤效果。
COLMO 智能洗衣机针对这些用户痛点,研发了专门的多神经网络模型、柔性物体类型识别技术、基于图像语义分割的多模型融合的衣物重量和颜色识别技术,以及基于大数据的动态参数自适应匹配技术。
图|洗衣机智能系统(来源:COLMO)
用户无须在衣物中添加额外的标签,也不需要分开逐件投入,洗衣机就可以准确地将滚筒内的衣物和背景分离进行有效识别,在 1 秒内可识别得出衣物重量、数量、类型、材质等信息,在衣物混合洗的情况下,目前视觉识别技术准确率也能达到 85% 以上。
此外,云端系统利用深度神经网络算法对图像进行分析,可识别出洗衣机内部衣物量的多少及当前桶内衣物是否需要护色,把分析结果反馈给洗衣机做出智能匹配决策,对于每次都不相同的洗衣场景,COLMO 洗衣机可基于已积累的用户体验数据和实验室专业数据自适应调整洗涤参数,同时辅以洗衣机的水流和洗涤节拍控制技术,实现精细化洗涤。
因为这些技术创新,COLMO 洗衣机有幸成为了首个获得吴文俊奖的白色家电品牌,经第三方评测比较,充分利用AI技术的智能洗衣机,在用水、用电、耗时等方面实现大幅的改进,不仅可以普惠消费者,更能实现节能环保的社会价值。
机器人的 “ 通用智能本体 ” 研究更进一步
上海交通大学研究员、博士生导师、非夕机器人首席 AI 科学家卢策吾介绍了智能机器人行业的“通用智能本体”研究,该项目研究论文被 Nature 机器智能子刊录用,也在中国工程院院刊上进行了发表。
在当下的机器人技术环境下,每一个任务都要单独去设计一套软硬件系统,而反观人类,人是一个通用的智能本体,可以把一项技能以非常低成本的方式,在各种活动和任务中去迁移执行;另一方面,机器人在未来会去执行各种各样无穷尽的任务,如果每一个任务执行方式都需要单独的定制开发,整体成本是巨大的,且机器人执行任务的变化空间较大,有没有一个统一的模型或架构能够在机器人中通用?这便是通用智能本体的研究重点。
图|机器人的关键动作任务分解(来源:卢策吾)
通用智能本体应具备怎样的特性?卢策吾认为主要有三点:1、可迁移性。在执行大多数任务时,无需更换本体,用户只需提供简单的任务描述,无需重新设计底层通用硬件,协议和操作系统;2、可扩展性。和通用计算机的模块(CPU,RAM)一样,各个基本模块相对独立,且可升级;3、可群智性。面向群体智能,知识可增长,经验可共享。
在这样的思路基础上,卢策吾把通用智能本体研究分为 5 个模块:感知模块、知识引擎、任务编译器、决策处理器、执行模块等,并可以把操作任务解析(parsing)为一系列 “ 元操作 ”,即不能再分割的基本操作,比如抓取、插、拔、推等。
图|通用智能本体的核心模块(来源:卢策吾)
由此,可以将机器人的一个任务分解成连续的元操作流,很多元操作其实有较强的共性,比如插入电源插头跟在工厂里插入一个零件的力学模式和视觉模式是很相似的,所以机器人动作有能迁移的可能性,又比如让机器人拧开一个药瓶和拧开一个水瓶,机器人动作的执行流程和逻辑都很接近。
所以,机器人在行为理解上的一系列工作可分为几大步骤,例如图像视频主结构提取、异常事件检测、行为视觉关系提取、动作分类等。
在机器人行业,AI 技术的应用也有很大的局限性,比如依赖深度学习,算法面对没有见过或者训练过的数据它就难以识别进行下一步的操作。例如,我们想要告诉机器人这是一把剪刀,只能通过大量的图片数据训练告诉它长成这个样子的物品就是剪刀,这仍是一个模式识别的弊端,机器人并没有真正理解剪刀的概念和交互操作方式。
卢策吾认为,基于有泛化能力的元操作集合,通过与物体交互操作,智能体对物理世界( 特别是操作对象 )会产生更加深刻的理解,而以元操作为基本单位建立统一协议,能为实现本体之间经验共享的群体智能打下基础,未来有望在工业、餐饮、医疗、家用等诸多机器人领域应用。
AI 中台正在成为企业驱动器
来自快手 AI 平台部、Ytech 西雅图人工智能实验室、FeDA 商业化智能实验室的负责人刘霁讲述了 “ AI中台 ” 在快手公司内部的实践。
中台的本质就类似是一个公司内部的共享经济,公有的部分通过中台的开发来完成,其余多条的业务线共享中台的能力。让开发产品的人员只需要关心产品相关的算法设计,或者模型设计,而不太需要去关心数据是怎么存储的,数据特征怎么提取以及在什么地方训练等问题,这些问题都可以通过AI中台来进行开发管理。
图|数据中台和 AI 中台的架构设计(来源:刘霁)
具体而言,中台在企业内部可以分为两类,数据中台和 AI 中台。从另外一个维度讲,中台可以共享三方面的内部能力,包括数据、计算资源、软件服务的共享,这不仅可以打通公司内部的数据壁垒,也能够提高各项资源和开发成果的利用率。
图|AI 中台的具体功能模块(来源:刘霁)
目前在快手内部,AI 中台就类似于是一个一站式的 SaaS 平台,主要包含三个层次:首先是硬件基石,目前公司管理着成千上万的 GPU/CPU/FPGA 计算资源,如何高效利用调度这些资源为业务提供服务是很有必要的;其次是软件工具,比如深度学习的通用训练和推理、AutoML、通讯库、模型压缩等功能;最后一层是平台服务,提供通用化或定制化的业务服务,比如快手软件背后定制化的海外异地推荐系统,让模型大小从 TB 降到了 GB,带宽需求减少了一个量级。
AI 中台的设定提升了快手内部的商业效率,让快手的技术水平在业内保持着领先。
国产 AI 芯片的难点仍在于打造完整产品链
赛灵思人工智能业务高级总监、前深鉴科技联合创始人兼 CEO 姚颂现场针对 AI 芯片赛道分享了自己的一些观点和看法。
AI 覆盖广泛的各类算法,所以 AI 芯片的定义也十分宽泛,能够支持一定 AI 算法计算的芯片就可以称为是一颗 AI 芯片。AI 芯片可主要划分为 4 个象限:推理、训练、云端、终端。
从芯片设计的角度来讲,AI 芯片并没有那么难,因为它只针对特定的神经网络和算法,相比通用型的 GPU 与 CPU 芯片设计难度要小很多 ,但 AI 芯片的难点在于打造完整的产品链。
图|AI 芯片的类别(来源:姚颂)
AI 芯片企业怎样建立起一个壁垒形成自己的技术优势 ?这其实是一个非常庞杂的技术堆栈问题,在应用层下面需要有一些算法库,有软件、编译器、操作系统等,然后芯片的指令集设计,IP和微架构的设计,再到芯片的实现和整个系统的设计。
跟 CPU 芯片不同,由于其通用性和多年生态开发,设计时无需考虑上层软件与应用,也无需考虑系统设计,但是对于现在 AI 芯片则截然不同,因为它的应用场景非常广泛,也需要支持机器学习、深度学习或支持某些神经网络,所以一定得跟上层的软件跟上层的算法打通。
因此,对于 AI 芯片企业来说,系统层面的复杂度是非常高的,必须要知道应用场景是怎样的,才能够去把芯片定义好,做出来之后才能真正用起来,需要对上游和下游都非常了解。
AI 芯片的成功远远不止是芯片本身设计那么简单,以 Nvidia 的 GPU 为例,基于 CUDA 生态打造的无数软件与算法库才是其成功的关键,背后是一整套非常庞杂的软件体系,而且资源非常丰富,这是 Nvidia 真正壮大起来的护城河。
图|芯片研发成功的关键环节(来源:姚颂)
AI 芯片要经过让客户能用、好用、爱用、离不开几个阶段,更多还是要靠基于芯片的软件生态,AI 芯片企业不仅要实现芯片的性能提升,而且要解决芯片能够非常便捷的让用户使用起来的问题。从大的行业来看,AI 芯片只是安防、自动驾驶、智能终端产品系统中的一个组成部分,用于终端推理的 AI 芯片必须更多地去结合应用场景。
现在对于 AI 芯片行业来说正处于一个新的拐点,前些年整个行业稍微有些下滑,芯片这个行业的迭代周期跟互联网行业差异很大,它可能需要几千万美金的前期投资,两年左右才能有一个迭代周期,因此需要企业更有耐心地打磨技术做长线发展规划,AI 芯片在趋势上仍是一个非常有影响力、市场空间非常大的产业。
AI 产业走向深水区,安全可控不容忽视
瑞莱智慧创始人兼 CEO 田天针对 AI 技术大范围应用潮流下的 “ 安全可控 ” 问题进行了分析探讨。
人工智能已经成为了新一代产业变革的核心驱动力,近些年来,随着深度学习的不断成熟,AI 在包括自动驾驶、医疗诊断、以及人脸识别等各个领域越发普及,不过相关的安全性、可靠性问题也频频发生。
比如基于深度学习对抗样本的漏洞,添加少量噪声,识别模型就会出现极大偏差;自动驾驶车辆在道路上识别出错造成人员伤亡;AI 换脸的技术滥用、利用AI技术合成虚假视频、虚假音频的案例以及侵犯用户数据隐私的问题,这都促使世界各国已经开始推出关于人工智能治理,以及人工智能合理发展的系列法规以及规划。
图|常见的 AI 安全风险问题(来源:田天)
目前已经普遍使用的一些人工智能系统,包括搜索引擎、推荐系统、数据挖掘系统、语音识别、视频分析等等,有一个共同的缺口就是使用者实际上对于安全性没有极高的要求。但在我们推动人工智能进行深度应用时,特别是与金融、医疗、交通等领域相结合的情况下,人工智能算法我们是不能容忍它出现任何严重错误的,稍有差错就有可能导致非常恶劣的后果。
因此,瑞莱智慧目前在打造 RealSafe 人工智能安全平台,致力于从模型安全检测、防御解决方案、对抗样本体验等方面提升 AI 应用的安全可控性。人工智能行业大部分从业者都在围绕数据、算法、算力等领域进行提升,但实际上随着人工智能大范围的应用,它的安全性应该是很核心的一部分。
图|圆桌讨论,由左至右分别为尹乐、姚颂、田天(来源:DeepTech)
真格基金投资总监尹乐在最后的圆桌环节与姚颂、田天两位嘉宾针对“新基建”背景下的人工智能产业趋势进行了讨论。
姚颂认为,新基建是整个国家高新技术产业发展的推进器,整个人工智能产业肯定也会从中受益,具体到细分领域,他比较看好智能交通新一轮的发展,包括自动驾驶、辅助驾驶、智能车联网、车路协同等都会得到显著进步,还有芯片领域,如果国内企业能拿出足够好的产品,芯片的国产替代可能接下来会掀起一波热潮。
此外,田天补充说,新基建其实是对旧基建的一种升级,并不是全新的领域,在这样的政策推动下,工业互联网进程势必也会进一步加速,而整个 AI 市场早期的试水和管制相对比较粗放,行业对于 AI 安全性和可靠性的研究今后必定会越来越迫切。
也许强人工智能时代何时来临的节点我们难以预测,但我们可以看到的是,随着 AI 在各行各业的深入应用,我们对于 AI 技术的探索正在不断创新中日渐走上新的台阶。