7月5日,百度AI开发者大会(英文名称:Baidu Create 2017)到来, 汇聚了全世界的AI开发者。这是中国工业史上第一次大规模的AI开发者大会,未来将每年夏季定期召开。
当天上午的主论坛在科技、互联网圈乃至汽车圈频频刷屏。而当天下午的重头戏之一——AI技术与开放平台分论坛,以“开放创新 共襄AI未来”为主题。
如果看过前天的百度开发者大会,相信你也会和我一样,认为“开放”可以算作百度整个AI战略最重要的关键词之一。百度人工智能开放战略一直是延续的,从技术、战略和人才这三个层面看,这个选择大概率是正确的。这也是谷歌、亚马逊这样的国际AI巨头们正在做的决策。
百度AI“开放套餐”已经到了能力溢出阶段
作为百度AI技术平台体系(AIG)总负责人,百度副总裁王海峰在分论坛现场表示:
“百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎及百度各产品的用户需求、数据和平台,支撑了百度AI技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。”
百度此次开放了5大类目的14项核心技术。覆盖语音、视频、增强现实、机器人视觉、自然语言处理等各个领域,能够满足开发者从API、源码、数据、计算能力等多个层次的需求。
之所以会选择开放,主要还是因为百度人工智能成熟度足以开放给行业使用,而且技术领域覆盖也比较完整,有能力为开发者提供“套餐”,而且已经处于能力溢出的阶段。
这几年来百度在人工智能领域的深入研究,也决定了百度无论是在横向(人工智能的领域)以及纵向(人工智能各个领域的深度)上都达到了国内顶尖的水准。
用王海峰的话来说,百度的AI能力分为四层。
在基础层,是AI算法、大数据、大计算能力。感知层,包括语音、图像、视频、AR/VR等技术。认知层,有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度AI开放平台开放。而百度AI开放平台上开放的技术能力总共有60个,是最全面的AI技术开放平台。
随着越来越多行业(汽车、物流、电商、服务业)的进一步深入,都必须用到AI能力,对于开发者以及创业者来说,很多时候对于AI技术的运用往往是组合式的,以智能家居企业为例,一旦要尝试使用AI,那么不仅仅需要用到人脸识别,还要语音识别等技术,涉及到的技术点就包括了图像识别、自然语言处理等。
尤其是像无人车这样的技术更是如此,这背后是无数人工智能技术复合的载体——导航时需要用到语音识别、语义识别技术,自动驾驶时需要用到机器视觉技术。
如果没有这样的人工智能企业在背后做支撑,很多企业的智能化设想几乎没办法推进,效率也无法提高。
考虑到人工智能领域的创业者越来越多,百度也是选择把自己的能力开放出来,给创业者使用。重要的是,百度的AI覆盖领域也足够全面。
百度AI开放平台覆盖了各行业的合作伙伴,百度集团总裁及COO陆奇介绍说,百度做了一系列的行业解决方案和生态合作方案,从智能客服到智能销售、智能大脑、出行大脑、医疗大脑、教育大脑等等。
对于创业者和开发者来说,这样一个平台,是一个万能的“工具箱”,有需要就可以从里面掏出最适合自己的工具。
开放将推动人工智能技术、产品、生态得到完善
“工具箱”当然仅仅只是一个层面的目的。事实上,技术开源是一个大趋势,人工智能不可能靠一家公司来推动。
李彦宏在这次开发者大会上说到这样一句话:
AI时代是属于开发者的时代,因为有太多技术需要去提升和应用。把这些技术应用在任何领域,都打开了无数的可能性。但是互联网时代的个人英雄主义行不通了。
开放这也是所有人工智能巨头的选择。2015年谷歌曾开源TensorFlow,这是谷歌基于DistBelief进行研发的第二代人工智能深度学习系统,可以应用到语音识别、自然语言理解、计算机视觉和广告等领域。亚马逊在后来也开放了自家深度学习框架MXNet。
百度的开放策略与其相比,优势还是在于更容易学习,也更便于开发者使用。像PaddlePaddle这样的人工智能开源平台仅需少量代码就能训练深度学习模型,大大降低了用户使用深度学习技术的成本。
降低学习成本的效果是显而易见的,这会带来四个结果:
1、借此构建起一个以自身为核心的生态系统
有能力的巨头建立生态,从AI技术、整体解决方案、云平台,到硬件和产业都有完整的布局。在这个生态系统中,开发者、创业者不仅仅用自己的工具,还用自己的标准和语言。不同的人工智能开源方案对感知层面的技术、学习与训练计算都有差异。人工智能计算能力的调用,将来可能会作为API直接被打包在整体解决方案甚至硬件中。
2、可以获取到更多数据,并且让算法更加精确
在各个垂直领域的开发者和平台对接后,复杂的数据结构会被传输至人工智能神经网中进行分析和处理。之所以要开放自家平台,核心目的还是要不断用实践数据不断去“喂饱”自家的人工智能,让它的算法更精确,尤其是在各个垂直领域的开发者和平台对接后,不仅能够让自家业务有精确数据进行指导,反过来也可以继续调教平台的准确性。
3、真正和具体行业结合在一起,产生更多研究成果
如Android开发者平台使APP开发者有统一标准可以参与开发一样,人工智能的开发工具和相对标准的开源硬件的成熟,若能形成云端智能和终端智能打通的工具平台,普通开发者参与开发难度降低,生态发展会大大加速。
在人工智能领域软件系统开源同样会是常态,多家巨头都将自己的人工智能系统开放出来,也已有巨头在硬件开源方面进行尝试,这有利于业内更多的企业和工程师参与人工智能领域的研发,产生更多有价值的研究成果。模型与基础算法并非核心竞争壁垒,结合行业数据的使用才产生巨大的价值。
AI开放策略还将会吸引、培育更多专业领域人才
福布斯在6月21日发表了一篇名为《These 20 Leading TechnologistsAreDriving China's AI Revolution》(这20个人领导了中国的人工智能革命)的文章,20位领导者有7人在百度任职,3人曾在百度任职,也就是说,20人一半来自于百度。
百度之所以会成为中国甚至是世界人工智能的黄埔军校,核心原因就在于这里汇聚了一批优秀的“教官”,这些“教官”有自己的一套“教材”,能够不断确定标准,并且基于这套“教材”培育出新的人才。
所谓的“教材”其实就是开源人工智能,把自家语言、标准制定出来,作为标准提供给开发者使用。
谷歌公开自家系统的重要目的之一,就是要是吸引到更多的人工智能专家,来为软件的改进和应用出谋划策,英国布里斯托大学的人工智能教授克里斯蒂亚尼曾分析:
“谷歌此举并不是昏了头。深度学习不是即插即用,它需要做很多测试、调整和适配工作。这类系统有数百万个参数需要调整。如果没有工程师进行这一工作,那么谷歌这次放出的深度学习算法用途就极为有限。”
这样的分析过程实际上也是在为行业确定一套通用的语言。当然,这套语言是否简单、易懂,便于操作也是重要因素之一。
所以百度杰出科学家徐伟曾经谈到,让开发者决定使用哪个平台进行开发的决定因素主要包含几个方面,首先是该平台能否实现自己想实现的功能,其次是使用某平台实现起来的难度有多大,最后是效率有多高。
就像对于程序员来说,如果选择了更为流行的编程语言,就会有更多可使用的库,也能更轻松的做出好的产品。纵览程序语言的发展历史,最为流行的,总是最容易上手的。就像前文中所说的,百度的优势则在于,它的平台更容易学习。
谷歌、百度、亚马逊开放自己的平台,其实也是希望开发者尽可能使用自己的语言,尤其是这次百度把覆盖语音、视频、增强现实、机器人视觉、自然语言处理5大类的14项核心技术全面开放出来,目的就是在于方便开发者开发出优秀的产品,甚至让人才围绕着自家标准进行开放。
人工智能开源上的竞争,也在重演编程语言的历史。作为国内人工智能领域最早的开源者,百度实际上也是为国内所有在人工智能领域的开发者制定了一套标准。百度举办这样的开发者大会,不仅仅是在为制定“教材”,更是在为中国人工智能行业培育人才。
作者:深几度,转载请保留版权内容。