近日于上海举办的世界人工智能大会,可谓集结了全中国乃至全世界最主要的 AI 企业,其中更不乏一些行业风向标公司,例如谷歌,分享了其 AI 框架 TensorFlow 的最新进展。
回顾机器学习的发展,其之所以是 AI 技术中获得长足发展的一大方向,得益于数据、算力、算法的到位,基于机器学习的应用已在现实社会中带来了广泛的影响。
在这三个方面,各类学科中的各种数据集已成为机器学习系统的燃料,例如,Open Images Dataset 就是一个由涵盖数千个类别的超过 900 万张图像组成的数据集。为了实现更好的计算,企业争先开发出专用于机器学习的计算硬件,以谷歌为例,最新的 TPU 达到 420TFLOPS 峰值计算能力,比 90 年代的超算还快数倍,大量 TPU 还可以形成集群。算法模型的进展也不可忽略,同样以谷歌在自然语言处理上的突破来看,从循环神经网络、Transfomer,到可以结合上下文理解词语的 BERT,到今年再超过 BERT 的 XLnet,模型的进化也越来越快。数据大爆炸就更不用说了,而 TensorFlow,简单来说就是这三者的连接器。
向端侧进化的框架
TensorFlow 自 2015 年开源以来,和深度学习应用在各行各业遍地开花的趋势紧密绑定,已经成为 AI 研究人员必备的基础设施之一。
根据现场发布的最新数据,TensorFlow 在全球范围内已经有了 4.1 千万的下载量,超 9900 的代码改动请求。作为最成熟的 AI 框架之一,它对中国开发者和企业来说也颇具吸引力。
但是目前深度学习框架不止 TensorFlow 一个,如 FaceBook 的 Caffe、百度的 PaddlePaddle,都已经展现出一定的后发制人趋势。包括华为也在 AI 计算框架上开始有了较大的动作,推出了新的计算框架 MindSpore,以求借助其拥有的移动终端产品优势吸引开发者。
那么,TensorFlow 团队将如何面对新的市场变局的出现?
针对这一问题,TensorFlow 全球产品总监 Kemal El Moujahid 在接受 DeepTech 采访时表示,目前 TenorFlow2.0 版本是团队工作的重点方向,该版本的特性是易用、强大、可扩展,其中两个具体的改进方向分别是易用性的进一步提升和针对端侧的适配优化。
图|Kemal El Moujahid(来源:谷歌)
“我们的目标是让更多没有接触过机器学习的人,能够轻松使用这个工具,解决他们生活中或者所处行业的问题。这也是我们强调 TenorFlow 2.0 重要性的原因。
我们要加大投入的第二个方向是端侧,即将在移动端继续发力。我们认为移动端是机器学习未来非常重要的方向。随着越来越多小型移动设备的普及,现在其规模已经达到约 55 亿台移动设备、2500 亿个微控制单元。在此基础之上,机器学习的应用场景非常高。在未来 TensorFlow 将重点关注这个方向,希望可以让 TensorFlow 更加轻量化,将机器学习带到端侧更多领域”,他说。
和发力端侧配套的一个判断也来自于 5G 的崛起。Kemal El Moujahid 称,5G 将对机器学习和 TensorFlow 的发展产生很大的影响,因为移动端是非常重要的领域,但是 5G 也不能够解决所有的互联和使用方面的问题,比如频段问题等。
Kemal El Moujahid 也表示,各大公司在计算框架上取得进展的局面有利于整个行业的发展:“我们非常乐于看到行业取得发展。现在,全球范围来看,虽然机器学习和 AI 的普及度还处在初期阶段,但是我们不能忘了最终的目标:在全球推广普及机器学习和 AI。所以,我们现在能做的就是提供最好的应用和最好的技术平台,让整个应用场景可能性更多,普及速度更快。”
他透露,就目前全球下载量和社区发展的良性度来讲,团队取得了非常好的进展。
(来源:DeepTech)
医疗应用仍待爆发
当天论坛展示的 TensorFlow 应用的几大方向,分别为使用 AI 打造更实用的产品、将 AI 用于社会公益事业、构建 AI 驱动的应用。其中,谷歌翻译的即时相机翻译正基于 TensorFlow 实现对于图片的机器翻译。
在利用机器学习解决更多全球化问题上,一支印度团队关注到洪水带来的当地受灾问题,以及难以预警的状况,基于 TensorFlow 生成了高精度的地图,进行了成千上万的模拟,实现了预测地点和灾害程度的效果,据透露该预报算法已经结合到谷歌的公共系统中,正在印度试点,和当地的水利局共同推广。
通用电气、腾讯天衍、网易严选的 AI 研究者亦到场分享机器学习技术在行业内发挥价值的商用场景。
通用电气贝克休斯高级总监 Simon Mantle 透露,机器学习在能源领域的应用包括大规模系统异常检测、预测组件的系统故障和剩余使用寿命、预测油田产量、识别工业组件的缺陷等。
网易严选算法部负责人杨杰称,目前网易关注机器学习在供应链和销售端的应用,如供应链智能决策、搜索系统、个性化推荐、智能广告、客服机器人等,“网易严选备货上要做销售、补货计划,机器学习可以帮助销量预测,因为深入到供应链所以预测的周期需要更长,这对我们来说是一大挑战,以及大促和上新的节奏”,他说。
腾讯天衍实验室医疗机器学习研究员孙继超则表示,腾讯将医疗视为重点战略方向,该实验室应用机器学习的几大方向包括:医疗机器学习平台、疾病预测模型、医疗搜索意图识别、智能分诊。
他说:“谷歌在做糖尿病和癌症的筛查,腾讯觅影同样在做类似的医学影像识别。除此之外,我们还在利用宏观和微观的数据,与政府卫计委合作预测慢性疾病的风险,例如基于门诊记录等信息预测脑卒中,最终相对于传统的疾病筛查可以实现准确率上的提升,有明确致病因素的慢性疾病预测都可以借此提高准确度。在医疗领域应用机器学习时一定要考虑如何用上已有的信息,二是通过新的方法在传统行业的预测模型上提高准确率。
但是,需要指出,有些问题是可以解决的,有一些是不可解决的,例如预测死亡,我们需要用业务去指导技术的应用”。
(来源:DeepTech)
对于目前中国开发者和企业基于 TensorFlow 开发的各种各样的应用,Kemal El Moujahid 特别提到两个公司的应用方向引起了他的兴趣:“第一个是爱奇艺,爱奇艺在视频编辑和分段这方面大量地使用了 TensorFlow,他们利用机器学习也在移动端上传了很多很酷炫的功能。第二个是流利说。通过机器学习,它完全改变了英语学习的方式方法。它使用了建议模型让用户学习英语,这或许能改变教育行业的生态。”
不过他表示,医疗领域的应用将是他更乐见的一个方向,但目前来看,医疗行业的机器学习应用还没有达到团队期待的量级。
“之前谈到的心血管和皮肤疾病的检测案例,是很好的信号,它说明机器学习能帮助医疗人员提高诊断效率。试想一下,未来我们用手机摄像头就能做到个人的身体疾病检测,这是激动人心的应用场景。我个人非常期待能用到这个技术”,他说。