不懂算法的人,未来也能自主开发训练机器学习模型。
机器学习是将 "AI" 部署到产品或服务中的重要途径,因此对算法专家的需求量也随着 AI 的火热而日益暴增。这样一来,算法技术人员的稀缺直接限制了机器学习的大规模运用。
为了解决这一行业痛点,微软 AI 研究院进行了多年的观察和研究,找到了一种可以将机器学习与算法背景分离开的方法:”机器教学”,并成立了机器教学专家组。
微软承诺,”机器教学”工具将最大程度降低模型开发的准入门槛。
机器学习 VS 机器教学
简单来说,机器学习是让计算机拥有类似人的学习能力来解决问题,为了获取这种能力,需要大规模数据训练,利用算法发现数据背后隐藏的关联和规律,生成模型。下次遇到新的数据,就可以通过模型预测结果。
在比较困难和模糊的深度增强学习中,一个任务的解决方案有数百万种可能,如果机器学习从 0 开始训练,不仅浪费大量的计算资源和时间,结果也不一定如人所愿。
人类学习的优势是可以从有限的样本归纳出泛化能力极高的准则。如果某些领域专家(律师,会计师,工程师等)将一些抽象概念分解成更容易的任务交给机器学习,并为机器学习模型提供如何更快找到解决方案的线索,这将大大缩短模型找到解决方案所需的时间。
图丨机器教学过程(来源:Microsoft blog)
“机器教学”就是让计算机从非技术行业的专家那里学习知识规律,而不是仅从数据中提取知识。这种更依赖于行业专家的知识引导,模型结果也更符合专家意图。
微软研究人员将”机器教学”作为”机器学习”的补充。机器学习是在算法的基础上找到数据模型,机器教学是专业人士用专业技能来训练机器学习模型。
图丨微软AI 商业总经理 Mark Hammond(来源:DanDeLong for Microsoft)
本质上,”机器教学”是在”机器学习”层次之上的,它能让没有编码能力的人也可以部署和训练AI 系统。微软 AI 商业总经理 Mark Hammond 在接受 venturebeat 采访时解释道。
微软研究员 Simard 很早就注意到,在机器学习会议上几乎所有论文都在研究如何提高算法,而同一算法在不同的数据集上表现差异非常大,实验中的效果未必能在真实世界产生的数据中复现。他意识到,现实中很多行业拥有的数据有限,处理的任务也很简单机械。”机器教学”比”机器学习”更适用这些行业。
图丨微软研究员Patrice Simard,Alicia Edelman Pelton和Riham Mansour(左至右)正致力于将”机器教学”融入微软产品中。[来源:DanDeLong for Microsoft]
2015 年,微软 AI 研究院成立人工智能机器教学组,之后微软又分别在 2018 年 6 月和 9 月收购了 Bonsai 和 Lobe 两家创业公司。Lobe 专注于无需代码的深度学习,Bonsai 旨在帮助企业开发用于制造、建筑管理和机器人的系统。目前,担任微软 AI 商业总经理的 Mark Hammond 正是前 Bonsai 公司创始人。
仍需 AI 算法专家坐镇
AI 的发展最终一定会让越来越多的普通人也能接触运用它,微软视频演示中的”机器教学”工具 demo 向大家传递着这一可能性。
不过,也引来了业内专业咨询公司 Gartner 的质疑,行业分析师 Erick Brethenoux 表示未来公司仍然需要 AI 专家。
一方面,”机器教学”取决于特定的 AI 试错法,也就是深度增强学习。例如,如果目标是将对象移动到特定目的地,则只要系统将对象指向正确的方向,系统就会得到正向反馈。Brethenoux 称这类应用领域目前仍然非常窄,很难大规模推广使用。
即使微软能将它的适用范围推向更多领域,Brethenoux 仍建议企业要有 AI 专家在后台监控预测系统,以便随时应对可能发生的情况。
Brethenoux 还指出,微软并不是唯一一家试图简化机器学习模型开发的公司。另外有 Cogitai (https://www.cogitai.com/),是一家能提供个性化的深度增强学习平台,以及谷歌 Cloud AutoML (https://cloud.google.com/automl/),向用户承诺可以用最少的机器学习知识训练自定义 AI 模型。不过 Brethenoux 对微软在普及 AI 开发工具上的努力和贡献还是非常肯定的。
目前,微软在多个视频中演示了机器教学项目的创建使用过程,预计将于 5 月 6 日至 8 日在西雅图举行的 Build 年度开发者大会上,发布更多有关升级微软机器教学模型工具的细节。