科大讯飞同传“造假”,可能是AI大跃进的恶果

《哈佛商业评论》曾在一篇文章中这样预言人工智能:“人工智能和计算能力将在未来20年取得突破。”

本该是长达数十年的技术深耕,但在大量资本涌入、概念游戏、风口论的烘托下,不少人工智能相关的企业上演了一场场 “大跃进”。“同传造假”事件缠身的科大讯飞,也再次被拖进了舆论场。

AI又玩砸了

早在今年4月份的时候,腾讯的AI同传也翻过车,AI翻译出了一些令人费解的话,蹦出了大段莫名其妙的词。

腾讯将其解释为一场尴尬的科普,呼吁公众对人工智能应该有合理的期待。客观上来说,腾讯的做法无可厚非,腾讯AI翻译只是“技不如人”而已。

科大讯飞就没有那么幸运。9月20日,一位同传工作者在知乎上发文控诉:自己和同伴的翻译成果在不知情的情况下,被科大讯飞以文字形式上传在屏幕上,整场活动中科大讯飞只标注了“AI智能翻译”的字眼,并未提示有人工介入。言下之意,科大讯飞的AI翻译根本就是在“造假”!

面对指责,科大讯飞选择直接怼了回去:我们是人机耦合模式,机器提供语音转写和翻译结果给同传参考,目的是辅助同传工作者提供工作效率。

遗憾的是,科大讯飞的极力避嫌,恐怕并不能消除同传工作者心中的怒火。想要成为一名优秀的同传工作者,不仅需要数年的专业化学习,还要不断积累业务经验,甚至在化妆上都有苛刻要求。但AI只需要集中资源训练“神经网络”,就有可能达到专业同传的水平,亦或者直接张冠李戴式的忽悠。

同传工作者的反击和许多AI威胁论不无关系,人工智能相关的报道大多习惯了“震惊体”,一旦有新的成果出现,立刻被无限放大解读,仿佛下一秒人工智能就将统治世界。而不少和人工智能相关的产品也颇具“挑战性”,陪伴式机器人宣称要取代英语老师,物流机器人声称要替代快递小哥,就连极力解释没有标注AI同传的科大讯飞,诸如翻译机之类的产品难道不是要打败普通翻译吗?

虚胖的人工智能,注定经不起拷问,当人类专家向AI发起挑战的时候,多半的结果会是一地鸡毛。

终究急不来

虽然人类为科大讯飞的同传泼了一盆冷水,但这未必是一件坏事。

决定AI进化进程的不是PPT上打鸡血的愿景和口号,而是算法、算力和数据,任何一个环节都将制约人工智能的应用,AI同传的“翻车”就是输在了数据上。

同传翻译不是新闻联播,话题专业性强,现场噪声干扰多,上台发言的中外专家们又往往夹杂着方言,倘若在兴起时来两句古诗词,专业的同传工作者都可能搞不定,又怎么寄希望于当前水平的AI。

假如给到的是标准的英语朗读,科大讯飞也许能很好地完成任务,毕竟在其数据库里不乏类似的语音资料。可日式英语、印度英语等衍生出的语种,却可能存在数据样本上的缺失,至少从成本和商业化价值上,还没有必要去建立小语种数据库,进而开发特定的神经网络,效果自然大打折扣。

在某种程度上说,人工智能的竞争本质上还是数据的竞争,百度、阿里、腾讯等不缺少数据源,在人工智能的研究上也始终领先创业者一个身位,即便如此,BAT对外的AI服务也很基本,主要集中在语音识别、图像识别等相对成熟的技能,还是走的稳扎稳打的路子。

以同处AI领域发展的自动驾驶为参考,谷歌母公司Alphabet下属的自驾车部门 Waymo,迄今已经在公共道路上行驶了600万英里,还有交通模拟器内的27 亿英里虚拟里程。国内做无人驾驶的百度,也开放了大规模自动驾驶数据集ApolloScape,包括感知、仿真场景、路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据,并且还在日夜不停地坚持进行各种情况的路测。

也就是说,人工智能注定是一个慢生意,从实验室的象牙塔到规模化应用,还有很长的路要走。科大讯飞之类的“翻车事件”何尝不是一个教训呢,人工智能在日常翻译上可能还存在一个又一个Bug,抢同传翻译的饭碗难免被当头棒喝。

被迫向前跑

只是身在风口之上、浪潮之中,被迫向前跑是一种常态。在人工智能还不会走的时候,已经有人想要它跑起来。

一个典型的现象,人工智能被捧上风口浪尖之后,大量的资本流向这个市场,但资本不是慈善家,拿了别人的钱,势必要给到别人想要的结果,以至于出现了人工冒充智能的各类奇葩事件。

比如2015年横空出世的客服机器人娇娇,凭借软萌的声音、流畅的反应、高度人性化的对答,一度成为机器人领域的焦点,最后却被扒出是一场“摄像头+变声器+人工客服”的李鬼式造假。

再比如被沙特阿拉伯授予公民身份的机器人索菲亚,曾经在《早安英国》、《吉米今夜秀》、《60 Minutes》、《我是未来》等综艺节目中大放异彩,最后被研究者认定索菲亚展示出的主动引导话题的社交能力,是提前编写好的对话。

在这种风气下,科大讯飞也在一定程度上成了跟风者。在科大讯飞近20年的成长历程中,不乏灵犀语音助手、讯飞输入法等优秀产品,在企业端和政务市场也有着举足轻重的影响力。但在人工智能的浪潮下,等待科大讯飞的却有两个陷阱:

一方面,在持续性的公关包装下,科大讯飞已经是一家彻彻底底的人工智能企业,也变相绑架了公司战略。可以窥知一二的是,一向专注于B端市场的科大讯飞,在2017年的年度发布会上一口气发布了10多款人工智能产品,从教育到医疗,从客服到智能家居,再到移动手机端和车载环境。如果没有同传工作者的搅局,科大讯飞在国际会议上的表现不失为一场成功的公关秀,至少不用刻意强调人机耦合,而是智能翻译。

另一方面,科大讯飞的优势在于技术,选择人工智能最为主阵地很可能是深思熟虑的选择。不幸的是,科大讯飞的AI门口可谓强邻环伺,百度、阿里、腾讯乃至华为,无不在技术研发上巨额投入,在人才挖掘上不惜成本,并以云计算的形式对外输出人工智能能力,把自身AI能力加入到各种打包的解决方案中,导致企业应用AI的门槛越来越低。

科大讯飞需要找到合理的商业模式,找到对抗强敌的资本,向C端转型是其一,变着花样秀技术也是一种方式。可科大讯飞会是唯一一家被AI推着向前跑的公司吗? 人工智能“打假”早已哀鸿遍野。

结语

人工智能的出现是时代的必然,“人工”智能的造假是行业的悲歌。

在很多人打的比方中,人工智能都还是个牙牙学语的三岁小孩,让它像成年人一样处理复杂问题,未免有些拔苗助长。或许“人机耦合”的意识才是正确的,人工智能的应用还需要慢慢来,给出足够的试错空间。我们也不应该抱着鸵鸟心态,与其害怕或者斥责AI威胁论,倒不如学会怎么去和AI协作。