科大讯飞的“人机耦合说”真的说清楚了吗?隐藏了什么?

2018 年 9 月 20 日,科大讯飞被指责在 2018 创新与新兴产业发展国际会议上所使用的“智能翻译”系统造假,其显示的中文翻译,并不是根据其传感器采集的声音文件所呼应的,而是后台两位同传译员临场实时翻译后,再由机器读出来的。

而科大讯飞则在 9 月 21 日回应称,该企业主要为主办方提供两种翻译方案:一、直接由机器离线翻译,现场全自动翻译并同步展示在屏幕上,没有任何人工同传参与;二、直接转写同传语音,并且为同传语音打上字幕,直播提供中英文对照的字幕。

科大讯飞认为,第二项业务是人机耦合,可以降低同传工作者工作强度、赋能翻译人员,并在声明中特别强调:人机耦合才是未来。

这个答案显显然没有让人们满意,因为在该场会议的进行过程中,根据同传译员的说法,他们并没有感觉到任何实质工作量上的减少。

同传译员的爆料,不只来自于对于此次会议工作流程的问题,更反映了部份新兴科技变革所造成的抵触情绪,就如同仍经常被提及的:“ AI 是否会取代人类工作岗位”,许多人将此视为危机甚或是威胁。

如果科技变革所带动的效益,确实让人无话可说,那么时代就会继续前进,该被碾压的是那些没能跟上脚步的人事物。但不可否认的是,包括新兴科技的导入演化,都不会是一步到位的,失误甚至是失败都是常见的状况,奚落嘲讽自是难免,但并不影响整体科技的发展。只不过当科技变革与商业利益产生交互作用,也就是靠着新兴科技得以获得不同型式的商业利益时,那势必要面对更高的检验标准。科大讯飞此次所遭遇的状况如此,许多靠着 AI 或者是其他新兴科技拉高品牌知名度、获得更高估值、融得更多资金的科技公司也都是如此。

人机耦合到底是个什么?

根据科大讯飞在事件后的回应来看,科大讯飞在回答中提到了“人机耦合”这个名词,诚然“人机耦合”是真实存在的一种理论,也被应用在了多种领域之中。但是,科大讯飞将“机器识别同传译员写的译文,再朗读”过程认为是人机耦合,这其中确实存有歧义。

“耦合关系”本身是指两个事物之间如果存在一种相互作用、相互影响的关系,同时耦合也是电路中的术语,指两个或两个以上的电路元件或电网络等的输入与输出之间存在紧密配合与相互影响,并通过相互作用从一侧向另一侧传输能量的现象。

那人机耦合指的是什么呢?在学术界,人机耦合指的是一种“控制方法”。这项技术的英文名为“Human-Machine Coupling”,在机械相关应用领域,这指的人与机械的耦合,人机耦合因为其阻尼和刚度特性所带来的高鲁棒性,常被用来作为人体外骨骼对应的控制系统。

早在 2004 年,浙江大学的李晓明博士就在其由国家自然科学基金支持的论文《基于外骨骼技术的机器人远程控制》中,把人机耦合视作了上文提到的控制方法。

换句话说,人机耦合也可以是一个仿生学、机械学的术语,在过去的使用上来看,并不完全等于人和电脑的耦合,但科大讯飞使用了“耦合”这样的说法,的确也让人疑惑,这会不会是科大讯飞自造了一个“人机耦合”的概念,以此来解释他们用电脑朗读出同传译员的过程呢?

这样的质疑确有其道理,即使争执名词的使用,对于探究此事的真正影响不见得真有太大帮助,但让人担心的是,身为一家在科研、科技领域都有极大投入的公司,面对外界一般人对于科技技术的困惑,的确必须要更加审慎,用一个并不常见通用的学术名词来解释问题,恐怕也达不到原本希望的沟通释疑的目的。

继续说回人类同传译员。既然科大讯飞,那么为什么不直接使用同传译员便成了一个大问题。科大讯飞董事长刘庆峰回应到:“考虑到会议的专业性,这次会议主办方明确要求机器做转写工作。因而本次会议的产品 logo 全部采用‘讯飞听见’,没有采用‘讯飞听见翻译系统’。”

然而,微博上一位 ID 叫做 @ 同声翻译靳萌 的用户发微博称,“之前有翻译公司找过我翻讯飞的会,说甲方给的条件是不能说出是真人在翻译,否则就不要接。”

图丨 @ 同声翻译靳萌 的微博截图

对于会议在进行过程中,科大讯飞系提供了何种技术完成工作,外界其实并无法进一步确定,但不可否认的是,科大讯飞若是在会议当时未说明是使用了科大讯飞版“人机耦合”完成工作,从而让人产生一种“翻译和转写都是由讯飞听见独自完成”的认知,这的确就会有很大的问题。

事实上,许多看似酷炫、引发惊叹的创新科技应用,当有其场景设置的条件与假设前提,在行销活动或者是品牌宣传时,这些设置条件与假设前提的说明,有时会因为某些因素被忽略不的。但这样的作法,过去就经常出现在不同类型的行业里。

举一个例子说明,当年英特尔(Intel)推出内建 Wi-Fi 的 Centrino 平台时,就曾作一了个广告,广告里的主角在荒野中的营地露营,但他拿着一台 Centrino 笔记本在上网查资料。英特尔这个广告是要告诉消费者,以后不再需要受限于有线网络的限制,有了无线网络 Wi-Fi 之后,随时随地当可以连上网络。

但当年这个广告在美国曾经被消费者告上法院,控告英特尔广告不实,因为他看了广告买了一台 Centrino 笔记本去露营,但却上不了网。

现在回头来看这个事件,许多人或许会觉得这够傻了,没有 Wi-Fi 基站网络,怎么上得了网?但不可否认的是,在当时那个 Wi-Fi 还是新兴科技的年代,这样的基本常识是业者本身必须教育市场的,而不能期望消费者一上来就能理解的。

而同样的,尽管这几年 AI 应用看来满地都是,但对于 AI 技术的运作,不只是在技术面上仍是一个正在持续探索的黑盒子,对于身处应用终端的消费者而言,他们唯一能够理解的信息来源,就只有提供服务的业者,如果业者本身自己都说不清楚,或者是不说清楚,那又怎么能指望一般大众真的理解呢?

这事还没完

虽然科大讯飞版人机耦合的事情说完了,不过科大讯飞没有在会前向外界公布“讯飞听见没有翻译工作,而是直接朗读同传译员的译文”这件事始终是错的。于是就有了另一种猜想,讯飞是为了面子才不说,还是为了别的?

讯飞听见是科大讯飞在 2015 年年末发布的,该发布会名为《A.I. 复始,万物更新》,并且该企业一口气连发了 AIUI、录音笔、录音宝、智学网、E 听说等多样产品,以及讯飞超脑 2.0。这对于讯飞来说是一件很劲爆的事情,毕竟光是同时运营这么多产品,就很耗费人力和物力,更别提开发了。但是,对于科大讯飞的财报来说,2013 年、2014 年和 2015 年,他们在营运层次和盈利层次,都碰到了不小的麻烦。

图丨科大讯飞盈利能力指标(来源:讯飞财报)

科大讯飞营业收入增长小于营业成本增长,尤其在 2015 年科大讯飞的营业收入增长为 40.87%,而营业成本增长则为 49.49%,导致营业利润率和销售净利润率大幅度下降。

图丨科大讯飞营运能力指标(来源:讯飞财报)

科大讯飞资产创造收入的能力不高,有大量的资产处于闲置状态。科大讯飞的流动资产周转情况和应收账款回收情况也不乐观。此外,在 2013 年至 2015 年期间,存货周转率逐年降低,说明存货的增长速度高于主营业务收入的增长水平。

综上,2013 年到 2015 年期间,科大讯飞业务收入总体水平不理想,而且收入不能为企业提供足量的现金流入,资金链条十分脆弱,容易发生财务风险。在营运层次方面,科大讯飞的资产周转更为糟糕,企业没有充分利用资产进行盈利。

科大讯飞的研发支出一直在 20% 以上,不过这笔钱有很有一部分是资本化支出,费用化和资本化的区别在于:资本化支出计入形成资产的成本,通过折旧摊销在使用期内扣除,而费用化的支出就是当期发生就一次性计入当期损益中,以后不再扣除。

有网友讽刺称,2017 年讯飞 11.45 亿研发支出,其中有 5.5 亿是资本化支出,占比 47.96%,上一个占比 50% 左右的企业是乐视。事实上,行业的研发支出资本化率平均水平为 5.78%。

这些产品着实让科大讯飞有了牌面,光是其百度指数就足以说明。

图丨科大讯飞百度指数(来源:百度)

然而,事实可能并没有那么令人兴奋,其收入增长与利润增长落差越来越大,而且在扣去政府补贴后,公司的营运状况的确实也让人感到忧虑。这其实是所有在科技创新这条路上摸索前进的公司都会遭遇的状况,而科大讯飞也是如此。

所以,科大讯飞不仅是为了要面子,更或许是为了保住自己的饭碗。若是其主力产品“讯飞听见”无法得到社会范围内的重视,甚至是因此被严重质疑,那么迎接科大讯飞的可能是极为严峻的挑战。

发展与活下去

对任何企业来说,“活下去”这句话都是拥有启示性的,更别提发展迅速的科大讯飞了。2018 年 5 月 14 日,科大讯飞发布《非公开发行预案》,拟向不超过 10 名特定对象非公开发行股票不超过 1.08 亿股,募集资金不超过 36 亿元。,意图继续发力人工智能领域。该公司 5 月 14 日至 5 月 16 日股价则呈断崖式下跌。

此前有观点表示,目前讯飞最强大的护城河,不是语音技术,而是政府采购、教育等事业单位采购而建立起来的客户关系。

DT 君不完全赞同这种观点,毕竟科大讯飞的市值仍然很高,这代表市场认可科大讯飞具备技术优势和市场空间。但是,其资本是否能转化为技术,同时在市场上保持领军地位,便成为了不少人聚焦的问题。

(来源:百度)

根据公开信息,王小川的搜狗已经不满足于语音识别了,他们为了追求更高的效率正在研发“唇语识别”技术;阿里更是直接把语音识别做成了音箱,用市场来锻炼其能力。不能一辈子吃老本,况且 BAT 三家对语音技术的强势投入,让科大讯飞陷入了四面楚歌的境界。

避雷针的发明者本杰明·富兰克林曾说过:“大船可以去远处探险,而小船不应该远离海岸。”科大讯飞一直都想成为一艘大船,引领语音识别,乃至整个人工智能行业。但是只有奋发图强、货真价实的态度,才能让企业长存。