智能音箱是个好故事，就是剧本有点老

亚马逊、谷歌、苹果、阿里、微软......智能音箱世界里的明星阵容不可谓不豪华。

尽管“智能音箱”不算是一个新玩意，可在人工智能的浪潮下，却有了一个新名词，即“智能语音助手”，尤其是先发制人的亚马逊Echo一举拿下将近千万的销量，加之上千元的售价，几乎成为智能硬件领域利润和销量双丰收的扛鼎之作。

有了亚马逊接近满分的开局，跟随者蜂拥而聚，既有轰动一时的科技巨头，也有镁光灯之外的创业者，好一番热闹。

智能化的音箱，讲了个好故事

既然选择了“音箱”的外表，在某种程度上意味着科技巨头们已经笃定语音将成为下一代交互入口之一。也恰是因为如此，对“无产阶级”们来说谈不上刚需的高端移动音箱，意外成了科技猎手们觊觎的对象。

距离亚马逊推出第一代Echo已经过去了将近三年的时间，有趣的是，Echo在发布之初似乎并不讨市场喜欢，即便在音质输出和设计方面均不输专业级产品，亚马逊还推出了一套完整的音乐流媒体服务。而当诸多的开发者接入Echo，使得这款智能语音助手更加“好玩”的时候，销量也开始一路水涨船高。

终究，无论是科技巨头还是消费者，对智能音箱所期望的仍然是讲一个好故事，所幸亚马逊的Echo不孚众望。

最为震动人心的就是“个人助理”的故事，亚马逊Echo内置的Alexa语音助手号称可以实现叫车、叫外卖、阅读新闻、网购下单等功能。随后推出的GoogleHome、苹果HomePod、天猫精灵X1以及微软Invoke，甚至包括有京东和科大讯飞背景的“叮咚”系列、百度的“小鱼在家”等，这些产品和亚马逊的理念如出一辙，只是将语音助手换成了自己家的产品。而有些巨头的故事还要更丰富一些，将智能音箱塑造成智能家居的又一控制中心，用语音来控制点灯、电视等产品的工作状态，以此来弥补自身的生态布局。

想象一个生活的场景：一位家庭主妇在厨房做饭时，可以通过智能音箱查询菜谱、控制厨具、下单买菜，抑或是借助智能音箱来制定烹饪时间，拨打网络电话喊家人回家吃饭等等。一个小小的音箱在人工智能的加持下或可称为改变人类生活方式，甚至是打开智能家居大门的新撬板。

十年前乔布斯重新定义的触屏交互，带来了属于智能手机的黄金时代，而在十年之后，各家的人工智能技术在语音识别准确率方面纷纷秀出97%以上的成绩，卷积神经网络、隐藏马可夫模型、迁移学习、语义分析等新名词充斥网络，亚马逊Echo巧妙的解决了远场语音识别的瓶颈，或许预示着语音交互的时代已然来临。

可惜是个老剧本

巨头们挺进智能音箱市场可以说各有所图，也不排除存在未来焦虑的跟风之作。亚马逊和阿里都在尝试加入购物功能，似乎有理由相信这是他们在布局未来的电商入口；谷歌努力让Google Home懂得更多，无不在展示自身在知识图谱深度和广度方面的建树；苹果顺势推出了内置Siri的HomePod，不排除被迫进行战略卡位的可能......

情节的转折之处在于，智能音箱这个新故事或许是一个老剧本。容易让人联想到的就是2012年前后的智能手环浪潮，彼时炙手可热的科技娇子们不无染指，三星、华为、小米、OPPO等手机厂商也顺势切入，除了计步、定位、睡眠质量、心率监测等基础层面的“故事”，还讲出了一个“数据+健康”的大布局。可现在呢？盛极一时的Jawbone已经进入破产清算，Fitbit的股价在过去一年下滑了60%，就算是苹果和三星，在健康维度上依然不作为，所谓的智能手环和智能手表成了微利的鸡肋。

不太乐观的是，语音交互的成熟度有被高估的可能，苹果、微软、阿里等后续发布的几款智能音箱在功能上并没有跳出亚马逊Echo在2014年画下的圈子，将近三年的时间内，软件和硬件方面均未出现长足的进步。更有甚，亚马逊是率先打起了“退堂鼓”，今年上半年推出的新Echo搭载了一块7英寸的触摸屏，此举或许会给智能音箱带来新的玩法和功能，比如视频聊天等，却也在某种程度上承认了语音交互在短时间内难以取代图像和动作交互的事实。

有人抨击亚马逊推出触屏版Echo是理念上的退步，倒不如说是亚马逊变得更加实际。智能语音助手的痛点在哪里，亚马逊大概更有话语权，同时亚马逊的妥协也暴露出了语音交互的诸多弊端，毕竟我们使用手机上的语音助手，尚且有很多不方便之处，纯粹语音交互的正确率和用户体验可想而知。

较为尴尬的是，智能手机仍然是一个可怕的对手，至少除了音质效果和被夸大的远场语音识别，智能音箱在其他方面的体验上并不能出智能手机其右。毕竟当智能手机加入计步功能后，大多数人微信运动的数据来源变成了手机本身，谁能保证手机厂商不会在手机上植入更加强大的语音助手服务呢？答案是显而易见的。

下一话该怎么写？

在新事物面前，既得利益的科技巨头们总是那么的疯狂，哪怕存在一丝颠覆的机会，也要事先把它握在手中。智能音箱或许是个坑，可巨头们并不忧虑故事的下一话该怎么进行。

就目前来看，几乎对所有的巨头来说，智能音箱都只是形式上的工具，亚马逊最核心的是Alexa、苹果最核心的是Siri，Google有Assistant，微软有Cortana，就连阿里也造出了自家的人机交互系统“AliGenie”。并非是所有的巨头都义无反顾的选择All in人工智能，语音交互这个潜在的爆发点却是置身其中的每家公司所筹谋的。

举个例子，亚马逊正在积极为Alexa语音助手培养开发者，而且没有局限在软件服务层面，Fire TV、LG的机器人、福特的汽车、Dish的机顶盒，甚至包括可能是Echo竞品的联想智能音箱。苹果、谷歌、微软等也表现出了同样的初衷，智能音箱不过是展示给潜在合作伙伴的样品而已，真正的智能语音助手应该是无处不在的，串联起我们可能接触到的任何产品，从汽车到家里的对讲机......

也就是说，智能音箱这个故事能否继续下去，牺牲者永远都是专注于产品本身的创业者们，而台前和幕后的巨头们，则早已习惯了生态和平台逻辑。从积极的角度来看，巨头的号召力可以打破终端市场的各自为战，一步步消灭信息孤岛；同样狡猾的是，在保证技术趋势和商业布局不会马失前蹄的情况下，巨头是永远的赢家，他们要占领的是顶层入口，至于何种实现形式并没有太多关系，可能是今天的智能音箱，也可能是明天的智能机器人、智能家电、乃至平板电脑等等。

有理由相信，假使在不久之后出现了智能语音助手更佳的载体，今天备受关注的智能音箱终将会成为过去式。而巨头们也需要反思的是，跟随策略当真是最恰当的反应吗？这世界需要的是创新，而非复制。

结语

智能音箱不过是人工智能故事的继续，那些不遗余力的吹捧者可以歇着了，这里没有风口，所有故事和场景的前提仍然是语音交互变得更加完善。从用户到巨头，从来都不会拘泥于一种形式和一种载体，相比于在智能音箱身上写故事，噪音识别、方言识别、语义理解等更具有挑战性的痛点，才是语音识别成为未来人机交互入口的关键所在。