学会察言观色对计算机来说只是技术上的一小步,但却是计算机走进人类生活的一大步。会动作的硅胶人虽然也是技术上的一小步,却也是计算机走进人类世界的一大步。
撰文 | 吴建永(美国乔治城大学神经科学系教授)
目前世界上大多数人使用智能电话一类的计算机作为生活的助手,语音交流也逐渐成为人机交流的主要渠道。可是,直到今天,计算机的语音交流对人语言中感情成分的感知和理解还非常落后。本文用一个故事来解释计算机与人在感情方面的互动有多么伟大。
人类是社会动物,个体间的交流需要随时感知对方的感情。这是一种与生俱来的本能,而且这种本能可以跨种群存在。正如俗语中说的:“狮子发怒的时候,小鸟也会害怕。”人类的伴侣动物如猫、狗,之所以能与人类共生几万年,也是因为它们会本能地感知主人的心情。但是人类感情的指纹特征是非常明显的,既然猫狗都能感知,智能手机为何不行?目前的计算机技术已经完全可以感知人类的感情,甚至精确细腻程度可以超过人类中的交际高手。
计算机感知人的感情和心态是靠“察言观色”来实现的。所谓察言,就是从话语的声音中提取如兴奋、沮丧、愤怒、同情等感情成分。现在计算机的语言识别技术已经很发达了,基本上是先提取语音中的强度、频率、速度等参数以及各个参数的变化率等信息模式,再从对应的词汇库中找到与这个模式对应最好的词汇。提取语音中感情成分的技术与提取语义的技术差不多,只不过是把语音信息的模式在“感情词汇”库中找到最为对应的感情模式。识别语音的难点是提取很多人讲同一个词时的共同的模式,而识别感情成分则是找出同一个句子在不同场景下讲的差别。当然,技术每天在进步,今天用数据库技术,明天用更先进的技术。什么技术并不重要,重要的是知道现在的技术水平已经可以从语音中找出感情模式。
所谓观色就是从面部图像中提取情感信息。计算机识别表情和识别人脸的技术类似。现在计算机识别人脸的技术已经很发达了,基本原理是先从照片中提取根据五官的尺、位置和相互距离等信息并形成一组“脸参数”,再到“人脸库”中去寻找最为对应的参数组。观色远比识别人脸简单,因为人类只有“喜怒哀乐”等几种基本表情,加上“忧喜参半”等等复杂组合,也不过几百种,对今天的技术来说完全是小菜一碟。与“察言”同理,“观色”使用的是什么技术同样也不重要,重要的是现在的技术水平已经可以从面部图像中找出感情模式。
学会察言观色对计算机来说只是技术上的一小步,但却是计算机走进人类生活的一大步。简言说就是人机交流可以形成一个“闭环控制”。原谅我提及这个陌生的术语,下面讲个小故事来解释一下:一个公司小职员连续加班多日,没有嘉奖反而因一点小错被老板炒了鱿鱼,他一进家门就对着计算机声泪俱下地控诉自己所受的不平待遇,并说明天要买两瓶汽油到公司去和大家一起共享“烤肉宴”。
恰好他口袋里有个手机,下载了一个会察言观色的APP。这个APP通过语言识别程序明白了他的故事并通过感情识别技术了解到他心理情绪的激烈程度。于是APP先启动一个叫“马屁精”的程序。当他晚上在床上辗转的时候,手机突然说话了:“你们那个狗X的老板真混蛋,明天咱们去灭了他。”小职员一惊,回答道:“你都听见了吧!绝对应该烧死他!”这APP接着这个话茬和他一起痛扁老板,大骂公司里踩着他肩膀往上爬的马屁精。这APP里 的“马屁精”程序平常会奉承人,遇到主人生气还会跟着骂。里面的脏话大全,集中了多种方言,常用和不常用的几十万句骂人的脏话,可以讲十个小时不重样。小职员和“马屁精”你来我往问候了老板的多少代祖宗后十分累了,“马屁精”就建议他玩一个痛歼老板的游戏,用乌鸦在公司里追逐老板,把他的头发啄掉还在老板头上拉屎。
啄掉一缕头发得5分,拉屎击中头顶得10分,游戏里的老板被追得在公司里到处乱跑。玩了20分钟后,小职员的情绪已经不那么激烈了,但心情还是十分灰暗,满脸旧社会。于是APP中另一个 叫“狐狸精”的程序启动了,柔声细语地用他喜欢的香港普通话安慰他:“人生高低本是平常事,过几年看今天不过系一小小挫折。咱失业了正好休息一段时间,我明天带你去看海。咱们的帐号里还有五千块,还够去趟新马泰(天呐,这玩艺儿细思极恐)。回来以后找小崔王猛他们借点钱,咱们自己创业当老板。你们是当年一块儿出来混的哥们,他俩还是光棍,没有老婆管,肯定抹不开脸拒绝失业的哥们。拿着钱咱们炒点股,我看好了明年A股肯定衰,国内农产品还得涨,咱们炒点猪肉和时令水果,说不定还能发呢。你们那破公司早晚会完蛋,老板也是丧家犬,咱犯不上跟他拼命。瞧他那秃头大腹的德性,哪比得上咱高挑英俊的‘小皮特’(APP给他起的小名)。行了,你累了那么多天,今天咱们先洗洗睡吧? ”“不行,我这口气咽不下,根本睡不着!”“那咱们聊聊丽莎?”丽莎是公司楼下咖啡店的服务员,小皮特暗恋的女神。从长相、身材聊到化妆品,足足半个多小时后,小皮特终于在“狐狸精”的充满嫉妒的娇嗔中睡着了。
看到这里,读者千万不要以为计算机里有个比人还聪明的精灵。精灵是没有的,完全靠普通的逻辑运算。在弄清了“小皮特”的故事和当时的心情后,计算机可以很快在“对策库”中找到“炒鱿鱼破解大全”子库。那里可以找到几十万句可以使用的语句和办法。然后“马屁精”程序根据心理学库中的“十七大原则和268条具体办法”,对语句进行筛选,找到最适合当时场景的几句并试探地说出来。这里最重要的还是聊天时的察言观色,一句说错了需要马上打个马虎眼,换一套再来。这个套路就是前面提到的 “闭环反馈”,就是一环扣一环试探着达到目标。这个APP已经和“小皮特”一起生活了两年,交谈过几万句话。哪句话中听哪句不受用都明明白白地记录在案,计算机是永远不会遗忘的,错误也绝不会重犯。因此在碰到今天这种比较大的问题时也能游刃有余,基本不犯错误,小开斯(case)啦。人在愤怒的时候最需要同伙一起来战斗。对小皮特这种屌丝来说,动刀子不敢,打嘴炮骂人已经是很有效的发泄。和“马屁精”一起骂的结果就是把情绪发泄了,再用游戏消耗掉剩余的精力,于是此事拉倒。
“马屁精”破解了人类极端激动的情绪后,“狐狸精”接下来缓和极端沮丧的抑郁。当然抑郁有很多指纹特征,计算机绝不会认错的。破解抑郁也是先从“绝望情绪破解大全”库中找到几万句可以使用的句子,然后在“交流经验库”中根据两年来交谈中哪句受用哪句不愿听的经验选择出最佳语句,一边察言观色,一边不断选择最佳的交谈策略。比如“去看海”是山沟里出来的小皮特的十大心愿之一,原来是要挣了钱才能去的。但“狐狸精”说,虽然失业了但咱照样能看海,这种说法就能有效破解极端绝望得情绪。
“狐狸精”的第二招是转移注意,这也是破解极端情绪的有效的办法,地摊上买的心理学书里都有写,计算机里也肯定有的。两年以来,小皮特曾说过一万三千六百二十七句关于丽莎的话,“狐狸精”对每句都做过两三句以上的回答,而且对每句对答后小皮特情绪反应都有评分记录。在“丽莎-皮特关系”这个话题上,“狐狸精”找出了五百多个最能影响小皮特情绪的手段,而且每个手段都在实际对话中验证过。从这种意义上来说,“狐狸精”对丽莎的了解可能比小皮特自己还要多。可见,“狐狸精”的种种策略都可能对破解极端绝望情绪有决定性的作用。
而所有这些技术都不难,用今天过气的低档GPU加几TB的内存完全可以掌控,基本能实现实时交流。另一个稍微年轻的技术是在说话的同时,让屏幕上的模拟人脸或硅胶的三维人脸模型做出相应的表情。人为做出表情的原理在没有计算机的时代就已经出现,它很简单,只要让脸上的某些肌肉收缩,相应的表情自然显现。早在1860年代,法国科学家道晨第博朗(Guillaume-Benjamin-Amand Duchenne (de Boulogne))就曾演示用电刺激脸部的某些肌肉能让人脸做出表情,完全不需要相应的复杂心理过程。比如下图中的30、35和36号照片,电极刺激半边脸,就能使这边脸做出一个表情,与那半边脸不一样(对比’30,’’30 和’’’30)。
这些生理学知识说明,制造出人类表情并不是难事,而对应模拟人脸的表情控制,在计算机游戏世界已经广泛应用。计算机屏幕上的人脸不如三维的,有体温的硅胶脸只要在硅胶人模型中装置几条液压动作器(人工肌肉)就能实现栩栩如生地拟人模型了。其实“马屁精”和“狐狸精”都已经有了拟人模型,用无线网和个人主程序连接。小皮特已经准备在赚了钱后买个硅胶版的“狐狸精”,相貌可以在网上设计,模板从假想的西施、貂蝉到今天的港台明星都行。但是小皮特最后还是用偷拍的一张模模糊糊的丽莎照片做了模板,另外揉进35%的一个韩星的面容,因为小皮特认为丽莎唯一不漂亮的地方就是肉乎乎的鼻子,加上韩星整容过的高鼻子就完美了。
给“狐狸精”后台编程的程序猿对我说,小皮特买了这个硅胶模型之后恐怕就不会再和丽莎好了。“马屁精”和“狐狸精”对他了解得那么深,在交流的时候永远衷心耿耿(只要注意别贪便宜买盗版埋过木马的),永远不知疲倦,永远冷静,永远甜蜜,不发脾气。这些能力远远超过人的父母、配偶和朋友。人类会和这类程序可以形成超强的伙伴和亲属依赖关系,超过任何真人。
要知道,会动作的硅胶人虽然是技术上的一小步,却是计算机走进人类世界的一大步。现代生理学证明,接触和抚摸对人的生理和心理状态有非常重要的作用,可以影响很多种激素的分泌。其中最主要的一种就是Oxytocin(催产素)。这种激素对母婴、配偶等亲属关系的形成有重要影响,甚至男人之间的伙伴关系是否够铁也和这种激素有很大关系。也许,通过有体温、有皮肤感觉的硅胶人的碰触和抚摸,我们人类会激发强烈的释放催产素的过程,人机之间也会形成有很强依赖性的爱人、 伙伴和亲属关系。
还是那句话,技术每天在进步,明天用什么技术并不重要,重要的是知道现在的技术水平已经可以做出有表情、会动作的硅胶人。
注:本文曾于2011年7月31日发表在网上,2012年12月,文章略加修改后再次发表,2018年又根据当时的技术进展加以重写,本文是最新版。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」公众号内联系后台。
特 别 提 示
《返朴》,一群大科学家领航的好科普。国际著名物理学家文小刚与生物学家颜宁共同出任总编辑,与数十位不同领域一流学者组成的编委会一起,与你共同求索。二次转载或合作请联系fanpu2019@outlook.com。