机器人是如何感知世界的?那是你想象不到的困难!

我们好像刚刚经历了pc到移动的互联网革命,或许你还没有完全适应,但现在机器人技术已经是发展趋势。

不管你信不信,下一个主要的革命将是机器人的崛起。或许用不了多久,我们会像离不开手机一样离不开机器人。

考虑到机器人的发展速度,我们有必要理解它们的工作原理,就像我们理解电脑和手机一样。

现在,尽管机器人技术是一个庞大的学科,但我们今天主要讨论机器人的一个特殊方面——感知。

在我们解释机器人感知的各种方式之前,让我们先看看人类是如何感知世界的。

人类感知世界

人类通过视觉、嗅觉、听觉、味觉和触觉这五种感官感知世界。虽然所有的感官都很重要,但主要的感官是视觉、听觉和触觉。

如果这些感官中少了一种,我们的生活将变得相当困难。不过大多数人直到失去后,才知道这三种感觉的价值。

我们想象一下,即使是简单的事情,比如走在路上,听到司机的喇叭声,或者有人为了阻止你触摸危险物体而大喊大叫……

如果没有你关键感官的功能和控制,你是很难做出反应解除麻烦的。

我们还必须认识到,感知不仅是每个感官的感知,而且是它们之间的无缝集成和处理,以连贯的方式感知来自你感官的信息输入。

我们的大脑和脊髓主要控制感官的信息整合。让我们以视觉为例,来理解感知的整合和处理。

我们知道,当一个人看一个物体时,这个物体会在视网膜上形成一个倒象。这张由光形成的图像随后被视网膜转换成电信号,并通过视神经发送到大脑。

这个时候,物体再次倒换,从而使图像直立。这有助于我们查看图像,并为我们提供了物体本质的细节,包括它的尺寸和与我们的距离。

大自然的设计是原始的并且非常辉煌;要在机器人身上复制如此规模的设计,需要全新的数学严谨性和纪律性。

机器人图像处理(视觉)

正如图像是在我们的眼球内形成的,机器人也可以在相机的帮助下创建数字图像。

数字图像可以定义为二维图像的表达形式,即有限的数字值集合,称为图像元素或像素。将图像数字转化为像素意味着图像是实际图像的近似。

像素值包含许多信息,如灰度、颜色、高度、不透明度等等。在计算机科学中,数字图像处理是利用计算机算法对数字图像进行图像处理。

数字图像处理是作为数字信号处理的一个子范畴或领域,它与模拟图像处理相比具有许多优势。

它允许更广泛的算法应用于输入数据,并可以帮助您避免在处理过程中产生的干扰和信号失真等问题。

自然语言处理(听觉)

我们人类理解语言的方式是非常直观的,但计算机在处理语言时采用了一种更合乎逻辑的方法。

自然语言处理(NLP)是计算机科学、信息工程和人工智能的一个子领域,研究计算机和人类语言之间的语言差异。

自然语言处理有两种形式:基于规则的NLP和统计的NLP。

在NLP的早期,大多数处理都是基于手写代码。后来,NLP转向了更多的使用统计方法的机器学习范式。

许多不同种类的机器学习算法已被应用于自然语言处理中。这些算法采用从输入数据生成的大量“特性”。(机器学习相关,搜索下我们之前文章了解)

一些早期使用的算法,如决策树,产生了硬“if-then”规则系统,类似于当时常见的手写规则系统。

然而,越来越多的研究集中在统计模型上,这些模型基于为每个输入特性附加实值权重来做出软性概率决策。

这种模型的优点是能够表达许多不同的可能答案的相对确定性,而不是只有一个,因此,当将这种模型作为一个更大的系统组件包含进来时,就可以产生更可靠的结果。

好了,了解了这些之后,现在你应该可以明白让机器人理解它周围的世界需要付出多大的努力!