2019,4G将慢慢成为过去,5G正在缓缓到来,5G时代,AI(人工智能)和物联网将会成为热词,尤其是随着5G的网络延迟大幅降低,以AI为核心的物联网将实现真正的万物互联。那么AI的智力是怎么来的呢?AI的智力主要来源于贝叶斯-拉普拉斯公式,可以说是AI的大脑组成!
什么是贝叶斯-拉普拉斯公式
18世纪英国有一位英格兰长老会牧师,他很喜欢数学,所以也可以称得上是一位业余数学家,他的名字叫托马斯·贝叶斯,他为了证明有上帝的存在,发明了概率统计学原理,可惜,他到死也没有证明成功,反而因此诞生的许多概率统计学术语折磨了无数大学生。
他提出过一种看上去似乎显而易见的观点:“用客观的新信息更新我们最初关于某个事物的信念后,我们就会得到一个新的、改进了的信念。”
它的数学原理很容易理解,简单说就是你如果很喜欢去某家菜馆吃饭,那么你可能会非常喜欢这家的菜,也就是说当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。
由此,贝叶斯分析方法诞生了,它建立在主观判断的基础上,你可以先估计一个值,然后根据客观事实不断修正。
当然了,这还只是一个理论,看起来的确很简单!
但是在1774年,法国数学家皮埃尔-西蒙·拉普拉斯根据这个研究成果提取出来了贝叶斯公式。拉普拉斯关心的问题是:当存在着大量数据,但数据又可能有各种各样的错误和遗漏的时候,我们如何才能从中找到真实的规律。拉普拉斯研究了男孩和女孩的生育比例。有人观察到,似乎男孩的出生数量比女孩更高。这一假说到底成立不成立呢?拉普拉斯不断地搜集新增的出生记录,并用之推断原有的概率是否准确。每一个新的记录都减少了不确定性的范围。从而诞生了“贝叶斯-拉普拉斯公式”。
P(A/B)=P(B/A)*P(A)/P(B),该公式表示在B事件发生的条件下A事件发生的条件概率,等于A事件发生条件下B事件发生的条件概率乘以A事件的概率,再除以B事件发生的概率。公式中,P(A)也叫做先验概率,P(A/B)叫做后验概率。
很多人一看到这个公式觉得特别头疼,其实我给大家翻译一些就明白了,其实大家在生活中就经常使用贝叶斯分析方法,只不过大家并没有意识到罢了,比如我们去一个陌生的地方吃饭,我们的手机又没有电了,你没有办过通过手机APP了解这个地方的哪个餐厅最好吃,这样我们似乎只能随机选择,但实际上并非如此,我们会根据贝叶斯方法,利用以往积累的经验来提供判断的线索。经验告诉我们,通常那些坐满了客人的餐馆的食物要更美味些,而那些客人寥寥的餐馆,食物可能不怎么样而且可能会被宰。这样,我们就往往通过观察餐厅的上座率来选择餐馆就餐。
当然了,生活中还有很多这样的例子,我们淘宝的时候,看到下面购买人数多,就会觉得这家店更可靠一些,购买人数太少,就不太放心以及突然发现老公的公文包里突然有了一支口红,进而怀疑他出轨等等等等。。。
这其实就是我们在生活中不自觉地运用了贝叶斯分析方法。
AI时代,贝叶斯-拉普拉斯公式
大家可能会觉得这个公式和AI有啥关系。其实这个公式刚刚出来的时候,大家也觉得没有什么用,但是随着互联网的不断发展,科技的不断进步,在被冷落200年之后,贝叶斯-拉普拉斯公式的存在感也就越发凸显。甚至在热门美剧《生活大爆炸》中谢耳朵也秀了一下。
这就要多亏了香农了,这位大数学家也是信息论的创始人,提出了想用数学方法处理自然语言的想法。(自然语言处理就是让计算机代替人来翻译语言、识别语音、认识文字和进行海量文献的自动检索。)
然而那个时候的计算机,因为时代和技术水平的原因,根本无法满足大量信息处理的需要。你要知道即使在1982年,640K内存对微型计算机来说显得绰绰有余,人们甚至认为,640K的内存可以用来干任何事。你就可以知道当时的计算机有多弱鸡了!
所以香农的想法并没有得到重视,然而时代在发展,科技在进步,后来大家才知道香农的话多么具有前瞻性!
1994年,比尔盖茨坐在一堆纸上,告诉全世界:我手上的光盘能装下下面所有纸记录的信息
随着计算机的不断更新迭代,一路升级,很多人力很麻烦的东西都可以通过计算机来解决,很多在手工条件下看起来不可思议的进行模型训练的巨大工作量通过计算机来实现变得轻而易举,而如何让计算机来处理这些东西呢?贝叶斯-拉普拉斯公式就隆重登场了!
打一个比方,我们给人工智能看一个菜刀的图谱,问它这个是什么?人工智能又不是人,它不像我们在社会中成长,对于任何物体都有约定俗成的叫法,我们可以通过大脑思考,去判定事物,它又没有脑子。那么贝叶斯-拉普拉斯公式这个时候就成为了人工智能的脑子。
当看到菜刀的形状之后,可能是金属制品。
一侧十分锋利,可能是用来分割物品。
一端还有刀柄,可能是厨具
。。。
最后得出结论是菜刀。
人工智能不断地搜集自己储存的信息,并用之推断原有的概率是否准确。每一个新的推断都减少了不确定性的范围,从而得出正确的结论,所以说,贝叶斯-拉普拉斯公式可以说是AI进化论的基石。
还有人工智能识别我们的语音,我们对人工智能说了一句话,假设这句话是a,人工智能就需要判定它出现的意思e哪个是最靠谱的。即我们需要计算:P(e|a)。根据我上面给出的公式,从而得出:
P(e|a) ∝ P(e) * P(a|e)
最后人工智能就会判定出你说的话是什么意思,为什么现在的很多品牌的手机语音助手经常翻车,包括Siri也是经常翻车,就是在这个的计算上出现了问题。
所以,你明白了吗?为什么人工智能的“智能”来自贝叶斯-拉普拉斯公式。
当然了,这还只是初级,由此为一个点,慢慢不断延伸,比如深度学习+贝叶斯网络。这些就太深了,就不细说了。
贝叶斯-拉普拉斯公式作用很多,广泛应用生活
贝叶斯公式在生活中的运用非常常见,比如我们非常了解的大数据、人工智能、海难搜救、生物医学、邮件过滤、疾病诊断,企业的资质评判,诉讼,市场预测等等等。
我们最为熟知的马航搜救工作,也利用了贝叶斯-拉普拉斯公式。
可以说贝叶斯-拉普拉斯公式就好像是整个信息网络化社会的大脑一样。当随着互联网的不断深入发展,技术的不断成熟,贝叶斯公式与计算机结合的真正威力我们还无法预估。
不知道人工智能是否真的能从贝叶斯-拉普拉斯公式跳脱出,从而可以独立地思考,甚至与人类之间发生战争。
然而,我们终归要相信,人类之所以珍贵,是因为我们有血有肉,拥有真正的感情。
可以说在如今的社会,在以贝叶斯为基础的算法已经成为了社会的血管,万事万物都拖离不了算法,大数据需要算法、自动化机器的运转需要算法、手机拍照需要算法调教、彩票的机器需要通过算法筛选大奖等等等等。
不过,现在,算法过程、深度学习、机器学习、大数据运维之类的年入百万也是轻轻松松,不过难度很高,希望大家报名此类的培训班三思而行, 因为这门槛太高,如果这么不好,全球也不会这么缺人了。
注:因为受众原因,讲的比较粗略简单,贝叶斯分析方法和贝叶斯-拉普拉斯公式之间的关系和联系,还有贝叶斯和深度学习、机器学习之间,以及贝叶斯在算法中的作用等等,都没有深入去谈,有兴趣的朋友可以多去了解一下。有任何错漏欢迎指正!