神奇的正态分布源于“加”。
撰文 | 张和持
时隔多年,或许你早就记不得16岁那年夏天高中闷热的教室,但可能会记得有一天数学老师说着要给大伙看个稀奇——一块祖传的高尔顿板。尽管班上大多数同学都叫不出它的名字,却也从小到大在科技馆、博物馆见多了,一点都提不起劲儿。老师一本正经地开始讲,这个图形就是正态分布,它有诸多的性质……午后的时光更加昏沉而缓慢地流逝。
不过,这里面蕴含的数学可一点都不无聊,让我们来观察一下高尔顿板的结构。
杨辉三角/图片来源:维基百科
不过这一结论在当时并没有引起重视,毕竟并不是所有赌徒都能像梅雷一样交上帕斯卡这样的朋友。百年之后,拉普拉斯试图挽救这个定理的人气,依然没有成功。为了纪念这对“难兄难弟”,现在人们把这个定理称为棣莫弗-拉普拉斯定理。
在物理学中,误差来自于无关因素的微小扰动。这些扰动加起来,就是整体的误差。这个整体误差虽然层次不齐,但形状与正态分布还是大致吻合的。从那以后,实验的误差一般都当作是正态分布。为了纪念高斯的贡献,也把正态分布称为高斯分布。
至此,我们已经大概能想象到,正态分布的逼近与这种“加”的性质有关,剩下证明就是数学家的事了。如今,我们把这一系列逼近正态分布的性质称为“中心极限定理”,结论从最初的二项分布,已经扩展到了任意分布(包括同分布和不同分布)的广阔天地。就如同上一段中的误差——即便我们对微观下的扰动一无所知,也能通过这种极限形式,了解大样本下的整体行为。
应用这一思想的最为经典的例子当属统计力学。假如有一大堆粒子,每个都杂乱无章地运动,我们自然无从知晓每一个粒子的运动状况。不过,如果把每一个粒子的动量当作是一个随机分布的话,那就可以把所有这些分布“加”起来当做整体的动量。如此一来,中心极限定理岂不是大有用处?
的确如此。如果对理想气体应用中心极限定理,得到的正是大名鼎鼎的麦克斯韦速度分布:
物理学中一般是用玻尔兹曼分布来推导麦克斯韦分布的,但玻尔兹曼分布本身也可以用中心极限定理间接推导出来。之所以说是间接,只需要看它的形式
这根本不是正态分布。归根结底,能量的分布在这里不能相加,但在推导过程中,还是能见到正态分布。具体操作会稍微复杂一些,这里就不扯远了。
参考资料
[1] A. I. Khinchin, Mathematical Foundations of Statistical Mechani