今年早些时候,天文学家偶然有了一个意外的发现:我们的银河系中心附近可能存在着数千个黑洞。导致这一发现的X射线图像并不是来自于一些最先进的新望远镜,甚至都不是最近的观测数据,其中一些数据其实是20年前就已经收集到。
研究人员通过挖掘以前的、长期存档的数据,发现了黑洞。因为大数据时代改变了科学的发展方式,像这样的发现只会变得越来越普遍。天文学家每天都在收集呈指数增长的海量数据,以至于需要数年时间才能发现埋藏在存档中的所有隐藏信息。
天文学的发展
60年前,典型的天文学家基本上是独自工作,或者是在一个小团队中工作。他们可能在所在院校中能使用一个相当好的大型地面光学望远镜,这些观察大多局限于可见光的波长。这意味着他们错过了来自大量天体物理源的信号,这些物质可以发射出非可见的电磁波,从低频无线电波一直到高能伽马射线。
如今,有一些天文台覆盖了整个电磁波谱。这些最先进的天文台不再由单个机构运作,通常由宇航局发射,有许多国家共同参与的。
哈勃太空望远镜
这些天文台产生了惊人数量的数据。例如,哈勃太空望远镜自1990年开始运行,已经完成了130多万次观测,每周传输大约20 GB的原始数据。要知道,这台望远镜是在20世纪70年代设计出来的,如今还在正常工作。位于智利的阿塔卡玛大型毫米阵列现在预计每天会增加2 TB(2048 GB)的观测数据。
海量数据
天文数据的存档已经非常庞大了。每一代天文台的灵敏度通常至少是以前的10倍,要么是因为技术进步,要么是因为尺寸更大。例如,同为运行10年的伽马射线望远镜——高能伽马射线实验望远镜和费米伽马射线太空望远镜,前者在1991年投入使用,在10年里发现了大约190个伽马射线源;后者在2008年投入使用,目前已经观测到超过5000个伽马射线源。
大口径全景巡天望远镜
目前正在智利建造的大口径全景巡天望远镜是一种光学望远镜,每隔几个晚上,就能绘制整个天空的图像。它的灵敏度极高,每晚将会发现1000万个新的信号源,10年后会产生超过15 PB(1 PB=1024 TB)的数据。
此外,平方公里阵列射电望远镜在2020年完工后,将成为世界上最灵敏的望远镜,它能够探测到50光年远的外星文明的航空雷达站发出的信号,如果那里存在外星文明的话。仅仅一年的观测,该望远镜将产生比整个互联网更多的数据。
这些雄心勃勃的项目将考验科学家处理数据的能力。图像需要进行自动处理,这意味着数据需要被简化为可处理的大小,或者转换成最终结果。新的天文台正在突破计算能力的极限,要求设备每天能够处理数百TB字节。
解锁新科学
海量的新数据将使天文学成为比以往任何时候都更加需要合作和开放的科学。多亏了互联网档案,强大的学习社区和新的拓展计划,普通人现在可以参与天文学研究。例如,通过计算机程序Einstein@Home,任何人都可以利用他们计算机的空闲时间来帮助寻找来自黑洞碰撞的引力波。
Einstein@Home
对科学家来说,这也是一个激动人心的时刻。因为研究物理现象时间尺度太宽广了,远远超过了正常人类生命长度,实时观察它们是不可能的。像星系合并这样的事件,可能需要数亿年的时间。我们所能捕捉到的只是一张快照,无法看到它们的全过程。
然而,也有一些现象发生在更短的时间尺度上,只需几十年、几年甚至几秒钟。这就是科学家在新研究中发现成千上万个黑洞的方式,他们意识到,自从20世纪90年代首次探测到以来,来自附近矮星系中心的X射线辐射正在消失。这些新发现表明,在跨越几十年的档案数据中,将会发现更多的信息。也可以说,天文学在目前以及未来要面临的最大问题是海量的数据。