做文职的航海者
现代社会,大数据一词越来越多地被提及,人们用它描述信息爆炸时代所产生的海量数据,也用它命名因海量数据而催化的技术创新。虽然大数据是一个崭新的概念,但其原理和应用其实由来已久,美国南北战争时期的海洋学家——马修·莫里,便是使用大数据技术的先行者。
1806年,马修·莫里出生于美国弗吉尼亚州。这位农场主的儿子,从小就争强好胜,他的哥哥是美国海军军官,为了把哥哥比下去,1825年,莫里在海军军校学习了仅1年时间,就以学生的身份加入了海军。随后的十几年里,莫里大部分时间在海上漂泊,几乎乘船周游了世界。在漫长的航海实践中,莫里切身体会到了海洋洋流以及海面风场对于航行的重要性。
1839年,莫里在乘坐马车时发生了一场意外事故,让他的腿留下了残疾,无法继续航海。于是,美国军方任命他在海军天文台做文职,主管文档、航海图和仪器库。事实证明,这次任命是将莫里放在了最适合他的地方,一个伟大的海洋科学家即将应运而生。
当初在海上航行时,莫里曾经对船长们的固执感到十分不解,他们在海上航行,墨守成规,常常会舍近求远,绕着弯走,即使遇到逆流,也不敢改道。当莫里向船长们请教这个问题时,船长们回答说,绕弯的航海路线都是以前走过的,走一条熟悉的弯路总比冒险走一条可能危险的近路要好得多。但是,莫里对这样的答案并不满意。来到天文台上任后,莫里翻看了美国海军使用的图表,发现这些文件的内容陈旧,几十年没有更新过一次,而且其中很多内容都是错误的。莫里觉得,他有必要做点什么,为航海者提供更合理的向导。
从旧日记里收集数据
然而,莫里已经无法航海,没法收集数据。他在清点仪器库时,发现那里除了气压计、指南针,还存放着成千上万本旧日记。这些日记是世界各地数千只旧船的船员们所写的流水账,莫里有些好奇,随便翻了两页,大受启发。
这些日记的内容杂乱无章,既有拗口的打油诗和潦草的涂鸦,也有对航海行程的记录,比如某天经过某地,天气如何、水温如何、有无风雨等等。莫里意识到,如果把其中的信息整理一下,就能够提取有价值的数据。
比如,西北航道是大西洋和太平洋之间最短的航道,它从北大西洋的格陵兰岛出发,经加拿大北部可以到达阿拉斯加北岸,这条航道靠近北极,很多地方是冰封的,船员们很少走这条路。但是,莫里从老捕鲸船的日记中发现,加拿大的船员们在北极附近捕鱼时可以听到鲸鱼的声音,目睹鲸鱼露出水面来呼吸,这表明那里是没有冰的,沿加拿大的北部确实存在着一条可靠的通航航道。
又比如,从纽约到里约热内卢的航线,根据以往的经验,美国船员一直被劝导先向东南航行,穿过赤道后再向西南航行,这样的航线很绕路。莫里根据加勒比海船只上的日记,发现直接向南,然后沿着海峡穿越加勒比海再向西南,这才是最佳航线,因为既无风险,又可以顺流。
于是,莫里雇佣了20多位文员,一起整合、分析航海日记。通过对这些庞杂资料的研究和解释,莫里先后出版了《海风与海流图表》《航海指南》等书籍。这些书标明了海上最良好的航线,后来多次再版,又加入了贸易、风暴、降水、鱼类、热量等数据,成为世界各国船员通用的工具书。1855年,《航海指南》再版时,书中已经整合了上百万组数据,从美国东海岸到里约热内卢的海上航程缩短了10天,到澳大利亚缩短了20天。
开拓海洋科学
莫里整合了海量的数据,自然而然会发现洋流、海风等自然现象的规律,这为他研究海洋科学打下了坚实的基础。1855年,莫里开始陆续出版海洋科学方面的著作,包括《海洋自然地理》《亚马孙河与南美洲的大西洋斜坡》《地理:我们生活的世界》等。这些书籍的内容涵盖了海洋和大气、墨西哥暖流及对气候的影响、大海洋流、信风、海洋气候等方面。
莫里对海洋科学最杰出的贡献之一是他对海风和深海洋流的系统研究。他指出,海风形成了海洋表面的波浪,深海洋流则受到海水密度和温度变化的影响,在墨西哥湾,有一股温暖的海水会穿过佛罗里达海峡,沿着美国的东部海域向北,最后跨越北大西洋通往北冰洋。莫里其实并不是墨西哥暖流以及其他洋流现象的最早发现者,但他是第一个系统论述洋流现象的科学家。
为了给航船导航,莫里绘制了标注海洋深度的地图。19世纪,科学家普遍估计大海平均深度为十几千米。莫里分析了当时最先进的深海测深法所得到的数据,证明海洋的平均深度“不会超过4.8千米”。现代科学对平均海深的估计为3795米,这表明当年莫里的估计与事实已经相当接近。莫里还进一步阐述,所谓平均深度的概念会引起误导,因为数据显示海底地形就像山脉一样高低不平,海底地形崎岖起伏的程度令人吃惊。同时,莫里首先提出了大西洋深处存在山脊的推论。
著书立说之余,莫里也积极推动科学事业的发展,他是美国科学进步协会的创始人之一,还组织参加了第一次国际海洋气象会议。1861年,美国南北战争爆发,莫里加入了南部邦联,在战争中,他致力于海防事务,发明了一种对付敌方舰艇的鱼雷。战争结束,莫里在国外流亡了几年,然后回国,在弗吉尼亚军事学院担任物理学教授,直至去世。