摩尔斯电码将日常语言转换成了适合通过电线实现近乎即时传递的信号,它让19世纪的普通人适应了编码的概念:那并不是普通的字母表,而是一种表示其他符号的符号,是从一种抽象向另一种抽象的转换。与此类似,符号逻辑则将日常语言转换成了适合于进行代数演算的符号系统。事实上,文字、通信、密码学、符号从来都紧密相关,它们汇聚成信息的洪流,交织成复杂的网络包裹着我们。
今天展卷微信留言被点赞最多(截至6月29日中午12点)的五位读者可获赠《信息简史——一部历史,一个理论,一股洪流》一本。
撰文 | 詹姆斯·格雷克
保密文字和文字一样古老。事实上,在文字诞生之初,它对除了少数人之外的所有人来说,都是无法读解的。而随着文字的神秘性逐渐消退,人们又找到了各种新方法来试图让自己的字词显得与众不同、隐秘难懂:用字母变位法来重写单词,用镜子反转文本,或是发明密码进行加密。
1641年,英国内战爆发在即,一本匿名的小册子记录下了许多当时已知的所谓“密码术”。其中包括使用特种纸张和墨水,如柠檬或洋葱的汁液、生鸡蛋或“蒸馏萤火虫得到的汁液”,使得文字在暗处可见(或不可见);或者以各种方式打乱文字内容,如将一些字母替换成另一些字母、发明新的符号、从右至左书写,或“以某些不同寻常的顺序对字母进行变位,比如把第一个字母放到行末,而把第二个字母放到行首,诸如此类”,又或把一条讯息分在两行书写:
The Souliders are allmost famished, supply us or wee must yeild.
(部队饥饿不堪,再无补给将全军覆没。)
通过字母变位和替换,罗马人和犹太人发明了其他更加错综复杂,因而也更为隐秘难懂的保密方法。
这本小册子名为《墨丘利神,秘密而快捷的信使:关于人们如何秘密而快捷地与任意远距离外的朋友交流思想》。后来作者披露了自己的身份,他就是约翰·威尔金斯,一名教区牧师和数学家,后来成为剑桥大学三一学院院长,也是英国皇家学会的发起者之一。一位同时代人评价他说:“他是个天才,具有一颗机械般缜密的头脑……他的思考很有广度和深度……精力过人、身材魁梧、体格健壮、膀大腰圆。”他也是个思虑周到的人。在小册子中,虽然无法做到囊括自古以来所有曾经出现过的密码术,但他还是把一个17世纪的英国学者所能知晓的此类工作都搜罗了进来。这不仅是本保密文字的入门书,也是本汇编手册。
对于威尔金斯来说,密码学事关通信的基本问题。在他看来,文字和保密文字在本质上是一回事。但暂时撇开保密的问题不谈,他是这样来表述通信的基本问题的:“一个人如何以最迅速、最快捷的方式将自己的意图传递给另一个相距遥远的人。”在1641年,他所谓的迅速和快捷,还只限于一种哲学思辨。要知道,一年后,艾萨克·牛顿才会降生。他注意到,“我们常说,没有什么比思想的速度更快”。而仅次于思想的似乎就是视觉了。作为一名牧师,他认为,最快的运动肯定属于天使和灵。要是一个人可以差使天使跑腿,那么交流的距离可以是任意远。可惜我们凡夫俗子受制于血肉之躯,“无法以如此简单和即时的方式交流思想”。因此,威尔金斯写道,难怪天使的原意是使者。
作为一名数学家,他又从另一个角度思考了该问题。他试图确定,如何用一个有限的符号集(或许仅含两个、三个或五个符号)来表示整个字母表。当然,这必须通过组合的形式实现。例如,一个包含五个符号的符号集(a、b、c、d、e),其符号两两成对,就可以表示一个由二十五个字母组成的字母表:
“根据以上规则,”威尔金斯写道,“‘I am betrayed’(我被出卖了)就可以表示成‘Bd aacb abaedddbaaecaead’。”这样,即使是一个小型的符号集,在适当安排之后,也足以用来表达任何讯息。不过,使用小型符号集的话,一条给定的讯息就需要以更长的字符串来表示,而这也意味着,用威尔金斯的话说,“更多的精力和时间”。威尔金斯没有进一步解释说 25 = 52,也没有引申说 33= 27,由于,如果三个字符一组的话(aaa、aab、aac,……),就会产生27种可能。但显然他很清楚背后所涉及的数学知识,因为他的最后一个例子是一种二元编码,尽管这用字母而不是数字来表示显得有点怪怪的。
字母表中的两个字母在五个位置上的变位,会产生三十二种差异,所以即使有多于二十四个字母,它们也可以应用其上。
两个符号,五个一组,“会产生三十二种差异”。
差异(differences)一词想必在威尔金斯的读者(尽管为数不多)看来是个奇怪的措辞。但这是有意之举,并且富有深意。威尔金斯正试图接近信息最纯粹、最一般的形式,而文字只不过是其中的一个特例:“因为我们必须意识到,一般说来,任何能够创造出有效的差异,可为某种感官所感知的东西,都足以作为表达思想的手段。”这可以是“音调不同的两个钟”,或是“任何可见物,如火焰、狼烟等”,又或是号角、大炮或皮鼓。任何的差异都是一种二元选择,而任何的二元选择都可以拿来表达思想。在这里,在这份1641年不为人知的匿名专著中,信息论的核心思想浮出了人类思维的表面,却像土拨鼠一样看见了自己的影子,于是又沉没下去,消失长达三百多年。
摩尔斯电码用不同排列顺序的点、划和停顿来表示不同的英文字母、数字和标点符号。| 图片来源:Wikipedia
密码史学家戴维·卡恩将电报出现后密码学方兴未艾的时期总结为,业余爱好者的贡献。密码学不仅在某些知识分子圈子里受到青睐,在公众当中也引发了一股新的热潮。古代密码术吸引了各色人物,难题制造者、游戏玩家、数学爱好者,甚至诗歌爱好者。他们分析古代密码术,并尝试发明新的技术。理论研究者则争执于谁会成为最后的赢家,是一流的密码制作者,还是一流的密码破解者。在美国,一位伟大的密码学普及者就是爱伦·坡。在其幻想故事和杂志随笔中,他将这一门历史悠久的艺术广而告之,并津津乐道于自己在这上面的造诣。1841年,他在给《格雷厄姆杂志》的文章中写道:“我们无法想象会存在这样一个时期,在其中人们没有必要,或至少没有意愿,力图使相互之间传递的信息不为他人所知。”对于爱伦·坡来说,密码制作并不仅是一种对历史或技术的热情,而是一种执著,反映了他对人类是如何与世界交流的认识。在他看来,密码制作者和作家售卖的是同一类货物:“心灵就是一个密码;它所提供的密文越短,破解起来就越艰难。”热爱秘密是爱伦·坡的天性,他喜欢神秘甚于透明。
爱伦·坡认为,“保密通信肯定是与字母的发明差不多同时出现的”。对他而言,密码是科学与神秘学之间、理性头脑与智者之间的桥梁。密码分析(“作为一项严肃的活动,作为传递信息的手段”)要求具备敏锐的头脑和特殊的精神力量,完全可登大雅之堂,值得在学院里传授。他屡屡强调,密码破解过程是种“特别的脑力活动”。爱伦·坡自己也给读者提出了一系列替换密码难题。
爱伦·坡的小说《金甲虫》中的一段密文(cryptograph)展现了他作为密码破解者的技艺。读者可以通过英文字母的出现频率来破解这段文字。| 图片来源:Wikipedia
和爱伦·坡一样,凡尔纳和巴尔扎克也在他们的小说中加入了密码元素。1868年,刘易斯·卡罗尔设计了一种“电报密码”,它包含一个“密匙字母表”和一个“讯息字母表”,使用时根据收发双方约定并记在脑子里的一个单词密匙进行变位加密。不过,在维多利亚时代的英国,最杰出的密码分析者还是查尔斯·巴贝奇。符号替换以及意义在各种抽象之间转换的过程,是众多问题的核心关键,因此巴贝奇对于这个挑战乐此不疲。他指出:“解密艺术最奇特的一个特性就是,每个人(即使是对此一知半解的人)都坚信,自己可以构造出一种无人能解的密码。我也注意到,一个人越聪明,他的这种信念植根得就越深。”他自己一开始也是如此,但后来他投向了解密者一方。他原计划要写一本权威著作,定名为《解密的哲学》(The Philosophy of Decyphering),但最终未能完成。不过,他确实破解了很多密码,其中就包括一种多码密码——维吉尼亚密码。该密码在欧洲曾一度被视为最安全的密码,被誉为“不可破译的密码”。一如他在其他工作中所做的,他在其中也应用了代数方法,以方程的形式表达密码分析过程。但即便如此,他仍然只是个业余爱好者,并且他自己也心知肚明。
除了将代数演算应用到密码学领域,巴贝奇先前已经尝试将这种工具运用到了其更为传统的应用领域——数学,以及不那么传统的领域——机械,他曾为标记齿轮、杠杆和开关等活动部件的动作创造了一套符号语言。迪奥尼修斯·拉德纳对于这种机械记法评论道:“一旦机械的不同部件通过适当的符号能够在纸面上表示出来,研究者们在思考时就可以完全抛开机械本身,而把注意力完全放到符号上去……这是一套近乎形而上学的抽象符号系统,借助它的帮助,动手即是动脑。”
查尔斯·巴贝奇更为人所熟知的成就是发明了自动化数学机器,差分机与分析机。差分机以齿轮运转带动十进制的数值相加减、进位,从而求出多项式方程的结果。| 图片来源:Carsten Ullrich
而两个更年轻的英国人,奥古斯塔斯·德摩根和乔治·布尔,则把相同的方法论应用到了更为抽象的逻辑命题之上。德摩根是巴贝奇的朋友、爱达的老师,也是伦敦的大学学院的教授。布尔出身于林肯郡的一个修鞋匠和女仆家庭,到了19世纪40年代,最终成为科克的女王学院的教授。1847年,他们在同一天各自出版了堪称自亚里士多德以来逻辑学领域最伟大的里程碑式著作:布尔的《逻辑的数学分析》和德摩根的《形式逻辑》。这个小众的领域可是沉闷了很长一段时间。
德摩根更熟悉该领域的学术传统,布尔则是位更具创造性和自主精神的数学家。多年来,他们通信交换意见,讨论如何用代数符号来表示语言,或真理。X可以代表“母牛”,而Y代表“马”。这可能是一头母牛,或所有母牛的集合中的一个元素。(两者等价?)这些符号可以像在代数中一样操作。XY可以代表“所有既是X又是Y的事物的名字”,而X,Y代表“所有或是X或是Y的事物的名字”。再简单不过了——不过别急,语言可没有如此简单,种种复杂情况会突如其来。德摩根写道:“现在有些Z不是X,也就是那些ZY,但ZY并不存在。你或会说,不存在的不是X。但一匹不存在的马甚至不是马,(更进一步地?)也不是一头母牛。”
不过,他接着不无希冀地补充道:“但我不怀疑你会找到办法,为这种新的负值赋予意义。”最终他没有寄出这份草稿,但也没有丢弃它。
布尔设想的体系是一种不包含数的数学。他写道:“逻辑学的公理,即仅靠它们就可以构建出逻辑科学的那些定律,其形式和表达都是数学的,尽管不是计量的数学:这是一个事实。”其中允许使用的数只有0和1,用以表示全无和全有:“符号0和1在逻辑体系中的相应解释是空类(Nothing)和全类(Universe)。”在此之前,逻辑学一直从属于哲学;而现在,布尔要代表数学将逻辑学收入麾下。为此,他设计了一种全新的编码形式,其码本融合了两套抽象的符号体系:一套是从数学的形式主义中借用的字符,如p 和 q、+ 和 -,以及大小括弧等;另一套则是通常用含糊多变的日常语言表达的运算、命题和关系,如表示真和伪、类的个体、前提和结论等的字词,以及各种“小品词”,如if、either、or等。布尔理论的部分要点如下:
“
语言是人类理性的工具,而不仅仅是表达思维的媒介。
所有语言的组成元素都是记号或符号。
词即记号。有时它们被用来代表事物;有时则代表运算,思维借此可将简单概念组合成复杂概念。
词……并非是我们能用的仅有的记号。任意的可见标记,以及任意的声音或动作……都同样能够作为记号使用。
”
而将一种抽象转换成另一种抽象的编码也有其功用。对于摩尔斯电码而言,这个功用就是把日常语言转换成了一种适合于通过铜线实现近乎即时传递的形式。对于符号逻辑而言,新的形式则要适合于进行代数演算。这些符号就像一个个小容器,保护其中脆弱的货物免遭日常交流中的风雾侵扰。对于以下这个布尔常举的例子,试比较哪种形式更可靠,是将命题写成如下公式,
1 - x = y(1 - z) + z(1 - y) + (1 - y)(1 - z)
还是用如下日常语言表达?
不洁净的走兽包括所有分蹄却不反刍的、所有反刍却不分蹄的,以及所有既不分蹄也不反刍的。(上面式子中的各符号的意思为,1:全类;x:洁净的走兽;y:分蹄的走兽;z:反刍的走兽。——编者注)
这种可靠性在很大程度上是来自于将字词的意义剥离而只留下符号。在这里,记号和符号并不仅仅是占位符,还是运算符,就如同机器中的齿轮和杠杆一般。语言,说到底,也是一种工具。
语言至此被视作服务于两种独立的功能,既是表达的工具,也是思维的工具。人们一般假定,其中思维在先。对于布尔来说,逻辑就是思维,是思维经过打磨和提纯的结果。因此,他选择将1854年出版的杰作起名为《思维的规律》(The Laws of Thought)。同样,电报操作员们也隐约感到他们收发的讯息会对人们的思维产生影响,这恐怕并非巧合。1873年,《哈泼斯》的一位随笔作家这样写道:“单词在思考者将它用作沟通思维的信号之前,首先是作为一种思维工具而存在的。”
电报将给人类思维带来的最广泛也最重要的影响恐怕来自于它对于语言的影响……类似于达尔文提出的自然选择原理,在语言使用中,短词将逐渐对长词占有优势,直接表达形式将逐渐对间接表达形式占有优势,含义清晰的字词将逐渐对模棱两可的字词占有优势,而地方性的习语在任何地方都将处于劣势。
乔治·布尔(George Boole)的书《思维的规律》上面写着,逻辑与概率的数学理论建立在这部书的基础之上。
不过,布尔在当时影响并不大,其重要意义在一段时间后才会被认识到。他与巴贝奇仅有过简短的通信,两人素未谋面。他的支持者之一是刘易斯·卡罗尔。在《爱丽丝梦游仙境》出版四分之一个世纪后,在人生行将终结之际,卡罗尔写了两卷以符号逻辑为主题的书,其中包含指南、谜题、图表和练习等。尽管他使用的符号无可挑剔,但其应用的三段论却不乏幽默:
1. 婴儿是不讲逻辑的;
2. 没有一个会调教鳄鱼的人被鄙视;
3. 不讲逻辑的人被鄙视。
(结论)婴儿不会调教鳄鱼。
到了19、20世纪之交时,伯特兰·罗素给予了乔治·布尔非同寻常的赞颂:“纯数学是由布尔在其《思维的规律》中发现的。”这句话经常被人引用。不过,真正使其赞颂非同寻常的却是紧跟其后但很少被人引用的批评:
他也错误地以为自己是在讨论思维的规律。但事实上,人们实际是如何进行思考的问题与他的研究并不相干,况且要是他的著作真的包含思维的规律,那么奇怪为什么此前没有一个人用这样的方式来进行思考呢?
这不由让人感到,罗素对悖论还真是乐此不疲。
本文经授权取自《信息简史——一部历史,一个理论,一股洪流》
特 别 提 示
《返朴》,致力好科普。国际著名物理学家文小刚与生物学家颜宁联袂担任总编,与几十位学者组成的编委会一起,与你共同求索二次转载或合作请联系fanpu2019@outlook.com。