人类现存于世的语言有六七千种之多,哪一种是效率最高的语言呢?法国里昂大学的语言学家给出了一个衡量标准——信息率,即在相同时间内表达的信息量的多少,信息率越大,效率就越高。2010年,他们选取了世界上讲得最多的7种语言:英语、法语、意大利语、日语、西班牙语、汉语和德语,计算了它们的信息率,最后得出英语的信息率是最大的,意味着英语是最高效的,这也为英语能称霸全球找到了一个新原因。那么,具体说来,这些语言又该如何比较呢?又是什么影响了它们的速度和信息量呢?
英语PK德语
我们不妨选一个简单的句子做个比较。比如在英语中,当一位父亲说要一个小孩到他身边来时,是这样表达的:“The father said:‘Come here’”可以看到,这个语句明确说明这儿有一个父亲,他说话的动作是过去式,他表示孩子应该靠近他的位置是“here”。
那么,其他语言又是怎么表达的呢?相同的意思,德国人会说:“Der Vater sagte:‘Komm her!’”这个句子看上去与英语句子差不多,其实有很多不同,“der”表示“the”,虽然也是特指,但“der”只用在男性名词之前。如果这句话是一个母亲说的,那就要使用女性冠词,“Die”,或者一个孩子的,要用到中性词“Das”。
那我们再看看表示“说”的动词“sagte”,这个词其实表示的是第三人称的过去式。如果主语是第一人称,比如你,那将是“sagtest”。在英语中,这些形式过去式并不会变化,无论你我他,“说”的过去式都用“said”表示。
再看另一个差异,“her”意思是“to here(到这里)”;如果想表达“这里”,德语会有一个不同的词语:“hier”。
从这个德语句子里我们能看出什么不同呢?可以看出,德语要求我们更加注意人和物体的性别,注意到是我还是你、她、他或者我们、他们发出的动作。它也需要人们辨别的不仅是说话人在哪儿,而且是否这个人正在靠近或者远离。这样对比下,一个相同的意思,德语信息量不大,反而单词量更多,意思重复。比如既然有单词表示父亲的意思,前面表示性别的词语完全可以省略。所以,德语比英语更复杂,也更不简洁。里昂大学的研究显示,德语的信息密度只有0.79,音节率只有5.97,而英语信息密度达到0.91,音节率为6.19,总体的信息率比德语高0.18,所以更有效率。
汉语的效率
那么,汉语又是如何表达的呢?很简单,一句话:“父亲说:到这儿来!”和英语一样,汉语对父亲的性别没有特别指明,动词“说”也没有暗示说话者的人称是第一人称还是第三人称。像英语“here”一样,“这里”既可以表示在这里,或者到这里来的意思。
然而,比起英语,汉语更具暗示性,比如父亲的前面没有定冠词“the”,而且也没有标出时态,“说”这一动词的过去、现在、将来时的时态都是一样的。这就说明汉语比英语的象征性更强,语言用得更简洁。里昂大学的研究也显示,汉语的信息密度为0.94,是七种语言中密度最高的。那么,汉语为什么反而没有成为这几种语言中最有效率的语言呢?这是因为汉语在语速上败给了英语。研究显示汉语的音节率为5.18,而英语则高达6.19,综合衡量,英语的信息率为1.08,汉语则为0.94,略高于德语。
然而,这样的比较还是小范围的比较,那么,世界上其他的语言又是怎么样的呢?
最没效率的语言
如果有人要设立一个“最没效率的语言奖”,大概卡巴尔达语可以获此殊荣。卡巴尔达语也被称为切尔克斯语,属于高加索语言体系,主要在土耳其及中东的一些地方使用。它能力压群雄成为最没效率的语言的原因是一个单词的意思会大量重复。
比如,英语里有个句子是“The men saw me”,鉴于卡巴尔达语表达这个意思的句子实在太长,我们仅挑选一个词来做个比较。比如“saw”(看见了),对应的卡巴尔达语是s?q’ay??aa?w?a?ha?(大致发音像英语“SUCK-A-LAGH-A-HESH”)。我们知道语言的书写都是千奇百怪的,世界上也可能有比卡巴达尔语更长的单词,但为什么说它很没效率呢?这个也是有原因的。
在解释这个问题前,我们需要看看另外一个类似的英语单词,supercalifragilisticexpiadocious,这个单词由34个字母组成,出自1964年美国电影《欢乐满人间》的插曲,实际上可以拆分成五个单词:super(非常,超越),cali(美丽),fragilistic(易碎的),expiali(补偿)和docious(可教育的),组合在一起的意思是“用易碎的美丽补偿可教育性的缺失”。s?q’ay??aa?w?a?ha?跟这个组合的原理很类似,也是由不同意思的字根组合起来的。然而,为什么英文中这个有34个字母的词不能说是没效率的呢?这是因为卡巴尔达语这个单词并没有像这个英语单词传达那么多的意思,反而在一个问题上反复纠结,实在像一个裹脚布又臭又长。
比如,“s?q’ay??aa?w?a?ha?”,绝不是简单的“看见”的意思,它的一些字根重点强调的是“我”被看见了,其实整句话里已经有一个单独的词语表示“我”。然而,不止这一点,还有其他的字根重点强调看见我的是那些男人而不是别的人,尽管整个句子会阐明是那些男人们(复数)看见了我,还是有字根强调“我”是被多个人看见。另一些字根则强调这个事件发生在过去而不是现在或未来,然后还有的字根会暗示这个人没有开玩笑,他真的在说他正在说的事情。
总之,一个简单的英文单词“saw”,换成说卡巴尔达语的高加索人表达,他用了一个词“s?q’ay??aa?w?a?ha?”,他不仅表达看见了的意思,还在强调“看见的是“我”、是许多人看见的我,我没有开玩笑”等等,是不是看得有点绕?很明显,卡巴达尔语包含了太多重复的无意义的信息,很啰嗦,所以当之无愧地被评选为最没效率的语言。
最有效率的语言
见识了世界上最没有效率的语言后,世界上最有效率的语言又是哪一种呢?
这个奖项可以颁给印度尼西亚的某些方言,这些语言很少被书写,但几百万人使用它来交流日常生活信息。例如,在印尼的苏门答腊,一些方言就特别地省事,比如,“ayam”意思是“鸡”,“makan”表示“吃”的意思,但“ayam makan”这句话,不仅仅可以表示“鸡正在吃”的意思。根据上下文,“ayam makan”可以有几十种意思,可能意味着“一只鸡正在吃”,“一群鸡正在吃”,“一群鸡将正在吃”,“鸡在吃”,“一群鸡吃了”,“有人正在吃鸡肉”,“有人正在等着吃鸡肉”,“那只正在吃的鸡”、“鸡正在吃的地方”、“当鸡正在吃的时候”……可以看出,“ayam makan”这一句可以不分时态、不分单复数,甚至连主语都可以不分,到哪儿都通用,确实简洁又实用。
终极语言
这就说明印尼语就应该是用于交流的最佳语言吗?这倒不尽然,在人类语言中,语言学家们认为任何一种语言其实都比实际需求所需要的都稍稍复杂点,随意性和多义词无处不在。所以,如果要想寻找一种人类交流的最佳语言,我们应该可以创建一个新的人工语言,宗旨是“逻辑、简洁、信息量大”,同时最大限度地减少模糊性、不合逻辑、冗余性、多义词和随意性。
有趣的是,还有人真的发明了这种语言Ithkuil,由俄罗斯的一个语言博士创造,他发明语言的初衷是消除交流过程中的所有模糊性,历经30年完成。由于高度抽象性,Ithkuil被称作是世界上最简洁也最难的语言,比如Ithkuil语言的一个句子是这样的:
Aukkras êqutta ogv?u?a tnou’elkwa pal-l?i augwaik?tülnàmbu。
翻译成英文是这样的:
An imaginary representation of a nude woman in the midst of descending a staircase in a step-by-step series of tightly-integrated ambulatory bodily movements which combine into a three-dimensional wake behind her, forming a timeless, emergent whole to be considered intellectually, emotionally and aesthetically。(在一幅假想图上,一个裸体女人在下楼梯的过程中,一步一步行走时,身体的模糊运动在身后组成了一个立体的虚构轨迹,形成了一幅永恒的浮动的画面,兼具理性、感性和美感。)
很明显,Ithkuil语信息密度更大,解读意思更像是一个高级智慧生物的智力游戏,因为语调、字形、哪怕是间隔符都已经参与进来制造意义,这种高度抽象性的语言也被视为目前为止最有效率的语言。然而,由于难度太大,即使发明者也没法讲流利。所以,目前这种语言实用性不大。
本文源自大科技*百科新说 2016年第11期杂志文章