从你的说话方式或者写出来的文字之中就可以预测出你未来的精神状态,甚至是精神错乱——这么说感觉有点玄。但是,在一场精彩的演讲中,神经科学家马里阿诺·西格曼,透过古希腊书籍及对内省来源的分析,他发现在我们的话语中可以反映出我们的内心世界,并讲解他如何用文字地图的演算法,预测精神分裂症的发展。也许你觉得不可思议,但是看过视频你可能就会发现,原来科学研究如此神奇!
我们有历史记录可循,可以让我们知道古希腊人如何穿着、如何生活、如何打仗……但是他们如何思考呢?有一个很自然的方法就是,去探索人类最深处的想法——我们的想象力、自觉力、梦想力是否是一样的。另一种看法是,去探索我们文化的社会变革,这些变革也许就是改变人类想法的主要因素。
3000年前的人类是精神分裂患者?
裘利安·傑尼斯在上世纪70年代,发表了一个相当大胆激进的假说:他说,3000年前的人类,是我们现在俗称的精神分裂症患者。他会如此主张的原因是,在世界各地不同的传统及地方,这些书籍里面所描述的人类行为似乎都不约而同地会服从。他们认为是众神在那边传来的声音。而如今,我们会称之为“幻听”或“幻觉”。随着时间的洗礼,他们开始认识到那些声音是他们自己创造的,他们就是那些内心声音的主人。有了这样的认知,他们学会了自省:一种反思自己想法的能力。
所以,傑尼斯对“意识”的理论就是,至少现在我们觉察到“意识”、感受到我们自己就是人生导师的感悟。这理论相当特别,它是建立在极少有特定的案例上。
所以问题是,3000年来人类才能建立起自省能力的这个理论,是否可以经得起“量化”且“客观”的考验。至于要如何做的问题,也是相当简单明了。但我的意思并非如此,比如,柏拉图有一天突然醒来说,“哈喽我是柏拉图,我今天,拥有完整的自省意识了”那样的简单而已。
词汇之间怎么建立关系架构?
说完自省意识后,我们再来聊聊第二方面:词汇之间如何建立关系架构。举个例子,“狗”、“猫”应该是比较有关系性的,但“葡萄柚”和“对数”就没什么关系了。而在这个空间里的任何两个字,都必须是可以被测量出来的。而我们有很多方式,可以建立起这些字的空间架构。方法一,是只要请教专家就行了,有点类似查字典。另一个可行方法是,当两个字出现关系性时,去追踪它们的预设状况,它们可能会出现在同一句、同一段或同一文件中,多于“偶然”地出现。在这个简单的前提下,这个单纯且带有运算技巧的方法必须好用,而这个复杂且高维度的空间,事实证明,相当有效。
演算法也可以把我们要整理的概念分门别类出来。举个例子,你可以看到科学的词汇被拆解成两个子类,分别是太空与物理的词汇。然后你会发现一件好玩的事,举个例子,“天文学”这个词汇,它应该摆的位置与它现在的位置好像不太搭噶,它现在介于真实科学与天文学之间,偏向科学的位置,而它自己却是一个天文学的词汇。我们可以继续找其它类似的情况。
实际上,如果你盯着这些字一阵子,然后随机搭配链接一下这些字,你会觉得好像自己在吟诗。那是因为,在某种程度上,在这些空间词汇里漫游,就像是脑海中吟诗一样。最后,演算法也能辨认出人类的直觉词汇。并归纳到内省的相邻词汇中。举个例子,像是自我、内疚、理由、情绪与内省相关的词汇非常接近,但其他的字,像是红色、足球、蜡烛、香蕉就差很远了。
所以,一旦我们建立起了这样的词汇空间,有关于内省的历史,有关于任何概念的历史,以前被认为是抽象或是有点模糊的词汇,都可以变成扎扎实实可以被量化的科学。而我们要做的就是,拿起这些书,把它们数位化,然后把这些字,像子弹一样射到这些词汇空间里面,然后我们问电脑,这些词汇所行径的轨迹。
从词汇空间中我们能看到什么?
有了这些数据我们就可以分析古希腊传统中,有关于内省的历史,因为有最完整的文字记录。所以,我们先把这些书,按照时间排列,然后把这些字投射到词汇空间里面,然后我们问电脑,这些词语内省有多少相关性,再把它们平均起来。然后我们不断地问电脑问题,这些书就会越来越接近内省的概念。而这正是古希腊所发生的事。
这个方法相当重要,因为圣奥古斯丁已经被多位学者、心理学家、历史学家公认为是内省的创始人之一。有些人认为他是现代心理学之父。所以,我们演算法的优点不仅可以量化、而且客观、当然速度也相当快——几秒就可以跑完——并捕捉到。若使用传统方法,必须费长时间调查才能抓到一些重点。这也是科学美好的地方,它可以解读、归纳这些想法,然后广泛应用在许多不同的领域上。
或许,最具挑战性的问题是,我们用电脑来分析过去的自我意识发展方法,是不是也可以告诉我们自我意识的未来趋向呢?
词汇信息是这样检测人类的精神状态的!
同样的方式,我们现代很多人都使用穿戴式测试器,可以检测我们的心跳、呼吸、基因,让我们可以预防疾病的发生,我们是否可以借由检测分析我们所说的话、推的文、邮寄的信、写的文字,来提前告诉我们,我们的心智可能要发生问题了?我(注:本文作者)跟我的兄弟,吉列而莫·切基,扛起了这项任务。我们记录分析了34位年轻人的谈话。他们过去曾经是罹患了精神分裂症的高风险族群。我们测量了他们第一天的谈话,然后问电脑,从他们的话中,是否可以预测出,未来三年内,他们会不会精神错乱。但我们大失所望,一次又一次的失败。因为没有足够的语义资讯来预测未来的心智发展。它在分辨精神病患及控制组上已经有足够的能力,因为这有点像我们之前做古文字的分析,但并没办法预测未来精神错乱的发病。
后来,我们了解到,也许最重要的关键不是他们说了什么,而是他们怎么说。更精确地说,不是他们说的“话”落在哪个语义相近的群组里,而是他们说话的“方式”是否会在这几个语义相近的群组里快速地跳来跳去。所以我们想出了一个叫做“语义连贯性”的测量方法,本质上就是测量谈话的持续性,是否会落在同一个语义主题或类别上。结果显示,刚刚的34位年轻人,透过这个语义连贯性演算法,预测谁会精神错乱的正确率达到百分之百。
目前,临床上所有测量方式都无法达到、或接近这个数字。在我做这项研究的时候,清楚地记得一件事,当时我坐在电脑前,看到之前我回到布宜诺斯艾利斯的第一个学生——保罗,传了一堆信息给我,当时他住在纽约。我发现讯息不大对劲——虽然我讲不出个所以然来,因为他写得不清不楚——但我有一个强烈的直觉,一定是出事了。
所以,我打电话给保罗,没错,他当时感觉不太舒服。用这样一个单纯的辨认方式,从他的字里行间,可以隐约感受到他的感觉,并在第一时间有效地帮助他。今天我告诉各位的是,我们已经越来越能理解如何把我们共有的直觉,转换成演算法。经由这样做,未来我们也许可以看到一种全然不同的心理健康模式,而且是基于一种客观、量化的方式来自动分析出我们所写的字、我们所说的话,这将非常值得期待。
编辑:张旭 薛燕男
本文系原创作品
转载及商务合作请联系 jiangq@cast.org.cn
投稿请联系xueyn@cast.org.cn