大数据时代的经济计算
近年来,无论是居庙堂之高还是处江湖之远,“大数据”都是热度极高的流行词。人们在为大数据时代的到来欢呼的同时,似乎有一种欲将大数据神化的倾向,如认为大数据可以增强经济预测能力、改变商业模式,甚至预防犯罪。大数据神话的一个新变种,是一位在中国极有影响力的企业家不止一次地宣称,随着大数据的普及应用,计划经济将会越来越大。如果只是借此噱头为自己的大数据产业做些宣传,做出此等大胆预言倒也情有可原。可是,此预言关涉到经济思想史和经济史的百年之争,远不是为自家赚些眼球那么简单。
一
从社会科学的意义上说,大数据是相对于传统的以随机抽样为统计学基础的小样本数据而言的,是包含了所有相关数据的全集数据。大样本数据的产生以数据采集技术的发展,尤其是互联网技术的进步为前提。我们日常接触最多的大数据的代表,无论是脸书(Facebook)、推特(Twitter)、微博等社交网络的大数据,还是谷歌和百度等搜索引擎的大数据,再或是优步(Uber)和淘宝等网络商业平台的大数据,抑或是支付宝和微信支付等互联网金融平台的大数据,都是以互联网的技术进步和普及应用为基础的。抛开所谓的4V或是5V的说法,大数据的特征无外乎是数据量特别大(全数据)以及数据的获取和处理速度特别快(现时数据)。声称大数据能够复兴计划经济的人士显然是相信,启动关于经济活动的集中计划的关键信息就蕴藏在大数据之中。
那么,大数据真的能与计划经济无缝对接吗?回答这一问题的前提是要正确理解计划经济的理论逻辑与历史经验。马克思并没有提供关于计划经济的可操作的方案,计划经济的真正探索始于列宁和斯大林在苏联的实践,而对于计划经济的理性计算问题的理论反思则源于二十世纪二三十年代的“社會主义经济计算的论战”。
上个世纪二三十年代经济计算的论战是从价格问题开始的。奥地利经济学家米塞斯和哈耶克认为,由于计划经济取消了市场,所以不可能有价格。因此,中央计划经济下没有任何可以用于经济计算的数据信息,所以无论是个人还是中央计划部门都会发现“理性计算的不可能”。
波兰经济学家兰格等人的回应是提出了“市场社会主义”的方案,按其设想,中央计划部门的角色等同于瓦尔拉斯模型中的拍卖人,通过不断的试错获得正确的价格。且兰格相信,完全可通过计划部门收集的市场供求不平衡的信息来获得影子价格。
“二战”后大型计算机的推广似乎使得兰格的理论设想更接近现实可能,原则上我们可以高速计算出瓦尔拉斯方程组的解值。如今大数据时代的到来仿佛让兰格的设想离现实又近了一步,大数据可以大大降低计划部门获得方程组的变量信息的成本(不再需要层层统计汇总,而只需要一台联网的电脑)。但是,按照奥地利学派的观点,兰格的方案仍只是一个理想化的乌托邦,其原因是:求解方程组只回答了计划经济的工程学问题,而让计划经济有效运转—计划部门能够做出统一的理性计算以代替分散的个人决策—的经济学问题则要比工程学问题复杂得多。在米塞斯和哈耶克看来,计划经济体制下实际决定要素在各个企业间分配的是投入—产出的技术性关联(或者说是生产函数),而不是真实的市场价格所反映出的要素的稀缺性。更重要的是,从作为静态均衡的结果的角度来理解价格实际上是一种认识论偏误,价格不仅可以表现稀缺性,更可以激励企业家创新和促进知识的运用。计划经济的失败恰是因为资源配置的无效率和激励的缺乏。
那么,大数据时代的到来,又会给传统的经济计算之争增添哪些新的元素呢?
二
搜集分散化的经济信息并将其转换为可以计算的“数据”是实现计划经济体制下理性经济计算的前提。可是,大数据能否帮助我们达成这一前提呢?从技术上说,大数据确实可以收集与经济活动相关的海量信息(甚至是“全数据”),但是,运用大数据收集信息的实际操作要比理想情况困难得多。
我们先从一个最简单的经济学的情境—不存在任何信息变化的静态均衡状态,即哈耶克的所谓的“给定数据”的情况—来讨论大数据获得完备经济信息的可能性。在此情境下,如果大数据技术真的可以获取关于经济活动的“全数据”,那么其在原则上可以代替市场价格机制,从而实现科学理性的计划经济。但问题是,大数据根本不是什么真正意义上的全数据,而是有偏的选择性样本数据,很多时候甚至在数据质量上弱于随机抽样的小数据。首先,大数据所获得的信息是有噪音的—在很多互联网商业平台上,都存在网络水军“刷回复”“刷好评”“刷订单”的现象。由于制造噪音的低成本高收益,数据噪音往往比有效信息增长得更快。其次,大数据所获得的信息有样本选择性偏误。网络用户有显著的年龄和学历特征,故互联网大数据无法体现统计意义上的代表性(例如,女性是“双十一”在淘宝网上购物的主力,知识分子较多选择国外的搜索引擎)。再次,大数据无法获得某些关键的经济信息。许多家庭内部的决策(如教育资源在子女间的分配)和企业内部的决策(如中低层职位的变动)信息是无法在网络上通过大数据获得的,但这些决策显然具有重要的经济意义(影响人力资本积累和企业生产效率)。
显然,大数据在技术上无法保证获取足够丰富的高质量的经济信息,从而无法为计划经济的理性计算提供数据支撑。
不仅如此,一旦我们跳出最简单的新古典经济学模型,我们就会发现:那种认为大数据可以复兴计划经济的观点,实在是体现了对知识在市场运行中的作用的不充分理解。哈耶克提醒人们注意一个常识:在任何经济体制下,用于经济计算的数据化信息,都属于分散的个人知识,即我们每个人都只掌握关于市场的极小部分的知识。区别于可以成为公共知识的“科学知识”,这种分散的个人知识被称为在特定时空下有关各种“情势的知识”。因此,与存在劳动分工一样,需要有所谓的“知识分工”。
那么,情势的知识如何才能被有效利用呢?答案是市场的价格机制。从功能上看,市场的价格体系应被视为一种交流信息的机制。价格机制的优势在于,市场中的个人参与者只需要掌握少量信息就可以达成正确的行动。即是说,市场价格机制使得我们可以形成自发的交流,以最低的信息成本使个人所掌握的各种分散知识得到有效的利用。所以按照哈耶克的观点,以大数据来复兴计划经济完全就是“世上本无事,庸人自扰之”。
当然,如果一个计划部门真的搜集了全部的相应信息且其质量可靠(姑且不考虑信息的搜集成本),那么在逻辑上也可能达到与市场价格机制同样的效果。但是,一方面,正如我们已经说明过的,现有的大数据技术并不能搜集到全域和保质的信息;另一方面,更根本的是,哈耶克所说的分散的个人知识在很多时候是一种“默会知识”,其在逻辑上不可能被包括大数据在内的任何信息获取技术所得到。
在一九六○年的《自由秩序原理》和七十年代的三卷本的《法律、立法与自由》中,哈耶克吸收波兰尼的“默会知识”概念,丰富了其对知识问题的理解。默会知识不仅具有分散的个人属性,更重要的是其无法被充分地向他人描述,即那是一种关于“怎么办”的知识而非“那是什么”的知识。故而面对默会知识时,我们所能知者远甚于我们所能言者。例如,学习游泳、骑车、弹奏钢琴乃至感受权威的学问之道等所习得的,都是不可言传的个人知识。因为在学习这类知识的过程中,我们无法用可以说明的道理来解释我们成功的原因。
默会知识的经济学含义在于,商业上的成功因素往往不是参与者所能察觉到的,且即使能察觉到,参与者也只是在实践中知道该怎么办,却无法用可被他人所理解的方式去表达。例如,在新古典经济学理论中,所有厂商的生产函数是同质的,而实际上,由于默会知识的存在,各个厂商的生产技术的知识必然是异质的个性化的,从而才有生产效率的差异。类推之,在销售、财务、组织生产等领域都没有给定的关于生产技术和经营手段的公共知识,只有默会的个人知识,从而不会有可辨识的同质化的数据信息。
既然默会知识无法被外部观察者所理解,那么他人就更不可能利用任何技术手段将这种知识数据化,大数据技术也不例外—这不是技术能力的问题,而是一种逻辑上的不可能。基于默会知识的存在,无论未来大数据技术如何发达,任何个体心智或计划部门都不可能获得“完备知识”,相反,却会处于“必然无知”的状态。于是,对于任何个体心智或计划部门,让计划经济可行的知识要求都不可能经由大数据技术所搜集的数据信息达成。
三
经济学的一个元问题是“什么是市场”,这一问题对于理解大数据与计划经济的关系有莫大的意义。
對于什么是市场,主流经济学的标准定义是将市场视为一种价格决定机制,其看重的是作为均衡的市场结果,而非市场的过程。若按照这种定义,将一切经济现象(主要是均衡价格和均衡数量)大数据化当然既无逻辑不可能性,也无技术的困难。而按照奥地利学派的观点,市场不再是静态的均衡,而是动态的过程。具体说来,市场可定义为具有企业家精神和才能的参与者发现和创造知识,进而优化资源配置和实现经济增长的机制。这种对市场的理解实际上也有着非常丰厚的经济思想史积淀。
哈耶克在一九六八年发表的《作为一个发现程序的竞争》中指出,市场是通过竞争去发现知识的“发现程序”。什么是在经济学意义上有稀缺性的商品,其稀缺程度几何,都是需要在市场过程中发现的。而在新古典经济学中,这些都作为已知变量给定了。
哈耶克的同代人米塞斯及米氏弟子柯兹纳的企业家理论,为哈耶克对于市场的理解补充了主要“推动者”的部分。市场激励企业家去发现能获得利润的机会,这是一种经由市场竞争才能获得的知识。更具有“机敏性”的企业家具有一种“企业家能力”—“独立地掌握情境并达成确切的(虽然仍是非决定性的)未来想象图景的功能”(Kirzner, Israel, 1992, The Meaning of Market Process: Essays in the Development of Modern Austrain Economics, London: Routledge, p. 26)。于是,不再像配置范式中的厂商那样被动遵循价格来调节生产,企业家的行动是主动去发现价格,并进而利用自己所掌握的商品或要素稀缺性的知识优势获得利润。
只将企业家视为潜在知识和机会的发现者,仍无法表现企业家在知识创新领域的创造性角色。准奥地利学派经济学家、一九八六年诺贝尔经济学奖获得者布坎南从“激进主观主义”出发,认为企业家行为所展现的不是在“偏好—约束”框架已定条件下的被动选择,而是一种“创造性选择”,即打破市场常规的选择。即是说,企业家不仅是发现已经存在但尚未被利用的知识,而是也要创造新的知识;企业家不仅要发现被忽略的市场机会,而且也要创造新的市场机会;企业家不仅要为满足消费者的需求而生产,而且也要培育和创造消费者的新的需求。典型的创造性选择的例子就是智能手机,这显然是企业家创造出了新的知识和机会,通过改变和塑造手机市场的消费者需求而获利。
于是,企业家的角色具有双重面向:企业家的机敏性可以弥补市场中被忽略的机会,从而令现有资源的配置更为有效,此时,企业家承担的是知识和机会的发现者的角色。企业家的创造性选择则可以创造出新的知识,从而促进动态的经济增长,此时,企业家的角色变成了创新者。
在计划经济体制下,企业只是整个列宁主义社会大工厂的一个个车间,经理按照指令行动,故不可能存在真正的企业家行为。而一旦我们认识到企业家对于知识的机敏性和创造性在经济活动中的重要价值,那么任何以计划经济完全或大部分代替市场经济的想法就会即刻表露出其荒谬性。
进一步说,企业家的发现和创新行为意味着,通过大数据带动计划经济的复兴完全没有任何理论和现实的可能性。因为经济活动中的知识不是给定的,而是市场活动的参与者发现和创造的结果,这其实是一个通过市场竞争促进知识生产的过程。市场生产出的知识只有一部分是外显性质的,可以转化为数据信息;另一部分默会的知识则没有数据化的可能,所以大数据只能利用市场生产的局部的知识。退一万步说,即使在大数据时代,我们真的能够通过大数据技术获得计划经济运转所需要的全部信息(甚至包括在逻辑上不可能获得的关于默会知识的信息),我们也不能对大数据在计划经济领域的应用前景盲目乐观。因为市场在本质上并不是一个静态的均衡,而是一个发现和创造的过程,假如我们不顾知识生产的本相,强行利用大数据所搜集的残缺知识来重造计划经济,那么计划对市场的替代就会掐断知识生产的流程,令大数据变成无源之水。
四
一九七六年,面对计划经济呼声在美国的回潮,哈耶克曾经嗟叹:“一个令人遗憾又无可否认的事实是,较之其他科学门类,经济学更易于受复兴的潮流的影响。曾经被前代经济学家们成功驳倒的奇谈怪论和蛊惑人心式的大众迷信,会周期性地反复进入专业讨论。”(Hayek, F. A., 1976/1978,“The New Confusion about ‘Planning’”, in New Studies in Philosophy, Politics, Economics and the History of Ideas, Chicago: Chicago University Press, p. 232)所以,经济计算的争论实际上从未完全结束过,因为争论背后代表了一种对于理性的最高形式—集体理性的不懈渴望,哈耶克称为“致命的自负”。只不过,争论会在不同的时代以不同的面貌呈现在人们面前,故大数据与计划经济的关系之辩可视为“社会主义经济计算的论战”在大数据时代的升级版。
可是,这类大众迷信或外行预言,在喜欢热闹的媒体和爱看热闹的吃瓜群众眼中可能只是一种天马行空的大胆想象,对于专业人士来说却是“细思恐极”。按照我们在本文中所做出的证明,大数据将复兴计划经济的说法只是大数据神话的一个新变种。但是,该神话此次勾连着经济思想史上的一个长期争论,且关系到经济发展的根本理念,故让人不得不发出新的声音,把经济学前辈大师们说过的话再从故纸堆里翻出来。
俱往矣,但愿哈耶克式的嗟叹不再反复成真,但愿笔者所说的将是最后的多余的话。
作者:汪毅霖