互联网的数据到底应该归谁?

2021年4月19日,上海车展上一位特斯拉车主身穿“刹车失灵”白T恤站上车顶维权。特斯拉方坚称,刹车未失灵,对方搞事情。紧接着,网络媒体上掀起了一场声势浩大的“讨特”运动。

公众舆论迅速聚焦到一个点:行驶数据。

三天后,特斯拉对外公布了车辆事故发生前一分钟的数据。数据显示,刹车前车辆时速为118.5千米每小时,驾驶员刹车后车辆持续降速,时速降至48.5千米每小时时发生碰撞。从第一次刹车到碰撞间隔时间约为4.5秒左右。

数据公布后,吃瓜群众逐渐散去,热度迅速滑坡。但是,车主家属指责特斯拉侵犯个人隐私权,要求撤销数据。同时,也有一些人质疑,特斯拉可能修改过数据。

这起特斯拉维权事件终于把数字经济的关键问题推到了前台:数据的产权界定、隐私保护以及风险监管。互联网平台垄断的关键问题,不是市场支配地位和巨额补贴,也不是资本泛滥和无序扩张,而是垄断和滥用私人数据。大数据杀熟、信息茧房以及网络信贷问题,根本上是私人数据被平台垄断和滥用。如今,无人驾驶汽车的数据问题似乎更加急迫——直接关系到驾驶生命安全以及事故责任的认定。

数据产权到底应该归谁?

第一类信息是从公共信息中收集的数据。

有人认为,数据本身是公共资源,按照“谁付钱归谁”的原则,互联网平台花费了成本搜集、储存和维护大数据,大数据的产权归属应当是平台。按照这种观点,特斯拉的车辆行驶数据的产权不归车主,而归特斯拉。

在大千世界中,宇宙中的火星、道路上行驶的汽车和全球流行的新冠病毒,都是一种信息的存在。这些信息是无主的公共信息。但是被收集的信息是有主的资源,谁为搜集的数据支付成本,数据的产权就归谁。值得注意的是,公共信息与被收集的数据是两个概念。事实上,每个人都在想方设法地收集更多更有效的公共信息,然后做出相应的决策。很多公司会将大量的市场信息形成有效的数据统计,股票交易员每天搜集大量的价格信息及行业信息。科斯表达的是帕累托最优而非产权界定,这种产权的界定原则在美国法与经济学家波斯纳的《法律的经济学分析》中有详细论述。

但是,这里有个前提,所收集的信息必须是公共信息,而非私人信息。何为公共信息?第一空间上是公共的。比如,你可以在大街上统计多少人穿耐克鞋,但是不能侵入私人家庭窥探。你可以在股票市场上统计量价信息,但不能侵入私人账户窃取信息。第二对象上是公共的。比如,你可以统计多少男人或女人进店,但是不能跟踪偷拍某个客户或每一个客户的购买行为。为什么私人空间和私人对象上的数据收集是不正当的?因为私人空间和私人对象具有产权归属,比如私宅和隐私权。这些数据,即便是花费成本获取的,也是不正当的,属于对他人的产权构成侵害。

第二类信息是因交易及服务必要而提供的个人数据,如个人身份证、联系方式等。所谓交易及服务“必要”,主要是为了降低交易费用。比如,双方提供身份证、营业执照有助于降低信任成本。又如,住酒店登记身份证,乘坐飞机过安检检查包裹,都是为了降低交易风险。

所以,交易者会“让渡”出部分个人信息(权益)以降低交易风险,或换取公共安全。但有人误以为个人信息在这次交易中也被交易出去。其实不是,这些信息的产权依然是个人,产权没有发生变化。个人之所以提供信息,是为了促进交易,降低风险。对方以及任何个人,未经当事人允许不得占有和使用他人数据。这一点是明确的,比如我们在签署合同附个人身份证复印件都会注明“仅限于本合约”或“复印无效”。这么做的目的是防止个人信息被滥用。

第三类信息是因交易及服务而产生的数据,比如交易价格、交易数量、付款周期及合约信息。这类信息的归属权在交易双方,由双方协商是否公开交易价格及合约信息。在一些交易中,双方约定不公开价格。通常,为了降低交易成本,很多人愿意公开价格,但不公开交易个人信息。比如,深圳用指导价调控楼市后,交易价格迅速消失,给交易带来不便。又如股票交易市场,我们可以看到每一笔交易的价格,但是无法知晓交易对象及更多个人信息。但是,交易所为何要求大宗交易公开信息?道理与上面类似,为了降低大宗交易的风险,避免内幕交易,上市公司及大宗交易对象需要做到信息公开。这相当于公开部分信息来促进交易。

以智能驾驶汽车为例。特斯拉的优势是拥有几百万台汽车每天在道路上行驶,它可以获得大量真实的行驶数据来提高它的智能驾驶技术。哪些数据该收集,哪些数据不该收集?数据的产权归谁?

特斯拉可以通过外部摄像头和传感器收集外部公共信息,比如识别道路上的行人、汽车、红绿灯、危险物等。这些针对外部公共信息收集的数据归属于特斯拉。无人驾驶系统正是通过对外部信息的收集、识别及处理,然后做出驾驶决策,从而提高安全性。如果车主危险变道和跟车太近,特斯拉辅助驾驶系统都会报警,如果车主没有采取措施,该系统会强行干预。

斯坦福教授吴恩达曾在谷歌无人驾驶汽车项目中建立人工神经网络。这个网络具备深度学习的功能,它在YouTube上看一周的视频后,可以自主学习识别哪些是猫的视频。这个技术如果运用到无人驾驶汽车上,可以用来识别车辆前面的物体是猫还是小孩,帮助无人驾驶系统执行合理避让。

但是,无人驾驶汽车不能在未经车主允许的情况下对内实施监控,收集车主的个人行车数据。车主的个人行车数据,包括行车里程、行车位置、行车速度、刹车次数、变道次数、乘坐人数、车内对话、交通事故、违章次数、保养维修、驾驶习惯等等。

不过,其中有些个人信息,因交易及服务必要而需要向汽车厂商提供,比如对行车速度、发动机、安全带、油量电量的监控数据。汽车在交易结束后,服务才刚刚开始,汽车厂商对汽车安全负有一定的责任,对必要的行车速度、发动机安全等数据进行监控,并起到提醒作用。如今,对这些安全数据的监控已是汽车产品质量标准。

智能驾驶汽车对数据的依赖性更大。无人驾驶或辅助驾驶,不仅需要外部数据,还需要大量的个人行驶数据。比如,辅助驾驶系统采取紧急避让,必须结合当时行驶的车速来判断。又如,辅助驾驶系统会分析车主的不良驾驶习惯并加以提醒和纠正。而这些都依赖于对个人行驶数据的监控、搜集及处理。

问题来了,哪些是因交易及服务必要而提供的个人信息?车内对话、乘坐人数、个人肖像不属于交易及服务“必要”。不过,美国联邦通信委员会许可特斯拉及五家公司使用雷达传感器,在可疑活动发生时对车内人员及环境进行监控。

除了普通汽车涉及的安全数据外,智能驾驶“必要”数据或覆盖行车里程、行车位置、行车速度、刹车次数、变道次数、交通事故、违章信息、保养维修、驾驶习惯等大量数据。

这类数据的产权归属是个人,只是目前尚无法律或制度来保证这类数据不被滥用。

文 | 智本社

智本社 |一个听硬课、读硬书、看硬文的硬核学习社。微信搜索「智本社」(ID:zhibenshe0-1),学习更多深度内容。