大数据是把双刃剑?

今天,计算机功能发展到前所未有的强大,海量数据——包括个人信息——被其搜集形成大数据库。这些数据被正常合法利用的同时也存在着被滥用的危险。

大数据的预测功能赋予了其变革我们生活的巨大潜能。在它的支持下,未来两天内天气预报的准确率将会达到95%。然而大数据一旦被滥用,用户的隐私安全就会受到威胁,经常使用互联网的人尤甚。

这些威胁是怎样产生的?我们又应该如何在保证大数据造福社会的同时应对这些日益加剧的威胁呢?

潜在问题的影响范围

首先,单纯从大数据安全事件涉及的人数来分析,其影响范围在不断扩大。2014年阿肯色大学专业发展系统被攻破,导致50,000人身份信息泄露。这个数据已经不小了,但相比同年ebay公司数据外泄事件中145,000,000人的生日、住址、邮箱及其他信息被窃取,就是小巫见大巫了。

从安全维护的专业领域来说,要保护大数据库中信息不被窃取,更是不容乐观。一定程度上,这和储存和处理信息所使用的基础技术的本质缺陷有关。

像亚马逊这样的大数据公司,对分布式计算的依赖性极大,他们往往在世界各地都分散设有数据处理中心。亚马逊公司将全球业务分为十二个区进行经营,每个区大量的数据中心都不断遭受着物理攻击和网络袭击,这些威胁主要是来自成百上千隐匿的独立服务器。

访问控制的难题

控制对信息或网页访问的最好策略就是只设置单一的访问接口,这比控制当前的成百上千个接口要简单的多。然而事实确是:大数据广泛地储存在各个区域。其容量之巨、分布之广、获取渠道之多,也让它在面对威胁时更加脆弱。

除此之外,很多公司对其尖端的软件组件以及大数据基础设备的安全性并没有给予足够的重视。这更是给潜在攻击大开了方便之门。

一个典型的例子,Hadoop(译者注:由Apache基金会开发的分布式系统基础架构,可以让用户在不了解分布式底层细节的情况下,开发分布式程序)中大量的软件组件使得编程人员可以在分布式计算系统获取大量数据信息。刚推出时,Hadoop的安全性能较低,不能同时供很多人使用。很多大公司却不顾这一缺陷,依旧采纳Hadoop成为其整个公司的数据平台。

用户需求推动数据安全发展

从用户角度来说,通过多种方式来提高大数据产品的安全性至关重要,例如同大数据的收集和使用组织签订条件和协议、服务水平协议、安全密封等。

大数据公司方面又应该怎样保护用户的个人信息不外泄呢?为防止信息外泄落入不法使用者手中,我们可以采取包括信息加密、访问控制、入侵侦测、数据备份、使用过程审查等策略。这样数据的安全性提高了,我们个人信息的隐私性也就等到了加强。

然而,过分强调安全性也许会侵害你的隐私:执法机构可以借口安全原因来搜集更多的个人信息,比如员工计算机的浏览历史。

执法机构打着增强安全性的旗号,将每个人都当成是潜在的犯罪分子或是恐怖分子,搜集其信息,用于某一天证明其罪行。政府通过这种方式掌握了我们大量的信息,不仅如此,苹果、谷歌、亚马逊等公司也会被要求提供其他情报,包括我们的网购记录、网页浏览历史以及解密后的各项数据。

这种监视所遵循的基本原则就是:每个人都是不可信的(大数据技术让这种监视的成本大大降低,可行性也随之提高)。然而这些搜集起来的信息很有可能泄露并被滥用,美国国安局员工滥用职权监听他人电话事件就是一例。

其实如果能被适当利用,大数据可以帮助我们获取更多的信息,提高有关潜在计算机攻击和攻击者的情报的质量(特别是准确性)。这样一来,你的隐私就得到了更好的保护。

举个例子,理想的状况是:如果大数据分析引擎能在海量的邮件中精确地辨别出哪些是欺诈邮件的话,我们也就再也不用担心碰到钓鱼邮件了。

大数据是怎样使用的—对你有利还是有害

其他有关大数据使用的问题还有,一些公司为了要针对你的习惯和爱好给你发送特定的广告,他们会记录你所有的浏览历史。大数据为他们这种行为提供了便利——成本更低,分析更简单。

IBM公司的“性格洞察”服务,能够根据你的上网习惯,对你的形象进行“素描”。这已经远远不止身份信息被泄露这么简单。你的性格特点,比如是否外向、是否具有环境意识、政治上是保守还是革新,甚至连是否有去非洲旅游的意愿,都会在其调查结果中表现出来。

这些公司对外宣称,这项技术可以极大地提高上网体验。听起来是在为用户考虑,但是反过来,我们也不难想到,同样的信息也很容易用来损害我们的利益。比如现在已经有保险公司通过大数据分析出的用户素描来实行差别收费。

想要解决这个问题,禁止大规模数据搜集显然是不现实的。不管我们喜欢与否,大数据时代已经来到。找出方法在允许合法使用大数据的前提下保护隐私,才会让我们的生活更加安全、富足、高效

例如,在合法安全地使用时,大数据科技就能极大地提高反侦察的效率,这反过来也会让我们避免身份信息盗用和潜在的经济损失。

想要在享受大数据带来的便利的同时解决保障安全性、隐私性的难题,关键在于信息使用的公开透明。大数据的操作者必须公开所搜集数据的内容及用途。

除此之外,用户必须有权了解数据是如何储存的,谁可以使用这些数据以及数据的授权过程。最后,大数据公司也要对其为保障用户安全对数据所采取的安全管控措施作具体的阐释以此来赢得公众的信任。


注:所有文章均由中国数字科技馆合作单位或个人授权发布,转载请注明出处。