大数据预测犯罪,科幻还是现实?

从硅谷到世界各地,大数据被视为科技领域最热门的话题。随着智能手机等其他便携式智能设备的出现,人类的位置,行为,个人喜好,甚至身体的各项生理数据等每一点变化都变成了可被记录,储存和分析的数据。这些数据看似普通,但是却是被广泛地使用在商业行为用途中。以此为基础,‘反馈经济’等新经济和新商业模式也应运而生。

曾几何时,大数据的价值被人类大大忽略。一方面,那时的计算机以及其附加计算工具发展尚不成熟。云计算出现之前,传统的计算机是无法处理如此量大,并且毫无规则的信息数据。而另一方面,是人类自身没有意识到蕴藏在大数据里无穷的信息价值。随着计算机技术和互联网技术的发展,云计算成为一个科技时代的优秀产物被作为发掘数据价值,征服数据海洋的强大动力。

大数据被广泛应用于公共卫生服务,商业服务,国防科技的领域的例子比比皆是。在这些领域,数据正在成为巨大的经济资产,成为新世纪的矿产与石油。随着近期全球犯罪率加剧以及恐怖袭击案发生频繁,各国的安全部门正考虑引进大数据技术来帮助预测犯罪及恐怖袭击地点。很多人有疑问,这样真的行得通吗?

2011年,美国洛杉矶警察局和英国曼彻斯特警察署联合做了一次测试,他们使用了一个计算机算法来试图预测犯罪地点。这听起来很像美国科幻大片的场景,但是两家警察局确实只是为了使用大数据来预测罪犯的行为特征,从而预测犯罪的发生地点。通过这个办法,就可以通过提前部署相应的警力和预防措施来化解或应急处理一场犯罪。

警察防止犯罪并不是什么新鲜事,人类使用警力来防止犯罪的历史已有千百年。但是警察使用大数据来防止犯罪确实是第一次。这就意味着,人类不再依据过往的经验预测犯罪高发地点,而是依赖于机器人-电脑程序。

犯罪数据特征模仿了疾病传播和地震波传动特征。伦敦大学的学者们根据犯罪数据的特征,做了一项虚拟的实验。下面的系列图片详细地介绍了这个实验过程。下图中,学者们假设犯罪(抢劫)发生于某城市边郊的一栋房屋里。通过实验的仿真分析,学者们发现,事发地点周围的抢劫案发生的风险概率要远远大于离案发点更远的地方。而且随着距离的增加,这种风险会急速减小。以案发点200米为半径的地区是此类案件再发的高危地区。但是,这种再次案发的风险也会随着时间的推移而减小。高风险通常是在首次案发的两个星期以内。而两个星期之后,这种风险会随着时间推移加速减小。学者们一致认为,离案发地的距离和案发后的时间是预测再次案发的两个重要指标。因此,警察署可以根据这两个指标来布置警力以及通知当地居民做好防范措施。

在另外一项试验中,如下图,学者们假设在首次案发的两周内,案发地点附近又发生了另一起犯罪案件。研究结果表明,第三次案发的风险完全覆盖了首次案发地点和第二次案发地点之间的所有区域。这种犯罪案发风险并不是两次独立案发事件影响简单叠加的结果,而是其中有着一种相互放大彼此影响的效应,以致波及到了更大的范围。警察叔叔们需要投入更大的警力来维护该地区的治安。

这个方法真的有效吗?美国人抢先试用。2011年,洛杉矶(以下均简称洛城)警察局试用了这项研究的成果,结果当年洛城的入室抢劫犯罪案件大幅度减小。现如今,这项研究结果已经被做成了预测分析软件来进一步协助落成的警察们预测犯罪案件的发生地。

听说美国人成功吃了第一个螃蟹,英国也急于尝试一下自己的科研成果。随后,从肯特郡到约克郡,英国多地的警察局都参与到了英国的犯罪预测实验项目中来。实验结果显示,犯罪行为通常表现出明显的规律特征,而科学家们新加入的预警模型也可以帮助大幅度降低犯罪案件的发生率。其中一例,2011年曼彻斯特(以下均简称曼城)市的特拉福德区的抢劫案跟之前一年同期相比下降了26.6个百分点,而整个曼城市的抢劫案件发生率相较之前一年同期减少了9.8个百分点。

但并不是所有警察叔叔们都有着如此美好的用户体验。肯特郡警署却并不同意绝大多数同僚的用户感言。经历了大约四个月成功而有效地试用期后,2013年四月分开始,肯特郡的抢劫案如离离原上草一般,猛然复苏,犯罪率如疯狂报复般上涨。各地警署和专家们听闻后大为吃惊。难道大数据预测犯罪还是不够可靠吗?通过调查肯特郡的警力调动历史数据,专家们惊奇发现,在成功的四个月后肯特郡警署自以为犯罪率下降了,而降低了警力的布置,进而引发了犯罪案件数量的回涨。

作为2014年亚太经合组织领导人非正式会议的举办地,北京怀柔警方通过运用科学分析模型,云计算技术以及大数据技术,以怀柔地区9年1万6千个历史案件信息为数据库建立了犯罪数据分析系统和犯罪趋势预测系统。该系统有效地预测了北京地区的犯罪趋势,并成功地指导了警力的投入。

研究表明,每类犯罪案件的犯罪事件和犯罪地点都是有规律可循的,犯罪预测系统可以以数轴的方式预测出不同时间段犯罪的发生概率。目前,世界上犯罪预测系统通常包括了对入室盗窃,抢劫,诈骗,破坏公物等几十类案件的预测分析,大大提高了此系统的实际应用范围。最近,该系统又被扩展到了交通事故和火灾事故的领域。