最近,由于51信用卡被查出“套路贷”问题牵扯出搜集个人信息和暴力催收等一系列问题,公安部门开始对对第三方大数据行业进行强力监管和审查,大力开展爬虫整顿风暴行动,此前杭州就有多家业内知名大数据风控公司人士被“协助调查”!
根据磊哥了解,网络爬虫又叫采集,就是一种按照一定规则,自动抓取网上信息的程序与技术。主要在金融业务领域应用的比较广泛,一般讲如果通过爬虫抓取网络公开信息,并不违法;但如果抓取的是未公开、特别是未授权的个人隐私信息,就属于违法行为。
简单讲就是,“公开的数据,你去爬那就是捡,但是私密的数据,你去爬那就是偷。
并且,“爬数据”是个技术活,一般有能力自建爬虫队伍的公司都是有点规模和实力的正规公司,而在金融行业中还大量存在着草草搭建的各类互联网贷款平台,他们没爬虫技术但又想要数据信息,因此这些网贷公司很多都是购买,同盾科技、魔蝎科技第三方大数据风控公司的数据服务来获取个人信息。
这也是为什么在这轮公安机关的整治中,杭州的魔蝎科技和同盾科技、杭州存信数据科技有限公司和贷款超市头部机构“信用管家”先后被杭州警方调查的原因,这些公司牵涉贩卖信息给涉黑暴力催收金融机构等问题。
而且有互联网金融公司人士爆出了份内部数据服务商报价单,包含身份证号、手机号、姓名和近三个月联系人活跃度排名、通讯录名单、常用位置信息等隐私数据。单次有效查询的价格仅在0.38元~0.98元不等,如果包年还有额外折扣”可以讲想获取个人信息成本太低了,怪不得信息数据泛滥!
最后有相关人士表示:“在中国,爬虫技术显然被玩坏了”这帮人什么都敢爬,在大数据风控行业中,以网络爬虫获取信息数据的做法盛行,而违规使用、买卖爬虫得来的数据则是导致数据泄露、隐私泄露等一系列问题的根源,爬虫数据服务商为网贷平台和现金贷服务,早已不是行业秘密。
最主要的是还产生了数据贩卖的灰色生意,这项技术滥用会造成严重的社会危害,甚至扰乱金融行业秩序。被查是早晚的事,这次被查估计会死掉一大堆爬虫公司!
因此,磊哥个人觉得经过这次的对爬虫行业的整肃之后,那些还能存活的数据公司数量会骤减,同时对于爬数据这方面和使用数据方面估计也都不敢在乱来了,估计以后在网上再想低价获取第三方个人数据就没那么简单了 !
相关阅读: