有一位网友总结道:任何华丽成果的背后,都是一条非常枯燥的创作之路,比如一副健美、健壮的好皮囊背后,一定是每天撸铁,上千次地锻炼而成,还有精致时尚的iPhone手机,背后则是富士康工人历经上百个组装步骤完成的。现如今,人工智能AI技术正在大热,华丽丽的最高端技术,几乎能酝酿出新一轮的科技革命,但普通人很难想象到,在AI系统建制完成前,也需要大量重复、枯燥的密集劳动,最典型的工作就是给数据贴标签。众所周知,人工智能涉及的领域非常广泛,有着琳琅满目的分支,其中,Machine learning是一个比较热门的项目,同样也是需要花费大量基础劳动维护的项目。
Machine learning顾名思义就是机器向人类学习,更准确的说法,则是“人类要教会机器”,是靠着上万次的重复劳动教会它们的。
总得来说,人工智能有两个重要的支柱,一个是海量的数据、大大的数据;另一个则是高精度算法,显然,算法需要一小撮的天才来编辑和优化,而海量的大数据,除了机器本身的收集能力之外,还需要大量的人工操作,给相关的数据贴上固定的标签。
海量数据,为什么依靠人工来贴标签?
在电子信息时代以前,因缺乏合适的记忆载体,大自然的数据和人类的行为,绝大多数是没有被记录和保存的。现在,随着移动互联网的发展,信号无处不在,手机又是随身携带的,以至于,我们的任何行为都会被记录下来,形成或有价值或无价值的数据,如微信会记录下用户每天的步数,还给他们弄个排名,以刺激其加强锻炼;网络购物则会知晓消费者的喜好,从而在合适的时间推送出合适的商品;滴滴打车常年追踪着乘客经常去哪里,一来二去就能计算出一些“打车最佳路线”等等,但显然,单凭借这些自然地、无意识的数据,还远远达不到人工智能的远景目标,依旧需要大量的人工来“制造”数据。
毫无疑问,未来人工智能应用最广泛的领域,就是那些基于“经验”的领域,比如中医领域,无论它多么神秘或者高深莫测,本质上就是“不太复杂”的大数据:神农氏尝百草,就是收集数据的过程,而古代治疗疑难杂症,就是要不断地尝试,直到找到可以治愈疾病的良药,在可预见的未来,有很大一部分的医疗诊断,都会交给人工智能,机器扫描病人之后,只需要从数据库中找到对应症状即可,但在人工智能足够聪明之前,人类需要先将“数据传授给机器”,如印度的一位女工,拿到一段结肠的医疗视频之后,会利用自己的专业知识寻找到其中的“息肉”,即大肠中可能导致癌症的小肿块,看起来有点像黏糊糊的痘痘。当她们找到息肉时,就用电脑鼠标和键盘标记,在这个“凸起”周围,画一个机器能识别的圆圈,之后,当人工智能扫描到这个圆圈时,就能做出判断:恩,这就是息肉。
简单来说,数据标签就是可以让机器识别的符号,而人类劳动在其中的贡献就是把这种标签和实际内容关联到一起。
从业内人士披露的内幕来看,很多AI智能系统都需要重复、单调地“机器训练”计划,也即通过人工劳动使数据变得更有价值,算法变得更加精明,因如此做法常常会涉及到隐私范畴,很少有人工智能企业愿意主动承认“自己正这么干”呢,按照这个推测,用户常用的软件都有可能进行如此单调的“密集劳动”,如现在的地图已然非常“精准”,是一个智能化的软件,不仅能精准定位到龙城大街或者深南大道之类的主干线,连一些弯弯曲曲的羊肠小道以及临时修路搭建起来的简易房都能识别清楚,笔者相信,这一定是源于“标记工人”的日常劳作和实时更新,还有,我们常用的智能输入法,几乎囊括了全部的人类词汇,显然,那些格言、诗词、网络流行语,甚至错别字,单凭人工智能自己学习显然是不够的,而是靠着日积月累的人工服务,要知道,把一本辞海吞掉,真不是一件简单的事情…
基于以上描述,笔者由衷地相信:人工智能再怎么发展也要依赖自然人类的智慧,最起码现阶段是这样的,同样地,我们也可以推论出:给数据贴标签,或者说数据维护工作,已经是一个非常庞大的产业链,且对技能的要求非常低,正野蛮生长。
人工智能带来失业潮,焦虑可休矣?
自从人工智能概念形成之后,讨伐的声音就从未停止过,最主流的观点就是:人工智能会取代大量的基础劳动,造成非常高的失业率,甚至形成社会不稳定因素。毫无疑问,人工智能会掏空一些就业市场,如传统的制造业,人工智能机器人会取代自然人类,完成简单、枯燥、有职位危害的工作;又如新闻业,机器人完全可以把那些“五毛写手”干掉,而且文章又快速又精确,还有金融类、银行内的数据统计工作人员,也都有失业的风险,更尴尬的是,失业者又都是最基础的人力,丢掉工作后,会很快地就会危机生存底线。
但真正的科技大咖和社会学家都清楚,人类历史上任何一次的技术革命都没有带来“血淋淋”的失业潮,新技术在消灭一些工作岗位的时候,同时会创造出新的岗位,正如当年汽车取代马车时,也曾遭遇到强烈地抵抗,理由是驯马师、兽医、马车厢制造者、捡马粪的清洁工都会失业,但历史的车轮总会滚滚向前,后来人们惊喜地发现,汽车行业消灭了一些马马虎虎的工作,却缔造出上百倍的新工作,人类的生产生活效率也因此大大提升。
现在,人工智能在真正普及之前,也会面临同样的抵抗和讨论,高端大气的回怼理由是:人工智能会创造编程、硬件开发等更体面的工作,需要普通人加强学习之类的,但真正的事实是,人工智能在消灭一些单调、枯燥、劳动密集的工作之前,竟然先创造了大量的类似工作,同样地单调,同样地技术含量低,同样地采用计件制,维护一个标签收入仅有几分钱。如此工作在印度、尼泊尔等发展中国家正在流行开来,野蛮生长,截止到去年,市场规模已经超过5亿美元,到2023年将会达到12亿美元,当然,这类工作也会让工人情绪压抑、甚至产生心理阴影,毕竟,常年面对医学、暴力画面,真地是一件艰苦的事儿。(科技新发现康斯坦丁/文)