近来央视两档文化节目捧火了古诗词,各种诗人骚客、民间高手、百年才子如雨后春笋涌现于神州大地,令人欢欣振奋。
与此同时,一些人工智能、AI、机器人也开始尝试“写诗”。AlphaGo战胜人类当下最杰出的一批围棋选手,百度推出的机器人“小度”也击败了最强大脑微观辨识高手王昱珩轰动全国,与此同时,清华大学语音与语言实验中心(CSLT)也推出一款作诗机器人“薇薇”。
上图第一首诗是机器人所做,第二首则为诗人创作,如此高水平的文学作品,简直羡煞众人!
除了清华大学的写诗机器人外,网络上还有多种在线生成诗词的机器人,比如“编诗姬”,只要输入特定意向或关键词,智能系统便能够创作出诗歌。
以上几首诗虽然是机器人写的,但是文笔比较流畅,文辞也很优美,可以说已经达到了机器创作的最高水准。据调查显示,“薇薇”机器人写出的诗词中有31被认为是人创作的。
那么,机器人究竟是如何写诗的?
众所周知,人与机器最本质差别是人拥有意识,而机器没有。机器生成诗歌的历史,可以追溯到上世纪70年代。
起初只是将特定意象的词汇和词语随机进行拼凑,这样写出来的诗歌有的逻辑不通,结构凌乱、不伦不类,当然也能从成千上百首诗歌出找出一篇文辞优美的。
沿着这种拼凑的套路继续发展,可以设定诸多人工规则,比如限定模板和样式,设定复杂的约束情况,自动剔除语义不连贯的,缺乏灵活性的,筛选出诗词格律和质量高的作品。
进入AI智能时代后,机器人深度学习技术越来越强,背后的程序集合了五万首全唐诗,并且进行语义分析和语料模拟训练,不断优化语言模型输出的概率分布,从而组合成完整的诗歌。
而后,机器人还需要进行“图灵测试”,就是说通过对话分辨真实人类和人工智能的试验,通过“图灵测试”意味着人类无法通过语言对话分辨出人类和人工智能。
除了写诗机器人外,国内外利用机器代替人工创作的案例并不鲜见,比如2015年腾讯财经推出的“Dreamwriter”的自动化新闻写作机器人,它所写文章文从字顺,数据翔实,只需要一分钟就可以赶出一篇稿子。
美社联的“机器人记者”每秒可产出2000篇文章,南方都市报也推出机器人“小南”,它们所从事的都是简单数据类新闻稿件,最终还是要进行人工润色的。百度的百家号也推出了“百度写作大脑”,利用大数据分析内容、处理语言,帮助写作者进行创作。
机器人辅助写作的智能系统也有很多,能够根据作者的需求,利用大数据分析处理,自动联想匹配下文,比如微软小冰、机器人GitHub、爱创写作等,写作主体虽然还是人,但绝大部分文字处理是机器人辅助完成的。
以目前的科技水平来看,人工智能并不能进行完全独立的故事原创,他们能做的只是通过新的方式来收集信息从而生产出看上去类似于原创的内容,也就是说他们的作品都是从人类作品中拼凑的,而不是自己纯粹的原创。
那么,机器人是否享有著作权?
首先,版权法中的作品必须是人类意志的产物,而在缺乏人类意志的情形下,机器生成的信息不属于版权法所保护的客体。
其次,人工智能形成具有高度独创性的作品,需要经过其拥有者发布和管理,相当于人类雇佣机器人进行创作的“法人作品”,作品版权则属于机器人系统的开发者或拥有者,而不属于机器人所有。
当然,既然机器人创作的作品能够拥有版权,那么机器人抄袭和剽窃它人作品,也会构成侵权,当然并不是机器人侵权,而是它的拥有者侵害了原作者的权利。
比如,机器人在素材库中提取别人的作品作为写作模板,在创作的过程中只对模板进行少量的修改,或者改头换面后将他人作品改编成自己的作品进行发表。
市场上有很多粗制滥造的“写作软件”,直接从他人作品中摘抄剽窃,然后进行拼凑组合,它们是最低级的写作机器人,当然真正的AI也能实现这种方式的创作,如果侵权机器人的拥有者需要负法律责任。
不管是有心为之,还是算法错误无意中抄袭,都必须承担相应的责任,所以说使用AI创作也是有一定风险的,毕竟谁也无法保证AI所用的素材都是没有版权限制的,不过这种风险倒是可以利用自动检索和查重技术来排除掉的。
法律与科技的双向互动是一个永恒的话题。新技术戏剧性地改变了知识产权的实践方式,使得法律和政策也需要随之调整,与相应领域的技术背景、哲学基础、经济学分析和社会样态交织,编织成协调自洽的瑰丽图景,完成又一次的深刻变革。
AlphaGo、“小度”、搜狗“汪仔”、新闻写稿机器人,以及各种各样的人工智能不断的出现,而且取得了不俗的效果,似乎未来独属于人类的领域越来越少,机器无法涉足的人类空间越来越少。
艺术,是人工智能进军的最后阵地,尽管它们可以创作出高仿人类的作品,但是在文字艺术、图像艺术还有声音艺术方面,机器的表现都很难与人类媲美,因为它们没有情感,没有意识和思考。