近日,在百度机器翻译技术开放日上,百度技术委员会联席主席、自然语言处理部技术负责人吴华博士表示,基于领先的人工智能、神经网络以及自然语言处理技术,百度早在1年多以前就率先发布了世界上首个互联网NMT系统,引领机器翻译进入神经网络翻译时代。
近两年,神经网络机器翻译(Neural Machine Translation, NMT)技术异军突起,取得了翻译质量的大幅跃升。随着其翻译准确度的提升,在文化全球化的时代背景推动下,高度成熟的翻译技术或将开启第二次全球化的浪潮。
而究竟是否达成推动,那么我们就需要来观察一下,到底NMT技术发展到了何种阶段,应用到了何种阶段,以及当前的全球化时代背景又是怎样?
一,NMT神经网络机器翻译系统到底是什么
1)机器翻译的前4个阶段
1947年计算机诞生以来,学界就开始尝试利用计算机进行机器翻译,而从1947年到1991年这期间,机器翻译并没有太大的进展,原因在于整个学界是让机器在模拟人类翻译的过程,这也和计算机发展历史的必然性有关,这一阶段没有数据,更没有互联网,因此只能停留于算法迭代阶段止步不前。
此后随着互联网的发展,各种在线大数据的增加,1991年基于数据的统计机器翻译,让机器翻译的准确度大幅度提升。
2)NMT成当前主流
随着深度学习的崛起,其被广泛应用到了各个数据挖掘领域,其运行原理是让机器自动从更大规模的语言资料中学习规则,而非直接利用给定规则。2014年学界也开始提出将深度学习应用于机器翻译,创造出神经网络机器翻译(NMT)系统。
神经网络翻译技术从2014年9月提出,到百度2015年5月上线首个互联网NMT系统,只用了短短8个月时间。2015年百度翻译正式上线NMT系统,成为世界范围内第一个真正实用的NMT系统。而谷歌在2016年9月才发布第一款NMT翻译系统,比百度晚了整整两年。
二,NMT翻译已有大量应用
各大巨头开始紧盯NMT翻译技术,则正是说明了随着机器翻译准确率的大幅度上升,机器翻译将有广阔的商业前景,摆脱此前只存在于大学实验室的研究状态。
而百度,谷歌等公司早就开启了实际的应用,以百度为例,目前的百度翻译支持全球28种语言互译,756个翻译方向,每日响应过亿次的翻译请求,而这一切的原因在于实际应用。
1)应用于学习
很多中学生以及大学生都会通过百度网页翻译、APP对不懂的词汇进行翻译学习,对于生词,不仅能查到读音、用法,还能看到具体的使用场景和权威例句。对于不认识的物体,结合图像识别进行实物翻译,给出多种语言的描述,帮助记忆。
2)应用于境外游
百度翻译最具备商业化的使用场景,依然在境外游市场,结合百度其他人工智能技术,百度翻译目前应用在如下场景。
首先是图片技术+翻译,当用户无法识别建筑物上的标志时,通过拍照就可以让百度翻译为其进行精准的翻译。而当用户在国外点餐时,通过百度翻译拍照识别同样很重要。
其次是语音识别技术+翻译,百度翻译中有个“对话翻译”功能,可以让用户和国外用户直接实时对话,一旦用户说完一个语言,机器就会马上翻译成另一种语言并语音读出,实现无障碍交流。
3)中国企业的全球化赋能
百度翻译还开放了API接口,助力广大企业国际化。目前已有超过2万个第三方应用接入。华为、OPPO、中兴、三星等手机厂商,金山词霸、灵格斯词霸、敦煌网等众多产均接入了百度翻译API。世界知识产权组织(WIPO)也将百度翻译API集成到官网,供用户将专利信息翻译成不同语种查询。对于这些企业的国际化来说,百度翻译有着极其重要的作用。
而未来随着一带一路战略的推进,我国还将继续鼓励更多的企业进行全球化,而翻译技术将在未来起到不可或缺的作用。
三,文化全球化时代,NMT翻译技术或将开启第二次全球化浪潮
此前一轮的全球化浪潮主要在于工业的驱动,分工的经济带来了全球经济旺盛的增长,但随着基础设施建立的完成,满足了温饱阶段之后,文化需求开始增长,各国之间的文化交流也越来越密切。
在娱乐领域,我们看到近期火爆国内电影市场电影包括《神奇动物在哪里》、《佩小姐的奇幻城堡》、《你的名字》等等,均来自国外。此外,像各种英剧、美剧、韩剧、二次元动漫也都是网民们非常乐于观看的节目,有着极高的受众。大量观看影片的网民们,其实早就习惯了那些充满英语、韩语、日语的世界,通过大量的观影,网民们早就消除了对其他国家在文化上的陌生与隔阂感。
与此同时在新闻领域,今年英国脱欧事件、法国恐袭事件、美国川普当选事件、韩国朴槿惠闺蜜事件、也在国内各大新闻客户端持续发酵,成为网民们热议的焦点,热度一点都不逊色于国内事件。
所以,现在不仅仅是经济的全球化,而是一个文化正在全球化的时代,国内用户有着与国外用户交流的渴望,他们也开始越来越关心国外的文化娱乐、以及新闻事件,并且也越来越希望自己能够在第一时间获得国外大事件的信息,甚至是第一时间参与到对方的交流中。
但语言问题却是绕不过去的障碍因素,而现在基于NMT的翻译技术则让机器翻译上升到了一个全新的台阶,无论是百度,还是谷歌都在发力NMT翻译技术,这对于全球化的交流来说是一件好事。
基于文化逐渐融合的现状,彼此交流的渴望,未来也一定会出现各个跨国的,满足各种需求的网站或者APP,例如可以有一个韩剧迷的网站或者APP,同时容纳中韩两国国民,可以由美剧的网站或者APP同时容纳中美两国的国民。本国民众都只需要输入自己国家的语言,而通过翻译技术,在对方国家呈现出对方国家的语言,这一试想并非不可能,基于互联网的NMT技术发展,这样的一天或许就在不久后到来。
结语:
随着互联网的来临、大数据的爆发,机器翻译技术也迎来了自身的春天。而同时随着文化的全球化时代的到来,机器翻译将会在其中扮演一股不小的力量。
NMT机器翻译作为当前最主流最有效的技术,或将开启下一次的全球化浪潮。
作者公众号:首席发言者(shouxifayanzhe)