AI翻译狗与人工“翻译狗”,谁更厉害?

(发表于2018-03-12  责编:浦璐)

随着科技的发展,人工智能、机器翻译在翻译行业也备受青睐。前段时间火热的“人机大战”中,谷歌智能系统阿尔法狗(Alpha Go)以压倒性优势战胜了韩国顶级围棋选手而引起世界的瞩目。以翻译狗为代表的一众智能翻译平台,是否也能凭借科技的力量碾压人类,取代人工翻译呢?

我们先直接访问这家总部位于杭州的在线翻译平台,并放上伟人佳句,进行简单的中英翻译测试:

稍有英语常识的读者都能看出,图二的译文可谓诘屈聱牙。毫不客气地讲,即便是十年前的百度翻译,恐怕也比此号称“媲美人工翻译”的翻译能力强一些。由此可见,拿翻译狗这一家国内名不见经传的平台来评判人工智能AI翻译的未来,显然不大合适。

于是我们想到了科技巨头谷歌。其从创立后不久至今,旗下的翻译栏目一直是翻译行业的标杆。加上近几年来,Google推出的神经机器翻译(NMT)系统,给整个机器翻译领域带了个革命性创新。

上图是笔者于近日(2018年3月)在谷歌翻译网页上进行的实时翻译,为体现对比,我们依旧选用了与之前一样的例子。不难看出,整句译文表达完全转化成了英语惯用形式,细看之下,虽在语义上仍有瑕疵,但已然有模有样。

为进一步探讨机器翻译背后的原理,我们分别查看了传统的基于语料库技术的翻译(MT)以及现阶段流行的Google神经机器翻译系统(GNMT)的相关介绍。

所谓机器翻译,是指借由语料库技术以及相应计算机程序,将文字从一种自然语言翻译成另一种语言的计算语言学类。而经了解,语料库又是由无数真实语境中出现过的加工语言材料,这些来自实际沟通环境、不断自我我扩充、各自关联的资料库,构成了传统机翻的基础。同时,逐渐强大的分词算法、排序算法、上下文分析统计算法使得一定条件下的机器翻译,渐渐能满足日常翻译需求。

但是,语系有别,语法有异。语言,作为人类文明的结晶之一,本身的多样性在语用、语义等各个维度体现得淋漓尽致。过去几年有过在线翻译经验的读者都有体会:在遵循语法的情况下,稍微改变一下原句的语序、修饰成分、主从结构或将多义词放在不同的句子里,就会得出大失所望的译文。这或许与语料库的数据量积累与算法有一定关系,但传统的计算机逻辑,在此显然不能充分满足以人为本的翻译需求。

机翻时代最经典的错误之一便是下图所示的“松下问童子”翻译,时至今日,依然有明显语义错误。

人工神经网络与翻译的结合,很大程度上缓解了上述误差因素。AI的重要意义之一,便是让代码具备自我学习升级能力,这种仿生物神经系统吸收了人类神经网络结构的优点,用通俗的话讲,不断“调教”之后的AI翻译,会越来越“聪明而强大”。

更加灵活而强大的函数与规则集群在复杂的机制下,使得机器翻译正在以难以置信的速度变得智能化。金雨有理由相信,Google这只日日创新的翻译狗终有一日,会缓慢拉近与人类“翻译狗”的距离,最终超越我们。