微软周三称,机器翻译取得重要进展,研发出了首个媲美人类水平的中翻英系统。
微软采用了对偶学习(dual learning)、推敲网络(deliberation networks)联合训练(joint training)和一致性规范(agreement regularization)的技术组合。对偶学习和推敲网络此前已经发布,此次新增了后两项技术。
根据微软的介绍,对偶学习类似与人类翻译的“回译”,将中文翻译成英文后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对;推敲网络顾名思义,是机器翻译的不断推敲修改。
联合训练则可以理解为用迭代的方式去改进翻译系统,用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。一致性规范则让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。
目前微软的这一翻译已经开放(地址:https://translator.microsoft.com/neural/),实际使用中运行可能偏慢。微软会显示两种翻译结果,从实际测试来看,微软修正后的翻译系统(右),显示出了相对更高的翻译水平。