在慕尼黑的发布会上,华为展示了Mate 10 的诸多AI功能,其中有一项堪称惊艳的功能——翻译。进入2017年以来,机器翻译技术在智能手机上的应用几乎已经成为各大手机厂商都标配,从谷歌到苹果再到华为,都演示了在终端设备上进行机器翻译的功能,谷歌甚至推出了可以实时翻译的可穿戴设备Google Pixel Buds耳机,能翻译40多种语言。
华为Mate 10 上,神经网络处理器麒麟970成为最大看点。根据余承东在发布会的介绍,Mate10提供的翻译功能,能够提升 300% 的翻译速度,为 50 多种语言提供即时的文本/图片翻译。
新智元了解到,Mate上的翻译技术由微软提供。这多少有些意外,因为此前,华为诺亚方舟实验室自己也在做机器翻译,并宣布达到了“于谷歌机器翻译持平”的精度。(见新智元报道:与谷歌翻译持平,华为诺亚方舟实验室全新深度机器翻译模型,提高译文忠实度)
华为与微软两大巨头此次的合作细节具体是什么?在端侧的人工智能应用,例如这次在华为Mate10手机上提供的机器翻译有哪些技术要点?新智元联系到了微软全球技术院士、微软语音语言技术团队负责人黄学东博士。
他说,微软翻译团队利用华为Mate 10 的NPU处理器将微软的翻译APP进行了定制化,以提供连线(设备端)的神经网络翻译技术。“这是首次在移动设备上实现离线可用的全神经网络机器翻译”。
他说:“图像翻译结合了我们的本地OCR引擎和新的离线神经翻译。实际上,我们提高了速度和翻译质量(准确度)。以前由于神经MT的计算要求,不可能离线进行神经机器翻译。因此,以前版本的Microsoft Translator应用程序使用统计学的机器翻译。在Mate 10中,我们切换到神经离线翻译,实现了更高的离线质量,同时也提高了速度。这是世界上第一个离线(设备)神经机器翻译的应用。”
黄学东博士在接受采访时强调,Mate10上的机器翻译可以做到真正的离线,文本和图像的翻译可以完全在设备上完成。使用的是微软人工智能最新的机器翻译技术。
在该软件上产生的数据将全部交到微软,遵守微软为微软翻译软件设置的隐私规定(请见:https://privacy.microsoft.com/en-us/privacystatement )。具体说来,根据黄学东的介绍:
-
对于在线翻译来说,翻译的内容完全归用户所有(微软没有任何的版权,用户可以随意使用)
-
但是,微软会记录翻译的请求,并且可能会以匿名的方式保留一些子集,用于训练(微软并不知道具体是哪一台设备发出了请求)
-
APP直接连到微软的数据中心,这些对华为都是不可见的
对于离线翻译来说,数据是归用户的。在离线的翻译中,一切都在本地发生,所以不会有数据被发到华为或者微软。
除了翻译,双方还在哪些方面展开了合作?黄学东透露,还有便是华为将与LinkedIn展开合作,这是一个内置的解决方案。另外,微软的键盘Swiftkey也将成为华为的默认键盘(在中国以外的市场)。
黄学东还介绍说,他们团队的PowerPoint Presentation Translator 功能,现在在华为Mate 10上可以得到良好的运行,能够消除课堂上的语言障碍,这是使用AI的最有趣的生产力应用之一。