C114讯 7月11日下午消息(岳明) 在今天举行的“2017中国互联网大会”上,谷歌翻译研发科学家高勤介绍,谷歌翻译现在提供超过100种语言互通,覆盖全球99%的网民,每天提供超过10亿次的翻译,大约相当于100万本书的文本总量。
谷歌翻译月度活跃用户超过10亿人次,其中95%来自于美国以外地区。在技术层面,谷歌利用机器学习带来了许多全新的翻译体验,例如利用手机摄像头做的即时翻译,利用手机麦克风和扬声器进行即时对话翻译,离线翻译的支持为没有数据服务的旅行者提供帮助。
高勤认为,翻译质量一直是谷歌翻译所关注的焦点,在近十年以来,谷歌翻译一直致力于翻译质量的提升,特别是最近一年以来,谷歌翻译的质量有了长足的提升,无论从流畅度和准确性上都有了巨大的提升,而其背后正是神经网络机器翻译技术。
传统的翻译技术,基于短语的统计机器翻译是拼图过程,通过对短语对的排列和组合,尝试找出较好的翻译选项,而整个决策过程是离散的,而支持这个决策的信息也都是局部的。而神经网络机器学习是反其道而行之,做每一步翻译过程中可以利用云语言与目标语言所有信息,使整个决策过程既是连续也是全局的。
高勤表示,2015年最初预计完成项目计划要花三年时间,但基于TensorFlow平台,在2016年11月针对16个语言的机器翻译能力基本实现。这其中,多语言模型使200个模型的训练与维护成为可能。所谓多语言模型是指用同一套神经网络学习多种语言的互相翻译。如将英语、西班牙语、韩语放在同一个翻译模型中进行翻译。在外界看来,谷歌翻译之所以能够做到如此快速,主要归功于多年的积累以及Tensor Processing Unit(张量处理单元,简称TPU)处理器的引入。