跨语言的实时对话翻译一直是各种翻译器难以跨过的“大坑”,特别是在多人对话的场景更是如此。而近日,微软表示他们发布了世界上第一个“万能翻译器”——Microsoft Translator。除了具备输入翻译、语音识别翻译及拍照识别翻译这三大基本功能外,他们还声称这款翻译器可以实现多达 100 人间的多语言实时翻译。
前面三个基本功能与其他翻译器相似,而最后一个实时翻译功能则是通过 Microsoft Translator 里一个类似聊天室的功能来实现的。用户可以作为发起人生成一个二维码及口令,其他人经过验证后便可加入聊天室(与微信的“面对面建群”相似)。此外,在进入聊天室前,用户需要输入自己的姓名及选择自己的语言,这样别人发言的时候,你就可得到实时翻译的结果。
微软表示,Microsoft Translator 的实时翻译并不是简单的“单一短句翻译”,由于在语音识别及文本翻译部分分别采用了 ResNet 深度神经网络(深度达到了 150 层)和 LSTM(长期短期记忆)技术,Microsoft Translator 会根据你的上下文语义调整语句翻译,以此更接近真人翻译的效果。
(注: 图 1 图 2 为使用文字输入的实时翻译,图 3 图 4 为使用语音识别的实时翻译)
不过在实际试用的过程中,我们发现 Microsoft Translator 还远远没有达到“万能翻译器“的程度。比如在文本翻译上,一些结构简单的短句翻译效果较好,而一旦遇到较长或较复杂的语句,翻译器就会开始“说胡话”。而且如果交谈中使用更为口语化的中文进行对话时,翻译的质量就差得多了。比如图中的中文的口语常用语“在吗?”和“要不试试”,变成英文之后,意思就完全不一样了。
另外,我们使用同样的对话,再通过语音识别功能进行交谈时,发现语音识别的效果不甚满意,翻译效果也比文本输入有所下降,有时候甚至会识别出完全没有关联的语句。
对此,Microsoft Translator 团队的项目经理 Tanvi Surti 表示,“我们知道目前 Microsoft Translator 还不够完善,但这只是一个开始,我们希望建立一个能够让不同语言使用者能够实时无障碍沟通的平台,这款翻译器还会不断进步。”
目前,Microsoft Translator 支持 9 种语言的对话语音识别和近 60 种语言的文字输入翻译。支持安卓、Ios 和 Windows 的跨平台使用。微软认为这个多人多语言实时翻译功能,将会给多语言的工作环境带来更多便利,例如国际导游、国际会议等。