百度微软阿里传神齐聚京交会 探讨机器翻译未来10年专栏

砍柴网 / 光山居士 / 2016-06-06 19:08
翻译技术给“一带一路”带来的价值是深远的。沿线六十个国家,文字信息达到几亿字、几十亿字的时候,如果没有很好的机器翻译和人机结合的方式,从成本上、时效上是无法满足...

5月31日,首次以独立版块出现在第四届京交会的语言服务推介洽谈会在国家会议中心召开。会议由中国外文局、中国翻译研究院指导,中国翻译协会主办。会议期间,阿里的骆卫华先生、百度的何中军先生、微软的张冬冬先生以及传神语联网的蔺伟先生,就人工智能和深度学习在机器翻译的应用方面进行了深入的探讨。

传神语联网副总裁蔺伟作为本场嘉宾兼主持,分别从“机器翻译技术、人工智能和深度学习训练、人机结合、翻译技术未来10年”等角度抛出问题,观点新颖大胆、脑洞大开,成为此次京交会语言版块的最大亮点。

机器翻译难于语音识别、图像识别   深度学习仍在不断尝试

机器翻译是大众比较普及的一种翻译使用,利用计算机进行不同语种文字之间翻译,其翻译准确率不够稳定,这一直也是机器翻译的硬伤,例如你说“我讨厌你”,可能想表达的意思是“我爱你”,机器信号是不能做到这一点的。

微软的张冬冬先生就此从人和动物的区别做了非常有意思的比较:文本和机器翻译方面的问题比图像稍微难一点。人的语言系统是非常高级复杂的,动物也有语言系统,跟人类相比是简单得多。但是,动物也可以很好地识别图像。从这个角度来说,语言系统更复杂一些。

对此,百度的何中军先生也抛出了有趣的类比:我一直在观察我的孩子。在刚出生的时候,他可能对声音有一点反应,会对亮度有一点反应,慢慢的可能认识一些事物,他会喊、叫。但他真正掌握语言的时候可能是1-2岁,首先是从字到词,再到完整表达一个句子。因为儿童的个体差异,有些儿童掌握语言的时间更晚。就人类而言,语言掌握是一个更难的过程。对人类都是很难的事情,对计算机来说,难度更大。

阿里的骆卫华先生表示:从另外一个角度来看,语音识别、图像处理和机器翻译,大家都在尝试用深度学习来解决问题。从我的角度来看机器翻译深度学习的未来发展,对于替换现有翻译成为翻译的主要工作部分,我是比较看好的。

传神语联网的蔺伟先生介绍:传神语联网也在进行深度学习的研究,希望跟统计型机器翻译相比,未来可以用低数量级的语料,通过深度学习与统计型,以及规则型机器翻译技术的结合,期望它的速度超过传统的统计型机器翻译的质量。未来深度学习在机器翻译中的占比会提升,但不会完全替代统计规则。

未来10年翻译实现形式多样  人机结合或是趋势

骆卫华:打个比方,跨境旅游越来越火,大家越来越多的选择自由行。以前到了当地的景点是请一个当地的导游。如果机器翻译到这样的程度,未来的场景下就不需要再请专门的导游,只需要随身携带一个手机,上面安装好一个APP,当你到某一个景点的时候,它通过地图定位知道了你走到哪一个景点,通过后台搜索到关于这个景点的历史和特点,再翻译成本地语言,用语音合成的方式播放出来。我觉得就不需要再请专门的导游来做介绍了。

蔺伟:是的,插个小广告,传神语联网已经推出了全球唯一一个即时专人翻译服务Te小尾巴,商务及旅游人士出国必备。

何中军:如果十几、二十年前大家对机器翻译还抱有怀疑和抵触心理的话,现在机器翻译的质量和接受程度已经大大提高了。在座各位可能还懂一些英语,但基本上是不懂韩语的。有一次我去韩国,我要打车,要告诉司机去某一个地方,这个时候怎么办?我就使用了百度翻译,司机就把我带到了目的地。有一次在法国的卢浮宫,有一个中国老大爷,他跟着一个箭头出去了,这个箭头上写的是“出口”,而它用的是法语,结果就是一点都没有参观到。如果把它做到眼镜上,你看到的是自己的母语,这将极大的方便我们的出行、交流、生活。

张冬冬:过去的机器翻译都是文本翻译,是用户进行大量的语言检索。现在随着移动端的发力,虽然现在有些错误,但大家也可以猜得出大概意思。将来不管大家在任何地方旅游、工作,有一个语音的设备,这将可以方便大家的沟通。

从技术层面,我们可以捕捉到手势,通过技术判断出来他说的是什么意思。将来可以做到唇语翻译,再高级一点可能会做到脑电波翻译。机器学习加上跨学科技术,可能会取得更多的创新。

蔺伟:我们谈未来十年的翻译,可能是脑洞大开。假设未来你看到的所有网站、电影、电视都是你的母语的时候,你的生活圈子会有很大变化,信息获取跟现在是完全不一样的。目前我左边的三位都是来自全球知名的公司,阿里、微软和百度,还缺谷歌。作为翻译行业,我发现翻译行业的技术好像都不是真正的翻译企业做出来的,都是由这些行业巨头做出来的。因为这样的技术投入是非常巨大的,包括人才的投入和计算机网络的投入。但它没有和应用场景很好的结合,也很难变成操作。现在机器翻译的技术已经可以解决很多问题。因此,场景化的结合、人机的结合是未来机器翻译非常重要的组成部分。单纯去谈技术的好坏和先进程度过为单一,场景化结合是非常重要的。

翻译行业的人、技术、模式三件事情,如果可以更多的关注翻译技术的发展和投入,也许中国翻译行业在全球翻译行业的地位会发生很大变化。目前正是由于翻译技术的投入和支持没有跟上,人才储备还不够,我们通过某种方式跟互联网巨头们一起把翻译场景结合得更加密切一些,这样既能满足你们生态系统的要求,又可以满足商业的要求。传神自己也研究了很多应用场景,使用现在的引擎,在翻译行业的传统环节已经发生了非常大的变化,甚至是天翻地覆的变化。未来我们公司推出的产品也会让大家感受到这样的变化。

翻译技术给“一带一路”带来的价值是深远的。沿线六十个国家,文字信息达到几亿字、几十亿字的时候,如果没有很好的机器翻译和人机结合的方式,从成本上、时效上是无法满足“一带一路”的语言要求的。因此,必须通过人机结合的方式解决“一带一路”海量信息的要求。 “一带一路”核心的是智能摘要、语义匹配、人机结合的方式才能满足“一带一路”海量信息的时效性和低成本的要求,这也是翻译技术促进“一带一路”非常重要的技术突破。

感谢三位专家和在场的听众。

此文为看点(新发现)原创内容,特此声明



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3