机器翻译新纪元:从人工智能红利到实际应用落地专栏

/ 李北辰 / 2016-01-11 13:00
评判一项技术是否伟大有个标准:它是否增进连接。“欲增加生产力先增进连接”曾在人类历史上反复出现。

我曾臆断:人类互联网发展一直延续着一个母题:回归“部落”,包括社交网络,物联网,开源,云计算,共享经济等热门词汇的涌现,也许都是“回归部落”现象的各个支脉,这些技术让每个人的每项活动都变成某种合作,从而成为产消者。而倘若宏观意义上,互联网发展的底层逻辑是将全人类更为透明高效地连接在一起,形成一个巨大“村落”,语言无疑是终将攻克的技术障碍,而人类对机器翻译的无限企盼和仰仗,不过是一种顺势而为。

嗯,从直觉便知,在一个自由连接,信息与服务唾手可得的互联网时代,机器翻译可以解除巴别塔魔咒,在教育,社交,跨境商贸等领域有广袤应用空间,降低人类的沟通成本。

正因如此,机器翻译从来不是只属于科技圈的“自嗨”,它早已获得学术界的认可。1月8日,在人民大会堂举行2015年度国家科学技术奖励大会上,百度凭借机器翻译项目获得国家科学技术进步奖二等奖,成为中国互联网巨头中首个获得这一奖项的企业,算是给“BAT中百度技术属性最强”的知名论调增添了一个有力脚注。

颇值一提的是,作为中国最高级别的科技奖项,其往年获奖者包括载人航天和探月工程这样的重量级项目,而这次获奖项目也有不少来自物理化学等基础科学突破。能与其并列,足以看出学术界对机器翻译的重视——嗯,从计算机诞生伊始,人们即达成共识:消弭因地理割裂而生的语言障碍,拥有无以复加的现实意义。

人工智能红利

作为典型的多学科交叉技术,机器翻译涉及计算机,认知科学,语言学,信息论等学科,很长时间内都是人工智能领域最难课题之一——尽管对“人工智能”本身的定义在随时代的变迁而更替,但人类对机器翻译的愿景从未磨灭。

事实上,追溯历史,几十年之前计算机刚刚诞生,当时的从业者即不满足将机器仅用来“计算”,开始醉心于对“智能机器”的乐观描述——1956年便提出了人工智能的概念,并相信短时间内可以造出这台智能机器。当然,经过几十年努力,无知导致的乐观遭遇重挫,人们开始重新回归对“计算”本身的追寻,于是摩尔定律成为常识,计算机日趋高速和微小,“只要是计算问题机器都能解决”成为今日人类引以为傲的资本。数据红利让人们对人工智能的幻想暂时落地——某种意义上,至少在现阶段,人工智能的本质就是将一个领域所有人的“智慧”灌注在机器里,以一种类似“群体智慧”的方式帮助到个体。

与之相伴的是,应用的瓶颈被彻底打开。不少业内人士预测,2016年或者未来五年之内,人工智能会像基础设施一般渗透至各个领域,出现数万亿美元的巨大市场。就连凯文·凯利也曾表示,将尚未产生人工智能的领域引入一些人工智能,即是从业者的机遇。“人工智能会是下一个20年颠覆人类社会的技术,它的力量将堪比电与互联网……我们将会看见旧有的事情加入人工智能,产生千万种不同的结果。”

嗯,科技巨头们也纷纷发布人工智能领域的研究成果(看看眼下CES展对人工智能的追捧便知)。而从机器翻译的实际应用来看,百度无疑也希望通过人工智能的落地,为中国科技创新带去更多红利。

应用落地

机器翻译的历史几乎是人工智能的缩影。上世纪九十年代,机器翻译完成了从以规则为基础的方法到统计方法的蜕变,基于大数据加以分析以完善翻译系统,唤起了机器翻译新纪元。而百度融合了统计和深度学习方法的在线翻译系统,甚至可以借助海量计算机模拟的神经元,实现类似于人脑“理解语言,生成译文”的翻译方式,并结合已有的统计机器翻译技术,让翻译质量实现了某种跃迁。官方数据显示,百度机器翻译经历6年漫长“攻关”和技术累进,全球已拥有超过5亿用户,支持中文、英文、西班牙语、日语、韩语、法语、俄语等27个语种、702个翻译方向,在全球覆盖超过47亿人口——换句话说,理论上,这个星球一半以上的人口都能通过这台翻译机器,与他们基因相近的同类自由交谈。

那么这一切意味着什么?

早在1954年冷战时期,当科学家首次公开发布了一款能翻译人类语言的机器时,人们就坚信,一旦通用翻译机器问世,不仅能让美国在国家安全上领先苏联,还能消除语言障碍,促进世界和平——几十年之后,我们发现,这个良善的判断愈加接近于正确。

你得承认,当“地球村”三个字愈加脱离比喻成为现实,当人们觅得彼此,却听不懂彼此语言,着实有些尴尬。譬如,据不完全统计,在全世界浩如烟海的数万亿网页之中,80%为非中文网页(全球语言多达7100种,互联网网页上的语言只占约5%);在出境游前20的国家之中,累积语言高达12种……不夸张地说,人类语言的割裂正成为阻碍经济发展的一大桎梏,而可以肯定,机器翻译至少是人类可以掌握的一大利器,对于推动经济发展,促进文化交流,甚至维护国家安全都有着不俗意义。有业内人士估计,目前全球翻译市场年规模已达到370亿美元。

随便说个例子——出境游。

如你所知,伴随着中国中产阶级的崛起以及所谓的“消费升级”,出境游日渐成为休闲常态。而过多羁绊则让更多年轻人拒绝跟团游,选择自由行,但对英语不太好的人来说,身为异乡客,却始终隐隐浮现对语言的担心,从而耽搁一场说走就走的旅行。其实你大可将翻译任务交给机器,问路,点餐,买票都可以通过百度翻译这个中介寻求帮助,更重要的是,翻译可根据场景的变迁而自由切换,无论是实物翻译,涂抹翻译,还是语音翻译,它都能满足用户瞬间的翻译需求,这也符合科技记者罗伯特·斯考伯在《即将到来的场景时代》中所言:移动设备、大数据、传感器、社交网络与定位系统这“五力”的组合,将移动时代的争夺战场从流量搬至了各种应用场景。通过场景打造入口级产品,几乎称得上是移动互联网时代的新常识。

事实上,但凡涉及多语言应用场景,无论在线教育,互联网金融,还是传媒和跨境交易,机器翻译都可自如嫁接。拿百度翻译来说,其研究成果不仅应用于国家多个重要部门,并通过开放API,支持了包括华为、金山、OPPO、敦煌网等上万家第三方翻译应用,实现机器翻译的大众化使用,激发更大商业价值,很大程度上提升了中国企业的开放创新能力,带动了相关产业的发展。举个例子,B2B跨境电子商务平台“敦煌网”就使用百度翻译进行跨境贸易,服务超过100万家国内供应商,助其将商品销往全球224个国家和地区,促进了我国对外贸易的发展。据官方介绍,百度翻译目前已实现10.94个亿的直接经济效益以及63个亿的间接经济效益。

颇为值一提的是,在“一带一路”的国家战略背景下,机器翻译也可发挥不凡意义。清华大学计算机系党委书记孙茂松就曾表示,“一带一路”涉及俄罗斯,印度等国家超过六十个,人口逼近三四十亿,想要打造政治互信、经济融合、文化包容的利益共同体,语言不通将造成很大障碍,机器翻译可在其中发挥举足轻重的作用。“从国家战略角度看,机器翻译是重要的国家软实力之一,从老百姓角度看,包括做生意、旅游等,机器翻译都是不可缺少的工具,它的社会、经济效益是不可低估的。”

其实还可以更近一步讲,不知你是否察觉,无论自由市场经济,还是互联网和其他通讯工具,人类构建的制度和技术,正在让人们更友好地善待彼此。

在某种意义上,评判一项技术是否伟大有个标准:它是否增进连接。“欲增加生产力先增进连接”曾在人类历史上反复出现。事实上,人类社会阔步向前的核心一直是连接产生的协作,从采集狩猎,到城市,国家,全球贸易,再到互联网(也许还包括未来的大脑相连),人类正不停地扩展合作边界,也在不断通过技术与其他人产生连接和协作。从这个角度,像百度这样的机器翻译或许也可归为所谓“连接型技术”,它能让人们更好地理解彼此,让世界平得无以复加。

嗯,也许这才是机器翻译最伟大的意义,因为我相信,人类始终对那个“无国界”的世界怀有乡愁。

李北辰/文(知名科技自媒体,致力于为您提供文字优雅的原创科技文章;微信公号:李北辰)



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3