星期四 , 5月 2 2024
首页 / 新知快讯 / 24H看点 / 霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

今天,一年一度的GMIC(全球移动互联网大会)进入第二天议程,本届大会不仅关注人工智能、商业航天、无人车等前沿领域,同时也对诸如环境、医疗健康、娱乐、移动支付、教育等与生活息息相关的话题展开讨论。

而在今天,最受关注的议题无疑与AI相关。毕竟昨天“人类的伟大导师”、著名科学家霍金还以视频的方式进行了现场演讲。

在演讲中,霍金提出要谨慎使用人工智能,否则,人类有可能被取代。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

不过这也只是一种可能性的推测,并且要求人工智能高度发达,或许也是很久以后的事了。

但就目前来看,人工智能给人类带来的更多还是便利。

比如今天网易有道首席科学家段亦涛也谈及了人工智能,不过他讲的是人工智能在翻译领域的应用——神经网络翻译的研究。

并表示该技术将应用在有道词典、有道翻译官、有道翻译网页版等产品上,将给超过7亿的有道用户实实在在的便利——翻译质量的大幅提升,语言或许不再是一种障碍。

段亦涛说,神经网络翻译是人工智能在翻译领域的具体应用,是目前最前沿的机器翻译技术,它带来的翻译质量提升是过去十年的总和。

网易自主研发的人工智能“NMT”究竟有多“聪明”?

网易有道今天在GMIC上公布:由网易公司自主研发的神经网络翻译( Neural Machine Translation,以下简称NMT)技术正式上线。

作为受到丁磊亲自“过问”、网易最重要技术创新之一,有道NMT技术是由网易有道与网易杭州研究院历时两年合力研发,将服务于有道词典、有道翻译官、有道翻译网页版、有道e读等产品。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

据介绍,这套NMT技术的核心是关于AI的深度学习。而深度学习正是推动当前人工智能热潮最关键的技术,它首先在图像、音频等感知领域获得了巨大成功,目前在语言方面的应用也获得了长足的进展。

作为目前机器翻译领域最前沿的技术,神经网络翻译采用独到的神经网络结构,能够对翻译的全过程整体建模;与统计翻译模型(SMT)相比,神经网络翻译模型更像一个有机体。

NMT能够对整个句子进行编码,能够更充分地利用上下文信息,判定多义词的词义,生成更高质量的译文。

最直观的一点就是,NMT译文的句子结构完整,语序更接近人类语言使用习惯,翻译结果更加通顺;而SMT则像由多个组件构成的机器,每个组件完成各自的目标,但“拼接”出来的翻译结果,常常差强人意。

如果从具体的例子来看,此次在有道上线的NMT的翻译结果更准确,断句和语法比起传统机器翻译(SMT)有了直观可感知的提升,更接近人们心中“会说话”的人工智能。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

神经网络翻译质量提升是过去十年总和

根据网易有道首席科学家段亦涛的介绍,有道其实很早就开始做机器翻译。

“我们在2008年就推出了机器翻译的服务,应该是国内最早推出这一服务的互联网公司。这两年我们更关注把深度学习接入机器翻译领域,我们研究成果是非常显著的,我们的机器翻译质量有非常大的提升。”

段亦涛在现场为观众们演示了两个有关NMT翻译的例子。

第一个例子是英译中的,有道随意从外媒选取了一段新闻报道,报道内容是关于前段时间巴黎恐怖事件。

有道用各个翻译引擎进行了翻译,第一个是统计翻译模型,第二个是有道的神经网络翻译模型,第三种是某海外的神经网络翻译引擎。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

从上面的结果可以看出来,统计翻译模型的结果拼凑感非常明显,而且有些片断翻译还搞错了,整体来看很不通顺;有道的翻译结果,可以看到是相当的准确和流畅的;第三个国外神经网络翻译模型的结果,可以看到不少的不准确的地方。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

另一个例子是中译英的,有道摘取了机器之心前段时间发布的一条消息,观察各家神经网络翻译的结果。

可以看到,有道上线的神经网络翻译的结果,仍然是通顺和准确的,这里面几乎没有任何语法错误。

这个结果,即使是普通人中等英文水平,都很难达到,但是有道的神经网络翻译做到了。再来看另个国外神经网络模型的翻译结果,其实还是看出有明显的不合适的地方,比如“起起伏伏”以及一些词之间的关系搞错。

面对这些例子是否精心挑选出来的质疑,段亦涛表示以上两个例子是随机选出的,没有特别的筛选。

有道对质量的评测非常严格和客观,采用庞大的评测数据集,并在这个数据集上看整体的质量。

段亦涛还表示,有道过去两年研究神经网络翻译所带来的质量提升差不多是过年十年质量提升的总和,同时这个技术很快会被有道旗下的超过7亿的用户便捷地享受到。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

未来AI翻译的目的是要改变人与人之间的交流障碍

作为一个前沿技术,神经网络模型是如何在机器翻译领域起到如此大的作用呢?

根据网易有道首席科学家段亦涛的介绍,原来神经网络模型模仿了人脑的工作机制,整个模型由大量的“神经元”来构成,一个“神经元”完成一些简单的任务,然后通过对这些“神经元”的组合来协调工作,最终得到更加出色的效果。

以往的统计翻译模型更像一个机械系统,它由很多个组件来构成,包括短语组件、分词组件、条序组件还有原模型等等。每个模块都是有各自的功能和各自的目标,然后机械地拼装在一起,完成一个翻译的结果。

与这个“笨拙”的机械系统相比,神经网络翻译模型更像一个有机体,模型里面有很多参数,这些参数都是为同一个目标来调整和优化的;它们中间的结合和交互更加有机,所以整体效率更高,效果更好。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

还有一个不同是,两种模型的内部信息的表达方式也不一样。

在统计翻译模型里,其表达方式能够识别词,但却不能够表达词与词之间的关系,而神经网络翻译模型能够使用一个十数位的向量来表达每个词,它的表达能力更丰富、更灵活,以及能够更好地来表达词和词之间的关系。

这种表达方式能够顾及到更多这样的关系,它的内部表达是一个有机整体,从而生成更通顺的翻译结果。

那么,有道又为何要投入这么巨大的人力物力财力,研究神经网络机器翻译呢?

段亦涛表示,最直接和现实的价值就是,神经网络翻译能够帮助人打破语言的障碍。纵观历史,信息交流的变革都是对人类技术进步有很强的刺激作用。

霍金亮相GMIC掀人工智能热潮,网易有道神经网络翻译上线

有道翻译官拍照翻译中的应用

虽然目前来看,信息技术的发展使得数据传输不再是瓶颈,但是另一个面临的问题就是语言的障碍,比如同样的数据能不能看懂和理解就是大问题。或许未来改变这一“交流困境”的,就是神经网络翻译。

也正因为如此,有道以及网易公司将以神经网络翻译技术为契机,进一步探索人工智能与机器翻译相结合的技术创新与发展。

有道在机器翻译领域深耕了近十年,积累了大量的优质的语料和技术。依托有道词典积累的语料和用户数据,有道的团队和网易杭州研究院一起,攻克了数据处理、大规模框架、模型优化、领域适配等技术难题,开发了特有的技术,目前已经在新闻、学习、口语和一些科技领域等场景下做到了最优。

技术的进步一日千里,或许就像霍金所说,在未来的短短几十年之内,AI很可能会超越人类智力范围,进而挑战人类。

所以到时候,机智的你又将如何适从呢?

关于 新知君

新知君
关注科技,自有新知

检查

投资者只想看 AI 赚钱,不想听 AI 烧钱

2024 开年,海外互联网巨头 …

发表评论

邮箱地址不会被公开。 必填项已用*标注