本篇文章3860字,读完约10分钟

相对于标准的同声传译,网络技术巨头的智能翻译的故事应该在哪里讲述?1954年,美国成功开发了世界上第一个机器翻译系统,实现了俄语和英语之间的简单转换。然而,由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对人类语言的理解一直处于相对较低的阶段,很少有研究成果投入实际应用。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

近10年来,以“深度学习”为代表的人工智能技术在将语音识别、自然语言处理等基础应用领域与工业相结合的业务上取得了重大突破,能够识别语音的机器翻译也逐渐从实验室走向大众。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

在人工智能机器翻译的轨道上,互联网巨头们虎视眈眈

自百度和搜狗去年在乌镇互联网大会上出现人工智能同声传译技术以来,再次引发了机器翻译是否将取代同声传译的激烈争论。

尽管专业的人工翻译公司仍然看不起人工智能对翻译行业的颠覆,但包括谷歌、facebook、微软、百度、腾讯和搜狗在内的主要技术巨头都不遗余力地推动机器翻译领域深度学习的研发和应用。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

2016年9月,谷歌发布了谷歌神经机器翻译(Google Neural Machine Translation,GNMT)系统,声称该系统利用神经网络技术模仿人脑的神经思维模式,产生了与人工翻译相当的高质量翻译,误差降低了55%-85%。谷歌公司已经将该技术应用于网络翻译和手机应用,翻译质量明显提高。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

腾讯、百度、阿里巴巴等国内互联网公司将深度学习的理念应用到机器翻译中,在智能翻译领域不断努力,推出了多种基于神经网络技术的在线翻译和手机应用。即使在移动浏览器的升级战中,智能翻译也被视为一项重要的功能创新。搜狗移动浏览器推出了“智能翻译”,它集成了语音对话翻译、ar实时翻译和图片翻译等常见功能。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

智能翻译为人们搭建了一座不同语言间便捷交流的桥梁,已经成为日常交流、出国旅游和外语学习中不可或缺的助手。智能相对论简要梳理了人工智能在文本和口语翻译中的基本原理,并结合实例介绍了智能口语翻译的难点和智能翻译需要解决的问题。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

各种花哨技术概念的核心仍然是人工智能处理人类语言的三种方式

让计算机处理人类自然语言是人工智能领域的一个重要课题,它与计算语言学的核心理论如句法分析、语义理解和自然语言生成密切相关。目前,人工智能主要有三种方法来翻译人类自然语言。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

1.基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依赖于人工双语词典和专家总结的各种形式的翻译规则,但其在一般领域的适用性不强,往往局限于专有应用,逐渐被新方法所取代。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

2.基于案例的机器翻译方法。基于现有的翻译经验,源语言句子被分成在翻译知识中已经看到的短语。通过自动总结已有的翻译资源,获得双语案例库,并设计规则处理双语案例库中的歧义,从而实现新源语言句子的翻译。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

3.基于统计的翻译方法。统计机器翻译方法将任何目标语言句子视为源语言句子的可能翻译候选,从语料库中自动学习翻译模型,然后基于该翻译模型,找到对输入源语言句子评价得分最高的目标语言句子作为翻译结果。目前,谷歌、搜狗等基本上都采用这种方式。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

深度学习可以自动学习抽象特征表示,建立源语言和目标语言之间复杂的映射关系,为实现统计机器翻译提供了一种新的途径。目前,在词对齐、语言模型训练、解码等模块的优化应用方面已经取得了很多成果。例如,2006年,谷歌发布了基于短语的机器学习(pbmt)系统,该系统将句子分解成单词和短句,并逐一翻译。它的弱点在于忽视语境,所以翻译质量不好。谷歌2016年发布的神经机器翻译gnmt以句子为基本单位,而不是逐个翻译单词和短句,这明显提高了翻译质量。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

作为智能翻译的“制高点”,人工智能口语翻译的难度是什么?

与普通的文本翻译相比,人工智能口语翻译更加困难,原因有二:

一,

如果你想“准确地翻译”,你必须首先能够“听清楚”。Ai应该准确判断指令发出者的发音和停顿,并在很短的时间内做出“断句”的语音提示。当涉及到一些模糊的声音时,可以根据“上下文”及时调整。这就要求深入学习的模式自动替换成语义流畅、更符合作者指示的句子,然后才能进行文本翻译。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

其次,如果你想“翻译准确”,你还必须容忍英语口语的“四任性”

基于神经网络技术的智能翻译系统越来越多,翻译质量也有了很大的提高。然而,我们将做几个测试来测试人工智能翻译的水平。为了便于解释,选择了具有代表性的谷歌翻译和搜狗移动浏览器的智能翻译进行对比。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

1

日常英语口语的特点是不连贯。在口语会话中,经常会出现一些不连贯的成分,如重复、逆序、冗余和句子不完整等。下面是一个典型的句子,句子不完整,发音重复。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

六楼怎么样?让我们...我们今天下午谈好吗?

谷歌翻译:六楼?我们下午再谈吧。

六楼怎么样?让我们……让我们今天下午谈谈。

谷歌的翻译没有真正反映原文在重复处理,但搜狗的移动浏览器的智能翻译是忠实地恢复。然而,这两种翻译结果的表达都存在错误。

2.语法限制相对较弱。在英语口语中,很少有结构完整、结构正确、严格符合语法约束的句子,但有许多语法规则难以处理的现象。一方面,这是由于系统的语法知识对语言现象的覆盖不够;更重要的是,它是由口语本身的特点决定的。例如,口语中有大量的代词,这使得人类口语更容易理解。然而,人工智能不能结合语境,缺乏背景知识,难以区分指称对象,导致翻译结果偏离原意。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

听着,伙计,你什么都不用做。这个对我来说很重要。

听着,伙计,你什么都不做。这对我很重要。

听着,伙计,你什么都不用做,这对我很重要。

翻译的关键在于两个词:看和人。谷歌的翻译是正确的,似乎搜狗手机浏览器的翻译结果更符合现实生活。

3

没有明确的句子边界。英语口语中没有标点符号来标记句子,基本上没有传统意义上的句子,缺少必要的声调和停顿,容易导致句子的歧义。

例如,“这个苹果不是很好吃。”这句话有两种不同的解释:这个苹果不大/好吃(它不大但味道好),这个苹果不太好吃(它味道不好)。这两种人工智能都无法区分句子结构的发音差异,默认情况下,它们都将其翻译为“苹果味道不好”。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

4.有许多非正式的文体材料。汉英两种语言中都有很多随意的口语或网络词汇,它们丰富了生活,大多是非正式文体的材料。智能翻译需要大量基础词汇的支持。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

最近,我们注意到一种国际观点,即中国已经成为世界上最大的经济体。一方面,它挑战了美国的领导地位;另一方面,中国仍然在许多国际事务中搭便车。你觉得这个观点怎么样?(中国日报记者在总理新闻发布会上的现场提问)

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

谷歌翻译:我们最近接到通知,有一种观点认为中国已经成为世界上最大的经济体,一方面挑战美国的领导地位,另一方面在许多国际事务中,中国仍然是自由的。你认为这个观点怎么样?

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

搜狗手机浏览器智能翻译:最近我们注意到一个国际观点,即中国已经成为世界上最大的经济体。一方面,它挑战了美国的领导地位。另一方面,中国人在许多国际事务中搭便车。我想问一下你对这个观点的看法。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

专家翻译:最近我们注意到国际社会有一种观点认为中国已经成为世界上最大的经济体,一方面挑战美国的领导地位,另一方面在许多国际事务中中国仍然是一个搭便车的人,你怎么看待这种观点?

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

可以说,尽管两个人工智能对这段话的翻译存在一些缺陷,但它们基本上是到位的,而搜狗的手机浏览器在翻译典型的口语词汇“搭便车”时相对更准确。中国古诗的英译一直是文化翻译中的难题,甚至被认为是最难翻译的文学形式。让我们来测试一下这两个人工智能理解和翻译王伟的《山东兄弟在山上度假的思考》的能力。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

我是一个陌生土地上孤独的陌生人,每逢节日,我都会更加想念我的家人。想到兄弟们的身体被高高地封了起来,还会不会因为不到我而有所遗憾。

谷歌翻译:陌生人在异国他乡,每逢节日。

尊贵的兄弟登上了王位,他充满了科妮莉亚。

搜狗手机浏览器智能翻译:独自一人在异国他乡,假期里我最想念的是我的亲人。我知道我哥哥已经爬到了山顶,到处都种了山茱萸,但是有一个人不见了。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

独自一人,一个在异国他乡的孤独的陌生人,我倍加怀念我的家人在度假。我知道我的兄弟们会手里拿着山茱萸喷剂,爬上山顶,想我想得那么远。

翻译古诗对两个人工智能来说真的很难。然而,翻译结果非常有趣。搜狗的手机浏览器可以公平地翻译前两句话,而最后两句话翻译成我哥哥到处种山茱萸。谷歌对最后两句进行了富有想象力的扩展。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

跨越语言障碍的鸿沟,智能翻译应该在哪里加油

智能翻译已经取得了惊人的进步,用手机和外国人交流基本没有问题。然而,在智能翻译中仍然存在“缺点”,会出现“不尽如人意的词语”。人工智能要想进一步发展,与几十年积累的高水平翻译竞争,可能需要从以下几个方面努力。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

1、大量补充口语语料库

智能翻译在处理口语文本方面能力不强。首先,由于翻译语料库中口语语料库的不足,其次,由于口语词语的直译,存在许多误译。要解决这个问题,我们应该扩展相应部分的语料库,增加口语文本的语料库,包括常用的口语词、表达方式和生活用语。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

2.提高理解上下文的能力

智能翻译不足以区分汉语复杂句型中的时态,为了准确掌握时态,往往需要充分理解整个句子的意思。智能翻译不是建立在理解的基础上,而是建立在统计和语料库的基础上,只能粗略准确地翻译这句话的意思,却缺乏识别情感色彩的能力。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

将神经网络学习的抽象表示与传统的符号语义方法相结合,建立一个新的基于语义的机器翻译系统,可以大大提高人工智能处理组合语义和复杂递归语言结构的能力。

AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

然而,我们仍然期待着有一天人工智能将帮助我们摆脱语言鸿沟。

(主编:陆承ha010)

标题:AI当起了实时翻译,我们离跨越语言的鸿沟还有多远?

地址:http://www.hcsbodzyz.com/hcxw/7321.html