本篇文章1522字,读完约4分钟
“为什么关注单词识别和处理?这是因为我们发现,在手机摄像头的性能提高之后,文字可以做更多的事情。7月4日,有道集团总裁周峰在有道开放日对媒体表示。
事实上,我们所发现的不仅仅是摄像能力的提高,还有深度的学习。三个月前,有道正式将深度学习应用到机器翻译中,并推出了神经网络翻译模型。同时,深度学习也适用于大多数有道产品,如有道字典、翻译器、有道云笔记等等。
在这个开放日,有道总结了过去三个月神经网络翻译的进展,并宣布正式推出ocr技术和有道智韵平台。
神经网络翻译的效果是什么?网易有道在三个月前正式推出基于深度学习的神经网络翻译模型(nmt),雷(公开号:雷)曾采访过有道首席科学家段。在这次活动中,再次提到了段利用深度学习来完成机器翻译任务的优势。在他看来,深度学习有三个特点,可以使其在翻译任务中取得更好的效果:
模拟生物神经的方式是由大量的神经元组成
神经元可以完成一些基本运算。该模型通过奇妙的组织使神经元协同工作,完成更复杂的任务,类似于动物神经网络。
关键信息将由连续的关键向量来表示
在翻译中,一个单词对应一个高阶向量。这样做的优势在于其强大的描绘能力——描绘信息之间的关系。例如,同义词或反义词不容易用传统编码来表达,但是如果它们用矢量空来表达,它们之间的关系可以通过矢量之间的位置来更好地反映。
端到端模型
翻译模型中有许多参数,这些参数是为共同目标而优化的。与传统模型不同,传统的机器学习有不同的模块,每个模块都根据自己的目标进行调整和优化。它被人为地拼凑成一个机器类,可以完成这个功能,但它相当生硬。
对于神经网络翻译模型的评价,在机器翻译领域有一个通用的评价指标bleu。分数越高,翻译结果越接近目标翻译。段以有道与国际同类产品的汉英翻译为例,进行了比较。
*有神经网络翻译(中英文)的bleu值评估结果
除了汉译英,段还介绍说,有道最近推出了日韩神经网络翻译。根据内部测试的bleu值,中国、日本、中国和韩国的翻译准确率高于国内和国际同类产品。
雷锋。com了解到,机器翻译的深度学习已经成为业界的一种普遍做法。百度、谷歌、搜狗和其他制造商也在这么做,但一些公司最近提出了一些新的翻译模式,比如完全基于cnn的facebook翻译模式。
ocr技术如何识别和翻译图片中的单词?此外,有道正式宣布推出其ocr技术。Ocr是识别图片中的文本区域,然后提取并翻译该区域中的文本。
ocr的工作原理分为两个步骤。第一步是识别文本区域,这是通过两个通道来分别识别区域的位置和大小;第二步是识别区域中的字符,通过多层网络提取数据,然后用2n结构进行处理,最后一层进行识别。
目前,某一产品上有470万个ocr请求,不仅可以识别书籍,还可以识别零食和化妆品外包装上的英文,并提取单词进行翻译。
有道智能云平台的意图是什么?网易有道副总裁向雷介绍说,有道的技术接口每天被请求1.5亿次,其中1亿次来自第三方,而不是有道自己的产品。
基于这一机遇,有道正式推出了面向企业的“有道之云”平台,在该平台上集成了机器翻译和ocr技术,供第三方厂商使用。目前,神经网络翻译提供的界面是传统的api模式,价格为48元/万字。此外,sdk有两个版本,ios和安卓,价格为1元/月激活。同时,对于特定的合作伙伴,还为本地部署提供定制服务。
目前,有道智云的行业客户包括支付宝、微信、360、掌上阅读、网易邮箱、华为辉煌魔术手机等。其中有道提供的内置翻译功能为很多人所熟知。用户可以按住消息,然后选择翻译功能将消息翻译成系统语言。
相关阅读:网易有道段访谈:丁磊亲自询问的神经网络翻译技术是什么?
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:网易上线“有道智云”平台,为第三方厂商提供神经网络翻译接口
地址:http://www.hcsbodzyz.com/hcxw/9709.html