当前位置:主页 > 网络与CDN > 大数据 >

中间件_发送邮件服务器_免费6个月

  • 大数据
  • 2021-05-05 05:03
  • 动埠云

Stefan Haenisch,Ingo Schulz,Michael Pflanz

以学习者的母语提供学习内容一直是全球环境下知识转移的主要挑战。随着所有技术的进步,这一过程仍然是高度手动的——缓慢、繁琐且昂贵。一旦内容以源语言提供,就会聘请翻译人员(通常是通过外部机构),然后由翻译人员手动翻译成所需的语言。然后,为了确保您的业务特定术语和上下文被正确翻译,另一个密集的质量保证步骤是与本地专家一起完成的——由于资源瓶颈,这通常比翻译本身需要更长的时间。再乘以大量的内容和大量的语言——再加上,当翻译项目已经在进行时,原始的源内容可能会发生变化——你很快就会遇到无法解决的可扩展性和资金挑战。像SAP这样的公司已经尽可能成功地以当地语言提供了大量内容,但我们无法提供所有语言的全面覆盖,而是专注于最受欢迎的客户需求,同时尽量缩短上市时间。这不是一个完美的解决方案,但在很大程度上是"足够好的"。

然而,随着数字经济的到来,高防云服务器,对翻译学习内容的即时可用性的需求急剧加快,主要由以下两个因素驱动:

好消息是,机器翻译也取得了巨大的进步。我们大多数人在个人生活中都使用过谷歌翻译等例子,结果给我们留下了深刻的印象。从学习的角度来看,如果这些引擎足够好,能够以正确的质量将所有学习内容即时翻译成所有必需的语言,那将是一个梦想——上述所有挑战都将立即得到解决!但是机器翻译技术准备好学习了吗?在今天的现实中已经可以实现什么,我们期望在未来看到什么?

机器翻译-新的炒作

机器翻译的话题已经存在了很长一段时间。它始于20世纪50年代的基于规则的机器翻译(RBT),然后是90年代的统计机器翻译(SMT)。SMT已经相当成功,物联网展会,引起了大家的注意,但人们往往只记得大的失败;因为SMT在需要重新排序单词时不是很好。它只适用于某些语言对,而且结果翻译在很多情况下都不太流利。几年来,有一个新的孩子:神经机器翻译(NMT)。除了自动驾驶、图像识别和分类任务之外,它已经成为机器学习的一个成功领域。新的NMT方法得益于基于图形处理单元(GPU)和数十年的人工翻译内容的强大且价格合理的硬件能力的可用性—这是训练机器学习模型的理想前提,在试图模拟人脑的神经网络时,

由于NMT翻译结果显示出明显优于SMT翻译内容的结果,它成为机器学习的宠儿之一:机器翻译是微软、谷歌、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、微软、,甚至还有SAP(请查看2017年SAPPHIRE Now的Jürgen Müller主题演讲)。此外,像谷歌新耳塞这样的新玩意也吸引了大量的关注和宣传:"实时翻译多达40种语言","人类梦想成真"……于是一场炒作就诞生了

神经机器翻译——一场效果大好的炒作

SAP在SAP翻译中心的背景下建立了自己的SAP NMT。sapnmt目前支持十种语言对之间的翻译。SAP Leonardo Machine Learning Foundation上的SAP Business API hub中的开发人员可以使用alpha翻译服务,也可以通过SAP translation hub进行测试。

SAP NMT提供了令人印象深刻的翻译结果。在我们的第一次内部评估中,利用NMT对三种语言的关键和最终用户教程进行评估,我们可以证明

人类译者对NMT的偏好是SMT翻译的五倍以上在后期编辑过程中,NMT翻译的纠正速度快了约2倍与SMT相比,NMT翻译所需的更正要少得多,例如,超过60%的英汉翻译根本不需要任何人工后期编辑

字符(字符级别的翻译编辑率)和后期编辑时间之间的相关性

总之,NMT结果所需的人工后期编辑要少得多,翻译比SMT更流畅,而且很有前景,…但是你不应该期望和人类翻译人员一样的翻译质量。你应该预料到问题仍然存在,甚至会出现有趣的错误,例如在亚马逊上,我看了一本自动翻译成德语的烹饪书:其中一个食谱将火鸡(鸟)翻译成了土耳其(国家)……在某些情况下,NMT结果会显示奇怪的翻译结果,什么大数据,部分句子可能会丢失。但是,如果70-80%的质量符合您的翻译用例,例如支持您学习某个主题,那么它现在已经是一个出色的工具了。

与10000名openSAP学习者进行实际检查

猜你喜欢

微信公众号