Meta 的人工智能可以翻译数十种资源匮乏的语言

菲梦 2024-05-23 阅读:2967 评论:0
经过 自然出版集团 Meta 的人工智能模型背后的技术可以翻译 200 种不同的语言,发表在 自然 。该模型扩展了可以通过机器翻译翻译的语言数量。 神经机器翻译模型利用人工神经网络来翻译语言。这些模型通常需要大量可访问的在...

经过 自然出版集团

Meta 的人工智能模型背后的技术可以翻译 200 种不同的语言,发表在 自然 。该模型扩展了可以通过机器翻译翻译的语言数量。

神经机器翻译模型利用人工神经网络来翻译语言。这些模型通常需要大量可访问的在线数据来进行训练,而这些数据对于某些被称为“低资源语言”的语言来说可能不是公开的、廉价的或普遍可用的。根据模型翻译的语言数量来增加模型的语言输出可能会对模型翻译的质量产生负面影响。

Marta Costa-jussà 和 No Language Left Behind (NLLB) 团队开发了一种跨语言方法,使神经机器翻译模型能够学习如何利用其预先存在的翻译高资源语言的能力来翻译低资源语言。

因此,研究人员开发了一种名为 NLLB-200 的在线多语言翻译工具,包含 200 种语言,包含的低资源语言数量是高资源语言的三倍,性能比现有系统好 44%。

鉴于研究人员只能访问许多低资源语言的 1,000-2,000 个样本,为了增加 NLLB-200 的训练数据量,他们利用语言识别系统来识别这些给定方言的更多实例。该团队还从互联网档案中挖掘双语文本数据,这有助于提高 NLLB-200 提供的翻译质量。

作者指出,该工具可以帮助人们使用很少翻译的语言访问互联网和其他技术。此外,他们强调教育是一个特别重要的应用,因为该模型可以帮助那些使用资源匮乏语言的人访问更多书籍和研究文章。然而,科斯塔-尤萨和合著者承认,误译仍然可能发生。

更多信息: 将神经机器翻译扩展到 200 种语言, 自然 (2024)。 DOI:10.1038/s41586-024-07335-x

期刊信息: 自然

由...提供 自然出版集团

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 法国国家铁路公司 (SNCF) 将在意大利提供高速客运线路

    法国国家铁路公司 (SNCF) 将在意大利提供高速客运线路
    通过安东尼·盖伊 法国国家铁路运营商 SNCF 周三表示,计划从 2026 年起在邻国意大利提供高速客运服务,在其本土与竞争对手 Trenitalia 竞争。 SNCF Voyageurs 城际 TGV(高速列车)服务主管 Alain Krakovitch 表示:“意大利是一个天然的高速列车市场,每年接待 5600 万名乘客。” “但这是一个尚未成熟的市场,仍有许多乘客需要引进。” SNCF 计划最终在都灵、米兰、罗马和那不勒斯之间提供每日 9 趟往返列车...
  • 新的168飞艇官方开奖历史记录查询图形处理技术比现有解决方案显示出显着的速度优势

    新的168飞艇官方开奖历史记录查询图形处理技术比现有解决方案显示出显着的速度优势
    经过168飞艇官方开奖历史记录查询高等教育出版社管理大规模图数据的行业对高效、快速的数据处理工具的需求导致了 GraphCP 的发展,这项技术可以显着提高处理速度。GraphCP不仅满足甚至大大超过了现有图处理系统的性能:这种性能改进使 GraphCP 成为依赖快速高效的图形数据处理的应用程序的领先解决方案。该研究的通讯作者 Yongli Cheng 表示:“GraphCP 在减少冗余数据访问和提高 I/O 带宽利用率方面的进步有助于我们领域的发展。”凭借其增强的速度,Gra...
  • 苹果面临在开发者大会上交付人工智能的压力

    苹果面临在开发者大会上交付人工智能的压力
    作者:格伦·查普曼 预计苹果公司将于下周证明,在科技界的竞争对手在人工智能领域大放异彩之际,它并没有被抛在后面。 分析师称,人工智能,甚至与 ChatGPT 制造商 OpenAI 的合作,都可能成为周一在硅谷举行的苹果年度 WWDC 开发者大会的主题。 这次会议是为苹果生态系统创建应用程序和软件的开发人员举办的年度盛会,首席执行官蒂姆库克将努力说服他们,随着竞争对手微软和谷歌连续快速推出创新,该公司是人工智能的关键参与者。 尽管苹果多年来一直在其 iPho...
  • Meta 的人工智能可以翻译数十种资源匮乏的语言

    Meta 的人工智能可以翻译数十种资源匮乏的语言
    经过 自然出版集团 Meta 的人工智能模型背后的技术可以翻译 200 种不同的语言,发表在 自然 。该模型扩展了可以通过机器翻译翻译的语言数量。 神经机器翻译模型利用人工神经网络来翻译语言。这些模型通常需要大量可访问的在线数据来进行训练,而这些数据对于某些被称为“低资源语言”的语言来说可能不是公开的、廉价的或普遍可用的。根据模型翻译的语言数量来增加模型的语言输出可能会对模型翻译的质量产生负面影响。 Marta Costa-jussà 和 No Lang...
  • 3D打印的微型执行器可以移动小型软机器人,将它们锁定成新的形状

    3D打印的微型执行器可以移动小型软机器人,将它们锁定成新的形状
    通过马特·希普曼 , 北卡罗来纳州立大学 北卡罗来纳州立大学的研究人员展示了微型软液压执行器,可用于控制厚度不到一毫米的软机器人的变形和运动。研究人员还证明,这项技术适用于形状记忆材料,允许用户反复将软机器人锁定为所需的形状,并根据需要返回到原始形状。 “软机器人技术在许多应用中都有前景,但设计小规模驱动软机器人运动的执行器具有挑战性,”该工作论文的通讯作者、机械和航空航天副教授杰尹说。北卡罗来纳州立大学的工程学。 “我们的方法利用商用多材料 3D 打印技术和...