中新网北京1月16日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。
这款名为SEAMLESSM4T的人工智能模型,填补了语言覆盖方面的空白,并且性能优于现有的系统。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。
该论文介绍,科幻小说的读者可能很熟悉《银河系漫游指南》里的“巴别鱼”,这种小鱼能侵入耳朵,即时将一种口语翻译成另一种口语。类似“巴别鱼”的这种工具对于促成全球互联环境下的交流非常有用,但大多数现有的机器学习翻译系统都是文本导向,或者需要语音识别、翻译成文本、再将文本转换成语音好几步。此外,现有语音到语音模型的语言覆盖范围也远低于文本到文本的模型,并且倾向于从源语言翻译成英语,而非从英语到另一种语言。
为了解决这些限制,在本项研究中,美国meta基础人工智能研究的“无缝交流团队”开发出一个单一模型SEAMLESSM4T,其支持多达101种语言之间的多种翻译模式,可以支持语音到语音(识别101种语言并翻译为36种语言)、语音到文本(101种语言译为96种)、文本到语音(96种语言译为36种)、文本到文本(96种语言)的翻译,以及自动语音识别(96种语言)。
版权声明 本文仅代表作者观点,不代表本站立场。
如遇本文系为网络转载到本站发表,图片或文章有版权问题的请联系客服确认后会立即删除文章。 如遇本文系作者授权本站发表,未经许可,不得转载。 |
0 条