translatotron
谷歌翻译是该公司最常用的产品之一。它可以帮助人们从输入文本,拍摄图片和使用语音到文本技术将一种语言翻译成另一种语言。现在,Google推出了一个名为Translatotron的新项目,该项目将提供语音到语音的直接转换
当谷歌在2019年首次宣布开发Translatotron时,这款语音到语音的翻译程序因其能够产生目标语言语音而受到称赞,且该语音听起来像是最初说话者的声音,而非计算机生成的声音(如Siri或Alexa的声音)。程序保留原说话者声音的能力被认为是一个不可思议的进步,尽管该技术存在一个问题: 一些人认为这项技术可能会被滥用,担心它会被用来制造“超级骗子”——除了保留原始语音之外,用户还可以生成目标语言的语音来匹配另一个人的语音,从而允许恶意用户来造假。 谷歌最近声称已在其程序的更新版本Translatotron 2中解决了该问题,该程序只允许用户使用原始说话者的声音进行翻译
Facebook正在研究自己的方法,以实现真正的语音(到语音)翻译(S2ST):他们从一开始就取消了文本翻译的步骤,只用音频。 如前所述,常见的S2ST流程包括自动语音识别(ASR)、转录、文本机器翻译(MT)和文本到语音合成为目标语言。 虽然谷歌一直在努力通过Translatotron(Google在2019年春天首次公开的项目)消除文本-机器翻译这一步骤,苹果也一直在进行类似的探索,尽管是通过更内省的方式
当谷歌在2019年首次宣布开发Translatotron时,这款语音到语音的翻译程序因其能够产生目标语言语音而受到称赞,且该语音听起来像是最初说话者的声音,而非计算机生成的声音(如Siri或Alexa的声音)。程序保留原说话者声音的能力被认为是一个不可思议的进步,尽管该技术存在一个问题: 一些人认为这项技术可能会被滥用,担心它会被用来制造“超级骗子”——除了保留原始语音之外,用户还可以生成目标语言的语音来匹配另一个人的语音,从而允许恶意用户来造假。 谷歌最近声称已在其程序的更新版本Translatotron 2中解决了该问题,该程序只允许用户使用原始说话者的声音进行翻译
随着机器学习和 AI 技术的发展,机器翻译得到了快速的发展,在很多的场景下,我们都可以看到机器语音翻译的应用。在现阶段,语音翻译系统在实现翻译时大致需要三个步骤: 3、将文本再生成翻译后的语音(TTS) 不过,Google AI 最新的论文显示,Google 正尝试将这三步中的文本翻译去掉——日前,Google AI 官方博客提出了一个实验性质的新系统 “Translatotron”,这一系统可实现使用序列到序列模型的直接语音翻译,是首个能够直接将一种语言的语音内容直接翻译成另一种语言的语音版本,而中间不需要文本转化的端到端模型。得益于此,Translatotron 可以实现更快的翻译速度,还能降低机器转译出现的错误