Text-2-Speech:语音克隆与生成

早上起来,先是体验了一下MyVocal.ai

MyVocal.ai是一家开创性的人工智能公司,她们的梦想是为大众创造一个语音克隆产品,让全世界的创作者能够更轻松、更高效地生成高质量的 AIGC。

我们都知道,语音克隆是一个进入门槛很高的领域,对高质量源材料的严格要求可能需要用户几天甚至几周的时间来准备。

这些障碍还导致成本过高,这使得许多人无法获得语音克隆。

为此,MyVocal.ai就面世了!

MyVocal.ai,一个以普及语音克隆为自己的使命。

他们开发了尖端技术,允许用户克隆自己的声音,创建可用于内容创作、歌曲创作等的高质量克隆。

他们的目标是通过提供简单、经济高效且易于访问的语音克隆解决方案,来激励和增强全球创作者的能力,从而彻底改变语音技术领域,让世界变得更具创造力和表现力。

用户只需要录制一点自己的语音样本,系统就可以对用户的语音进行特征分析,汲取语音特性,用于语音克隆和语音生成。

在完成这些准备之后,用户只需要输入文字,就可以克隆和生成自己的语音。

https://myvocal.ai/

MyVocal.ai 还没玩过瘾,就看到了Meta今天的新闻,Meta 创建的一种人工智能大规模多语言语音 ( MMS ) 项目可以识别 4,000 多种口头语言并生成 1,100 多种语音(文本到语音)。

这实在是一个革命性的消息。

与大多数其他公开宣布的AI 项目一样,Meta今天正在开源 MMS以帮助保护语言多样性,并鼓励研究人员在其基础上进行建设。

​Meta 的新闻报道说,“今天,我们公开分享我们的模型和代码,以便研究界的其他人可以在我们的工作基础上进行构建,”

该公司写道:“通过这项工作,我们希望为保护世界上令人难以置信的语言多样性做出一点贡献。”

https://ai.facebook.com/blog/multilingual-model-speech-recognition/

这项研究的关键是使用了一个巧妙的宗教语言数据集:利用翻译宗教文本的录音。

“我们求助于《圣经》等宗教文本,这些文本已被翻译成多种不同的语言,其译文已被广泛研究用于基于文本的语言翻译研究,”

Meta公司表示。“这些翻译有公开的录音,人们用不同的语言阅读这些文本。” 

结合圣经和类似文本的未标记录音,Meta的研究人员将模型的可用语言增加到 4,000 多种。

金嘴蝎尾蕉  Photo by Johnnie Walker