生成式人工智能一日千里。
文本到语音(TTS)作为一种语音合成应用程序,能够使得软件像人类一样对文本进行处理,并清晰地朗读出来。
最近,文本到语音(TTS)领域最近蓬勃发展,一系列令人惊叹的文本转语音(TTS)生成器和工具如雨后春笋般涌现出来了。
TTS 生成器用途广泛。
它既可以当作有学习困难的人的辅助技术,也能够被企业和视频创作者用于画外音。
而且,这些TTS生成器还在游戏、品牌、动画、语音助手开发、有声读物等诸多领域得到广泛应用。
伴随着TTS 的快速发展,这项技术不再需要大量的语音样本,甚至无需专业设备就能正常运作。
市场上存在许多出色的文本到语音生成器,每个生成器都有着自己独特的一系列功能和应用场景。
之前,自留地君曾介绍过 ElevenLabs:用文本生成语音。
今天再介绍最近很火的三款TTS 应用。
ChatTTS
近日,一款名为 ChatTTS 文本转语音项目爆火出圈,引来大家极大的关注。短短三天时间,在 GitHub 上已经斩获了 9.2 k 的 Star 量。截止今天早上,Star量已经达到了20.6 K,其发展速度
ChatTTS专为对话场景进行优化,特别适用于会话应用程序,适用于大型语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。
它支持中文和英文。通过使用大约100,000小时的中文和英文数据进行训练,ChatTTS在语音合成中表现出高质量和自然度。
此外,ChatTTS 计划开源基于40,000小时数据训练的基础模型使其与众不同,促进该领域的进一步研究和开发。
Seed-TTS
今天早上看到 Seed TTS的新闻。
Seed-TTS是由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型 该模型能够生成高质量、几乎无法与人类声音无法区分的语音。
在无需训练的情况下,只需要简短的语音片段, Seed-TTS即可克隆生成高度自然且富有表现力的语音。
Seed-TTS完全能否胜任读小说、配音等任务。
Seed-TTS 还提供了对各种语音属性的高级控制能力,包括但不限于情感、语调、说话风格等。
Seed-TTS可以通过编辑文本来编辑生成的语音。
TTSMaker
TTSMaker是一款免费的文本转语音工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语、越南语等,以及多种语音风格。
用户可以用它大声朗读文本和电子书,或下载音频文件用于商业用途(完全免费)。
作为一款优秀的免费 TTS 工具,TTSMaker 可以轻松地将文本在线转换为语音。
各位亲,除了自留地君介绍的这三款,
您自己最喜欢的是哪一款?
欢迎跟帖分享!
谢谢先!
Photo by Johnnie Walker