一款新型开源TTS模型,小白都能无压力上手,还有海量音色模型可选择。

1,817 阅读2分钟

TTS 语音模型我们都不陌生,前段时间一夜火爆的ChatTTS模型更是效果炸裂,很多人都更换了常用的语音生成模型,转而使用它。

而今天再次为大家介绍一款新型的TTS语言生成模型工具-FishSpeech。它是一款人人可用的AI音频工具,无论你是专业人士、行业职场人还是小白都可以使用。

图片

FishSpeech 在GitHub上开源不久,但是已经有了3.1k Star量。虽然它是开源项目,但是与其他开源TTS又有些不同,不需要再去搭建部署服务,官方已经发布了功能齐全的网站可供使用。

而且界面还特别赏心悦目,看着就很舒服。接下来为大家介绍下这款TTS工具吧!

图片

FishSpeech 是由FishAudio团队开发的一款TTS语音生成工具,比较出众的Bert-VITS2 语音模型也同样出自该团队,是由So-VITS-SVC项目的一个维护者冷月创办的团队。

海量人物音色可供使用,包含明星、游戏人物、动漫角色等

官网在线Demo上,上传了许多创作者训练的各种人物音色,比如理塘丁真、邓紫棋等明星音色,还有原生人物纳西妲、钟离、芙宁娜等,还有海量音色可直接使用。

这个是其他开源TTS模型所不具备的,如果有现成的创作者训练好的音色模型,不需要我们自己再次去训练了(除非觉得效果不好)直接使用即可。

图片

支持自定义构建(训练)声音

FishSpeech 训练不像So-VITS-SVC需要填写一大堆训练参数,有时候还需要进行微调。

它点击 构建声音 标签即可跳转到声音训练界面,只需要提前准备好相关的同一个角色的音频文件,所有文件合集不可大于150M,填写好角色模型名称即可开始训练。

模型图片、描述等其他信息可选,可以不做填写。同时它支持私有训练选项,训练完成后只供个人使用,别人在FishSpeech是看不到的。

图片

文本转语音更加方便

照常的输入需要进行语音转换的文本,选择想要转换的声音音色(可搜索),点击创建即可完成文本转语音功能。

图片

这里提供一个原神中纳西妲的demo:

是不是不论是情感、语速、语调都比较富有特色,有感情的,角色音色训练的也OK。

这款TTS工具可以作为主选(备用)配音工具也是可以的,有兴趣可试一试。

GitHub: github.com/fishaudio/f…

官网Demo: fish.audio/