ChatTTS 一键本地安装!目前最简单高效的部署方案【文本转语音】
ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.
亮点
- 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
- 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
- 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
目前最新的打包安装版是:ChatTTS-UI-0.84
ChatTTS 一键安装包:【国外网盘下载】、【国内网盘下载】,建议使用国外网盘下载, 不限速。
注意:如果你无法网盘下载,可以纯手动部署:【教程】
需要设置的提示词:口语化、 笑声、停顿,合理使用会让合成的语音更加逼真自然!
口语化 :[oral]
笑声:[laugh]
停顿:[break]
2.Google Lab 一键安装:【点击前往】
1.安装Python 和 git环境,python需要 3.9+ 版本,比如我选择python 3.10.6 【点击下载】
然后安装下git环境:【官方下载】
2.下载 chatTTS-ui 【点击下载】
3.解压后在根目录下输入CMD进入终端,然后依次执行下面的安装命令:
4.如果不需要CUDA加速,执行
如果需要CUDA加速,执行
如果你没有安装CUDA+ ToolKit, 可以看下这篇文章:【点击查看】
5.最后执行 python app.py 启动,将自动打开浏览器窗口,默认地址 http://127.0.0.1:9966
(注意:默认从 modelscope 魔塔下载模型,不可使用代理下载,请关闭代理)
6.源码部署启动后,会先从 modelscope下载模型,但modelscope缺少spk_stat.pt,会报错,【点击下载 spk_stat.pt】
下载后将该文件复制到 项目目录/models/pzc163/chatTTS/asset/ 文件夹内
注意 modelscope 仅允许中国大陆ip下载模型,如果遇到 proxy 类错误,请关闭代理。
如果你希望从 huggingface.co 下载模型,请打开 app.py 查看大约第50行-60行的注释。如果需要GPU加速,必须是英伟达显卡,并且安装 cuda版本的torch
内容转载自:零度博客




发表评论
0 评论