ChatTTS 一键本地安装!目前最简单高效的部署方案【文本转语音】

 

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.

亮点

 

  1. 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
  2. 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
  3. 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

目前最新的打包安装版是:ChatTTS-UI-0.84 

ChatTTS  一键安装包:【国外网盘下载】、【国内网盘下载】,建议使用国外网盘下载, 不限速。

注意:如果你无法网盘下载,可以纯手动部署:【教程

需要设置的提示词:口语化、 笑声、停顿,合理使用会让合成的语音更加逼真自然!

口语化 :[oral]

笑声:[laugh]

停顿:[break]

 

2.Google Lab 一键安装:【点击前往


1.安装Python 和 git环境,python需要 3.9+ 版本,比如我选择python 3.10.6 【点击下载

然后安装下git环境:【官方下载

2.下载 chatTTS-ui  【点击下载

3.解压后在根目录下输入CMD进入终端,然后依次执行下面的安装命令:

python -m venv venv
.\venv\scripts\activate
pip install -r requirements.txt

4.如果不需要CUDA加速,执行

pip install torch==2.1.2 torchaudio==2.1.2

如果需要CUDA加速,执行

pip install torch==2.1.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu118

如果你没有安装CUDA+ ToolKit, 可以看下这篇文章:【点击查看

5.最后执行 python app.py 启动,将自动打开浏览器窗口,默认地址 http://127.0.0.1:9966

(注意:默认从 modelscope 魔塔下载模型,不可使用代理下载,请关闭代理)

 

6.源码部署启动后,会先从 modelscope下载模型,但modelscope缺少spk_stat.pt,会报错,【点击下载 spk_stat.pt

下载后将该文件复制到 项目目录/models/pzc163/chatTTS/asset/ 文件夹内

注意 modelscope 仅允许中国大陆ip下载模型,如果遇到 proxy 类错误,请关闭代理。

如果你希望从 huggingface.co 下载模型,请打开 app.py 查看大约第50行-60行的注释。如果需要GPU加速,必须是英伟达显卡,并且安装 cuda版本的torch

# 默认从 modelscope 下载模型,如果想从huggingface下载模型,请将以下3行注释掉
CHATTTS_DIR = snapshot_download('pzc163/chatTTS',cache_dir=MODEL_DIR)
chat = ChatTTS.Chat()
chat.load_models(source="local",local_path=CHATTTS_DIR)
# 如果希望从 huggingface.co下载模型,将以下注释删掉。将上方3行内容注释掉
#os.environ['HF_HUB_CACHE']=MODEL_DIR
#os.environ['HF_ASSETS_CACHE']=MODEL_DIR
#chat = ChatTTS.Chat()
#chat.load_models()

 

内容转载自:零度博客

发表评论

0 评论