前言:项目介绍请参考官网CosyVoice2-0.5B,本文仅讲解部署实践内容
1. 克隆项目
确保你的设备上安装了Git Git - Downloads
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
cd CosyVoice
git submodule update --init --recursive
2. 创建虚拟环境
安装 Conda / MiniConda: 请参阅 Download Now | Anaconda
安装后在Win开始菜单中找到 Anaconda Prompt 并打开,此时你的终端应该是 :
conda create -n cosyvoice python=3.10
conda activate cosyvoice
conda install -y -c conda-forge pynini==2.1.5
注意在执行 conda activate cosyvoice 后,确保你的终端 (base)变成 (cosyvoice)再执行下一步安装,否则会安装在系统Python中。
3. 安装依赖库
直接安装就行了,如果出现缺少了哪个库就手动安装一下。比如(Cython)
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com
4. 下载模型
CosyVoice语音生成大模型2.0-0.5B · 模型库 如下图:

如果部署 CosyVoice2 - 0.5B,只用下载第一个模型就可以了。
注:Webui支持4种不同的推理模式:预训练音色、3s极速复刻、跨语种复刻、自然语言控制。
5. 运行模型
官方原文档给的是CosyVoice1.0的使用方法,我们先以启动WebUI为例。
打开webui.py的源码,可以看到默认加载的就是CosyVoice2的模型。直接运行python webui.py 即可。

运行页面如下:

如需通过接口对外提供服务,请详见CosyVoice2-0.5B:API接口封装实践(含代码)
注意事项:
1. 确保下载的模型存放路径正确:
pretrained_models/CosyVoice2-0.5B
2.预训练音色为空的情况:
CosyVoice2-0.5B 没有 spk2info.pt ·议题 #729 ·FunAudioLLM/CosyVoice
根据上面的issus,需要手动下载spk2info.pt文件粘贴到pretrained_models/CosyVoice2-0.5B中,随后重新运行webui.py就能看到预训练模型: